なぜモデルの解釈性が重要なのか 画像認識、音声認識、自然言語処理など数多くの分野でブレークスルーをもたらしたディープラーニング技術の元となるアルゴリズムは、ニューラルネットワークです。 ニューラルネッ... 続きを読む
ǂデータサイエンス
確率と確率変数とは
確率とは? 確率とは一言でいうと、ある出来事(統計学では「事象」)がどの程度起こりやすいかを数量的に表した値です。 日常生活を送る上で「絶対」というものは殆どありません。よって私たちは、「どの程度起こ... 続きを読む
ǂデータリテラシーとは
今では、データ分析官、データコンサルなどの専門家だけではなく、幅広い職業分野において、ビジネススキル・基本教養の1つとしてデータリテラシーが求められています。 個人だけではなく、経営層および社員一人... 続きを読む
ǂデータ分析における仮説検証
データサイエンティストは1つのデータ活用プロジェクトの中で、 課題定義から結果報告までを行う必要があり、一般的に以下の順番で進めます。 1.課題定義と仮説立案→ 2.仮説検証→ 3.検証結果の評価... 続きを読む
ǂよく聞くKPIとKGI
データ分析の業務を進めるのにあたって、依頼側が達成したい目的・目標を意識すべきです。そうすると、目標達成のために、分析に使うべきデータやアプローチが明確になります。 この記事では、ビジネス上の目的・目... 続きを読む
ǂアジャイル開発とウォーターフォール開発の違い
データ分析プロジェクトの要件に、システム開発が含まれる場合があります。システム開発の進め方として、ウォータフォール開発(古くから使用)と アジャイル開発(近年普及)が代表的です。 これらはデータ分析プ... 続きを読む
ǂ母集団と標本
本日は、統計学でよく聞く「母集団」と「標本」について語りたいと思います。 統計学で最もよく使われるアプローチは記述統計学(descriptive statistics)と推測統計学(inferenti... 続きを読む
ǂExcelで度数分布表・ヒストグラムを作成
データの分布を可視化するための代表手段の1つはヒストグラムです。 ヒストグラムとは、データがとりうる区間(階級)ごとのデータの個数(度数)を分布として表現したグラフです。横軸は階級、縦軸は度数です。... 続きを読む
ǂAIを用いた画像生成〜ディープフェイクの現状〜
AIや機械学習は既存のデータに対する予測や識別に活用されるというイメージが強い中、近年ではディープラーニングを用いて、画像、動画、音声、文章を新しく生み出す技術(「深層生成モデル」)が実現されています... 続きを読む
ǂすぐできる!特徴量の相関を調べる&可視化
「データサイエンスもくもく会」を10月から開始し、皆さんのおかげで、5回を開催することができました。もくもく会とは、毎回異なるトピックで講義し、ディスカッションする、無料オンライン・サロンです。ライ... 続きを読む
ǂ