なぜモデルの解釈性が重要なのか 画像認識、音声認識、自然言語処理など数多くの分野でブレークスルーをもたらしたディープラーニング技術の元となるアルゴリズムは、ニューラルネットワークです。 ... 続きを読む
確率と確率変数とは
確率とは? 確率とは一言でいうと、ある出来事(統計学では「事象」)がどの程度起こりやすいかを数量的に表した値です。 日常生活を送る上で「絶対」というものは殆どありません。よって私たちは、... 続きを読む
データリテラシーとは
今では、データ分析官、データコンサルなどの専門家だけではなく、幅広い職業分野において、ビジネススキル・基本教養の1つとしてデータリテラシーが求められています。 個人だけではなく、経営層および... 続きを読む
データ分析における仮説検証
データサイエンティストは1つのデータ活用プロジェクトの中で、 課題定義から結果報告までを行う必要があり、一般的に以下の順番で進めます。 1.課題定義と仮説立案→ 2.仮説検証→ 3.検証結... 続きを読む
よく聞くKPIとKGI
データ分析の業務を進めるのにあたって、依頼側が達成したい目的・目標を意識すべきです。そうすると、目標達成のために、分析に使うべきデータやアプローチが明確になります。 この記事では、ビジネス上の... 続きを読む
アジャイル開発とウォーターフォール開発の違い
データ分析プロジェクトの要件に、システム開発が含まれる場合があります。システム開発の進め方として、ウォータフォール開発(古くから使用)と アジャイル開発(近年普及)が代表的です。 これらはデー... 続きを読む
母集団と標本
本日は、統計学でよく聞く「母集団」と「標本」について語りたいと思います。 統計学で最もよく使われるアプローチは記述統計学(descriptive statistics)と推測統計学(infer... 続きを読む
Excelで度数分布表・ヒストグラムを作成
データの分布を可視化するための代表手段の1つはヒストグラムです。 ヒストグラムとは、データがとりうる区間(階級)ごとのデータの個数(度数)を分布として表現したグラフです。横軸は階級、縦... 続きを読む
AIを用いた画像生成〜ディープフェイクの現状〜
AIや機械学習は既存のデータに対する予測や識別に活用されるというイメージが強い中、近年ではディープラーニングを用いて、画像、動画、音声、文章を新しく生み出す技術(「深層生成モデル」)が実現されていま... 続きを読む
すぐできる!特徴量の相関を調べる&可視化
「データサイエンスもくもく会」を10月から開始し、皆さんのおかげで、5回を開催することができました。もくもく会とは、毎回異なるトピックで講義し、ディスカッションする、無料オンライン・サロンで... 続きを読む