データサイエンス

説明可能AI(Explainable AI; XAI)

なぜモデルの解釈性が重要なのか 画像認識、音声認識、自然言語処理など数多くの分野でブレークスルーをもたらしたディープラーニング技術の元となるアルゴリズムは、ニューラルネットワークです。 ニューラルネッ... 続きを読む

ǂ

確率と確率変数とは

確率とは? 確率とは一言でいうと、ある出来事(統計学では「事象」)がどの程度起こりやすいかを数量的に表した値です。 日常生活を送る上で「絶対」というものは殆どありません。よって私たちは、「どの程度起こ... 続きを読む

ǂ

データリテラシーとは

今では、データ分析官、データコンサルなどの専門家だけではなく、幅広い職業分野において、ビジネススキル・基本教養の1つとしてデータリテラシーが求められています。 個人だけではなく、経営層および社員一人... 続きを読む

ǂ

データ分析における仮説検証

データサイエンティストは1つのデータ活用プロジェクトの中で、 課題定義から結果報告までを行う必要があり、一般的に以下の順番で進めます。 1.課題定義と仮説立案→  2.仮説検証→  3.検証結果の評価... 続きを読む

ǂ

よく聞くKPIとKGI

データ分析の業務を進めるのにあたって、依頼側が達成したい目的・目標を意識すべきです。そうすると、目標達成のために、分析に使うべきデータやアプローチが明確になります。 この記事では、ビジネス上の目的・目... 続きを読む

ǂ

母集団と標本

本日は、統計学でよく聞く「母集団」と「標本」について語りたいと思います。 統計学で最もよく使われるアプローチは記述統計学(descriptive statistics)と推測統計学(inferenti... 続きを読む

ǂ

Excelで度数分布表・ヒストグラムを作成

データの分布を可視化するための代表手段の1つはヒストグラムです。 ヒストグラムとは、データがとりうる区間(階級)ごとのデータの個数(度数)を分布として表現したグラフです。横軸は階級、縦軸は度数です。... 続きを読む

ǂ

すぐできる!特徴量の相関を調べる&可視化

「データサイエンスもくもく会」を10月から開始し、皆さんのおかげで、5回を開催することができました。もくもく会とは、毎回異なるトピックで講義し、ディスカッションする、無料オンライン・サロンです。ライ... 続きを読む

ǂ

プロ講師の授業を体験!