DS検定とは?難易度や合格ラインを講師が解説(データサイエンティスト検定リテラシーレベル)
本ページにはプロモーションが
含まれていることがあります
データサイエンティスト検定リテラシーレベル(DS検定★)とはどんな資格試験なのか、ヤンジャクリン講師が解説します。
試験範囲や出題内容、必要な学習レベル、また合格基準や難易度などについても考察しますので、ぜひ参考にしてください。
DS検定の合格を
目指している方へ
- 自分に合う教材を見つけたい
- 無料で試験勉強をはじめてみたい
アガルートのDS検定講座を
無料体験してみませんか?
約2時間半のDS検定やG検定、数学ストラテジスト資格試験対策講義が20日間見放題!
実際に勉強できる!講義に対応したレジュメ(PDF)付き
1分で簡単!無料
▶資料請求して特典を受け取る目次
DS検定試験とは
データサイエンティスト検定リテラシーレベル(DS検定★)は、一般社団法人データサイエンティスト協会によって実施されている、今大注目の検定試験です。
2021年9月に第1回目が実施された比較的新しい検定であり、データ活用人材の需要が高まるにつれて受講者数はますます増加していくと予想されます。
データサイエンスと呼ばれる大きな分野に含まれる、データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバーしています。
DS検定の目的
DS検定の取得により、データサイエンティストに必要な入門レベルの実務能力や知識、および、裏でそれを支える数理統計学やAI教育のリテラシーレベルの実力を有していることを証明できます。
データサイエンティストを目指す人達とそれを必要とする産業界を結びつけることがデータサイエンティスト協会の指針のひとつです。
データサイエンティストに必要なスキルを一般的に、データサイエンス力・データエンジニアリング力・ビジネス力、と3つのカテゴリに分けて考えることができます。
とはいえ、データサイエンティストに必要な素養は様々で、全てに精通している人材は稀であり、「データ分析官」の方はビジネス系寄り、業務系寄り、フロント寄りなどと言われ、「AIエンジニア」の方は開発・実装重視と言われています。
データサイエンスの専門企業だけではなく、一般企業の社員が全員持つべき「データリテラシー」についてはこちらをご覧になってください。
参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ
DS検定試験の概要
出題形式 | 選択式問題 |
問題数 | 100問程度 |
試験時間 | 100分 |
会場 | 全国の試験会場で開催(CBT) |
出題範囲 | ・スキルチェックリストの3カテゴリ (データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当 ・ 数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム |
受験費用 | 一般:10,000円(税抜) 学生:5,000円(税抜) |
公式参考書 | 「最短突破 データサイエンティスト検定(リテラシーレベル) 公式リファレンスブック」 |
試験日程 | 申込期間 | |
---|---|---|
第10回 | ※決まり次第更新 | ※決まり次第更新 |
第9回 | 2025年3月8日(土)~3月30日(日) | 個人:2025年1月13日(月)10:00~2月21日(金) 団体:2025年1月13日(月)10:00~2月14日(金) |
第8回 | 2024年11月9日(土)~12月1日(日) | 個人:2024年9月24日(火)10:00~10月31日(木) 団体:2024年9月24日(火)10:00~10月25日(金) |
第7回 | 2024年6月8日(土)~6月30日(日) | ー |
第6回 | 2024年3月9日(土)~3月31日(日) | ー |
第5回 | 2023年11月11日(土)~12月3日(日) | ー |
第4回 | 2023年6月3日(土)~6月25日(日) | ー |
第3回 | 2022年11月15日(火)~12月5日(月) | ー |
第2回 | 2022年6月10日(金)~6月30日(木) | ー |
第1回 | 2021年9月11日(土)~9月30日(木) | ー |
DS検定の試験科目 必要な知識とスキル
DS検定に出題される内容をより詳しく解説します。
上記では、データサイエンス、データエンジニアリング、ビジネスの3つの枠組みについて話をしましたが、ここでは各分野において求められる個別の知識やスキルを紹介します。
データの活用事例
まず、全体像を掴むためには、社会におけるデータ・AIの活用事例を知る必要があります。
アガルートアカデミーのDS検定対策講座では、冒頭のPart1で実際のデータサイエンティストの会社で行われているデータ活用案件を豊富に紹介します。
データリテラシー
そして、サイエンス、エンジニアリング、ビジネスのどれを学ぶにしても、重要となる基本的なデータリテラシーも出題されます。
参考:データリテラシーとは|AGAROOT ACADEMY ヤン講師ブログ
データサイエンス
データサイエンスは最も広い出題分野です。
代表的な出題項目が以下となります。
- 機械学習の基本概念である、人工知能、機械学習、ディープラーニングの関係性
- 学習と予測の仕組み、機械学習モデルの構築と運用の流れ
- 教師あり学習、教師なし学習、強化学習
- 特徴量設計・データ前処理
- 機械学習・データ分析の代表的な手法(例:線形回帰、ロジスティク回帰、決定木、アンサンブル学習、K-means、ナイーブベイズ、ニューラルネットワーク)
- 学習済みモデルの評価、 精度指標、ROC曲線、AUC
- モデルの最適化、ハイパーパラメータのチューニング
- 画像・動画データの形式、処理と解析(画像分類、物体検出、セグメンテーション)
- 音声データの形式、音声処理
- 自然言語の処理(形態素解析、構文解析、意味解析)
- 時系列データ、時系列分析
- モデルの予測結果の解釈、局所的説明と大域的説明
データエンジニアリング
- データ収集の技術、 ウェブクローリング・スクレイピング
- データの保管: ストレージ、データストア、データベースなど
- リレーショナルデータベース(RDB)、SQLとnoSQL
- ER図
- テーブルの正規化、正規化の各種
- データ基盤、クラウド、 サーバー
- データ転送、 バックアップ、 データ処理
- セキュリティ上の注意点(機密性、完全性、可用性)、 攻撃と防御、アクセス制御
ビジネス力
ここではデータ分析プロジェクトの進め方、契約や開発の種別、そして軽視してはいけない法規制について問われます。
- データサイエンティストに求められるビジネス力
- データ分析プロジェクトの進め方
- 現状把握: ビジネスモデル、プレイヤー、一次情報、二次情報
- 課題の定義: スコーピング、5フォース分析、MECE、ロジカルシンキング
- 目標の設定(KPI、KGI、KPIツリー)
- 仮説の立案と検証
- ドキュメンテーション、結果の考察と説明
- 契約の種別: 請負契約、準委任契約
- 開発の形式:ウォータフォール開発、アジャイル開発
- データ倫理、コンプライアンス
- AIが社会に及ぼす影響、ELSI、GDPR
- 個人情報保護法、プライバシー、要配慮個人情報と機微情報
- 匿名加工情報、オプトアウト制度
- 公平性と透明性:ブラックボックス問題、説明可能AI(XAI)、人間中心のAI社会原則、
- 知的財産権、特許権、著作権、
- 不正競争防止、営業秘密、限定提供データ
統計学・数学
上記以外に、統計学・数学の基礎も問われます。
例えば統計学では以下が代表的な出題項目です。
- 記述統計学と推測統計学
- 基礎統計量とその使い分け(平均値、中央値、最頻値)
- データの広がりを示す指標(分散、標準偏差)
- 母集団から標本の無作為抽出
- 統計的推定
- 統計的仮説検定
- 二変数間の関係性(共分散、相関係数、因果関係)
数学では、微分や線形代数の高校レベルの問題が出題されることがあります。
DS検定の合格率・合格ライン・合格基準
2024年6月に実施された第7回試験の合格率は48%でした。
過去の実施結果も見てみると、2021年9月に実施された第1回から合格率は下がっており、第3回以降約40%台を推移しています。
合格ラインの目安は、第1回から常に正答率約80%となっていていましたが、第7回試験は正答率約77%とこれまでで一番低い数値となりました。
ただ、非常に高い正答率が求められることは変わりないので、しっかりとした対策が必要です。
試験実施日 | 受験者数 | 合格者数 | 合格率 | 合格ラインの目安 |
---|---|---|---|---|
第8回(2024年11月実施) | ー名 | ー名 | ー% | ー% |
第7回(2024年6月実施) | 約1,950名 | 929名 | 約48% | 正答率約77% |
第6回(2024年3月実施) | 約2,500名 | 1,089名 | 約44% | 正答率約79% |
第5回(2023年11月実施) | 約3,750名 | 1,427名 | 約38% | 正答率約79% |
第4回(2023年6月実施) | 約3,050名 | 1,347名 | 約44% | 正答率約79% |
第3回(2022年11月実施) | 約2,600名 | 1,088名 | 約42% | 正答率約79% |
第2回(2022年6月実施) | 約2,900名 | 1,453名 | 約50% | 正答率約80% |
第1回(2021年9月実施) | 約1,400名 | 927名 | 約66% | 正答率約80% |
試験ごとに振れ幅が想定されるので、あくまでも目安だと思ってください。
あくまでも個人的な感覚としては、以下のような水準を達成するまで勉強をされている方は合格圏内に入ると推測しています。
- 本記事に羅列されている出題項目を一通りご自身の言葉で「どういうことなのか」を他人に説明できるようになる
- アガルートのDS検定対策講座を履修し、その8割を「よく理解できている」レベルにあること、並びに、講座に付属する模擬試験で8割以上の点数を取れている
参考として、同じくAI資格のG検定の合格率は7割前後と言われています。
CBT会場で試験終了と同時に、「データサイエンス」「データエンジニアリング」「ビジネス」の各分野、及び総合の得点率が印刷された紙がPCから出力され、受験者の出来の速報として参考になります。
試験が行われた月の翌月中には、合否の結果とともに、詳細なスコアシートを受験する際に登録するマイページからダウンロードできるようになります。
この詳細なスコアシートを見れば、上記の各分野で出題された各詳細項目の正答率と全受験者の平均点を知ることができます。
以下に、データサイエンス分野におけるスコア詳細の一例を添付します。
DS検定の難易度
DS検定は筆者からみて、今までの国内のデータサイエンス資格の中で最も難易度が高いものと思っています。
DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。
さらに、比較的新しい資格試験ということもあり、参考書や対策講座がG検定など他の資格試験と比較すると少なく、ネット上の情報も多くはないのも事実です。
それでも、DS検定への注目度が急上昇しており、今後は非常に伸びていく資格試験と予想されており、社員に重要な教養として企業では集団としてDS検定を目指すことも多くなってきました。
統計検定やG検定に合格した後に、次のステップとしてDS検定に挑戦される方が多いです。
過去にG検定を受験したことのある方はDS検定の受験が大変有利です。
データサイエンスの分野など、出題内容に親和性があるためです。
プログラミングのスキルはDS検定にとって重要ではありません。
しかしプログラミングやデータ操作の経験があるとエンジニアリングの分野とのなじみが良くなるかもしれません。
数学や統計学は中学・高校で学んだレベルの範囲で出題されます。
統計学は演習も含めてアガルートのDS検定対策講座の中で十分に教えいたします。
文系出身の方など、数学をもう少し勉強したい方は補助として公式参考書「最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版」の使用をお勧めします。
書籍名 | 最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版 |
目次 | 第1章 DS検定とは 第2章 データサイエンス力 第3章 データエンジニアリング力 第4章 ビジネス力 第5章 数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム データサイエンティスト検定リテラシーレベル模擬試験 問題 データサイエンティスト検定リテラシーレベル模擬試験 解答例 |
ページ数 | 328ページ |
著者名 | 菅 由紀子など |
出版社 | 技術評論社 |
発売日 | 2022年5月14日 |
関連記事:データサイエンティストを目指す方におすすめの8資格
G検定との違い
今では、ITパスポート、G検定、DS検定はデータサイエンス人材になるための3つの関門と言われています。
以前こちらでG検定を紹介しました。
関連コラム:G検定(ジェネラリスト検定)とは?【データサイエンティストに関わる資格】
DS検定はG検定よりも、出題範囲が2割ほど広いと言われています。
G検定はディープラーニングやそれを応用した最先端技術の非常に深い技術(ニューラルネットワークの仕組み、強化学習、自然言語処理、画像認識のCNN、音声生成など)の部分を問う問題が多いです。
DS検定ではこれらが薄くなっている反面、ビジネス、エンジニアリングの知識が増えます。
また数学・統計学に関する出題も若干G検定のより多い可能性があります。
また、DS検定の方が難易度が少しだけ高いと言われています。
そのため、G検定を先に受験してからDS検定に挑む方もいます。
ただ、2つの検定試験は出題が被っていない部分が多くあるので、独立した資格試験と思ってください。
どちらも同じくらいデータサイエンティストを目指す方に重要です。
Di-Lite3大資格の難易度比較
他に、Di-Liteの3大資格には、G検定、DS検定、ITパスポートがあります。
この中で、DS検定が一番難しく、次にG検定、次にITパスポートと言われています。
しかし、これには個人差が大きいので、あくまでもひとつの目安と受け取ってください。
上記に書かれているように、DS検定は出題範囲が広いだけではなく、暗記で解決できるものが多くなく、計算が必要とする問題、各項目の本質を理解していないと解けない問題がそれなりに含まれているからです。
「Di-Lite (ディーライト)」とは、「デジタルを使う人材」であるために、全てのビジネスパーソンが、共通して身につけるべきデジタルリテラシー範囲です。「Di-Lite」は現在、「ITソフトウェア領域」「数理・データサイエンス領域」「AI・ディープラーニング領域」の3領域として定義され、その学習すべき範囲として、「ITパスポート試験」「G 検定」「データサイエンティスト検定」の3つの試験のシラバス範囲が推奨されています。
デジタルリテラシー協議会
まとめ
DS検定試験とは
- 一般社団法人データサイエンティスト協会が実施
- データ加工、機械学習、データ分析、エンジニアリング、数理統計学、ビジネスなど、様々な知識やスキルを広くカバー
DS検定の試験科目
- データの活用事例
- データリテラシー
- データサイエンス
- データエンジニアリング
- ビジネス力
- 統計学・数学
DS検定の難易度や合格ライン・合格基準
- DS検定は今までの国内のデータサイエンス資格の中で最も難易度が高い
- 2024年第7回目の合格ラインの目安は正答率約79%
DS検定のG検定との違い
- DS検定はG検定よりも、出題範囲が2割ほど広い
- DS検定の方が難易度が少しだけ高い
DS検定の合格を
目指している方へ
- DS検定に合格できるか不安
- 勉強をどう進めて良いかわからない
- 勉強時間も費用も抑えたい
アガルートのDS検定講座を
無料体験してみませんか?
追加購入不要!これだけで合格できるカリキュラム
充実のサポート体制だから安心
全額返金の合格特典付き!
▶DS検定講座を見る
約2時間半のDS検定やG検定、数学ストラテジスト資格試験対策講義が20日間見放題!
実際に勉強できる!講義に対応したレジュメ(PDF)付き
1分で簡単!無料!
▶資料請求して特典を受け取るこの記事の著者 ヤン ジャクリン
2015年 東京大学大学院 理学系研究科物理学専攻 修了(理学博士)
2015年 高エネルギー加速器研究機構 素粒子原子核研究所(博士研究員)
2017年 株式会社GRI(現職) 講師 兼 分析官
2019年 Tableau Desktop Certified Associate 資格取得
・英検1級
・TOEFL IBT試験満点
北京生まれ、米国東海岸出身(米国籍)、小学高学年より茨城県育ち。
万物の質量の源となるヒッグス粒子の性質を解明し、加速器実験による新粒子発見に関する研究を行い、国際・国内学会発表20件以上、査読論文5件以上。
10年以上に渡り、幅広い年齢層の学習指導を学習塾や大学などで実施(5科目、英会話、受験指導、素粒子物理など)。
現在は、株式会社GRIにて、データ分析官(データ前処理、可視化分析、マーケティング施策の分析 他)
公開講座および法人研修を多数開設。