2021年11月16日に、今年最後のG検定試験を受験した方、勉強も試験当日もお疲れ様でした❗️

私も昨日、皆さんと一緒にこの試験に向き合ってきました。以下では個人的な感想をまず述べてから、定量的に今までの試験との出題の変化についてコメントします。

資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
  ・講座(G検定・機械学習・データ分析など) 約3時間分

現役プロ講師によるわかりやすい講義

1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)

20日間無料で講義を体験!

全体的な感触

全体に見ると、前回とは傾向が大きく変わらない、むしろJDLA様の出題意図が前回とほぼ同じなのでは、とまで感じました。

実務で使える知識を確認したいなどの協会側の人材育成における「姿勢」を十分に窺えて、改めて、良問の多い有意義な試験だと再認識できました。


個人的に何が嬉しかったのかというと、斬新(そして奇抜)なアルゴリズム名、あるいは聞いたことのない法律を問う問題はあまり多くなく、機械学習やニューラルネットワークの基礎をしっかりと出題されていたことです。

これらの、時間と共に変わらない堅実な知識を定着することが今後の新しい技術の利用や開発に不可欠な土台ですので大切にすべきです。私の書籍や講座でも、例えば、過学習や特徴量の概念、データサイエンス分野に最も汎用的な知識に力を一番入れています。半分意地ですが(笑)。。。。

今後勉強していきましょう、新しい概念

聞いたことのない技術ワードは好奇心を掻き立てられ、ジェネラリストとして今後も勉強を続けていくきっかけとなります。
今後のブログの中で、これらを1つずつ解説していこうと思います。

今回出題された比較的新しいワード、印象に残ったものは以下です。

●CycleGAN
●アダマール積
●オンライン/オフライン強化学習
●パルス符号変調器
●アルゴリズムバイアス
●教師強制(teacher forcing)
●T-SNE
●NAS(Neural Architecture Search)

講座や書籍の手応えは?

いうまでもなく、「白緑本」の著者、そしてG検定講座の担当講師として、提供しているコンテンツが利用者を合格に導けたかどうかが寝れないほど(笑)気になります。

試験が終わったばっかりで、まだフィードバックを十分に得られない今、この1、2ヶ月で私の書籍や講座を選んでくださった600名あまりの方々には、他では得られない価値を与えられたことを願うばっかりです。

試験後に、お疲れの中もすぐにコメントを寄せてくださった受験者からは、「的中率が素晴らしい」とのご意見いただきました。 

これらと今後いただくご指摘を謙虚に受け止めて、より良い講座、記事、書籍を今後永く提供していけるように磨いていきます!⭐️
おかげさまで、今後も書籍を「最強バイブル」をメンテナンスするモチベーションをいただきました。

講座や書籍からは、特に以下が今回目立って現れた気がします。

参考コラム:G検定直前にチェック!講座のQ&Aを共有

【Chap1】
探索・推論、 Is-a 関係(意味ネットワーク)
強いAIと弱いAI 、AI効果
エキスパートシステム、 知識のボトルネック

【Chap2】
過学習(3〜4問)
顧客セグメンテーション 
クラスタリング
汎化性能
訓練データと検証データ
ランダムフォレストのアンサンブル
ハイパーパラメータ

【Chap3】
(この辺はGRIの隔週開催のもくもく会でも多く取り上げました)
誤差逆伝播と活性化関数、ReLU(5問以上) 、ソフトマックス関数、
EfficientNet(スケールの法則)
大域最適解 、Adam で学習率を調整
転移学習、 データ拡張 、ドロップアウト
エポック、イテレーション、ResNet と skip connection 、GPU (この辺は必ず出ると強調しました!)
事前学習とオートエンコーダ
RNN とそのゲート、LSTM(5問以上)
GAN,DCGAN VAE

【Chap4】
One-Hotベクトル
Grad-CAM(3問も出題)
Mask R-CNN(インスタンスセグメンテーション)
Actor-Critic
機械翻訳、 Seq2Seq 、TF-IDF
AD変換、音素
BERT 、fastTeXt 、ELMo

【Chap5】
XAI、透明性 個人情報保護法 不正競争防止法、差し止め 、
クラウドとエッジ プライバシーバイデザイン、
サンプリングバイアス 、フィルタバブル 、PoC

以前の試験・模試と比べた出題の変化

今回は、最新の2021年第3回の試験を、過去の数回の本試験及び企業が提供している模擬試験と比較しました。

模擬試験には弊社提供のものをあえて含ませませんでした。

過去問に関しては、保存や共有をすることができないので、「記憶」や受験直後にメモした「感触」に基づいています。よって数字の正確さにはブレがあることをあらかじめご了承ください。

比較をした対象は:2021年第2回、2020年第3回、2020年第2回、2019年第3回、の本試験、企業が提供されている模擬試験です。

(注)

1.「毎回出る問題」もあるので、新しい順に比較しています。つまり2021年第2回に出ていたらそれより昔の試験とはもう比べません、という意味です。

2. 問題が(ほぼ)完全に一致した場合のみカウント。同じ概念が問われているけど問題文はかなり違う場合は異なる問題とみなしています。

大まかな結果は以下です。

過去受験メモ設問数
2019第3回1~2問
(ここにしかなかった問題)
2020第2回数問
(つまり2021#2や2020#3にはなくてここにあるのは数問)
2020第3回数問
(つまり2021#2にはなくてここにあるのは数問)
2021第2回全体の半分を以上
(つまり今回の試験のうち100問以上が前回の試験にも出題)
新規1/3 程度?
(つまり、今回の試験のうち、1/3程度が今まで見なかった問題)

以上を省みて言えるのは、問題の2/3程度は今までの試験でもよく現れていた問題です。

時間とともに変わらない、誰もが一度は身につけなければいけない基礎知識の存在が非常に強いからでしょう。

また、全体の半分以上は1つ前の試験(2021#2)にそのまま出題されていました

特にシラバスが2021年4月に変更されてからは、前回や前々回の試験の傾向に関する情報を正しく、偏りなく仕入れて、試験対策のお助けにするといいですね。

そして、印象として、「新規」カテゴリの問題の多くは、私の書籍や講座でいうPart5のコンテンツです。その中でも、データの正しい活用法(例えば、そんなバイアスが発生しうるのか)、AIプロジェクトを成功するための細かい留意点(データ量、計算時間)、モデルの解釈性(XAI、Grad-CAM)が注目されています。

他に、今回は前回にも増して、音声認識(物理学そのものの細かい知識)の問題が多いです。音声処理は、近年、ディープラーニングの応用分野として注目度が上がっていることは2021年4月のシラバス変更でよくわかりました。

個人情報保護や不正競争防止に関する出題が多かったとソーシャルメディア上でも声が多くありましたが、こちらは前回(2021#2)の時も全く同じでした。

いかがでしたか?

後続のブログでは、上記の新しい概念の解説、そして、もしできたら、もう少し細かい出題傾向分析と学習アドバイスを皆さんにお出しできたら嬉しいです。

最後に、みかみ先生のブログもぜひご覧になってください。

公式本だけを使って対策されている方も多いですが、公式本では対策が不十分である個別項目、素晴らしく需要の高い分析軸ですね。

データサイエンス(G検定・AI・機械学習・データ分析)

資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
  ・講座(G検定・機械学習・データ分析など) 約3時間分

現役プロ講師によるわかりやすい講義

1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)

20日間無料で講義を体験!

実践的な
Python・データ分析スキル

を身に付けたい方へ

何から手をつけたら良いかわからない

独学で挫折したことがある

専門的な内容で身近に相談できる人がいない

このような悩みをお持ちでしたら
AI Academy Bootcampにご相談下さい!

「目的別学習コース」と「手厚いサポート」

AI Academy Bootcampに無料相談する>>

この記事の著者 ヤン ジャクリン

ヤン ジャクリン (講師紹介はこちら

2015年 東京大学大学院 理学系研究科物理学専攻 修了(理学博士)
2015年 高エネルギー加速器研究機構 素粒子原子核研究所(博士研究員)
2017年 株式会社GRI(現職) 講師 兼 分析官
2019年 Tableau Desktop Certified Associate 資格取得

・英検1級
・TOEFL IBT試験満点

北京生まれ、米国東海岸出身(米国籍)、小学高学年より茨城県育ち。

万物の質量の源となるヒッグス粒子の性質を解明し、加速器実験による新粒子発見に関する研究を行い、国際・国内学会発表20件以上、査読論文5件以上。
10年以上に渡り、幅広い年齢層の学習指導を学習塾や大学などで実施(5科目、英会話、受験指導、素粒子物理など)。
現在は、株式会社GRIにて、データ分析官(データ前処理、可視化分析、マーケティング施策の分析 他)
公開講座および法人研修を多数開設。

講座を見る