yukiyoshisato's blog

とりとめのないめも

日本ディープラーニング協会(JDLA)のG検定を受けました。

本日、日本ディープラーニング協会(JDLA)が主催するG(ジェネラリスト)検定を受験しましたので、雑感を述べてみたいと思います。

G検定とは何か

www.jdla.org

JDLAの提供する資格試験にはG検定とE資格という二つの種類があります。

G検定

ディープラーニングの基礎知識を有し、適切な活用方針を決定して事業応用する能力を持つ人材

E資格

ディープラーニングの理論を理解し、適切な手法を選択して実装する能力を持つ人材

ディープラーニングを取り巻く主要な2種類の登場人物を育成していこうという狙いです。いわゆるシステム業界で分かりやすい言葉で言えば、「ユーザー」と「エンジニア」です。

エンジニア側はともかく、ユーザー側のお話としてAI界隈でよく聞く話で、「AI使ってなんかやれ」とか「金払ってデータもやったのになんで精度出ないんだ」とかAIのことを何もわかっていないのにこういうおかしな事を言う人が出てきてしまうと、うまくいくものもうまくいかなくなってしまいます。どんなにエンジニアが努力をしても、そもそもAIで解くべき問題でもなければ、いくらお金払われても何の役にも立たないようなゴミデータばかり出されても、こればっかりはどうにもなりません。

恐らくそういった残念な人が出てくることを抑止したいという狙いもあってこのG検定ができたのかな…?という気もしますね。

なぜ受けたのか

私は今、東京大学松尾研究室が提供する寄付講座である、Deep Learning 基礎講座を受講しています。この講座のレベル感は恐らくE資格の方に当たると思います。この講座では高レベルなライブラリを使わずに、自力でディープラーニングのモデルを開発できるようになることを目指していて、実際に演習ではそういったことをやっています(今のところ私はコピペしてなんとか動かすのが精一杯ですが)。

でも、ふと思ったときにディープラーニングで何をしたいのかという点について、自分の中でもまだあまり具体的なイメージを持てていなかったというか、そもそも何ができるのかをあまりよく知らなかったので、アイデアが湧いてこないというような感じもありました。そんな中、本屋でG検定のテキストを手に取ってぱらぱらっと眺めてみたら、今の私がちょうど知りたかったようなことなどが簡潔にまとめられているなという印象を持ちました。

また、そのすぐ横にJDLAが発刊したばかりのこちらの本もありましたので、両方合わせて買ってみることにしました。

あと、最後に一番大事な点ですが、G検定合格者Slackなるものがあると聞き、これに加わりたいと思ったのがこれに受かりたいと思った一番の動機です。機械学習界隈では、こういったコミュニティが色々なところでできており、無料で入れる上に、その道のエキスパートから色々と教えてもらうこともできてしまいます。本当に学習意欲のある人にとっては素晴らしい環境が整っていると思いますし、こういった動きを見ると本当にいい時代になったなぁとしみじみ思います。ご参考までに私が参加しているコミュニティをご紹介します。

Kaggler-ja
https://kaggler-ja.herokuapp.com/
機械学習工学研究会
https://sites.google.com/view/sig-mlse/

どう勉強したのか(どう勉強するとよかったのか)

この記事を書いている時点では、まだ合格していませんでしたので、内容を踏まえてどう勉強すればよかったのかも含めて反省してみたいと思います。

まず、私がG検定を受けようと決めたのは締め切り1日前の11月14日でした(遅)。

次回は2019年3月9日に予定されていますので、気になる方は早めに勉強を開始しましょう。

私の場合、もともと機械学習は勉強していたところに、松尾研の講座と講座の副読本としてこちらを読んでいました。

そのため、ゼロから勉強する方に比べればだいぶアドバンテージはある状態だったと思います。でもやっぱり実際に試験勉強をして試験を受けてみて実感するのは自分が苦手にしているところとか、理解をおろそかにしていた部分とか如実にわかるので大変良い自己点検の機会になりました。結局私がやれたこととしては、公式テキストを一読する程度で終わってしまいました。

で、肝心のどう勉強すると良かったのかという点についてですが、まず公式テキストだけでは足りません。出題内容に関して触れられてはいるけど回答につながるまでの情報は書かれていないものもあったり、AI白書2017からもかなり出題がありました。

もうすぐ、これの2019版が出ますね。

あと、これはちょっと意外だったのですが、簡単な計算問題(微分やベクトル計算)も出ました。ディープラーニングをかじっていれば普通にやる程度のものではありましたが、エンジニアでもないユーザーサイドの方からすると、「お、まじか」ってなる気はします。社会実装例(自動運転、他)に関しても結構細かいところまで突っ込まれていたりしたので、活用例もしっかり勉強しておいた方が良いと思いました。

本番対策Tips

あまり本質的ではないですが、ルールを破らない程度のTipsをまとめてみたいと思います。この試験は自宅受験になっており、わからないことは自分で調べながら試験を受けることができます。ただ、120分で226問とかなりボリュームがありますので、恐らく調べるスキを与えないためのボリュームなのかと思います。でも調べることはできますので、これを最大限活用しましょう。

問題の中には、比較的簡単な選択問題が1つの文章で4問とかあるケースもあれば、1問で5つぐらいの長文を読んで内容を判定しないといけないようなものもあります。絶対に犯してはならないのは、自信のない読解問題で時間を消費することです。そのため、試験中、私の中で以下に問題を分類しました。

  1. 調べればすぐに答えにたどり着きやすい設問
  2. 読解が必要で答えにたどり着きにくい設問
  3. 読解が必要で答えにたどり着きにくそうで、後で調べても回答できなさそうな設問

この試験には、後で振り返るためのマーキングをする機能がありますが、3に関してはマーキングをやめました。つまりその場でテキトーに答えるだけ答えて完全に捨てました。

結果どうだったかというと、この戦略は正しかったと思います。私のペース的に、半分ぐらい来たところでまだ85分くらい残っていました。ただ、この前半は考えることを一切しなかったので、ちょっとでも不安に感じたらマーキングして次に進んでいました。このペースでいけば、50分くらい余ることになりますので、後半は、1の調べればすぐに答えにたどり着きやすい設問について、初見でも調べながらやることにしました。特に、1つのテーマで穴埋め4-5問とかあるやつは調べるコストに対して回答効率がぐっとよくなりますので、多少自信がある方でも絶対に落とすまいと調べながらやりました。

その結果、一通り解き終えた時点で余った時間は17分ぐらいでした。この17分を使って前半かなり飛ばしたところを中心に振り返りをしていきました。ここで、公式テキストでも書いていないこととかもあったので、ググったりして回答していきました。そうこうしていたら、いくつか回答しきれずに時間切れになりました。やはりググり出すとすぐに回答にたどり着けるかわからないですし、可能な限りググる個数を減らすのもポイントですね。 

あと、公式テキスト調べるときは索引を利用して該当ページを探したりしていましたが、まだこれからテキストを購入される方は、楽天Koboでの電子書籍購入がオススメです。なぜなら、電子書籍の中身をPC上で検索できるからです。ではなぜAmazon Kindleではないのかと言うと、Amazon Kindleは日本語での検索に対応していません。試験内容は日本語ですので、日本語で検索することになりますが、Amazon Kindleで検索しようと思うと、テキストエディタなどで一度日本語を入力してから、それをコピペして検索する感じになります。これだけ時間がタイトな試験なので、そのリードタイムは下手したら数問回答をできるぐらいの時間になりかねません。推薦図書の楽天Kobo版リンクを貼っておきます。

これは試験を受けた後にTwitterを眺めていて知ったのですが、どうやらG検定の模擬試験を受けられるところがあるようで、軽くググってみたところ恐らくこちらですかね…?試験形式になれるためにも問題に解きなれておくのは大切だと思いますので、ご活用ください。

study-ai.com

 最後に、間違っても数人で結託して設問をブートストラップサンプリングして解いてアンサンブル回答する(?)みたいなことはしないでくださいね。

 これからG検定を受けようとされる方の参考になれば幸いです。