データサイエンティストとして入社するまでにやったこと
こちらの記事では、データサイエンティストを目指すきっかけからデータサイエンティストとしてオファーを頂くまでのことを書かせていただきました。
今回は、データサイエンティストとしてオファーを頂いてから入社するまでにやったことについてまとめてみたいと思います。
ミートアップやイベントへの参加
業界研究やお勉強も兼ねて色々なミートアップやイベントに参加させていただきました。
AIジョブカレに通い始めるまでは名前も知らなかったのですが、機械学習の自動化に力を入れているDataRobotという会社があります。DataRobotは定期的にユーザー向けに説明会などを開いており、まだユーザーではない人でも参加してみて、実際に触ってみることができる会もありましたので、行ってみました。
大体一通りの機械学習の流れは実践してみて掴めていた頃にお邪魔したので、そのすごさが良くわかりました。こんなことできたら、いいな、あーPythonでどうやって書いたらこういうことできるんだろう、とか色々考えていたことが、まぁものの見事に全部自動化されていますね。細かいパラメータとかデータの型とか細かい調整が必要なところもGUIからやれるようになっており、これならPythonが実装できない人でも機械学習できそうです。
一言でいうと、カッコイイ!と思いました。自分は機械学習に必要な実装をPythonでひとつひとつ調べながらやってますが、これがあれば、出したい予測に対してそれなりのデータがそろっていれば、かなりイケてるモデルで学習と予測をぶん回すことができそうです。デモ用のアカウントでもデータを吸い上げたら本国経由でAWSにつなげてそこで機械学習の処理をぶん回しているようです。色々なモデルで同時に学習と予測をしてその予測結果とか一覧やグラフやらで比較検討できちゃう感じでした。
ただ、データが揃うまでのところが実世界ではかなりキーポイントになりますが、その辺のソリューションはおそらくDataRobotのデータサイエンティストがガイドしていくような感じなのでしょうか・・・?機械学習やってみたいけど、手が出ない会社にはうってつけかもしれません。
Slush Tokyo 2019 - Slush Tokyo
スタートアップに転職しようと思っていたこともあり、スタートアップ界隈のことを調べていたら出てきました。どうやら毎年開かれていたようで、こういった催しがあったこと自体知らなかったことも、本当にここ数年自分のアンテナが低くなってしまっていたんだなと感じました。
行ってみたら、サイトの雰囲気の通りというか、もはや完全にフェスのノリでしたね。昔はサマソニとかROCK IN JAPANとかよく行ってましたけど、本当にそんな感じでした。みんな真面目な話するはずなのに爆音のシャレた音楽とともにアントレプレナー登場みたいな感じでしたし、メインステージはちょっとマイクの音が大きすぎたので、インナーイヤーヘッドフォンを着けたまま聞く感じでちょうどよかったです。
イベントで集まる人たちも、ブロックチェーン周りやAI周り、IoT周りの人が沢山いたので、最先端の領域を学ぶのに本当に良い場だなと思いました。チケット代はそれなりにしますが、全然払う価値あると思います。
にしても本当に世界の第一線を走っているアントレプレナーのみなさんの熱量は凄かったです!!みんな情熱をもって自分たちの事業に取り組んでいて、凄く良い刺激になりました。やっぱり事前に会社のホームページを調べたり、インタビュー記事読んだりしてても、実際会うのとは全然違いますね。なんだろう、やっぱりすごい人って本当にエネルギーやオーラに満ち溢れているし、それに触れるだけで自分までそうなれるような錯覚すら感じるような気がしてきます。
正直自分はそれなりに情熱があってやりたいことに向かってやれるタイプとは思いますが、やっぱりちょっと横道にそれたり、気持ちがめげそうになったり、全力で逃げることもあったりする凡人なので、こういった方々に定期的に触れて栄養補給するのは大切なんだなと思います。
次はTeam AIのイベントに初参加しました。代表の石井さんの動画はちょこちょこ見ていたのですが、この会は以下のテーマで、もうまさに今の自分のためにあるかのようなテーマだったので行ってみました。
①BLOCKCHAIN/仮想通貨取引は金融業界の再成長エンジンになるのか?
②RPA(Robot Process Automation)による劇的な事務合理化と働き方改革
③AIロボットによる金融無人店舗化へ
④量子コンピューターとAGI(汎用人工知能)が読み解く資本市場
恐らく10~15人くらい集まっていたかと思います。進め方も面白くて、一方的にレクチャーをする感じではなく、みんなでラウンド形式でトピックについて話し合ったりする場もあったり、会の後には近くのレストランで一杯やりながらみんなで業界の話をするような流れもあって本当に楽しかったです。
Blockchainのこととかは、入門書をちょろっとかじった程度ではありますが、やっぱりきちんと理解できていないところがあったり、あるいはさらに最新の情報があったりと代表の石井さんがとても幅広くわかりやすく解説してくださるので、本当に参考になりました。
その後の量子コンピューターを解説してくださった伊藤さんも、難しいお話をすごくかみ砕いてお話してくださるので、入りとしてこの場を選んで本当に正解だったなと思いました。いきなり別の講義とか本とかにアタックしてたらちんぷんかんぷんのまま終わってしまいそうなところ、なんとなくどんなことをしてくれるのかのイメージは湧かせられるようになりました。
機械学習もソフトウェア工学の学問体系的な感じでまとめていこうというような流れが始まったようで、そのキックオフがありました。当日は行くことは難しかったので、これまで使ったことのなかったニコニコ動画でプレミアム会員になって視聴しました。本当に便利な世の中になりましたね。動画配信で生の話を聞けるなんて本当にありがたいですね。
ただ、家のこととかやりながら見ていたので、工藤さんと杉山先生の発表を見たあたりであとは録画みればいいやと思って中断してしまい、その後1週間以内に見なければいけないのに見そびれてしまうという失態を演じてしまいました。やっぱりこういうのは直接行って聞いた方がいいですね。人のエネルギーに触れることもできますし。もちろん動画でもお話の内容は大変参考になりました。
杉山先生は機械学習の手法を簡潔にまとめてくださっていてとても参考になりました。
確かにデータ収集の状況を踏まえて学習法をうまく使い分けられないと、半教師付きでやるとよかったところ、前処理でばっさりデータ落として無理やり教師付きにしちゃうとかなってしまうのか…そもそもそういう学習法があること自体を勉強していないとダメですね。 #mlse_kickoff
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月17日
杉山先生の論文あとで見てみよう。半教師付き学習、信頼度から分類、類似データ対から分類、…メモり切れず…どこかに資料アップされているといいのですが… #mlse_kickoff #MachineLearning #機械学習
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月17日
というわけでまだ杉山先生の論文見れてませんが、見なければ!ブログに書くのがちょうどよいリマインダーになりました。
こちらでは、前の記事でも紹介させていただいた『会社を変える分析の力』を執筆された滋賀大学の河本先生のプレゼンがある!ということで気になっていました。河本先生のお話は実際の現場でのお話なので、ビジネスでどのようにデータサイエンスが活かされるのか、どんなところでつまずきやすいのかなどお話してくださいました。また、最近だとGEなんかはエンジニア自身がデータサイエンスを普通にできるようにするということを目指しているとか、データサイエンスにおける人材育成のお話なんかも参考になりました。割と今いる会社もそんな雰囲気で、非エンジニアの方とかでもTableauとかPythonとか使ってデータ分析を普通にやる雰囲気がありますね。きっとデータサイエンスってロジカルシンキングとかみたいにビジネススキルの基礎を成す一般教養レベルにいずれなっていくのだと思います。
その他感想はこちらをご覧ください。
やはりスタートアップの方々のピッチを見るのは本当に刺激になりますね…!
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月23日
最新テクノロジーと社会課題について考える5日間「朝日新聞DIALOG AI FORUM」開催 https://t.co/GGUDBkum4W
Aidemy石川さんの「イニシャルがAIです!」はなかなかオイシイ感じですね…w
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月23日
それはともかく、Aidemyは国内受講数No.1になったみたいですし、前から気になっていたので、受講メニュー見てみよう。#Aidemy
JOLLY GOOD上路さんのお話めちゃくちゃ面白かったです!センサーからIoTじゃなくて、VRからビッグデータ集めてソリューションに繋げるところになるほど!と思いました。 https://t.co/0MmrxSKMwb
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月23日
競馬予想AIなんてあったんですね〜!確かにデータは日々蓄積されるので分析対象として良さそうですね。 https://t.co/gUCEXZKcWR
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月23日
何この量子トンネル効果の裏ワザ感…!400mトラックで200m走したときにトラックのど真ん中突っ切ってゴールした感じ?(例えが下手… #QuantumComputing #量子コンピュータ
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月23日
大関先生(@mohzeki222)のお話めちゃくちゃ面白かったです!開発競争の歴史や各種事例、デモなど盛りだくさんで本当に勉強になりました!最後の夢のお話には感動して鳥肌立ちました。#朝日新聞DIALOG #QuantumComputing #量子コンピュータ
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月24日
自分も何か貢献できるような働きをしていきたいです…!まずは実用化させるためのアプリ開発からですね!『量子アニーリングの基礎』も今買ってきたのでD-WAVEのいじり方見てみよう。 #QuantumComputing #量子コンピュータ
— Yukiyoshi Sato (@YukiyoshiSato) 2018年5月24日
東北大学の大関先生の話は本当に感動しましたね…!映画とかみたいに特別な演出もなく、普通に素でお話を聞いて鳥肌が立ったのって人生で初かもしれません。未だにその時の感動を思い出すと体の底からフルフルしてくる感じがあります。そうだ、D-WAVEのAPIとかも調べないと!目標に挙げておきながらそれ以来何もしていないという…。ブログを書きながらリマインドするのが定着化しそうですね…!
自学自習(2018年4月~2018年6月)
内定を頂いてからはイベントなどに合わせて予習する目的もかねて以下の本を読みました。
ベイズもかじってみました。まだきちんと理解はできていませんが、どんなことをやるのかはつかめた気がしています。この辺も追って学習を深めたいと思います。
- ジャンル: 本・雑誌・コミック > 人文・地歴・哲学・社会 > 社会 > 労働
- ショップ: 楽天Kobo電子書籍ストア
- 価格: 1,944円
こちらは大分前に買って寝かせていましたが、ざっと目を通しました。Googleがどういう領域でディープラーニングを適用しているかの事例を中心にまとめられています。理論面にはそれほど触れずに、だれでも読みやすくなっていると思いますので、AI導入したい人が読むのにちょうどよいと思います。
東北大学大関先生の本です。ぜひみなさんご一読ください。そして機会があれば大関先生のお話を直接聞いてみてください!DVD化されたら真っ先に買います。冗談抜きで。
- ジャンル: 本・雑誌・コミック > 人文・地歴・哲学・社会 > 宗教・倫理 > 倫理学
- ショップ: 楽天ブックス
- 価格: 1,350円
TED SAPPOROでもブームになった植松さんの本です。ほぼTEDでのお話とリンクしていますが、私は植松さんの考え方が大好きです。このブログで書いている内容も植松さんに影響を受けているところが結構あります。
正直転職するのは少し怖かったです。でも勇気を出してその一歩を踏み出してみることにしました。でもやっぱり怖かったので、入社日前夜と入社日の通勤時間でこの本を読み切りました。勇気出ました。よっしゃ、やってやるぞ、という気持ちになれました。自分の気持ちが浮かないときとか、イマイチなことが続くときとかにも定期的に動画を見て気持ちをリフレッシュさせていただいています。今はそんなにイマイチな気分ではないですが、また見てみよう。
TEDの動画はこちらです。