アイキャッチ

業務中のKaggle参加を推奨――DeNA流「データサイエンティスト」の必要条件と育て方

ITニュース

    DeNA AIシステム部

    世界トップレベルのデータサイエンティストたちが集い、最適な分析モデルの構築を競うコンペプラットフォーム『Kaggle』。参加者(Kaggler)は全世界に100万人以上おり、提示したモデルの精度に応じて「Gold」「Silver」「Bronze」メダルが授与され、その取得数によって「Grandmaster」「Master」「Expert」「Contributor」「Novice」の称号が与えられる。

    シリコンバレー企業ではKaggleで上位に入賞し、称号を獲得している人材の積極採用は普及しているが、日本国内ではまだ一部の企業が注目し始めたばかり。そんな中、先行してこのKaggle人材の獲得に乗り出しているのが株式会社ディー・エヌ・エー(以下、DeNA)だ。

    転職市場でもデータサイエンティストの求人は急増しており、人材ニーズは高まっている。とはいえ、新たな領域の職種だけに、必要とされるスキルや志向性、業務範囲の定義が曖昧なまま、その職種名だけが独り歩きしている感もある。

    そこで、日本全国で数十名程度と言われるKaggleマスターのうち、既に4名が在籍しているというDeNAのデータサイエンスチームに、データサイエンティストの職務と必須要件について聞いた。

    プロフィール画像

    株式会社ディー・エヌ・エー
    システム本部 AIシステム部 部長
    山田憲晋氏

    1995年に大手電機メーカーへ入社し、TCP Offload Engine等の研究開発に従事。その後、2008年7月にDeNA入社。『Mobage』のサービス開発・インフラ運用、ゲーム開発チームのマネージメントを経て、現在はDeNA全社のディープラーニングを中心としたAI活用事業の研究開発および分析基盤の構築・運用を行うAIシステム部のマネージメントを行う

    プロフィール画像

    システム本部 AIシステム部 AI研究開発第二グループ
    原田 慧氏

    数理学博士。2011年4月、金融コンサルティング会社に新卒で入社し、主に金融機関向けの数理モデル構築およびモデル活用のコンサルティングを担当する傍ら、Kaggleのコンペに多数参加。累積でGold medalを2個獲得。2018年2月、DeNAに入社。オートモーティブ事業部向けの案件を手掛けるのと並行し、データサイエンスチームのチームリーダーとして、Kaggleランク設定や採用活動など、チーム立ち上げ業務に取り組む。現在、自身もKaggle Grandmasterを目指している

    プロフィール画像

    システム本部 AIシステム部 AI研究開発第二グループ
    小野寺 和樹氏

    神奈川大学卒業後、銀行系基幹システム開発に従事。その後、金融コンサルタントとして金融機関の審査モデル構築に携わりつつ、2015年にACM/KDD 主催のデータマイニングコンテスト『KDD Cup』にて準優勝。そして17年、Kaggleの『Instacart Market Basket Analysis』にて準優勝。現在はDeNAにて、各種サービスの機械学習活用に向けた開発を行っている

    分析能力のさらなる向上を目指し、新制度『Kaggle社内ランク制度』を導入

    データサイエンティストの採用、育成を強化している企業は多い。ただ、その活躍の舞台を十分に整え、ビジネスへのインパクトを実現している企業は意外に少ないかもしれない。こうしたデータ活用の観点で、先行する企業の一つがDeNAだ。

    「当社では2010年代の初めから、本格的にデータ分析・活用に取り組んできました。ゲームを例に取ると、アクセスログや画面遷移などの基本的なデータはもちろん、ゲーム内でのユーザーの一つ一つのアクションについて、細かなログを収集・分析しています。分析結果を受けて、ゲームの中身を改善しながらユーザー体験の向上を進めてきました」

    こう語るのは、DeNAのAIシステム部部長を務める山田憲晋氏だ。こうした施策を進めながら人材育成に注力することで、同社はデータサイエンティスト集団の厚みを増し、そのケイパビリティーを高めてきた。そして今、この動きをさらに加速させようとしている。それがKaggle人材獲得への取り組みである。

    DeNAは2018年4月、『Kaggle社内ランク制度』を導入した。Kaggleで開催されたコンペでの実績に応じて、社員がKaggleに取り組む時間を業務として認める制度だ。こうして、社員のKaggleへの参加を推奨すると同時に、Kagglerの積極的な採用に向けて動き出してもいる。なぜ今、DeNAはKaggleへの取り組みを強化しているのだろうか。

    新たな課題に、新たなアプローチを都度考え出せる能力が求められる

    「ここ数年で、データ分析を担う社員はかなり増えました。DeNAの各サービス事業部の中に在籍し、開発チームと共に仕事を進める彼らのことを、当社では『データアナリスト』と呼んでいます。

    分析をしやすいようにデータを加工して整備し、定常レポートによるKPIを見える化し、そしてデータ分析を元にサービス改善施策を提案することが主なミッションです。データアナリストの活躍もあって、データ分析に基づいて意思決定するという業務フローやカルチャーも根付きました」

    一方で、事業部ごとにデータ分析を行うのでは、DeNAという企業の成長スピードに対応しきれなくなってきたと、山田氏は続ける。

    山田憲晋氏

    「かつてはゲーム事業が中心でしたが、現在はヘルスケアやオートモーティブ、スポーツなどの事業が生まれ、今後もまた新たな事業の立ち上げが予想されます。

    そこで、各事業部を横断的にサポートして、AI技術を事業活用するための専門部隊が必要と判断し、AIシステム部を設立しました。このAIシステム部に所属する機械学習や強化学習などのエキスパートを、当社では『データサイエンティスト』と呼び、データアナリストとは明確に切り分けています」

    データアナリストは、各事業部のサービスにコミットしてデータ分析を行い、高いコミュニケーション能力でサービスメンバーを説得しながら既存サービスの改善に力を注ぐ。データサイエンティストは、DeNAが持つ全てのサービスデータを対象に、機械学習を用いて精度の高い予測モデルをつくることに集中している。データアナリストとデータサイエンティストが連携することで、より大きな事業貢献が可能となるという。

    多くの企業ではこの切り分けが曖昧で、データサイエンティストという職種の業務範囲として一括りにされがちだ。しかし、これら全ての領域をカバーするのは実際には難しい。DeNAは、これまで多くのデータアナリストを育成してきた上で、次のステップとしてデータサイエンティストの拡充フェーズへと移行しつつある。

    同社のAIシステム部は大きく2つのグループに分かれているという。分析基盤づくりを担うグループと、AIのアルゴリズム開発などを行うグループだ。2018年2月、後者の中にKaggle経験者を集めてデータサイエンスに特化したチームが生まれた。

    「今後、データサイエンスで解くべき課題は増えるでしょう。サービスごとの結果分析だけではなく、予測の必要性はより高まっていくと思います。既存事業の延長線上にはない、新たな課題の解決が求められてくるはずです。だからこそ、日々新たな課題に対峙し、その度に新たなアプローチで解決方法を考え出せる人材が必要なのです。

    AIシステム部には、ディープラーニングに精通したAI研究者が多く在籍し、自動運転でも使われる画像認識技術や、AlphaGoで使われている深層強化学習等の先端AI技術を実サービスに応用する取り組みを行っています。

    ただ、そのような専門的なAI技術だけでなく、データサイエンス技術を使ったビジネス活用ニーズも多く存在します。例えば、決済サービスでの不正取引の検出アクセスの確率や野球観戦チケットの販売数などを、機械学習の予測モデルを用いてシミュレーションしてみるなどです」(山田氏)

    Kaggleには、こうした能力を備えた人材が多く集まっている。また、社員に対してKaggleのコンペへの参加を推奨することで、山田氏が語るような高度な課題解決力を磨くことも期待している。それが、DeNAがKaggleに着目した理由だ。

    「高度な予測モデルの構築には、幅広いデータ分析のスキル・経験を積む必要があります。その意味で、業務以外にもKaggleのような場で知見を養うことは価値あることですし、また社内でKaggleに取り組むことでアドバイスを得たり、お互いに刺激し合うなど、チーム全体のレベルアップに必ずつながると考え、『Kaggle社内ランク制度』を導入したのです」

    既に同社にはKagglerが集い始めている。現在、AIシステム部に所属している原田慧氏と小野寺和樹氏も、Kaggleをはじめとするデータ分析コンテストで上位にランクインした経験を持つ人材だ。両氏共に、2018年2月にDeNAに入社した。

    “伝説の剣”ではなく、“手持ちのこん棒”で戦え

    原田 慧氏

    「2014年頃から、土日の時間を使ってKaggleに参加するようになりました。やっているうちに面白くなり、上位に入賞できたこともあって、15年頃からより力を入れるようになったんです。

    でも、やりたい気持ちはあっても、仕事も忙しく、なかなか時間を取るのが難しい状況でした。そんな時に、DeNAが本気でKaggle参加推奨に取り組むという話を聞いて入社を決めたんです」

    そう語る原田氏は現在、AIシステム部内のデータサイエンスチームのリーダーを務めている。原田氏は数理学博士の学位を持っているが、文系出身者にも優秀なKagglerはいる。小野寺氏もその一人だ。小野寺氏は、2015年頃からKaggleに参加するようになったという。

    「最初は全く知見がなく、Excelを使って分析するところから始めました。経済学部出身なのでもともと統計の基礎知識は持っていましたが、プログラミングや分析手法などはKaggleに出会ってから改めて学びましたね。

    小野寺 和樹氏

    機械学習モデルを使う上で、中身を理解したくなってソースコードを開いてみたりとか、そんなことをしているうちに自然と知識は習得していけました。ゲームのようにどんどんハマっていった感じで、今は週末も自宅でずっとKaggle漬けです(笑)。

    DeNAへの入社を決めたのは、Kaggleに時間を割けることはもちろん、その他の面でも自分が望むスタイルで自由度高く働ける環境があると判断したからです」

    Kaggleのコンペは年間100回ほど開催されており、原田氏や小野寺氏は年に5~6回参加している。ところで、Kaggleで上位に入るようなデータサイエンティストになるためには、何が必要なのだろうか。

    「とにかく、データに触ることが大事だと思います。『もっと知識を身に付けてから』と考える人も多いようですが、勉強ばかりに時間を使うことには賛成できません。どこかのタイミングで割り切って、実践してみることです。

    RPGに例えると、強いモンスターに遭遇した時、“伝説の剣”を探しに行くのではなく、手持ちの“こん棒”を使って戦えということ。まずは今持っている力を駆使して、何らかのアウトプットを出すことにこだわるスタイルの人が、データサイエンティストとしても成長できるのではないでしょうか。経験を積んでこそ、実力が身に付く仕事ですから。

    Kaggleに参加していると、あらゆる種類のデータに触る機会が得られます。データサイエンティストは、技術的なスキルや知識の深さよりも、最終的には『どんなデータが扱えるか』が大事。そうした意味で、Kaggleは最適な修行場だと思います」(原田氏)

    「私は好奇心旺盛であることも重要な人材要件だと思います。例えばKaggleのコンペでは、問題によって毎回違うアプローチが求められる。前回と同じような問題だなと思っても、同じアプローチでは全く通用しないんですよ。

    過去の成功にとらわれることなく、常にさまざまな手法を繰り出していくことを楽しめるマインドが絶対必要ですね」(小野寺氏)

    前処理にかける工数が少なく、分析に集中できる

    現在、原田氏がリーダーを務めるデータサイエンスチームは4名ほどだが、近い将来、十数人超へと拡大する予定だ。社内からの異動も考えられるが、主として外部のデータサイエンティストを採用することでチーム力のアップを図ろうとしている。

    「データサイエンティストに対して、DeNAは魅力的な仕事の環境を提供できると思っています。まず、当社が実際にサービスを運営しており、関連する膨大なデータを保有していることが大きい。データサイエンティストはこうしたデータを扱いながら、事業部門と一緒にサービスの改善や新サービスの創造に関与することができます。また、分析基盤が整っているので、高度な分析やモデルづくりに集中できる点もアピールしたいですね」(山田氏)

    分析基盤については、若干の補足が必要かもしれない。一般に、データサイエンティストの業務の中では、データを分析可能な状態にするための前処理に相当の時間がかかると言われる。これに対して、DeNAは以前からデータを整理し、分析するための基盤づくりに先行して着手してきた。

    また、データアナリストなど周囲の協力も得られるので、データサイエンティストが存分に力を発揮しやすい環境がある。事業部門とのコミュニケーションに必要以上の時間をかけずに、本来の業務に集中できるというわけだ。

    こうした中で、原田氏と小野寺氏はデータサイエンティストとしてさらなる高みを目指している。

    「前職ではクライアントに対して、データ活用の意義から説明し、理解を得なければならない場面がよくありました。『データを活用しよう』という総論には誰もが賛成するのですが、各論になると『それって、本当にやる意味があるの?』という声が挙がり、納得してもらうために相当の工数がかかるケースも珍しくなかったのです。おそらく、多くの企業で同じことが起きているのだろうと思います。

    しかし、DeNAに入社してからは、そうした苦労からも解放されました(笑)。社内の共通理解として、データ活用の価値が認められているからこそ、分析業務もその結果の反映もスピーディーに行える。それがデータサイエンティストのさらなる成長につながる。とても良いサイクルが回り始めています。

    データサイエンスチームの体制をさらに強化して、精度の高い予測モデルを構築し、事業成長を加速できるような大きなインパクトを生み出すことが目下の目標ですね」(原田氏)

    「恵まれた環境をフルに活かして、私自身はデータサイエンティストとしてさらに知見を深めていきたいと思っています。

    直近の目標としては、Kaggleのコンペでユーザーランキング1位を獲りたい。全世界で1位。これはもう物凄い快感です。分かりやすい指標だからこそ、のめり込んでしまいますよね(笑)」(小野寺氏)

    データサイエンスチームが、「会社の事業への貢献」と「Kagglerたちのスキルアップ」が両立できることを証明した時、DeNAのビジネスはまた飛躍的な進化を遂げるだろう。同社から、データサイエンティストのロールモデルが数多く誕生することを期待したい。

    DeNA AIシステム部

    取材・文/津田浩司、福井千尋(編集部) 撮影/小林 正(スポック)
     

    Xをフォローしよう

    この記事をシェア

    RELATED関連記事

    RANKING人気記事ランキング

    JOB BOARD編集部オススメ求人特集





    サイトマップ