ディップのデータサイエンティストとは?ーー入社1年目の新卒社員が語る仕事内容・特徴・成長できる環境

author

久保知生
データサイエンティスト ▼詳細

多彩な分析手法を適切に利用し、データに隠れた傾向を抽出することで、ユーザーやクライアント、そして社内の意思決定の質を高める。今回はそんなディップのデータサイエンティストの仕事内容を入社1年目の社員目線でお伝えます!

データサイエンティストの仕事の特徴

ディップのデータサイエンティストは「社内勉強会」や日頃の自学自習を通じてスキルを磨き、日々の業務で「予測モデル構築」や「効果検証」などを行っています。また、これらの業務を通じて得られた知見を「学会発表・イベント登壇」で公開し、外部からフィードバックをもらうことで、再び業務に活かすというサイクルを回している点が特徴的です。今回はこの4つのポイントに絞って、それぞれの仕事内容の事例をお伝えします。(※1日のスケジュールを知りたい方は『ディップの新卒データサイエンティストの仕事内容、スケジュール、入社理由ついて密着取材!」』を併せてご確認ください。)

予測モデルの構築:ビジネスの未来を予測する

予測モデル構築の目的は主に2つあります。一つは、営業活動のサポートです。各種サービスの売上額、受注額、受注率などを予測する統計モデルを構築し、適切な営業活動量を算出します。例えば『バイトル』や『はたらこねっと』などの求人広告を取り扱う採用コンサルタントが効率的に営業活動を行えるように、適切なコール数や提案数を算出することで目標を支援しています。詳しくは『売上・受注予測をするときに精度よりも大事なこと』を併せてご確認ください。

第二に、効果的な広告投資の実現です。ユーザーの様々な流入経路を分析し、統計的アプローチによって受注を最大化できる組み合わせを特定します。広告予算は限られているため、どの広告媒体にどれだけ投資するべきか、データに基づいた意思決定が必要不可欠です。例えば図の予測モデル構築では、状態空間モデルを用いて売上額・受注額をモデリングしています。売上・受注に特有の性質をふまえ、中長期的なトレンド成分や周期的な季節成分をパラメータとして組み込んでいます。また、現場のKPIをモデルに含めて予測精度を改善させることもあります。 

予測モデルのイメージ図

効果検証:データに基づく意思決定をサポート

効果検証ではKGIに影響を与えているKPIの特定や、テレビCMが応募者に与えた効果の測定等を行います。効果検証の結果が実施施策の改善や継続の判断や、組織編制に伴うKGI・KPIの設定などの材料になるため、データサイエンティストの影響範囲は多岐にわたります。

効果検証のイメージ図

効果検証では、サンプルをランダム化できたり、疑似的にランダムな状況を作り出せている場合は、因果推論の枠組みを用いて効果検証を行います。ですが、ビジネスの現場でサンプルがランダム化されていることは決して多くなく、ランダム化することも難しかったりします。そのような場合は、インパルス応答関数に代表されるようなマクロ計量の手法を用いて効果検証を行っています。

社内勉強会:組織全体のデータリテラシー向上

いくつか存在しますが、例えば非分析者にとっても有益なデータサイエンスの知識を共有する時間を業務時間内に設けたり、データサイエンティスト内でテキストを指定して勉強会を実施したりしています。データ分析では、分析依頼者(非分析者)と分析者のコミュニケーションが非常に重要です。基本的なデータサイエンスの知識やルールを非分析者側にも知ってもらうことで、円滑なコミュニケーションを期待できます。また、データを介して分析者と非分析者が議論をすることで、お互いにドメイン知識を深めることができます。さらに、データサイエンティストが各々のスキルを高め、分析手法の幅を広げることに繋がります。

学会発表・イベント登壇:知見の共有と成長

Japan.R 2024 に登壇したデータサイエンティストの呉東文さん

Japan.R 2024 に登壇したデータサイエンティストの呉東文さん(2021年 新卒入社)

自身の研究を学会で発表したり、データサイエンス系のイベントに登壇したりします。ディップのサービスに関連した研究である必要はなく、最終的に実務に活かすことができるのであればどのような分野でも構いません。例えば、国際政治の研究を通じて、実務に通じる分析手法を開発・発展させているデータサイエンティストがいます。また、普段の業務で用いているR言語のカンファレンスに参加・登壇することもあります。こうした活動は業務として認められており、休日出勤となる場合は振替休日が与えられます。

学生時代を振り返って気付いたこと

広くデータサイエンスと呼ばれる分野は積み重ねの学問なので、学生時代にステップを踏んで取り組めたのは幸いでした。また、事業会社では必ずしも因果推論を行う環境が整っているわけではありませんし、頻度論を使うとも限りません。そういう意味では、幅広い分野に触れていたのは入社後の学習コストを下げるという意味で有意義だったと思います。私が大学時代に学んできたテキストを『新卒データサイエンティストが学生時代のテキストを振り返る』でまとめました。これからデータサイエンティストを目指す人の参考になれば嬉しいです。

関連記事一覧

author

久保知生

データサイエンティスト 大阪大学大学院修了。学生時代は経済学と因果推論を学ぶ。2024年4月に入社して以来、未知の分野での実装に奮闘している。現在は売上予測モデルの開発やマーケティング・ミックス・モデリング(MMM)の実装、KPIまわりの効果検証を担当。