データサイエンスで意思決定を加速させる。それが私の【passion】。
計量経済学と計量政治学の社会実装を夢見るディップのデータサイエンティスト、呉 東文さん。入ったばかりのデータサイエンス部署は、彼のバックグラウンドを十分に活かせるような環境ではなかったといいます。周囲のメンバーを巻き込み、データサイエンスの有効性を会社全体に伝える様子に迫ります。
営業職を助ける応募予測モデルの開発
久保:はじめに自己紹介をお願いします。
呉:ディップでデータサイエンティストをやっている呉東文と申します。計量経済学・計量政治学の社会実装が夢です。
久保:計量経済学・計量政治学をどのように業務で用いているのですか?
呉:現在は、バイトルに掲載している求人への応募数を予測するモデルの開発を行っています。営業社員が利用できる応募予測のツールは、すでに社内にありました。ですが、生のデータを見せることへのこだわりが強く、決して使いやすいものとは言えませんでした。営業職の立場に立てば、自分が受注した企業と似た特徴・課題意識を持つ企業を訪問すれば、受注できる確率が上がるわけですよね。過去に担当した企業と似ている企業なら、有効な募集方法を提案できるわけですから。
久保:そうですね。
呉:ですが、営業社員が似たような特徴を持つ会社を選ぶのは簡単ではありません。そもそも従来のツールでは、データをその都度引っ張ってくるので、ビッグクエリにも負担がかかり、ツールの動きが遅くなって操作性もよくなかったんです。そこで、企業の情報を集約したモデルを作ることにしました。新たに作ったツールでは、営業社員が市区町村や職種といった変数を指定すれば、該当企業の平均的な応募数の想定が返ってきます。
久保:モデルをつくる上で意識していることはありますか?
呉:営業社員に実際に使ってもらって、彼ら・彼女らの所感をツールに反映させることです。現場の声を取り入れたツールを使えば、これまで以上に企業様のニーズにあった提案ができるようになり、ビジネスパートナーとして選んでもらえる可能性が高くなることも期待できます。
できたばかりのデータサイエンス部署にやりがいを感じた
久保:社会科学をバックグラウンドにしたデータサイエンスをビジネスに実装して、クライアントの信頼を高めようとされているのですね。呉さんはディップ社内で初の社会科学寄りのデータサイエンティストですが、大変なこともあったのではないですか?
呉:はい、以前は、会社の方針が社会科学的なデータサイエンスの考え方とあまり親和的ではなかったんです。営業の売り上げを上げることよりも営業のコスト削減に注力していました。つまり、データサイエンスというよりはエンジニアリングに近い発想です。簡単に言えば自動化や工数削減を志向するものです。例えば、もらった名刺を自動で登録するにはどうすればよいか、といったような。
久保:社会科学のデータサイエンスが目指すところとは違った方向性ですね。
呉:社会科学寄りのデータサイエンスが目指すところは、モデルの構築や効果の検証なんですね。例えば、営業社員がどんな行動・発言をすれば受注につながりやすいのか。この施策の効果は本当にあるのだろうか、といったところです。
データサイエンスを活用すれば、営業コストの削減だけでなく、営業の売り上げを増やすことにつながります。
久保:なるほど。社会科学的なデータサイエンスの活用の理解を得るために、どんなことに取り組んだのか教えてください。
呉:解決すべき課題が現場に本当にあるということを示すのが、まずは大事だと考えました。そこで自分から営業現場に行って、営業職の方がどんなことに困っているのか、耳を傾けることに取り組んだんです。そのうえで、営業社員が抱えているリアルな課題をデータサイエンスで解決し、社会科学のデータサイエンスがビジネスに貢献できることを周りのメンバーに伝え続けました。地道に実績を出していけば、データサイエンスの考え方が社内に広がっていくだろうと思ったんです。
久保:データサイエンティストも足を動かすことが大事なのですね。
呉:そうです。他の部署を巻き込んで進めることが大事です。そういう意味では、データサイエンティストも営業と一緒ですね。
入社の決め手は「圧倒的な社内データ量」
久保:データサイエンティストに営業力が必要というのは意外ですが、学生の頃からそのようなデータサイエンティスト像をイメージしていたのですか?
呉:いや、正直イメージできていなかったですね。仕事を通じて身に付けていった感じです。ただ、大学院では国際政治学と計量政治学を専攻していたので、データサイエンスは私にとって身近なものでした。実際、分析手法として計量政治学を用いていましたし、テキストデータ分析やIRTといった高次元モデルに興味がありました。
久保:データサイエンティストを募集する会社は他にもあると思いますが、なぜディップに決めたのですか。
呉:データサイエンティストの職種で何社か受けていましたが、営業活動データと求人データといったように、toBとtoCの両方のデータを持っているのはディップだけだったからです。社内にデータがたくさんあるというのは魅力でしたね。
久保:なるほど、当時はデータサイエンティストの部署が誕生してまだ2年目だったと思うんですけど不安はなかったんですか?
呉:なかったですね。できたばかりの部署なので、逆にいろいろなことができそうだなと思いました。加えて、自分が持っていたスキルセットも十分に生かせそうだなとも思いました。
未来のチームメンバーに向けたメッセージ
久保:呉さんとこれから一緒に働けるのが楽しみです。呉さんはどんなメンバーと働きたいですか?
呉:専門知識と営業力を兼ね備えた人ですかね。
久保:具体的にはどういうことでしょうか。
呉:営業力に関していえば、先ほどお話ししたとおり、データサイエンスが目指す方向性を上司や他の部署に理解してもらうのが重要であり、必要でもあります。実務では営業社員の話を聞きながらモデルを開発しますから、他者を巻き込んで説得する力が欠かせません。
久保:専門知識についてはどの程度必要ですか。
呉:簡単なものでもよいのですが、パッケージが用意されていない分析手法ってありますよね。そういう手法の論文を読んで、実装できるような力です。例えば、LDA(Latent Dirichlet Allocation)ってありますよね。あれはStanの仕様上の問題のために、実装することができません。そうしたケースでも、自力で分析手法を実装する力が大事だと思います。
久保:最後に、データサイエンティストを志望する学生にメッセージをお願いします。
呉:ディップのData Brain課ができていない分析は、まだまだたくさんあります。ご自身の持つデータサイエンス関連のスキルをビジネスに活かして、圧倒的成長を遂げたい方はぜひご応募ください!
久保:呉さん、ありがとうございました。