【登壇レポート】ディップのデータサイエンティストがJapan.R 2024で語る – R言語の本番実装と売上予測モデルの実践知
2024年12月7日(土)、LINEヤフー株式会社 紀尾井町オフィスにて開催されたJapan.R 2024。R言語のコミュニティが一堂に会する国内最大級のカンファレンスに、ディップからデータサイエンティスト2名が登壇しました。R言語の本番環境での実装ノウハウと、事業貢献を重視した予測モデルの知見を発表。今回は、登壇した2名のデータサイエンティストに、発表内容とカンファレンスでの学びについて話を聞きました
本番環境へのR言語モデルのデプロイから学んだ教訓
田中:呉さんの発表内容を教えてください。
呉:R言語はその優れた統計解析と機械学習機能により、多くのデータサイエンティストにとって欠かせないツールです。しかし、ビジネスの本番環境での活用に関しては、一般的にパフォーマンスの低さや、シングルスレッド性、そして実装の難しさが指摘されています。先日、Japan.R 2024で発表した私のセッションでは、これらの問題が必ずしもR言語そのものの限界ではなく、責任分解点を明確にすることで解決できる可能性があることを強調しました。 私が発表で特に伝えたかったのは、R言語の「本番環境への実装が難しい」とされる理由には、よく言われる属人化やパフォーマンスの問題だけでなく、もっと本質的な課題があるということです。その一つが、R言語のシングルスレッド性であり、これが大規模なビジネス環境での運用を難しくしています。データサイエンティストとエンジニアが協力し合い、R言語の持つ特性を最大限に活用しながら、例えばGo言語などと組み合わせることで、本番環境への適用が可能であるということです。
田中:なるほど、エンジニアとチームを組んでプロジェクトを推進してきた、呉さんならではの視点ですね。一方でカンファレンスの中で印象的だった話はありますか?
呉:R言語の本番環境への実装に関して、さまざまな意見交換が行われた点は印象的でした。その中でも、R言語界隈で著名なハドリー氏が目指す「少人数のシニアマネジメント向けダッシュボード作成」に対し、私が目指すのは「大人数が利用可能なAPIの構築」といった方向性の違いです。このような多様なアプローチこそが、プログラミング言語やコミュニティの発展を促進する原動力だと感じました。私自身、この経験を通じて、ディップでの学びとサポートがあったからこそ、深い内容で発表を行い、多くの洞察を得ることができたと実感しています。これからも引き続き、データサイエンスとエンジニアリングの協力を通じて、R言語をはじめとするツールをより実践的に活用し、より多くの成果を上げていきたいと思います。
田中:ありがとうございます。
呉さんの詳しい発表内容:「R言語は本当に実装向きではないのか?— 固定観念を問い直す」
売上・受注予測をするときに精度よりも大事なこと
田中:久保さんの発表内容を教えてください。
久保:事業会社では財務会計やリソース配分の最適化のために、売上や受注額の予測が行なわれています。予測精度の向上は重要ですが、予測精度の向上それ自体は売上の増加に直接貢献しません。現場では、売上や受注の増加に結びつく具体的な示唆が求められます。 例えば状態空間モデルでは、目に見えない売上・受注額の平均的な水準にトレンド成分や季節成分を加味することで予測を行いますが、モデルに現場のKPIも組み込むことができます。これにより「このKPIを来月これくらいに設定すれば売上・受注額がこれくらい伸びそう」といったシミュレーションが可能になります。 もちろん、KPIを伸ばすだけで売上・受注額が必ず達成されるわけではなく、市場のトレンドや季節成分も影響します。また、モデルが識別の仮定を満たしていることを確認する必要があります。 これらの点には注意が必要ですが、最低限の予測精度を担保し、予測値を達成するために現場のKPIがどうあるべきかを明確にするところまで落とし込むことが大事だという点を発表しました。
田中:まだ入社1年目の新卒ながら、そこまで深く取り組めるんですね。一方でカンファレンスの中で印象的だった話はありますか?
久保:全体的にR言語の環境開発まわりの話が多く、馴染みの薄い私にとっては非常に刺激的でした。様々なプロジェクトで経験を積むうちに、私も開発環境にも触れていくことになるんだろうなと、将来を考えるきっかけになりました。また、スポンサートークとしてLINEヤフーの方が当社のデータサイエンス組織について紹介されていたのも印象的です。分析チーム、分析環境を整備するチームに加え、研究開発チームまで十分な数のメンバーが揃っているように思いました。私たちのチームはまだまだ小さいですが、分析者を組織内にどのように配置すれば実装が効率よく行われるかという点は引き続き考えていかないといけないと感じました。
田中:ありがとうございます。
久保さんの詳しい発表内容:「売上・受注予測をするときに精度よりも大事なこと」
チームで事業に貢献するデータサイエンス部門
大規模なビジネス環境でも、営業やエンジニア部門と密に連携しながら、事業価値の創出に挑戦し続ける呉さん。そして、具体的な売上・受注の増加につながる示唆を導き出すモデル構築に情熱を注ぐ久保さん。二人の発表からは、部門や役職の枠を超えて、チームで協働しながら事業の成長を追求するデータサイエンティストの真髄が感じられました。私たちは、このような環境で一緒に課題解決に取り組むデータサイエンティストを募集しています。数字の向こうにあるビジネスの可能性を見出し、共に新しい価値を創造していく仲間として、皆さまのご応募をお待ちしております!