20
KADOKAWAグループにおける データの活用事例の紹介と 求めるデータサイエンティスト像について KADOKAWA Connected 塚本 圭一郎 0

求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

KADOKAWAグループにおけるデータの活用事例の紹介と

求めるデータサイエンティスト像について

㈱KADOKAWA Connected 塚本 圭一郎

0

Page 2: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

1

自己紹介

塚本圭一郎

• 略歴– 2014-03 大阪大学大学院 情報科学研究科 博士後期課程修了

– 2014-04 ㈱ ドワンゴ 入社

– 2019-04 ㈱ KADOKAWA Connected 兼務出向

– 2020-04 ㈱ KADOKAWA 兼務出向

• 所属– ㈱ ドワンゴ ICTサービス本部 Dwango DataManagement Service部 部長

– ㈱ KADOKAWA Connected Integrated Data Service部 部長

– ㈱ KADOKAWA DX戦略アーキテクト局 Integrated Data Service部 部長

• 職務内容– KADOKAWAグループにおける部署横断的なデータ活用促進をデータマネジメントからリード

Page 3: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

2

目次

● 会社紹介

● 弊社事例の紹介

● 企業の求めるデータサイエンティストとは

● まとめ

Page 4: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

会社紹介

3

Page 5: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

4

KADOKAWA Connected (KDX) とは

日本の文化をベースに働く人々の「生涯生産性」を最高に高めるためのソリューションを提供する企業

事業概要

• KADOKAWAグループへのICTサービス提供– niconico事業へのICT基盤提供– KADOKAWA系IPのWebサイト基盤提供

• 働き方改革の実現支援– Office向けICTインフラサービス提供– 導入後も含めたコンサルティングサービス

Page 6: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

KADOKAWA

KADOKAWA

5

KADOKAWAグループとは

KADOKAWA

KDX

ドワンゴ

ブックウォーカー

… KDXはKADOKAWAの子会社でドワンゴの兄弟会社にあたります

ニコニコテレビちゃん ©DWANGO Co., Ltd.

Page 7: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

事例紹介

6

Page 8: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

7

niconico事業のビッグデータ分析基盤の提供

リアルタイムログ収集基盤

アクセス解析ツール群

Google Analytics 360, Data Portal, etc.

DWH・BI

Spark, Digdag, Jenkins, Tableau, etc.

リアルタイム集計基盤

Norikra, InfluxDB, Grafana, etc.

ビッグデータ分析基盤

Hadoop, Spark, Impala, Hive, Pig, etc.

Fluentd, Kafka, Kinesis Stream, etc.

分析者数

● アクセス解析ツール群: 410+● ビッグデータ分析基盤: 260+

ビッグデータ分析基盤のデータ

● サイズ: 約1.4PiB● テーブル数: 2,800+

ID発行数 月間UB ログインMAU プレミアム会員 チャンネル入会

約8,017万 約5,747万 約646万 約161万 約123万

2020年6月末時点

Page 9: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

8

管理会計ツールの開発と保守

事業単位よりも詳細なサービス単位の損益計算書などを作成するツールを提供、より細やかな意思決定を支援

niconico事業 ニコニコ動画 ニコニコ生放送

売上 1,000,000,000

人件費 300,000,000

インフラ費 400,000,000

… ...

合計 200,000,000

売上 400,000,000

人件費 100,000,000

インフラ費 100,000,000

… ...

合計 60,000,000

売上 400,000,000

人件費 80,000,000

インフラ費 150,000,000

… ...

合計 40,000,000

詳細化

数値は勿論、仮値です

Page 10: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

9

チャンネルオーナー向けダッシュボードの提供

チャンネル事業のコンサルチームがチャンネルオーナーにデータに基づく提案が可能になるダッシュボードを開発

Page 11: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

10

純減チャンネル予測モデルの構築 (PoC段階)

将来不調になるチャンネルを予測し、コンサルチームが優先的に対応しなければならないオーナーを明らかにする

会員行動データ

ch属性マスタ

機械学習

入力 出力3ヶ月後

入会数 < 退会数になるchはあるか?

Page 12: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

11

GPUクラスタ基盤の提供 (予定)

ドワンゴのMLエンジニアリングチームに紅莉栖に代わる強力なGPUクラスタ基盤を提供する

(出典)https://pc.watch.impress.co.jp/docs/news/721741.html

現行DL専用GPUサーバー紅莉栖を新世代のGPUクラスタ基盤に更改

MLエンジニアリングチームは、レコメンドシステムから将棋AIや麻雀AIまで幅広い機械学習プロジェクトを推進するチームです

詳細は、https://dmv.nico/ja/

(出典)https://twitter.com/NAGA025/ (麻雀AIのナーガ)

Page 13: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

企業が求めるデータサイエンティストとは

12

Page 14: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

企業はデータサイエンティストを求めている

KPI管理や効果測定 (記述的) が企業で当たり前になり、今後は診断的・予測的アナリティクスのニーズが高まる

13

原因の分析と将来の予測がこれからは必要

● 診断的: 多変量分析、RCT、集積分析など

● 予測的: 回帰分析、機械学習など

実際に事業で機械学習を用いる試みが当たり前の時代になりつつある

(参考) https://www.sbbit.jp/article/cont1/36820

Page 15: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

14

データサイエンスはコモディティ化した

データサイエンス単体の希少価値が失われつつある

• 大学やオンライン学習でのデータサイエンス教育の一般化

• 様々な研究分野で機械学習が利用される状況

• Auto MLの台頭

– DataRobot, AutoML Tables, …(参考) https://www.itmedia.co.jp/enterprise/articles/2007/30/news033.html

(出典)

Page 16: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

15

データサイエンス✕◯◯◯が必要になっている

✕ エンジニアリング● MLOps● データエンジニアリング

○ Volume: ビッグデータ

○ Velocity: ストリーミングデータ

○ Variety: 非構造化データ

✕ R&D● アルゴリズム開発

● 未踏領域への適用○ 新しいXXXTech

✕ ビジネス● アナリティクストランスレーター

● 説明可能なAI○ Explainable AI

ただし、データソースの壁がある企業側しかこれらを学ぶために潤沢なデータや実例を持っていない⇒ 産学連携? or データ流通促進?

Page 17: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

まとめ

16

Page 18: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

17

まとめ

• 企業活動においてデータ活用は当たり前のものになり、予測

的アナリティクスの需要も高まっている

• 需要に対して、データサイエンティストを大量に育成した結

果、データサイエンスの希少価値が減少している

• これからは、データサイエンスに加えて異分野の専門性をも

つπ型人材になることが求められている

Page 19: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

18

We’re Hiring!

エンジニアリングで、日本の文化を支える人たちが、楽しい、働きやすい環境を。

KADOKAWA Connected 採用 検索

Page 20: 求めるデータサイエンティスト像について データの活用事例の紹 … · 1 自己紹介 塚本圭一郎 • 略歴 – 2014-03 大阪大学大学院 情報科学研究科

ご清聴ありがとうございました

19