ビジネス・イノベーションを支える テクノロジ活用への挑戦
Gartner ビジネス・インテリジェンス&アナリティクスサミット2015
株式会社 リクルートテクノロジーズ ビッグデータインフラグループ
菊地原 拓
Copyright © Recruit Technologies Co.,Ltd.
Agenda
01 リクルート
02 テクノロジ活用
03 ビジネスとITの連携
Copyright © Recruit Technologies Co.,Ltd.
01 リクルート
①「起業家精神」を持った個人に、若いうちから大きな仕事の機会が与えられ、より速く成長する
②「圧倒的な当事者意識」を育むために、フラットなコミュニケーションとフィードバックが日々繰り返される
③「個の可能性に期待し合う場」から、より大きな成果が生まれる
4
①「クライアント・ユーザー双方へのチャネル」を活かし、双方の潜在ニーズを喚起する
②「ベストマッチングの追求」により、クライアント・ユーザー双方の最終満足度を高める
③「マーケットの不を解消」することで、社会に新しい機会を提供する
企業文化(カルチャー)
ビジネスモデル
リクルートのユニークネス
これらを支えるコミュニケーションの中心には“あなたはどうしたい?”という言葉がある
リクルートが築いたビジネスモデルは“リボンモデル”であり、変化し続ける
Copyright © Recruit Technologies Co.,Ltd.
事業構造
私たちは、誰かと誰かを結ぶ「場」を提供しています
Copyright © Recruit Technologies Co.,Ltd.
リクルートキャリア
リクルートジョブズ
リクルートスタッフィング
リクルート住まいカンパニー
リクルートライフスタイル
リクルートマーケティングパートナーズ
スタッフサービス・ホールディングス
リクルートアドミニストレーション
リクルートコミュニケーションズ
事業会社
機能会社 インフラ部門
大規模プロジェクト推進部門
UI設計/SEO部門
ビッグデータ機能部門
テクノロジーR&D部門
事業・社内IT推進部門
リクルート ホールディングス
リクルートとは、 主要7事業会社+3機能会社 で構成されるグループ企業群
私が所属する会社は リクルートテクノロジーズ
6
リクルートテクノロジーズとは
Copyright © Recruit Technologies Co.,Ltd.
リクルートテクノロジーズのビジョン・ミッション
リクルートグループ各社の現在・将来のニーズを見据えて 競合優位性の高いIT・ネットマーケティング基盤を 開拓、ビジネス実装することにより リクルートグループの競争優位を構築していく。
IT・ネットマーケティング領域において トップレベルの専門スキルを持った人材が育ち、集い、楽しんでいる。 業界を驚かせるレベルで、 テクノロジーの開拓と、そのビジネス実装が実現している。 リクルートグループのビジネス、業界のルールを、 恒常的なイノベーションによって変革している。
ミッション
ビジョン
Copyright © Recruit Technologies Co.,Ltd.
02 テクノロジ活用
Copyright © Recruit Technologies Co.,Ltd.
フェーズの考え方
Copyright © Recruit Technologies Co.,Ltd.
技術への取り組み
10
広範囲のビジネスに装着し、効果を最大化させるための改善を行い、事業貢献利益を追究
Rグループのビジネスに短・中期的に実活用の可能性がある技術をリサーチ
対象技術における事業化への検証を行い、評価・選定する
開拓(実活用研究)
実際に事業へ適用し、より広範囲に利用するための型化やスキームを構築
実装・展開 運用
実施内容
リクルートテクノロジーズ(短・中期的視野)
利益を目的としない中長期的な視点に立ち、新技術や新手法の研究/発明を行い、論文発表することを目指す
要素基礎技術の研究
社外(中・長期的視野)
技術数の 推移イメージ
年間約200の技術をリサーチし、約30の技術を評価・選定
年間数個~10個の 技術を展開
運用フェーズまで 移行された技術が蓄積
無数の新技術を研究/発明
Copyright © Recruit Technologies Co.,Ltd.
実装フェーズ技術の一例
11
機械学習を用いた画像認識を独自開発。
「ユーザーが興味をもつ画像が自動的に表示される」
ユーザーが興味を持った 画像に類似した 画像が自動的に 表示されるUX
Image データソース
特徴点 抽出
機械学習 類似画像検索
スパースコーディング 画像の局所特徴量を抽出し
ベクトル化
Support Vector Machine を用いた機械学習
→ Deep Leaning へ
HBaseを用い 画像のデータ化 基本処理 ・サイズ調整 ・ホワイトニング etc
Copyright © Recruit Technologies Co.,Ltd.
仕組みを改善
12
オープンソースに手を加えて表現方法をカスタマイズ。
「クリック状況をヒートマップで表し、UI変更の意思決定」
データ加工 データマート
作成 Webで表現
Amazon EC2
Amazon Redshift
Amazon EMR
初期バージョンはEMRを300並列で処理。 MemsqlとRedshiftに変更し、処理速度と利便性を向上。
ソースコードに手を加え 表現方法をカスタマイズ。
Copyright © Recruit Technologies Co.,Ltd.
管理者
Availability Zone (az-a)
Bucket
SnapShots
S3
LB
データ送受信
専用線
EC2
メタ/監査情報
Redshift NAT
(HA)
LDAP VPC peering
Web Access Remote Desktop SSH
Availability Zone (az-c)
EC2
cognos
cognos
メタ/監査情報
運用
利用者
Az-cへ
Batch
踏み台
ETL
LB
Az-aへ
フレームワークマネージャ
モデル生成
リプレースしたBI環境
Copyright © Recruit Technologies Co.,Ltd.
ビッグデータ基盤
Copyright © Recruit Technologies Co.,Ltd.
中央Hadoop ・データ整形・加工 ・データストレージ
各事業DB
DWH ・モデル作成 ・高速分析処理
BI ・モニタリング ・レポート
各事業Hadoop
分析用外部データ
SNS・クラウドデータ
データソース群 ビッグデータ基盤スタック 利用者層
高度分析やモデル作成
レポート/モニタリング
エンドユーザー (エグゼ/マネージャ/営業)
ビジネスインサイト
マーケター (プロデューサ/事業企画)
データサイエンティスト (高度分析者)
機械学習やモデル実装
データサイエンティスト (エンジニア)
分析ツール群
Hadoop エコシステム
ビッグデータ基盤構成概要
Copyright © Recruit Technologies Co.,Ltd.
ビッグデータ活用
Copyright © Recruit Technologies Co.,Ltd.
ビッグデータ活用 分析観点の分類
レポーティングBI
分析BI
リアルタイム処理
広宣効果予測 売上予測
レコメンド
可視化 予測
事業利益への
間接的な効果
事業利益への
直接的な効果
ビッグデータ活用は2つあり、”可視化” と ”予測”
“可視化” は過去と現在のデータを集計、分類、統計処理して可視化する。 “予測” は過去のデータを高度な数学で分析し、未来を予測する。 この2つから、事業利益へ直接的、間接的に効果を出すことができる。
Copyright © Recruit Technologies Co.,Ltd.
目的 リクルートの活用状況 新規ビジネス創出 新しい情報プラットフォームを作り上げる。
マーケティング ネットマーケティングにおける活用が活発。 詳細は次ページ以降。
業務効率化 統計学を用いた予測を行うことで、広告宣伝費の効率化、営業活動の効率化、売上予測による人員配置の最適化などを実施している。
ビッグデータ活用 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
コンバージョンに至るまで、おおまかに下記のようなマーケティング施策がある。
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
潜在層
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
ニーズが潜在的な対象者にマス・マーケティングを実施する
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
ニーズが顕在化している対象者に個別のアプローチをする
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
リクルートサイト外で施策を実施する部分
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
リクルートサイトで施策を実施する部分
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング ビッグデータ 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング
広宣費予測によりコスト効率化
ビッグデータ 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング
広告が「枠」から「ユーザID」へ変化してきている。 カスタマーに応じた広告の出し分けをする動きが始まっている。
サービスが特にコモディティ化している。
ビッグデータ 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング
自然検索結果の上位ランク化の取り組み。 検索ワードの集計でビッグデータ活用。
ビッグデータ 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
CV
TVCM
ラジオ広告
印刷媒体広告
タイアップ
プロモーション
PR
バナー
ブラパネ
ソーシャル拡散
Push、ジオフェンス
ニーズ顕在層 潜在層
サイト外の施策 サイト内の施策
レコメンド
サイト内検索
SEO
Display
SEM メールマーケ
マーケティング
ニーズ顕在層に対し、リクルートサービス内でアプローチする。 行動ログを多種多様に分析する領域。
ビッグデータ 目的による分類
Copyright © Recruit Technologies Co.,Ltd.
PUSH通知基盤との連携
Copyright © Recruit Technologies Co.,Ltd.
PUSH通知へとは
30
Push!
Push!
APNs Apple Push Notification Service
ユーザがアプリを起動していなくても 待ち受け画面に通知を送ることが出来る
GCM Google Cloud Messaging
Copyright © Recruit Technologies Co.,Ltd.
PUSH通知基盤の全体構成
31
DynamoDB
elasticsearch
クラスタ
デバイス登録
リクエスト
APNs/GCM サーバ
登録API
データ登録
配信worker
SQS
SQS 登録worker
システム管理・操作用 Web UI
管理API
データ参照
事業サーバ 配信担当者
Copyright © Recruit Technologies Co.,Ltd.
SQSによるメリット〜システム拡張性
32
デバイス登録キュー
ELB
DynamoDB
elasticsearch
デバイス登録
ビックデータ基盤
BD基盤用
デバイス登録キュー
後で実施したビックデータ基盤との連携もシステム改修無しで実現
登録API
登録Worker
Copyright © Recruit Technologies Co.,Ltd.
Pushとビッグデータ連携
33
Copyright © Recruit Technologies Co.,Ltd.
次世代検索基盤との連携
Copyright © Recruit Technologies Co.,Ltd.
次世代検索基盤とは
35
• Query Analyze Search System リクルート内のサイトに対して • 検索品質 • フィードバック • 検索機能追加 • メトリクス など提供する次世代検索基盤
Copyright © Recruit Technologies Co.,Ltd.
Suggest+Beacon サーバ
各サイト
システム構成
36
APサーバ
Batchサーバ
QassPlugin Qass Analizer
コンテンツ インデックス
シノニム
機械学習辞書
マッピング
HDFS
収集データ
集計結果
シノニム
機械学習辞書
マッピング
Map/Reduce サジェスト
データ
クエリーログ
ビーコンログ
コンテンツ データ
運用管理 Batchサーバ
Qass Analizer
サジェスト インデックス
Copyright © Recruit Technologies Co.,Ltd.
Hadoopによる機械学習の活用
37
機械学習辞書
ビーコンデータ ・入力中のキーイベントを収集
「牛角」の読みが「ぎゅうかく」であることを学習!
牛角
翌日「ぎゅうかく」で検索してみると・・・
※入力途中で「牛角」を入力候補に表示!
検索
※「牛角」に漢字変換してから検索
特殊な読み仮名は通常手動で辞書登録しないと仮名検索ができない 例)「ぎゅうかく」と入力
検索ログ
Copyright © Recruit Technologies Co.,Ltd.
03 ビジネスとITの連携
Copyright © Recruit Technologies Co.,Ltd.
仕組み改善 イノベーション
Copyright © Recruit Technologies Co.,Ltd.
片方だけでは走れなくなる
実際、手痛い思いをした
Copyright © Recruit Technologies Co.,Ltd.
どうすれば、ITを活用した仕組み改善や イノベーションを生み出せるか
私達も模索し続けていますが、今の動きかたを紹介します
Copyright © Recruit Technologies Co.,Ltd.
テクノロジーリサーチ
・Computer Science ・Data Science ・常に情報収集 ・お試し、所感 ・実験
Copyright © Recruit Technologies Co.,Ltd.
ユースケースリサーチ
・事業戦略、課題 ・客観的な分析
Copyright © Recruit Technologies Co.,Ltd.
アイデア
リサーチしているから発想が生まれる。 2年後のITは?ビジネス状況は? 少し未来を想像することも。
Copyright © Recruit Technologies Co.,Ltd.
プロトタイプ・MVP を作成する 仮説をフィジビリで実証
磨き、育てていく
Copyright © Recruit Technologies Co.,Ltd.
現在、未来にビジネスで必要となるのは何か。
システム部門も事業部門と考えることが必要。
お互いの強みを活かしてITを上手に使う。
46
戦略・目標
施策
技術
Copyright © Recruit Technologies Co.,Ltd.
ご清聴 ありがとうございました