22
明明明明明明明 AI 明明明明明明明明明明明明明明 10 明 python 明明明明 AI 明明 澪澪澪澪澪澪澪澪澪澪澪澪澪

みんなのPython勉強会#21 澪標アナリティクス 井原様

Embed Size (px)

Citation preview

Page 1: みんなのPython勉強会#21 澪標アナリティクス 井原様

明日から使える AI システム開発シナリオ事例特選 10

      〜 python を使った AI 開発

澪標アナリティクス株式会社

Page 2: みんなのPython勉強会#21 澪標アナリティクス 井原様

©Miotsukushi Analytics Inc. 2016, All rights reserved. 2

この業界での豊富な経験と実績に基づいたコンサルティングをご提供する事をお約束いたします

会社概要

Page 3: みんなのPython勉強会#21 澪標アナリティクス 井原様

会社概要

会  社  名:澪標アナリティクス株式会社

代表取締役:井原 渉

顧     問:川村 秀憲(北海道大学教授)  栗原 聡(電気通信大学教授)

所  在  地:東京都中央区日本橋茅場町1丁目10-8         グリンヒルビル6階

事 業 内 容:データ分析に関する各種事業            アドバイザリーサービス 教育研修 分析組織・ IT基盤構築 分析官派遣 受託分析

U  R  L :http://www.mioana.com/©Miotsukushi Analytics Inc. 2016, All rights reserved. 3

Page 4: みんなのPython勉強会#21 澪標アナリティクス 井原様

会社名の由来

澪標(みおつくし)とは船の安全のため、河口などで浅くて船の航行が不可能な場所を示すために、船の航路の指す澪(みお)と境界に並べて設置され、航路を示す標示の事です。 

また、小倉百人一首 20 番にわびぬれば 今はたおなじ 難波なる みをつくしても 逢はむとぞ思ふと詠われており、「身を尽くす」を指す掛詞としても使われておりました。 

お客様にとってビジネスの航路を示す標示となりたい皆様のために身を尽くして働きたいとの思いから命名いたしました。

©Miotsukushi Analytics Inc. 2016, All rights reserved. 4

Page 5: みんなのPython勉強会#21 澪標アナリティクス 井原様

代表者の紹介

代表取締役社長

井原 渉(シニアコンサルタント)

大学在学中に外資系コンサルティング会社の日本法人を設立。

老舗中堅ゲーム会社にて分析部門の立上げにリーダーとして参画し、データマイニング、分析体制構築、新規事業立ち上げを担当すると同時に、大学の研究センターにおいてもアクセスログに関するデータマイニングの応用論を研究。

その後、東証1部上場企業にてシニアコンサルタントとして国内大手通信事業会社におけるゲームやその他デジタルサービスのデータ分析・KPI設定・分析基盤構築に従事。

澪標アナリティクス株式会社を設立した後も、大手自動車メーカーをはじめ幅広い業種にて分析コンサルティングや分析基盤構築、分析組織構築、レコメンドシステム、AI開発を行う。

また、国立九州工業大学非常勤講師としてデータマイニング応用論と流体シミュレーションを研究している。

※講演実績:九州工業大学、関西大学、AWSソリューションDAYS、 オンラインゲームカンファレンス、吹田市公益活動センター等多数

©Miotsukushi Analytics Inc. 2016, All rights reserved. 5

監修書籍・記事掲載雑誌等

Page 6: みんなのPython勉強会#21 澪標アナリティクス 井原様

6

データ分析のレベル

©Miotsukushi Analytics Inc. 2015, All rights reserved.

レベル

目的 手段 分析内容 必要人材 ツール

LV1サービスの目標・状況を数値に置き換えて説明

KPIレポーティング

登録者数、利用率、継続率、課金率、 ARPU 、属性別等の情報を取得

KPI を理解し、活用できる人材

KPI 取得システム

LV2

ユーザやサービスの現状に合った施策を実施

詳細 KPI追加 アイテム・イベントの状況、LTV顧客セグメント別等の情報を取得

サービスにあったKPI 設計ができる人材

DBBIツール

LV3ユーザ単位で最適化 多変量解析 ユーザ単位で効果検証や

パラメーターの設定等アナリスト データウェア

ハウスマイニングツール

LV4ユーザやサービスを予測仮説が作れない状況での分析

データマイニング

優良顧客見込の発掘、売上予測など仮説を持たずに分析を行う

データサイエンティスト

 「データ分析」は取組む難易度により、大きく4つのレベルに分類することができる。

Page 7: みんなのPython勉強会#21 澪標アナリティクス 井原様

7

レベル

手段 1段階 2段階 3段階

LV1KPIレポーティング 毎日1回 KPI を更新 複数回、 KPI を更新 リアルタイムに集計

LV2詳細 KPI追加 全体向けに決まった

集計軸で状況を把握職種ごとに決まった集計軸で状況を把握

自由に集計軸を変更可能

LV3多変量解析 ログインや課金などの

主な情報だけで分析を実施

ログやユーザ DB 、タップや角度などの情報も活用

自動で結果を出力可能サービスにロジックを組み込む

LV4

データマイニング 決定木、回帰などツールで容易に実施手法で分析を実施

ベイズや Deep Learningなどで分析を実施

自動で結果を出力可能サービスにロジックを組み込む

分析レベル別の深化(1/2)

©Miotsukushi Analytics Inc. 2015, All rights reserved.

 同じデータ分析レベルでも取組みの深さ(活用方法)が異なる。

Page 8: みんなのPython勉強会#21 澪標アナリティクス 井原様

【別紙】データ分析の業務ロードマップ

©Miotsukushi Analytics Inc. 2016, All rights reserved. 8

ビジネスアナリスト ◎ ○ ◎

データアナリスト ○ ◎ ○ ○ ◎ ◎ ○

データマネージャ ○ ◎ ◎ ○ ○

ビジネスアナリスト ○

データアナリスト ○ ○ ◎ ○

データマネージャ ◎ ○ ○ ◎BI アプリスペシャリスト ○ ◎ ○ ○

トライアル分析 ビジネス仮説導出 分析設計

分析実施/レポート作成 ビジネス仮説の検証

(施策立案)データ

クレンジング

データマート

構築基礎集計 モデル構築

定型的な分析分析作業の定型化

分析実施/定型帳票作成

設計・構築 BIツール検討

データ集計の手順化

データ活用基盤構築・運用維持

ビジネスアナリスト ○データアナリスト ○データマネージャ ○BI アプリスペシャリスト ○インフラマネージャ ◎ ◎

基盤設計・運用

設計

構築・運用維持

Page 9: みんなのPython勉強会#21 澪標アナリティクス 井原様

【別紙】澪標が提供するスペシャリスト一覧

©Miotsukushi Analytics Inc. 2016, All rights reserved. 9

ポジション 役割 スキル

ビジネスアナリスト

• ビジネス上の課題を引出し、分析シナリオへと落とし込む

• アナリストの分析結果に基づき、ビジネス仮説を構築、

  施策の方向性を示唆

• 分析用データの理解、 Biz課題の解決プロセス構築力

• 分析結果の Biz的な意味づけ、仮説構築力• 各分析手法のインプットとアウトプット、一般的

な分析の  プロセスに関する知識• BIツール等を使った基本的な加工集計技術

データアナリスト

• ビジネスアナリストから提示された各分析テーマに対する

  分析データ、分析プロセスを設計• データマネージャより提供される分析データを用

いて、分析を実施

• 分析テーマ設定、分析プロセス設計の知識• 分析ツールを利用した分析、分析モデリングの知識

• 分析用 DM の基本的知識

データマネージャ

• データアナリストから提示された分析データを抽出

• ソース・データ(分析用 DM等)から分析用データを

  集計・加工するプロセスを設計・実装• 分析結果を実装

• 分析 DM等のシステム構築スキル、データモデリングの知識

• 分析に関する基本的知識• SPSS や R などの知識

インフラマネージャ• ソースデータ、分析用データ等の AP 基盤、及び

システム  基盤を構築、運用

• データストア技術 (RDB ・ Hadoop ・ NoSQL ・インメモリ DB) に関する知識・取り扱いスキル

• システム運用設計、運用試験に関する知識 / 経験• 性能 / 信頼性 /NW/ 開発方式 / 実装方式など、広範な技術分野に対する知識 / 経験

BI アプリスペシャリスト

• BIツールを使った各種レポートの設計・実装

• BIツールを利用したレポート設計、 BIツールの実装スキル

• BIツールに関する広範な知識 (製品仕様、アーキテクチャ)• 分析用 DM の基本的知識、データモデリングの知識

Page 10: みんなのPython勉強会#21 澪標アナリティクス 井原様

主な取引先(敬称略、順不同)

©Miotsukushi Analytics Inc. 2016, All rights reserved. 10

株式会社リクルート

コミュニケーションズ

大手自動車メーカー

大手運送会社 大手監査法人

パナソニック株式会社

大手金融機関

大手インターネット

マーケティング会社

大手広告会社 大手不動産会社

地方公共団体

Page 11: みんなのPython勉強会#21 澪標アナリティクス 井原様

AIカタログ校正「 KOUSEI-KUN 」

TEXTDATA

IMAGEDATA

PRICEDATA

多品番を扱うメーカー、サービス契約が多数かつ複雑な通信、保険会社など

30%

90%

90%

50%

導入推奨企業

これまで、人間に依存してきた膨大な量のカタログ校正作業に関して AI及びディープラーニング機能を実装することにより、大幅な時間短縮、コスト削減を実現。印刷ミスによる廃棄率が大幅に削減し、環境に配慮した企業活動を支援。

独自 AIエンジン

※使用するデータは過去原稿、禁止表現・画像、ガイドライン、商品 DB等になります。

Page 12: みんなのPython勉強会#21 澪標アナリティクス 井原様

AI 最適化レコメンド

各種ポータルサイト、 ECサイトの運営事業者様、人材派遣 /不動産会社など導入推奨企業

ユーザー情報

登録情報

閲覧履歴

クリック履歴

購入履歴

商品データベース

性別は?購入履歴は?

ユーザ毎に最適な情報を上位表示

レコメンド

従来のレコメンドエンジンは、在庫数が豊富な商品を前提にしているため、売り切れを想定せずに、新着商品 / 人気商品を表示することが多っく、人気商品と不人気商品の2極化が起きやすい状況であった。「 AI最適化レコメンド」は、「不動産物件」や「人材採用」のような在庫が少量の商品を対象に、人気商品に偏った表示をせずに、「ユーザー側と販売側の満足度が最大化」するように最適化されており、売切れによる機会損失の軽減と、ロングテール商品の売上増加が実現できます。

独自 AIエンジン

Page 13: みんなのPython勉強会#21 澪標アナリティクス 井原様

AI 監査システム 「 KANSA-RO 」

監査法人様、多店舗展開されている企業導入推奨企業

過去の監査データ

店舗 POS データ

過去の監査データや POS データ、店舗の POS データを独自のパターン認識に掛けて、不正をしている確率を参考値として表示。架空売上、経費の水増し、債務隠し、グループ取引などにおける異常な傾向を検出し、監査業務の効率化を実現

独自 AIエンジン従業員の勤続年数、学歴、年齢など

A会社 架空売上の可能性: 60%経費の水増しの可能性: 80%

B会社 債務隠し: 30%

C会社渋谷店 架空売上の可能性: 90%

Page 14: みんなのPython勉強会#21 澪標アナリティクス 井原様

AI コミュニケーションチャット 「 AI Chat 」

各種ポータルサイト運営事業者導入推奨企業

各ウェブページの情報 サイト全体の構造過去の問合せ履歴過去のページ遷移情報等

ページ B情報

ページ C情報

ページ D情報

ページ A情報

ウェブページ情報

コンシェルジュエリアにて、ユーザーの質問に自動応答

言語認識により、フリーテキスト質問に対する回答を可能とするシステムを構築。当該システムを導入したコンシェルジュエリアをウェブページに用意し、ナビゲーション及びフリーテキストによる適切な自動回答を実施し、ユーザーが的確な情報に到達できる誘導を実現。

独自 AI自動応答システム

Page 15: みんなのPython勉強会#21 澪標アナリティクス 井原様

(派生形) AI コンシェルジュダッシュボード

コールセンター運営事業者もしくはコールセンターを有する事業者導入推奨企業

使用実績

契約情報

各種ユーザー情報

<お問合せのキーワード>1・・・・・2・・・・・3・・・・・<該当するマニュアルページ>1○○ページ2○○ページ3○○ページ

独自 AI予測システム

ユーザーの個人情報等を基に、ユーザーの問合せ内容を予測するシステムを実装。自動で当該質問のキーワード及び当該問合せに対応するマニュアルページ等を表示することで、コールセンター担当者の対応工数を軽減するとともに、迅速な問合せ対応を実現。

カスタマー オペレーター

個人情報等を基に問合せ内容を事前予測。対応に必要な情報とともに表示。

Page 16: みんなのPython勉強会#21 澪標アナリティクス 井原様

マニュアルが膨大にある、違反すると大きな問題になる会社導入推奨企業

業務マニュアルが膨大かつ更新頻度が高く、どこに何が載っているのか、どこに格納されているのかを調べることを AI によって支援することにより、検索時間の大幅削減とマニュアル違反削減を実現。

質問入力画面

ユーザが回答確認&フィードバック

入力役立つ・不満等

回答表示

マニュアル検索支援 AI

このルール

どこだっけ?

全マニュアル文章

過去のトラブル事例

その他データ

AI マニュアル検索支援

稼働ログを学習

※お探しの情報はこちらですか?リンク 1  ○○規定 .htmlリンク 2   ××ガイドライン .htmlリンク 3  △△レギュレーション .html

*回答表示については  要件定義にて検討・決定

質問文を入力

Page 17: みんなのPython勉強会#21 澪標アナリティクス 井原様

FAQに載っている内容でのお問い合わせの多い会社、 ECサイト、ゲーム会社導入推奨企業

FAQ に回答が載っているにもかかわらず、読まないでお問い合わせをしてくるお客様に対し、お問い合わせ内容のテキストを入力するとその質問に関連する FAQ を表示するシステムを実装。お問い合わせの件数削減を実現。

FAQ閲覧支援システム

お問い合わせ内容入力

17

おすすめ FAQ確認後

メール送信判断

お問い合わせ内容確認

確認画面にて、おすすめ FAQ を表示

※こちらの FAQもご覧ください

リンク 1リンク 2リンク 3

FAQレコメンド AI

全 FAQ の文章データベース

過去のお問い合わせ対応ログ

稼働ログを学習

トラブル

発生!

Page 18: みんなのPython勉強会#21 澪標アナリティクス 井原様

会員カードや BtoBのようなデータをお持ちの会社、 ECサイト、ゲーム会社導入推奨企業

これまで、人間の勘と経験に依存してきた分析作業を AI や統計解析によって、自動化する機能を実装することにより、データ分析の定型化、高頻度化を実現。高速かつ細やかなデータに基づく PDCA を支援。

自動分析システム

ユーザー情報

登録情報

閲覧履歴

クリック履歴

購入履歴

商品データベース

ユーザ毎に継続率などの KPI を予測

自動分析システムuser_id 予測継続率xxx n%…… ……

7日後継続率

継続率などの KPIの変動要因を特定

user_id 予測継続率xxx n%…… ……

30日以内購入率

出力形式はサンプルです。

要因 影響度xxx n%…… ……

7日後継続率

Page 19: みんなのPython勉強会#21 澪標アナリティクス 井原様

自社メディアをお持ちの会社、 ECサイト、広告代理店導入推奨企業

これまで、人間に依存してきた画像の制作指示や配置決めに関して、 AI及びディープラーニング機能を実装することにより、大幅な時間短縮、精度向上を実現。ユーザごとの画像の出し分けも実現。

画像評価システム

ユーザー情報

登録情報

閲覧履歴

クリック履歴

購入履歴

画像データベース

自動分析システム

ユーザ毎に最適な画像を上位表示

CV数の高そうな画像を上位表示

レコメンド

Page 20: みんなのPython勉強会#21 澪標アナリティクス 井原様

( 派生形 )AI A/Z テスト for Banner

資料請求、説明会申し込み等が必要な企業様、 ECサイト運営事業者など導入推奨企業

従来の A/B テスト AI A/Z テスト

Banner A Banner BVS

Banner B Banner CVS

Banner C

Banner D

Banner BVS

Banner E

2×2×4= 16回以上のテストとデータ収集期間(1ヶ月以上 ) が必要。

画像有無 テキスト

色使い 肌の露出 その他あり 小さい 暗め 少ない ・・・・

ちょっと暗め ちょっと少ないなし 大きい ちょっと明るめ ちょっと多い ・・・・

明るめ 多い

バナー登録

Banner Z

無数にあるバナーを同時テスト

これまで、手作業で行ってきたバナーやページ校正などの A/B テストを、機械学習を用いる事で無限のテストを高速に実施。最適な結果を自動で導き出します。データを蓄積することで、最適な結果を予測する事ができ、成約率の最大化と制作者の負担軽減を実現します。

独自 AIエンジン

※上記はコンバージョン率を計算するエンジンのみとなります。 テストする仕組みは既存の WEB サイトや導入済みのシステムとの連動が必要となります。

Page 21: みんなのPython勉強会#21 澪標アナリティクス 井原様

自社メディアをお持ちの会社、 ECサイト、広告代理店導入推奨企業

これまで、人間に依存してきたシフト組みに関して、最適化問題及び機械学習を実装することにより、連続休暇や連続勤務、シフトの公平性などを極力かなえれるようにシフトの自動化を実現。

シフト最適化

シフト希望

時給・スキル・役割

シフト組みの条件

シフト自動化システム

Page 22: みんなのPython勉強会#21 澪標アナリティクス 井原様

自社メディアをお持ちの会社など導入推奨企業

長いテキストの中にある重要な単語を自動的に抽出する AI システムを実装。メールや記事で重要な単語だけで概要を把握することを実現。既存の検索ロジックの代替や読むべき記事のレコメンドなどにより、作業時間の大幅短縮を実現。

自動要約

新規のテキスト

過去のタグ付けデータ

自動要約システム 重要となる単語