Predix データ・サイエンス あなたのデータに価値をもたらすために ·...

Preview:

Citation preview

powered by #IndustrialInternet

Predix データ・サイエンス: あなたのデータに価値をもたらすために

アレクサンダー・ロス

エグゼクティブ・ディレクター, データサイエンス・エンゲージメント & シェアドサービス

GE Digital

July 6, 2016

powered by

GE Digital Day 2016

2

「インダストリアル・カンパニー(製造業)」

としてベッドに入ったのに、翌朝には「ソフト

ウェアとアナリティクス・カンパニー」として

目が覚めることになるかもしれない。

ジェフ・イメルト

デジタル化された

エンターテイメント

© General Electric Company, 2014. All Rights Reserved.

10億人の人々がつながったら何が起きるのか?

ソーシャル・

マーケティング

の登場

コミュニケーション

の起動

ITアーキテクチャー

の仮想化

小売り & 宣伝

の変化

コンシューマー・ インターネット

] [

] [

] [ ] [

] [

インダストリアル・インターネット

ブリリアント・パワー

ブリリアント・ファクトリー

ロジスティックの最適化

工場の最適化

スマートグリッド

病院の最適化 リアルタイム・ネットワーク・プランニング

インテリジェント 医療機器

接続された

マシン

ブリリアント・ホスピタル

ブリリアント・

レイルヤード

もしも50億のマシーンがつながったらどうなるのか?

労働者は生産性を向上させる OT が仮想化される 分析が予測的になる

マシンは自己回復が可能になり、自動化される モニタリングとメンテナンスが起動する [

[

© General Electric Company, 2014. All Rights Reserved.

輸送の可視性

CRM, ERP,

ジオ・ロケーション・データ

センサー・データ

歴史的データ

マシン・データ

ログ

ソーシャル・ネットワーク・データ

コンテンツ (images, videos,

manuals, etc.)

インダストリアル“ビッグデータ”– 大量&広範

50B

2X 次の10年に おいてインダストリアル・データがより増大へ

実際は

3% のみの利用可能性があるデータがタグ付けされ、それ

よりも少ない数が分析

*Source: IDC © General Electric Company, 2014. All Rights Reserved.

• 各スマートメーターから 1日につき35GBのデータ

• 1フライトにつき1TBのデータ

• 2012年から 2020年にかけて50Xのヘルスケア分野におけるデータの成長

• ガス・タービンのブレードにつき500GB のデータ

• 蒸気機関車1時間につき9MM のデータポイント

のマシンが2020年までに互いにつながる

5

“ビッグ・データ”とは何か?

ボリューム データの量

バラエティー データの種類

ヴェロシティ データのスピード

“ビッグデータ” は重要なのか?

データ 情報

インパクト 行動可能な 見識

行動可能な見識: 過去の情報ではなく、よりリアルタイムに近い情報で別のルート

を提供

インパクト: 最短ルートをとるためにリアルタイムの他のドライバーの

ルートを利用

データ: 二地点間におけるルートなど、

プランニングに使える事実

情報: ターンバイターン方式のルートを作るためにデータを使用

7

インダストリアル・データサイエンスにおける3つのブロック

物理/エンジニアリングに基づいたモデル

• 専門知識、第一原理をレバレッジ

• 最小限のデータのみを必要とする

• メンテナンスや調整が困難– 時間とともに影響力を失う

経験的かつヒューリスティックな ルール& 見識

• 簡単に理解可能

• 専門領域で蓄積された知識を捉える

• 専門領域に対応して調整し、学習する

データドリブン・テクニック

• 産業領域における不十分なデータ

• 偏見:過去の「イベント」に縛られた将来予測

• しかしメンテナンスや調整が最も容易

インダストリアル分野のアナリティクスは 広い範囲のデータ・サイエンス能力を必要とする

センサー & シグナル加工

知識の 発見&

文脈上の分析

理論上 & 適用された統計

物理 & 専門性に基づいたモデリング

機械学習 &

人工知能

イメージプロセシング & アナリ

ティクス

コントロール&最適化

プロセスエンジ & オペレーションサイエンス

立証・検証& 計測学

予知システム& 方法

インダストリアル分野のアナリティクスは 広い範囲のデータ・サイエンス能力を必要とする

分析バリューチェーンの段階

11

壊れたときに修理

予測的メンテナンス(“将来”)

規定的な推薦

フリート/オペレーション規模の最適化レベル ビジネスを最適化するためのトレードオフ

パフォーマンス

コンディションベース・メンテナンス (“現在”) モデル・ドリブン ワーク・ドリブン タイム・ドリブン

• より早い段階での探知 • 根本原因 • より機器のタイプ、事例に調整

オペレーションまたはビジネスに関する最適化のための新しい「レバー」

“機器の健康状態は与えられたものではなく、変動するものである”

産業データサイエンスはどう違うのか?

対象とするイベント 機器・コンポーネント の故障

広告の クリック回数

メディアの 購入

イベント毎のコスト/価値 莫大 極小 小

イベント発生頻度 極少 膨大 大

多様さ/原因因子の数 大 小 小

データの「清浄度」 低 非常に高 非常に高

データ点数 広範かつ多種 大 大

物理学モデル 関連性大 ? ?

既存システム/作業 との統合

クリティカル 極微 極微

… … … …

産業データサイエンスはどう違うのか?

ビッグデータは汚染を作り出している

2018年までに、導入されたデータレイクの90%は不確かな利用目的のために収集された、膨大な情報データのために、無意味なものになる*

*Gartner – Predicts 2015

14

“ビッグ・データ”とは何か?

ボリューム データの量

バラエティー データの種類

速度 データのスピード

“ビッグデータ”とは何か?

ボリューム データの量

バラエティー データの種類

速度 データのスピード

価値 データの影響力

ビジネス・ アウトカムの領域

データ・ システムの領域

17

予測性と因果関係の規則性は、潜在的なソリューションへ データをあなたのガイドにしよう

データが何を問題視するかをどう判別するか?

18

ソリューションへと導く 予測性と因果関係の規則性

ビジネス・ アウトカムの領域

データ・ システムの 領域

なぜ我々は“データ・サイエンスをする”のか

物理& エンジニア

リング・モデル

経験的な,

ヒューリスティッ

クな ルール &

見識

データ・ドリブン

な方法

ハイブリッド・メソッド

データをあなたのガイドにしよう

powered by #IndustrialInternet

データ・サイエンスが提供するもの

powered by

データ・サイエンス・サービス

Predixアクセラレータ

`

データ・サイエンス プロジェクト・タイムライン & アクティビティー

産業データサイエンス・ワークショップ データ探索 分析モデリング

ポスト・アクセラレーター: ソリューション・ディベロップメント

2日間

4-8週間

6-12週間

4-12週間

我々は分析とデータ・サイエンスがあなたのビジネスにもたらすことができる対価としてふさわしい商品を定義するために、すべての契約を主要なステークホルダーと内容領域専門家を集めることから始めます。ベストな実践データサイエンス・パターンを使い、我々は問題整理を組みたて、成功できるメトリクスを定義し、重要なビジネス・ドライバーに影響を与えられる関係性のためのデータシステムを判別します。

我々は品質評価と実地踏査のためのデータを取り出すために、あなたのデータ・システム・オーナーと取り組みます。我々はデータ・サイエンス・メソッドが最も効果を発揮するうえで最適な機会を見極めるうえで、データとあなたの重要なビジネス・ドライバーとの潜在的関係性を判別します。我々の目的はビジネス効果に関する当初の仮定を立証するデータ内における関係性、因果関係、予測性をテストすることです。

我々があなたのデータが生み出すことができるビジネス上のインパクトを認識できた後には反復的に増築するために、及びあなたのアウトカムを最適化するための分析を立証するために、分析モデリングフェーズを実行します。我々はデータ探索を通じて把握できた現在の状況におけるチャレンジとビジネス・ドライバーを見て、あなたが望むアウトカムを実現するうえでのロードマップを定義します。

データサイエンス・ワークショップ、データ探索、分析モデリングを通じて連帯的にあなたのビジネス・メトリックスに影響を与える分析を実証した後には、我々はPredixカタログを通じてアクセスされ展開されたPredixに基づく分析ソリューションを発展させ、効果的にさせます。

`

データ・サイエンス ワークショップ・アジェンダ

準備 産業データサイエンス・ワークショップ

イントロ

ファースト・ワーク概観

IDS 概観

ランチ

KPIワークアウト

KPI 辞書作成

エグゼクティブ・ブリーフフィング

テクノロジー・ブリーフィング

アウトカム資格

データ・ソースとシステム・ワークアウト

データ辞書作成

ランチ

ダウンスコーピング

LOFA アイデンティフィケーション

MVP プラン・ディベロップメント

オウナーシップ, チーム&プロセス整理

1日目 2日目

データ探査

4-8 週間 4-12 週間

ポストアクセラレーター・ソリューションディベロップメント

分析モデリング

6-12 週間

データサイエンス データ分析の例

実働可能な見識の判別・分類

分析の発展、実証

GE Confidential

GE Digital ファウンドリー

• デザイン・シンキング • カスタマー共創/ 価値の証明 • 即座の問題解決 • カスタマー・デジタル変化

• エコシステム使用可能性 (ディベロッパー、大学、研究者、産業グループ)

• 大学の奨学金とパートナーシップ

• シード・ファンディング • インキュベーション

ソフトウェアデザイン & 共創

• データ・サイエンス • サイバーセキュリティー • GEインダストリアル専門性へ

のアクセス

• Predixトレーニング&Dojo

• 破壊的アプリケーション・デバイス • クラウドサービス

• オープンソース • R&D

デジタル・ファウンドリ

インダストリアル・インターネット 専門性

エコシステム, ベンチャー,

インキュベーション

トレーニング& 生産

• デジタル・ファウンドリーはGE Digitalの存在を主要なマーケットの中で作り上げ、Predixの認知度を高め、顧客とディベロッパーをトレーニングし、エンゲージするために戦略的メカニズムとして機能

• 2016年の予定: 上海、パリ、サウジアラビア、ボストンに開設 • 2018年までに、東京を含む6か所に追加開設

GE Confidential

あなたのデータ内から実行可能なインサイトを探す

ソリューションの発展と展開

機会を判別する

あなたはもうすでに答えを持っている

Recommended