23
クラウドを活用した自由自在なデータ分析 BigData Platform Conference 日本IBM アナリティクス事業部 インフォメーション・アーキテクト 野間 愛一郎

クラウドを活用した自由自在なデータ分析

Embed Size (px)

Citation preview

Page 1: クラウドを活用した自由自在なデータ分析

クラウドを活用した自由自在なデータ分析BigData Platform Conference

日本IBM アナリティクス事業部インフォメーション・アーキテクト野間愛一郎

Page 2: クラウドを活用した自由自在なデータ分析

様々な分析のニーズ

ダッシュボード・BIレポート

ビジネスルール

予測分析

コグニティブ

何が起こっているのか?

何が起こりえるのか?

どうすれば最高の結果を成し遂げられるのか?

経験に基づきどう変化していくか?

可視化と検索

どのようなデータがあるのか?

ほとんどのユーザーはここ

Page 3: クラウドを活用した自由自在なデータ分析

4つの例

インフラエンジニア

データサイエンティスト マーケティング

業務担当者

Page 4: クラウドを活用した自由自在なデータ分析

データ量の増加に追いつかない

• 社内でデータウエアハウスを構築済

• まだ1年も経過していないうちにBusinessが急成長

• 構築したデータウエアハウスデータを投入するもそれを越えるデータ量

• 1年保管を半年保管に変更して運用でカバー

• 成長に比例したIT基盤作りをしたいが間に合わない

• 基盤を整えた途端にBusinessが減速したら?

Page 5: クラウドを活用した自由自在なデータ分析

データ量の増加に追いつかない

4

dashDB

PureData for Analytics

(Netezza) • データ・ウエアハウス・サービス• 短期間で構築• スモールスタート• 月額課金

• お使いのデータウエアハウス• dashDB

Page 6: クラウドを活用した自由自在なデータ分析

dashDB

• RDB(リレーショナル・データベース)

列指向、イン・メモリー技術を採用

Netezza に実装される イン・データベース分析機能を実装

Oracleとの互換性を提供

ハードウェアのサイジングや物理設計は不要

ソフトウェアのインストールや運用管理は不要

• パッチの適用やバージョンアップも不要

• バックアップ運用も不要

• チューニング作業も不要5

• “フルサービス”のクラウド・データウエアハウス• LOAD and GO - データを用意してから使い始めるまでを早く・簡単に• データベースだけでなく充実した分析環境をビルトイン

Page 7: クラウドを活用した自由自在なデータ分析

CREATE TABLE

Data LOAD

&

GO!

1. Create Table

2. Load data

AFTER

dashDB

1. データベース設計データ分割圧縮テーブル設計

2. Create Table

3. Load data

4. 索引作成やサマリ表作成5. 統計情報更新6. チューニング作業

従来のデータベース環境データベースデザインやチューニングが必要

Repeat

dashDB : コンセプトはLOAD & GO

Page 8: クラウドを活用した自由自在なデータ分析

データ量の増加に追いつかない

7

dashDB

PureData for Analytics

(Netezza) • データ・ウエアハウス・サービス• 短期間で構築• スモールスタート• 月額課金

DataWorks

ETL

As a Service

• お使いのデータウエアハウス• dashDB

• dataWorks

Page 9: クラウドを活用した自由自在なデータ分析

Dataworks

8

データソースSystems of Record

Systems of Engagement

データのクレンジングおよび統合

ETL

クラウドでの

データベースサービス

IBM DB2/PDA

Cloudant

Oracle

Other relational

systems

IoT, Social Media

dashDBDataWorks

ETL

As a Service

• データ統合にかかる時間を節約。すぐに利用可能。• 複数のデータソースへのアクセスを可能にするシンプルなETLツール• dashDBなどクラウド上のデータベースはもちろん、オンプレミスで稼働するデータベースへもシームレスにアクセス可能

Page 10: クラウドを活用した自由自在なデータ分析

製造現場:多様な属性データを収集・分析したい

• データ分析基盤はあるが、活かされていない

• 基盤が古い、代表的な一部のデータしか取得できていない

• 様々な情報を出力可能ではあるが収集が出来ていない→見れば何かが分かりそうだ

• メーカー毎、モデル毎に出力可能なデータが異なり、多くの属性を取り扱う

• 出来そうだでは予算化が難しい

Page 11: クラウドを活用した自由自在なデータ分析

dashDB

製造現場:多様な属性データを収集・分析したい

Cloudant

{

“id”:”12345”,

“装置番号”:”AB123”,

“属性”:”ABC123”

}

すべての属性データを漏れなく溜める

MapReduceを利用した集計・簡易分析

JSONデータをSQLでも参照したい

JSON

自動変換

• NoSQLデータベース・サービス• スケーラブル・高可用性• 短期間で構築• 月額課金

• Cloudant

• dashDB

Page 12: クラウドを活用した自由自在なデータ分析

Cloudant

11

• 様々なAPIを提供

シンプルなREST (HTTP) API

データベース・レプリケーションおよびデータセンター間のレプリケーション

MapReduce

Geospatial index (地理情報関数)

全文検索索引

• モバイルアプリケーション用のデータストア

• クラウド環境に対してオープン

• クラウド版とオンプレミス版の両方を提供

• “フルサービス”のクラウド・NoSQLデータベース• Operational JSON NoSQL data store

• スケーラブル、高可用性、データセンター間連携が容易

Page 13: クラウドを活用した自由自在なデータ分析

品質部門:セルフサービス分析

• 分析用の高速DWHを全社で構築済

• 大量データ集計は分析は確かに抜群に高速

• このリソースを自分用、グループ用、部門用に利用したい

• 別途予算化は難しい

• トライ&エラーで分析のアイデアをいろいろ試したい

Page 14: クラウドを活用した自由自在なデータ分析

品質部門:セルフサービス分析

13

dashDB

PureData for Analytics

(Netezza)

DataWorks

ETL

As a Service

• お使いのデータウエアハウス• dashDB

• dataWorks

• SPSSなどお使いのBIツール• Rの実行環境• Spark

EXCELやCSVファイルをロード

Spark

As a Service

GraphXやMLib

Page 15: クラウドを活用した自由自在なデータ分析

アドテク / マーケティング

• Webページのユーザーの動きを分析に活かしたい

• キャンペーンサイトをすぐに構築し、アクセスユーザーの属性を取得したい

• ソーシャルでの評判(クチコミ)を取り込みたい

• ユーザーの位置情報を活かしたエリア・マーケティングを実施したい

• 外部データを取り込み分析に活用したい

Page 16: クラウドを活用した自由自在なデータ分析

dashDB

アドテク / マーケティング

Cloudant

アプリケーションログ

• Cloudant + Geospatial (地理情報)

• dashDB + Geospatial (地理情報)

• Insights for Twitter

• Insight for weather

Insights for WeatherInsights for Twitter

• ソーシャルデータ、オープンデータを活用• APIエコノミーで短期間にアプリケーションを構築

Page 17: クラウドを活用した自由自在なデータ分析

様々なパーツが揃っています

Page 18: クラウドを活用した自由自在なデータ分析

BigInsights on Cloud• インメモリーで高速なSparkとHadoopの連携• ベアメタルのクラスターによるパフォーマンス• 多様な大量のデータを集計、分析

Cloudant• 世界規模でクラウドにデータを貯め、アプリケー

ションを迅速に開発するためのNoSQL型DBaaS• モバイルアプリにおけるデータストアとして最適• JSON形式データをRDBMS形式のデータに自

動変換

• BLUのカラムナーおよびインメモリーによる高いパフォーマンス

• Netezza In-DB アナリティクスによる高度な分析

• Cloudant NoSQLからの自動変換・同期、および、Watson Analyticsとの連携

分析用 トランザクション用

非構造化データ

構造化データWatson Analytics

直観的ビジュアル分析ツール

DataWorks

ETL

DB2 on Cloud• SoftLayerのプライベート仮想化ノードでの汎用

DBMSを、Bluemix経由でプロビジョニング• データの処理中、使用中、保存中のいずれでも

ネイティブに暗号化• DB2の高度な機能をクラウドの柔軟な

課金体系で

dashDB

データベースも用途に応じて選択

Page 19: クラウドを活用した自由自在なデータ分析

DB2 on

Cloud

データの場所を気にする必要はありません。

• アプリケーションは場所を気にする必要はない• オンプレミスでもクラウドでもアプリケーションからは透過的

Page 20: クラウドを活用した自由自在なデータ分析

最適なパーツを組み合わせて利用

Page 21: クラウドを活用した自由自在なデータ分析

IBMは分析のすべての範囲をカバー

ダッシュボード・BIレポート

ビジネスルール

予測分析

コグニティブ

何が起こっているのか?

何が起こりえるのか?

どうすれば最高の結果を成し遂げられるのか?

経験に基づきどう変化していくか?

IBM Branded Big

Data & Analytics

Platform

Bus

ines

sV

alue

可視化と検索

どのようなデータがあるのか?

Page 22: クラウドを活用した自由自在なデータ分析

IBMのクラウドソリューションは“すぐに使える”分析環境をご提供します。

dashdb.comcloudant.combluemix.net

Security Services

CloudIntegration

Services

Mobile Services

Database services

Big Data services

Watson Services

Web and application

services

Page 23: クラウドを活用した自由自在なデータ分析

Thank You