54
ビッグデータ/IoTの最新事例とHadoop活用の勘所 ~成功のポイントはデータベースとの共存にあり! 20151110日本オラクル株式会社 クラウド・テクノロジー事業統括 クラウド・テクノロジー製品戦略統括本部 担当マネージャ 大橋 雅人 [email protected]) Cloudera World Tokyo 2015

Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

  • View
    1.667

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

ビッグデータ/IoTの最新事例とHadoop活用の勘所 ~成功のポイントはデータベースとの共存にあり! ~

2015年11月10日 日本オラクル株式会社 クラウド・テクノロジー事業統括 クラウド・テクノロジー製品戦略統括本部 担当マネージャ 大橋 雅人 ([email protected])

Cloudera World Tokyo 2015

Page 2: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

• 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。以下の事項は、マテリアルやコード、機能を提供することをコミットメント(確約)するものではないため、購買決定を行う際の判断材料になさらないで下さい。オラクル製品に関して記載されている機能の開発、リリースおよび時期については、弊社の裁量により決定されます。

2

OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。 文中の社名、商品名等は各社の商標または登録商標である場合があります。

Page 3: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

皆様と共に

3

日本オラクル

設立30周年

Hadoopアプライアンス製品

Oracle Big Data Appliance

発売3年目

Page 4: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

2015/10/29 日本オラクル プレスリリース

セブン&アイ・ホールディングス様

4

2015/10/29 日本オラクルプレスリリース https://www.oracle.com/jp/corporate/pressrelease/jp20151029.html

Page 5: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

非構造 データ

構造データ

5

MES

機器ログ

ERP

音声

ビデオ

テキスト

ソーシャル

ソース 収集 蓄積

DWH

データ 貯蔵庫

Data Visualization

Analytics Platform

分析 • これまでの取り組み – ERPをグローバルシングルインスタンス化

• Oracle Applicationsを活用

• 業務プロセス標準化、ITコスト削減($7.7M)

– グローバルKPIシステム(DWH)を構築

• Exadata、Exalyticsを活用

• 世界中の各生産ラインの生産状況や歩留情報、 在庫情報、販売情報のKPIを可視化

• 影響分析等、効率的な工場管理が可能に

• 新たな取り組み – MESや装置データをDWHに統合

• Oracle Big Data Applianceを活用 • 詳細な長期間での装置稼働状況可視化 • 生産稼働最適化 • 操業率低下の原因分析

バッチデータフロー インテラクティブな データフロー

マスター、 サマリー、 詳細データ

サマリー 分析結果

アーカイブ

ビッグデータ/IoT お客様 活用例

MESデータ活用により、詳細な生産状況の分析を実現

某グローバル製造業様

Page 6: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. | 6

• メインフレーム・ダウンサイジング

– MIPS:30%削減

– バッチ処理時間:50%削減

• Exadata+Big Data Appliance(Hadoop 基盤)のハイブリッド構成

– 既存データマートの集約

– OPEX:約40% 削減

• データ配布モデルの近代化

– 「データありき」 vs 「スキーマ/モデルありき」

– 顧客360°ビューの実現

ビッグデータ/IoT お客様 事例

ITコスト削減と、情報の一元化によるビジネス変革実現

La Caixa様 メインフレーム テープ サブシステム・DWH バッチ処理 レポート

Data Reservoir (Hadoop)

ソーシャルデータ

顧客情報

決済情報

バッチ処理の削減による コスト削減 メインフレーム

およびテープ上の ストレステスト データの移行

レポート

顧客360°

DWH (RDBMS)

Page 7: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

業務 アプリケーション

オペレーショナル レポーティング

成功のポイントはデータベースとの共存にあり!

HadoopとRDBMSの強みを組みあわせる

ソーシャルメディア

Internet of Things

73°

ビッグデータ マネジメント基盤

Data Reservoir (Hadoop)

7

アナリティクス

DWH (RDBMS)

Page 8: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

成功のポイントはデータベースとの共存にあり!

Modern Big Data Management System

Interface

Processing

Persistence

Security | Performance | Availability

SQL REST Python Graph R node.js Java

Map Reduce

Graph Engine

SQL Engine

Warehouse (Database)

NoSQL Reservoir (Hadoop)

8

Page 9: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

成功のポイントはデータベースとの共存にあり!

Oracle Big Data Management System データの特性による典型パターン 適材適所のデータ配置例

パターン・データ特性 Hadoop

(Big Data Appliance) DWH/Database (Exadata)

データ 容量

データ密度・ データ価値

低い 高い

フォーマット 変更頻度

多い 少ない

粒度 細かい 粗い

参照頻度 少ない 多い

ETL処理 ETL処理と生データ保持 ETL処理、生データ 処理後データ

インフラ SAS 高速化基盤 Hadoop上のデータ DB上のデータ

センサーデータ、 ログデータ、GPSデータ、

SNS等

既存のRDBMS内のデータ(マスターデータ/

トランザクションデータ)

明細データ サマリデータ

経年データ アクティブデータ

ETL処理前の生データ ETL処理後データ

SAS アナリティクス高速化基盤

9

Page 10: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

オラクルが提供するHadoopソリューション

Hadoop活用の8つの勘所

Hadoop活用の障壁を もっと下げたい

HadoopとRDBMSを もっと密に連携させたい

構築・運用・管理を もっと簡単に、安く

もっと多くの人に開放、使ってほしい

もっと簡単に有益な データを見つけだしたい

MapReduce処理を もっと簡単に構築したい

Oracle Big Data Appliance

Oracle Big Data SQL

Oracle Big Data Discovery

Oracle Data Integrator

両者間のデータ移動を もっと早く

Oracle Big Data Connectors

MapReduceからDBのデータを使いたい

Oracle Table Access for Hadoop and Spark

ライフサイクルを見越したデータ管理をしたい

Copy to BDA

他システムとだって 密に連携したい

Oracle’s Big Data Integration Solutions

10

Page 11: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

Hadoop活用の障壁を もっと下げたい

構築・運用・管理をもっと簡単に、安く

Oracle Big Data Appliance

Page 12: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Appliance X5-2 事前最適化されたビッグデータ活用Hadoopプラットフォーム

12

エンタープライズ向けビッグデータ活用環境

信頼性

TCO削減

コスト

• ハードウェア、ソフトウェアを包含し、安価な価格(手組に比べ21%以上 コスト削減)

• 事前構成、調整済 (手組に比べ30%以上 構築期間短縮)

• ノード追加などの拡張設定やアップグレードが コマンド一つで実施可能、運用コスト削減

処理の高速化

スピード

• ハードウェア、ソフトウェアで最適化(手組に比べ20%高速化)

• Map Reduce高速化のための独自機能 (Perfect Balance)

• 内部ノード間でのInifiniband接続による 高速連携(40Gb/sec)

• 効果に併せて、容易に 柔軟に段階的に拡張可能

• エンタープライズ使用に 耐えうる、高度な セキュリティ機能

• エンタープライズ利用の ベストプラクティスに基づいて、事前調整、テスト済

• H/WからS/Wまでの、一元サポートと、 Oracle Enterprise Managerによる一元管理 • Exadataと組み合わせることで、HadoopとRDBMの利点を活かしたビッグデータ活用基盤

(Oracle Big Data Management System)の構築

構築・運用・管理を もっと簡単に、安く

Oracle Big Data Appliance

Page 13: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Appliance X5-2 IntelとOracleの協業でイノベーションをさらにリード

• DIY(手組)と比較してBDAが最大1.4倍、平均1.2倍高速化!(*)

– Wider Network: 23GbE vs. 10GbE

– Advanced Linux & Apache* Hadoop* configuration

• さらなるチューニングにより最大2.86倍高速化を実現!(*)

– 一部チューニングは既に最新バージョンで反映済

• 今後Intelとのさらなる協業により、 BDAのHardware及びSoftwareの両面からの 最適化を図っていく – Spark 活用のためのさらなる最適化 など

13

(*)Intel実施のパフォーマンステストより。詳細は下記参照 https://blogs.oracle.com/datawarehousing/entry/performance_study_big_data_appliance http://www.oracle.com/ocom/groups/public/%40otn/documents/webcontent/2745435.pdf https://software.intel.com/en-us/articles/deploying-an-apache-hadoop-cluster-spend-your-time-on-bi-not-diy

構築・運用・管理を もっと簡単に、安く

Oracle Big Data Appliance

Page 14: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Appliance X5-2

14

ESG(第3者機関)調査に裏付けられた優位性:DIY(手組)より21%安価に構築

構築・運用・管理を もっと簡単に、安く

Oracle Big Data Appliance

コストを節約

出典: ESGホワイト・ペーパー

21% コスト削減

33% 構築期間短縮

「Oracle Big Data Applianceは、Clouderaが提供している主要なHadoopベース技術のフル・スイートを 使用したいと考えている顧客にとっては 素晴らしい選択肢です。DIY( Do It Yourself )クラスタよりも低コストかつ短期間での導入が可能です。」

⁻ Mike Olson Cloudera founder, Chief Strategy Officer, and Chairman of the Board

Page 15: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Appliance X5-2 ESG(第3者機関)調査に裏付けられた優位性:DIY(手組)より33%短期に構築

15

• Architect

1. Design a production-ready, enterprise-class, high-throughput approach for both running hadoop and for integrating with current enterprise relational systems

2. Design a growth strategy, so the initial system can expand easily without hitting future unanticipated issues like network bottlenecks

3. Design redundancy/failover strategy for all levels (power, network cards and cables, network switches, core hadoop, supporting software, o/s disks, etc)

4. Design a strategy for what services should run in which locations, and how to easily change those locations due to growth or unplanned maintenance

5. Design network approach including network switches needed now and in the future

6. Determine an optimal matching configuration of server model, drive type, drive count, cpu, networking, and memory

7. Conduct rigorous (and ongoing) testing to determine exact versions to use for BIOS, drive firmware, network cards, and O/S packages

Install

8. Physically rack up the servers

9. Setup network switches

10.Cable the servers

11.Install optimal firmware versions for ILOM, BIOS, drives, and network cards

12.Setup all the IPs, including for administration networks, virtual IPs for failover, etc

13.Install the O/S

14.Setup tuned O/S parameters (such as file and page cache, swap, networking, etc) to support heavy I/O and heavy network workloads

15.Install the Oracle Java VM

16.Install Oracle R, including optimized math libraries

17.Install Oracle MySQL metadata database and configure for failover

18.Install CDH (Enterprise Data Hub offering) and Cloudera Manager

19.Install the Oracle Big Data Connectors

20.Install Oracle Big Data SQL

21.Test the installation for each node of cluster

22.Sanity check network timings and performance of the cluster post-install

23.Certify cluster with SAS, NGData, and other third party products

Grow

24.Research, plan, and design a way to reallocate/balance services appropriately as you add servers and racks

25.Design how to expand/scale/setup the networking appropriately as you add servers and rack

Secure

26.Research, plan, design, and test overall security implementation technique

27.Manually install/configure disk encryption

28.Manually install/configure network encryption

29.Manually install supporting Kerberos infrastructure, enable Kerberos, and configure for failover

30.Manually install/configure Audit Vault collector

Patch & Upgrade

31.Assess multi-level patching needs (i.e. upgrade bios, ILOM, O/S, Java, Hadoop)

32.Determine when it is necessary to upgrade HW firmware

33.Assess when it is necessary to upgrade O/S and how to upgrade O/S without disruption existing Hadoop installation

34.Write scripts to automate patching of multiple layers and multiple nodes from a single command

35.Write scripts to add new features

Service

36.Install/Configure Automatic Service Request for proactively opening Oracle Support tickets

37.Install/Configure Enterprise Manager plug-in for enterprise monitoring integration

38.Worry about resolving hardware issues, thanks to BDA’s Oracle Field Hardware Support

39.Worry about hardware points of failure, thanks to BDA’s use of Enterprise Servers with robust Redundancy (O/S disks, network switches, PDUs, Bonded cables)

40.Worry about disruptive disk failures that might hurt SLAs, thanks to BDA’s use of Enterprise Disks with Predictive Disk Monitoring

Financials

41. Lose weeks during the design and analysis phase of a build-your-own cluster

42. Pay for consultants to validate your cluster design

43.Dedicate scarce highly talented people to work on cluster installation and growth when they could be working on tackling business opportunities

44.Remember to account for extra requirements (racks, power distribution units, inter-rack networking)

45.Contract for annual support with operating system vendor (this is part of the BDA’s single annual support fee)

46.Contract for annual support with R support vendor (this is part of the BDA’s single annual support fee)

47.Contract for annual subscription/support with Hadoop distribution vendor (this is part of the BDA’s single annual support fee)

Oracle Big Data Appliance で省略される、47にも及ぶ構築作業項目

構築・運用・管理を もっと簡単に、安く

Oracle Big Data Appliance

Page 16: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Appliance 事前最適化されたビッグデータ活用Hadoopプラットフォーム

16

•36のCPUコア (2 ×18 Core Intel ® Xeon ® E5-2699 v3 Processors (2.3 GHz)

•96TBのストレージ容量 (12 x 8 TB 7.2K RPM 高容量 SAS (hot-swap)

•128GBのメモリ (8 x 16GB DDR4 Memory) 768GBまで拡張可能

Oracle Big Data Appliance ノード Oracle X5-2L Server

Oracle Big Data Appliance Starter Ruck:6ノード

• 6台のOracle X5-2L Serverで構成 • 合計216のCPUコア • 合計576TBのストレージ容量 • 合計768GBのメモリ(最大4608GBまで拡張可能)

Oracle Big Data Appliance Full Ruck:18ノード

• 18台のOracle X5-2L Serverで構成 • 合計648のCPUコア • 合計1728TBのストレージ容量 • 合計2304GBのメモリ(13824GBまで拡張可能)

1ノードずつ 追加可能

•40Gb/sec InfiniBand 合計 100 port (内部接続、Exadataへの接続)

•10Gb/sec Ethernet 合計16 ports (データセンター機器との接続)

•Oracle Linux 6.7 •Oracle Java JDK 8u66 •Cloudera Enterprise Data Hub Edition 5

• Cloudera Distribution including Apache Hadoop (CDH) v5.4.7

•Cloudera Impala, Cloudera Search, Apache HBase, Apache Spark •Cloudera Manager,Cloudera Navigator

•Oracle R Distribution •Oracle NoSQL Database v3.4.7

構築・運用・管理を もっと簡単に、安く

Oracle Big Data Appliance

*ハードウェアのサポート契約で、 上記ソフトウェアのサポートを追加料金なしでご提供 (Oracle NoSQL Database EEを除く)

ソフトウェア

Page 17: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

Hadoop活用の障壁を もっと下げたい

もっと多くの人に 開放、使ってほしい

Oracle Big Data SQL

Page 18: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data SQL

18

Smart Scan クエリをExadataの

ストレージサーバーにオフロード

Storage Index クエリに必要な

データブロックのみをスキャン

SQL一つで、 必要なデータが

高速にセキュアに返される

Smart Scan クエリをBig Data Applianceの

データノードにオフロード

Storage Index クエリに必要な

データブロックのみをスキャン

SQL

必要データ のみ移動

SQL

Big Data Appliance +

Hadoop/NoSQL

Exadata +

Oracle Database 12c

Hive metadata

ビッグデータの活用をよりシンプルに、しかも迅速に、そしてセキュアに

既存のアプリ、ツール、スキル

そのままで全てのデータがクエリ可能

もっと多くの人に 開放、使ってほしい

Oracle Big Data SQL

Page 19: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data SQL

select last_name, state, movie, genre from movielog m, customer c where genre=‘comedy’ and c.custid = m.custid

Smart Scan:ローカルでの絞り込み・データ転送の極小化

1

NameNode/Hive Metastoreから 以下の情報取得: • データの保持場所 • データの構造 • 対象のブロック数

1

2

Big Data SQL Serverが並列読込み: • DataNodeが並列にデータアクセス • 行と列の絞り込み

2

Hive Metastore

HDFS NameNode

3

データベースサーバーでの処理 • 関連するデータのみ転送されてくる • データベースのテーブルとジョイン • データベースセキュリティポリシーの適用

3

HDFS Data Node BDS Server

HDFS Data Node BDS Server

customer DB

Hadoop

19

もっと多くの人に 開放、使ってほしい

Oracle Big Data SQL

Page 20: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data SQL Storage Index:スキャン対象を絞込み、クエリ時間とデータIOを削減

20

HDFS

Field1, Field2, 1001 1010 1045 1109 1043 1001 1045 1609 1043 11455 1909 12430 13010 10450 1909 2043

Field3, … , Fieldn

HDFS Block1

(256MB)

HDFS Block2

(256MB)

Index B1 – Movie_ID Min: 1001 Max: 1609

B2 – Movie_ID Min: 1909 Max: 13010

Example: Find all ratings from movies with a MOVIE_ID of 1109

• 自動的にHDFS上のデータブロック毎のIndexの最大値と最小値を作成

• スキャン前に目的のデータが最大値-最小値の間にあるかを確認

• 最大値-最小値の間になければ、スキャンを行わず、クエリにかかる時間と、HDFSからのI/Oを削減

平均65%、最大100倍高速化

もっと多くの人に 開放、使ってほしい

Oracle Big Data SQL

Page 21: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data SQL

21

Hadoop上のデータにもOracle Databaseの強固なセキュリティ機能を提供

Big Data Appliance +

Hadoop

Exadata +

Oracle Database

SSN EMPID LAST FIRST SALARY

111-11-1111 275895 Smith John 125275

222-22-2222 335685 Jones Sally 250950

333-33-3333 558544 Stinson Chuckie 32000

EMPID LAST FIRST

275895 Smith John

335685 Jones Sally

SSN SALARY

111-11-XXXX 125275

222-22-YYYY 250950

333-33-ZZZZ 32000

•BDAの持つ機能 —Kerberos/LDAPによる認証 —Apache Sentryによる認可 —Oracle Audit Vault Fire Wallによる監査 —HFDSのデータ格納されるHDDの暗号化 —ネットワーク暗号化

•データベースのセキュリティ制御 —マスキング/リダクション —仮想プライベートデータベース —ファイングレインアクセス制御

•セキュリティ管理の統合、シンプル化

もっと多くの人に 開放、使ってほしい

Oracle Big Data SQL

Page 22: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

Hadoop活用の障壁を もっと下げたい

もっと簡単に有益な データを見つけ だしたい

Oracle Big Data Discovery

Page 23: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Discovery データ分析前の1000本ノックをいかにアジャイルに迅速に繰り返すか

ビジネスの状況 の把握

ビジネス状況の把握 データの理解

データの準備

モデル作成 評価 展開/共有

データ

CRoss-Industry Standard Process for Data Mining(CRISP-DM) :業種を超えたデータマイニングプロセス

データの理解

データの準備

モデル作成

評価

展開/共有

23

・サンプリング ・データの把握、理解 ・変数の選択、把握 ・データ加工

専門スキルやツールが 求められ、高度な職人技で 行われている分析プロセスを 迅速に可能に

Oracle Big Data Discovery

もっと簡単に有益な データを見つけだしたい

Oracle Big Data Discovery

Page 24: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Discovery

24

直感的なUI画面でデータサイエンティストの生産性を向上

1.Hadoop上のデータを 可視化、タグ付け

2.データの値特性、品質、 分析価値有無を可視化

3.データの因果関係、説明変数 のシミュレーションと把握

4.次の分析へデータ加工

もっと簡単に有益な データを見つけだしたい

Oracle Big Data Discovery

Page 25: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle R Advanced Analytics for Hadoop

・RとHadoopを活用した分析のためのソフトウェア

・R言語のみでデータマイニングの分散並列処理が可能

・HDFS上のデータへR言語からアクセス

・Spark対応

Oracle Big Data Spatial and Graph

(Spatial Analytics)

・豊富な空間演算関数

・近傍情報、ジオフェンス判定

・位置情報への付帯情報の付加

・空間データ、ラスタ(画像)データの加工・準備

Oracle Big Data Spatial and Graph

(Graph Analytics)

・プロパティグラフ

・標準のグラフ分析関数

・ソーシャルメディア分析

・IoT

・サイバーセキュリティ

Oracle’s Big Data Advanced Analytics

Hadoop上でデータ分析をしたい

Oracle’s Big Data Advanced Analytics

25

さらに、、

Page 26: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

Hadoop活用の障壁を もっと下げたい

Map Reduce処理をもっと簡単に構築したい

Oracle Data Integrator

Page 27: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Data Integrator Oracle Data Integrator Application Adapters for Hadoop Oracle Data Integrator Advanced Big Data Option

• ファイル/RDBMSからHiveへのロード • Hive を利用したデータの検証と変換 • FileもしくはHiveからOracleへのロード

27

Map Reduceによるデータ加工やETL処理、DBへのデータロードをGUIで定義可能

Hadoop Cluster

f(x)

MapReduce

Data Load

Oracle Database

Oracle Data Integrator

Application Adapters for Hadoop

• 追加オプションでSparkやPigのコードを 生成する事が可能

• Hadoopの最新技術を活用した、 高速なインメモリ処理がGUIで定義可能に

Map Reduce処理を もっと簡単に構築したい

Oracle Data Integrator

Page 28: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Data Integrator Oracle Data Integrator Application Adapters for Hadoop Oracle Data Integrator Advanced Big Data Option

28

GUIの画面で論理的なデータフローを、物理的なフローに変換可能

Logical Design

Physical Design

Oracle

MySQL

Hive

Sqoop

Sqoop

IKM

LKM

LKM

Oracle

Hive

MySQL

Hive

Map Reduce処理を もっと簡単に構築したい

Oracle Data Integrator

Page 29: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

両者間のデータ移動をもっと早く

Oracle Big Data Connectors

HadoopとRDBMSを もっと密に連携させたい

Page 30: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Connectors

30

Oracle Databaseが持つ並列処理の仕組みを活用し、 HadoopとDB間を高速データ連携

• Hadoop上のデータを並列処理でOracle DBに高速データロード(15TB/時間)

• Hadoop側でフォーマット 変換するため、Oracle DB への負荷を最小化

• 自動ロードバランスによるデータロード処理時間の短縮

• ケルベロス認証のサポートによるセキュアなデータ連携

JSON Log

files Hive

Text Parquet Avro Sequence

files

Compressed

files And more …

両者間のデータ移動を もっと早く

Oracle Big Data Connectors

Many versions 10g Release 2 11g Release 2 12c On any OS platform

Page 31: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

MapReduceから DBのデータを 使いたい

Oracle Table Access for Hadoop and Spark

HadoopとRDBMSを もっと密に連携させたい

Page 32: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Table Access for Hadoop(Oracle Big Data Appliance機能)

HiveやSpark SQLからOracle Databaseのデータにアクセス

Big Data Appliance Cloudera Hadoop

Oracle Database

MapReduceから DBのデータを使いたい

Oracle Table Access for Hadoop and Spark

HCatalog

StorageHandler

JDBC

• Oracle DBからのデータの 移動の必要なく、Hive SQL, Spark SQLからOracle DBのデータにアクセス可能

• Hadoopからのデータ アクセスを並列化し、高速 かつセキュアに実現

32

Page 33: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

ライフサイクルを 見越したデータ管理をしたい

Copy to BDA

HadoopとRDBMSを もっと密に連携させたい

Page 34: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Copy to BDA(Oracle Big Data SQL機能)

データライフサイクルを見越した低コストでのデータ管理

Big Data Appliance Cloudera Hadoop

Exadata Oracle

Database

Copy Partition to

BDA

Oracle Big Data SQL

直近13ヶ月分のデータ

14ヶ月目 以降のデータ

ライフサイクルを見越したデータ管理をしたい

Copy to BDA

• ビジネス上重要なデータをExadataに保持

• 過去データをBDAに安価に保持

– Hadoop上でデータ分析を実施

– アーカイブデータによる非定形な クエリの実施

• 既存アプリケーションに改修の 必要なく、全てのデータにSQL でクエリ可能

SQL

34

Page 35: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

他システムとだって 密に連携したい

Oracle’s Big Data Integration Solutions

HadoopとRDBMSを もっと密に連携させたい

Page 36: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle’s Big Data Integration Solution データ連携、メタデータ管理、データガバナンス:ヘテロな環境にも対応可能

36

他システムとだって 密に連携したい

Oracle’s Big Data Integration Solutions

Oracle Data Governance Foundation Oracle Enterprise Data Quality

Oracle Enterprise Metadata Management with Business Glossary

Staging

Sqoop

HDFS

Hive

Flume

ETL Offload / Transformation

Data Streaming Kafka (MPP Pub/Sub)

Storm and Trident

Spark Streaming

HBase

Discovery Sandbox/s

R

Unst

ructu

red

Str

uctu

red

Oracle GoldenGate

Oracle Data Preparation

Oracle Data Integrator

Page 37: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

Cloudへの取り組み

Page 38: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Integrated Cloud: エンタープライズ向けの統一化されたプラットフォーム

38

Cloud On-Premises

DEVELOP AND DEPLOY ANYWHERE

同じ「アーキテクチャ」 同じ「オラクル製品」

同じ「知識・ノウハウ」

オンプレミスで培った高度な技術を セキュアなクラウド環境へ

Complete Open

Integrated Engineered

Complete Open

Integrated Engineered

オラクルのクラウド戦略

Page 39: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Cloud Service エンタープライズ向けビッグデータ活用環境をクラウドで

39

Big Data Cloud Service

高パフォーマンスかつセキュアな 最新の Hadoop の専有環境をご提供

必要に応じて柔軟なスケールアップ/ダウンも可能

高パフォーマンス な専有環境

オラクルの最新ビッグデータ活用製品も含有 単なるインフラ層のコストや管理コスト削減

だけでなく、ソフトウェアも含めたTCO削減が可能

ビッグデータ活用 のための製品も

含有

Oracle Big Data SQL Cloud Service により RDBMS, Hadoop, NoSQL にSQLでアクセス可能

クラウド上で総合的な ビッグデータ管理システムを実現

SQL一つで 全てのデータを

活用可能

Page 40: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Big Data + IoT環境をセキュアなクラウドでも活用可能

Big Data Cloud + IoT + SaaS + PaaS Cloud

Gateway software 2G/3G/LTE

ネットワーク

WWAN

Database

Hadoop

NoSQL

Big Data SQL

Big Data Discovery

SCM

ERP

Sales Marketing

HCM PLM

ファイアウォール

IoT Cloud Service Big Data

Cloud Service SaaS

Docs

Data Prep.

Java BI

Dev DB

Integ ration

Process Mobile

PaaS

IoT Cloud Service Gateway & SDKs

Device Virtualization

High Speed Messaging

Endpoint Management

Stream Processing

Event Store

Enterprise Connectivity

40

Page 41: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

本日のまとめ

Page 42: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

本日のまとめ

Hadoop活用の8+1つの勘所

42

Hadoop活用の障壁を もっと下げたい

HadoopとRDBMSを もっと密に連携させたい

構築・運用・管理を もっと簡単に、安く

もっと多くの人に開放、使ってほしい

もっと簡単に有益な データを見つけだしたい

Map Reduce処理を もっと簡単に構築したい

Oracle Big Data Appliance

Oracle Big Data SQL

Oracle Big Data Discovery

Oracle Data Integrator

両者間のデータ移動を もっと早く

Oracle Big Data Connectors

MapReduceからDBのデータを使いたい

Oracle Table Access for Hadoop and Spark

ライフサイクルを見越したデータ管理をしたい Copy to BDA

他システムとだって 密に連携したい

Oracle’s Big Data Integration

ビッグデータ/IoT環境をセキュアな クラウド環境で実行したい Oracle Cloud

Page 43: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

技術情報 お試し環境

ご紹介

Page 44: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

技術情報

• 各製品技術情報ページ

–Oracle Exadata

–Oracle Big Data Appliance

–Oracle Big Data Connectors

–Oracle Advanced Analytics

–Oracle Big Data Discovery

–Oracle NoSQL Database

–Oracle Spatial &Graph

–Oracle Big Data Spatial & Graph

–Oracle Data Integration

44

Page 45: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

ご参考資料

オラクル データベース インサイダー@IT

• いつものSQLでHadoop操作を。“フツーの会社”のための ビッグデータ活用基盤とは

• どこが違う? 何がうれしい? オラクルならではのビッグデータソリューション

• ビッグデータとIoTを組み合わせて使い、さらに高い価値を得る。 オラクルのソリューションが可能にしたベストプラクティス

• 日常業務の中で自然にアナリティクスを実践。 Analytics 3.0時代を加速するオラクルのビッグデータアナリティクス ソリューション

45

Page 46: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

• 事前設定済のオラクルビッグデータ製品の最新バージョンを インストール作業の必要なく、すぐに利用可能

• OTNサイトから無料でダウンロード

• サンプルデータ込、自己学習のための動画、 デモスクリプトも公開

• RDBMS、Hadoop、NoSQL、R、Spatial, Graph、 興味のある製品から、ビッグデータ活用の全体フローまで お好きな製品をローカルの仮想マシン環境上で

• 自己学習環境としてぜひお試しください

*自己学習用のサポート対象外製品です

*使用にあたっては、 License Agreementをよくお読みになり、同意の上、ご利用ください

*OTN Communityのフォーラムにも技術ディスカッションのスレッドがございます https://community.oracle.com/community/database/big_data

オラクルのビッグデータ製品が、仮想マシン環境上ですぐに無料でお試しできます!

Oracle Big Data Lite Virtual Machine のご紹介

ダウンロード先:http://www.oracle.com/technetwork/database/bigdata-appliance/oracle-bigdatalite-2104726.html

Page 47: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

オラクルのビッグデータ製品が、仮想マシン環境上ですぐに無料でお試しできます!

Oracle Big Data Lite Virtual Machine のご紹介

• Oracle Enterprise Linux 6.6

• Oracle Database 12c Release 1 Enterprise Edition (12.1.0.2)

– Oracle Multitenant, Oracle Advanced Analytics, Oracle OLAP, Oracle Partitioning, Oracle Spatial and Graph, and more

• Oracle Big Data SQL

• Cloudera Distribution including Apache Hadoop (CDH5.4.0)

• Cloudera Manager (5.4.0)

• Oracle Big Data Discovery 1.1

• Oracle Big Data Connectors 4.2

– Oracle SQL Connector for HDFS 3.3.0

– Oracle Loader for Hadoop 3.4.0

– Oracle Data Integrator 12c

– Oracle R Advanced Analytics for Hadoop 2.5.0

– Oracle XQuery for Hadoop 4.2.0

含まれる製品(Version 4.2.1) • Oracle NoSQL Database Enterprise Edition 12cR1

(3.3.4)

• Oracle Big Data Spatial and Graph 1.0

• Oracle JDeveloper 12c (12.1.3)

• Oracle SQL Developer and Data Modeler 4.1

• Oracle Data Integrator 12cR1 (12.1.3.0.1)

• Oracle GoldenGate 12c

• Oracle R Distribution 3.1.1

• Oracle Perfect Balance 2.4.0

• Oracle CopyToBDA 2.0

http://www.oracle.com/technetwork/database/bigdata-appliance/oracle-bigdatalite-2104726.html

Page 48: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

オラクルのビッグデータ製品が、仮想マシン環境上ですぐに無料でお試しできます!

Oracle Big Data Lite Virtual Machine のご紹介

48

1. Google “Big Data Lite”

2. Download the VM

3. Do the Tutorial

Page 49: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

オラクルのビッグデータ製品が、仮想マシン環境上ですぐに無料でお試しできます!

Oracle Big Data Lite Virtual Machine のご紹介 Hands-on Labs 自己学習用おすすめコース

Training Collateral 説明

Data Manipulation with Hive and Pig

まずはここから HiveやPigの基本的な操作が学べます

Analyze All Your Data with Oracle Big Data SQL

Oracle DBからHadoopに透過的なSQLアクセスを行うシナリオ。 Hadoopがよく分かってなくとも、DBの知識だけでなんとかなります。

Tame Big Data with Oracle Data Integration

HiveやSqoopはなんとなくわかってる人向け GUIでETLプロセスを定義できます。

Oracle R Enterprise v 1.4 - Tutorial Series

最近注目のRを始めてみたい方向け

etc

49

Page 50: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Agenda

最新イベントご紹介

Page 51: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

POCO (The Power Of Cloud by Oracle) を実現する 最新のクラウドテクノロジー/製品/サービス

その具体的な活用事例をご紹介します

2日間にわたり7つのサミットを開催

80 を超えるセッション

お客様によるビジネス変革の実例紹介

Oracle OpenWorld 2015 最新情報

詳細・お申し込み oracle.co.jp/clouddays

Page 52: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

クラウド時代でデータベースの開発、チューニング、アップグレード

などのエンジニアリング・ノウハウはどう変わったのか?

クラウド上で「使える実践的なノウハウ」をご紹介します

17:45~20:00 参加しやすい夕方からの開催

実践的な10の技術者向けセッション

Hadoop、機械学習、IoT、Java、Database、最新技術のノウハウをご紹介

詳細・お申し込み http://www.oracle.co.jp/events/ddd2015/

Page 53: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」

Copyright © 2015 Oracle and/or its affiliates. All rights reserved. |

Page 54: Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」