2
大量の実世界データから「今」を分析する ストリームデータ処理基盤 「uCosminexus Stream Data Platform」 実世界から絶え間なく流れ込んでくる膨大な情報をリアルタ イムに分析し、より迅速な意思決定やリスク管理、現場状況の 把握などに生かしたいという動きが本格化しています。金融業 界のトレンドとなったアルゴリズムトレードや、通信サービス分野 におけるSLA ※2 管理などの分野で適用が進みつつある「複合 イベント処理(CEP ※3 )」「イベントストリーム処理(ESP ※4 )」など の技術が注目されているのはこのためです。 現在、多くの企業で採用されているDBMS ※5 などのデータ 処理方式では、分析する情報を一度DBに格納した後、バッチ 処理などで一括して集計・分析を行うため、情報の発生から 集計・分析までには、どうしてもタイムラグが生じてしまいます。 これまでの一般的なビジネス用途では問題ありませんが、“いま 起きている事象”への即対応という新しい要求に対応するた めには、このタイムラグを極小化し、いかに“瞬発力を高める か”が最大のプライオリティーとなります。 そこで日立が開発したのが、CEPやESPの適用範囲をカ バーしながら、大量データを瞬時に分析することでビジネスに新 たな価値を創造する「ストリームデータ処理」という新技術です (図1) 日立のストリームデータ処理は、データ発生時に、あらかじめ 登録した「集計・分析シナリオ」に従って必要なデータを抽出 し、即座に結果を出力します。その 基盤製品となる「uCosminexus Stream Data Platform」(以下、 uCSDP)では、対象となるデータを 高速なメモリ上に展開した上で、 時系列データの中で必要な差分 計算のみを行う手法を採用してい ます。これにより、従来のDBMSに 対して二桁以上もの高速性を実 現するほか、分析済みのデータを HDDなどに蓄積しないため、スト レージ容量の削減にも貢献します。 このストリームデータ処理におい て最も特徴的なのが、多様な分析 ニーズに対応できる「集計・分析シ ナリオ」と、その定義を簡単に記述 できるスクリプト言語「CQL ※6 」の存 電子マネーやICカードによる電子決済、センサやRFID ※1 を利用した物流管理などが普及する中、 多様な実世界の情報が大量かつリアルタイムに情報システムへと流れ込んでいます。 これらのデータを瞬時に分析したいという市場ニーズに応えるため、 日立は継続的に発生するデータをDBに格納せず、メモリ上で高速処理するストリームデータ処理基盤を開発。 ビジネスに新たな価値をもたらす“瞬発力”を提供しています。 オープンミドルウェア ※1 Radio Frequency-Identification Service Level Agreement Complex Event Processing Event Stream Processing DataBase Management System ※2 ※3 ※4 ※5 11 はいたっく2011-6 瞬発力を実現するストリームデータ処理 集計・分析シナリオを記述が容易なCQLで定義 図1 瞬発力を実現するストリームデータ処理 複合イベント処理 (Complex Event Processing) イベントストリーム処理(Event Stream Processing) ネットワーク 稼働監視 稼働情報 ICカード 通信データ ストリームデータ処理 イベント通知 ダッシュボード(見える化) 出力結果 ①実世界の大量データ ②発生と同時に瞬時に分析 ③結果の見える化・通知 ストリーム データ処理 ストリームデータ処理の特徴 ①データを発生と同時にメモリ上で処理することで従来のDBMSに対して2桁以上高速 ②分析済データを蓄積しないことでストレージ容量を削減し大量データの高速処理を実現 ③データの発生時刻の概念を持つため、ログやセンサといった時系列データの処理に最適 事前登録 分析1 分析2 判定 分布/ 相関分析 集計・分析シナリオ OPEN MIDDLEWARE All Rights Reserved,Copyright ©2011,Hitachi,Ltd.

大量の実世界データから「今」を分析する ストリームデータ処理 … · におけるsla※2管理などの分野で適用が進みつつある「複合 イベント処理(cep※3)」「イベントストリーム処理(esp※4)」など

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

大量の実世界データから「今」を分析するストリームデータ処理基盤「uCosminexus Stream Data Platform」

 実世界から絶え間なく流れ込んでくる膨大な情報をリアルタイムに分析し、より迅速な意思決定やリスク管理、現場状況の把握などに生かしたいという動きが本格化しています。金融業界のトレンドとなったアルゴリズムトレードや、通信サービス分野におけるSLA※2管理などの分野で適用が進みつつある「複合イベント処理(CEP※3)」「イベントストリーム処理(ESP※4)」などの技術が注目されているのはこのためです。 現在、多くの企業で採用されているDBMS※5などのデータ処理方式では、分析する情報を一度DBに格納した後、バッチ処理などで一括して集計・分析を行うため、情報の発生から集計・分析までには、どうしてもタイムラグが生じてしまいます。これまでの一般的なビジネス用途では問題ありませんが、“いま

起きている事象”への即対応という新しい要求に対応するためには、このタイムラグを極小化し、いかに“瞬発力を高めるか”が最大のプライオリティーとなります。 そこで日立が開発したのが、CEPやESPの適用範囲をカバーしながら、大量データを瞬時に分析することでビジネスに新たな価値を創造する「ストリームデータ処理」という新技術です(図1)。

 日立のストリームデータ処理は、データ発生時に、あらかじめ登録した「集計・分析シナリオ」に従って必要なデータを抽出

し、即座に結果を出力します。その基盤製品となる「uCosminexus Stream Data Platform」(以下、uCSDP)では、対象となるデータを高速なメモリ上に展開した上で、時系列データの中で必要な差分計算のみを行う手法を採用しています。これにより、従来のDBMSに対して二桁以上もの高速性を実現するほか、分析済みのデータをHDDなどに蓄積しないため、ストレージ容量の削減にも貢献します。 このストリームデータ処理において最も特徴的なのが、多様な分析ニーズに対応できる「集計・分析シナリオ」と、その定義を簡単に記述できるスクリプト言語「CQL※6」の存

電子マネーやICカードによる電子決済、センサやRFID※1を利用した物流管理などが普及する中、多様な実世界の情報が大量かつリアルタイムに情報システムへと流れ込んでいます。これらのデータを瞬時に分析したいという市場ニーズに応えるため、日立は継続的に発生するデータをDBに格納せず、メモリ上で高速処理するストリームデータ処理基盤を開発。ビジネスに新たな価値をもたらす“瞬発力”を提供しています。

オープンミドルウェア

※1 Radio Frequency-Identification

Service Level AgreementComplex Event ProcessingEvent Stream ProcessingDataBase Management System

※2※3※4※5

11 はいたっく2011-6

瞬発力を実現するストリームデータ処理

集計・分析シナリオを記述が容易なCQLで定義

図1 瞬発力を実現するストリームデータ処理

複合イベント処理 (Complex Event Processing)イベントストリーム処理(Event Stream Processing)

ネットワーク

稼働監視

稼働情報ICカード

通信データストリームデータ処理 イベント通知

ダッシュボード(見える化)

出力結果

①実世界の大量データ ②発生と同時に瞬時に分析 ③結果の見える化・通知

ストリームデータ処理

ストリームデータ処理の特徴①データを発生と同時にメモリ上で処理することで従来のDBMSに対して2桁以上高速②分析済データを蓄積しないことでストレージ容量を削減し大量データの高速処理を実現③データの発生時刻の概念を持つため、ログやセンサといった時系列データの処理に最適

事前登録

分析1

分析2 判定

分布/相関分析

集計・分析シナリオ

OPEN MIDDLEWARE

All Rights Reserved,Copyright ©2011,Hitachi,Ltd.

在です。一般的なデータベース言語SQL※7を拡張したCQLは、汎用的な言語であるため誰にでも扱いやすく、幅広い業種に対応できます。CQLを連結することで、複雑な時系列処理も簡単に記述することが可能です。 また、シナリオベースであるため、集計・分析用のアプリケーション開発を行う必要もなく、シナリオをテキストファイルに定義し、uCSDPに登録するだけで使用できます。このため、開発効率が大幅に向上し、シナリオの追加・変更だけで分析内容の変化に柔軟に対応できます。 uCSDPに加えて、実世界データを活用したモニタリングを実現する入出力アダプターや、集計・分析結果表示用の環境設定機能などのアプリケーションフレームワークも提供されるため、短期間で容易にシステム導入が行える点も大きな魅力といえます(図2)。

 ストリームデータ処理は、大量のフローデータを瞬時に分析することで、「いつもと違う」現象の変化を即座に検知できるソリューションです。このため、不正アクセスや機密ファイルのダウンロードなどをリアルタイムに検知・ブロックする「コンプライアン

スチェック」のほか、株価や出来高の解析により売買注文を自動化する「アルゴリズムトレード」、GPS端末のセンサ情報を利用したリアルタイム位置情報監視による「渋滞検出」、人の滞留状態に合わせて広告内容を瞬時に切り替える「デジタルサイネージ」など、幅広い分野への応用が期待されています。 もちろん、RFIDデータを活用したリアルタイムな物流管理や流通トレーサビリティ、大量のログ情報解析による業務システムのモニタリングなども得意分野の1つです。例えば、仮想化やクラウドの進展でシステム構成が一段と大規模化・複雑化しているITシステムの稼働監視に適用すれば、膨大なログの中から正常時とは異なる障害発生の予兆を検知できるため、障害が起こってからの対応ではなく、障害を未然に防ぐことでダウンタイムを最小化する、文字どおりの“プロアクティブな予防保守”が恒常的に可能となります。 このように、データの流れを瞬時に分析し、必要なアクションを即座に実行できる“瞬発力”の高さは、まさにストリームデータ処理ならではの大きなビジネスバリューといえます。 現在、あらゆる業務分野において、より鮮度の高いデータに基づいた迅速な意思決定や状況分析、リアルタイム監視によるリスクマネジメント、スピードを付加価値とした新ビジネスの創出が強く求められています。その意味でも、ストリームデータ処理の可能性は今後さらに拡大し、従来のDBMSと並ぶ新たなメインストリームの技術へと進化していくことは間違いありません。

お問い合わせ先

HMCC(日立オープンミドルウェア問い合わせセンター)  0120-55-0504利用時間 9:00~12:00、13:00~17:00(土・日・祝日・弊社休日を除く)携帯電話、PHS、一部のIP電話など上記フリーダイヤルがご利用いただけない場合TEL (03)5439-2733

■ 情報提供サイト  http://www.cosminexus.com/  http://www.hitachi.co.jp/cosminexus/

Continuous Query LanguageStructured Query Language

※6※7

12はいたっく2011-6

データの活用範囲を飛躍的に拡大させ新たな価値を創出

図2 ストリームデータ処理によるWebシステム稼働監視の例

●この記事は、はいたっく別冊「Open Middleware Report vol.54」に掲載されたものです。

uCosminexusApplication Server

HiRDB

JP1

システムメッセージ

システム稼働ログ

システム稼働監視

障害の未然防止

大量のログ情報を活用して、Webシステムを安定稼働させたい

ポイント・ 既存システムのログ情報を二次活用することで、既存システムに影響を与えずに、高度なリアルタイム稼働監視を実現・ 稼働監視の自動化、障害発生の未然防止により、運用コストを低減

ログ

ログメッセージ

パケットデータ

既存システム 連携システム

出力ストリーム利用AP

データ分析サーバ

JP1イベント生成

分析対象データ・ メッセージ出力数や出力パターンから障害発生の予兆や障害復旧を検知・ 過去統計値とリアルタイム統計値の比較によって、正確に状況を判断

分析結果活用

分析結果活用

既存データを二次活用 データ量に応じたサイジング

入力ストリーム生成AP

uCosminexus Stream Data Platform

分析シナリオ

大量データの高度な分析を高速に実現

OPEN MIDDLEWARE

All Rights Reserved,Copyright ©2011,Hitachi,Ltd.