27
Oracleホワイト・ペーパー 20109Oracle Data Mining 11g Release 2 データベース内分析での競争

Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracleホワイト・ペーパー

2010年9月

Oracle Data Mining 11g Release 2

データベース内分析での競争

Page 2: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

免責事項

以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、情報提供を

唯一の目的とするものであり、いかなる契約にも組み込むことはできません。マテリアルやコード、

機能を提供することをコミットメント(確約)するものではないため、購買決定を行う際の判断材

料になさらないで下さい。オラクルの製品に関して記載されている機能の開発、リリース、および

時期については、弊社の裁量により決定いたします。

Page 3: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

概要 ..................................................................................................................................... 1

データ・マイニングにおけるトップ企業との評価を獲得したオラクル ....................... 2

データベース内データ・マイニング .................................................................................. 2

Oracle Data Miningのおもな利点 .................................................................................. 4

はじめに .............................................................................................................................. 5

Oracle Data Mining ........................................................................................................ 5

データ・マイニングによる詳細な分析 .............................................................................. 7

Oracle ExadataとOracle Data Mining ................................................................................. 9

データ・アナリストにとってのOracle Data Mining ........................................................ 16

アプリケーション開発者にとってのOracle Data Mining ................................................. 17

データベース内分析での競争 ........................................................................................... 19

単なるツールを超えた、予測を可能にするアプリケーション ................................... 20

コスト削減 ........................................................................................................................ 22

重複データと従来型分析サーバーの排除 .................................................................... 23

結論 ................................................................................................................................... 23

Page 4: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

1

概要

Oracle Data Miningオプションは、Oracle Databaseで機能する強力なデータ・マイニングを提供し

ます。このオプションを使用すれば、データの中に隠されていた新たな事実を発見したり、Oracle

Databaseテクノロジーへの投資を活用したりすることができます。つまり、最優良顧客の絞り込み

に役立つ予測モデルの構築および適用、詳細な顧客プロファイルの開発、不正行為の検出および防

止ができるのです。Oracle Data Miningは分析面での競争力を高めるのに役立ちます。

「一部の企業は、データを収集、分析、活用する能力を土台にして事業そのものを構築している。...多数の組織が分

析を取り入れているが、分析力をこのレベルまで高めている組織はほんの一握りにすぎない。しかし、分析力を武器

とする競合企業は、コンシューマ製品、金融、小売り、旅行/娯楽などのさまざまな分野でトップになっている」

—Tom Davenport、『分析力を武器とする企業』著者

Page 5: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

2

データ・マイニングにおけるトップ企業との評価を獲得したオラクル

独立系調査会社のForrester Researchが2010年2月に発表したレポートの中で、オラクルは予測分析

およびデータ・マイニング(PA/DM)におけるトップ企業であるとされています。著者であるSenior

AnalystのJames G. Kobielusは、『The Forrester Wave™: Predictive Analytics And Data Mining

Solutions, Q1 2010』の中で、「オラクルは、さまざまな顧客に採用されている自社のDBMSプラッ

トフォーム、データウェアハウス・プラットフォーム、データ統合プラットフォーム、およびBIプ

ラットフォームにPA/DMソリューション・ポートフォリオを搭載し、あらかじめパッケージされた

さまざまな予測アプリケーションを提供している。また、複雑な構造化情報や非構造化情報のマイ

ニングに使用できるアルゴリズムを豊富に提供している」と述べています。

また、「オラクルが力を入れているのは、Oracle Databaseでのデータベース内マイニング、Oracle

DatabaseカーネルへのOracle Data Miningの統合、オラクルのブランドが付けられたアプリケーション

でのマイニング・テクノロジーの活用だ。オラクルの現行製品のおもな差別化要因は、DBMSに統合さ

れたデータ準備ツール、半構造化情報と非構造化情報の統合、テキスト分析、戦略マップ、アンサン

ブル・モデリング、チャンピオン-チャレンジャー・モデリング、感情分析、ソーシャル・ネットワー

ク分析、多岐にわたる統計アルゴリズムと変数選択方式のサポートである」とも述べています。

データベース内データ・マイニング

Oracle Data Miningを使用すると、高度なビジネス・インテリジェンス用のセキュアかつスケーラブ

ルな単一プラットフォームであるOracle Databaseですべての処理が行われます。また、Oracle Data

Miningは、ビジネス・インテリジェンスのブレークスルーです。従来の統計ソフトウェアの場合は

データを抽出してサーバーを分ける必要があり、安全性が低くなるとともにメンテナンスにコスト

がかかる可能性がありますが、Oracle Data Miningの場合は、データの格納場所であるデータベース

内部にさまざまなマイニング機能が組み込まれます。また、SQLを組み合わせれば、デ―タの移動

や複製は不要になり、セキュリティが維持されるとともに、最小限の待機時間で生データから有益

な情報が得られます。

Oracle Data Miningを使用すると、以下のことを実現できます。

Page 6: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

3

データの活用による、パターンや有益な新事実の発見

予測モデルの構築および適用と、ダッシュボードやアプリケーションへの予測モデルの埋込み

コスト削減

Oracle Data Miningは従来の統計ソフトウェアよりかなり低価格です。Oracle Databaseの機能の1

つであるOracle Data Miningを採用することで、総所有コストが削減されます。

Oracle Data Miningを使用すると、データ移動およびデータ複製が不要になり、セキュリティ上の危険がなくなります。

Page 7: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

4

Oracle Data Miningのおもな利点

Oracle Data MiningをOracle DatabaseのSQLカーネル内部でネイティブに実行することで、ユーザーは

次の利点を享受できます。

業界トップのパフォーマンスと信頼性を誇るOracle Database内部のデータのマイニング

データ抽出およびデータ移動の排除

分析に基づくデータベース・アプリケーション用のプラットフォームの準備

データベースのセキュリティ・オプションの活用によるセキュリティ強化

従来のデータ・マイニング・ベンダーより大幅に低い総所有コスト(TCO)の実現

進歩を続けるOracle Databaseテクノロジーの30年以上におよぶ実績の活用

Oracle Data Miningを使用すれば、"最上位顧客は誰か"、"もっとも売れている製品はどれか"、"もっ

ともコストが高い場所はどこか"といった質問に回答する標準的なBIツールやOLAPツール以上のこ

とができます。データ・マイニングを実行すると、データが自動的に絞り込まれ、事業経営の改善

に役立つパターンや事実が浮き彫りにされます。競争の激しい今日の市場にあっては、もっとも貴

重な企業資産、つまりデータを管理する必要があります。さらには、競争優位性を確保するために

データを活用する必要があります。活用しない場合は、競合他社が実行することになるでしょう。

Oracle Data Miningを使用して、以下の戦略を実装できます。

選択した顧客グループの把握と絞り込み

マーケティング・キャンペーン実施のための詳細な顧客プロファイルの開発

顧客離れおよび顧客減尐の予測および防止

有望な抱合せ販売およびアップセルのチャンスの識別

コンプライアンス違反および不正の可能性の検知

新しいクラスタまたは顧客セグメントの検出

マーケットバスケット分析の実行による、頻繁に同時発生する項目の検出

Page 8: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

5

「簡潔に言うと、データ・マイニングを使用する目的は、データに[隠されている]パターンと関係を発見し、ビジネス上の意思決定の向上を支援するこ

とにある」

-- Two Crows Corporation、Herb Edelstein

はじめに

従来のビジネス・インテリジェンス(BI)レポーティング・ツールは、過去に発生したことについ

て報告します。OLAPには、さらに詳細な情報まで迅速にドリルスルーする機能や、情報をまとめて

集計する機能があり、集計レベル予測機能が付いている場合もあります。優れたBIツールまたは

OLAPツールと優れたアナリスト、それに十分な時間があれば、いつかは必要な情報が見つかります。

しかし、"いつか"はとてつもなく長い時間を意味することもあります。たとえば無限の猿定理による

と、猿がでたらめにタイプライターのキーを叩き続ければ、いつかはシェークスピア全集が書き上

げられるとされています。

コンピュータ・サイエンスと機械学習が進歩したおかげで、データ・マイニングが可能になりまし

た。データ・マイニングで使用できる新しいアルゴリズムを使用すると、個々のレコードという深

いレベルでデータを自動的に絞り込んで、パターン、関係、要素、クラスタ、関連性、プロファイ

ル、予測といった、これまでは"隠されていた"情報を発見できます。

Oracle Data Miningという、Oracle Databaseに埋め込まれた機械学習アルゴリズムの集合体を使用すれ

ば、新たな事実、セグメントおよび相関の発見、より正確な予測、重要な変数の検出、異常の検知、

データからのより多くの情報の抽出が可能です。たとえば、最優良顧客を分析することで、最優良

顧客になりそうな顧客を特定するプロファイルが分かり、その予測分析をアプリケーションに埋め

込んだりすることができます。このような顧客は、現在はもっとも大切な顧客ではないかもしれま

せんが、現在の最優良顧客のプロファイルと一致します。Oracle Data Miningを使用すれば、予測モ

デルを適用して、もっとも有望な顧客を浮き彫りにするレポートやダッシュボードをマーケティン

グ部門や販売部門のために生成したり、コール・センターの担当者のためにリアルタイム予測を作

成したりできます。今後優良顧客になる可能性がある顧客とそうでない顧客を把握したり、解約し

そうな顧客またはセール情報に反応を示しそうな顧客を予測したりすることで顧客の"戦略的価値"

を知り、この情報を適切なタイミングで業務に統合することが、分析力で競争に勝つための鍵とな

ります。

Oracle Data Mining

Oracle Data MiningはOracle Database Enterprise Editionのオプションで、数多くの最新の機械学習アル

ゴリズムがこのオプションによりOracle Database内部に配置されます。Oracle Data Mining機能は

Oracle Databaseカーネルにネイティブに配置されるため、圧倒的なパフォーマンス、スケーラビリ

ティおよびセキュリティがもたらされます。データとデータ・マイニング機能はデータベースから

切り離されないため、包括的なデータベース内処理ソリューションが実現します。

Page 9: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

6

Oracle Data Mining 11g Release 2は、分類、回帰、相関ルール、クラスタリング、属性評価、および特

徴選択の問題に対応できる12種類のデータベース内マイニング・アルゴリズムをサポートしていま

す。Oracle Textは、標準SQLを使用してOracleデータベースやファイル、Web上に保存されたテキス

トおよびドキュメントの索引付け、検索、および分析を実行する機能ですが、Oracle Data Miningの

マイニング機能と連動させると、構造化データと非構造化(テキスト)データの両方をマイニング

できます。

Oracle Data Miningには、モデル構築機能およびモデル・スコアリング機能を使用するためのPL/SQL

アプリケーション・プログラミング・インタフェース(API)とJava APIが用意されています。マウ

スで操作できるGUIの使用を希望するデータ・アナリストのために、オプションのOracle Data Miner

グラフィカル・ユーザー・インタフェース(GUI)がOTNからダウンロードできるようになっていま

す。Oracle Spreadsheet Add-In for Predictive Analyticsをインストールすると、予測分析のPL/SQLパッ

ケージがMicrosoft Excel内に実装されます。アドインのインストールにより、スプレッドシート環境

内で自動予測分析機能が有効化されます。Oracle Data Miningグラフィカル・ユーザー・インタフェー

スとAPIは、データ・アナリストやアプリケーション開発者がデータ・マイニングの結果をBIダッシュ

ボードや企業アプリケーションに提供するときに使用する分析プラットフォームになります。

ビジネス・インテリジェンスの対象範囲

ここでは、データ・マイニングの概要と他のビジネス・インテリジェンス・ツール(問合せおよび

レポート・ツール、OLAPツール、統計ツール)との相違点および補完関係について説明します。ビ

ジネス・インテリジェンス・ツールの一般的な定義も取り上げます。

図1 BI、OLAP、統計およびOracle Data Mining。Oracle Data Miningは、これまでデータに隠されていた新たな事実が自動的に発見される点と予測

機能がある点で、問合せおよびレポート(BI)ツールやOLAPツールと異なります。

Page 10: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

7

BIツールや問合せおよびレポート・ツールは、データベースまたはデータウェアハウスからの情報

取得を支援します。これらのツールは、"過去3年の間にミューチュアル・ファンドを購入したのは誰

か"といった質問に回答する場合に効果的です。

OLAPツールには初歩的なBIツールより多くの機能があり、さらに詳しい情報や、比較、要約、予測

を求めてすばやくインタラクティブにデータを"ドリルダウン"できます。OLAPは、"ミューチュア

ル・ファンドの購入者の年度別および地域別の平均所得はどれくらいか"といった質問に対応する詳

細なドリルダウンに効果的です。

統計ツールは、大量のデータから抽出された代表的なサンプルから結論を出すために使用されます。

"尐量から中程度"の量のデータからパターンと相関関係を発見する場合には便利ですが、データ量が

ツールの能力を超えかかると、従来の統計手法では処理が難しくなります。統計ツールではすべて

のデータを分析できないため、データ・アナリストは、代表的なデータ・サンプルを使用したり分

析から入力変数を排除したりせざるを得ません。ただし、入力変数を排除したり小規模なデータ・

サンプルを使用したりすると、貴重な情報を破棄することになります。

Oracle Data MiningはOracle Databaseのカーネルで実行されるため、この制約は受けません。この10年

間に開発された機械学習技術を使用して、データに隠されているパターンや関連性を自動的に検出

します。また、データを詳細に分析し、データからパターンを発見します。Oracle Data Miningは、

詳細な事実の提供や"今後6カ月の間にミューチュアル・ファンドを購入するのは誰か。またその理由

は何か"といった個別の予測に効果的です。

データ・マイニングによる詳細な分析

Oracle Data Miningには、さまざまなビジネス上の問題や技術的な問題に対処できるように設計され

た多数のデータ・マイニング・アルゴリズムが用意されています。得意な分析の種類は、アルゴリ

ズムによって異なります。Oracle Data Miningは、分類、回帰、クラスタリング、相関、属性評価お

よび特徴抽出の問題に対応しています(すべてのアルゴリズムの一覧は、9ページの表「Oracle Data

Mining 11g Release 2のアルゴリズム」を参照してください)。

「必要なデータの判定には順序がある。すべてのデータを列挙してどれが重要かを決めるというやり方は間違っている。解決策か

ら開始して、明確な問題定義、調査およびモデルの移入に必要なデータの抽出の順にさかのぼるのが正しいやり方である」

— James Taylor、Neil Raden、『Smart (Enough) Systems』著者

データ・マイニング・プロセス

データ・マイニングは、解決したい問題を定義してから開始する必要があります。また、もっとも

大切なのは、解決策の発見に役立つ適切なデータを収集することです。適切なデータがない場合は

取得する必要があります。データ・マイニングの方法が適切でないと、"ガベージイン-ガベージアウ

ト"になる可能性があります。データ・マイニングを効果的なものにするには、通常、次の4ステップ

のプロセスに従います。

Page 11: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

8

ビジネス上の問題の定義

これがもっとも重要なステップです。このステップでは、各分野の専門家が、"どうすれば製品の売

上げを伸ばすことができるか"といった抽象的なビジネス目標を、"製品Aを購入する可能性がもっと

も高いのはどの顧客か"のような明白で実用的なデータ・マイニング問題文に変換する方法を決定し

ます。製品Aを購入する可能性がもっとも高い顧客を予測するモデルを構築するには、まず、過去に

製品Aを購入した顧客を描写するデータを取得する必要があります。その後、マイニング用のデータ

の準備を開始できます。

データの収集と準備

ここでは、データを詳しく調べ、ビジネス上の問題に適切に対処するうえで必要になる可能性のあ

るその他のデータを特定します。ほとんどの場合は、ある程度のデータ・サンプルを調査すること

から始めます。たとえば、統計的な概要やヒストグラムを見て、数千件、場合によっては数百万件

のうちの数百件を調査します。なんらかのデータ変換を実行し、隠れた情報を表面に引き出してマ

イニングに使用できるようにすることもあります。たとえば、"Date_of_Birth"フィールドを"AGE"

フィールドに変換したり、既存のフィールドから"No_Times_Amt_Exceeds_N"などの新しいフィール

ドを導出したりします。SQLを活用すれば、このプロセスは簡略化できます。

モデルの構築と評価

これで、データを絞り込んでパターンを発見するモデルの構築準備が整いました。通常は複数のモ

デルを構築し、それぞれで異なるマイニング・パラメータを使用してから、最適またはもっとも有

効なモデルを見つけ出します。

知識の配置

Oracle Data Miningによって、データから見つかった関連性を使用するモデルが構築されたらそれを

配置して、マネージャー、コール・センターの担当者、経営者などのユーザーがそのモデルを使用

して新たな事実を発見したり予測を生成したりできるようにします。Oracle Data Miningの組込み

データ・マイニング・アルゴリズムを使用すると、データベース内のデータにモデルを移動(リラ

イト)する必要や、データベース外部に配置されている予測モデルを使用してスコアリングをする

ために、スコアリングされていない大量のレコードを抽出する必要がなくなります。Oracle Data

Miningは、高度なビジネス・インテリジェンス・アプリケーションの構築および配置に使用できる

理想的なプラットフォームです。

Page 12: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

9

データ・マイニング・プロセスには、ビジネス問題の定義、データの収集および準備、マイニング・モデルの構築および評価、

モデルの適用、および新しい情報の伝達という一連の手順が含まれます。

Oracle ExadataとOracle Data Mining

Oracle Exadataは、データウェアハウスの問合せパフォーマンスを10倍以上に向上させることができ

る高パフォーマンス・ストレージのソフトウェア製品とハードウェア製品のシリーズです。Oracle

Database 11g Release 2のOracle Data Miningスコアリング機能は記憶域レイヤーで実行されます。巨大

なデータセットを超高速でマイニングできるため、すでにOracleのデータベース内分析により獲得さ

れている競合優位性が一段と増大します。

Page 13: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

10

さまざまな最新アルゴリズム

Oracle Data Miningには、さまざまなタイプのビジネス上の問題や技術的な問題を解決するための一

連のデータ・マイニング手法とアルゴリズムが用意されています。

Oracle Data Mining 11g Release 2のアルゴリズム

手法 適用性 アルゴリズム

分類

分類手法では、履歴データを使

用して、新しいデータの分類お

よびクラス・メンバーシップ(0

または1など)またはクラス値

(数値)の予測に使用できるモ

デルを構築します。

ロジスティック回帰( GLM)—Oracle

Database内に配置されている一般的な統計

手法。数千件の入力変数、テキスト・デー

タ、トランザクション・データをサポート

します。

Naive Bayes—高速かつ簡潔で、幅広く適用

可能

サポート・ベクター・マシン—2項問題と多

クラス問題をサポートする最新のアルゴリ

ズム。トランザクション・データや遺伝子

発現データ分析といった、浅いながらも範

囲が広く、ネストされているデータの問題

の処理にも長けています。テキスト・マイ

ニングのユースケースをサポートします。

ディシジョン・ツリー—さまざまな分類問

題に役立つ一般的なアルゴリズム。判読可

能な"If…. Then…"ルールを使用してモデ

ルのロジックを説明できます。

回帰

顧客の生涯価値、住宅の価値、

プロセスの歩留まりといった

連続的な数値の結果を予測す

るための手法

重回帰(GLM)—Oracle Database内で使用で

きる一般的な統計手法。数千件の入力変数、

テキスト・データ、トランザクション・デー

タをサポートします。

サポート・ベクター・マシン—回帰問題に

対応した最新のアルゴリズム。テキスト・

マイニングおよびトランザクション・デー

タのユースケースをサポートします。

属性評価

ターゲット属性との関連性の

強さに従って属性を評価しま

例:オファーに反応する人に関

係している要因の検出

最小記述長—各属性がターゲット・クラス

の単純な予測モデルとみなされます。属性

評価アルゴリズムでは、ターゲット属性に

もっとも影響する属性が検出されます。

Page 14: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

11

異常検出

正常値からの外れ具合に基づ

いて異常なケースや疑わしい

ケースを識別します。一般的な

例には、医療保険詐欺、経費報

告書偽造、タックス・コンプラ

イアンスなどがあります。

1クラス・サポート・ベクター・マシン—"

正常なケース"を基準にしてモデルを構築す

る教師なし学習手法。この手法を適用した

場合は、"正常"でない可能性がある異常な

ケースにフラグが付けられます。

クラスタリング

データを分析し、データ内で自

然に発生するグループを検出

するときに有効です。あるクラ

スタに含まれるメンバーは、別

のクラスタに含まれるメン

バーよりも、メンバー同士が類

似しています。一般的な例に

は、新しい顧客セグメントの検

出やライフサイエンス上の発

見などがあります。

拡張k-Means—テキスト・マイニング、階層

的クラスタリング、距離ベースをサポート

します。

直行パーティショニング・クラスタリング

—階層的クラスタリング、密度ベースをサ

ポートします。

相関

頻繁に同時発生する項目と関

連しているルールを見つけま

す。マーケットバスケット分

析、抱合せ販売、根本原因分析

に使用されます。製品のバンド

ル化、店舗内配置の決定、欠陥

分析に役立ちます。

Apriori— 業界標準のマーケットバスケット

分析。

特徴抽出

既存の属性の線形結合として、

新しい属性を生成します。テキ

スト・データ、潜在的なセマン

ティックの分析、データ圧縮、

データ分解、パターン認識に適

用できます。

Non-negative Matrix Factorization(NMF)—

同じ情報を表現する新しい属性を、より尐

ない属性で作成します。

教師あり学習アルゴリズム

ほとんどのデータ・マイニング・アルゴリズムは、教師あり学習または教師なし学習のデータ・マ

イニング技術に分類できます。教師あり学習を使用する場合は、想定されるクラスの例(0/1、Yes/No、

高/中/低など)を使用して、データ・アナリストがターゲットの属性または従属変数を確認する必要

があります。その後、従属属性の異なるクラスの分離に役立つ可能性のあるパターンおよび関係が、

独立した属性(予測子)の間に存在するかどうか、データを絞り込んで発見します。

Page 15: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

12

たとえば、新車の購入に興味を示す可能性がもっとも高い人を抽出するときにマーケティング部門

と販売部門で使用できる予測モデルを構築するとします。ターゲット属性は、各顧客の自動車購入

実績を示す列(例:購入実績のある人は"1"、ない人は"0")になるでしょう。監視ありデータ・マイ

ニング・アルゴリズムでは、データを絞り込んでパターンを検索し、絞り込まれたデータから検出

される関係性を取得するデータ・マイニング・モデルを構築します。通常、教師あり学習技術の場

合、データは2つに分離されます。1つはモデルのトレーニング用で、もう1つはモデルのテストおよ

びモデルの評価に使用するサンプルの提供用です。結果(車を購入した顧客と購入していない顧客)

がすでに分かっているため、提供されたサンプルにOracle Data Miningの予測モデルを適用し、モデ

ルの精度を評価してモデルの実用性を判断できます。条件を満たす予測機能を備えたOracle Data

Miningモデルには、高い経済的価値があります。Oracle Data Miningを使用して対処できる一般的な

ビジネス課題は、ほとんどが2項と多クラスの分類問題で表現されるもので、データベース・マーケ

ティング、反応と販売オファー、不正検出、収益性の予測、顧客プロファイリング、信用評価、解

約予測、在庫要件、障害予測などが含まれます。また、Oracle Data Miningは、モデルの正確性と"リ

フト"(単純な推論よりも予測モデルを使用した方が多くの利点がある)の観点からモデルを評価す

るユーティリティを提供します。

Naive Bayes

Naive Bayes(NB)は分類と予測に使用される教師あり学習技術で、Oracle Data Miningはこれをサポー

トしています。Naive Bayesアルゴリズムは条件付き確率に基づいています。このアルゴリズムでは、

Bayesの定理という、履歴データに含まれる値および値の組合せを数えて確率を求める計算式を使用

します。Bayesの定理では、すでに発生している別のイベントの確率を前提として、あるイベントの

発生確率を見つけます。Bが従属イベントを、Aが事前イベントを表す場合、Bayesの定理は次のよう

に表すことができます。

Bayesの定理:Prob(B given A) = Prob(A and B)/Prob(A)

Aを前提としたBの確率は、AおよびBが同時に発生するケースの数を、Aが単独で発生するケースの

数で割って求めます。

Oracle Data Miningを使用してNBモデルを構築した後、そのモデルを使用して予測を実行できます。

アプリケーション開発者は、Oracle Data Miningモデルを統合して次のようなさまざまな用途の分類

および予測を実行できます。

特定の製品を購入する可能性のある顧客またはマーケティング・キャンペーンに反応する可能性

のある顧客の識別

3,000ドル以上消費する可能性がもっとも高い顧客の識別

解約する可能性のある顧客の識別

Naive Bayesは、迅速なモデルの構築およびスコアリングに対応し、2項と多クラスのどちらの分類問

題にも使用できます。オプションの実行方法としてNB交差検証がサポートされています。これを使

用すると、データのある一部を使用してモデルを構築し、別の一部を使用してモデルをテストする

のではなく、モデルの構築に使用したデータと同じデータを使用してモデルの精度をテストできま

す。データの一部をテスト用に退避させておく必要がない点は、構築データの量が比較的尐ない場

合に特に有益です。

Page 16: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

13

ディシジョン・ツリー

Oracle Data Miningは、一般的な分類ツリー・アルゴリズムをサポートしています。Oracle Data Mining

のディシジョン・ツリー・モデルには、信頼度、支持度、分岐条件をはじめ、各ノードの情報がす

べて含まれます。各ノードの完全なルールを表示できます。また、モデルを欠損値のある事例に適

用する場合の代替値として使用される代替属性が各ノードに提供されます。

サポート・ベクター・マシン

Oracle Data Miningのサポート・ベクター・マシン(SVM)アルゴリズムは、2項および多クラスの分

類、予測、および回帰モデル、つまり継続的なターゲット属性の予測をサポートします。SVMは、

非常に多くの独立した属性がありながら非常に制限された数のデータのレコードまたは監視結果し

か存在しない問題に隠されているパターンの発見に特に効果的です。

SVMモデルを使用して、1人あたり数千の遺伝子発現測定結果を持つ100人の患者だけのゲノム・デー

タを分析できます。SVMを使用すると、遺伝プロファイルに基づいて病気の治療結果を予測するモ

デルを構築できます。

一般化線形モデル(ロジスティック回帰および重回帰)

Oracle Data Mining 11g Release 2から、一般化線型モデル(GLM)という、多目的に使用できる一般

的な統計アルゴリズムがサポートされるようになりました。Oracle Data Miningは、分類(2項ロジス

ティック回帰)および回帰(多変量線形回帰)の2つのマイニング機能としてGLMをサポートします。

GLMはパラメトリック・モデリング手法です。パラメトリック・モデルでは、データの分散を仮定

します。仮定が満たされる場合は、パラメトリック・モデルの方がノンパラメトリック・モデルよ

りも効率的になります。

Oracle Data MiningのGLM実装では、モデルの質のさまざまな診断と信頼限界を使用した予測が提供

されます。

Page 17: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

14

Oracle Data Miningは、回帰および分類の両マイニング機能に対してリッジ回帰をサポートしていま

す。データに単一性(正確多重共線性)が検出されると、自動的にリッジ回帰が使用されます。Oracle

Data MiningがサポートしているGLMには、数百から数千の入力属性を処理できる機能が追加されて

います。従来の外部統計ソフトウェア・パッケージの入力属性は通常10~30に制限されています。

属性評価

Oracle Data Miningの属性評価アルゴリズムを使用すると、ターゲット属性にもっとも影響する属性

を識別できます。多くの場合、もっとも影響する属性を識別すると、ビジネスの理解や管理の向上

に役立ち、モデリング・アクティビティの簡素化に効果的な場合があります。また、これらの属性

では、モデルの拡張用にデータに追加するデータのタイプを指定できます。

属性評価を使用して、製造部品の品質の予測にもっとも関連するプロセスの属性、解約に関連する

要素、または特定の病気の治療にもっとも関連する可能性がある遺伝子を発見できます。

教師なし学習アルゴリズム

教師なし学習では、アルゴリズムのターゲット属性を指定しません。相関およびクラスタリング・

アルゴリズムなどの教師なし学習技術は、ターゲット・フィールドを仮定しません。代わりに、デー

タ・マイニング・アルゴリズムを使用して、Apriori定義されたビジネス目標とは独立して、データ

の関連性およびクラスタを検索できます。

クラスタ化

Oracle Data Miningは、データの母集団の中で自然に発生するグループを識別するため、拡張k-Means

および直交パーティショニング・クラスタリング(O-Cluster)の2つのアルゴリズムを提供します。

Oracle Data Miningの拡張k-Means(EKM)アルゴリズムおよびO-Clusterアルゴリズムは、データの母

集団内で自然に発生するグループの識別をサポートします。Oracle Data MiningのEKMアルゴリズム

は、階層的クラスタリングをサポートし、量的属性および質的属性を処理します。また、母集団を

ユーザーが指定した数のクラスタに分割します。

Oracle Data MiningのO-Clusterアルゴリズムは、量的属性および質的属性を処理し、最適なクラスタ定義

を自動的に選択します。両方のアルゴリズムで、Oracle Data Miningは、クラスタの詳細情報、クラス

タ・ルール、クラスタの中央値を提供します。また、クラスタ・メンバーシップの母集団を"スコアリ

ング"するためにOracle Data Miningを使用できます。たとえば、拡張k-Meansクラスタリングは、新しい

顧客層の発見や、病気にかかっている人の母集団内のサブグループの把握に使用できます。

相関ルール(マーケットバスケット分析)

Oracle Data Miningの相関ルール(AR)は、データ内の同時発生する項目またはイベントを検出しま

す。一般的に"マーケットバスケット分析"と呼ばれるARは、項目のペア、3項目の組、4項目の組な

どの組合せの数をカウントして、パターンを発見します。相関ルールは、前提部と結論部の形式で

結果を表します。多くのルールが発見されますが、たとえば、"前提部がミルク、パン、ジャムの場

合、結論部のバターが予想される(信頼度が78%、支持度が12%)"というARルールがあるかもしれ

ません。簡単な表現に変換されていますが、この場合、マーケットバスケットで最初の3つの項目が

使用されている場合、4つ目の項目が存在する可能性が高く(78%の信頼度)、この組合せが調査対

象のすべてのマーケットバスケットの12%に存在することを示しています。このように検出された関

連性または"ルール"は、特別な販売促進、製品のバンドル、および店舗のディスプレイを設計する場

合に役立ちます。

Page 18: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

15

ARを使用すると、障害イベントに関連する製造部品および備品の設定、特定の結果に関連する患者

と薬の属性、項目Aを購入した人が購入する可能性がもっとも高い品目または製品を検出できます。

異常検出

Oracle Data Mining 10g Release 2から、異常検出の新しいマイニング・アプリケーションがサポートさ

れるようになりました。つまり、事例がほとんどあるいはまったく入手できない場合に"レアケース"

が検出されます。Oracle Data Miningは、分かっているクラスが1つだけの場合でも、データを"正常"

と"異常"に"分類"できます。Oracle Data Miningはサポート・ベクター・マシン・アルゴリズムの特殊

ケースを使用して、既知のケースのモデルを作成します。モデルが一般的な母集団に適用される場

合、プロファイルに適合しないケースは、異常(異常または疑わしいケース)としてフラグが付け

られます。Oracle Data Miningの異常検出アルゴリズムは、ほとんど発生しないケースを大量のデー

タの中から見つけ出すといった、干し草の山の中から針を見つけるような処理に極めて効果的です。

特徴抽出

Oracle Data MiningのNonnegative Matrix Factorization(NMF)は、大きいデータセットを代表的な属性

に削減する場合に便利です。上位概念では主成分分析(PCA)に類似していますが、NMFははるか

に多くの属性処理と特質の付加による新しい特徴の作成が可能であり、さまざまなユースケースに

使用できる強力な最新のデータ・マイニング・アルゴリズムです。

NMFを使用すると、大量のテキスト・データなどのデータを小規模でよりスパースな表現に縮小し、

データのディメンションを縮退させることができます。つまり、はるかに尐ない変数で同じ情報を

保存できます。NMFモデルの結果は、SVMなどの教師あり学習技術やクラスタリング技術などの教

師なし学習技術を使用して分析できます。Oracle Data Miningでは、非構造化テキスト・データのマ

イニングにNMFアルゴリズムとSVMアルゴリズムが使用されます。

テキスト・マイニングと非構造化データ

Oracle Data Miningには、行と列に整理された構造化データと非構造化データの両方をマイニングで

きる単一の統合分析サーバー・プラットフォームが用意されています。Oracle Data Miningでは、非

構造化データ、つまり"テキスト"を、年齢、身長、体重などの他の構造化データと結合できるテキス

ト属性としてマイニングして、分類モデル、予測モデル、およびクラスタリング・モデルを構築で

きます。たとえば、より多くの情報を抽出したりより優れたデータ・マイニング・モデルを構築で

きるように、構造化された"臨床"データに医者のメモを追加することもできます。

構造化データと非構造化データを結合できることにより、データ・マイニングに新しい機会が開か

れます。たとえば、警察の職員は、年齢、前科の数、所得などに基づいて犯罪行為を予測するモデ

ルを構築できますが、特定の人物に関する警察官のメモを組み合わせると、使用できるすべての情

報を活用するさらに精度の高いモデルを構築できます。

Page 19: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

16

非構造化データをマイニングするOracle Data Miningの機能をOracle Text内で使用して、Medlineなど

のデータベースに保存されているテキスト文書を分類およびクラスタリングできます。Oracle Data

MiningのNMFモデルおよびSVMモデルとOracle Textを組み合わせて、高度なドキュメントの分類お

よびクラスタリング・モデルを構築できます。

データ・アナリストにとってのOracle Data Mining

Oracle Data Miningを使用すると、データの分析がこれまでとはがらりと変わります。つまり、より

多くのモデルをより高速に構築し、構築したモデルをより迅速かつより簡単に配置できます。マイ

ニングできるデータソースの量とデータの種類が増え、ディメンション数が多い大規模なデータに

まで対応でき、最新のアルゴリズムが使用でき、モデルの構築、評価、企業全体への配置を迅速に

実行できます。Oracle Data Miningは、データから情報を抽出する方法を変化させ、従来の統計環境

への依存度を軽減する画期的なテクノロジーです。Oracle Data Miningを使用すれば、マイニングし

たいデータをすぐにマイニングできます。

Oracle Data Miningには、データ探査、データ準備、データ・マイニング、モデル評価、およびモデ

ル・スコアリング・プロセス用の"ノード"を備えたOracle Data Minerというグラフィカル・ユーザー・

インタフェースがあります。これは、Oracle SQL Developer Release 3.0の拡張機能です。インテリジェ

ントなデフォルトが用意されているため、データ・アナリストはデータを的確にマイニングできま

す。パワー・ユーザーは、任意で詳細設定を変更したり、APIを使用したりすることもできます。

Page 20: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

17

データ・マイニングを容易にするOracle Data Miner(Oracle Technology Network(OTN)からダウンロード可能)

Oracle Data Minerでは、ワークフローをエクスポートしたり、PL/SQLスクリプトやSQLコード・スニ

ペットを生成したりして、データ・マイニングの方法を統合型データ・マイニング/BIアプリケーショ

ンに変換しやすくすることができます。

アプリケーション開発者にとってのOracle Data Mining

Oracle Data Miningは、データ・マイニングをOracle Database本来の拡張機能にすることで、IT部門お

よびアプリケーション・ベンダーを支援します。すでに多くの企業がデータの格納および管理に

Oracle Databaseを使用しています。今回、企業はデータベース内分析機能を活用して、データが存在

している場所そのもの、つまりデータベース内でデータ・マイニングを実行できるようになりまし

た。Oracle Data Miningにより提供されるデータベース内マイニング機能では、データだけでなくデー

タ・マイニング・モデルと結果も安全性の高いデータベース内に保持されるため、SQL問合せやアプ

リケーションですぐに使用できます。Oracle Data Miningオプションが組み込まれたOracle Database、

Oracle Business Intelligence、Oracle Applicationsで、Oracle Data Miningは、データ管理、データ分析、

エンドユーザー・アプリケーション向けの完全なプラットフォームを提供します。

Page 21: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

18

Oracle Data MiningのSQLとJava APIを使用すれば、既存のビジネス・プロセス、ワークフロー、およ

びアプリケーションにデータ・マイニングを統合できます。Oracle Data Miningには多数のサンプル・

コードが用意されており、データ・マイニング・アプリケーションをすばやく構築するための開始

点として使用できます。また、Oracle Data Minerグラフィカル・ユーザー・インタフェースからは、

マイニング・アクティビティを実用化するためのPL/SQLコードが生成されます。

Page 22: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

19

データベース内分析での競争

「どのような会社でも、従業員1人あたりの平均収益や平均注文数量のような、事業内容に関する単純な記述統計を生成できる。しかし、分析力を武器

とする競合企業は、初歩的な統計よりはるかに有益な情報を得ている。予測モデルを使用してもっとも利益率の高い顧客を識別し、さらに最大の利益

をもたらす顧客とそうでないと思われる顧客も識別する」

Thomas Davenport、『分析力を武器とする企業』著者、ハーバード・ビジネス・レビュー発行

成功している企業は基本的なBIダッシュボードやレポートで満足していてはいけません。持ってい

るデータから最大限の情報を引き出し、競争を優位にするためにそれらのデータを活用する必要が

あります。これまでは、データから情報を抽出するプロセスは、高度な技術を持つデータ分析の専

門家の作業範囲とされ、データ・アナリストが特殊なデータ分析ツールを使用して、データのコピー

を抽出していました。

Oracle Data Miningの導入によりこの障壁が取り払われ、データ・アナリストは直接データにアクセ

スできます。そのため、これまでより短時間で企業全体の予測分析を構築、評価し、"Oracle Data Mining

をエンジンとして使用する"ダッシュボードや次世代アプリケーションに配置できます。Oracle Data

Miningを活用する企業は次のことを実行できます。

データ移動の排除と情報取得までの待機時間の短縮

データベース・リポジトリから"分析データベース"への変換

新たな事実と予測分析の企業全体への提供

Oracle Business Intelligence Enterprise Editionやその他のレポート作成ツール用のデータベースで使用できるOracle Data Miningの予測機能と確率機能

Page 23: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

20

単なるツールを超えた、予測を可能にするアプリケーション

データ・マイニングの本当の価値は、新たな事実と予測が既存のビジネス・アプリケーションに統

合され、運用できるようになったときに、もっともよく分かります。Oracle Data Miningは、理想的

なデータとビジネス・インテリジェンスのITプラットフォームを提供して、企業が分析力で競争に

勝てるようにします。Oracle Data Miningを使用すれば、ビジネス・アプリケーション、コール・セ

ンター、Webサイト、キャンペーン管理システム、現金自動預払機(ATM)、エンタープライズ・

リソース管理(ERM)、および他の業務アプリケーションやビジネス計画アプリケーションに分析

予測を配置できます。そのため、専門部署にデータ・アナリストを抱え、データベースから遠く離

れたサイロで高度な分析を行う必要はもはやありません。データベースは単なるデータ・リポジト

リではなく、数多くの新しい高度なBIユースケースに対応できる分析データベースになります。

Oracle Data Miningでは、データ・マイニングを実行するためにデータベースからデータを抽出しな

いので、総所有コストが大幅に削減されます。複数のデータ・ストレージ・ハードウェアとソフト

ウェア環境、複数のデータ分析ツール、および複数のサポート・リソースは必要ありません。"移動

部分"が尐なくなり、簡潔で信頼性と効率性の高いデータ管理およびデータ分析環境を実現します。

データ・マイニング・タスクの自動化は、Oracle Data Miningのアプリケーション・プログラミング・

インタフェース(API)によって促進されます。Oracle Data Miningでは、PL/SQL APIとJavaベースの

APIの両方を使用できます。アプリケーション・プログラマーは、データ・マイニングのあらゆる側

面を管理できます。上級ユーザーのために複雑な設定を公開したり、ビジネス・ユーザーのために

プロセスを完全に自動化したりできます。プログラムによる制御は、単一レコードのオンデマンド・

スコアリングおよび大型データセットのバッチ・スコアリングのためのデータ準備からモデル構築、

さらにはモデル適用にまで及びます。Oracle Data Miningのモデルの予測は、次のSQL問合せ例に見ら

れるように、オンデマンドでコールされたり、他のビジネス・アプリケーションからアクセスでき

るようにリレーショナル表に格納されたりすることがあります。

Oracle Data MiningのAPIを使用すると、Oracle Data Miningの機能に非同期で直接アクセスできます。

アプリケーション開発者は、Oracle Data MiningのPL/SQLおよびJavaベースのAPIを使用して、コー

ル・センター・アプリケーションなどを強化して顧客の解約可能性または収益を見込める顧客を強

調表示できます。顧客サービスの向上のため、顧客が特別なオファーを受け取る可能性をウィンド

ウ・ポップアップとして顧客サービス担当者に対して表示できます。

Page 24: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

21

オープンなリレーショナル・データベースにすべての結果が作成および保存されるため、ユーザー

は、Oracle Business Intelligence Enterprise Edition、Oracle OLAP、Oracle Reports、Oracle Portal、および

Oracle Applicationsをはじめとするさまざまなビジネス・インテリジェンス・ツールを使用してデー

タ・マイニングの結果にアクセスできます。

組込み型の自動予測分析でOracle CRM OnDemand Sales Prospectorを支援するOracle Data Mining

オラクルはデータ・マイニングを統合したアプリケーションと業界データ・モデルを提供していま

す。Oracle CRM OnDemand Sales Prospectorアプリケーションは、これまでの顧客の購入実績と人口統

計をマイニングし、販売地域内の顧客が次に購入する可能性のもっとも高い商品、推定投資金額、

もっとも効果が高いと見込まれる顧客参照情報についての推奨事項を営業担当者に提示します。

Oracle Industry Data Modelは、Oracleデータウェアハウス用に設計および事前チューニングされた標準

ベースのデータ・モデルです。Oracle Retail Data Modelは、市場をリードする小売りアプリケーショ

ンの知識に、Oracleのデータウェアハウス・プラットフォームとBusiness Intelligenceプラットフォー

ムの機能を組み合わせたものです。事前作成済のOracle Data Mining、Oracle OLAPおよびディメン

ション・モデルにより、すぐに対処が可能な業界固有のメトリックと見識が提供されますOracle Retail

Data Modelを使用すると、小売データウェアハウスの設計および実装をすばやく開始し、予測どおり

の実装作業でデータウェアハウスおよびビジネス・インテリジェンスのプロジェクトの投資収益率

を短期間でプラスに転じることができます。

Page 25: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

22

Oracle Retail Data Modelには、事前構築されたデータ・マイニングが統合されており、自動データ・マイニングからの標準ダッシュボードとレポー

トが提供されます。

Oracle Data Miningは、オラクルの一連のビジネス・インテリジェンス製品および機能の一部です。

オラクル製品を使用すれば、企業ユーザーによってアクセスされ、データベースのセキュリティ・

スキームで保護された、同じ"単一の本物のソース"からデータを取得できます。データ・マイニング

を自動化して組織内に新たな事実を配信するエンタープライズ・アプリケーションの構築は、Oracle

Data Miningを使用すれば簡単です。

コスト削減

Oracle Database Enterprise EditionのオプションであるOracle Data Miningは、従来型の高額な統計分析

ソフトウェアに代わる費用対効果に優れた機能です。計算およびストレージ環境の追加ハードウェ

アの購入、余分なデータのコピー、複数バージョンのデータ、類似した業務を行うにもかかわらず

異なるソフトウェア・パッケージを無駄に使用している担当者の重複を回避することでコストが削

減されます。従来型の統計ソフトウェアは年間使用料という料金体系を使用してレンタルできます

が、専用の統計ソフトウェアを本当に必要としている個々人がそのソフトウェアを使用できるよう

にすることで、企業はデータ分析コスト全体を削減できます。本番の分析アプリケーションをすぐ

にOracle Database内に実装してデータベース内分析を実行できます。

Page 26: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracle Data Mining 11g Release 2データベース内分析での競争

23

重複データと従来型分析サーバーの排除

Oracle Data Miningは、データ・マイニングのコストを大幅に削減します。Oracle Databaseの外にデー

タを抽出する必要がないため、独立したマイニング専用のサーバーが不要になります。

また、同じデータと"単一の本物のソース"が活用されるため、データを適切に選択したり、いつも最

新版のデータを使用したりすることが簡単になります。

Oracle Data Miningを使用すると、データ移動およびデータ複製が不要になり、セキュリティ上の危険がなくなります。

結論

Oracle Data Miningは、価値ある新情報の取得や業界標準のインフラストラクチャを探しているデー

タ・アナリスト、企業全体の予測分析を自動的に検出および配置するアプリケーションを構築しよ

うとしているアプリケーション開発者のために、強力かつスケーラブルなデータベース内マイニン

グ・エンジンを提供します。

Oracle Data Miningの多種多様なデータ・マイニング・アルゴリズムはOracle Databaseに完全に組み込

まれており、さまざまなビジネス問題の解決に使用でき、高度なエンタープライズ・ビジネス・イ

ンテリジェンス・アプリケーションを構築、自動化および配置する際には強力なインフラストラク

チャになります。

予測分析およびビジネス上の新たな見識の発見および配信の自動化、統合、および実用化により、

企業はOracle Databaseへの投資を、よりインテリジェントな業務運営のために活用でき、これがもっ

とも重要なことですが、競争優位性の獲得にも活用できます。

Page 27: Oracle Data Mining 11g Release 2データベース内分 …...Oracle Data Mining 11g Release 2データベース内分析での競争 3 データの活用による、パターンや有益な新事実の発見

Oracleホワイト・ペーパー

Oracle Data Mining 11g Release 2

データベース内分析での競争

2010年9月

著者:Charlie Berger

Oracle Corporation

World Headquarters

500 Oracle Parkway

Redwood Shores, CA 94065

U.S.A.

海外からのお問い合わせ窓口:

電話:+1.650.506.7000

ファクシミリ:+1.650.506.7200

www.oracle.com

Copyright © 2009, Oracle and/or its affiliates. All rights reserved. 本文書は情報提供のみを目的として提供されており、ここに記

載される内容は予告なく変更されることがあります。本文書は一切間違いがないことを保証するものではなく、さらに、口述に

よる明示または法律による黙示を問わず、特定の目的に対する商品性もしくは適合性についての黙示的な保証を含み、いかなる

他の保証や条件も提供するものではありません。オラクルは本文書に関するいかなる法的責任も明確に否認し、本文書によって

直接的または間接的に確立される契約義務はないものとします。本文書はオラクルの書面による許可を前もって得ることなく、

いかなる目的のためにも、電子または印刷を含むいかなる形式や手段によっても再作成または送信することはできません。

Oracleは米国Oracle Corporationおよびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。

0109