17
Oracle Database 12cを使用した 非構造化データの管理 Oracle ホワイト・ペーパー | 2016 年 11 月

Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

Oracle Database 12cを使用した 非構造化データの管理 Oracle ホワイト・ペーパー | 2016 年 11 月

Page 2: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

Oracle Database 12c を使用した非構造化データの管理

免責事項 下記事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、情報提供

を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。マテリアルや

コード、機能の提供をコミットメント(確約)するものではなく、購買を決定する際の判断材

料になさらないで下さい。オラクルの製品に関して記載されている機能の開発、リリース、お

よび時期については、弊社の裁量により決定されます。

Page 3: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

Oracle Database 12c を使用した非構造化データの管理

目次

免責事項 ........................................................................................................................................................... 1

概要 ................................................................................................................................................................... 1

非構造化データ管理の機能 .......................................................................................................................... 2

Oracle Database 12c の非構造化データのサポート ................................................................... 3

より高速で統合性に優れた非構造化データ機能 .................................................................................... 3

特殊なデータ型とデータ構造 ..................................................................................................................... 4

Oracle Spatial and Graph(旧称 Oracle Spatial) ...................................................................... 5

Oracle XML DB ..................................................................................................................................... 7

Oracle Text ............................................................................................................................................ 8

Oracle Multimedia .............................................................................................................................. 9

DICOM 形式の医用コンテンツ管理サポートの強化.................................................................... 9

Oracle SecureFiles ....................................................................................................................................... 10

SecureFiles の記憶域の最適化 ....................................................................................................... 10

データベース内でのファイルの再活用 ........................................................................................ 11

結論 ................................................................................................................................................................. 13

Page 4: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

1 | Oracle Database 12c を使用した非構造化データの管理

概要 団体、企業、およびその他の組織の運営が成功するかどうかは、ソーシャル・メディア、Web コンテンツ、センサー、マシンからの出力、XML、ドキュメントなどから生成される膨大な量の非構造化データおよび情報(いわゆるビッグ・データ)を管理、理解、有効利用できるかどうかにかかっています。標準のデータ構造(例:明確に定義されたスキーマの行と列)に簡単に対応できる財務管理システム、注文処理システム、製造管理システム、カスタマ・リレーションシップ・マネジメント・システムなどの従来型のビジネス・アプリケーションも、ビッグ・データの分析に関与します。事業の価値創出と運営の成功は、人間や機械による解釈がなければ理解できない情報を管理し、分析し、理解することにかかっています。一般的な例は、ドキュメント、XML、マルチメディア・コンテンツ、Web コンテンツから、衛星画像や医用画像、地図、地理情報、センサー・データ、セマンティック Web 構造などの専門的な情報まで多岐にわたります。

オラクルは、データベース・システムを背景として、10 年以上も非構造化データをサポートしてきました。ビッグ・データのワークフローには、取得、整理、分析、探索と意思決定の実行のための多くのテクノロジーが関わります。Oracle Database 12c には、これらの非構造化形式のデータに対するインテリジェントな管理と深い分析を行うためのさまざまな機能が含まれています。

Oracle Database 12c では、非構造化データの問合せと分析における大幅なパフォーマンス向上、非構造化データ型と Oracle Database のその他の機能との強化された統合、より多くのアプリケーション・ロジック、特定のデータ型に関連する分析および解析機能をデータベースに移行することによるアプリケーション・コードの簡素化を重点項目としています。

こうした非構造化データを管理する方法は、以下に示すように、どのようにデータが生成され使用されるかによって大きく変わります。

» デスクトップ・オフィス・システム(ドキュメント、スプレッドシート、プレゼンテーション)、および特殊なワークステーションやデバイス(地理空間分析システムや医用画像の取込みおよび分析システム)にある膨大な量のデータ

» 官界、学界、産業界のマルチテラバイト・アーカイブとデジタル・ライブラリ

» ライフサイエンスや薬学研究で使用される画像データ・バンクとライブラリ

» 公的機関、通信、公益事業、エネルギーの地理空間データウェアハウス

» 業務記録または健康記録、場所とプロジェクト・データ、(小売、保険、医療、政府機関、公共安全のシステムに関連する)音声、ビデオ、画像の情報を含む総合運用システム

» 学問、薬学、および知能の研究と検出アプリケーションで使用される RDF セマンティック・データ(トリプル)

Page 5: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

2 | Oracle Database 12c を使用した非構造化データの管理

非構造化データ管理の機能

Oracle データベース・テクノロジーは数十年にわたって、あらゆる形式の大量の情報を管理する際に発生する問題に対処するために使用されてきました。多くの場合、データベースは、"ポインタベース"の実装でファイルに保存されるドキュメント、画像、およびメディア・コンテンツをカタログに追加および参照するために使用されます。この非構造化データをデータベース表内に保存するために、バイナリ・ラージ・オブジェクト(BLOB)がコンテナとして使用されてきました。Oracle Database では、簡単な BLOB に加えて、XML 文書、マルチメディア・コンテンツ、テキスト、地理空間情報を分析および操作するために、インテリジェントなデータ型を組み込んで、演算子とともにデータ構造を最適化しています。Oracle Database 12c でもまた、パフォーマンスを大幅に向上させること、また、より多くのアプリケーションレベルの処理をデータベース・サーバーに移行することにより、このような情報の管理における新しい境地を開いています。

組織があらゆる形式の情報を Oracle Database に保存するのには、以下のような多くの理由があります。

» 堅牢な管理、チューニング、および保守機能:データベースに保存されるコンテンツを関連するデータに直接リンクできます。メタデータとコンテンツは、同時に保守され、トランザクション制御下で管理されます。データベースは、バックアップ、リカバリ、物理的チューニングと論理的チューニングを実現する堅牢なサービスも提供します。

» 容易なアプリケーション開発:特定のタイプのコンテンツに対するオラクル・サポートには、SQL 言語の拡張、PL/SQL、Java API が含まれます。また、多くの場合、組込み演算子を通じて一般的な処理や重要な処理を実行するアルゴリズムや JSP タグ・ライブラリがサポートされます。また、特定のコンテンツについて、Xquery(XML 用)、SPARQL(RDF グラフ用)、DICOM アクセス・コマンド(医用画像用)、ファイル・システム操作(Oracle DBFS によりアクセスされる非構造化データ用)などの特殊な問合せ言語も Oracle Database に搭載されています。

» 高可用性:オラクルの Maximum Availability Architecture によって、すべてのデータで"データ損失ゼロ"の構成を実現できます。ファイルの非構造化データへのポインタとともに属性情報がデータベースに保存される一般的な構成とは異なり、障害が発生した場合には、単一のリカバリ手順のみが必要になります。

» スケーラブルなアーキテクチャ:多くの場合、索引付けやパーティション化の機能、そしてトリガーや参照処理または表およびデータベース・レベルのパラメータを使用する処理は、ファイル・システムではなく、データベースで構築されるアプリケーションで非常に大きなデータセットをサポートできます。

» セキュリティ:Oracle Database は、細分化された(行レベルと列レベル)セキュリティを実現します。あらゆる形式の情報に対して、同じセキュリティ・メカニズムが使用されます。多くのファイル・システムを使用する場合、ディレクトリ・サービスは、細分化されたレベルのアクセス制御を許可しません。したがって、ユーザーの(個人レベルでの)アクセスを制限できない場合があります。また、多くのシステムでは、ディレクトリにあるいずれかのコンテンツへのユーザー・アクセスを有効にすると、そのディレクトリにあるすべてのコンテンツへのアクセスが可能になります。

Page 6: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

3 | Oracle Database 12c を使用した非構造化データの管理

Oracle Database 12cの非構造化データのサポート

Oracle Database 12c の非構造化データのサポートには、以下の 5 つの側面があります。

» 記憶域 – Oracle Database 12c では、非構造化データの効率的な保存および問合せが可能です。これには、非常に効率的な圧縮を使用したり、多くの場合、特定のデータ型向けの問合せ言語、セマンティック、その他のメカニズムを使用したりします。

» データ型 – Oracle Database 12c では、多数の非構造化データ共通形式に対応する、特殊なデータ型をサポートします。そのため、アプリケーション開発者、開発ツール、データベース・ユーティリティから、標準的なリレーショナル・データと同じくらい容易に非構造化データを操作できます。

» 管理 – 非構造化データは Oracle Database 12c に保存されるため、非構造化データの管理にも、その他のデータベース・コンテンツと同じ管理機能、監視機能、保守機能を使用できます。

» 索引付け – 高パフォーマンスの問合せを行うために、Oracle Database 12c にはさまざまな種類の非構造化データにアクセスするための特殊な索引があります。たとえば、XML、テキスト、RDFグラフ、空間などの索引付けがあります。

» データ型に関連する演算子や関数を含む、多くの種類の非構造化データに特化したデータベース内分析

より高速で統合性に優れた非構造化データ機能 オラクルが約 15 年前に非構造化データのサポートを開始した頃のおもな利点は、業務に必要不可欠な非構造化データを使用するアプリケーションを容易に開発できるほか、そのようなアプリケーションに Oracle データベースの可用性、管理性、セキュリティを拡張できることでした。ドメイン索引、パーティション化、並列処理などのデータベース機能は、従来のファイル・システムに保存されたコンテンツではなく、データベースに保存されたコンテンツを使用するため、地理空間アプリケーション、グラフ分析、問合せおよび更新を集中的に行う XML アプリケーションのパフォーマンスを向上させることができます。

データベース内の一部の形式の非構造化データでは、パフォーマンスや記憶域の問題がありました。オラクルは SecureFiles LOB によって、画像、音声、ビデオ、バイナリ・データの処理におけるファイル・ベースの代替機能に少なくとも並ぶか、多くの場合はそれを上回ることで、この問題に対処しました。SecureFiles は、同等のファイル・システム構成以上の速度で LOB を保存、取得できる、高パフォーマンスのデータ保存機能です。SecureFiles は、Oracle Database 12c のデフォルトの LOB データ型です。

Page 7: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

4 | Oracle Database 12c を使用した非構造化データの管理

特殊なデータ型とデータ構造 データベース管理システムに、データ型、記憶域および索引構造、演算子が含まれ、構造化データの有効な問合せと分析を可能にするのと同様のことが、非構造化データを管理する際にも要求されます。Oracle Database 12c には、XML、テキスト、空間、ネットワーク・データ・モデル・グラフ、RDF セマンティック・グラフ、マルチメディア、および DICOM データの管理に独自の優位性を備えた機能が搭載されています。

Oracle Database 12c では、非構造化データ分析における大幅なパフォーマンス向上と、より多くのアプリケーション・ロジックおよび解析機能のデータベースへの移行という 2 つの側面を重点項目としています。その結果、非常に大規模なデータセットに対する分析とアプリケーション・コードの簡素化が可能になり、また、アプリケーションから Oracle Exadata やその他のエンジニアド・システムをより上手く活用できます。

Page 8: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

5 | Oracle Database 12c を使用した非構造化データの管理

Oracle Spatial and Graph(旧称Oracle Spatial)

Oracle Spatial and Graph(Oracle Database Enterprise Edition のオプション機能)は、ベクトル・データとラスター・データのネイティブ・サポート、トポロジ・モデルとネットワーク・モデル、3D データ、ジオコーディング、ルーティング、Open Geospatial Consortium(OGC)標準の Webサービスなどの包括的な空間データベース機能を提供します。さらに、Oracle Spatial and Graph では、ソーシャル・ネットワーク、リンクト・データ・アプリケーション(研究、保健科学、財務管理、メディア、インテリジェンス向け)で使用される RDF セマンティック・グラフもサポートしています。輸送、通信、公益事業、エネルギー関連の大企業における従来のネットワーク・アプリケーションで使用される、ネットワーク・データ・モデル(NDM)グラフも搭載されています。これらは実績のある堅牢なグラフ・データベース・テクノロジーです。

Oracle Spatial and Graphの空間機能

Oracle Spatial and Graph の空間機能は、ベクトル分析操作およびラスター分析操作の最高レベルのネイティブ・サポート、トポロジ・モデルとネットワーク・モデル、3D データ、ジオコーディング、ルーティング、OGC 標準の Web サービスを含む、包括的な空間データベース機能を提供します。Oracle Spatial and Graph は、企業と政府機関で使用されるビジネス・インテリジェンス、土地管理、公益事業、防衛、および国土安全のアプリケーションの地理空間に関する高度な要件に適合できるように設計されています。また、空間に対するオープンなネイティブ・サポートを提供することによって、個々の独自システムのコストと複雑さを排除し、それと同時にすべての主要な GIS ツールを使用できるようにしています。このように、オラクルは、ミッション・クリティカルな空間資産にも対応できる業界最高のセキュリティ、パフォーマンス、スケーラビリティ、管理性を実現しています。

Oracle Database 12c の Oracle Spatial and Graph オプションには、以下の特徴があります。

» Vector Performance Acceleration を使用することで、一般的な空間の問合せ、分析に関する関数と演算子のパフォーマンスが最大 50~100 倍向上します。Oracle Spatial and Graph の関数と演算子は、そのままでも他の空間データベース分析と同等以上のパフォーマンスを発揮しますが、Vector Performance Acceleration を起動すると、SPATIAL JOIN、TOUCH、CONTAINS、OVERLAPS、COMPLEX MASK の各操作の実行速度が 50 倍、場合によっては 100 倍向上します。また、RELATE、DML 操作、単一の挿入、COORDINATE TRANSFORMATION のパフォーマンスも大幅に向上します。

» GeoRaster 機能においてパラレル・ラスター操作、インデータベース・ラスター代数、仮想モザイクがサポートされます。GeoRaster 機能で、より多くの画像処理を Oracle Database 内で実行できるようになります。異種の画像形式と、個々のラスター・セルまたはピクセルに対して作用するラスター代数操作により、仮想モザイクをその場で作成して、Oracle Spatial and Graph で、2つ以上のラスター・レイヤーから新しい地図を生成できます。ラスター代数操作を使用して、アプ リ ケ ー シ ョ ン で Normalized Difference Vegetation Index ( NDVI ) 、 TCT ( Tasseled Cap Transformation)などの高度な分析アルゴリズムを実装できます。ラスター操作のパフォーマンスも大幅に向上し、パラレル化することで、大規模なデータセットの処理速度が 100 倍になるようなスケーラビリティを達成できます。

» デザイン・アプリケーションや輸送アプリケーションで使用されるパラメトリック曲線または非一様有理 B スプライン(NURB)がサポートされます。これにより、Oracle Spatial and Graph で表現される曲線の管理と編集が容易になります。

» ネットワーク・データ・モデル・グラフで実環境の特性をネイティブにモデル化でき、トラフィック・パターン・データを組み込むことができ、ネットワークに対するマルチモーダル分析を実行できます。

Page 9: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

6 | Oracle Database 12c を使用した非構造化データの管理

» 3D 機能と点群機能において、複数セッションによる点群作成のスケーラビリティが大幅に向上します。また、記憶域の大幅な節約、点群データおよび TIN データのピラミッド化のサポート、点群データからの等高線生成、3D 測地計算、3D セグメントの距離計算が提供されます。

Oracle Spatial and GraphのRDFセマンティック・グラフ機能

Oracle Spatial and Graph の一機能として、RDF セマンティック・グラフ・データの高度な管理と分析の機能が提供されます。Resource Description Framework(RDF)と Web Ontology Language(OWL)は、セマンティック・データの表現と定義のための標準であり、SPARQL は、グラフ分析のための専用の問合せ言語です。これらの World Wide Web Consortium(W3C)標準がネイティブにサポートされるため、アプリケーション開発者は、業界をリードするオープンでスケーラブルなグラフ・データ・プラットフォームとその粒度の細かいセキュリティ機能を利用できます。グラフは、ソーシャル・ネットワーク、リンクト・データ・アプリケーション(保健科学、財務管理、メディア、インテリジェンス分野でよく使用されるもの)という新カテゴリの中核を成すものです。

アプリケーション開発者は、一連の用語とそれらの関係を定義して、データとメタデータに意味を追加できます。これらの一連の条件("オントロジー")によって、単なるデータ値ではなく、セマンティック・コンテンツに基づく問合せ、分析、アクションを実行できます。オントロジーは、分野固有の知識を利用するアプリケーションを構築するために使用が増加しています。オントロジー・データセット(多くの場合、数億のデータ項目と関係を含む)は、RDF データ・モデルを使用して、3 つのグループ("トリプル")に保存できます。Oracle Database では、もっとも要件の厳しいアプリケーションのニーズに適合するために、トリプルを拡張して、数十億の項目に対応できるようになっています。

RDF グラフ分析によって、複数のデータセットやドキュメント間の関係を検出し、異種のメタデータを使用するシステムを統合し、それらのシステムにアプリケーションからアクセスできるようになります。

Oracle Database 12c の Oracle Spatial and Graph オプションには、以下の特徴があります。

» リレーショナル表に対する RDF ビューによって、以前はリレーショナル・データセットに対するRDF グラフ問合せの実行時に必要となったデータや関連する記憶域を複製する必要がなくなります。RDF ビューに対するセマンティック・グラフ問合せによって、Oracle に保存されたリレーショナル・データと RDF セマンティック・グラフのトリプル・データを統合できます。これらのビューに対するセマンティック問合 せは、SPARQL 問合せ言語 で記述す るか、Oracle SQL SEM_MATCH 表関数内に SPARQL を埋め込むことで記述できます。

» RDF セマンティック・グラフの"名前付きグラフ"が、World Wide Web Consortium(W3C)で定義されているとおりにサポートされます。

» 分析の操作とツールがサポートされます。RDF セマンティック・グラフで、単純なパスと複雑なパスの両方に対して、SPARQL 1.1 のパス式がサポートされます。また、RDF セマンティック・グラフをネットワーク・データ・モデル Java API とともに使用して、RDF グラフの最短パス分析、到達可能性分析、コスト内分析、最近傍分析などのインメモリ・グラフ分析を高速に実行できます。グラフ問合せの結果を、Oracle Advanced Analytics で使用するためのマテリアライズド・ビューとして保管して、Oracle Data Mining のクラスタリング、分類、回帰、異常検出、ディシジョン・ツリーの各アルゴリズムや、Oracle R Enterprise のアルゴリズムを利用できます。

Page 10: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

7 | Oracle Database 12c を使用した非構造化データの管理

» RDF セマンティック・グラフでは、XML スキーマ、テキスト、空間の各データ型をサポートしており、データ型の索引を追加、削除、変更できます。また、XML スキーマ、テキスト、空間の属性を使用して、SPARQL または SQL で記述されたセマンティック問合せをフィルタリングすることもできます。

» RDF セマンティック・グラフのドキュメント索引付けの機能拡張:

» ドキュメントのバッチによる索引付け

» エンティティ抽出エンジンや関連するルールを管理するための柔軟なフレームワーク

» ローカルのパーティション索引付け

» 検出されたドキュメントの関連性を計算するための演算子

Oracle XML DB

XML は、あらゆる業界で幅広く採用されています。XML ベースの規格は、医療、製造、金融サービス、政府機関、および出版業で利用されています。XBRL などの XML ベース規格の導入によって、XML はアプリケーション・システム間で情報を交換するための事実上の標準メカニズムとなっています。このため、ミッション・クリティカルなデータの永続化モデルとして、XML の使用が増加しています。

このニーズを満たすために、オラクルは Oracle XML データベース(DB)を開発しました。Oracle XML DB は、すべてのバージョンの Oracle Database に提供される高パフォーマンスのネイティブXML 記憶域と検索テクノロジーを実装しています。XML、名前空間、DOM、XQuery、SQL/XML、XSLT を含むすべての主要な XML 規格を完全にサポートしています。Oracle XML DB は、本格的なハイブリッド・リレーショナル XML 機能を提供する最初のプラットフォームです。XML コンテンツに関連する SQL 言語のすべての機能とリレーショナル・データに対する XML パラダイムの機能を最大限に活用できます。

Oracle Database 12c では、すべてのタイプの XML コンテンツの保存、管理、および問合せに関して、Oracle Database が最高のプラットフォームであり続けるために、業界をリードする XML サポートを拡張しています。Oracle Database 12c の機能を使用すると、パフォーマンスとスケーラビリティが向上し、多くの異なる組織に対して魅力的な XML データ・モデルを提供する柔軟性が完全にサポートされます。

Oracle Database 12c では、Oracle XML Database のユーザーに多くの拡張機能を提供します。オラクルは、以下のように XQuery 実装を拡張することで、XML 開発者に対するサポートを継続的に強化しています。

» XQuery Update のサポート:W3C の問合せ言語を使用して、ノードレベルの断片的な変更を実行することで、大きな XML 文書を効率的に更新できます。

» XQuery Full-Text 仕様のサポート:ドキュメント処理中心のアプリケーションで、全文検索と索引付けを最大限に活用できます。

» XQuery API for Java(XQJ)を API としてサポート:XQJ は、Java プログラムから XQuery 文を実行するための Java Specification Request(JSR)です。

» Oracle Database 12c では、以下のような Oracle XML DB の中心機能に対する継続的な機能拡張も実施しています。

Page 11: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

8 | Oracle Database 12c を使用した非構造化データの管理

» 問合せと索引メンテナンスを 10 倍以上高速化

» バイナリ XML ストレージおよび索引付けのパーティション化の拡張サポート

» ハッシュ表の Oracle XML DB およびドメイン索引のサポート

» Digest 認証をサポートするためのリポジトリの強化、HTTP を使用するユーザーがデータベース内に保存されたコンテンツにアクセスするためのより堅牢なセキュリティの実現

» リポジトリで、DBFS に保存されたコンテンツへの WebDAV、HTTP、FTP を使用したアクセスに対応

Oracle XML Developer's Kit(Oracle XDK)は、XML を処理する C、C++、Java によるソフトウェア・プログラムの構築とデプロイを行うための汎用的なコンポーネント・セットです。これらのコンポーネントは、ビジネスの要件に対応する XML アプリケーションに組み込むことができます。Oracle XML Developer's Kit は、以下のように強化されています。

» Oracle XDK/J DOM の機能拡張:W3C DOM Level 3 Core API のサポートが追加され、XML スキーマの利用に関連するメモリ・フットプリントが削減されます。

» Oracle XQuery 実装の統合:Oracle XQuery エンジンと BEA XQuery エンジンの統合により単一のJava ベース XQuery エンジンが構築されます。

» Oracle XSLT/XPath エンジンの相互運用性:非 XDK ベースのデータ・モデルを Oracle XDK/J XSLT/XPath エンジンで利用できます。これらのエンジンでは、Oracle エンジンとサード・パーティの XML プロセッサとの相互運用性がサポートされます。

» スタンドアロン XQuery 仮想マシン:高パフォーマンスの XQuery 操作を Oracle Database の外部に保存された XML コンテンツに対して実行できます。

Oracle Text

Oracle Text は、テキストの検索、取得、管理を行う主要なシステムで、データベース環境に統合されます。Oracle Database 12c の Oracle Text では、索引と問合せのパフォーマンスやユーザビリティを向上する、多くの新機能が導入されています。

新機能には、次のような効果があります。

» ほぼリアルタイムの索引付けによって、索引が頻繁に更新されるアプリケーションをサポートします。最近変更された索引情報をメモリ内に保持して、定期的にメインの索引内に移動できます。

» トークン化された圧縮版のドキュメントを Oracle Text 索引内に保存することで、ハイライトとスニペット生成のパフォーマンスが向上し、元のドキュメントへのアクセス、フィルタリング、トークン化が不要になります。

» 結果セット・インタフェースからのスニペット情報をネイティブでサポートすることで、アプリケーションの高速化、より容易なメンテナンス、より優れた可用性と柔軟性を実現します。

» BIG_IO での大規模な TOKEN_INFO オプションによって、大規模な TOKEN_INFO データ項目をディスクからロードする際に多数のシーク処理が不要になるため、パフォーマンスが向上します。

» 問合せフィルタ・キャッシュ機能により、特定の問合せ(または問合せの一部)の結果をキャッシュできます。このキャッシュした結果を使用して、それ以降の検索をフィルタリングすることで、他の問合せで共有されるコンポーネントを含む問合せのパフォーマンスが向上します。

» 許可される MDATA セクション数が事実上無限になりました。以前の最大値は 100 でした。

Page 12: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

9 | Oracle Database 12c を使用した非構造化データの管理

» 索引を一から再構築しなくても、新しいビジネス要件に対応するように索引を変更できます。SDATA 項目の値は、その行内のすべてのデータを再度索引付けしなくても更新できます。SDATAセクション数の最大数が 32 から 99 に拡大されています。

» フィールド・セクション数が 64 からほぼ無限(10,000 以上)に拡大されています。

Oracle Multimedia

Oracle Multimedia は、他のエンタープライズ情報と統合して、画像、音声、ビデオ、その他のメディア・データを Oracle Database で保存、管理、および取得できる機能です。Oracle Multimediaは、Oracle Database の信頼性、可用性、データ管理を従来のアプリケーションやインターネット、電子商取引、およびメディアリッチ・アプリケーションのマルチメディア・コンテンツにまで拡大します。

また、Oracle Multimedia は、SecureFiles をサポートして、パフォーマンスを大幅に向上させ、Oracle Database のネイティブ・コンテンツ管理機能を強化します。データベース記憶域構造(BLOB)内で保存および取得できる個々のメディア・オブジェクトの上限サイズは、128 テラバイトです。

大きい画像の保存および取得以外に、Oracle Multimedia では、最大解像度が 46,000×46,000(20億ピクセル)までの画像から、高さ、幅、圧縮形式を含む画像属性を抽出することもできます。

DICOM形式の医用コンテンツ管理サポートの強化

DICOM(Digital Imaging and Communications in Medicine)は、医用画像内の情報の処理、保存、印刷、送信に関する標準です。この標準には、ファイル形式の定義とネットワーク通信プロトコルが記載されています。Oracle Database 12c には、多くの機能が含まれ、DICOM 形式の医用画像の大規模 なリポジトリとアーカイブを構築 する ため に必 要なパ フ ォー マン スを 提供 しま す。Multimedia を拡張し、SecureFiles を使用して、OracleDatabase に画像、音声、ビデオを保存すると、Oracle Database をエンタープライズ・クラスの標準データベースにしたすべてのセキュリティ・ツール、パフォーマンス・ツール、および管理ツールをメディア・オブジェクトの大規模なアーカイブにも使用できます。

特に医用画像アプリケーションにおいて、Oracle Database は、以下の手段を提供します。

» Web アプリケーションで扱いやすい形式に画像を変換して、視覚的なアプリケーションの開発を簡素化します。

» 索引を作成するため、標準のメタデータとプライベート・メタデータの両方を抽出します。

» メタデータが、DICOM 標準またはユーザーやベンダー固有の拡張された標準に準拠しているかを検証します。

» 研究用またはトレーニング用の匿名の画像を作成するため、すべての患者の個人データを削除します。

» 正しいメタデータで新しい画像を作成します。

» DICOM 形式以外の画像から、DICOM 形式の画像を作成します。

Page 13: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

10 | Oracle Database 12c を使用した非構造化データの管理

Oracle Database 12c では、以下のような多くの DICOM サポート拡張機能を提供します。

» Oracle Database 向けの DICOM プロトコルのサポート:Oracle Multimedia では Digital Imaging and Communications in Medicine(DICOM)形式のデータ型の管理を Oracle Database 11g よりサポートしていますが、Oracle Database 12c では DICOM プロトコルのサポートも追加されました。そのため、DICOM アプリケーションやデバイスから、Oracle Database 内の DICOM データに容易にアクセスして、臨床治療ワークフローの一部として DICOM コンテンツを保存し、管理できます。

» Oracle WebCenter Content に DICOM コンテンツを保存し、Oracle WebCenter Content からアクセスできます。そのため、画像対応の患者向けポータル、委託医師向けポータル、電子医療記録(EMR)、ライフサイエンス研究のアプリケーションの開発と管理が容易になります。

» Oracle Multimedia では、Oracle Data Pump と Oracle Multimedia DICOM データ・モデルを使った、完全モードのデータベースのエクスポートとインポートがサポートされるようになりました。

Oracle SecureFiles SecureFiles は、データベースでファイル・データを処理する方法を完全に新しいアプローチで設計しています。また、基本的な問合せや挿入操作では、ファイル・システムのようなパフォーマンスを提供します。SecureFiles の最適化されたアルゴリズムは、以前の LOB サポート(現在のBasicFiles)よりも最大で 10 倍高速になります。また、ファイル・システムでは実現できない、以下のような複数の高度な Oracle Database の機能を利用できます。

» Oracle Real Application Clusters(Oracle RAC)環境の SecureFiles は、ファイル・システムで提供されるものよりもはるかに高いスケーラビリティを提供します。

» SecureFiles では、既存のアプリケーションに影響を与えることなく、オンライン表再定義を使用して、以前の LOB から簡単に移行できます。

» アプリケーションは、関連するファイル・データを操作する際に、複数のインタフェースを利用する必要がありません。

» SecureFiles を使用すると、あらゆる形式の情報をデータベース・トランザクションの一部にすることができます。これによって、原子性、読取りの一貫性、他のバックアップ要件やリカバリ要件を保証する複雑な処理からアプリケーションが解放されます。

» SecureFiles は、透過的データ暗号化(TDE)機能を LOB データ対応に拡張しています。Oracleデータベースは、表内にあるすべての LOB 列の自動的な鍵管理をサポートし、データ、バックアップ、REDO/UNDO ログ・ファイルを透過的に暗号化または復号化します。

SecureFilesの記憶域の最適化

SecureFiles では、重複排除や圧縮などの高度なファイル・システム機能も使用できます。重複排除機能は、SecureFiles データの冗長な複数のコピーを削除し、アプリケーションに対して完全に透過的です。Oracle Database は、複数の同じ SecureFiles データを自動的に検出し、1 つのコピーだけを保存します。このため、記憶域容量が節約されます。重複排除機能により記憶域管理が簡素化されるため、パフォーマンス(特にコピー操作)が大きく向上します。

SecureFiles データは、業界標準の圧縮アルゴリズムで圧縮できます。このため、容量が大幅に節約され、パフォーマンスが向上します。Oracle Database は、SecureFiles ファイルが圧縮可能かどうか、または圧縮による節約に利点があるかどうかを自動的に判断します。SecureFiles は、サーバー

Page 14: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

11 | Oracle Database 12c を使用した非構造化データの管理

全体のデフォルトの LOB 圧縮アルゴリズムを使用し、さまざまなレベルの圧縮を提供します。各圧縮レベルは、圧縮の要素と速度のトレードオフを表します。組織は、記憶域と CPU の使用制約に基づいて、要件をもっとも満たす圧縮レベルを選択できます。SecureFiles ファイルは、アプリケーションに対して透過的、自動的に圧縮または非圧縮されます。

重複排除も圧縮も Advanced Compression オプションに含まれます。このオプションは、Oracle Database 12c で利用可能な、別途ライセンスされるデータベース・オプションです。

Oracle Database 12c の Oracle SecureFiles の新機能

» SecureFiles LOB のパラレル DML サポートが強化され、パフォーマンスが向上します。

» BasicFiles LOB ではなく SecureFiles LOB が、LOB のデフォルトの記憶域オプションになります。

» SQL データ型の VARCHAR2、NVARCHAR2、RAW の最大サイズはそれぞれ 4,000 バイト、4,000 バイト、2,000 バイトでしたが、これらがすべて 32,767 バイトに変更されます。対応する PL/SQLデータ型のサイズは、32,767 バイトのままです。

» Data Pump では、SecureFiles をデフォルトの LOB 記憶域として使用します。表をインポートするときには、すべての LOB 列を SecureFiles LOB として再作成し、Data Pump インポート時にBasicFiles LOB を SecureFiles LOB に変換できます。

» SecureFiles では、さまざまな XML DB サーバー・プロトコルを使用して、HTTP、WebDAV、FTPがインターネット経由で Oracle DBFS にアクセスできるようにするコンポーネントをサポートします。

データベース内でのファイルの再活用

SecureFiles の高パフォーマンス・ファイル記憶域とデータベース内に保存されたファイルに対する単純なファイル・システム・インタフェースの実装を組み合わせることによって、既存のファイル・ベースのツールでデータベース・ファイルにアクセスできるようになりました。Oracle Database File System は、パス名、ディレクトリ、リンクを使用した一般的なファイル・アクセスを実現します。これらのファイルは専用の SecureFiles ストアに保管されます。また、SecureFiles LOB として既存のアプリケーション表内に保存することもできます。Oracle DBFS を使用すれば、データベース内へのビジネス・データ・ファイルの保存が、データベース外への保存よりも容易になり、より高速かつ堅牢になります。

Oracle Database File System(Oracle DBFS)

Oracle DBFS では、標準の Network File System(NFS)マウントと同様に、Linux ホストに DBFS ファイル・システムをマウントできる Linux 用のクライアントが提供されます。アプリケーションはこの機能を利用して、通常のファイル・システム・コールを実行できます。Linux FUSE モジュールはファイル・システム・コールを DBFS クライアントの実行可能ファイルに転送します。その結果、データベース内の DBFS"ストア"へのリモート・コールが実行されます。

Oracle Database には、DBFS SecureFiles Store と DBFS Hierarchical Store(HSM)という 2 つの組込みのストア・プロバイダが付属しています。DBFS SecureFiles Store では、SecureFiles 列を含む表を利用して、ファイル・システム・データを保存します。DBFS SecureFiles Store には、POSIX に似た機能が実装されています。DBFS Hierarchical Store では、Oracle Recovery Manager でサポートされるテープ・ストレージ・ユニットまたはクラウド・ストレージ・システムにファイルを書き込むことができます。

Page 15: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

12 | Oracle Database 12c を使用した非構造化データの管理

また、Oracle DBFS には、dbfs_client と呼ばれるクライアント・コンポーネントも付属しています。dbfs_client は、ネットワーク上の任意のホストからデータベース内外にファイルを容易にコピーできるコマンド・インタフェースです。リスト表示やコピーのような単純なファイル・システム・コマンドを、Linux シェル・ユーティリティの ls や rcp と同様の方法で実装しています。このコマンド・インタフェースは、Oracle DBFS の OS マウントを実行しなくても、データベースに直接接続します。

Oracle DBFS のおもな利点の 1 つは、Oracle Real Application Clusters を使用して、従来のファイル・システムでは不可能な高可用性とスケーラビリティを実現できることです。シームレスなスケーラビリティを実現するために、Oracle RAC では、アプリケーションを中断せずに、処理リソースとストレージ・リソースをシステムに追加できます。障害の発生時には、ファイル・アクセスを代替的な RAC インスタンスに透過的にリダイレクトします。

DBFS Store API

Oracle DBFS では、DBFS Store API と呼ばれる API を使用します。この API には、ディレクトリおよびリンクのためのファイル作成/削除用の演算子、LOB や既存のファイル・パスの属性の読取りと書込みを行う Get/Put、ディレクトリ操作、ロック操作、スナップショット作成などが含まれます。DBFS Store API には、ファイルに関連するメタデータの保存や、トランザクション内でのファイル・システム操作を強力にサポートしています。

開発者は、DBFS Store API と同様の PL/SQL パッケージを記述することで、データベース内にファイル・システム実装を構築できます。このアプローチは Linux FUSE のユーザー・モード・ファイル・システム・インタフェースと概念的に似通っており、さまざまな種類の DBFS ストア・プロバイダを作成できます。おもな例は次のとおりです。

» アプリケーション表内の LOB にファイル・システムからアクセスできるプロバイダ

» ロジック(ウィルス・チェック・フィルタ、アクセスに関するアプリケーション・ルールを適用するフィルタなど)を追加した操作を基盤のファイル・システムにわたすフィルタ・ファイル・システム・プロバイダ

» リレーショナル・データをファイル・データに変換する(またはこの逆方向の変換を行う)プロバイダ

Page 16: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

13 | Oracle Database 12c を使用した非構造化データの管理

結論 Oracle Database の Advanced Analytics とデータウェアハウス機能を組み合わせた非構造化データ機能によって、Oracle Database 12c では、多くのビッグ・データ関連ワークフローやその他のアプリケーション・ワークフロー向けのスケーラブルで高パフォーマンスの管理と分析が実現されます。標準のデータ構造(例:明確に定義されたスキーマの行と列)に簡単に対応できる財務管理システム、注文処理システム、製造管理システム、カスタマ・リレーションシップ・マネジメント・システムなどの従来型のビジネス・アプリケーションに加え、Web、ソーシャル、マルチメディア、モバイル、センサー・データの分析をベースとするアプリケーションにも、非構造化データが次第に取り込まれています。Oracle Database 12c では、大幅なパフォーマンス向上と、より多くのアプリケーション・ロジックおよび解析機能のデータベースへの移行という 2 つの側面を重点項目としています。これらの項目によって、アプリケーション・コードの簡素化、格段に大きなデータセットに対する分析、Exadata やその他のエンジニアド・システムのより優れた活用が可能になります。

Oracle Database 12c では、パフォーマンスと機能が大幅に向上しているため、非構造化データをより活用するための 2 つの重要な要素が実現されます。1 つは、もっとも優れたパフォーマンスでの非構造化データの管理、セキュリティ確保、問合せ、保守です。もう 1 つは、以前は専用のアプリケーションやデバイスのロジックに依存していたあらゆる種類のデータから、オープンで標準的な方法により理解と知識を引き出すことです。10 年以上の開発と研究、そして顧客とアプリケーション・プロバイダとの緊密な協力によって、こうした Oracle Database 12c にしかない独自の非構造化データ機能が開発されました。

Page 17: Oracle Database 12cを使用した非構造化データの管理 › technetwork › jp › database › ...Oracle Database 12c を使用した非構造化データの管理 免責事項

Oracle Corporation, World Headquarters

500 Oracle Parkway

Redwood Shores, CA 94065, USA

海外からのお問い合わせ窓口

電話:+1.650.506.7000

ファクシミリ:+1.650.506.7200

C O N N E C T W I T H U S

blogs.oracle.com/oracle

facebook.com/oracle

twitter.com/oracle

oracle.com

Copyright © 2016, Oracle and/or its affiliates.All rights reserved.本文書は情報提供のみを目的として提供されており、ここに記載される内容は予告なく変更されることがあります。本文書は、その内容に誤りがないことを保証するものではなく、また、口頭による明示的保証や法律による黙示的保証を含め、商品性ないし特定目的適合性に関する黙示的保証および条件などのいかなる保証および条件も提供するものではありません。オラクルは本文書に関するいかなる法的責任も明確に否認し、本文書によって直接的または間接的に確立される契約義務はないものとします。本文書はオラクルの書面による許可を前もって得ることなく、いかなる目的のためにも、電子または印刷を含むいかなる形式や手段によっても再作成または送信することはできません。 Oracle および Java は Oracle およびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。 Intel および Intel Xeon は Intel Corporation の商標または登録商標です。すべての SPARC 商標はライセンスに基づいて使用されるSPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMD ロゴおよび AMD Opteron ロゴは、Advanced Micro Devices の商標または登録商標です。UNIX は、The Open Group の登録商標です。0116 Oracle Database 12c を使用した非構造化データの管理 2016 年 11 月 著者:James Steiner