59
知識モデリング

知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

知識モデリング

Page 2: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

PSM

→PSM(Problem Solving Methods) の体系化 →推論エンジンの仕様を与える →Common KADS(アムステルダム 大学)が普及 →実装との対応付けは不十分

Page 3: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

中粒度メソッドリポジトリのイメージ

Select

Abstract Insatiate

Compare Specify Assign

Sort Classify

Match Specializes Compute

Merge

Generalize Assemble

Transform

Replace Propagate Predict

Obtain Receive Provide Present

Page 4: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す
Page 5: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す
Page 6: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す
Page 7: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す
Page 8: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す
Page 9: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

task diagnosis

diagnosis

task method through

generate-and-test

decomposition

cover obtain

predict compare

inferences transfer function

Page 10: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

complaint

causal actual

cover model obtain finding

expected

hypothesis predict finding compare

manifestation

model result

Page 11: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

engine does

complaint not start

state dependency

rules gas dial = normal

causal actual

cover model obtain finding

expected

hypothesis predict finding compare

empty fuel tank gas dial = zero/low

manifestation manifestation

rules model not equal result

Page 12: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

PSM

Reference

Input Output

入力,出力,参照する情報の定義が必要 →概念定義→オントロジー

PSMだけでは不十分?

Page 13: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

オントロジーに関する 知識工学と次世代Webの流れ

知識工学のトレンド

• 90-: 概念化の明示的仕様 (Tom Gruber オントロジーの定義)

オントロジー記述言語(Ontolingua) 知識交換言語(KIF) Generic Ontology CYC, WordNet, EDR… PSM Task Ontology オントロジー構築方法論 ...

次世代Webのトレンド

• 95-97: XML as arbitrary

structures

• 97-98: RDF

• 98-99: RDFS (schema) as a frame-like system

• 00-01: DAML+OIL

• 2004.2.10: OWL

• Rule 仕様検討中

Page 15: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

オントロジーの構築と利用

ONTOLOGIES : Mike Uschold and Michael Gruninger: Principles,

Methods and Applications,AAAI96 Tutorial Syllabus (1996)

Page 16: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

オントロジーとは?

オントロジーは、与えられた問題領域内の

概念集合を分類(または体系化)する。

概念集合

概念化

オントロジー

Class

Page 17: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

オントロジーの形式度

• 非形式的

• 準非形式的

• 準形式的

• 形式的

:自然言語で自由に表現されるもの

:人工の形式言語で表現されるもの

:健全性や完全性を持つ形式的意味

論によって定義されたもの

:制限付き構造化された形式の

自然言語で表現されたもの

Page 18: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

システム間の

相互運用

人々及び組織間の

意思伝達

再利用 仕様 信頼性

システム工学

オントロジーの使用目的

Page 19: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

意思伝達

統一した枠組みの供給

統一した枠組みを供給することにより、概念と用語の混同を減らす。

異なる観点を持った人々の間で、共有理解を

持たせ、コミュニケーションを可能にする。

Page 20: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

相互運用1

ソフトウェア間の相互運用

ソフトウェアA ソフトウェアB データ

オントロジー

データ データ

Page 21: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

相互運用2

中間言語としてのオントロジー

• 相互運用を援助するために、異なる言語と表現の間での変換を支援する。

L1

L3 L4

L2

中間言語

L4 L3

L2 L1

中間言語をオントロジー

で支援

Page 22: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

ソフトウェア自身の設計・開発を支援

・仕様

・信頼性

・再利用性

システム工学

Page 23: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

対象と目的の明確化

評 価

オントロジーの構築

既存のオントロジーの統合

獲 得

コーディング

オントロジー開発の流れ

Page 24: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

1. 対象と目的の明確化

なぜオントロジーが構築されるのか、

目的は何なのかを明らかにする

以降の段階に十分定義された対象を提供できる

Page 25: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

2 .オントロジーの構築

2.1 オントロジーの獲得

2.2 オントロジーのコーディング

2.3 既存のオントロジーの統合

オントロジーは以下のステップに添って構築される

Page 26: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

2.1 オントロジーの獲得

1. 特定

2. 文書による定義の作成

3. 命名

オントロジーの形式化への準備

概念間関係やキー概念の

Page 27: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

2.2 オントロジーのコーディング

• 特にオントロジーで使われるような基礎用語 ( クラス、対象、関係など ) の決定 - メタオントロジーと呼ばれる

• メタオントロジーをサポートできる表現言語の選択

• コードの記述

Page 28: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

2.3 既存のオントロジーの統合

既存のオントロジーの全てまたは一部を、使用するかどうか、またどのように使用するのか - 方法論中の大きな課題

オントロジーの基礎を成す全ての仮定を明らかにすることで解決される

Page 29: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

3 評価

関連ソフトウェア環境、要求仕様、機能問題などを考慮した文書化の技術的判断を作る

有効的な知識共有につながる

Page 30: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

・ 全般にわたるガイドライン

明確性 一貫性 拡張性

最小限のオントロジーに関する意味決定 内部

要素がオントロジーを束縛しないためにも、形成される世界についての要求は最小限にする

最小限のコーディングのバイアス 表示や実装

の便利さのためだけの表現選択は最小限にする

Page 31: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

獲得段階の流れ

対象と目的の明確化

評価

オントロジーの構築

既存のオントロジーの統合

獲得

コーディング

システム化の対象範囲の特定

レビュー

メタオントロジーの決定

定義の作成

獲得

Page 32: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

・ システム化の対象範囲の特定

用語の切り出し グループ化

Page 33: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

・定義の作成

メタオントロジー 各概念を熟考し、どのような基礎概念を導入するかを決定する

ワークエリア 他のワークエリアとの重なりを考慮し、複雑な関係のものから定義する

用語 各ワークエリア内で最も基本的な用語

を定義し、その後より抽象的または固有な用語へ進む - ミドルアウトアプローチ

オントロジー構築における最も重要な段階

Page 34: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

表現方法

テキストの定義は非形式さを保ち、技術的に正確な定義は、コードに直接付随する文書化において使用する

・あいまいな用語の処理

・定義段階のガイドライン

できるだけ少ない技術的用語で

概念定義を行うなどして対処する

一貫性を守る、循環性をなくす、

適切な例を与えるなど、

ガイドラインに従って慎重に定義する

正確さ

明確さ

Page 35: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

・ レビュー及びメタオントロジーの決定

レビュー 定義を批判的にレビューし、適切に訂正する

メタオントロジーの決定 自然言語の定義を使ってメタオントロジーを考案する

形式的なコーディング段階の基準として役立つ

Page 36: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

まとめ1

• オントロジーは、それぞれの問題領域の概念を構造化することにより、共有理解を得るための明示的な概念定義である。

• オントロジーには4つの形式度があり、それぞれに使い方がある。

• オントロジーには意思伝達、相互運用、システム工学の3つの利用領域がある。

Page 37: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

まとめ2

これまで紹介した手順に従い、各段階の役割を踏まえたオントロジー構築が望ましい

そうすることで獲得段階で問題となった既存のオントロジーの統合など、共有と再利用という最も重要な目標の障害を減らすことができる

Page 38: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

An Ontology Spectrum

Page 39: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

General Ontology

• WordNet(プリンストン大学で開発.名詞が 約10万語.IS-A,HAS-Aが定義.フリー) http://www.cogsci.princeton.edu/cgi-bin/webwn

• CYC(米国MCCで開発)

• EDR(日本電子化辞書)

Page 40: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

WordNet

• 10万語以上の概念を体系化(General)

• is-a,has-a関係など

• 計算機で利用可能

Page 41: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

WordNet

• http://wordnet.princeton.edu/

• 最新版:ver.3.0 for Unix-like system

– Windows版はver.2.1

• 約11万7千のsynset(同義語の集合)

• 約15万語(名詞,動詞,形容詞,副詞)

• synset間には,品詞ごとにいくつかの関係が定義されている

Page 42: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

WordNet: synset(名詞)間の主な関係

• hypernym

– X hypernym Y → XはYの上位概念(synset)

• hyponym

– X hyponym Y → XはYの下位概念(synset)

• holonym

– X holonym Y → XはYを持つ(has-a)

• meronym

– X meronym Y → XはYの一部(part-of)

Page 43: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

product: 名詞に関して6つのsynset(意味)が定義されている

キーワードを入力

Page 44: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

WordNet (オントロジーサンプル)

Page 45: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

Cyc

• 世界最大の知識ベース

– 2007年現在,約20万概念の定義,100万以上の主張を記述

• マイクロ理論 (microtheories)

– 部分世界の内部だけで整合性を保持

• OpenCyc

– Cycのオープンソース版

– http://opencyc.org/

– 試用版: • http://www.yamaguti.comp.ae.keio.ac.jp:3602/cgi-bin/cyccgi/cg?cb-

start

Page 46: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

OpenCycの特徴 • 固有の用語は「#$」ではじまる

• 「#$is-a」関係はinstance-ofを意味する

• 「#$genls」関係はis-a関係を意味する

• 「Mt」はマイクロ理論( microtheories )の省略

• WordNetのsynsetとの対応関係を定義 – Mt : WordNetMappingMt の

synonymousExternalConcept

• OpenCyc KB Browser – sourceforge.netからダウンロード可能

– Windows版とLinux版

Page 48: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

OpenCyc KB Browser

検索したい概念を入力

Page 49: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

OpenCyc KB Browser

Page 50: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

OpenCyc KB Browser

概念の追加

Page 51: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

Topic Map – Top Level

Page 52: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDR電子化辞書の概念

・識別子 ・日本語と英語の 見出しの集合 ・意味(説明) ・読み ・品詞

概念

電子計算機 コンピュータ コンピューター 電算機

computer brain box

computery electronic brain

電子回路を用いて計算,判断,記憶などを自動的に行う装置

an electronic device that speedily and automatically performs calculations, makes judgments and memorizes large amounts of information

コンピュータという概念

概念A

概念B

概念C

概念D

0ffcb7

Page 53: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDR概念体系辞書:is-a関係

学生

職業で捉えた人間

役割で捉えた人間

人間

生命体

Page 54: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDR概念記述辞書:その他の関係

• object: 動作・変化の影響を受ける対象 – 食べる—object→りんご

• agent: 有意志動作を引き起こす主体 – 食べる—agent→父

• goal: 事象の主体または対象の最後の位置 – 行く—goal→東京

• implement: 有意志動作における道具・手段 – 切る—implement→ナイフ

• a-object: 属性をもつ対象 – 赤い—a-object→トマト

• place: 事象の成立する場所 – 遊ぶ—place→部屋

• scene: 事象の成立する場面 – 演じる—scene→ドラマ

• cause: 事象の原因,理由 – 死んだ—cause→インフルエンザ

動詞的概念が名詞的概念を 支配する場合の格関係を中心に 8種類の概念関係を記述

Page 55: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDRブラウザ(EDRBrow): 単語辞書検索

Page 56: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDRブラウザ(EDRBrow): 単語辞書検索

Page 57: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDRブラウザ(EDRBrow): 上位概念検索

Page 58: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

EDRブラウザ(EDRBrow): 上位概念検索

Page 59: 知識モデリング...2.3 既存のオントロジーの統合 既存のオントロジーの全てまたは一部を、 使用するかどうか、またどのように使用す

オントロジーの分類

• 3つの軸による分類

形式度 情報量

汎用性 固有性

General

Generic

Specific

1st Level 2nd

Level 3rd Level

Light Weight Middle

Weight Heavy Weight

• General 最も一般的なレベル • Generic 対象領域があるが やはりかなり一般的 • Specific 特定領域に固有

各レベルの 情報を利用して 切り分けを 明確にする