53
Hideaki Takeda / National Institute of Informatics セセセセセセセ Web セセセセセセセ セセセセセセセ セセセセセセセ Web セセセセセセセセセセ (SIG-SWO) セセ セセ 国国国国国国国国 [email protected] Twitter: @takechan2000

セマンティックWebとオントロジー:現状と将来展望

Embed Size (px)

Citation preview

Page 1: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

セマンティック Web とオントロジー現状と将来展望

セマンティック Web とオントロジー研究会 (SIG-SWO)

武田 英明

国立情報学研究所

[email protected]

Twitter: @takechan2000

Page 2: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

セマンティック Web とオントロジー研究会 (SIG-SWO)

第2種研究会 2002年発足 主査:溝口理一郎 ( 初代 )

:山口高平 ( 二代目 ) :武田英明 ( 三代目 ) : 來村徳信 (New!)

現在の構成 主査:來村徳信 ( 阪大) 副査:川村 隆浩 (東芝) 幹事:古崎 晃司(阪大)

   大向 一輝( NII)

Page 3: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーセマンティックウェブセマンティックウェブ

Page 4: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

オントロジー研究 Semantic Web semantic web

セマンティック Web/ オントロジー・スケール

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

Page 5: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

Semantic Web semantic web

オントロジー研究

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

オントロジー研究

Page 6: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジー研究 オントロジーの基礎から応用まで

オントロジーとは何ぞや?

Page 7: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーの定義 Gruber

概念化の明示的な仕様 FIPA98

特定のドメインの構造の明示的な仕様。 対象領域を参照するための語彙(論理定数と述語記号)と領域に存在

する制約の表現と語彙の解釈を制限する論理的言明。 あるトピックに関する知識の表現と通信のための語彙とその語彙で示

される実在物 (entity) の関係と属性の集合である。 もっとわかり易くいえば

共通の概念の体系(“語彙”とその定義とそれら間の関係) 語彙以上 OOのオブジェクト未満

Page 8: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーの定義 存在に関する体系的議論(哲学) 概念化の明示的な仕様( T. Gruber) 人工システムを構築する際のビルディングブロックとして用いられる基

本概念/語彙の体系(理論)(溝口) ある目的のための世界の認識の合意(武田)

Page 9: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーの構成要素 「概念」の集合 「概念」の is-a 関係による階層化 「概念」間のそれ以外の関係の付与 「概念」の公理化(意味付与)

Page 10: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーの役割 人間間において

合意をえる手段 暗黙情報の明示化

システム間で (システム間の)コミュニケーションの定義 システムの仕様の明瞭化

人間ーシステムの関係において 知的検索 知識の共有と再利用

Page 11: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジー利用のレベル(1)共通語彙 (2)意味検索 (3)インデックス (4)データスキーマ (5)知識共有の媒体 (6)情報分析 (7)情報抽出 (8)知識モデルの規約 (9)知識の体系化

Page 12: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

オントロジーの種類と利用法

  オントロジーの種類  

オントロジーの利用法語彙集合、簡易スキーマ

概念階層 そのほかの関係を含む

意味制約も含む

強い公理を含む 合計

(1)共通語彙 1 4 12 1 0 18(2)意味検索 2 2 49 5 1 59(3)インデックス 1 3 28 5 0 37

(4)データスキーマ 1 0 35 5 0 41

(5)知識共有の媒体 3 0 39 4 0 46

(6)情報分析 4 1 30 5 0 40

(7)情報抽出 1 2 25 4 1 33

(8)知識モデルの規約 0 1 51 12 10 74

(9)知識の体系化 0 2 8 1 0 11合計 13 15 277 42 12 359

Page 13: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 20090

20

40

60

80

100

120

140

160

“ ”オントロジー を含む論文( CiNii)

オントロジー

Page 14: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

人工知能学会誌特集:「オントロジーの進化と普及」

概念体系とオントロジー ―基礎的ターミノロジーの提案― ……… Gunnar O. Klein ・ Barry Smith ・來村徳信

現代応用オントロジーの哲学的・論理学的源泉 ……… 岡田光弘 言語的オントロジーの構築と展開……… 林良彦 ビジネスに使えるオントロジー関連ツール ―代表的シーンからの抽出― ………

川村隆浩・長野伸一 オントロジー学習の現状と動向 ……… 森田武史・山口高平 オントロジー利用研究の分類と傾向………… 古崎晃司 生物学関連のオントロジーの最新動向 ………… 桝屋啓志 臨床医学知識処理を目指した医療オントロジー……… 大江和彦・今井健 SNOMED-CT と ICD-11 に見る医学・医療分野の Ready to Use Ontology ………藤

田 伸輔・今井健 情報家電をより身近にするオントロジー……… 大沼宏行・松平正樹・細見格・福重貴雄・富岡豊・野本昌子

ものづくり情報連携におけるオントロジーの応用 ……… 西岡靖之 目的指向プロセスのオントロジー的共通性に基づいた人工物機能とモバイルユーザ行動のモデリングとその応用 ……… 來村徳信・笹嶋宗彦・溝口理一郎

Page 15: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

        合計 (日本語 英語)

------------------------------------------登録ユーザ数:  2209  (  859  

1350 )ダウンロード数: 6737  ( 4022  

2715 )

Page 16: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

ダウンロード数:約150件 ( 約 2ヶ月 )

Page 17: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

オントロジー研究 semantic web

( 大文字の )Semantic Web

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

Semantic Web

Page 18: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の目的 “The Semantic Web is an extension of the current web in

which information is given well-defined meaning, better enabling computers and people to work in cooperation.” ( セマンティック Web とは現在の Web の拡張であり,そこでは情報はちゃんと定義された意味を与えられていてコンピュータと人のよりよい協調が可能となる).

The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila

The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.( セマンティック Web とはビジョンである.データはきちんと定義されリンクされており,単に表示用ではなく自動化,統合,アプリケーションを超えたデータの再利用などに使える)

http://www.w3.org/2001/sw/

Page 19: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Next Generation Web

Web の進化 HTML: 表示のための Web XML: シンタックスをもった Web ?? : セマンティックスをもった Web

なぜセマンティックスを Web のメカニズムの中に組み込なねばならないか 人間のための Web

から 人間と機械のための Web

 ヘcf. 機械ためだけの Web

Page 20: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の階梯 RDF (Resource Description Framework)

最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット

RDF Schema RDF に最も原始的な概念記述の仕組みを追加

class-subclass 関係,制約 OWL (Web Ontology Language)

記述論理 (description logics) に基づいた概念とその関係を記述する言語

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

Page 21: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

A B

C

E

D

RDF で意味付けされたウェブページ

ウェブページ作成者

従来の HTML のウェブページ

RDFS で表現されたオントロジー

SPARQL で表現された検索問合せ

ウェブページ探索者

推論のためのルール

D

F

C

E

自然文で記述された情報をいかに効率的に

変換するか?

いかに手間なく記述させるのか?いかに表記をそろえさせるか?

いかに網羅性、一貫性を確保するか?

いかに普及させるのか?

a b

c

知識の表現 UI

ユーザの検索意図をどのように把握し表現するか?

複雑な知識構造をいかに分かりやすく提示するか?

どのように知識を融合 (推論 )させるのか?

知識・情報をどのように記述するか?

Semantic Web の利用の枠組みと課題

バイオ基幹情報資源の高準化と共用化「バイオ分野におけるセマンティックWeb 技術動向に関する調査」より抜粋

Page 22: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

特集テーマ/招待講演 (抜粋 ) 第 3回:招待講演:辻井潤一「テキスト情報処理とオントロジー」

(2002/6) 第 6回:特集テーマ「 Weblog 」 (2004/7)招待講演:山下清美「 Weblog の心理学」

第 10回:特集テーマ:「ライトウエイト・メタデータ( blog, SNS, wiki他)」 (2005/11)

第 12回:特集テーマ「セマンティック Webサービス」 (2006/1)招待講演: D. Fansel & M. Zaremba “Semantically Enabled Service-Oriented Architectures: A Framework"

第 13回:特集テーマ「セマンティック Web 」 第 14回:特集テーマ「セマンティック Web と Web2.0 」 (2006/11) 第 16回:特集テーマ「領域オントロジーの利用」 (2007/7) 第 17回:招待講演: N. Guarino “An introduction to formal ontological

analysis”(2008/2) 第 18回:特集テーマ「知識構造化のツール・方法論・事例」 (2008/12) 第 20回: Wikipediaワークショップ (2009/1)

Page 23: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web に関する会議

International Semantic Web Conferences

(2002- )

European Semantic Web Conferences(2004- )

Asian Semantic Web Conferences(2006- )

Page 24: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web に関する会議 World Wide Web Conferences における Track

2002-2007: Semantic Web 2008,2009: Semantic / Data Web

その他 セマンティック Web コンファレンス(日本)  2001-2009 RuleML (The International RuleML Symposium on Rule

Interchange and Applications) 2005-

Page 25: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

7

Page 26: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

オントロジー研究 Semantic Web semantic web

(小文字の )semantic web

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

Page 27: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

(小文字の )semantic web

広い意味でのセマンティック Web を実現する RDF(S)/OWL に必ずしも依存しない 今の Web 情報を最大限利用する セマンティック技術の活用( NLP、メタデータ、、、)

二つのアプローチ メタデータの異なるアプローチ

microformats, atom Web 2.0 的データの活用

blog, social tagging, SNS, wikipedia

Page 28: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

特集テーマ/招待講演 (抜粋 ) 第 3回:招待講演:辻井潤一「テキスト情報処理とオントロジー」

(2002/6) 第 6回:特集テーマ「 Weblog 」 (2004/7)招待講演:山下清美「 Weblog の心理学」

第 10回:特集テーマ:「ライトウエイト・メタデータ( blog, SNS, wiki他)」 (2005/11)

第 12回:特集テーマ「セマンティック Webサービス」 (2006/1)招待講演: D. Fansel & M. Zaremba “Semantically Enabled Service-Oriented Architectures: A Framework"

第 13回:特集テーマ「セマンティック Web 」 第 14回:特集テーマ「セマンティック Web と Web2.0 」 (2006/11) 第 16回:特集テーマ「領域オントロジーの利用」 (2007/7) 第 17回:招待講演: N. Guarino “An introduction to formal ontological

analysis”(2008/2) 第 18回:特集テーマ「知識構造化のツール・方法論・事例」 (2008/12) 第 20回: Wikipediaワークショップ (2009/1)

Page 29: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Wikipedia ワークショップ 2009/1/22 終日 15件発表+1チュートリアル+1招待講演 参加者:120名程度

大学:企業=2:1(参加票より) 大体は研究者、少し Wikipedia コミュニティ、マスコミ

Page 30: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

なんのために Wikipedia を研究するか “Wikipedia 現象”の解明

コンテンツの共同作成プロセスや編集者コミュニティの分析 利用状況や利用者コミュニティの分析作成されたコンテンツの分析

Wikipedia データの利用 情報検索 情報推薦 信頼性推定 2次データ作成

用語辞典作成 シソーラス作成 知識ベース作成 オントロジー作成

18+27

145+167

37+30

25+2211+29

9+10

13+1715+1516+17

53+59

Page 31: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Wikipedia の何に注目するのか 編集プロセスに注目

合意形成プロセス 集団性、社会性、社会ネットワーク、コミュニティ

利用プロセスや利用者に注目 利用状況の分析 利用者コミュニティの分析

共同作成されたコンテンツに着目 知識の集合として

構造的な知識、オントロジーの抽出常識、日常知識の抽出意外な知識の発見

言語の集合として、多言語の集合として 構造化文書の集合として

3+20

2+12

71+61

Page 32: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

どんな研究分野か 知識処理(人工知能) 自然言語処理 データベース ネットワーク分析、ネットワーク科学 言語学 社会学 そのほか

22 13

18 14

10 12

3 8

2 102 7

1 1

Page 33: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

オントロジー研究 Semantic Web semantic web

セマンティック Web/ オントロジー・スケール

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

Page 34: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Linked Data

Linked Data とは “ Web of Data” RDF で公開されるデータ 外部から参照可能

Linked Data のための 4条件 事柄の名前に URI を使うこと

すべてのモノ,コトに URIを! 名前の参照が HTTP URI でできること

DOIとかいった URNは使わないでね URI を参照したときに関連情報が手に入るように

理解可能なデータを提供してね. 外部へのリンクも含めよう

Webのようにリンクでつながるデータを作ろうLinked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html

Page 35: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の階梯 RDF (Resource Description Framework)

最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット

RDF Schema RDF に最も原始的な概念記述の仕組みを追加

class-subclass 関係,制約 OWL (Web Ontology Language)

記述論理 (description logics) に基づいた概念とその関係を記述する言語

Rule-ML …

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

もっと上へ、もっと上へ

Page 36: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の階梯 抽象問題から具体問題への回帰

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 37: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の階梯 オントロジー

クラスに関する記述 RDFS、 OWL オントロジー構築の課題

オントロジー構築はそもそも大変 一貫性、網羅性、論理性

複数オントロジーの統合・関連付けはもっと大変

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 38: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Semantic Web の階梯 Linked Data

インスタンスに関する記述=個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点

書きやすい(事実に関する記述が主)リンクしやすい(同)

Linked Data の記述における問題点複雑な記述は難しい それでもクラス定義は必要(→オントロジー)

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 39: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Linking Open Data (LOD)

公開された Linked Data を集めるプロジェクト 主要な Linked Data (データ変換)

Dbpedia (Wikipedia) : 百科事典 , 2.7億文 Geonames :地名と緯度経度 , 9300万文 MusicBrainz :音楽 WordNet :辞書 DBLP bibliography :論文の書誌, 2800万文 US Census Data: 米国国勢調査 (2000 年 ), 10億文

(クロール) FOAF (Friend Of A Friend) :個人と個人関係のプロファイ

ル (ラッパー)

Flickr Wrapper

Page 40: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

131億文1.41 万個のリンク

Life Science and Health Care

Geographic informationPapers

Web-based Information

Music

Page 41: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

LOD の発展 (1)

As of March 2008

Page 42: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

LOD の発展 (2)

Page 43: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

LOD の発展 (3)

Page 44: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

131億文1.41 万個のリンク

LOD の発展 (4)

Page 45: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Page 46: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

DBpedia Mobile

Page 47: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://id.ndl.go.jp/auth/ndlsh/

http://id.ndl.go.jp/auth/ndlsh/?query=PREFIX+skos%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0A%0D%0ASELECT+DISTINCT+%3Fy+%3Flabel%0D%0AWHERE+%7B%0D%0A+++%3Fx+rdfs%3Alabel+%22%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD%22+.%0D%0A+++%3Fx+skos%3Arelated+%3Fy+.%0D%0A+++%3Fy+rdfs%3Alabel+%3Flabel+.%0D%0A+++FILTER%28%3Flabel+%21%3D+%22%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD%22%29%0D%0A%7D%0D%0A&output=htmltab

Page 48: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Page 49: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Page 50: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

LOD.AC Museum

日本の美術館・博物館の情報を Linked Data化 めざせ 3000 館 !?

手法 オントロジー : Lightweight Ontotology

Japeana!? (日本版 Europeana) 情報収集 : Crawling & Scripting

ミーニク !? (美術館版カーリル ) 目下がんばっています

Page 51: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Page 52: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

Page 53: セマンティックWebとオントロジー:現状と将来展望

Hideaki Takeda / National Institute of Informatics

http://www.flickr.com/photos/breebailey/470692148/

オントロジー研究 Semantic Web semantic web

オントロジー・セマンティックウェブ・セマンティックウェブ

論理知識表現 領域オントロジー

形式オントロジー OWL RDFS microformats tags

記述論理 軽量オントロジー

LinkedData集合知

Wikipedia

Web は AI の新しいプレイグランド Semantic Web は Web と AI を結ぶコンセプト

社会につながった研究 未来をつくる研究