Upload
hideaki-takeda
View
7.464
Download
0
Embed Size (px)
Citation preview
Hideaki Takeda / National Institute of Informatics
セマンティック Web とオントロジー現状と将来展望
セマンティック Web とオントロジー研究会 (SIG-SWO)
武田 英明
国立情報学研究所
Twitter: @takechan2000
Hideaki Takeda / National Institute of Informatics
セマンティック Web とオントロジー研究会 (SIG-SWO)
第2種研究会 2002年発足 主査:溝口理一郎 ( 初代 )
:山口高平 ( 二代目 ) :武田英明 ( 三代目 ) : 來村徳信 (New!)
現在の構成 主査:來村徳信 ( 阪大) 副査:川村 隆浩 (東芝) 幹事:古崎 晃司(阪大)
大向 一輝( NII)
Hideaki Takeda / National Institute of Informatics
オントロジーセマンティックウェブセマンティックウェブ
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
オントロジー研究 Semantic Web semantic web
セマンティック Web/ オントロジー・スケール
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
Semantic Web semantic web
オントロジー研究
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
オントロジー研究
Hideaki Takeda / National Institute of Informatics
オントロジー研究 オントロジーの基礎から応用まで
オントロジーとは何ぞや?
Hideaki Takeda / National Institute of Informatics
オントロジーの定義 Gruber
概念化の明示的な仕様 FIPA98
特定のドメインの構造の明示的な仕様。 対象領域を参照するための語彙(論理定数と述語記号)と領域に存在
する制約の表現と語彙の解釈を制限する論理的言明。 あるトピックに関する知識の表現と通信のための語彙とその語彙で示
される実在物 (entity) の関係と属性の集合である。 もっとわかり易くいえば
共通の概念の体系(“語彙”とその定義とそれら間の関係) 語彙以上 OOのオブジェクト未満
Hideaki Takeda / National Institute of Informatics
オントロジーの定義 存在に関する体系的議論(哲学) 概念化の明示的な仕様( T. Gruber) 人工システムを構築する際のビルディングブロックとして用いられる基
本概念/語彙の体系(理論)(溝口) ある目的のための世界の認識の合意(武田)
Hideaki Takeda / National Institute of Informatics
オントロジーの構成要素 「概念」の集合 「概念」の is-a 関係による階層化 「概念」間のそれ以外の関係の付与 「概念」の公理化(意味付与)
Hideaki Takeda / National Institute of Informatics
オントロジーの役割 人間間において
合意をえる手段 暗黙情報の明示化
システム間で (システム間の)コミュニケーションの定義 システムの仕様の明瞭化
人間ーシステムの関係において 知的検索 知識の共有と再利用
Hideaki Takeda / National Institute of Informatics
オントロジー利用のレベル(1)共通語彙 (2)意味検索 (3)インデックス (4)データスキーマ (5)知識共有の媒体 (6)情報分析 (7)情報抽出 (8)知識モデルの規約 (9)知識の体系化
Hideaki Takeda / National Institute of Informatics
オントロジーの種類と利用法
オントロジーの種類
オントロジーの利用法語彙集合、簡易スキーマ
概念階層 そのほかの関係を含む
意味制約も含む
強い公理を含む 合計
(1)共通語彙 1 4 12 1 0 18(2)意味検索 2 2 49 5 1 59(3)インデックス 1 3 28 5 0 37
(4)データスキーマ 1 0 35 5 0 41
(5)知識共有の媒体 3 0 39 4 0 46
(6)情報分析 4 1 30 5 0 40
(7)情報抽出 1 2 25 4 1 33
(8)知識モデルの規約 0 1 51 12 10 74
(9)知識の体系化 0 2 8 1 0 11合計 13 15 277 42 12 359
Hideaki Takeda / National Institute of Informatics
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 20090
20
40
60
80
100
120
140
160
“ ”オントロジー を含む論文( CiNii)
オントロジー
Hideaki Takeda / National Institute of Informatics
人工知能学会誌特集:「オントロジーの進化と普及」
概念体系とオントロジー ―基礎的ターミノロジーの提案― ……… Gunnar O. Klein ・ Barry Smith ・來村徳信
現代応用オントロジーの哲学的・論理学的源泉 ……… 岡田光弘 言語的オントロジーの構築と展開……… 林良彦 ビジネスに使えるオントロジー関連ツール ―代表的シーンからの抽出― ………
川村隆浩・長野伸一 オントロジー学習の現状と動向 ……… 森田武史・山口高平 オントロジー利用研究の分類と傾向………… 古崎晃司 生物学関連のオントロジーの最新動向 ………… 桝屋啓志 臨床医学知識処理を目指した医療オントロジー……… 大江和彦・今井健 SNOMED-CT と ICD-11 に見る医学・医療分野の Ready to Use Ontology ………藤
田 伸輔・今井健 情報家電をより身近にするオントロジー……… 大沼宏行・松平正樹・細見格・福重貴雄・富岡豊・野本昌子
ものづくり情報連携におけるオントロジーの応用 ……… 西岡靖之 目的指向プロセスのオントロジー的共通性に基づいた人工物機能とモバイルユーザ行動のモデリングとその応用 ……… 來村徳信・笹嶋宗彦・溝口理一郎
Hideaki Takeda / National Institute of Informatics
合計 (日本語 英語)
------------------------------------------登録ユーザ数: 2209 ( 859
1350 )ダウンロード数: 6737 ( 4022
2715 )
Hideaki Takeda / National Institute of Informatics
ダウンロード数:約150件 ( 約 2ヶ月 )
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
オントロジー研究 semantic web
( 大文字の )Semantic Web
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
Semantic Web
Hideaki Takeda / National Institute of Informatics
Semantic Web の目的 “The Semantic Web is an extension of the current web in
which information is given well-defined meaning, better enabling computers and people to work in cooperation.” ( セマンティック Web とは現在の Web の拡張であり,そこでは情報はちゃんと定義された意味を与えられていてコンピュータと人のよりよい協調が可能となる).
The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila
The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.( セマンティック Web とはビジョンである.データはきちんと定義されリンクされており,単に表示用ではなく自動化,統合,アプリケーションを超えたデータの再利用などに使える)
http://www.w3.org/2001/sw/
Hideaki Takeda / National Institute of Informatics
Next Generation Web
Web の進化 HTML: 表示のための Web XML: シンタックスをもった Web ?? : セマンティックスをもった Web
なぜセマンティックスを Web のメカニズムの中に組み込なねばならないか 人間のための Web
から 人間と機械のための Web
ヘcf. 機械ためだけの Web
Hideaki Takeda / National Institute of Informatics
Semantic Web の階梯 RDF (Resource Description Framework)
最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット
RDF Schema RDF に最も原始的な概念記述の仕組みを追加
class-subclass 関係,制約 OWL (Web Ontology Language)
記述論理 (description logics) に基づいた概念とその関係を記述する言語
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
Hideaki Takeda / National Institute of Informatics
A B
C
E
D
RDF で意味付けされたウェブページ
ウェブページ作成者
従来の HTML のウェブページ
RDFS で表現されたオントロジー
SPARQL で表現された検索問合せ
ウェブページ探索者
推論のためのルール
D
F
C
E
自然文で記述された情報をいかに効率的に
変換するか?
いかに手間なく記述させるのか?いかに表記をそろえさせるか?
いかに網羅性、一貫性を確保するか?
いかに普及させるのか?
a b
c
知識の表現 UI
ユーザの検索意図をどのように把握し表現するか?
複雑な知識構造をいかに分かりやすく提示するか?
どのように知識を融合 (推論 )させるのか?
知識・情報をどのように記述するか?
Semantic Web の利用の枠組みと課題
バイオ基幹情報資源の高準化と共用化「バイオ分野におけるセマンティックWeb 技術動向に関する調査」より抜粋
Hideaki Takeda / National Institute of Informatics
特集テーマ/招待講演 (抜粋 ) 第 3回:招待講演:辻井潤一「テキスト情報処理とオントロジー」
(2002/6) 第 6回:特集テーマ「 Weblog 」 (2004/7)招待講演:山下清美「 Weblog の心理学」
第 10回:特集テーマ:「ライトウエイト・メタデータ( blog, SNS, wiki他)」 (2005/11)
第 12回:特集テーマ「セマンティック Webサービス」 (2006/1)招待講演: D. Fansel & M. Zaremba “Semantically Enabled Service-Oriented Architectures: A Framework"
第 13回:特集テーマ「セマンティック Web 」 第 14回:特集テーマ「セマンティック Web と Web2.0 」 (2006/11) 第 16回:特集テーマ「領域オントロジーの利用」 (2007/7) 第 17回:招待講演: N. Guarino “An introduction to formal ontological
analysis”(2008/2) 第 18回:特集テーマ「知識構造化のツール・方法論・事例」 (2008/12) 第 20回: Wikipediaワークショップ (2009/1)
Hideaki Takeda / National Institute of Informatics
Semantic Web に関する会議
International Semantic Web Conferences
(2002- )
European Semantic Web Conferences(2004- )
Asian Semantic Web Conferences(2006- )
Hideaki Takeda / National Institute of Informatics
Semantic Web に関する会議 World Wide Web Conferences における Track
2002-2007: Semantic Web 2008,2009: Semantic / Data Web
その他 セマンティック Web コンファレンス(日本) 2001-2009 RuleML (The International RuleML Symposium on Rule
Interchange and Applications) 2005-
Hideaki Takeda / National Institute of Informatics
7
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
オントロジー研究 Semantic Web semantic web
(小文字の )semantic web
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
Hideaki Takeda / National Institute of Informatics
(小文字の )semantic web
広い意味でのセマンティック Web を実現する RDF(S)/OWL に必ずしも依存しない 今の Web 情報を最大限利用する セマンティック技術の活用( NLP、メタデータ、、、)
二つのアプローチ メタデータの異なるアプローチ
microformats, atom Web 2.0 的データの活用
blog, social tagging, SNS, wikipedia
Hideaki Takeda / National Institute of Informatics
特集テーマ/招待講演 (抜粋 ) 第 3回:招待講演:辻井潤一「テキスト情報処理とオントロジー」
(2002/6) 第 6回:特集テーマ「 Weblog 」 (2004/7)招待講演:山下清美「 Weblog の心理学」
第 10回:特集テーマ:「ライトウエイト・メタデータ( blog, SNS, wiki他)」 (2005/11)
第 12回:特集テーマ「セマンティック Webサービス」 (2006/1)招待講演: D. Fansel & M. Zaremba “Semantically Enabled Service-Oriented Architectures: A Framework"
第 13回:特集テーマ「セマンティック Web 」 第 14回:特集テーマ「セマンティック Web と Web2.0 」 (2006/11) 第 16回:特集テーマ「領域オントロジーの利用」 (2007/7) 第 17回:招待講演: N. Guarino “An introduction to formal ontological
analysis”(2008/2) 第 18回:特集テーマ「知識構造化のツール・方法論・事例」 (2008/12) 第 20回: Wikipediaワークショップ (2009/1)
Hideaki Takeda / National Institute of Informatics
Wikipedia ワークショップ 2009/1/22 終日 15件発表+1チュートリアル+1招待講演 参加者:120名程度
大学:企業=2:1(参加票より) 大体は研究者、少し Wikipedia コミュニティ、マスコミ
Hideaki Takeda / National Institute of Informatics
なんのために Wikipedia を研究するか “Wikipedia 現象”の解明
コンテンツの共同作成プロセスや編集者コミュニティの分析 利用状況や利用者コミュニティの分析作成されたコンテンツの分析
Wikipedia データの利用 情報検索 情報推薦 信頼性推定 2次データ作成
用語辞典作成 シソーラス作成 知識ベース作成 オントロジー作成
18+27
145+167
37+30
25+2211+29
9+10
13+1715+1516+17
53+59
Hideaki Takeda / National Institute of Informatics
Wikipedia の何に注目するのか 編集プロセスに注目
合意形成プロセス 集団性、社会性、社会ネットワーク、コミュニティ
利用プロセスや利用者に注目 利用状況の分析 利用者コミュニティの分析
共同作成されたコンテンツに着目 知識の集合として
構造的な知識、オントロジーの抽出常識、日常知識の抽出意外な知識の発見
言語の集合として、多言語の集合として 構造化文書の集合として
3+20
2+12
71+61
Hideaki Takeda / National Institute of Informatics
どんな研究分野か 知識処理(人工知能) 自然言語処理 データベース ネットワーク分析、ネットワーク科学 言語学 社会学 そのほか
22 13
18 14
10 12
3 8
2 102 7
1 1
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
オントロジー研究 Semantic Web semantic web
セマンティック Web/ オントロジー・スケール
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
Hideaki Takeda / National Institute of Informatics
Linked Data
Linked Data とは “ Web of Data” RDF で公開されるデータ 外部から参照可能
Linked Data のための 4条件 事柄の名前に URI を使うこと
すべてのモノ,コトに URIを! 名前の参照が HTTP URI でできること
DOIとかいった URNは使わないでね URI を参照したときに関連情報が手に入るように
理解可能なデータを提供してね. 外部へのリンクも含めよう
Webのようにリンクでつながるデータを作ろうLinked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html
Hideaki Takeda / National Institute of Informatics
Semantic Web の階梯 RDF (Resource Description Framework)
最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット
RDF Schema RDF に最も原始的な概念記述の仕組みを追加
class-subclass 関係,制約 OWL (Web Ontology Language)
記述論理 (description logics) に基づいた概念とその関係を記述する言語
Rule-ML …
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
もっと上へ、もっと上へ
Hideaki Takeda / National Institute of Informatics
Semantic Web の階梯 抽象問題から具体問題への回帰
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda / National Institute of Informatics
Semantic Web の階梯 オントロジー
クラスに関する記述 RDFS、 OWL オントロジー構築の課題
オントロジー構築はそもそも大変 一貫性、網羅性、論理性
複数オントロジーの統合・関連付けはもっと大変
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda / National Institute of Informatics
Semantic Web の階梯 Linked Data
インスタンスに関する記述=個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点
書きやすい(事実に関する記述が主)リンクしやすい(同)
Linked Data の記述における問題点複雑な記述は難しい それでもクラス定義は必要(→オントロジー)
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda / National Institute of Informatics
Linking Open Data (LOD)
公開された Linked Data を集めるプロジェクト 主要な Linked Data (データ変換)
Dbpedia (Wikipedia) : 百科事典 , 2.7億文 Geonames :地名と緯度経度 , 9300万文 MusicBrainz :音楽 WordNet :辞書 DBLP bibliography :論文の書誌, 2800万文 US Census Data: 米国国勢調査 (2000 年 ), 10億文
(クロール) FOAF (Friend Of A Friend) :個人と個人関係のプロファイ
ル (ラッパー)
Flickr Wrapper
Hideaki Takeda / National Institute of Informatics
131億文1.41 万個のリンク
Life Science and Health Care
Geographic informationPapers
Web-based Information
Music
Hideaki Takeda / National Institute of Informatics
LOD の発展 (1)
As of March 2008
Hideaki Takeda / National Institute of Informatics
LOD の発展 (2)
Hideaki Takeda / National Institute of Informatics
LOD の発展 (3)
Hideaki Takeda / National Institute of Informatics
131億文1.41 万個のリンク
LOD の発展 (4)
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
DBpedia Mobile
Hideaki Takeda / National Institute of Informatics
http://id.ndl.go.jp/auth/ndlsh/
http://id.ndl.go.jp/auth/ndlsh/?query=PREFIX+skos%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0A%0D%0ASELECT+DISTINCT+%3Fy+%3Flabel%0D%0AWHERE+%7B%0D%0A+++%3Fx+rdfs%3Alabel+%22%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD%22+.%0D%0A+++%3Fx+skos%3Arelated+%3Fy+.%0D%0A+++%3Fy+rdfs%3Alabel+%3Flabel+.%0D%0A+++FILTER%28%3Flabel+%21%3D+%22%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD%22%29%0D%0A%7D%0D%0A&output=htmltab
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
LOD.AC Museum
日本の美術館・博物館の情報を Linked Data化 めざせ 3000 館 !?
手法 オントロジー : Lightweight Ontotology
Japeana!? (日本版 Europeana) 情報収集 : Crawling & Scripting
ミーニク !? (美術館版カーリル ) 目下がんばっています
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
Hideaki Takeda / National Institute of Informatics
http://www.flickr.com/photos/breebailey/470692148/
オントロジー研究 Semantic Web semantic web
オントロジー・セマンティックウェブ・セマンティックウェブ
論理知識表現 領域オントロジー
形式オントロジー OWL RDFS microformats tags
記述論理 軽量オントロジー
LinkedData集合知
Wikipedia
Web は AI の新しいプレイグランド Semantic Web は Web と AI を結ぶコンセプト
社会につながった研究 未来をつくる研究