Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1
Hideaki Takeda / National Institute of Informatics
Semantic Webとオントロジー:現状と課題
武田英明国立情報学研究所総合研究大学院大学
takeda@nii.ac.jp
Hideaki Takeda / National Institute of Informatics
概要Semantic Webの位置付けSemantic Webの実現方法
RDFRDF SchemaDAML+OIL(OWL)
Semantic Webの課題オントロジー概念体系の収集と統合
2
Hideaki Takeda / National Institute of Informatics
The Semantic Webの目的"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."
The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila
The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
http://www.w3.org/2001/sw/
Hideaki Takeda / National Institute of Informatics
Semantic WebWebを通じてさまざまな情報交換の実現
自動化統合
データの再利用
自動化統合
データの再利用
3
Hideaki Takeda / National Institute of Informatics
Next Generation Web?Webの進化
HTML: 表示のためのWebXML:シンタックスをもったWeb?? :セマンティックスをもったWeb
なぜセマンティックスをWebのメカニズムの中に組み込なねばならないか人間のためのWebから人間と機械のためのWeb ヘcf. 機械ためだけのWeb
Hideaki Takeda / National Institute of Informatics
なぜXMLでは不十分か
“person”, “name”とは何を意味するのか.“name”と“名前”は同じなのだろうか.(同一性)これは“person”の記述して十分なのだろうか(拘束条件)…
結局,シンタックスだけは解決つかない
<person><name> Hideaki Takeda</name><age> 20</age>
</person>
<個人><名前>Hideaki Takeda</名前><年齢> 20</年齢>
</個人>
4
Hideaki Takeda / National Institute of Informatics
Semantic Webの階梯RDF (Resource Description Framework)最も原始的な意味記述の枠組みを提供ー>SVOモデル
Entity-Relation Model(実体関連モデル)セマンティックネット
RDF SchemaRDFに最も原始的な概念記述の仕組みを追加
class-subclass関係,制約DAML+OILより一般的な概念記述の枠組みを提供多様なクラス表現,多様な制約
DAML-Sプロセスの記述
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
Hideaki Takeda / National Institute of Informatics
Semantic Webの発展の流れWeb Communityから意味へ,知識へHTML -> XML -> RDF -> RDF Schema -> DAML+OIL
->XML schema ->
Knowledge Sharing Communityから閉じた知識表現から開いた知識表現へ深さよりも広さを完全性より可能性を
KIF, Ontolinga -> OKBC -> DAML+OIL
5
Hideaki Takeda / National Institute of Informatics
RDF (Resource Description Framework)メタデータを記述する枠組みモデルとシンタックスの分離W3C Recommendation (1999)
Hideaki Takeda / National Institute of Informatics
RDF モデル要素
Resource: URI(Universal Resource Identifier)でさせるもの全てLiteral(文字列)必ずしもWebでアクセス可能である必要はない
Property: resourceを記述する属性(attribute)Resourceと同様にURIあるいはLiteral
Statement: resource, property, propertyの3つ組
6
Hideaki Takeda / National Institute of Informatics
RDFモデル文
http://www-kasm.nii.ac.jp/~takedaのcreator “Hideaki Takeda” である
構造
Resource (subject): http://www-kasm.nii.ac.jp/~takedaProperty (predicate): CreatorValue (object): “Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator
Resource Property Value
Hideaki Takeda / National Institute of Informatics
RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“http://www.nii.ac.jp/staffid/123456であり,それはHideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creatorhttp://www.nii.ac.jp/staffid/123456
name email
7
Hideaki Takeda / National Institute of Informatics
RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creator
name email
Hideaki Takeda / National Institute of Informatics
RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”である
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator
Resource Property Value<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://dublincore.org/2001/08/14/dces#">
<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda"> <dc:Creator>Hideaki Takeda</dc:Creator>
</rdf:Description> </rdf:RDF> <rdf:RDF>
<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda"> <dc:Creator rdf:resource=“Hideaki Takeda” />
</rdf:Description> </rdf:RDF>
8
Hideaki Takeda / National Institute of Informatics
RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creator
name email
<rdf:RDF> <rdf:Description >
<dc:Creator><rdf:Description resource = " http://www.nii.ac.jp/staffid/123456 " >
<p:name>Hideaki Takeda</p:name> <p:email>[email protected]</p:email>
</rdf:Description></dc:Creator>
</rdf:Description> </rdf:RDF>
Hideaki Takeda / National Institute of Informatics
RDFS (RDF Schema)より強力な知識表現モデルの採用
RDF: ERモデル,セマンティックネットモデルRDF Schema: Frameモデル,オブジェクト指向モデルただし最小限の定義のみProperty中心型定義
RDFとして定義
9
Hideaki Takeda / National Institute of Informatics
RDF Schemardfs:Classrdfs:SubclassOfクラスを詳細化したもの複数可推移性
rdf:typeあるクラスのインスタンスのとき
rdf:property属性にあたるもの注意:propertyはグローバル
rdfs:subPropertyOfpropertyを詳細化したもの推移性
Range(値域)
一つ指定できる
Cardinality(個数制限)は
ない
Domain(定義域)
複数指定できる(OR)
Hideaki Takeda / National Institute of Informatics
RDF Schema<rdf:RDF xml:lang="en"xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
<rdfs:Class rdf:ID="Person"><rdfs:comment>The class of people.</rdfs:comment><rdfs:subClassOf rdf:resource="http://www.w3.org/
2000/03/example/ classes#Animal"/></rdfs:Class><rdf:Property ID="maritalStatus"><rdfs:range rdf:resource="#MaritalStatus"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdf:Property ID="ssn"><rdfs:comment>Social Security Number</rdfs:comment><rdfs:range
rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdf:Property ID="age"><rdfs:range
rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdfs:Class rdf:ID="MaritalStatus"/><MaritalStatus rdf:ID="Married"/><MaritalStatus rdf:ID="Divorced"/><MaritalStatus rdf:ID="Single"/><MaritalStatus rdf:ID="Widowed"/></rdf:RDF>
Animal
Person
ssnage
maritalStatus
s
d
MaritalStatus
r
“The class of person”
rdfs:comment
Integer
d
r
d
“Social Security Number”
rdfs:comment
t = rdf:typed = rdfs:domainr = rdfs:range= class= class instance= property
Resource Description Framework(RDF) Schema Specification 1.0http://www.w3.org/TR/2000/CR-rdf-schema-20000327/
Married
Divorced
Single
Windowed
t
t
t
t
10
Hideaki Takeda / National Institute of Informatics
DAML+OILRDFSにより豊富なクラス表現と制約の方法を追加Description LogicのfravorFrame表現のfravor特徴クラスクラス要素:必要条件,必要十分条件の区別が可能クラス表現:プロパティによる制約(クラスのスロット定義の相当)型制限(全称/限量),個数制限,型指定個数制限
クラスの論理演算:和,積,否定プロパティ定義域,値域の複数指定(積)推移性の指定
定義のインポート
Hideaki Takeda / National Institute of Informatics
DAML+OIL記述例<rdf:RDFxmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:daml="http://www.daml.org/2001/03/daml+oil#"xmlns:xsd ="http://www.w3.org/2000/10/XMLSchema#"xmlns:dex ="http://www.daml.org/2001/03/daml+oil-ex#"xmlns:exd ="http://www.daml.org/2001/03/daml+oil-ex-dt#"xmlns ="http://www.daml.org/2001/03/daml+oil-ex#“
>
<daml:Ontology rdf:about=""><rdfs:comment>An example ontology by Takeda, with data types taken from XMLSchema</rdfs:comment><daml:imports rdf:resource="http://www.daml.org/2001/03/daml+oil"/>
</daml:Ontology>
<daml:Class rdf:ID="Animal"><rdfs:label>Animal</rdfs:label><rdfs:comment>This class of animals is illustrative of a number of ontological idioms.</rdfs:comment>
</daml:Class>
DAML+OIL Examplehttp://www.daml.org/2001/03/daml+oil-ex.daml
11
Hideaki Takeda / National Institute of Informatics
<daml:ObjectProperty rdf:ID="name"><rdfs:domain rdf:resource="#Animal"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#decimal"/>
</daml:ObjectProperty><daml:DatatypeProperty rdf:ID="age"><rdfs:comment>
age is a DatatypeProperty whose range is xsd:decimal. age is also a UniqueProperty (can only have one age</rdfs:comment><rdf:type rdf:resource="http://www.daml.org/2001/03/daml+oil#UniqueProperty"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#nonNegativeInteger"/>
</daml:DatatypeProperty><daml:Class rdf:ID="Person"><rdfs:subClassOf rdf:resource="#Animal"/><rdfs:subClassOf><daml:Restriction daml:mincardinality="1">
<daml:onProperty rdf:resource="#name"/></daml:Restriction>
</rdfs:subClassOf></daml:Class><Person rdf:ID="Hideaki"><rdfs:label>Hideaki</rdfs:label><rdfs:comment>Hideaki is a person. His name is Hideaki Takeda and his age is 20.</rdfs:comment><name>Hideaki Takeda</name><age><xsd:integer rdf:value="20"/></age>
</Person></rdf:RDF> DAML+OIL Example
http://www.daml.org/2001/03/daml+oil-ex.daml
Hideaki Takeda / National Institute of Informatics
Semantic Webの課題仕様の確定と展開(推論など)[SW関係者]利用者に普及すること[SW関係者,APP関係者,一般ユーザ]よいオントロジーの提供[SW関係者,APP関係者]よいドメインをみつけること[APP関係者]
こういったことは全ての新しい仕様にとって必要だが...SWにとっては本質的.なぜなら[共有]することがSematicWebの存在価値だからc.f. XML: 部分的
12
Hideaki Takeda / National Institute of Informatics
疑問Q:“意味”って表現できるの?Semantic Webのアプローチでは意味とは
[共有]される([概念]とそれら間の[関係])で表現できるもっともプリミティブなレベルでは共有:URI概念,関係:存在することだけ(共有することだけ)
より高度なレベルでは共有:URI+体系としての共有概念,関係:構造をもつ存在
さらには証明信頼
Hideaki Takeda / National Institute of Informatics
より本質的な課題[共有]問題再考
Semantic Webにおける共有URIや定義のインポートしかしこれは楽観的かつ暗黙的,また一様でしかない利用は明示的だが...
共有の“幅”が必要共有の程度,変化へ対応など
人間/機械両用方式の拡張はどこまで可能なのかHTMLの成功神話はどこまで続くか
13
Hideaki Takeda / National Institute of Informatics
オントロジーとは
オントロジー概念体系の提供計算機可読性人間理解可能性
人間と計算機をつなぐもの
Hideaki Takeda / National Institute of Informatics
オントロジーの定義Gruber概念化の明示的な仕様
FIPA98特定のドメインの構造の明示的な仕様。対象領域を参照するための語彙(論理定数と述語記号)と領域に存在する制約の表現と語彙の解釈を制限する論理的言明。あるトピックに関する知識の表現と通信のための語彙とその語彙で示される実在物(entity)の関係と属性の集合である。
もっとわかり易くいえば共通の概念の体系(“語彙”とその定義とそれら間の関係)語彙以上OOのオブジェクト未満
14
Hideaki Takeda / National Institute of Informatics
なぜ知識表現ではいけなかったのか知識表現人工知能で人間の知識の表現手段として考案されたもの例:フレーム型,ルール型,ネットワーク型,論理型
エキスパートシステム上記の方法で専門家の知識を記述して,専門家の行う作業を行うシステム
エキスパートシステムの問題点システムの拡張性新しい機能をつけくわえよう
メンテナンス性環境が変化したので変更しよう
知識の問題知識の共有や再利用が困難
Hideaki Takeda / National Institute of Informatics
エキスパートシステムでの知識表現の問題点
普遍性へのコミットメントが不足汎用性と効率性のトレードオフ別に普遍的な知識がほしい訳ではないしかしそこへの配慮がないのでは困る
4つのコミットメント全体性へのコミットメント網羅性へのコミットメント体系性へのコミットメント変化可能性へのコミットメント
15
Hideaki Takeda / National Institute of Informatics
普遍性へのコミットメント全体性へのコミットメントどこまで対象と記述しようとしているか目的外の記述は存在しない
とある「リンゴ選別機」の知識サイズ,色,硬さ,重量は知っている(センサがあるから)ざらつき,採取者,採取からの日数(センサがなかった)
網羅性へのコミットメントどこまでを対象としているか対象外の事物は記述されない
とある「リンゴ選別機」の知識国産のりんごの種類は記述している外国産は知らない
体系性へのコミットメントどこまで背後にある概念との関係しているか背景にある概念はかかれない
とある「リンゴ選別機」の知識りんごが果物の一種であることは知らない
Hideaki Takeda / National Institute of Informatics
オントロジーの役割
オントロジー:普遍性のある知識表現形式性,推論可能性知識表現の性質
全体性(対象の包括的記述)網羅性(対象領域のカバー)体系性合意可能性目的の明示化による合意の可能性を示すことまったく目的のない表現はありえない
オントロジーは表現や記述(だけ)の問題ではなく,その利用の仕方(作り方,使い方)において意味がある
16
Hideaki Takeda / National Institute of Informatics
オントロジーの課題
オントロジーをどうつくるかオントロジーをどうつなげるかオントロジーをどうつかう
Hideaki Takeda / National Institute of Informatics
オントロジーの課題:“つかう”
エージェント間コミュニケーションのためのオントロジー人間とシステムの間のコミュニケーションのためのオントロジー人間と人間の間のコミュニケーションのためのオントロジー
17
Hideaki Takeda / National Institute of Informatics
KC-Kansai
お寺エージェント群
東大寺エージェント
¥地理エージェント
¥日本地図エージェント
¥関西地図エージェント
ホテルエージェント
地理エージェント群
¥観光エージェント
¥行程計画エージェント
¥アミューズメントエージェント
インタフェースエージェント
¥新幹線エージェント
¥交通エージェント
交通エージェント群
¥奈良交通エージェント
¥近鉄エージェント
ユーザ
旅行計画エージェント
Hideaki Takeda / National Institute of Informatics
IICA
t e mp l e
W W WInternet
1 search/collect
ontology
set of WWW pages classified WWW pages extractedinformation
h o t s p r i n g2 classify
r e s t a u r a n t
3 extract
name ingredient effectURL
As h e u ris tic s fo r p ru n in g s e a rc h
As taxonomyAs features of concepts
18
Hideaki Takeda / National Institute of Informatics
Designers Amplifier
Ontology Editor
Property of concepts
Contents of information
Search results(list of information)
Hideaki Takeda / National Institute of Informatics
オントロジーの課題:“つくる”
人手でつくる個人がつくる→オーサリングツール集団でつくる→協調オーサリングツール組織がつくる:
IEEE Standard Upper Ontology Working Group既存の情報から変換する→変換ツール既存の情報から抽出する→機械学習
19
Hideaki Takeda / National Institute of Informatics
オントロジーエディタOntoEdit
Protégé
Hideaki Takeda / National Institute of Informatics
オントロジーの課題:“つなげる”
集中型オントロジーから分散型オントロジーへひとつですべてをカバーするのは不可能
つなげ方のポリシー統合型:ユニークオントロジー指向連携型:多視点指向,マッピング,アライメント
つなげるオントロジーの関係垂直型(上位下位関係):top-level & domain ontologies水平型:同じ対象に対する(類似の)オントロジー交差型:同じ対象に対する別の視点のオントロジー
つなげ方の学習
20
Hideaki Takeda / National Institute of Informatics
概念体系の収集と統合:背景と問題意識Webによる情報流通は流通する情報の量的拡大に貢献しかし,情報の質的拡大をどう解決するか
どうやって意味記述構築していくか
Semantic Web構想 (Tim B. Lee他)意味記述言語の普及(RDF, RDFS, DAML+OIL)意味記述を利用したサービスの普及
公共性領域依存性ダイナミクス
意味を記述するプロセスの支援
Hideaki Takeda / National Institute of Informatics
インターネットディレクトリの関係付けの発見目的階層構造間の関係の発見
問題設定インターネットディレクトリ
方法インスタンスの共通性から統計的に推測
21
Hideaki Takeda / National Institute of Informatics
基本的アイデア
ペアの発見カテゴリペアの探索木構造を上から探索発見したペアのみ詳細化
ペアの利用インスタンスを移動させるためのルール所属するカテゴリにあるルールを使う所属するルールがなかったら、親のルールを使う
Hideaki Takeda / National Institute of Informatics
実験結果
SharedCategory Link Category Link Link
Literature 493 3192 186 1119 468Companies 7554 58609 413 5904 3992Recreation 3164 19609 709 4941 1939
LYCOSYahoo!
Results (Literature)
0
0.2
0.4
0.6
0.8
1
Criterion 1 Criterion 2
Yahoo to Lycos
Acc
urac
y
Exact RulesParent Rules
Lycos to Yahoo
0
0.2
0.4
0.6
0.8
1
Acc
urac
y
Exact RulesParent Rules
Criterion 1 Criterion 2
Results (Recreation)
0
0.2
0.4
0.6
0.8
1
Acc
urac
y
Criterion 1 Criterion 2
Exact RulesParent Rules
Yahoo to Lycos
0
0.2
0.4
0.6
0.8
1
Acc
urac
y
Criterion 1 Criterion 2
Exact RulesParent Rules
Lycos to Yahoo
22
Hideaki Takeda / National Institute of Informatics
実験結果Yahoo!→Google Google→Yahoo!
[1] R. Agrawal and R. Srikant. On integrating catalogs.In Proceedings of the Tenth International World WideWeb Conference (WWW-10), pages 603–612, 2001.
Hideaki Takeda / National Institute of Informatics
まとめSemantic Web実現の道筋:RDF⇒RDF Schema⇒OWL(DAML+OIL)課題:普及の仕組みオントロジー!
オントロジーつくる⇔つなげる⇔つかう
概念体系の収集と統合多視点的な“つなげかた”
23
Hideaki Takeda / National Institute of Informatics
参考文献基本的に以下の活動やプロジェクトのWebページから仕様などドキュメントが手に入るので参考にされたい.
[Semantic Web] http://www.w3.org/2001/sw (RDF, RDF Schema, XML Schemaなど)
[Dublin Core Metadata Initiative] http://dublincore.org/
[DAML]http://www.daml.org/
(DAML+OIL, DAML-Sなど)[On-To-Knowledge Project]
http://www.ontoknowledge.org/ (OILなど)