Upload
idalee
View
36
Download
0
Embed Size (px)
DESCRIPTION
第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web の融合に向けての展開. 中挾知延子(東洋大学) 野村直之(法政大学) 浦本直彦( IBM, 国立情報学研究所) Key-Sun Choi ( KAIST, NHK 技研). 発表の流れ. イントロ: NLPXML-2002 セッション 1 : Tools & Corpora セッション 2 : Document Generation セッション 3 : Discourse,Dialog & Speech セッション 4 : Semantic Web - PowerPoint PPT Presentation
Citation preview
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
11
第 2 回国際ワークショップ“ NLPXML-2002” の概要と
NLP, Semantic Web の融合に向けての展開
中挾知延子(東洋大学)野村直之(法政大学) 浦本直彦( IBM, 国立情報学研究所)Key-Sun Choi ( KAIST, NHK 技研)
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
22
発表の流れ発表の流れ イントロ:イントロ: NLPXML-2002NLPXML-2002 セッションセッション 11 :: Tools & CorporaTools & Corpora セッションセッション 22 :: Document GenerationDocument Generation セッションセッション 33 :: Discourse,Dialog & Discourse,Dialog &
SpeechSpeech セッションセッション 44 :: Semantic WebSemantic Web NLPXML-2003NLPXML-2003 に向けてに向けて
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
33
““NLPXML-2002NLPXML-2002””
第第 11 回:”回:” 11stst NLP NLP & XML WS” & XML WS” 於:東於:東京 京 http://hal2001.itakura.toyo.ac.http://hal2001.itakura.toyo.ac.jp/~chiekon/nlpxml/jp/~chiekon/nlpxml/
第第 22 回:回: Coling20Coling200202 のポストワーのポストワークショップとしてクショップとして台北で開催台北で開催ChairChair :: Dr. Graham WilcocDr. Graham Wilcockk (( HelsinkiHelsinki 大学)大学)
http://www.ling.helsinki.fi/~gwilcock/NLPXML/
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
44
ワークショップの目的=ワークショップの目的= XMLXML ととNLPNLP のシナジー効果のシナジー効果
XML for NLPXML for NLP (自然言語(自然言語処理のための処理のための XMLXML 技術)技術)– 高機能なフリーの高機能なフリーの XMLXML 処理系処理系
により,により, NLPNLP システムの設計システムの設計から実装までの高速プロトタイから実装までの高速プロトタイピングを実現ピングを実現
– 統一的な中間データ形式,コー統一的な中間データ形式,コーパス記述言語としての役割パス記述言語としての役割
NLP for XMLNLP for XML (( XMLXML のたのための自然言語処理)めの自然言語処理)– 多義語の処理,制約の解決,一多義語の処理,制約の解決,一
貫性の保持,シソーラス開発な貫性の保持,シソーラス開発などど
– XMLXML ドキュメントの自動生成,ドキュメントの自動生成,メタデータ,オントロジのメタデータ,オントロジの(半)自動メンテナンスなど産(半)自動メンテナンスなど産業界から期待されている機能の業界から期待されている機能の実現に実現に NLPNLP を適用を適用
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
55
セッションセッション 11 :: Tools & Tools & CorporaCorpora
XML for NLPXML for NLP– コーパスにおけるアノテーションの共有と再コーパスにおけるアノテーションの共有と再
利用利用アノテーションスキーマの提案アノテーションスキーマの提案
NLP for XMLNLP for XML– XMLXML ドキュメント変換処理に用いる文法ルードキュメント変換処理に用いる文法ルー
ルなどのルなどの NLPNLP ツールの標準化の提案ツールの標準化の提案
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
66
1.XML-Based NLP Tools for Analysing and 1.XML-Based NLP Tools for Analysing and Annotating Medical LanguageAnnotating Medical Language
C. Grover, et al.C. Grover, et al. (( Univ. of EdinburghUniv. of Edinburgh )) 医学分野の専門知識であ医学分野の専門知識であ
るる OHSUMEDOHSUMED コーパスコーパスを浅いレベル(を浅いレベル( e.g.e.g. 形形態素解析)から深いレベ態素解析)から深いレベル(ル( e.g.e.g. 意味解析)ま意味解析)まで処理するためにアノテで処理するためにアノテーションをしてーションをして XMLXML 化化
<RECORD><ID>395</ID><MEDLINE-ID>87052477</MEDLINE-ID><SOURCE>Clin Pediatr (Phila) 8703; 25(12):617-9 </SOURCE><MESH>Adolescence; Alcoholic Intoxication/BL/*EP; Blood Glucose/AN; Canada;
Child; Child, Preschool;Electrolytes/BL; Female; Human; Hypoglycemia/ET; Infant; Male;
Retrospective Studies.</MESH><TITLE>Ethyl alcohol ingestion in children. A 15-year review.</TITLE><PTYPE>JOURNAL ARTICLE.</PTYPE><ABSTRACT><SENT><WP=’DT’>A</W><W P=’JJ’>retrospective</W><W P=’NN’ LM=’study’>study</W><W P=’VBD’ LM=’be’>was</W><W P=’VBN’
LM=’conduct’>conducted</W><WP=’IN’>by</W><WP=’NN’ LM=’chart’>chart</W>
<W P=’NNS’ LM=’review’>reviews</W><W P=’IN’ >of</W><WP=’CD’>27</W>
<W P=’NNS’ LM=’patient’>patients</W><WP=’IN’>with</W><W P=’JJ’>documented</W>
<W P=’NN’ LM=’ethanol’>ethanol</W><W P=’NN’ LM=’ingestion’>ingestion</W><WP=’.’>.</W>
</SENT><SENT> : : : </SENT><SENT> : : : </SENT></ABSTRACT><AUTHOR>Leung AK.</AUTHOR></RECORD>
A sample from the XML-marked-up OHSUMED Corpus
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
77
2.A Brief Introduction to the Gem Annotation 2.A Brief Introduction to the Gem Annotation Schema for Complex Document LayoutSchema for Complex Document Layout
J. Bateman, et al.J. Bateman, et al. (( Univ. of BremenUniv. of Bremen )) マルチモーダルな文章レマルチモーダルな文章レ
イアウトをイアウトを XMLXML 化する化するためのための GemGem (( GeGenre nre & & MMultimodalityultimodality )ア)アノテーションスキーマのノテーションスキーマの提案提案
スキーマによるレイアウスキーマによるレイアウトタグ付きコーパスを活トタグ付きコーパスを活用した文章生成システム,用した文章生成システム,レイアウト作成支援シスレイアウト作成支援システムへの応用テムへの応用
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
88
レイアウトをより大きなブロックへレイアウトをより大きなブロックへ抽象化抽象化
<unit id="u-21.5">---------------</unit>
<unit id="u-21.6"src="gannet.jpg" alt="gannet-
photo"/><unit id="u-21.7">Huge (90cm) unmistakable seabird.</unit><unit id="u-21.8">Watch for white, cigar-shaped body
andlong straight, slender, black-tipped
wings.</unit><unit id="u-21.9">In summer, yellow head ofadult inconspicuous. </unit><unit id="u-21.10">Plunges spectacularly for fish.</unit><unit id="u-21.11">Sexes
similar.</unit>
<layout-unit id="lay-flegg-text"xref="u-21.7 u-21.8 u-21.9u-21.10u-21.11">Huge (90cm) unmistakable seabird.Watch for white, cigar-shaped bodyand long straight, slender,black-tipped wings. In summer,
yellowhead of adult inconspicuous. Plungesspectacularly for fish. Sexes similar.</layout-unit>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
99
レイアウトの階層化レイアウトの階層化<layout-root id="page-
21"><layout-leaf
xref="header-21"/><layout-chunk id="body-
21"><layout-leaf xref="lay-
21.2"/><layout-leaf xref="lay-
21.3"/></layout-chunk><layout-leaf xref="page-
no-21"/></layout-root>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1010
3.Cascaded Regular Grammars over 3.Cascaded Regular Grammars over XML DocumentsXML Documents
K. Simov, et al.K. Simov, et al. (( Linguistic Modelling Lab.Linguistic Modelling Lab. )) テキストコーパス処理のテキストコーパス処理の
ためのルールに基づいたためのルールに基づいたXMLXML 変換システム変換システム CLaRKCLaRK
The feast is from 12.03.2002 to 15.03.2002.
↓
The feast is from Date to Date.
Date ->( (0,(1|2|3|4|5|6|7|8|9)) |((1|2),(0|1|2|3|4|5|6|7|8|9)) |(3,(0|1))),.,((0,(1|2|3|4|5|6|7|8|9))|(1,(0|1|2))),.,(((1|2|3|4|5|6|7|8|9),(0|1|2|3|4|5|6|7|8|9)*))
カスケード型正規文法に基カスケード型正規文法に基づいて複雑な制約や並べ替づいて複雑な制約や並べ替えを伴うえを伴う XMLXML 変換が実現変換が実現 C→RC→R C:C: 語句のカテゴリ語句のカテゴリ R:R: 正規表現(エレメン正規表現(エレメントノードの場合はトノードの場合は XPathXPath表記)表記)
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1111
正規文法の適用による文章の正規文法の適用による文章の XMLXML 表現表現<s>John loves Mary who is in
love with Peter</s>
<s><w g="N">John</w><w g="V">loves</w><w g="N">Mary</w><w g="Pron">who</w><w g="V">is</w><w g="P">in</w><w g="N">love</w><w g="P">with</w><w g="N">Peter</w></s>
<s><w g="N">John</w><w g="V">loves</w><w g="N">Mary</w><w g="Pron">who</w><w g="V">is</w><PP><w g="P">in</w><w g="N">love</w></PP><PP><w g="P">with</w><w g="N">Peter</w></PP></s>
<PP>\w</PP> -> <"P"><"N#">
PropositionalAttachment
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1212
セッションセッション 22 :: Document Document GenerationGeneration
XSLTXSLT の文書生成への貢献の文書生成への貢献 -- 効率の良さと効率の良さと保守性の高さ保守性の高さ– 多言語対応の文書フィルタ多言語対応の文書フィルタ– XMLXML テンプレートからの文書自動生成テンプレートからの文書自動生成
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1313
1.Cascading XSL Filters for Content Selection in 1.Cascading XSL Filters for Content Selection in Multilinguial Document GenerationMultilinguial Document Generation
G. Burrutieta, et al.G. Burrutieta, et al. (( Mondragon Univ.Mondragon Univ. )) RSTRST (( RhetoricaRhetorica
l Structure l Structure TheoryTheory ))に基づに基づくユーザのニーズくユーザのニーズに応じた文書フィに応じた文書フィルタルタ
CSACSA (( Content Content Selection Selection AlgorithmAlgorithm ))によによりフィルタリング,りフィルタリング,XSLXSL で実装で実装
英語,スペイン語,英語,スペイン語,バスク語に対応バスク語に対応
XML-DTD
Course Material(Multilingual Parallel
Corpus)
User Aspects
Document Generation
Document View
Web Browser
InputsCourse Generator
Select content and format in
an “intelligent” way
html-xml-dtdxsl-javascript
Generation engine
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1414
Rhetorical Structure TheoryRhetorical Structure Theory<RST> <RST-S> <PREPARATION> <S> What is knowledge management?
</S> </PREPARATION> </RST-S> <RST-N> <S> Knowledge, in a business context, is
the organizational memory, which people know collectively
and individually </S> <S> Management is the judicious use of
means to accomplish an end </S> <S> Knowledge management is the
combination of those concepts, KM = knowledge +
management </S></RST-N></RST>
<RST> <RST-S> <PREPARATION> <S> Zer da ezagutzaren kudeaketa?
</S> </PREPARATION> </RST-S> <RST-N> <S> Kudeaketa, negozioetan, erakundearen
memoria da, jendeak bakarka eta taldeka
dakiena </S> <S> Kudeaketak erabideen erabilera zuzena
du helburu </S> <S> Ezagutzaren kudeaketa bi kontzeptu
hauen nahasketa da, EK = ezagutza + kudeaketa </S> </RST-N> </RST>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1515
Content Selection AlgorithmContent Selection Algorithm
If level_expertise = “null” or level_expertise = “basic”Then no relation-satellite is
discarded; If level_expertise =
“medium” or level_expertise = “high” Then discard example, exercise,
background and preparation relation-
satellites;
Specific User Specific User AspectsAspects
Discrete valuesDiscrete values
SubjectSubject Language processorsLanguage processors
Moment in Moment in timetime
Before the course / Period Before the course / Period 1 / Period 2 / … / After the 1 / Period 2 / … / After the course (review)course (review)
LanguagesLanguages EN/ ES/ EUEN/ ES/ EU
General User General User AspectsAspects
Discrete valuesDiscrete values
Level of Level of expertiseexpertise
Null / Basic / Medium / Null / Basic / Medium / HighHigh
Reason to readReason to read To get an idea / To get To get an idea / To get deep into itdeep into it
BackgroundBackground Not related to the Not related to the subject / Related to the subject / Related to the subjectsubject
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1616
XtraGen – A Natural Language Generation XtraGen – A Natural Language Generation System using XML & Java TechnologiesSystem using XML & Java Technologies
H. Stenzhorn H. Stenzhorn (( XtraMind Technologies GmbHXtraMind Technologies GmbH )) XtraGenXtraGen の文章生成メカニズムとの文章生成メカニズムと
そのその XMLXML とと JavaJava による実装による実装 XMLXML テンプレートによる文章生成テンプレートによる文章生成
– 形態素の扱い形態素の扱い– 生成文のレベル分け生成文のレベル分け
<template id="String" category="String"> <conditions> Condition*</conditions> <parameters> Parameter*</parameters> <actions> Action+</actions> <constraints> Constraint*</constraints></template>
<conditions> <or> <and> <condition type="equal"> <get path="/recall"/> <value>95</value> </condition> <condition type="less"> <get path="/accuracy"/> <value>90</value> </condition> </and> <not> <condition type="exist"> <get path="/exception"/> </condition> </not> </or></conditions>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1717
ユーザレベルに応じユーザレベルに応じた生成のためのた生成のための XMLXML
テンプレートテンプレート<template id="explainExpert"
category="explain"> <parameters> <parameter name="level"
value="expert"> <parameter name="verbosity" value="low"> </parameters> ...</template>generator.addParameter
("level","novice",0.75);generator.addParameter
("verbosity","low",0.5);
<template ...> <actions> <select category="determiner" label="X0"/> <select category="noun" label="X1"/> </actions> <constraint> <place label="X0" attribute="number"/> <place label="X1" attribute="number"/> <get
path="/categoryNumber"/></constraint></template>
形態素の制約のため形態素の制約のためのの XMLXML テンプレートテンプレート
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1818
セッションセッション 33 :: Discourse, Dialog & Discourse, Dialog & SpeechSpeech
マルチモーダリティを扱えるマルチモーダリティを扱える XMLXML でのアでのアノテーションの活用ノテーションの活用– 音声認識音声認識– 談話生成談話生成
SALTSALT – VoiceXML – VoiceXML の次に来るものの次に来るもの ??
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
1919
1.XML/XSL in the Dictionary: The Case of 1.XML/XSL in the Dictionary: The Case of Discourse Markers Discourse Markers
D. Berger, et al.D. Berger, et al. (( Univ. of PotsdamUniv. of Potsdam )) XMLXML による談話マーカ付による談話マーカ付
き辞書き辞書 DiMLexDiMLex を用いてを用いてXSLXSL によりにより HTMLHTML へ変換へ変換し可読性を向上し可読性を向上
文章生成,文章理解シス文章生成,文章理解システムへの応用が期待テムへの応用が期待
We were in SoHo; {nevertheless | nonetheless | however | still | yet}, we found a cheap bar.
We were in SoHo, but we found a cheap bar anyway.
Despite the fact that we were in SoHo, we found a cheap bar.
Notwithstanding the fact that we were in SoHo, we found a cheap bar.
Although we were in SoHo, we found a cheap bar.
談話マーカ談話マーカ接続詞ならびに接続接続詞ならびに接続の働きをする語の働きをする語
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2020
2.XiSTS – XML in Speech Technology 2.XiSTS – XML in Speech Technology Systems Systems
M. Walsh, et al.M. Walsh, et al. (( Univ. of College DublinUniv. of College Dublin )) 音声認識のための音声認識のための 33つのサブシステムにつのサブシステムに XMLXML をを
活用活用– 音韻認識 音韻認識 LIPSLIPS
Network GeneratorNetwork Generator による音素配列オートマトによる音素配列オートマトンの生成とンの生成と XMLXML 記述記述
– 音声合成 音声合成 REFLEXREFLEXシラブル辞書の生成シラブル辞書の生成辞書エントリを辞書エントリを XMLXML 化化
– 辞書生成 辞書生成 T-REXT-REX異なる音韻特徴セットの記述を異なる音韻特徴セットの記述を XMLXML で作成で作成
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2121
LIPSLIPS
alveolar ○ approximantapproximant ○ voicelessvoiceless ○ alveolar
fricative ○ palatopalato ○ voicelessvoiceless ○ fricative
[vowels] [n][m][S]
[S] [r]
Network GeneratorNetwork Generatorによる音素配列オートによる音素配列オートマトンの生成マトンの生成
パージングされ候補のパージングされ候補の音素配列が決定音素配列が決定
XMLXML 化され(次のスラ化され(次のスライド参照),イド参照), REFLEXREFLEXへの入力となるへの入力となる
音素配列オートマトン音素配列オートマトン
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2222
音素配列オートマトンの音素配列オートマトンの XMLXML 表現表現<phonotactic_automaton language=“english”><phonotactic_automaton language=“english”> <arc position=“o1” voweltrans=“false” initial=“true” root_final=“false” <arc position=“o1” voweltrans=“false” initial=“true” root_final=“false”
suffix_final=“false” internal=“false”>suffix_final=“false” internal=“false”> <start_node>1</start_node><start_node>1</start_node> <end_node>2</end_node><end_node>2</end_node> <phonemes><phonemeSymbol>S</phonemeSymbol><phonemes><phonemeSymbol>S</phonemeSymbol> <overlapConstraint><overlapConstraint> <ranking>3</ranking><ranking>3</ranking> <feature_info1><feature_name>fricative</feature_name></feature_info1> <feature_info1><feature_name>fricative</feature_name></feature_info1>
<feature_info2><feature_name>voiceless</feature_name></feature_info2> <feature_info2><feature_name>voiceless</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <overlapConstraint><overlapConstraint> <ranking>2</ranking><ranking>2</ranking> <feature_info1><feature_name>palato</feature_name></feature_info1> <feature_info1><feature_name>palato</feature_name></feature_info1>
<feature_info2><feature_name>voiceless</feature_name></feature_info2> <feature_info2><feature_name>voiceless</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <overlapConstraint><overlapConstraint> <ranking>2</ranking><ranking>2</ranking> <feature_info1><feature_name>fricative</feature_name></feature_info1> <feature_info1><feature_name>fricative</feature_name></feature_info1>
<feature_info2><feature_name>palato</feature_name></feature_info2> <feature_info2><feature_name>palato</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <typical_duration>50</typical_duration><typical_duration>50</typical_duration> <threshold>6</threshold><threshold>6</threshold> </phonemes></arc></phonemes></arc></phonotactic_automaton></phonotactic_automaton>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2323
<syllable> So:n <onset type=”first”>
<segment phonation=”voiceless”manner=”fricative”
place=”palato”duration=”null”>S</segment>
</onset><nucleus type=”first”>
<segment phonation=”voices” manner=”vowellike” place=”back”
height=”mid” roundness=”round” length=”tense”duration=”null”>o:
</segment></nucleus><coda type=”first”>
<segment phonation=”voiced” manner=”nasal” place=”apical”duration=”null”>n</segment>
</coda></syllable>
REFLEX, T-REXREFLEX, T-REX
XMLXML 化された特徴ベ化された特徴ベースのシラブル辞書ースのシラブル辞書を生成(を生成( REFLEXREFLEX ))
音素の特徴記述はユ音素の特徴記述はユーザによってカスターザによってカスタマイズされ新たな辞マイズされ新たな辞書を生成(書を生成( T-REXT-REX ))
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2424
3.SALT: An XML Application for Web-based 3.SALT: An XML Application for Web-based Multimodal Dialog Management Multimodal Dialog Management
K. WangK. Wang (( Microsoft ResearchMicrosoft Research )) SALTSALT (( SSpeech peech AApplication pplication LLanguage anguage TTagsags ))
– WebWeb 上での分散環境におけるマルチモーダルな対話処理システ上での分散環境におけるマルチモーダルな対話処理システムのためのムのための XMLXML ベース言語ベース言語
– プログラミング言語に依存せずプログラミング言語に依存せず HTMLHTML ,, XMLXML に対話処理のインに対話処理のインタフェースとして埋め込み可能タフェースとして埋め込み可能
マルチモーダルマルチモーダル– GUIGUI環境において多様な方式でユーザが入力環境において多様な方式でユーザが入力– 音声入力,テキスト入力,マウスでのイベント通知など音声入力,テキスト入力,マウスでのイベント通知など
WebWeb ページ単位での制御フローページ単位での制御フロー データと表示を切り離すことでのモジュール性の向上データと表示を切り離すことでのモジュール性の向上 対話の解釈にセマンティックオブジェクトを用いた対話の解釈にセマンティックオブジェクトを用いた OOOO モデルを採モデルを採
用用
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2525
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2626
プロンプトオブジェクトのプロンプトオブジェクトの XMLXML表現表現
<input name=”origin” type=”text” /><input name=”destination” type=”text” /><input name=”date” type=”text” />…<prompt …> Do you want to fly from
<value targetElement=”origin”/> to<value targetElement=”destination”/> on<value targetElement=”date”/>?
</prompt>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2727
SALTSALT フォーラムフォーラムhttp://www.saltforum.org/http://www.saltforum.org/
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2828
セッションセッション 44 :: Semantic WebSemantic Web
NLPNLP に用いるメタデータは汎用性や流通に用いるメタデータは汎用性や流通性から考えると性から考えると SemanticWebSemanticWeb での標準での標準スキーマへの準拠が妥当スキーマへの準拠が妥当
SemanticWebSemanticWeb におけるオントロジの洗におけるオントロジの洗練やメンテナンスに練やメンテナンスに NLPNLP の手法が適用の手法が適用(例:多義性解消,オントロジ等の知識(例:多義性解消,オントロジ等の知識獲得)獲得)
エージェントのプロファイリングにエージェントのプロファイリングに IRIR のの成果を適用成果を適用
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
2929
1.Annotating the Semantic Web using 1.Annotating the Semantic Web using Natural Language Natural Language
B. KatzB. Katz (( MIT Artificial Intelligence Lab.MIT Artificial Intelligence Lab. ))
STARTSTART システムシステム 人間が人間が
SemanticWebSemanticWebに自然言語で質に自然言語で質問し満足できる問し満足できる回答を得るため回答を得るためのアノテーショのアノテーションのしくみをンのしくみをRDFRDF に実現に実現
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
3030
RDFRDF でのプロパティ設定でのプロパティ設定nlnl アノテーションを付けたアノテーションを付けた CIA World CIA World
FactbookFactbook<rdfs:Class ID=“Country”><rdfs:Class ID=“Country”>
<rdfs:comment>A Country in the CIA <rdfs:comment>A Country in the CIA Factbook</rdf:comment>Factbook</rdf:comment>
</rdfs:Class></rdfs:Class><rdf:property ID=“population”><rdf:property ID=“population”>
<rdfs:domain rdf:resource=“#Country”/><rdfs:domain rdf:resource=“#Country”/><rdfs:range rdf:resource=“xsd:string”/><rdfs:range rdf:resource=“xsd:string”/><nl:ann text=“Many People live in ?s”/><nl:ann text=“Many People live in ?s”/><nl:ann text=“population of ?s”/><nl:ann text=“population of ?s”/><nl:gen text=“The population of ?s is ?o”/><nl:gen text=“The population of ?s is ?o”/>
</rdf:property></rdf:property>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
3131
インフォメーションアクセススキーマ多様な自然言語の質問に応答するためのメタ記述
<nl:InformationAccessSchema><nl:InformationAccessSchema><nl:ann>$country-1’s $att is larger than $country-2’s <nl:ann>$country-1’s $att is larger than $country-2’s $att</nl:ann>$att</nl:ann><nl:pattern>?x a :Country</nl:pattern><nl:pattern>?x a :Country</nl:pattern><nl:pattern>?x map($att) ?var-1</nl:pattern><nl:pattern>?x map($att) ?var-1</nl:pattern><nl:pattern>?y a :Country</nl:pattern><nl:pattern>?y a :Country</nl:pattern><nl:pattern>?y map($att) ?var-2</nl:pattern><nl:pattern>?y map($att) ?var-2</nl:pattern><nl:action>display(gt(?var-1,?var-2))</nl:action><nl:action>display(gt(?var-1,?var-2))</nl:action><nl:mapping><nl:mapping>
<nl:hash variable=“$attribute”><nl:hash variable=“$attribute”> <nl:map value=“population”>:population</nl:map><nl:map value=“population”>:population</nl:map> <nl:map value=“area”>:area</nl:map><nl:map value=“area”>:area</nl:map> ......</nl:hash></nl:mapping></nl:hash></nl:mapping>
</nl:InformationAccessSchema></nl:InformationAccessSchema>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
3232
プランスキーマ質問にどのような手順で応答するのかを手続
き的に記述<nl:InformationPlanningSchema><nl:InformationPlanningSchema> <nl:ann>distance between $country1 and $country2</nl:ann><nl:ann>distance between $country1 and $country2</nl:ann> <nl:plan>?x a :Country</nl:pattern><nl:plan>?x a :Country</nl:pattern> <rdf:seq><rdf:seq> <rdf:li>what is the capital of $country1 := ?capital1</rdf:li><rdf:li>what is the capital of $country1 := ?capital1</rdf:li>
<rdf:li>what is the capital of $country2 := ?capital2</rdf:li><rdf:li>what is the capital of $country2 := ?capital2</rdf:li><rdf:li>what is the distance between ?capital1 and ?<rdf:li>what is the distance between ?capital1 and ?capital2 := ?distance</rdf:li>capital2 := ?distance</rdf:li>
</rdf:seq></rdf:seq> </nl:plan></nl:plan> <nl:action>display(?distance)</nl:action><nl:action>display(?distance)</nl:action></nl:InformationPlanningSchema></nl:InformationPlanningSchema>
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
3333
START WebSTART Web サイトサイトhttp://www.ai.mit.edu/projects/infolab/http://www.ai.mit.edu/projects/infolab/
29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪
3434
3rd Workshop on NLP and XML 3rd Workshop on NLP and XML (( NLPXML-2003NLPXML-2003))