34
29-Nov-02 29-Nov-02 情情情情情情情情情情情情情情情情情情情情情 情情情情情情情情情情情情情情情情情情情情情 1 情 2 情情情情情情情情情情“ NLPXML- 2002” 情情情情 NLP, Semantic Web 情情情情 情情情情情情 情情情情情 情情情情情 () 情情情情 情情情情情 () 情情情情IBM, 情情情情情情情情Key-Sun Choi KAIST, NHK 情情

第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web の融合に向けての展開

  • Upload
    idalee

  • View
    36

  • Download
    0

Embed Size (px)

DESCRIPTION

第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web の融合に向けての展開. 中挾知延子(東洋大学) 野村直之(法政大学) 浦本直彦( IBM, 国立情報学研究所) Key-Sun Choi ( KAIST, NHK 技研). 発表の流れ. イントロ: NLPXML-2002 セッション 1 : Tools & Corpora セッション 2 : Document Generation セッション 3 : Discourse,Dialog & Speech セッション 4 : Semantic Web - PowerPoint PPT Presentation

Citation preview

Page 1: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

11

第 2 回国際ワークショップ“ NLPXML-2002” の概要と

NLP, Semantic Web の融合に向けての展開

中挾知延子(東洋大学)野村直之(法政大学) 浦本直彦( IBM, 国立情報学研究所)Key-Sun Choi ( KAIST, NHK 技研)

Page 2: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

22

発表の流れ発表の流れ イントロ:イントロ: NLPXML-2002NLPXML-2002 セッションセッション 11 :: Tools & CorporaTools & Corpora セッションセッション 22 :: Document GenerationDocument Generation セッションセッション 33 :: Discourse,Dialog & Discourse,Dialog &

SpeechSpeech セッションセッション 44 :: Semantic WebSemantic Web NLPXML-2003NLPXML-2003 に向けてに向けて

Page 3: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

33

““NLPXML-2002NLPXML-2002””

第第 11 回:”回:” 11stst NLP NLP & XML WS” & XML WS” 於:東於:東京 京 http://hal2001.itakura.toyo.ac.http://hal2001.itakura.toyo.ac.jp/~chiekon/nlpxml/jp/~chiekon/nlpxml/

第第 22 回:回: Coling20Coling200202 のポストワーのポストワークショップとしてクショップとして台北で開催台北で開催ChairChair :: Dr. Graham WilcocDr. Graham Wilcockk (( HelsinkiHelsinki 大学)大学)

http://www.ling.helsinki.fi/~gwilcock/NLPXML/

Page 4: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

44

ワークショップの目的=ワークショップの目的= XMLXML ととNLPNLP のシナジー効果のシナジー効果

XML for NLPXML for NLP (自然言語(自然言語処理のための処理のための XMLXML 技術)技術)– 高機能なフリーの高機能なフリーの XMLXML 処理系処理系

により,により, NLPNLP システムの設計システムの設計から実装までの高速プロトタイから実装までの高速プロトタイピングを実現ピングを実現

– 統一的な中間データ形式,コー統一的な中間データ形式,コーパス記述言語としての役割パス記述言語としての役割

NLP for XMLNLP for XML (( XMLXML のたのための自然言語処理)めの自然言語処理)– 多義語の処理,制約の解決,一多義語の処理,制約の解決,一

貫性の保持,シソーラス開発な貫性の保持,シソーラス開発などど

– XMLXML ドキュメントの自動生成,ドキュメントの自動生成,メタデータ,オントロジのメタデータ,オントロジの(半)自動メンテナンスなど産(半)自動メンテナンスなど産業界から期待されている機能の業界から期待されている機能の実現に実現に NLPNLP を適用を適用

Page 5: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

55

セッションセッション 11 :: Tools & Tools & CorporaCorpora

XML for NLPXML for NLP– コーパスにおけるアノテーションの共有と再コーパスにおけるアノテーションの共有と再

利用利用アノテーションスキーマの提案アノテーションスキーマの提案

NLP for XMLNLP for XML– XMLXML ドキュメント変換処理に用いる文法ルードキュメント変換処理に用いる文法ルー

ルなどのルなどの NLPNLP ツールの標準化の提案ツールの標準化の提案

Page 6: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

66

1.XML-Based NLP Tools for Analysing and 1.XML-Based NLP Tools for Analysing and Annotating Medical LanguageAnnotating Medical Language

C. Grover, et al.C. Grover, et al. (( Univ. of EdinburghUniv. of Edinburgh )) 医学分野の専門知識であ医学分野の専門知識であ

るる OHSUMEDOHSUMED コーパスコーパスを浅いレベル(を浅いレベル( e.g.e.g. 形形態素解析)から深いレベ態素解析)から深いレベル(ル( e.g.e.g. 意味解析)ま意味解析)まで処理するためにアノテで処理するためにアノテーションをしてーションをして XMLXML 化化

<RECORD><ID>395</ID><MEDLINE-ID>87052477</MEDLINE-ID><SOURCE>Clin Pediatr (Phila) 8703; 25(12):617-9 </SOURCE><MESH>Adolescence; Alcoholic Intoxication/BL/*EP; Blood Glucose/AN; Canada;

Child; Child, Preschool;Electrolytes/BL; Female; Human; Hypoglycemia/ET; Infant; Male;

Retrospective Studies.</MESH><TITLE>Ethyl alcohol ingestion in children. A 15-year review.</TITLE><PTYPE>JOURNAL ARTICLE.</PTYPE><ABSTRACT><SENT><WP=’DT’>A</W><W P=’JJ’>retrospective</W><W P=’NN’ LM=’study’>study</W><W P=’VBD’ LM=’be’>was</W><W P=’VBN’

LM=’conduct’>conducted</W><WP=’IN’>by</W><WP=’NN’ LM=’chart’>chart</W>

<W P=’NNS’ LM=’review’>reviews</W><W P=’IN’ >of</W><WP=’CD’>27</W>

<W P=’NNS’ LM=’patient’>patients</W><WP=’IN’>with</W><W P=’JJ’>documented</W>

<W P=’NN’ LM=’ethanol’>ethanol</W><W P=’NN’ LM=’ingestion’>ingestion</W><WP=’.’>.</W>

</SENT><SENT> : : : </SENT><SENT> : : : </SENT></ABSTRACT><AUTHOR>Leung AK.</AUTHOR></RECORD>

A sample from the XML-marked-up OHSUMED Corpus

Page 7: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

77

2.A Brief Introduction to the Gem Annotation 2.A Brief Introduction to the Gem Annotation Schema for Complex Document LayoutSchema for Complex Document Layout

J. Bateman, et al.J. Bateman, et al. (( Univ. of BremenUniv. of Bremen )) マルチモーダルな文章レマルチモーダルな文章レ

イアウトをイアウトを XMLXML 化する化するためのための GemGem (( GeGenre nre & & MMultimodalityultimodality )ア)アノテーションスキーマのノテーションスキーマの提案提案

スキーマによるレイアウスキーマによるレイアウトタグ付きコーパスを活トタグ付きコーパスを活用した文章生成システム,用した文章生成システム,レイアウト作成支援シスレイアウト作成支援システムへの応用テムへの応用

Page 8: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

88

レイアウトをより大きなブロックへレイアウトをより大きなブロックへ抽象化抽象化

<unit id="u-21.5">---------------</unit>

<unit id="u-21.6"src="gannet.jpg" alt="gannet-

photo"/><unit id="u-21.7">Huge (90cm) unmistakable seabird.</unit><unit id="u-21.8">Watch for white, cigar-shaped body

andlong straight, slender, black-tipped

wings.</unit><unit id="u-21.9">In summer, yellow head ofadult inconspicuous. </unit><unit id="u-21.10">Plunges spectacularly for fish.</unit><unit id="u-21.11">Sexes

similar.</unit>

<layout-unit id="lay-flegg-text"xref="u-21.7 u-21.8 u-21.9u-21.10u-21.11">Huge (90cm) unmistakable seabird.Watch for white, cigar-shaped bodyand long straight, slender,black-tipped wings. In summer,

yellowhead of adult inconspicuous. Plungesspectacularly for fish. Sexes similar.</layout-unit>

Page 9: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

99

レイアウトの階層化レイアウトの階層化<layout-root id="page-

21"><layout-leaf

xref="header-21"/><layout-chunk id="body-

21"><layout-leaf xref="lay-

21.2"/><layout-leaf xref="lay-

21.3"/></layout-chunk><layout-leaf xref="page-

no-21"/></layout-root>

Page 10: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1010

3.Cascaded Regular Grammars over 3.Cascaded Regular Grammars over XML DocumentsXML Documents

K. Simov, et al.K. Simov, et al. (( Linguistic Modelling Lab.Linguistic Modelling Lab. )) テキストコーパス処理のテキストコーパス処理の

ためのルールに基づいたためのルールに基づいたXMLXML 変換システム変換システム CLaRKCLaRK

The feast is from 12.03.2002 to 15.03.2002.

The feast is from Date to Date.

Date ->( (0,(1|2|3|4|5|6|7|8|9)) |((1|2),(0|1|2|3|4|5|6|7|8|9)) |(3,(0|1))),.,((0,(1|2|3|4|5|6|7|8|9))|(1,(0|1|2))),.,(((1|2|3|4|5|6|7|8|9),(0|1|2|3|4|5|6|7|8|9)*))

カスケード型正規文法に基カスケード型正規文法に基づいて複雑な制約や並べ替づいて複雑な制約や並べ替えを伴うえを伴う XMLXML 変換が実現変換が実現  C→RC→R    C:C: 語句のカテゴリ語句のカテゴリ   R:R: 正規表現(エレメン正規表現(エレメントノードの場合はトノードの場合は XPathXPath表記)表記)

Page 11: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1111

正規文法の適用による文章の正規文法の適用による文章の XMLXML 表現表現<s>John loves Mary who is in

love with Peter</s>

<s><w g="N">John</w><w g="V">loves</w><w g="N">Mary</w><w g="Pron">who</w><w g="V">is</w><w g="P">in</w><w g="N">love</w><w g="P">with</w><w g="N">Peter</w></s>

<s><w g="N">John</w><w g="V">loves</w><w g="N">Mary</w><w g="Pron">who</w><w g="V">is</w><PP><w g="P">in</w><w g="N">love</w></PP><PP><w g="P">with</w><w g="N">Peter</w></PP></s>

<PP>\w</PP> -> <"P"><"N#">

PropositionalAttachment

Page 12: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1212

セッションセッション 22 :: Document Document GenerationGeneration

XSLTXSLT の文書生成への貢献の文書生成への貢献 -- 効率の良さと効率の良さと保守性の高さ保守性の高さ– 多言語対応の文書フィルタ多言語対応の文書フィルタ– XMLXML テンプレートからの文書自動生成テンプレートからの文書自動生成

Page 13: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1313

1.Cascading XSL Filters for Content Selection in 1.Cascading XSL Filters for Content Selection in Multilinguial Document GenerationMultilinguial Document Generation

G. Burrutieta, et al.G. Burrutieta, et al. (( Mondragon Univ.Mondragon Univ. )) RSTRST (( RhetoricaRhetorica

l Structure l Structure TheoryTheory ))に基づに基づくユーザのニーズくユーザのニーズに応じた文書フィに応じた文書フィルタルタ

CSACSA (( Content Content Selection Selection AlgorithmAlgorithm ))によによりフィルタリング,りフィルタリング,XSLXSL で実装で実装

英語,スペイン語,英語,スペイン語,バスク語に対応バスク語に対応

XML-DTD

Course Material(Multilingual Parallel

Corpus)

User Aspects

Document Generation

Document View

Web Browser

InputsCourse Generator

Select content and format in

an “intelligent” way

html-xml-dtdxsl-javascript

Generation engine

Page 14: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1414

Rhetorical Structure TheoryRhetorical Structure Theory<RST> <RST-S> <PREPARATION> <S> What is knowledge management?

</S> </PREPARATION> </RST-S> <RST-N> <S> Knowledge, in a business context, is

the organizational memory, which people know collectively

and individually </S> <S> Management is the judicious use of

means to accomplish an end </S> <S> Knowledge management is the

combination of those concepts, KM = knowledge +

management </S></RST-N></RST>

<RST> <RST-S> <PREPARATION> <S> Zer da ezagutzaren kudeaketa?

</S> </PREPARATION> </RST-S> <RST-N> <S> Kudeaketa, negozioetan, erakundearen

memoria da, jendeak bakarka eta taldeka

dakiena </S> <S> Kudeaketak erabideen erabilera zuzena

du helburu </S> <S> Ezagutzaren kudeaketa bi kontzeptu

hauen nahasketa da, EK = ezagutza + kudeaketa </S> </RST-N> </RST>

Page 15: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1515

Content Selection AlgorithmContent Selection Algorithm

If level_expertise = “null” or level_expertise = “basic”Then no relation-satellite is

discarded; If level_expertise =

“medium” or level_expertise = “high” Then discard example, exercise,

background and preparation relation-

satellites;

Specific User Specific User AspectsAspects

Discrete valuesDiscrete values

SubjectSubject Language processorsLanguage processors

Moment in Moment in timetime

Before the course / Period Before the course / Period 1 / Period 2 / … / After the 1 / Period 2 / … / After the course (review)course (review)

LanguagesLanguages EN/ ES/ EUEN/ ES/ EU

General User General User AspectsAspects

Discrete valuesDiscrete values

Level of Level of expertiseexpertise

Null / Basic / Medium / Null / Basic / Medium / HighHigh

Reason to readReason to read To get an idea / To get To get an idea / To get deep into itdeep into it

BackgroundBackground Not related to the Not related to the subject / Related to the subject / Related to the subjectsubject

Page 16: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1616

XtraGen – A Natural Language Generation XtraGen – A Natural Language Generation System using XML & Java TechnologiesSystem using XML & Java Technologies

H. Stenzhorn H. Stenzhorn (( XtraMind Technologies GmbHXtraMind Technologies GmbH )) XtraGenXtraGen の文章生成メカニズムとの文章生成メカニズムと

そのその XMLXML とと JavaJava による実装による実装 XMLXML テンプレートによる文章生成テンプレートによる文章生成

– 形態素の扱い形態素の扱い– 生成文のレベル分け生成文のレベル分け

<template id="String"        category="String"> <conditions> Condition*</conditions> <parameters> Parameter*</parameters> <actions> Action+</actions> <constraints> Constraint*</constraints></template>

<conditions> <or> <and> <condition type="equal"> <get path="/recall"/> <value>95</value> </condition> <condition type="less"> <get path="/accuracy"/> <value>90</value> </condition> </and> <not> <condition type="exist"> <get path="/exception"/> </condition> </not> </or></conditions>

Page 17: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1717

ユーザレベルに応じユーザレベルに応じた生成のためのた生成のための XMLXML

テンプレートテンプレート<template id="explainExpert"        

category="explain">   <parameters>   <parameter       name="level"     

                 value="expert">   <parameter         name="verbosity"      value="low">   </parameters>      ...</template>generator.addParameter

("level","novice",0.75);generator.addParameter

("verbosity","low",0.5);

<template ...> <actions> <select category="determiner" label="X0"/> <select category="noun" label="X1"/> </actions> <constraint> <place label="X0" attribute="number"/> <place label="X1" attribute="number"/> <get

path="/categoryNumber"/></constraint></template>

形態素の制約のため形態素の制約のためのの XMLXML テンプレートテンプレート

Page 18: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1818

セッションセッション 33 :: Discourse, Dialog & Discourse, Dialog & SpeechSpeech

マルチモーダリティを扱えるマルチモーダリティを扱える XMLXML でのアでのアノテーションの活用ノテーションの活用– 音声認識音声認識– 談話生成談話生成

SALTSALT – VoiceXML – VoiceXML の次に来るものの次に来るもの ??

Page 19: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

1919

1.XML/XSL in the Dictionary: The Case of 1.XML/XSL in the Dictionary: The Case of Discourse Markers Discourse Markers

D. Berger, et al.D. Berger, et al. (( Univ. of PotsdamUniv. of Potsdam )) XMLXML による談話マーカ付による談話マーカ付

き辞書き辞書 DiMLexDiMLex を用いてを用いてXSLXSL によりにより HTMLHTML へ変換へ変換し可読性を向上し可読性を向上

文章生成,文章理解シス文章生成,文章理解システムへの応用が期待テムへの応用が期待

We were in SoHo; {nevertheless | nonetheless | however | still | yet}, we found a cheap bar.

We were in SoHo, but we found a cheap bar anyway.

Despite the fact that we were in SoHo, we found a cheap bar.

Notwithstanding the fact that we were in SoHo, we found a cheap bar.

Although we were in SoHo, we found a cheap bar.

談話マーカ談話マーカ接続詞ならびに接続接続詞ならびに接続の働きをする語の働きをする語

Page 20: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2020

2.XiSTS – XML in Speech Technology 2.XiSTS – XML in Speech Technology Systems Systems

M. Walsh, et al.M. Walsh, et al. (( Univ. of College DublinUniv. of College Dublin )) 音声認識のための音声認識のための 33つのサブシステムにつのサブシステムに XMLXML をを

活用活用– 音韻認識 音韻認識 LIPSLIPS

Network GeneratorNetwork Generator による音素配列オートマトによる音素配列オートマトンの生成とンの生成と XMLXML 記述記述

– 音声合成 音声合成 REFLEXREFLEXシラブル辞書の生成シラブル辞書の生成辞書エントリを辞書エントリを XMLXML 化化

– 辞書生成 辞書生成 T-REXT-REX異なる音韻特徴セットの記述を異なる音韻特徴セットの記述を XMLXML で作成で作成

Page 21: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2121

LIPSLIPS

alveolar ○ approximantapproximant ○ voicelessvoiceless ○ alveolar

fricative ○ palatopalato ○ voicelessvoiceless ○ fricative

[vowels] [n][m][S]

[S] [r]

Network GeneratorNetwork Generatorによる音素配列オートによる音素配列オートマトンの生成マトンの生成

パージングされ候補のパージングされ候補の音素配列が決定音素配列が決定

XMLXML 化され(次のスラ化され(次のスライド参照),イド参照), REFLEXREFLEXへの入力となるへの入力となる

音素配列オートマトン音素配列オートマトン

Page 22: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2222

音素配列オートマトンの音素配列オートマトンの XMLXML 表現表現<phonotactic_automaton language=“english”><phonotactic_automaton language=“english”> <arc position=“o1” voweltrans=“false” initial=“true” root_final=“false” <arc position=“o1” voweltrans=“false” initial=“true” root_final=“false”

suffix_final=“false” internal=“false”>suffix_final=“false” internal=“false”> <start_node>1</start_node><start_node>1</start_node> <end_node>2</end_node><end_node>2</end_node> <phonemes><phonemeSymbol>S</phonemeSymbol><phonemes><phonemeSymbol>S</phonemeSymbol> <overlapConstraint><overlapConstraint> <ranking>3</ranking><ranking>3</ranking> <feature_info1><feature_name>fricative</feature_name></feature_info1> <feature_info1><feature_name>fricative</feature_name></feature_info1>

<feature_info2><feature_name>voiceless</feature_name></feature_info2> <feature_info2><feature_name>voiceless</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <overlapConstraint><overlapConstraint> <ranking>2</ranking><ranking>2</ranking> <feature_info1><feature_name>palato</feature_name></feature_info1> <feature_info1><feature_name>palato</feature_name></feature_info1>

<feature_info2><feature_name>voiceless</feature_name></feature_info2> <feature_info2><feature_name>voiceless</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <overlapConstraint><overlapConstraint> <ranking>2</ranking><ranking>2</ranking> <feature_info1><feature_name>fricative</feature_name></feature_info1> <feature_info1><feature_name>fricative</feature_name></feature_info1>

<feature_info2><feature_name>palato</feature_name></feature_info2> <feature_info2><feature_name>palato</feature_name></feature_info2> </overlapConstraint></overlapConstraint> <typical_duration>50</typical_duration><typical_duration>50</typical_duration> <threshold>6</threshold><threshold>6</threshold> </phonemes></arc></phonemes></arc></phonotactic_automaton></phonotactic_automaton>

Page 23: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2323

<syllable>   So:n   <onset type=”first”>

<segment phonation=”voiceless”manner=”fricative”

place=”palato”duration=”null”>S</segment>

</onset><nucleus type=”first”>

<segment phonation=”voices”    manner=”vowellike” place=”back”

   height=”mid” roundness=”round” length=”tense”duration=”null”>o:

</segment></nucleus><coda type=”first”>

<segment phonation=”voiced” manner=”nasal” place=”apical”duration=”null”>n</segment>

</coda></syllable>

REFLEX, T-REXREFLEX, T-REX

XMLXML 化された特徴ベ化された特徴ベースのシラブル辞書ースのシラブル辞書を生成(を生成( REFLEXREFLEX ))

音素の特徴記述はユ音素の特徴記述はユーザによってカスターザによってカスタマイズされ新たな辞マイズされ新たな辞書を生成(書を生成( T-REXT-REX ))

Page 24: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2424

3.SALT: An XML Application for Web-based 3.SALT: An XML Application for Web-based Multimodal Dialog Management Multimodal Dialog Management

K. WangK. Wang (( Microsoft ResearchMicrosoft Research )) SALTSALT (( SSpeech peech AApplication pplication LLanguage anguage TTagsags ))

– WebWeb 上での分散環境におけるマルチモーダルな対話処理システ上での分散環境におけるマルチモーダルな対話処理システムのためのムのための XMLXML ベース言語ベース言語

– プログラミング言語に依存せずプログラミング言語に依存せず HTMLHTML ,, XMLXML に対話処理のインに対話処理のインタフェースとして埋め込み可能タフェースとして埋め込み可能

マルチモーダルマルチモーダル– GUIGUI環境において多様な方式でユーザが入力環境において多様な方式でユーザが入力– 音声入力,テキスト入力,マウスでのイベント通知など音声入力,テキスト入力,マウスでのイベント通知など

WebWeb ページ単位での制御フローページ単位での制御フロー データと表示を切り離すことでのモジュール性の向上データと表示を切り離すことでのモジュール性の向上 対話の解釈にセマンティックオブジェクトを用いた対話の解釈にセマンティックオブジェクトを用いた OOOO モデルを採モデルを採

用用

Page 25: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2525

Page 26: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2626

プロンプトオブジェクトのプロンプトオブジェクトの XMLXML表現表現

<input name=”origin” type=”text” /><input name=”destination” type=”text” /><input name=”date” type=”text” />…<prompt …> Do you want to fly from

<value targetElement=”origin”/> to<value targetElement=”destination”/> on<value targetElement=”date”/>?

</prompt>

Page 27: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2727

SALTSALT フォーラムフォーラムhttp://www.saltforum.org/http://www.saltforum.org/

Page 28: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2828

セッションセッション 44 :: Semantic WebSemantic Web

NLPNLP に用いるメタデータは汎用性や流通に用いるメタデータは汎用性や流通性から考えると性から考えると SemanticWebSemanticWeb での標準での標準スキーマへの準拠が妥当スキーマへの準拠が妥当

SemanticWebSemanticWeb におけるオントロジの洗におけるオントロジの洗練やメンテナンスに練やメンテナンスに NLPNLP の手法が適用の手法が適用(例:多義性解消,オントロジ等の知識(例:多義性解消,オントロジ等の知識獲得)獲得)

エージェントのプロファイリングにエージェントのプロファイリングに IRIR のの成果を適用成果を適用

Page 29: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

2929

1.Annotating the Semantic Web using 1.Annotating the Semantic Web using Natural Language Natural Language

B. KatzB. Katz (( MIT Artificial Intelligence Lab.MIT Artificial Intelligence Lab. ))

STARTSTART システムシステム 人間が人間が

SemanticWebSemanticWebに自然言語で質に自然言語で質問し満足できる問し満足できる回答を得るため回答を得るためのアノテーショのアノテーションのしくみをンのしくみをRDFRDF に実現に実現

Page 30: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

3030

RDFRDF でのプロパティ設定でのプロパティ設定nlnl アノテーションを付けたアノテーションを付けた CIA World CIA World

FactbookFactbook<rdfs:Class ID=“Country”><rdfs:Class ID=“Country”>

<rdfs:comment>A Country in the CIA <rdfs:comment>A Country in the CIA Factbook</rdf:comment>Factbook</rdf:comment>

</rdfs:Class></rdfs:Class><rdf:property ID=“population”><rdf:property ID=“population”>

<rdfs:domain rdf:resource=“#Country”/><rdfs:domain rdf:resource=“#Country”/><rdfs:range rdf:resource=“xsd:string”/><rdfs:range rdf:resource=“xsd:string”/><nl:ann text=“Many People live in ?s”/><nl:ann text=“Many People live in ?s”/><nl:ann text=“population of ?s”/><nl:ann text=“population of ?s”/><nl:gen text=“The population of ?s is ?o”/><nl:gen text=“The population of ?s is ?o”/>

</rdf:property></rdf:property>

Page 31: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

3131

インフォメーションアクセススキーマ多様な自然言語の質問に応答するためのメタ記述

<nl:InformationAccessSchema><nl:InformationAccessSchema><nl:ann>$country-1’s $att is larger than $country-2’s <nl:ann>$country-1’s $att is larger than $country-2’s $att</nl:ann>$att</nl:ann><nl:pattern>?x a :Country</nl:pattern><nl:pattern>?x a :Country</nl:pattern><nl:pattern>?x map($att) ?var-1</nl:pattern><nl:pattern>?x map($att) ?var-1</nl:pattern><nl:pattern>?y a :Country</nl:pattern><nl:pattern>?y a :Country</nl:pattern><nl:pattern>?y map($att) ?var-2</nl:pattern><nl:pattern>?y map($att) ?var-2</nl:pattern><nl:action>display(gt(?var-1,?var-2))</nl:action><nl:action>display(gt(?var-1,?var-2))</nl:action><nl:mapping><nl:mapping>

<nl:hash variable=“$attribute”><nl:hash variable=“$attribute”> <nl:map value=“population”>:population</nl:map><nl:map value=“population”>:population</nl:map> <nl:map value=“area”>:area</nl:map><nl:map value=“area”>:area</nl:map> ......</nl:hash></nl:mapping></nl:hash></nl:mapping>

</nl:InformationAccessSchema></nl:InformationAccessSchema>

Page 32: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

3232

プランスキーマ質問にどのような手順で応答するのかを手続

き的に記述<nl:InformationPlanningSchema><nl:InformationPlanningSchema> <nl:ann>distance between $country1 and $country2</nl:ann><nl:ann>distance between $country1 and $country2</nl:ann> <nl:plan>?x a :Country</nl:pattern><nl:plan>?x a :Country</nl:pattern> <rdf:seq><rdf:seq> <rdf:li>what is the capital of $country1 := ?capital1</rdf:li><rdf:li>what is the capital of $country1 := ?capital1</rdf:li>

<rdf:li>what is the capital of $country2 := ?capital2</rdf:li><rdf:li>what is the capital of $country2 := ?capital2</rdf:li><rdf:li>what is the distance between ?capital1 and ?<rdf:li>what is the distance between ?capital1 and ?capital2 := ?distance</rdf:li>capital2 := ?distance</rdf:li>

</rdf:seq></rdf:seq> </nl:plan></nl:plan> <nl:action>display(?distance)</nl:action><nl:action>display(?distance)</nl:action></nl:InformationPlanningSchema></nl:InformationPlanningSchema>

Page 33: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

3333

START WebSTART Web サイトサイトhttp://www.ai.mit.edu/projects/infolab/http://www.ai.mit.edu/projects/infolab/

Page 34: 第 2 回国際ワークショップ“ NLPXML-2002” の概要と NLP, Semantic Web  の融合に向けての展開

29-Nov-0229-Nov-02 情報処理学会デジタルドキュメント研情報処理学会デジタルドキュメント研究会大阪究会大阪

3434

3rd Workshop on NLP and XML 3rd Workshop on NLP and XML (( NLPXML-2003NLPXML-2003))