Upload
swenbe
View
57
Download
4
Embed Size (px)
Citation preview
美野 秀弥 田中 英輝 言語処理学会第17回年次大会発表論文集
pp.744-‐747, 2011
プレゼンテーション:野口 真人
1
p 動詞連用形名詞の平易化を行う理由 p 動詞連用形名詞が難易度の高い(1,2級の)表現である
p 連用形名詞はニュースでもよく使用されている p 語彙の平易化において連用形名詞の平易化は効果が大きい!
p どのような形に平易化? p 動詞連用形名詞は動詞から派生するという性質上,用言(動詞)に平易化できることが多い
p 連用形名詞を用言へと変換することに取り組む
2
p 動詞の連用形が名詞へと派生した形態素 p 読み・易い 動詞連用形 形容詞 p 読み・続ける 動詞連用形 動詞 p 深い・読み
連体修飾詞 名詞
p 今回は,連体修飾詞を1つ持つ連用形名詞を平易化の対象とした
3
平易化対 の獲得
平易化対を 用いた置換
連体修飾句 から
連用修飾句 への変換
用言から 体言への変換 (扱わない)
4
p 例)「需要の見通し」を平易化
(見通し(1級),予測する(2級)) などの組み合わせを獲得
「需要の予測する」
「需要を予測する」
「需要を予測すること」
p 以下の3つの手法で平易化対を獲得する p 国語辞典を用いた手法 p シソーラスを用いた手法 p 連用形名詞の特徴を用いた手法
p 上2つの手法では獲得できる平易化対数が少ないため,連用形名詞の特徴を用いた手法も利用する
5
p 論文「国語辞典を使った放送ニュースの平易化」で報告した国語辞典を用いた手法を利用
6
国語辞典 からの抽出
平易化対 の獲得
p 国語辞典の語釈文から言い換え可能な平易語を獲得する
p その際, 冗長表現と不要表現を取り除く p 例)「救い」
7
見出し語:救い 語釈文 :救うこと, 助けること 不要表現 不要表現 候補 :「救う(2級)」, 「助ける(2級)」
p 抽出した候補の中から平易化の関係にある対を平易化対として獲得
p 平易化対は(連用形名詞, 平易化した用言)の形で獲得
8
連用形名詞:救い(1級) 平易化用言:「救う(2級)」, 「助ける(2級)」 平易化対 :(救い(1級), 救う(2級)) (救い(1級), 助ける(2級))
p 単語間の上位下位関係が記述されたシソーラスを用いて平易化対を獲得する p 例)「怒り(上位語)」と「激怒(下位語)」
9
感情
怒り
激怒 喜び
感情
怒り
激怒
喜び
p 単語を分類し体系づけた辞書 p 上位/下位関係 p 部分/全体関係 p 同義関係 p 類義関係
p 語彙の持つ意味から目的の単語に達することができる
p 代表的なものとして”WordNet”などがある
10
日本語 ワードネット からの抽出
類似度を 用いた手法
平易化対 の獲得
11
p 日本語ワードネットから(上位語, 下位語)の対を獲得する p 例)「備え」
12
下位語 :備え 上位語 :準備, 仕込み, 用意, 警備 平易化対:(備え, 準備), (備え, 仕込み) (備え, 用意), (備え, 警備)
p 国語辞典の語釈文間の類似度が高い対のみを抽出する
13
見出し語:備え 語釈文 :ある事態が起こった場合などに対する準備・用意
見出し語:準備 語釈文 :物事をする前に, あらかじめ必要なものを用意すること
見出し語:警備 語釈文 :変事に備えて警戒し, 防備すること
類似度高い
類似度低い
平易化対:(備え, 準備), (備え, 仕込み) (備え, 用意), (備え, 警備)
p 抽出した対の中で, 平易化の関係にある対を抽出する
14
平易化対:(備え(級外), 準備(3級)) (備え(級外), 用意(3級))
p 連用形名詞と, その派生元である動詞を平易化対として獲得する
15
(連用形名詞, 派生元の動詞) の対の獲得
(動詞, 平易な動詞) の平易化対の獲得
平易化対(連用形名詞, 平易化した用言)の獲
得
p 連用形名詞とその派生元の動詞を対として獲得 p 例)見込み
16
連用形名詞:見込み 派生元動詞:見込む 対 :(見込み, 見込む)
p 「国語辞典を用いた手法」から, 派生元の動詞の平易化対を獲得する
17
見出し語:見込む 語釈文 :思う, 考える 平易化対:(見込む, 思う), (見込む, 考える)
p 2つの対を組み合わせて(連用形名詞, 平易化した用言)を平易化対として獲得する
18
P16の対 :(見込み, 見込む) P17の対 :(見込む, 思う), (見込む, 考える) 平易化対:(見込み(1級), 思う(3級)) (見込み(1級), 考える(3級))
p 連用形名詞を用言へ変換したので, 連用形名詞に修飾していた連体修飾句を連用修飾句に変換しなければならない
p 「の」は,「が」と「を」の両方に対応する p 用言に対して適切な助詞を選ぶ必要がある
19
連体修飾句
需要の
意義の
連用形名詞
落ち込み
申し立て
連体修飾句
需要が
意義を
連用形名詞
減る
主張する
20
手順Ⅰ: 連体修飾句 変換規則 の適用
手順Ⅱ: 格フレーム との照合
p 連体修飾句が形容詞型か名詞型かを判定 p 形容詞型の場合(形容詞型連体形)は, 形容詞を連用形に変換 p 例)「激しい当たり」→「激しく当たる」
p 名詞型の場合(名詞+助詞相当句)は, 助詞相当句置換規則を適用 p 例)「社会とのかかわり」→「社会とかかわる」
21
p 「としての/についての/にかけての/にあたっての/に対しての/を通じての」 p 後ろの「の」を省く
p 例)「保障についての考え」→「保障について考える」 p 「に対する」,「に関する」など助詞相当句に用言相当語が含まれる場合 p 助詞相当句中の用言相当語を連用形にする
p 例)「健康に関する悩み」→「健康に関して悩む」 p 助動詞「など」「だけ」などを伴う場合
p 助動詞を省いてから助詞相当句置換規則を利用 p 例)「議会などに対する働きかけ」 →「議会などに対して働きかける」
22
p 「の」,「からの/への/での/との」,「による」 p 置換先の助詞相当句の候補が複数存在するため, 助詞相当句の決定には格フレームとの照合が必要
23
p 用言とそれが持ちうる格要素(名詞+助詞)を記述したもの
p 今回は格要素ごとに出現頻度が併記されている京大格フレームを利用
24
25
26
27
連用修飾句 の変換候補 の抽出
格フレーム対
との照合
p 連用修飾句の変換候補を(名詞,助詞相当句,用言)の形で抽出 p 例)「復興への努め」(用言:努める) →「への」の置換候補は「へ/に/を」なので 変換候補は以下の3つ
p (復興,へ,努める) p (復興,に,努める) p (復興,を,努める)
28
p 変換候補と格フレーム対との照合を行い,照合できた対の中から頻度が最も多い対を用いて連用修飾句を決定する p 例)格フレーム対(復興,に,努める,326) 「復興への努め」→「復興に努める」
29
p 提案手法を2000年から2009年までのNHKニュース記事中の文節に適用
p 平易化の対象は, 連用修飾句を1つ持つ連用形名詞の難語(1,2級, 級外)とする
p 連体修飾句の分類ごとに評価を行う p 評価Ⅰ:手順1のみで変換がおこなわれる場合
p 20例ずつ無作為に抽出, 著者が評価 p 評価Ⅱ:手順1に加えて, 手順2が必要な場合
p 20例ずつ無作為に抽出, 著者を含めた3人の被験者が評価
30
p 「用言の評価」と「修飾句の評価」をそれぞれ以下の4段階で設定
p 「修飾句の評価」は, 「用言の評価」が0,1,2となった場合のみ行った
31
p Aは筆者,B,Cは筆者以外の被験者
32
p 上部が評価Ⅰ,下部が評価Ⅱの結果である p 評価0,1,2を正解とする p 「用言の評価」について
p 精度は評価Ⅰ,Ⅱ全体で76.4% p 「連用形名詞を用いた手法」を除いた場合の精度は56.0%
p 評価Ⅰの「修飾句の評価」について p 形容詞型,格フレームとの照合を必要としない名詞型ともに精度は100%
33
p 評価Ⅱの「修飾句の評価」について p 格フレームとの照合を必要とする名詞型の精度は全体で69.6%
p 助詞相当句別の精度は以下のようになる p Baselineは置換先の候補を無作為に選んだ場合の頻度
34
p 誤りとなった原因は,連用形名詞と平易化した用言との間の情報の欠落であった p 例)「住民の訴え」
→「住民が言う」と変換されてしまう
p 解消のためには, 情報の欠落部分と平易化可能性との関係性を明らかにする必要がある
35
見出し語:訴える 語釈文 :不平や痛みなどを人に言うこと 冗長表現 不要表現
p 正しい助詞相当句が付与されなかった場合に誤りとなる p 例)「職員からの申し出」の変換候補
p (職員,から,申し出る) p (職員,が,申し出る)←正解 p (職員,に,申し出る)←格フレームに出現
p 改善のためには格フレームの用例の増加が必要
p もしくは変換規則を加えればよい
36
p 連体修飾句を連用修飾句へと変換する際,連体修飾句変換規則の適用と格フレームとの照合を組み合わせることが有効とわかった
p 今回は変換後の接尾辞の付与や活用形の修正について取り組まなかった p 文に埋め込むことを考えると体言への変換は必須であり,今後の課題
37