28
スマホで語彙力測定(認知症簡易検査への応用) -ファイル圧縮技術を利用した 認知症スクリーニング装置- 奈良先端科学技術大学院大学 研究推進機構 特任准教授 荒牧英治

実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

スマホで語彙力測定(認知症簡易検査への応用)

-ファイル圧縮技術を利用した認知症スクリーニング装置-

奈良先端科学技術大学院大学

研究推進機構

特任准教授 荒牧英治

Page 2: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

• 音声特徴– 不明瞭な発話

– 言いよどみ/フィラー

– :

• 言語特徴– 未知語が多い

– 複雑な構文

– 結束性(cohesion)

一貫性(coherence)[Halliday&Hasan1976]の欠如

自然言語処理

能力測定

2

(77歳男性)(77歳男性)

Page 3: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

認知症発症数と医療費問題

2014年1月31日 読売新聞

65歳以上の高齢者における認知症の現状

(平成22年時点の推計)

医療費:数千億円介護費:6兆~7兆円*既に算出している英国並みと仮定すると:全体で10兆円を超す見込

要介護認定されている

認知症高齢者(日常生活

自立度II以上)約280万人

要介護認定されている

認知症高齢者(日常生活自立度I)

または要介護認定を

受けていない認知症高齢者約160万人

MCIの認知症高齢者

(年間で10~15%が認知症に

移行)約380万人

(全体の13%)健常者

(約2,054万人)

参考:厚生労働省http://www.gov-online.go.jp/useful/article/201308/1.html (2014/2/4)

3

Page 4: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

認知症の種類

アルツハイマー型認知症典型例

18.75%

脳血管性認知症

18.75%アルツハイマー型認知症

+脳血管障害

43.75%

その他の認知症

18.75%

n=32 宮城県田尻町

〈出典〉 Kenichi Meguro+ : Arch Neurol, 59, 1109(2002)

4

Page 5: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

認知症とは

意識障害なし

記憶障害あり

判断力障害(計画不能)

あり

認知症

社会生活・対人関係に支障あり

うつ病の否定

〈参考〉政府広報オンラインhttp://www.gov-online.go.jp/useful/article/201308/1.html (2014/2/4) 5

社会生活・対人関係に支障あり

Page 6: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

私達が今居るところはどこですか?

これから言う3つの言葉を言ってください.あとでまた聞きますので覚えておいてください.

a)桜,b)猫,c)電車

100から7をひいてください.その答えからまた7をひいてください.

6

長谷川式簡易知能評価スケール

Page 7: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

前にアレで見たぞ!認知症のアレだろう!失敬な!ワシはボケてなどおらん!

検査を受けるのを嫌がる患者さんが多い

知っている野菜の名前をできるだけ多く言って下さい

7

Page 8: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

最近楽しかったことは何ですか?

自然な会話で認知症の傾向を察知

8

Page 9: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

iPhone上の語彙量推定システム

宮部真衣,四方朱子,久保圭, 荒牧英治: 音声認識による認知症・発達障害スクリーニングは可能か?-言語能力測定システム“言秤”の提案-, グループウェアとネットワークサービスワークショップ2014. (2014/11/27, 湯河原) ベストプレゼンテーション (9%=2件/22件)・ベストペーパー賞 (9%=2件/22件) ・山下記念賞

Page 10: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

iPhone上の語彙量推定システム

宮部真衣,四方朱子,久保圭, 荒牧英治: 音声認識による認知症・発達障害スクリーニングは可能か?-言語能力測定システム“言秤”の提案-, グループウェアとネットワークサービスワークショップ2014. (2014/11/27, 湯河原) ベストプレゼンテーション (9%=2件/22件)・ベストペーパー賞 (9%=2件/22件) ・山下記念賞

Page 11: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

語彙能力は健常者で保たれる認知症患者で急速に減少する

年齢

年齢

健常者の語彙能力

認知症患者の語彙能力

• Snowdonや Kemperにて英語言語にて認知症者の語彙力が発症の30年前からも予測できる可能性を示唆

Snowdon, D. A., Kemper, S., Mortimer, J. A., Greiner, L. H.,

Wekstein, D. R., & Markesbery, W. R. (1996). Linguistic

ability in early life and cognitive function and Alzheimer’s

disease in late life: Findings from the Nun Study. Journal of

the American Medical Association, 275, 528‐532.11

64 86

64 86

Page 12: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

病理的妥当性

12

Page 13: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

M77

京都府複合ケア施設「修徳」での「認知症安心相談会」の様子(2015/03/15, Kyoto)

2010年以降「修徳」の入居は1000人待ちの状態がつづいている

77歳男性

85歳男性

82歳男性

86歳女性

72歳男性

Page 14: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

材料 n=19 (AD=8)

• 認知症群(AD; Alzheimer’s Disease) – レベル軽度〜中等度のアルツハイマー型認知症患者

• 対照者群 (nonAD) – 認知症でないと確認でき,中枢神経系に異常を認めない,認知

症群と年齢をマッチさせた群

– 中枢神経系の代謝に影響を及ぼすような疾患を持つ者,病状などにより十分な同意能力を持たない者.非日本語母語話者.

AD(MMSE21点以下)

nonAD(MMSE22点以上)

性別男性: 1名;女性: 7名

男性: 4名; 女性: 5名

年齢 77.2歳 76.6歳

MMSEScore

17.0 25.1

14

Page 15: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

材料

• 病院を受診中の患者が,心理検査時に話す内容を収録し,書き起こしたもの

あー 体調はー 別にどうもないです 物をよう忘れるだけで ほんで足がちょっと悪いのでね はい 手術して足が悪いしね あのーまあだいたい かがと かがとがつけないんですよ 今 あのー 痛んでてね で こー 今つま先だけで今ちょっと歩いてるからね そ そうですね ほんでちょっとあのよっぽど痛いときは まー松葉杖ついたりはするんですけどね まー今日は娘が自動車乗せてってくれたからね もうつま先だけでね この病院内を歩くぐらいやったらね どうもないから つま先だけで歩いてます

AD nonAD p value

TIME 17.40 13.27 0.23

15

Page 16: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

5つの言語指標

• Type Token Ratio (TTR) 語彙量– TTR=Type/Token

• Token Per Second (TPS) 語彙アクセス速度– TPS=Token/発話時間(秒)

• Lexical Education Level (LEL) 語彙レベル– LEL=中級以上の名詞数/名詞数

• Average Dependency Distance (ADD) 構文の複雑さ– ADD=Σp∈P DD(p)

• Average Word User (AWU) 語彙標準性– AWU=Σw∈W WU (w)

16

Page 17: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

語彙の難しさ=日本語教育語彙表Lexicon Education Level (LEL)

• 語彙の難易度を示す

• 難易度は日本語学習辞書に収載されている語彙レベルを用いた

レベル example

LEVEL6 愛敬

LEVEL5 愛国

LEVEL4 愛犬

LEVEL3 愛情

LEVEL2 合う

LEVEL1 会う LEL=中級以上の名詞数/名詞数

中級

上級

初級

砂川有里子, 学習辞書編集支援データベース作成について -『学習辞書科研』プロジェクトの紹介」. 日本語教育連絡会議論文集, 2012. 24.

17

Page 18: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

構文の複雑さ= Dependency Distance

• 構文解析– あらゆる解析結果Tの中から,もっとも解析確率の高

い解釈を選ぶ

• 文の生成確率≒ 構文の自然さ– その時の確率を文の自然さとみなす

ARGMAX t∈T Pr(t)

ADD=Σp∈P DD(p)

Lin D. On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733.

18

Page 19: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

AD nonAD p value

TTR 0.249

(0.054 )

0.313

(0.052 )

0.02

TPS 1.91

(0.99)

2.68

(0.37)

0.33

LEL 2.171

(0.157)

2.271

(0.135)

0.16

ADD 0.661

(0.20)

0.704

(0.182 )

0.64

AWU 69736.1

(5877.8)

62430.4

(5578.2)

0.33

結果

語彙量(TTR)のみ有意差が認められた先行研究と一致「構文能力は年齢とともに低下し,健常者と疾患群での差はないが,語彙能力は健常者で保たれており,アルツハイマー型認知症の特徴となる」

Snowdon DA, Kemper SJ, Mortimer JA, Greiner LH, Wekstein DR, Markesbery WR. Linguistic ability in early life and

cognitive function and Alzheimer's disease in late life. Findings from the Nun Study. JAMA : the journal of the American

Medical Association. 1996;275(7):528-32. PubMed PMID: 8606473.19

Page 20: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

繰り返し

質問内容からのズレ

発話内容認知症高齢者 健常高齢者

指示語

Page 21: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

冗長性 ≒ 要約可能性 ≒ 圧縮率

そうですね あのー最近 色んなあのーこともしてみたいのですけど あのー一応バイクの好きな 最近 あのー バイクのツー

リングとか そういうこととか

$@ですね※♫∃ ♠♦ 色んな※♫∃*&もしてみたいのですけど ※♫∃一応※■♥好きな ♠♦ ※♫∃ ※■♥ツーリング&% $@いう*&&%

dですね. c色んな. bもしてみたいのですけど. 一応a好きなc.a ツーリングbdいうeb

※♫∃ =あのー ✕4※■♥ =バイクの ✕2&% =とか ✕2♠♦ =最近 ✕2$@ =そう ✕2*& =こと ✕2

※♫∃ →.※■♥ →a&% →b♠♦ →c$@ →d*& →e

辞書法

符号割当

65文字 = 130 byte

43文字 = 86 byte

圧縮率=86/130=50%

Page 22: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

主要な圧縮方式(すべて方式は辞書法+符号化)

圧縮方式 説明

ZIP 現在使われている圧縮方式.自己解凍形式で解

凍ソフトが必要ない.

LZH フリーソフトウェア「LHA」で使用されていた形式

で,主に国内で普及している.Windows 用の圧縮

形式としては,Zip 形式と並んで広く利用されてい

る.圧縮率に優れている.

TAR.GZ Linux でよく使われるファイル圧縮方式であ

る.

CAB Microsoft 社が開発したファイル圧縮方式.他

の圧縮形式よりも圧縮率が全体的に高いと言

われている.

Page 23: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

結果AD nonAD p value

TTR 0.249

(0.054 )

0.313

(0.052 )

0.020

TCRZIP 0.348

(0.054)

0.395

(0.044)

0.054

TCRLZH 0.355

(0.04)

0.402

(0.032)

0.015

TCRTARGZ 0.389

(0.066)

0.446

(0.051)

0.060

TCRCAB 0.364

(0.048)

0.413

(0.038)

0.029

• 冗長性という概念を提唱

• 冗長性を圧縮可能性とみなすとこれまで十分に実用化が進んだ圧縮アルゴリズムをそのまま適応可能

Page 24: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

今後の予定

• 他の疾患/ドメインへの適応– 発達障害(自閉スペクトラム症) 東大・神経内

– 思春期の成長(思春期の人間形成支援) 東大精神科

• <患者の語りを引き出す>という行為が社会を変える– 本来,口を閉ざしがちである認知症の語りを引き出

す場を生み出す

– 疾患への社会的理解を促進し,結果的に疾患への社会的無理解からくる偏見や診断への抵抗感を大きく軽減

24

Page 25: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

ASD utilizes easy words

Autism Spectrum Disorders

Aramaki E, Shikata S, Miyabe M, Usuda Y, Asada K, Ayaya S, Kumagaya S. Understanding the Relationship betweenSocial Cognition and Word Difficulty. A Language Based Analysis of Individuals with Autism Spectrum Disorder.Methods Inf Med. 2015;54(6) (IF=1.8)

Page 26: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

測定

Biom arker LangM arker

⾔語マーカ ー

測定

産出

Bra in Language

Im aging NLPN atu ral Language Processin g

⾔語冗⻑性[H 27特願]

潜在語彙量[Aram aki+ 2015]

:

Page 27: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

お問い合わせ先

奈良先端科学技術大学院大学

産学連携コーディネーター 那脇 勝

TEL 0743-72-5930

FAX 0743-72-5015

e-mail k-sangaku@ad.naist.jp

Page 28: 実例を交えた Natural Language Processing in …...On the structural complexity of natural language sentences. Proc. COLING'96; 1996. pp. 729–733. 18 AD nonAD p value TTR 0.249

本技術に関する知的財産権

• 発明の名称 :診断装置、診断方法、及びプログラム

• 出願番号 :特願2016-036988

• 出願人 :奈良先端科学技術大学院大学

• 発明者 :荒牧英治