Upload
khcoder
View
64.217
Download
37
Embed Size (px)
Citation preview
KH Coderによる英語データの分析
樋口耕一
1
2
英語データを分析するための設定 1/2
① 「設定」をクリック
英語データを分析する際には、
前処理の前に以下の設定を:
A) 語の取り出し方法を「茶
筌」から英語向けの方法
に変更
B) Stop wordsを指定
3
英語データを分析するための設定 2/2
① 「Lemmatization」をクリック
③ 「tutorial_en」フォルダにある「stopwords_sample_en.txt」というファイルをここにドラッグ&ドロップ。 ※あるいは中身をコピー&ペーストしてもOK。
② 「config」をクリック
④ 「OK」をクリック ⑤ 「OK」をクリック
4
あとは日本語データと同様に分析可能
※チュートリアル添付の「坊っちゃん」英語版(botchan_en.txt)の分析結果から
5
Stop wordsについて
Stop wordsとして指定した語は「その他(OTHER)」品詞に分類されるので、分析対象から外れる
Be動詞のような一般的な語をStop wordsに指定して、分析から省くことができる
分析の目的や方針に応じて、Stop wordsとして指定する語は変わりうるので注意が必要