5
KH Coderによる英語データの分析 樋口耕一 1

KH Coderによる英語データの分析

  • Upload
    khcoder

  • View
    64.217

  • Download
    37

Embed Size (px)

Citation preview

Page 1: KH Coderによる英語データの分析

KH Coderによる英語データの分析

樋口耕一

1

Page 2: KH Coderによる英語データの分析

2

英語データを分析するための設定 1/2

① 「設定」をクリック

英語データを分析する際には、

前処理の前に以下の設定を:

A) 語の取り出し方法を「茶

筌」から英語向けの方法

に変更

B) Stop wordsを指定

Page 3: KH Coderによる英語データの分析

3

英語データを分析するための設定 2/2

① 「Lemmatization」をクリック

③ 「tutorial_en」フォルダにある「stopwords_sample_en.txt」というファイルをここにドラッグ&ドロップ。 ※あるいは中身をコピー&ペーストしてもOK。

② 「config」をクリック

④ 「OK」をクリック ⑤ 「OK」をクリック

Page 4: KH Coderによる英語データの分析

4

あとは日本語データと同様に分析可能

※チュートリアル添付の「坊っちゃん」英語版(botchan_en.txt)の分析結果から

Page 5: KH Coderによる英語データの分析

5

Stop wordsについて

Stop wordsとして指定した語は「その他(OTHER)」品詞に分類されるので、分析対象から外れる

Be動詞のような一般的な語をStop wordsに指定して、分析から省くことができる

分析の目的や方針に応じて、Stop wordsとして指定する語は変わりうるので注意が必要