10
弘前大学教育学部附属教育実践総合センター 研究員紀要 第 10 号(通号第 20 号):33~42(2012 年3月) 初級学習者用の語彙サイズテストの開発 - 試作テスト結果分析を通して - 佐藤 剛 弘前市立常盤野中学校 語彙サイズテストとは、学習者がどれだけ多くの語彙を習得したか、つまり語彙の 広さを測定するためのテストである。これまで様々なタイプの語彙サイズテストが開 発されている。しかし、現存する語彙サイズテストは難易度や元となる語彙リストの 特性などの点において日本の初級学習者である中学生に適応しているとは言い難い。 そこで本研究は、日本人初級英語学習者用の語彙サイズテストの開発を目的とする。 中学生用の検定教科書6社をもとに 1324 語からなる独自の語彙リストを開発し、出現 頻度 200 語ごとに区切り、そこからそれぞれランダムに 27 問を出題するマクロをエク セルで作成した。今年度はレベル1からレベル3の 3 つのレベルのテストをそれぞれ 2つのフォームを使用している教科書が異なる中学生 214 名に実施し、その妥当・信 頼性検証を行った。その結果、学校間に有意な差は見られず、レベル間には有意な差 が見られたことから、開発したテストは使用する教科書が異なっても、等しく使用で きるものであることレベル分けの妥当性が実証された。一方 2 つのフォームの間には 有意な差が見られ、ランダムにテスト項目を抽出した際に、テストの難易度は安定し ないことが明らかとなった。 【キーワード】語彙サイズテスト 語彙リスト 語彙指導 中学生 学習者がどれだけ多くの語彙を習得しているかを示す語彙サイズが、学習者の熟達 度を示す一つの基準となることはこれまで多くの研究によって実証的に明らかにされ ている。 Meara(1996) Koda(1989) Laufer(1992) Arnauld(1992) 。そのため、 これま 学習者の語彙を「広さ」という側面から測定する語彙サイズテストは Vocabulary Levels Test Nation, 1990; 2001 )をはじめとして、元となる語彙リストの種類やそのテスト形 式などにおいて数多くのテストが存在する。(Meara and Buxton, 1987; Meara, 1992) (望 , 1998 )(佐藤, 2003 )すなわち学習者がどれだけ多くの語彙を知っているかを知るこ とによって、その学習者がどれだけよく英語を運用できるのかを推定することができると 言い換えることができるのである。 さらに、学習者の語彙サイズを測定することは、生徒の学習や指導という点においても 非常に有効である。指導者が自らが指導する学習者の語彙サイズを客観的な指標によって 把握することによって、その学習者のレベルを明確に把握することができる。それによっ て、その学習者の熟達度に応じた授業の展開を行なったり、学習者のレベルに合致した教 材を選択することができる。 しかし、現存する語彙サイズテストは、成人学習者を対象としているものがほとんどで あり、初級英語学習者である日本人中学生に、そのままの形で実施することは、一番簡単 なレベルであっても、その難易度という点において困難である。さらにもととなる語彙リ ストも、一般の英語をもととしているため、教科書を使用している中学生の語彙の特性と は、頻度や分布などの面で大きく異なることが予想される。 そこで、本研究は、日本人初級学習者専用の語彙サイズテストを開発することを最終目 33

初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

弘前大学教育学部附属教育実践総合センター

研究員紀要 第 10 号(通号第 20 号):33~42(2012 年3月)

初級学習者用の語彙サイズテストの開発- 試作テスト結果分析を通して -

佐藤 剛 弘前市立常盤野中学校

1

初級学習者用の語彙サイズテストの開発

~試作テスト結果分析を通して~ 佐藤 剛 常盤野中学校

要旨

語彙サイズテストとは、学習者がどれだけ多くの語彙を習得したか、つまり語彙の

広さを測定するためのテストである。これまで様々なタイプの語彙サイズテストが開

発されている。しかし、現存する語彙サイズテストは難易度や元となる語彙リストの

特性などの点において日本の初級学習者である中学生に適応しているとは言い難い。

そこで本研究は、日本人初級英語学習者用の語彙サイズテストの開発を目的とする。

中学生用の検定教科書6社をもとに 1324 語からなる独自の語彙リストを開発し、出現

頻度 200 語ごとに区切り、そこからそれぞれランダムに 27 問を出題するマクロをエク

セルで作成した。今年度はレベル1からレベル3の 3 つのレベルのテストをそれぞれ

2つのフォームを使用している教科書が異なる中学生 214 名に実施し、その妥当・信

頼性検証を行った。その結果、学校間に有意な差は見られず、レベル間には有意な差

が見られたことから、開発したテストは使用する教科書が異なっても、等しく使用で

きるものであることレベル分けの妥当性が実証された。一方 2 つのフォームの間には

有意な差が見られ、ランダムにテスト項目を抽出した際に、テストの難易度は安定し

ないことが明らかとなった。 【キーワード】語彙サイズテスト 語彙リスト 語彙指導 中学生 1.はじめに 学習者がどれだけ多くの語彙を習得しているかを示す語彙サイズが、学習者の熟達

度を示す一つの基準となることはこれまで多くの研究によって実証的に明らかにされ

ている。Meara(1996)、Koda(1989)、Laufer(1992)、Arnauld(1992)。そのため、これま

で学習者の語彙を「広さ」という側面から測定する語彙サイズテストは Vocabulary Levels Test(Nation, 1990; 2001)をはじめとして、元となる語彙リストの種類やそのテスト形

式などにおいて数多くのテストが存在する。(Meara and Buxton, 1987; Meara, 1992)(望

月 , 1998)(佐藤,2003)すなわち学習者がどれだけ多くの語彙を知っているかを知るこ

とによって、その学習者がどれだけよく英語を運用できるのかを推定することができると

言い換えることができるのである。 さらに、学習者の語彙サイズを測定することは、生徒の学習や指導という点においても

非常に有効である。指導者が自らが指導する学習者の語彙サイズを客観的な指標によって

把握することによって、その学習者のレベルを明確に把握することができる。それによっ

て、その学習者の熟達度に応じた授業の展開を行なったり、学習者のレベルに合致した教

材を選択することができる。 しかし、現存する語彙サイズテストは、成人学習者を対象としているものがほとんどで

あり、初級英語学習者である日本人中学生に、そのままの形で実施することは、一番簡単

なレベルであっても、その難易度という点において困難である。さらにもととなる語彙リ

ストも、一般の英語をもととしているため、教科書を使用している中学生の語彙の特性と

は、頻度や分布などの面で大きく異なることが予想される。 そこで、本研究は、日本人初級学習者専用の語彙サイズテストを開発することを最終目

33

Page 2: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

佐藤  剛

2

標としている。そのために、これまで、中学生用の検定教科書6社に出現する語彙の頻

度から 1324 語からなる語彙リスト作成した。それを 200 語ずつ 6 つのレベルに分け、

その 200 語から 27 の語彙を無作為に抽出するテストを開発した。昨年度は、そのうち

レベル 1 からレベル3までを、2名程度の被験者を対象に実施し、正答数やアンケー

ト、リトロスペクションなどから得られたデータをもとに質的な分析を行った。その

結果、本研究で開発したテストが妥当性・信頼性を持ちうる可能性を示すものであっ

た。それを受けて、より大規模な被験者を対象に、試行テストを実施し、本研究で開

発した語彙サイズテストの信頼性・妥当性を実証的に明らかにする必要がある。 2.先行研究

Meara(1996)、Koda(1989)、Laufer(1992)、Arnauld(1992)など多くの先行研究におい

て、語彙は英語の熟達度と強い関係があると指摘されていることが挙げられる。言い換え

れば、ある学習者の語彙サイズを測定することによって、その学習者がどれくらい英語使

用において習熟しているのかを推測することができるのである。このことは多くの研究で

実効的に証明されていることはもちろんであるが、単語をたくさん知っていれば、よりよ

く英文を読解したり聴解することができる、また、語彙が豊富な人はそれだけ円滑に会話

などコミュニケーションをとることができるということは十分納得のできることであろう。 現在、使用されている語彙サイズテストには以下のようなものがある。 ①Vocabulary Levels Test(VLT)(Nation, 1990; 2001) ②チェックテスト (Meara and Buxton, 1987; Meara, 1992) ③語彙サイズテスト(望月テスト)(望月 , 1998) ④英語学習者のためのレベル別語いテスト(佐藤,2003) (http://www.zen-ei-ren.com/)

以上の様に、これまでさまざまな語彙サイズテストが開発され、またそれぞれ妥当性、

信頼性を向上させるために追実験が行われ、選択肢や定義などの変更や問題数などの点で

改良が行われている。しかし、現時点で開発されている語彙サイズテストを中学生を対象

に実施するには以下にあげる3つの問題点がある。1つ目は、難易度である。多くの語彙

サイズテストは、成人など主にある程度熟達した学習者を対象としている。そのため、語

彙の難易度が高すぎて中学生には適さないものが多い。また、テストによっては受験可能

なものもあるが、一番低いレベルのテスト一種類のみということもある。中学生の語彙レ

ベルに適合し、さらにそれを細分化、レベル分けをして測定するテストの開発が必要であ

る。 2点目として、語彙サイズテストのもととなる語彙リストの性格が挙げられる。現存す

る語彙サイズテストはBNCやそれをもとに作られた真正性の高い語彙リストをもとにし

て作られている。このような語彙サイズテストは、自分の語彙力が現実の場面での英語運

用にどれだけ対応できるかという点を測定することができるというメリットを持つ反面、

普段教科書を中心に英語を学習し、教科書が主なインプット源である日本の中学生の習得

している語彙とは種類や頻度の点において異なると考えられる。中学生が学習している教

科書を基準として語彙リストを整備し、それに基づいて語彙サイズテストを開発する必要

性がある。 3点目として、多くの語彙サイズテストには複数のバージョンがないことが挙げられる。

34

Page 3: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

初級学習者用の語彙サイズテストの開発

3

すなわち、あるレベルのテストは一度ずつしか受けられないということになる。既存のテ

ストがそのような形式をとっているのは、信頼性と妥当性の問題などテストの精度を高め

ることが目的であると考えられる。しかし中学校の英語の授業で使用するという点から考

えると、テストに数種類のバージョンがあり、何度かそれに挑戦できるタイプのテストの

ほうが生徒の語彙学習には有効であると考えられる。このテスト形式であれば、一度不合

格になったレベルにも、そのレベルに合格しようと学習し何度も挑戦することや、短い期

間に繰り返しテストをすることも可能である。 そこで本研究は、以下の3点の性格を持つ語彙サイズテストの開発を目的とする。 ①初級外国語学習者である、日本人中学生用に応じた語彙レベル、語彙の頻度であること。 ②教科書をもととした語彙リストから作られた語彙サイズテストであること。 ③複数のバージョンを持ち、同じレベルのテストに複数回挑戦できるものであること。 3.開発手順 日本人初級学習者用の語彙サイズテストを開発するにあたり、これまで、以下の手順で

主にそのもととなる語彙リストの作成を中心に研究を進めてきた。 ①平成 14 年度版、平成 18 年度版の検定教科書6社3学年分の本文をデータ化し、コンコ

ーダンサーAntConc を使用し頻度順の語彙リストを作成。この段階でリストの総語数は

98996 語であった。 ②人名 (Shun, Aki, Jim)や国名 (Japan, the U.K., China)、言語名(English, Japanese,

Spanish)などの固有名詞、冠詞(a, the)、数字(1、19、10:30)をリストから削除。 ③派生形(規則変化の動詞の過去形、現在分詞形、過去分詞形、規則変化の形容詞の比較

級、最上級、名詞の複数形)は原形に加算。 ④東京都中英研研究部の語彙リストを使用し、1社の教科書のみに出現している語をリス

トから削除。 ⑤東京都中英研研究部選定発表語彙リストと比較し、本研究の語彙リストの精度を検証。 以上のような過程から、中学生が学ぶべき 1315 語を選出し語彙サイズテストのもとと

なる語彙リストを開発した。 ⑥固有名詞はすべて削除していたが、やはり中学生には学習するべきものもあるという見

解から、America、Japanese など9語をリストに追加した。語彙リストの総語数は 1324語となった。

⑦検定教科書の巻末の定義をすべて参照し、リストにある語彙の定義づけを行なった。こ

れは、語彙サイズテストの選択肢および錯乱肢となるものである。すべての教科書で同

様の定義がされているものについては、無条件にその定義を採用したが、教科書によっ

て定義が異なる場合はできるだけすべての定義が盛り込まれるような定義づけを行なっ

た。 ⑧1324 語の語彙リストを 200 語ずつ(レベル 6 のみ 324 語)の 6 つのレベルに分け、RAND

関数と RANK 関数を組み合わせて、そこからランダムにテストアイテム 27 語とその錯

乱肢 27 語を抽出してテストを作成するマクロを組んだ。これにより、同じレベルの異

なるテストを何パタンも作成することが可能である。 ⑨テスト形式は Vocabulary Levels Test(VLT)(Nation, 1990; 2001)や英語学習者のため

のレベル別語いテスト(佐藤,2003)で用いられているテスト形式を採用した。この形

式では、測定する語彙 3 語に対して選択肢が 6 語という形式 9 題からなり、全 27 問の

形式である。母数が 200 語であるので、この形式であれば被験者がある語に遭遇する確

35

Page 4: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

佐藤  剛

4

率は約 4 回に 1 度の割合である。本研究の特徴のひとつである「バージョンを変えて何

度も使用できる語彙サイズテスト」という特徴を生かすためにも、この形式は非常に有

効であると考えられる。 4.リサーチクエスチョン

開発した語彙サイズテストの妥当性および信頼性を検証するために、以下のような 3

つのリサーチクエスチョンを設定した。

①本研究で開発した語彙サイズテストは、異なる教科書を使っていても等しく使え

るか。

②本研究で開発したテストの 20 0 語ごとのレベル分けは妥当であるか。

③本研究で開発した語彙サイズテストはランダムに問題を抽出しても等質性を保障

できるか。

5. 実験方法 5-1.対象

実験の対象は異なる教科書を使用している中学生計 214 名である。人数の内訳は以

下のとおりである。(A 教科書 62 名、B 教科書 101 名、C 教科書 51 名)実用英語技能

検定 5 級の語彙パート問題を事前に実施した結果、上記の 3 群の平均値には有意な差

が見られなかった。(F値=1.22、p値=0.29)よって、3 群は等質なグループであるこ

とがいえる。

表1 実用英語技能検定5級語彙パート記述統計 Group A Group B Group C

n Mean SD n Mean SD n Mean SD

101 14.84 5.34 62 15.88 6.49 51 14.31 4.57

5-2.マテリアル 本研究で、被験者に以下の7種類のテストを実施した。実用英語技能検定5級の語

彙パートは群間の透湿性検証のために実施するものである。各レベルのフォーム1と

フォーム2は、エクセルの関数を使用して 200 語のリストからランダムに抽出したも

のであるが、その結果2つのフォームに同じ語彙が選択肢や錯乱肢に抽出された場合

は、重複によって、テストの難易度が下がってしまうという効果を防止するために、

その語彙と同じレベルの語彙に変更するという作業を実施した。 ① 実用英語技能検定5級語彙パート

② レベル1~3 フォーム1 ③ レベル1~3 フォーム2

5-3.分析方法 開発した語彙サイズテストが、学習者の使用する教科書が異なっても、等しく使用

できるものであるのかどうかを検証するために、使用する教科書の異なる3つのグル

ープの平均点を一元配置の分散分析で比較する。また、200 語ずつにリストを分けたレ

36

Page 5: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

初級学習者用の語彙サイズテストの開発

5

ベル分けの妥当性を検証するために、それぞれの平均点を、グループ間とレベル間の

2要因の二元配置の分散分析で比較する。さらに、200語のリストからランダムに

抽出することで作成した2つのフォームの等質性を検証するために、それぞれの平均

点の差をt検定で比較する。 6.結果 3つのグループにおける、語彙サイズテストの平均、および標準偏差は表2に示すと

おりである。

表2 語彙サイズテストの記述統計 Group A Group B Group C

n Mean SD n Mean SD n Mean SD

Level 1 Form 1 64 23. 52 4.07 104 23.50 3.60 51 23.10 3.14

Form 2 64 22. 56 3.81 104 21.67 4.46 51 21.45 3.39

Level 2 Form 1 64 22. 37 4.14 104 21.35 4.00 51 20.92 3.63

Form 2 64 20. 08 4.02 104 19.26 4.60 51 18.31 3.80

Level 3 Form 1 64 19. 05 6.14 104 18.31 4.34 51 18.04 4.03

Form 2 64 15. 45 5.98 104 14.86 4.93 51 15.24 4.33

まず、本研究で開発している語彙サイズテストが、使用している教科書が異なっても等

しく使用できるという事を検証するために、グループ間の平均点を一元配置の分散分析で

比較した。その結果、5%水準で、すべてのレベルにおいて、有意な差は見られなかった。

(レベル1フォーム1:F(0.95)=1.93 p=0.14、レベル1フォーム2:F(0.95)=

1.49 p=0.22、レベル2フォーム1:F(0.95)=4.07 p=0.18、レベル2フォーム2:

F(0.95)=2.47 p=0.08、レベル3フォーム1:F(0.95)=1.13 p=0.32、レベル3

フォーム2:F(0.95)=2.89 p=0.11) しかし、レベル1のフォーム1レベル2のフォーム1、レベル2のフォーム2、レベル

3のフォーム2に10%水準の有意傾向が見られた。

次に、200 語ごと 3 つのレベルに分けるレベル分けの妥当性を検証するために、被

験者の平均を、レベルとグループの二要因の二元配置の分散分析で比較した。フォー

ム 1、フォーム2とも、5%水準で、グループ間には有意な差が見られず、レベル間に

有意な差が見られた。また、グラフ 1 およびグラフ 2 に示すとおり、有意な交互作用

は見られなかった。 フォーム1

グループ間 F(0.95)=2.32 p=0.09 レベル間 F(0.95)=76.26 p=0.00 交互作用 F(0.95)=0.34 p=0.85

フォーム 2

グループ間 F(0.95)=2.56 p=0.07

37

Page 6: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

佐藤  剛

レベル間 F(0.95)=122.68 p=0.00 交互作用 F(0.95)=0.49 p=0.73。

グラフ 1 二元配置分散分析フォーム1

グラフ2 二元配置分散分析フォーム2

ここでも、グループ間のp値がフォーム1でp=0.09、フォーム2でp=0.07と有意傾

向が見られた。 最後に、エクセルの関数によって200 語のリストからランダムにテスト 項目を抽出して

作成されるテストの等質性を検証するために、フォーム1とフォーム2の平均点をt検定

で比較した。その結果、すべてのレベルにおいて、フォーム1とフォーム 2 の平均点に有

意な差が見られた。(レベル1:t= 5.33、p=0.00、レベル2:t =10.02、p =0.00、レベ

ル3:t =11.50、p=0.00)よって、フォーム1とフォーム2の難易度には有意な差があると

平均値と標準偏差

0

5

10

15

20

25

30

L1A L2A L3A

レベル

得点

Group A

Group B

Group C

平均値と標準偏差

0

5

10

15

20

25

30

L1B L2B L3B

レベル

得点

Group A

Group B

Group C

38

Page 7: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

初級学習者用の語彙サイズテストの開発

7

いうように結論付けることができる。 7.考察 本研究は、教科書の本文の頻度をもとに作成した語彙リストからランダムにテストアイ

テムを抽出することによって作成する初級学習者用の語彙サイズテストの信頼性および妥

当性の検証を行なったものである。そのために、以下のようなリサーチクエスチョンを設

定した。

① 本研究で開発した語彙サイズテストは、異なる教科書を使っていても等しく使える

か。

使用する教科書の異なる 3 つのグループ間で、語彙サイズテストの平均点に有意な

差が見られなかったことから、本研究で開発した語彙サイズテストは、使用している

教科書に左右されず、等しく使用できるものであるということができる。これは、今

回、検証を行なったのが 6 つのレベルのうち、比較的頻度の高いレベル1~レベル 3

であったことが原因であると考えられる。特に高頻度の語彙は、多くの教科書で使用

されている。実際、レベル 1 の語彙 200 語の教科書出現率は、5.93 社/6 社で 98.9%、

レベル 2 では、5.68 社/6 社=94.7%、レベル 3 で、5.22 社/6 社=87.0% であった。

レベル1やレベル 2 で出題される語は、ほとんどすべての検定教科書に取り上げられ

ている語彙であるということができる。

2つ目として、学習者は、主に教科書を使って学習しているといっても、それ以外

の様々なところから語彙を習得していることがあげられる。被験者に、実施したアン

ケートでも、 90%が、教科書以外から英語の単語を覚えていると解答している。具体

例としては、授業のハンドアウト(23%)、テレビ(22.9%)、先生の話す英語(16.4%)

などが挙げられる。少数ではあるが、流行語やスポーツのルールや反則、マンガなど

から英語の語彙を習得しているという回答も得られた。このように、教科書以外の様々

なインプットによって、生徒の習得する語彙が均等化され、教科書の差が埋められて

いると考えられる。

しかし、上記いずれの場合も、高頻度の語彙だからであり、言い換えれば、各教科

書に多く出現する語彙や、自己表現をするために必然的に授業中に繰り返される語彙

であったり、反対に指導者が教科書にはないが生徒に習得させるべきであると考え意

図的にハンドアウトに盛り込んでいる語彙であるからという可能性が高い。レベル4

~6の効果測定をしていく際に、この状況が比較的に低頻度の語彙でも当てはまるの

か、検証していく必要があると考えられる。

② 本研究で開発したテストの 200 語ごとのレベル分けは妥当であるか。

レベル間とグループ間の二要因の二元配置の分散分析の結果、グループ間に差が見

られず、レベル間に差が見られたことから、今回効果検証を行なった 3 つのレベルの

テストは異なる要因を測定していると結論付けることができる。また、有意な交互作

用が見られなかったことから、レベルによって、グループ間で平均に逆転はないこと、

さらに、レベルが上がるにつれ、なだらかに正答率も下降していることが分かる。こ

のことは、レベル1とレベル2、レベル2とレベル 3 の間に極端に難易度の落差の開

きがない事を証明するものである。よって、以上の結果から本研究で開発した語彙サ

イズテストのレベル分けは妥当であると結論付けることができる。

③本研究で開発した語彙サイズテストはランダムに問題を抽出しても等質性を保障で

きるか。

39

Page 8: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

佐藤  剛

8

実施したフォーム1とフォーム2の平均点に有意な差が見られた。全体の平均点だけで

なく、3つのグループすべてにおいて、2つのテストフォームの間に有意な差が見られた。

よって、同じレベルのリストからランダムに語彙を抽出して作成したテストの難易度の安

定性は実証することが出来なかった。言い換えれば、テストを作り変えるたびに、難易度

が異なるものが作成されてしまう危険性があるということである。原因としては、同じレ

ベル間においても、それぞれの語彙の難易度に大きな差があることが挙げられる。以下の

グラフ3は、今回実施したテストの正答率を示したものである。なじれベルのテストであ

るのだが、正答率に大きな差があることが分かる。特に、フォーム 2の方が、全体的に正

答率の差が大きく、レベルが上がるにつれて、その傾向が強くなることが見て取れる。

難易度にこれほど大きな差が生まれてしまう要因として、以下の 2 つの可能性が考

えられる。1つは、前置詞である。前置詞は機能語であるため、動詞や名詞のような

内容語よりも比較的高頻度となる傾向にある。その結果、今回効果検証を行なった、

高頻度のレベルにも多く前置詞が含まれている。しかし、多肢選択という特性上、選

択肢に出された定義から前置詞を選択しなければならない。前置詞は、使用される文

脈によって、意味や訳が変化することが多く、さらに、動詞と一緒になって熟語的に

用いられることが多い。そのため、前置詞を個別に取り出して、その定義から前置詞

を想起するというのは学習者には非常に困難なことであると考えられる。例えば、正

答率が低かった問題に、「離れて・外れて」がある。(正答率 25.1%)この正答は、前置

詞「off」であるのだが、例えば「turn off=電気などを消す」のような形で普段その語

彙を学習していると考えられる中学生にとっては、その頻度以上に難しいテストアイ

テムであったということができる。

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1 3 5 7 9

11

13

15

17

19

21

23

25

27

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1 3 5 7 9

11

13

15

17

19

21

23

25

27

0.010.020.030.040.050.060.070.080.090.0

100.0

1 3 5 7 9 11

13

15

17

19

21

23

25

27

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1 3 5 7 9 11

13

15

17

19

21

23

25

27

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1 3 5 7 9 11

13

15

17

19

21

23

25

27

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1 3 5 7 9 11

13

15

17

19

21

23

25

27

Form1 Form2

40

Page 9: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

初級学習者用の語彙サイズテストの開発

9

このことは、テスト形式の改善の必要を示しているとともに、語彙指導に対しても、

非常に大きな示唆をあたえる結果である。つまり、英語の語彙を指導する際に、日本

語訳と英語を 1 対 1 対応で、指導すること是非を問う結果であると考えられる。動詞

や名詞ならば、 write=書く、 dog=犬で指導できるが、上記のような特性を持つ前置

詞の場合、訳を与える指導では不十分である可能背がある。その語彙の持つコアイメ

ージから、それが指し示す意味をイメージさせるような指導が必要なのではないだろ

うか。

次に、学習者の正答率に大きな影響を与えている要因として、その語彙の学習学年

が挙げられる。今回の被験者は中学 2 年生であり、実施した時期は 5 月であった。つ

まり、被験者は、1 年生の学習内容を修了したばかりの生徒であるということができる。

そのため、いくら高頻度の語であったとしても、不規則変化の一般動詞や be 動詞の過

去形、さらには betterや most など比較級や最上級など学習していない単語は正しく

解答できないことは、いうまでもないことである。実際に、出現頻度 200 語レベルの

レベル 1 においても 3 学年で学習する語が含まれている。(right、last、back、lean、

made 、mean 、could、if)この学習学年の要因は、2 つのフォーム間に見られる有意な

差だけでなく、リサーチクエスチョン 1 および2の結果に見られた有意傾向にも影響

を与えている可能性がある。ランダムにテストアイテムが抽出されるシステムをとる

以上、27 のテストアイテムのほとんどが学習した語彙に偏る可能性、また反対にほと

んどが未習語に偏る可能性は十分にありえる。中学校 3 年間修了した段階で受けるの

であればいいのであるが、本研究で開発するテストは、学習者が自分の現状を把握し、

その結果を今後の学習に還元させていくという目的を考えれば、今回の被験者のよう

に学年の途中で受験することがほとんどであろう。学習学年の要因をどのように操

作・統制していくかが、今後の大きな課題である。これまで、出現頻度という面から

語彙サイズテストを開発してきたが、それに、学習学習学年を加えより多面的・立体

的に捉えていく必要があると考えられる。

8.まとめと今後の課題 本研究では、初級英語学習者である中学生を対象とした語彙サイズテストの開発を目的

とし、200 語からランダムに 27 のテストアイテムを抽出して作成する試作テストの効果検

証を行なったものである。その結果、学習している教科書の影響やレベル分けの妥当性は、

ある程度検証できたものの、ランダムに抽出されることで作り出されるテストの難易度の

安定性は検証することができなかった。今後本研究で開発している語彙サイズテストの精

度を高めていくためには以下のような方法が考えられる。 第 1 に、テストのレベル分けは語彙の出現頻度によるものであるが、それに学習学年を

反映させる必要がある。いくら頻度が高い語彙であっても学習していない語彙であればそ

れを知らないのは当然であり、いかに学習データをテストのレベル分けや語彙リストの整

備の要因として反映させられるかは、本研究で開発しているテスト妥当性及び信頼性の向

上の鍵となるものである。 第2として、語彙リストの試行テストを繰り返し項目分析を繰り返しつつリストの整備

を進める。本研究の結果から、抽出方法や語彙の出題範囲のバランスなどテストの改善が

必要とされていることは言うまでもないが、その元となっている語彙リストの改善を行う

ことも同様に必要である。テストを繰り返す中で、同じレベルの語彙に比べて極端に正答

率が高い語彙や、逆に低いもののレベルを変更する、リストから省く等、語彙リストを整

備していくことが、さらなるテストの精度向上につながると考えられる。

41

Page 10: 初級学習者用の語彙サイズテストの開発 ~試作テスト結果分 …siva.cc.hirosaki-u.ac.jp/center/kenkyuin/pdf/sato11.pdf初級学習者用の語彙サイズテストの開発

佐藤  剛

10

参考文献 Meara, P. (1992). EFL Vocabulary Tests. Centre for Applied Language Studies,

University College Swansea. Meara, P. and Buxton, B. (1987). An Alternative to multiple chice vocabulary tests.

Language Testing, 4, 142-151. Nation, I.S.P. (1990). Testing and Learning Vocabulary. Boston, MA: Helinle &

Heinle. Nation, I.S.P. (2001). Learning Vocabulary in Another Language. Cambridge

University Press. Nation, I.S.P. and Webb, S. (2011) Researching and Analyzing Vocabulary. Boston:

Heinle Cengage Learning. Reppen, R.(2001). Corpus linguistics and language teaching.『英語コーパス研究』,8,

19-28. 磯達夫・相澤一美.(2009).「語彙サイズテストの結果解釈と読解力の予測:語彙知識

推定への 3 つのアプローチ」.『第 35 回全国英語教育学会鳥取研究開会発表予稿集』

pp216-217 佐藤留美.(2003).「新学習指導要領をふまえた中高生を対象としたレベル別語彙テス

トの作成」.『STEP BULLETIN』 15, pp 25-37. 望月正道・相澤一美・投野由紀夫.(2003).『英語語彙の指導マニュアル』。大修館書店

42