10
心理学実験実習:データ解析編 第1部 2007 9 1 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料 1 作成:清水和秋・柴田由己 第1部 概要 1. パソコンによるデータ解析 ―――――――――――――――― 2 2. データ入力 ――――――――――――――――――――― 3 A. データについて ――――――――――――――――――― 3 B. Excel から SPSS ――――――――――――――――――― 4 C. SPSS のデータエディタ ――――――――――――――――― 7 第2部 SPSS によるデータ解析:基礎編 3. 解析に使用するデータ:例題データ1 ――――――――――――― 11 4. 算術平均と標準偏差の計算 ――――――――――――――――― 12 5. クロス表の計算 ――――――――――――――――――――― 14 6. 変数の操作(変数の計算) ――――――――――――――――― 14 7. 特定データの抽出 ―――――――――――――――――――――― 15 第3部 SPSS によるデータ解析:応用編 8. 解析に使用するデータ:例題データ2 ――――――――――――― 18 9. 因子分析法 ―――――――――――――――――――――――― 20 10. 尺度の信頼性 ――――――――――――――――――――――― 26 11. 2要因の分散分析 ――――――――――――――――――――― 28 第4部 SPSS による解析結果の印刷 12. SPSS「出力ビューア」 ――――――――――――――――――― 34 13. SPSS の印刷に学籍番号・氏名を付与する方法 ――――――――― 35 14. SPSS から Excel あるいは Word への切り張り ――――――――― 36 5 SPSS によるデータ解析:追加編 15. 被験者の再グループ化 ――――――――――――――――――― 38 16. 重回帰分析 ――――――――――――――――――――――― 41 17. 多重比較・2 要因の分散分析 ―――――――――――――――― 44 6 シンタックス 18. シンタックスの活用 ――――――――――――――――――― 45 引用文献・参考文献 ――――――――――――――――――――――― 50 1 SPSS の最新の版は Ver.15 である。本資料では、一部を除き Ver.12 で作成している。実習で 使う範囲内ではそれほど大きな内容の改訂はない。この資料の改訂を予定しているので、間違い や修正すべき点などがあれば、連絡をいただきたい。

関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

  • Upload
    others

  • View
    39

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

1

関西大学社会学部心理学専攻

心理学実験実習: データ解析編 資料1

作成:清水和秋・柴田由己

目 次

第1部 概要

1. パソコンによるデータ解析 ―――――――――――――――― 2

2. データ入力 ――――――――――――――――――――― 3

A. データについて ――――――――――――――――――― 3

B. Excel から SPSS へ ――――――――――――――――――― 4

C. SPSS のデータエディタ ――――――――――――――――― 7

第2部 SPSS によるデータ解析:基礎編

3. 解析に使用するデータ:例題データ1 ――――――――――――― 11

4. 算術平均と標準偏差の計算 ――――――――――――――――― 12

5. クロス表の計算 ――――――――――――――――――――― 14

6. 変数の操作(変数の計算) ――――――――――――――――― 14

7. 特定データの抽出 ―――――――――――――――――――――― 15

第3部 SPSS によるデータ解析:応用編

8. 解析に使用するデータ:例題データ2 ――――――――――――― 18

9. 因子分析法 ―――――――――――――――――――――――― 20

10. 尺度の信頼性 ――――――――――――――――――――――― 26

11. 2要因の分散分析 ――――――――――――――――――――― 28

第4部 SPSS による解析結果の印刷

12. SPSS「出力ビューア」 ――――――――――――――――――― 34

13. SPSS の印刷に学籍番号・氏名を付与する方法 ――――――――― 35

14. SPSS から Excel あるいは Word への切り張り ――――――――― 36

第 5 部 SPSS によるデータ解析:追加編

15. 被験者の再グループ化 ――――――――――――――――――― 38

16. 重回帰分析 ――――――――――――――――――――――― 41

17. 多重比較・2 要因の分散分析 ―――――――――――――――― 44

第 6 部 シンタックス

18. シンタックスの活用 ――――――――――――――――――― 45

引用文献・参考文献 ――――――――――――――――――――――― 50

1 SPSS の最新の版は Ver.15 である。本資料では、一部を除き Ver.12 で作成している。実習で

使う範囲内ではそれほど大きな内容の改訂はない。この資料の改訂を予定しているので、間違い

や修正すべき点などがあれば、連絡をいただきたい。

Page 2: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

2

1. パソコンによるデータ解析

A)関大のパソコン環境

OS: WindowsXP

アプリケーション・ソフト:Word、Excel、SPSS など

インターネット:ブラウザ・メール

オープン利用:社会学部のパソコン関係教室の利用については各教室入口に掲示

:IT センターについては、センター内に掲示

B)心理学実験実習Ⅱで取り扱う統計量と解析方法

統計量:度数、算術平均・標準偏差・相関係数

解析方法:単純集計、クロス表、分散分析、因子分析

他には、データの図による表示など

ここであげた統計量の多くは、表計算ソフトの Excel でも計算することができる。

因子分析などの多変量解析では、専用の統計解析ソフトが必要となる。Windows の

SPSS では、プルダウンメニュー形式で、簡便に、基礎的な統計量の計算から多変量

についての解析もおこなうことができる。ここでは、主に統計解析ソフトである

SPSS により、心理データの統計解析について解説をおこない。

C)データ解析

簡単に書くと、研究は、次のように進行する。

研究目的->実験・調査->データ解析->結果のまとめ->論文作成

この資料は、データ解析について説明することを目的としている。前期の実習Ⅰで

は、統計計算の実際と基礎的な統計量に習熟することを目的の1つとして Excel を使

用した。実習Ⅱの課題実習では、領域ごとのそれぞれのテーマについて、本格的にデ

ータ解析を解析してみることにする。

実験実習「人格・測定」領域を前提として、SPSS によるデータ解析に習熟するため

の参考として作成している。統計の解析手法を学ぶには、数多くのデータで、試みを

おこなうことが勧めたい。この資料の中では、これらのデータの一部分を、分析の対

象としているだけである。いくつかのデータを参考資料として提供している。オープ

ン利用などの時間でも、基礎的な統計量の解析から推測統計など、復習を兼ねて、自

律的にトライしてみてほしい。前期の実習データについても、ここで紹介したような

解析で可能なものもある。今年度の資料では、前期最後に実施した「心理テスト」の

データから YG と FFI を学内サーバーで提供している。重回帰分析の例として紹介し

ているが、因子分析も可能である。データ解析に積極的にチャレンジしてほしい。

[注]この資料では、前期の心理学実習で体験した Excel や Word の操作技法を前提として書

いている。Windows の GUI についての基礎概念やファイル操作など必要に応じて、参考書

や情報処理関係科目そして前期の実験実習で学んだことを復習してほしい。

Page 3: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

3

2. データ入力

A)データについて

データの構造は、一般的には(被験者×変数)の形式である。行列形式(あるいは表

形式)で表現すると被験者は行であり、変数は列である。調査データならば、被験

者の回答した1綴りの調査票が、1行となるわけである。

データの入力作業手順(入力は Excel でおこなうことを想定している。)

a-1) 仮想データ(次のような質問紙を想定する。)

質問1(性別) 1:男子 2:女子 質問2(学年) 回生

質問3(兄弟姉妹の数) 人(自分は含めない)

質問 4-1 人中ではだまっている 3: はい 2: ? 1: いいえ

質問 4-2 いつもほがらかでいられる 3: はい 2: ? 1: いいえ

質問 4-3 元気である 3: はい 2: ? 1: いいえ

質問 4-4 人の世話が好きである 3: はい 2: ? 1: いいえ

a-2) 被験者の回答(最初の数値は id で、次からが各被験者の反応)

<被験者1> 1 2 2 3 1 2 3 3

<被験者2> 2 1 2 1 2 3 1 1

<被験者3> 3 1 3 2 1 3 3 3

<被験者4> 4 2 3 0 3 3 1 3

<被験者5> 5

図1 Excel への入力例

[注]この図では、<被験者1>から<被験者4>の値を入力している。なお、第1行に入力

したものは、各列の変数名である。Excel では、数値は右詰、それ以外は左詰で表示される

が、これを変更することもできる。

Page 4: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

4

a-3) 変数名の定義

日本語での変数名の記述も可能であるが、ここでは、アルファベットを使用し

た。変数名を付ける際には、わかりやすくかつ短く、が原則である。図1での変

数名と質問紙での内容との対応表を作成しておく方がよい。質問の数が多くなる

と、そして、質問紙の構造が複雑になると、実際の分析では混乱することがある。

a-4) データの入力

id とした列 A は、回答票の整理番号を記入した欄である。調査終了後、被験者

の反応を整理する際に、パソコンへ入力したものと原票との照合をするための

整理番号を記入する必要がある。この整理番号をここでは、id としているわけで

ある。Excel では「書式(O)」の「列( C)」の「幅(W)」で、列幅の調整ができる。

入力をしやすいように、各列の幅を調整するとよい。

a-5) 入力データの確認

すべての入力が終わったら、原票と照合しなければならない。この目的で印刷

する際には、質問項目の数(入力列の数)が多いときには、照合しやすいように

印刷時のページ設定に注意しなければならない。わかりやすくするには、縦の罫

線を挿入するとよいかもしれない。

B) Excel から SPSS へ

Excel で、いくつかの統計量を計算することもできる。そして、グラフ表示も多様なオ

プションが準備されている。実習Ⅱでは、SPSS Windows で、データ解析をおこなうこと

を想定しているので、Excel による統計分析は省略する。

<余録> Windows でのファイル形式について

パソコン内でのファイルの名前は、「~.拡張子」からなる。この~にファイルの内容に適

切なスペル(条件については Word などの Help で「文書」->「文書に名前を付けて保存」を

参照のこと)を記入する。ピリオドの後のスペルは、拡張子と呼ばれる。Windows は、この拡

張子のスペルによって、ソフトとの関連づけを自動でおこなう。ユーザーは、この拡張子を付け

る際には、ソフトとの関連を意識する必要がある。ここでは、主要なものだけを説明する。

テキスト形式ファイル:~.txt 文字と改行マークやタブマークだけからなる

カンマ区切りファイル:~.csv テキストファイルで、数値あるいは文字の区分けに

カンマ(,)を使用している形式

Word 形式ファイル:~.doc ワープロソフト

Excel 形式ファイル:~.xls ブック形式(Excel5.0 以降)、ワークシート形式

(Excel4.0 以前)の2つの形式があります。

SPSS 形式ファイル:~.sav SPSS のデータエディタ用ファイル

HTML 形式ファイル:~.htm あるいは~.html ホームページ用

その他の形式: ~.dat 音楽用データとして扱われることがある。

画像データ: ~.jpg ~.gif ~.bmp ~.tif など

[注]これらの拡張子は、4文字以上のこともある。

Page 5: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

5

以下の Step 1~5 では、Excel で作成したデータを SPSS データエディタへ写し、SPSS

のファイルとして保存してみることにする。

Step 1 Excel ファイルの保存。(各自フロッピーを準備すること)

保存の手順:図1の Excel にて、「ファイル(F)」->「名前を付けて保存(A)」

ここで現れる表示

の一番下に『ファイルの種類

(T)』がある。

こ の 最 初 の 表 示 は

「 Microsoft Excel ブ ッ ク

(*.xls)」となる。ここにファイ

ル名を入力する。

図2 Excel でのファイル保存画面

Step 2 SPSS を起動し、「データエディタ」にファイルを読み込む作業をおこなう。

まず、SPSS で、「ファイル(F)」->「開く(O)」で、「データ(A)」を指定する。

図3-1 SPSS の起動初期画面

次に、「ファイルの場所(I)」(ここでは、3.5 インチフロッピー)を指示し、表示の一番下

の『ファイルの種類(T)』では、「Excel (*.xls)」を指定する。

Page 6: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

6

図3-2 SPSS での Excel4.0 ワークシート形式ファイルの読み込み

Step 3 Excel のワークシートからのデータの読み込みの指示

Excel の第1行目に、変数名を記入して

いたので、ここでは、次の図のように『デ

ータの最初の行から変数名を読み込む』

を必ずチェックすること。ワークシート

は、今回のデータでは、図1で示したよ

うに、最初の「Sheet1」に、記入してい

た。ここでは、自動的にこの内容を読み

込むようにSPSSの方で設定してくれる

ので、「範囲」の指定はしなくともよい。

図4 SPSS でのファイルを開く際のオプション

Step 4 SPSS データエディタ

Excel のワークシートから SPSS のデータエディタへの変換作業が終了すると

図5の SPSS データエディタ画面となる。SPSS for Windows のビューア画面

がもし現れた場合には、変数名やデータに Excel からの変換において、何らか

のトラブルがあったかもしれないので、チェックしてみる必要がある。一般的

には、コードが合わない場合(Excel のワークシートにサポートされない文字グ

ループがある。)にこのメッセージが出る。今回の場合には、警告を、ビューア

画面において、表示している。なお、このビューア画面の内容を保存する必要

はない。

図5と図1とを比べると、Excel の第1行目が、SPSS の変数名の欄に、そし

て、第2行目からの各データが、SPSS の1行目から適切に置き換えられている

ことがわかる。ただし、ここでの手続きでは、id=5 のデータは、Excel では、

未記入であった。このため、SPSS では、この部分は欠損値の扱い(数値のかわ

りに小数点あるいはドット)となっている。

Page 7: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

7

図5 SPSS データエディタに Excel のファイルを取り込んだ画面

[注]この画面では、図1の Excel で記入したものすべてを変換している。なお、日本語版の SPSS では、漢

字コードを、データでも、変数名でも使用できる。

Step 5 SPSS のデータの保存

今後のデータ処理で、SPSS 形式のデータとして、この図5のデータを取り扱うに

は、「ファイル(F)」の「名前を付けて保存(A)」で、保存媒体を選び「ファイル名

(N)」に Windows での規則

に従った名前を記入し、「保

存(S)」する。この図では、フ

ァイル名を testdata として

いる。

ここまでの作業で、3.5 イ

ンチのフロッピーには、

testdata.xls (Excel 形

式)と testdata.sav(SPSS

形式)の2つのファイルが保

存されていることになる。

図6 SPSS でのファイルの保存

C) SPSS のデータエディタについて

ここまでは、Excel から SPSS へデータを持ち込む手順を説明してきた。SPSS のデータ

エディタに数値あるいは文字をデータとして、直に打ち込むことももちろんできる。デ

ータを数値あるいはアルファベットとして入力する場合には、日本語変換を解除して、

半角の英数字で入力しなければならない。次には、SPSS の使い方とあわせて、データエ

ディタの解説をおこなう。

Page 8: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

8

c-0) 概要

ここでは、データエディタの説明に先立って、SPSS の使い方について、簡単に説明

する。SPSS で、Windows 用に準備された統計解析やデータ管理オプションでデータ解析

をおこなうことは、このデータエディタ画面から、はじまるからである。データを SPSS

形式データとしてセットしてはじめて、解析が可能となからである。なお、SPSS には、シ

ンタックスとして SPSS プログラムを記述する方法もあるが、ここでは、省略する。

図5のデータエディタ画面には、「ファイル(F)」「編集(E)」「表示(V)」「データ(D)」

「変換(T)」「分析(A)」「グラフ(G)」「ユーティリティ(U)」「ウインドウ(W)」「ヘルプ(H)」

がある。これらの中で、Windows にほぼ共通した GUI として、「ファイル(F)」「編集(E)」

「ウインドウ(W)」や「ヘルプ(H)」などは、その内容が設定されている。他のものは、SPSS

独自なものである。ここでは、実習のデータ解析で使用するものを中心として解説をおこ

なう。

「データ(D)」-> 変数の挿入、ケースの挿入やファイルの併合など

「変換(T)」 ->「計算(C)」 (変数の操作:逆転項目・尺度得点の採点など)

「統計(S)」 -> 統計的データ解析の各手法

「グラフ(G)」-> 各種のグラフ作成

c-1) 変数ビューについて

データエディタは、「データビュー」と「変数ビュー」の2つから構成されている。

これらの選択は、画面左下(Excel での Sheet の選択に相当)でおこなう。「データビュー」

では、図5の画面のように個々のデータを取り扱うことができる。下の図7は、このデー

タの「変数ビュー」画面であり、ここでは、変数 gender を「名義」として設定しようとし

ているところである。

図7 データエディタの「変数ビュー」画面

この図の右端の「測定」は、各変数の尺度水準を定義するセルである。「測定」のセル

にカーソルをおいてクリックすると、「名義」「順序」そして「スケール」の選択画面が出

てくる。SPSS では、名義尺度水準・順序尺度水準と感覚尺度水準以上のレベルとを分けて、

3種類の尺度水準としての定義をサポートしているわけである。実際の分析では、「測定」

Page 9: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

9

図 8 変数「gender」のラベルに「性別」と入力

図 9 「変数「gender」のラベルと値を設定

の定義は参考程度として、目的にあわせて分析手法の各種の指定をおこなうことになる。

「変数ビュー」画面の機能は、変数の属性やデータビューでの表示内容を指示することに

ある。たとえば、「型」で変数のセルでクリックすると、セル内の表示が「数値 ・・・」と

なる。この点線の部分をクリックすると「変数の型」の定義画面が現れる。変数の型とし

て、一般的には、数値(N)である。名義尺度水準の場合には文字型(R)として取り扱うことも

ある。データ表示を整数の形式にするには、少数桁数(P)に0を半角で記入すればよい。こ

の「変数の型」の「幅」と「少数桁」は、「変数ビュー」画面でも定義することができる。

図7では、幅は 11、少数桁は 0(整数形式)となっている。また、「ラベル」の項には SPSS

の出力において表示させるラベルを、「値ラベル」では種々の値について出力されるラベル

を設定することができる。ここでは、ラベルの設定として変数「gender」のラベルを「性

別」に、値ラベルの設定として「1」を「男性」、「2」を「女性」とした場合について解説

する。

ラベルに「性別」と

入力した後、同変数の

「値」をクリックする

とセルの右端にグレ

ーのボタンが出現す

る。そのボタンをクリ

ックすると値ラベル

のウインドウが開く。

個々の値と対応する

ラベルを入力した後、

「追加」をクリックす

る。すべての組み合わせが下段のボックスに入力されたら OK を押す。変数ビューは図 9

のように変更された。この処理を行った後に分析等の出力を行うと、図 10 のようにラベル

と値ラベルとが表示された出力を得ることができる。

Page 10: 関西大学社会学部心理学専攻 心理学実験実習: データ解析編 資料shimizu/spss2007/SPSS2007s1.pdf · 解析方法:単純集計、クロス表、分散分析、因子分析

心理学実験実習:データ解析編 第1部 2007 年 9 月

10

統計量

性別4

1

有効

欠損値

度数

性別

2 40.0 50.0 50.0

2 40.0 50.0 100.0

4 80.0 100.0

1 20.0

5 100.0

男性

女性

合計

有効

システム欠損値欠損値

合計

度数 パーセント 有効パーセント 累積パーセント

図 10 ラベルと値ラベルが適用された変数「gender」の度数分布表

その他、「欠損値」についても特定の値や記号を与えることができるが、ここでは省略

する。

列の表示幅は、図7では、8となっている。このデフォルトの値を大きくすることも小

さくすることもできる。データビューでの文字や数値のセル内での配置については、「右」

「左」そして「中央」を選択することできる。

c-2) データ入力

この SPSS データエディタで、最初からデータの入力をおこなうことも、もちろん

できる。この場合には、上で説明した「変数ビュー」で、入力する変数の属性と表示の形

式を設定し、「データビュー」画面で数値を、あるいは文字などの記号を入力することにな

る。

データの欠損値の取り扱いについて、ここでは、標準的な方法を説明しておく。欠

損値の多い調査票は入力しない方がよいことは当然である。欠損の数が少ない場合(ある

いは、本来の解析目的の変数で欠損がなく、フェースの一部など解析にあまり影響しない

場合)、この調査票をデータから排除することが、望ましくないと判断することがある。こ

のような場合、欠損値をピリオド(もちろん半角)として入力すると、SPSS では、この欠

損処理をおこなってくれる。欠損値の含まれる変数を分析の変数とした場合、この欠損の

被験者のデータは、分析から除外してくれるわけである。なお、図5の id が 5(被験者5)

のデータは、このままでは、欠損値の扱いとなる。

SPSS では、Excel 形式のファイルやテキスト形式のファイルとの互換性を確保して

いる。卒論などの本格的な大量のデータを取り扱う場合、データの入力作業については、

Excel や一般的なテキストエディタでもおこなうことができる。Excel につては、すでに説

明した方法で、SPSS との間でのデータの交換が可能である。ただし、Excel では、列の数

に制限が(最大 256 列)あるので、これを超える数の変数の場合には、テキストエディタ

を使用することを勧める。

テキスト形式の場合には、2つの書式がある。1つは、カンマあるいはタブや空白

で区切り記号を入れた「自由書式」である。4ページの余録の csv 形式が、カンマ区切りの

ファイルに与えられる一般的な拡張子である。もう1つ書式が、各変数について固定した

横幅でデータを記述した「固定書式」である。変数の数が Excel で取り扱えないほどに多

い場合には、この固定書式が使われる。