Upload
dinhkhuong
View
214
Download
0
Embed Size (px)
Citation preview
- 1 -
■マトリックス・データ解析法解説
●目次
●マトリックス・データ解析法とは
●マトリックス・データ解析法で解決できる適用分野と課題
●マトリックス・データ解析の解析手順
●マトリックス・データ解析法の解析事例
★解析事例(1) “企業の総合品質レベル”
★解析事例(2) 学期末テストの得点のマトリックス・データ解析の例
★解析事例(3) 菓子類のパッケージサンプル
★解析事例(4) 2008年セリーグ個人打撃分析
★解析事例(5) 企業力の評価
●参考資料
- 2 -
●マトリックス・データ解析法とは → 目次へ 多変量解析は、数十に及ぶ品質特性を個々に詳細に眺めるのではなく、それらを総合的に要約し、理
解できる形までまとめる高度な統計手法であり、重回帰分析、主成分分析、独立成分分析、因子分析、
判別分析、数量化理論、クラスター分析、コンジョイント分析などの手法がある。
マトリックス・データ解析法は,新 QC七つ道具の中で唯一,数値データを扱う手法である.この手
法は多変量解析法と呼ばれる統計的方法の一つである主成分分析法と呼ばれる手法と同じものである.
マトリックス・データ解析は,通常,大量にある数値データを解析して,項目を集約し,評価項目間
の差を明確に表すために使用する。(JIS Q 9024:2003)
マトリックス・データ解析法とは、多数の数値を整理するにあたり、説明変数同士の相関をもとに、
できるだけ少数の指標で記述し、それを平面上に表す手法で、多変量解析の主成分分析と呼ばれるもの
である。 手順としては説明変数間の相関行列を作り、説明変数と同数の主成分を定義し、それぞれの
寄与率を評価する事で、各主成分の意味を考える。 特徴的な 2 つの主成分軸で各サンプルを評価する
と、当初の説明変数で比較するよりもそれぞれの特徴を一層際立たせることが可能になる。
“マトリックス・データ解析法”は観測・評価された大量のマトリックス数値データを解析して、見
通しのよい結論を得ようとする手法で、多変量解析の中の“主成分分析”に相当する高度な統計手法で
ある。
マトリックス・データ解析法とは,行と列の要素が複雑に絡み合ったマトリックス・データが得られ
た場合に、その数値データを統計解析することにより,全体を見通しよく整理する有効な手法である。
★マトリックス・データ解析法が N7に含まれる理由
やさしい新 QC 七つ道具 P138
新 QC七つ道具(N7)の他の6つの手法はいずれも言語データを整理する手法である。新 QC七つ道
具(N7)のマトリックス・データ解析法だけが数値データに基づく高度な統計手法で異質である。
マトリックス・データ解析法は、正式には主成分分析と呼ばれる多変量解析の1つである。
マトリックス・データ解析法を N7の手法として取り入れた理由は次の通りである。
企業毎に自社固有の問題を発見し、改善するためには、従来の Q7 手法および統計的方法に加えて、
多くの情報の複雑な絡み合いを整理する方法が求められている。
●マトリックス・データ解析法で解決できる適用分野と課題 → 目次へ
マトリックス・データ解析法は、多数の尺度(測定値)でデータを採取したものの,傾向がつかめない,
分類できない,要因として使いにくい,細かすぎて説明ができない場合に、次のような場合に適用する
と有効である.
適用分野 解決できる課題
市場調査 市場調査データを集約して顧客の評価や重視度をまとめる.
製品企画 企業戦略・方針にあった製品企画をしたい
設計・開発 研究開発すべき技術テーマを的確に選定したい
品質保証 製品や部品の品質データを集約して,QA(品質保証)上の問題点を把握する.
検査 官能検査データを集約して各対象物同士の比較評価を行う.
改善テーマ モラル調査,環境への意識調査などのデータから次の改善の糸口を探る.
人事 人事評価データを要約して各社員または各部門の比較評価を行う.
会計 会計データをまとめて部門ごとの比較評価を行う.
- 3 -
●マトリックス・データ解析の解析手順 → 目次へ
マトリックス・データ解析の手順は次のとおりである。
手順 1 解析目的の決定
手順 2 マトリックス・データの収集
手順 3 マトリックス・データ表の作成
手順 4 マトリックス・データの規準化
手順 5 相関行列の作成
手順 6 固有値・寄与率・累積寄与率の計算
手順 7 固有ベクトル表の作成
手順 8 主成分負荷量(因子負荷量)表の作成
手順 9 主成分得点 Z表の作成
手順 10 規準化した主成分得点 Z*表の作成
手順 11 第 1主成分と第 2主成分を軸上にポジョシニングした散布図の作成
上記の手順に基づいて、具体的な解析事例にて以下に解説する。
手順 1 解析目的の決定 → 解析手順へ
評価する対象(企業、機種などの標本)と評価する項目(評価尺度)を決める。
評価する基準として、良い悪いなどを 5段階や 10段階などの評価の段階を決める。
本事例では、あるクラスの生徒 10人の学期末テストの成績について,10段階で評価している。
手順 2 マトリックス・データの収集 → 解析手順へ
各標本(評価対象)の評価点データを収集する。
手順 3 マトリックス・データ表の作成 → 解析手順へ
収集した評価点データをマトリックスデータ表として一覧表にまとめる。
生徒 No, 理科 数学 社会 国語 英語
1 10 9 6 6 7
2 9 8 4 4 5
3 7 7 2 2 3
4 6 6 10 9 7
5 4 4 9 8 5
6 2 2 7 7 3
7 8 7 8 7 8
8 6 5 7 5 6
9 5 4 5 4 4
10 3 2 3 2 3
*作成上の注意事項としては,標本数は評価項目数より多くする,
本例では、標本数は生徒の人数 10であり、評価項目数は試験科目数 5である。
- 4 -
手順 4 マトリックス・データの規準化 → 解析手順へ
評価項目の評価点の大きさと単位の影響をなくし相互に比較できるように、平均 0,分散 12になるよ
うに、評価データを規準化する。
標準偏差
平均値データ規準化データ
生徒 No, 理科 数学 社会 国語 英語
1 1.549193 1.491963 -0.03844 0.248661 1.025405
2 1.161895 1.077529 -0.80729 -0.58021 -0.05397
3 0.387298 0.663095 -1.57615 -1.40908 -1.13334
4 0 0.248661 1.499261 1.491963 1.025405
5 -0.7746 -0.58021 1.114835 1.077529 -0.05397
6 -1.54919 -1.40908 0.345983 0.663095 -1.13334
7 0.774597 0.663095 0.730409 0.663095 1.565093
8 0 -0.16577 0.345983 -0.16577 0.485718
9 -0.3873 -0.58021 -0.42287 -0.58021 -0.59366
10 -1.1619 -1.40908 -1.19172 -1.40908 -1.13334
平均値 0 -1.8E-16 2E-16 -1.8E-16 2.22E-16
標準偏差 1 1 1 1 1
手順 5 相関行列の作成 → 解析手順へ
規準化されたデータの分散・共分散行列を求める。これは、“相関行列”である。
理科 数学 社会 国語 英語
理科 1 0.980893 -0.09926 -0.03567 0.62706
数学 0.980893 1 -0.04249 0.045802 0.61135
社会 -0.09926 -0.04249 1 0.966537 0.643156
国語 -0.03567 0.045802 0.966537 1 0.61135
英語 0.62706 0.61135 0.643156 0.61135 1
本例では、理科と数学の相関、社会と国語の相関が強い。
- 5 -
手順 6 固有値・寄与率・累積寄与率の計算 → 解析手順へ
固有値とは新しい評価尺度(主成分)が全体の情報量(ばらつきの大きさ)に対して占める割合であ
る。相関行列から、主成分分析を用いて新しい総合特性値(主成分)とそれぞれに対応する固有値を求
める
主成分の取り上げ方については、次のことを目安として考慮して決定する。
・固有値が 1以上の主成分を対象とする。
・累積寄与率が 70%~80%程度を対象とする。
本例では、全体の情報である固有値の和は、分散 1 である評価項目の変数が 5 項目であるので 5 であ
る。
主成分 No. Z1 Z2 Z3 Z4 Z5 計
固有値 2.781272 2.042183 0.159016 0.011963 0.005566 5
寄与率 55.63% 40.84% 3.18% 0.24% 0.11% 100.00%
累積寄与率 55.63% 96.47% 99.65% 99.89% 100.00%
本例では、第 1主成分と第 2主成分で、全体の情報の 96.5%の情報を含んでいる。
第 3主成分以下の固有値は 1より小さいので検討の対象としない。
手順 7 固有ベクトル表の作成 → 解析手順へ
主成分 No. Z1 Z2 Z3 Z4 Z5
理科 0.401888 0.517524 -0.05675 -0.15627 -0.7369
数学 0.419161 0.483719 -0.43816 0.344086 0.529091
社会 0.400725 -0.51759 0.005204 0.696831 -0.29313
国語 0.41686 -0.47985 -0.51731 -0.57073 0.051216
英語 0.573094 -0.00576 0.73291 -0.21418 0.297489
- 6 -
手順 8 主成分負荷量(因子負荷量)表の作成 → 解析手順へ
手順 7の固有ベクトルに各固有値の平方根を乗じると各主成分の主成分負荷量(因子負荷量)が求ま
る。
主成分 No. Z1 Z2 Z3 Z4 Z5
理科 0.67023 0.73957 -0.02263 -0.01709 -0.05498
数学 0.69904 0.69126 -0.17473 0.037635 0.039472
社会 0.6683 -0.7397 0.002075 0.076217 -0.02187
国語 0.6952 -0.6857 -0.20629 -0.06243 0.003821
英語 0.95576 -0.00823 0.292261 -0.02343 0.022194
主成分負荷量(因子負荷量)は、元の評価項目と新しく求めた評価尺度(主成分)の合成変量(新し
い総合特性)間の相関関係を示し、
・正の数値の大きいほど正の相関関係が強く、
・負の数値の大きいほど負の相関関係が強いことを示す。
主成分のネーミングは、主観的に行われるが、主成分を構成している固有ベクトルや主成分負荷量(因
子負荷量)の大きさと符号を考慮して、その業界や専門分野の知見を考慮して行う。
本例での学科成績のデータ構造として、次のように考えることができる。
・第 1主成分 →5科目の学科の総合成績を示す。
・第 2主成分 →理数系と文科系を示す。
★第 1主成分と第 2主成分の主成分負荷量のグラフ
理科 数学
社会 国語
英語
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1 1.2
第
2
主成分
第1主成分
理数系
文科系
→総合成績
- 7 -
手順 9 主成分得点 Z表の作成 → 解析手順へ
固有ベクトルと各標本の規準化した評価データとの積和から各標本の新しい総合特性軸Z1とZ2にお
ける各標本の主成分得点を計算する。
生徒 No, Z1 Z2 Z3 Z4 Z5
1 1.92388 1.418105 -0.11894 -0.11706 -0.02316
2 0.322311 1.819098 -0.28167 -0.03065 -0.09521
3 -1.43491 2.019655 -0.42243 0.11628 0.118128
4 1.914615 -1.37754 -0.12143 0.059155 0.073547
5 0.310491 -1.77529 -0.29299 0.094832 -0.02384
6 -1.44768 -1.97407 -0.46655 -0.13737 -0.00855
7 2.055301 0.01637 0.473349 -0.09758 0.065496
8 0.278417 -0.18252 0.51618 0.174633 -0.05312
9 -1.15039 0.019611 0.139054 0.024508 -0.10395
10 -2.77203 0.016588 0.575427 -0.08675 0.050668
分散 2.781272 2.042183 0.159016 0.011963 0.005566
*各主成分得点の分散は、各主成分の固有値と一致する。
手順 10 規準化した主成分得点 Z*表の作成 → 解析手順へ
主成分得点 Zの分散が 1となるように、手順 9で求めた主成分得点をその主成分得点の標準偏差(分
散の平方根)で割って規準化し、規準化した主成分得点 Z*を求める。
の分散
主成分得点規準化した主成分得点
ZZ* Z
生徒 No, Z*1 Z*
2 Z*3 Z*
4 Z*5
1 1.153603 0.992341 -0.29826 -1.07022 -0.31041
2 0.193265 1.272942 -0.70636 -0.28022 -1.27625
3 -0.8604 1.413285 -1.05934 1.06311 1.583404
4 1.148047 -0.96396 -0.30451 0.540833 0.985833
5 0.186178 -1.24229 -0.73473 0.867014 -0.31961
6 -0.86806 -1.38139 -1.16997 -1.25594 -0.11461
7 1.232406 0.011455 1.187028 -0.8921 0.877914
8 0.166945 -0.12772 1.294438 1.59661 -0.71204
9 -0.6898 0.013723 0.348708 0.224068 -1.39338
10 -1.66218 0.011608 1.443012 -0.79315 0.679157
分散 1 1 1 1 1
- 8 -
手順 11 第 1主成分と第 2主成分を軸上にポジョシニングした散布図の作成と考察 → 解析手順へ
規準化した主成分得点 Z*表の第1主成分 Z*1と第2主成分 Z*2の散布図を描いて、各標本(本例では
各生徒)の位置づけを明確にする。
・横軸は第 1主成分の軸で、学科の総合成績が良いことを示す。
・縦軸は第 2主成分の軸で、理数系か文化系かのタイプを示す。
第1主成分と第2主成分の散布図から、次のことが示される。
*生徒のタイプ
・理数系のタイプ → No.1,2,3
・文化系のタイプ → No.4,5,6
・一般のタイプ → No.7~10 →理科系でも文科系でもない。
*生徒の総合成績
・優 → No.1,4,7
・良 → No.2,5,8
・可 → No.3,6,9
・不可 → No.10 →落第
主成分のネーミングは、主観的に行われるが、主成分を構成している固有ベクトルや主成分負荷量(因
子負荷量)の大きさと符号を考慮して、その業界や専門分野の知見を考慮して行う。
1
2 3
4
5 6
7 8
9 10
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
-2 -1.5 -1 -0.5 0 0.5 1 1.5
第
2
主成分
第1主成分
優 可 良
理数系
←
不可
→
文科系
→ Z1 総合成績
- 9 -
●マトリックス・データ解析法の解析事例 → 目次へ
★解析事例(1) “企業の総合品質レベル” → 目次へ
15社の品質保証レベルを解析した事例である。
品質マネジメントレベルと製品品質レベルには正の相関関係がある。
O 社,J 社は品質マネジメントレベルが高く、その結果、製品品質レベルも高いことを示している。
一方、B社,F社は、品質マネジメントレベルが低く、その結果、製品品質レベルも低いことを示し
ている。
図 “企業の総合品質レベル”のマトリックス・データ解析法の例
(JIS Q 9024:2003 継続的改善の手順及び技法の指針)
- 10 -
★解析事例(2) 学期末テストの得点のマトリックス・データ解析の例 → 目次へ
あるクラスの生徒 10 人の学期末テストの成績について,主成分分析を行い,主成分負荷量と主成分
得点について,第 1主成分軸と第 2主成分軸の散布図として 2元グラフ化したものである。
(a) 主成分負荷量 (b) 主成分得点
図(a)の主成分負荷量のグラフより,第 1 主成分は総合的な成績の良さ・悪さ,第 2 主成分は理数
系が得意か文科系が得意かを表わしている.
図(b)の主成分得点のグラフから,次のことが示されている。
*生徒のタイプ
・理数系のタイプ → No.1,2,3
・文化系のタイプ → No.4,5,6
・一般のタイプ → No.7~10 →理科系でも文科系でもない。
*生徒の総合成績
・優 → No.1,4,7
・良 → No.2,5,8
・可 → No.3,6,9
・不可 → No.10 →落第
- 11 -
★解析事例(3) 菓子類のパッケージサンプル → 目次へ
日科技連 やさしい新 QC七つ道具 新 QC 七つ道具研究会編
*20 人の評価者の平均評価値
*菓子類のパッケージサンプルの主成分軸上への配置
各パッケージサンプルのイメージをポジショニングした散布図を示す。
50種類のパッケージ×18尺度
暖かく、目立って、華やか
暖かいが、目立たず、渋い
涼しく、目立たず、しぶい
涼しく、目立って、華やか
- 12 -
★解析事例(4)2008年セリーグ個人打撃分析 → 目次へ
2008 年セリーグ選手の個人成績を解析した事例である。各選手のタイプを長距離打者と好打者の散
布図としてポジショニングしている。
→ http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/principal1/pri1.html
2008 年年セリーグ個人打撃分析の場合,X 軸に関し「打点」や「本塁打」が大きい値をとっている
ので,第1主成分は「長距離打者」の要因を吸収していることが分かる。Y 軸に関し「打率」や「盗塁」
が大きい値をとっているので,第2主成分は「好打者」の要因を吸収している。
よって,村田(横)選手は,長距離バッターで,しかも,好打者であるといえる。それに対し,ウッズ(中)
は長距離であるが,三振も多いので,一発屋さんといえる。
(a) 主成分負荷量
(b) 主成分得点
- 13 -
★解析事例(5) 企業力の評価 → 目次へ
QSSセミナーテキスト
本例では、15社の企業力を 6項目の評価項目(評価尺度)で、評価基準 5段階で評価している。
*評価項目(評価尺度)
①販売力 ②商品力 ③仕入生産 ④資金調達 ⑤組織管理 6宣伝 PR
*評価基準 5段階評価で、得点が高い方が好ましい。
(a) 主成分負荷量 (b) 主成分得点
*企業評価のデータ構造
・第 1主成分 →仕入生産力、資金調達力、組織管理力 →企業の基礎体制力を示す。
・第 2主成分 →販売力、商品力、宣伝 PR力 →企業のアクティブ活動を示す。
*各標本(各企業)の位置づけ(ポジショニング)
・横軸は第 1主成分の軸で、企業の基礎体制が良いことを示す。
・縦軸は第 2主成分の軸で、企業のアクティブ活動を示す。
・企業の業績としては、仕入生産力、資金調達力、組織管理力などの企業の基礎体力が良いだけでは
十分ではなく、販売力、商品力、宣伝 PR力などの企業活動がアクティブであることが重要である
ことを示している。
・●I~Oは倒産した企業である。
- 14 -
●参考資料 → 目次へ
★主成分分析の解説
主成分分析について、簡単な例題で、分かり易く解説している。
http://ifs.nog.cc/gucchi24.hp.infoseek.co.jp/SHUSEI.htm
★主成分分析の解析事例
主成分分析による解析事例として、
① 家庭教育の国際比較
② プロ野球のセリーグの個人打撃成績
の事例で解説されている。
http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/principal1/pri1.html
★固有値と固有ベクトルの計算
固有値と固有ベクトルの計算は非常に複雑なので、多くのフリーソフトがWEBで紹介されている。
その中で、本 Excel VBA プログラムでは、固有値と固有ベクトルの計算については、
次のWEB資料を参照した。
http://www.qmss.jp/e-stat/excel/eigen.htm
※ 岡山大学 田中豊氏、垂水共之氏、長畑秀和氏 提供