5
On observe m =2 variables sur n =5 individus. 0 1 2 3 4 5 6 4 6 8 10 12 X1 Y2 Ind 1 Ind 2 Ind 3 Ind 4 Ind 5 X 1 X 2 Ind 1 1 5 Ind 2 2 10 Ind 3 3 8 Ind 4 4 8 Ind 5 5 12 On décide de faire une ACP normée. On a ¯ X = (3, 8.6) et D σ = ( 1.4142 0 0 2.3324 ) . Le tableau centré-réduit est X = -1.4142 -1.5435 -0.7071 0.6002 0.0000 -0.2572 0.7071 -0.2572 1.4142 1.4577 . Il s’agit de diagonaliser la matrice 1 n t XX = ( 1 0.7276 0.7276 1 ) . Les valeurs propres sont 1.7276 et 0.2724, associées aux vecteurs propres L 1 = (0.7071, 0.7071) et L 2 = (-0.7071, 0.7071). La somme des valeurs propres est égale à 2 ; le premier axe explique 86.38% de la variance et le second 13.62%. Cherchons les corrélations entre les anciennes variables (X 1 ,X 2 ) et les nouvelles variables Y 1 = 0.707X 1 +0.707X 2 et Y 2 = -0.707X 1 +0.707X 2 . On trouve Cor(Y 1 ,X 1 )= 1.7276 × 0.7071 = 0.9294 Cor(Y 1 ,X 2 )= 1.7276 × 0.7071 = 0.9294 Cor(Y 2 ,X 1 )= 0.2724 ×-0.7071 = -0.3690 Cor(Y 2 ,X 2 )= 0.2724 × 0.7071 = 0.3690 Les coordonnées des individus sont : Y = X ( 0.7071 -0.7071 0.7071 0.7071 ) = -2.0914 -0.0914 -0.0756 0.9244 -0.1819 -0.1819 0.3181 -0.6819 2.0308 0.0308 .

exacp

  • Upload
    mirusiv

  • View
    212

  • Download
    0

Embed Size (px)

DESCRIPTION

exacp

Citation preview

On observe m = 2 variables sur n = 5 individus.

0 1 2 3 4 5 6

46

810

12

X1

Y2

Ind 1

Ind 2

Ind 3 Ind 4

Ind 5

X1 X2

Ind 1 1 5Ind 2 2 10Ind 3 3 8Ind 4 4 8Ind 5 5 12

On décide de faire une ACP normée. On a X̄ = (3, 8.6) et Dσ =

(1.4142 0

0 2.3324

). Le tableau

centré-réduit est

X =

−1.4142 −1.5435−0.7071 0.60020.0000 −0.25720.7071 −0.25721.4142 1.4577

.

Il s’agit de diagonaliser la matrice

1

ntXX =

(1 0.7276

0.7276 1

).

Les valeurs propres sont 1.7276 et 0.2724, associées aux vecteurs propres L1 = (0.7071, 0.7071) et L2 =(−0.7071, 0.7071). La somme des valeurs propres est égale à 2 ; le premier axe explique 86.38% de lavariance et le second 13.62%.

Cherchons les corrélations entre les anciennes variables (X1, X2) et les nouvelles variables Y 1 =0.707X1 + 0.707X2 et Y 2 = −0.707X1 + 0.707X2. On trouve

Cor(Y 1, X1) =√1.7276× 0.7071 = 0.9294

Cor(Y 1, X2) =√1.7276× 0.7071 = 0.9294

Cor(Y 2, X1) =√0.2724×−0.7071 = −0.3690

Cor(Y 2, X2) =√0.2724× 0.7071 = 0.3690

Les coordonnées des individus sont :

Y = X

(0.7071 −0.70710.7071 0.7071

)=

−2.0914 −0.0914−0.0756 0.9244−0.1819 −0.18190.3181 −0.68192.0308 0.0308

.

X1

X2

d = 1

1

2

3

4

5

X1 et X2 sont parfaitement représentées (ce qui est normal puisque le cercle est dans le plan engendrépar X1 et X2). Ces deux variables X1 et X2 sont fortement positivement corrélées avec la premièrecomposante principale, mais peu corrélées avec la seconde. Elles s’opposent sur ce second axe.

Pour l’individu 1, on calcule sa contribution à l’inertie pour le premier axe

contrib(1/L1) =1

5

(−2.0914)2

1.7276= 0.5064.

La qualité de sa représentation dans le premier axe est donnée par

cos2(φ) =(−2.0914)2

(−1.4142)2 + (−1.5435)2= 0.9981.

On obtient

Ind 1 Ind 2 Ind 3 Ind 4 Ind 5L1 cos2(φ) 0.9981 0.0066 0.5000 0.1787 0.9998

contrib 0.5064 0.0007 0.0038 0.0117 0.4774L2 cos2(φ) 0.0019 0.9934 0.5000 0.8213 0.0002

contrib 0.0061 0.6275 0.0243 0.3414 0.0007

Les individus 1 et 5 contribuent fortement à la formation du premier axe sur lequel ils s’opposent. Lepremier axe est très fortement lié aux variables X1 et X2 et représente la « taille » des individus : lesindividus 1 et 5 sont ceux qui prennent des valeurs extrêmes pour X1 et X2. L’individu 3 est représentéde manière égale par chacun des deux axes. C’est l’individu 2 qui contribue le plus fortement à l’axe 2.Cet axe est lié positivement à X2 et négativement à X1 et la position de l’individu 2 est due à la faiblevaleur qu’il prend pour X1 par rapport à la forte valeur prise pour X2. L’individu 4 est un peu moins bienreprésenté sur le second axe et doit sa position à une assez forte valeur de X1 par rapport à la valeur prisepour X2.

On étudie des données économiques de l’INSEE sur les régions françaises, avec comme variables :– le PIB par habitant– le salaire moyen– le nombre de travailleurs salariés– le nombre de travailleurs non salariés– le taux d’emploi des 15-64 ans

Région PIBHab SalMoy NbSal NbnonSal TauxEmpAlsace 27379 23480 5619439 361163 65.1Aquitaine 26254 22620 480214 53882 63.5Auvergne 23797 21700 615656 56283 63.8Bourgogne 24696 21280 654973 55174 63.9Bretagne 24405 22030 913776 93294 64.5Centre 25126 21700 514214 64529 64.9Champagne-Ardenne 25781 22380 578693 70476 61.9Corse 24787 21910 1413288 103728 60.6Franche-Comté 23646 21470 781355 69669 64.6Île-de-France 49821 22050 707810 57408 66.8Languedoc-Roussillon 22993 23270 404489 43295 57.7Limousin 22429 31960 1347723 147677 63.4Lorraine 22973 21560 1150185 145206 61.7Midi-Pyrénées 26007 21370 610350 81048 64.2Nord-Pas-de-Calais 24142 22280 1153363 158906 57.3Basse-Normandie 23331 23160 1041077 150535 63.4Haute-Normandie 26051 22720 248352 36165 62.5Pays-de-la-Loire 26322 21940 2415291 265837 66.0Picardie 22866 21950 461690 68152 61.4Poitou-Charentes 23974 21230 825200 132182 63.5Provence-Alpes-Côte-d’Azur 28359 23570 1748874 237435 60.8Rhône-Alpes 29773 24340 105910 15467 65.9France Métropolitaine 30239 25020 23791922 2467511 63.7Guadeloupe 18967 23080 118045 7905 48.4Martinique 20828 24480 125785 8688 43.3Guyane 14640 23140 46866 3138 51.5La Réunion 18061 22150 224124 22541 43.6France 29900 24980 24306742 2509783 63.2

1 2 3 4 5Valeurs propres 2.3121 1.3083 0.8818 0.4179 0.0799

Part de variance expliquée 46.24 26.17 17.64 8.36 1.60Variance expliquée cumulée 46.24 72.41 90.04 98.40 100.00

Vecteurs propres 1 2 3 4 5PIBHab 0.3373 0.5821 0.3775 0.6333 0.0612SalMoy 0.0290 -0.5254 0.8495 -0.0379 -0.0092NbSal 0.5715 -0.3338 -0.2243 0.2024 -0.6861

NbnonSal 0.5847 -0.3157 -0.2061 0.0322 0.7176TauxEmp 0.4657 0.4171 0.2077 -0.7453 -0.1028

Corrélations 1 2 3 4 5PIBHab 0.5129 0.6659 0.3545 0.4094 0.0173SalMoy 0.0441 -0.6009 0.7977 -0.0245 -0.0026NbSal 0.8690 -0.3818 -0.2106 0.1308 -0.1939

NbnonSal 0.8891 -0.3611 -0.1935 0.0208 0.2028TauxEmp 0.7081 0.4771 0.1950 -0.4818 -0.0291

Projection des individus Axe 1 Axe 2 Axe 3 Axe 4 Axe 5Alsace 4.7906 -2.0710 -1.0280 0.7046 -0.7656Aquitaine -0.2473 0.6720 0.3052 -0.2939 -0.1072Auvergne -0.2915 0.6350 -0.2611 -0.5499 -0.1989Bourgogne -0.2256 0.8310 -0.3810 -0.4499 -0.2236Bretagne 0.2129 0.4247 -0.2139 -0.5017 -0.0790Centre -0.1321 0.8383 -0.1394 -0.5498 -0.0681Champagne-Ardenne -0.2264 0.4910 0.0620 -0.1305 -0.0067Corse 0.2872 0.0479 -0.4943 0.0904 -0.2400Franche-Comté -0.0653 0.6300 -0.4081 -0.6184 -0.2032Île-de-France 1.4800 3.2833 1.6310 1.9177 -0.0262Languedoc-Roussillon -0.9579 -0.1314 0.2218 -0.0044 -0.0937Limousin 0.7679 -2.7447 3.5480 -0.6706 0.0613Lorraine 0.4066 -0.0444 -0.7684 -0.2591 0.2451Midi-Pyrénées 0.0285 0.8739 -0.3036 -0.3435 0.0335Nord-Pas-de-Calais 0.2625 -0.4519 -0.5687 0.3684 0.4389Basse-Normandie 0.5522 -0.2984 -0.0128 -0.4655 0.3290Haute-Normandie -0.5752 0.6992 0.3930 -0.2521 -0.0977Pays-de-la-Loire 2.4200 -0.3745 -0.8131 -0.1203 0.4350Picardie -0.5138 0.3258 -0.2910 -0.4014 0.0273Poitou-Charentes 0.3275 0.4056 -0.6847 -0.4192 0.3233Provence-Alpes-Côte-d’Azur 1.6352 -0.6187 0.0383 0.5350 0.7124Rhône-Alpes -0.3115 0.9910 1.4983 -0.3093 -0.2065Guadeloupe -2.2608 -0.8624 -0.2701 0.5744 -0.1060Martinique -2.4933 -1.3753 0.2661 1.3407 -0.0098Guyane -2.3548 -1.0658 -0.3965 -0.2667 -0.1963La Réunion -2.5155 -1.1103 -0.9292 1.0750 0.0227

Qualité et contribution cos21 cos22 cos23 Contr1 Contr2 Contr3Alsace 0.7812 0.1460 0.0360 0.3818 0.1261 0.0461Aquitaine 0.0869 0.6417 0.1323 0.0010 0.0133 0.0041Auvergne 0.0946 0.4489 0.0759 0.0014 0.0119 0.0030Bourgogne 0.0447 0.6063 0.1274 0.0008 0.0203 0.0063Bretagne 0.0856 0.3408 0.0864 0.0008 0.0053 0.0020Centre 0.0167 0.6714 0.0186 0.0003 0.0207 0.0008Champagne-Ardenne 0.1636 0.7696 0.0123 0.0009 0.0071 0.0002Corse 0.2089 0.0058 0.6188 0.0014 0.0001 0.0107Franche-Comté 0.0043 0.4004 0.1680 0.0001 0.0117 0.0073Île-de-France 0.1134 0.5583 0.1378 0.0364 0.3169 0.1160Languedoc-Roussillon 0.9242 0.0174 0.0495 0.0153 0.0005 0.0021Limousin 0.0279 0.3559 0.5948 0.0098 0.2215 0.5491Lorraine 0.1868 0.0022 0.6672 0.0027 0.0001 0.0258Midi-Pyrénées 0.0008 0.7827 0.0944 0.0000 0.0224 0.0040Nord-Pas-de-Calais 0.0745 0.2208 0.3497 0.0011 0.0060 0.0141Basse-Normandie 0.4241 0.1239 0.0002 0.0051 0.0026 0.0000Haute-Normandie 0.3159 0.4668 0.1475 0.0055 0.0144 0.0067Pays-de-la-Loire 0.8535 0.0204 0.0963 0.0974 0.0041 0.0288Picardie 0.4281 0.1721 0.1373 0.0044 0.0031 0.0037Poitou-Charentes 0.1051 0.1611 0.4593 0.0018 0.0048 0.0204Provence-Alpes-Côte-d’Azur 0.6942 0.0994 0.0004 0.0445 0.0113 0.0001Rhône-Alpes 0.0280 0.2836 0.6484 0.0016 0.0289 0.0979Guadeloupe 0.8153 0.1186 0.0116 0.0850 0.0219 0.0032Martinique 0.6231 0.1896 0.0071 0.1034 0.0556 0.0031Guyane 0.7981 0.1635 0.0226 0.0922 0.0334 0.0069La Réunion 0.6605 0.1287 0.0901 0.1053 0.0362 0.0377

1 2 3 4 5

Parts de variance expliquée0

1020

3040

1 2 3 4 5

Pourcentages cumulés de variance expliquée

020

4060

8010

0

PIBHab

SalMoy

NbSal NbnonSal

TauxEmp

PIBHab SalMoy NbSal NbnonSal TauxEmp

Composantes du 1er vecteur propre

−1.

0−

0.5

0.0

0.5

1.0

PIBHab SalMoy NbSal NbnonSal TauxEmp

Composantes du 2e vecteur propre

−1.

0−

0.5

0.0

0.5

1.0

PIBHab SalMoy NbSal NbnonSal TauxEmp

Composantes du 3e vecteur propre

−1.

0−

0.5

0.0

0.5

1.0

−2 0 2 4

−2

−1

01

23

Premier plan factoriel (Y1,Y2)

Y1

Y2

Bretagne

Corse

Île−de−France

Midi−Pyrénées

Poitou−Charentes

Alsace

Limousin

Lorraine

Nord−Pas−de−Calais

Basse−NormandiePays−de−la−Loire

Provence−Alpes−Côte−d’Azur

AquitaineAuvergne

BourgogneCentre

Champagne−ArdenneFranche−Comté

Haute−Normandie

Picardie

Rhône−Alpes

Languedoc−Roussillon

Guadeloupe

Martinique

GuyaneLa_Réunion

−2 0 2 4

−1

01

23

Plan factoriel (Y1,Y3)

Y1

Y3

Île−de−France

Limousin

Provence−Alpes−Côte−d’Azur

Alsace

Bretagne

Corse

Lorraine

Midi−Pyrénées

Nord−Pas−de−Calais

Basse−Normandie

Pays−de−la−Loire

Poitou−Charentes

Aquitaine

Champagne−Ardenne

Languedoc−Roussillon

Haute−Normandie

Rhône−Alpes

Martinique

Auvergne

Bourgogne

Centre

Franche−Comté

PicardieGuadeloupe

Guyane

La_Réunion