55
ANALIZA GLAVNIH KOMPONENATA

ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Embed Size (px)

Citation preview

Page 1: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

ANALIZA GLAVNIH

KOMPONENATA

Page 2: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Analiza glavnih komponenata bavi se

tumačenjem strukture matrice varijanci i

kovarijanci skupa izvornih varijabli pomoću

malog broja njihovih linearnih kombinacija.

• Osnovni ciljevi analize su:

• Redukcija podataka

• Interpretacija

Page 3: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Premda je p ulaznih varijabli odabrano

kako bi se opisala varijablnost cijelog

sustava, često je velik dio tog varijabiliteta

opisan malim brojem k glavnih

komponenata (k<p) .

Ako je to ispunjeno, k glavnih

komponenata sadrži jednaku količinu

informacija kao p ulaznih varijabli.

Page 4: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Stoga se početni skup podataka koji se

sastoji od n mjerenja na p ulaznih varijabli

može reducirati na skup od n mjerenja na

k glavnih komponenata.

Analiza glavnih komponenata otkriva

povezanost među varijablama i stoga

dozvoljava interpretacije do kojih se inače

bez ovako provedene analize ne bi došlo.

Page 5: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Analiza glavnih komponenata često služi

kao međukorak za provođenje drugih

metoda kao primjerice:

• regresijske

• klaster

• ili faktorske analize.

Page 6: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Algebarski, glavne komponente su

linearne kombinacije p slučajnih varijabli .

Geometrijski su te linearne kombinacije

koordinatne osi novog koordinatnog

sustava dobivenog rotacijom oko starog s

glavnim komponentama kao koordinatnim

osima.

Page 7: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Kao što će se vidjeti, glavne komponente

reprezentiraju smjer maksimalnog

varijabiliteta i omogućuju jednostavniji opis

kovarijančne strukture.

• Također će se vidjeti da glavne

komponente ovise samo o matrici varijanci

i kovarijanci (odnosno o korelacijskoj

matrici ) polaznih varijabli pXXX ,,, 21

Page 8: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Neka slučajni vektor

ima matricu varijanci i kovarijanci sa

svojstvenim vrijednostima (eigenvalues,

latent roots):

Promotrimo linearne kombinacije:

pXXXX ,,, 21

021 p

Page 9: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

ppppppp

pp

pp

XaXaXaXaY

XaXaXaXaY

XaXaXaXaY

2211

222212122

121211111

(1.1)

Page 10: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Odatle je:

pkiaaYYCov

piaaXaVarYVar

kiki

iiii

,,2,1,),(

,,2,1)()(

(1.2)

Page 11: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Glavne komponente su one linearne

kombinacije pYYY ,,, 21

čije su varijance što je moguće veće.

Prva glavna komponenta je linearna

kombinacija s najvećom varijancom.

Page 12: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

S obzirom da se varijanca

može povećati množenjem vektora

konstantom, pažnja se ograničava na

vektore koeficijenata duljine jedan.

111)( aaYVar

Page 13: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Prva glavna komponenta = linearna kombinacija XaY 11

koja maksimizira

111)( aaYVar uz uvjet 111 aa

Druga glavna komponenta = linearna kombinacija XaY 22

koja maksimizira

222 )( aaYVar uz uvjet 122 aa i

0),( 21 XaXaCov

Page 14: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

.

.

.

i-ta glavna komponenta = linearna kombinacija XaY ii

koja maksimizira iii aaYVar )( uz uvjet

1iiaa i ikzaXaXaCov ki 0),(

Page 15: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

TEOREM 1

Neka je ∑ matrica varijanci i kovarijanci pridružena

slučajnom vektoru:

pXXXX ,,, 21

Neka su parovi svojstvenih vrijednosti i svojstvenih vektora

matrice ∑:

),(,),,(),,( 2211 pp eee

pri čemu vrijedi 021 pi

Tada je i-ta glavna komponenta dana s:

Page 16: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

piXeXeXeXeY pipiiii ,,2,12211

(1.3)

Uz takav izbor

pieeYVar iiii ,,2,1)(

kizaeeCovYYCov kiki 0)(),( (1.4)

Ako su neke svojstvene vrijednosti međusobno jednake izbor

odgovarajućih koeficijenata vektora ei, dakle i Yi nije

jednoznačan.

Page 17: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Dokaz:

1

0

max

aa

aa

a

(dostignuto ako je ) 1ea

No , jer su svojstveni vektori normalizirani.

111 ee

Odatle je:

)(max 1111111

1

11

111

011

YVareeeeee

ee

aa

aa

ea

Page 18: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 19: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

0),( kik

e

kiki eeeeYYCov

kk

Posljedica ovog teorema je da su glavne komponente

nekorelirane i da su im varijance jednake svojstvenim

vrijednostima matrice

.

Page 20: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

TEOREM 2

Page 21: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

DOKAZ:

Page 22: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

kao posljedica ovog rezultata proporcija ukupne varijance

protumačene k-tom glavnom komponentom je:

Page 23: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Promatra se veličina svake komponente vektora

Komponenta mjeri važnost k-te varijable na i-toj

glavnoj komponenti, neovisno o drugim varijablama.

ike

ipikii eeee 1

Koeficijent ike proporcionalan je koeficijentu linearne

korelacije između ki XY i

Page 24: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Neka su

XeY

XeY

XeY

XeY

pp

ii

22

11

glavne komponente dobivene iz

matrice varijanci i kovarijanci ∑

Tada su: pki

e

kk

iikXY ki

,,2,1, ,,

keficijenti linearne korelacije između ki XY i

TEOREM 3

Page 25: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Ovdje su ),(,),,(),,( 2211 pp eee parovi svojstvenih

vrijednosti i svojstvenih vektora matrice ∑.

Page 26: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

DOKAZ:

Page 27: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Premda korelacije između ulaznih

varijabli i glavnih komponenata često

pomažu pri interpretaciji komponenata,

one mjere samo univarijatni doprinos

jedne varijable na komponentu .

• Koeficijenti linearne korelacije ne

pokazuju važnost individualne varijable

na u prisustvu drugih varijabli.

iY

iY

Page 28: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 29: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Glavne komponente izračunate

polazeći od standardiziranih

varijabli

Page 30: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 31: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 32: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Glavne komponente mogu se izvesti pomoću

svojstvenih vektora korelacijske matrice od X.

• Svi se ranije izvedeni rezultati mogu primijeniti

uz određena pojednostavljenja, s obzirom da su

varijance standardiziranih varijabli jednake 1.

Nastavit ćemo s oznakama za i-tu glavnu

komponentu i za par i-te svojstvene

vrijednosti i pridruženog i-tog svojstvenog

vektora matrice ili matrice .

iY

),( ii e

Page 33: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

TEOREM 4

Page 34: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

DOKAZ

Page 35: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Primjer 1.1

Nakon snažne oluje 1. veljače 1898. u Herman

Bumpus-ovom laboratoriju na Brown University

na Rhode Islandu proučavan je veći broj

(nastradalih) umirućih vrabaca.

Oko polovica ptica je uginula, a Bumpus je taj

događaj tretirao kao priliku da ispita može li dati

potporu Darwinovoj teoriji prirodne selekcije.

Proveo je 8 morfoloških mjerenja na svakoj ptici,

a također je izmjerio njihovu težinu. Rezultati 5

mjerenja za ptice ženskog spola predočeni su u

datoteci Ptice.xls

Page 36: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Na osnovi prikupljenih podataka Bumpus je zaključio da

ptice koje su stradale, nisu stradale slučajno, nego stoga

jer su bile fizički diskvalificirane, a da su one ptice koje

su preživjele, preživjele zato jer su imale određene

fizičke karakteristike. Posebno je utvrdio da su preživjele

ptice bile kraće, manje teške, te da su imale dulje kosti

krila, dulje noge, dulju prsnu kost i veći moždani

kapacitet od onih koje nisu preživjele. Također je

zaključio da je proces selektivne eliminacije najjače

povezan s ekstremnom varijablom jedinke, bez obzira

na smjer varijacije. Zaključio je da je jednako opasno biti

iznad određenog standarda organske izvrsnosti, kao i

ispod tog standarda. Time je rečeno da se dogodila

stabilizacija selekcije i da su jedinke s mjerenjima bliže

prosjeku bolje preživjele od jedinki s mjerenjima daleko

od prosjeka.

Page 37: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

U doba dok je Bumpus pisao svoj rad razvoj multivarijatnih metoda je

bio na početku. 1897. je Francis Galton predstavio koeficijent korelacije

kao mjeru povezanosti među varijablama. Tek 56 godina kasnije Harold

Hotelling je opisao metodu provođenja analize glavnih komponenata,

koja se može primijeniti na Bumpusove podatke. Bumpus nije čak ni

računao standardne devijacije, no njegove su podatke ponovo

analizirali brojni autori i općenito potvrdili njegove zaključke.

Odaberu li se opisani podaci kao primjer za ilustraciju multivarijatnih

metoda, javljaju se slijedeća interesantna pitanja:

Na koji su način povezana različita mjerenja? Je li npr velika vrijednost

jedne varijable povezana s velikom vrijednosti druge varijable?

Jesu li sredine varijabli preživjelih i uginulih jedinki sitatistički

signifikantno različite?

Imaju li preživjele i uginule jedinke slični iznos varijacije za pojedine

varijable?

Page 38: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Primjer 1.1

• Svojstvene vrijednosti korelacijske

matrice za 5 mjerenja na 49 ženskih

vrabaca

• X1=duljina tijela X2= opseg krila X3=duljina vrata i glave

X4= duljina humerusa (nadlaktična kost) X5=duljina prsne kosti

• Primjenom programskog paketa

Statistica dobiveni su između ostalih

slijedeći rezultati:

Page 39: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 40: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Svojstvene vrijednosti i

pridruženi pokazatelji

Page 41: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Svojstvene vrijednosti su varijance glavnih komponenata. Zbroj svojstvenih vrijednosti iznosi 5. U drugom je stupcu izračunat postotak ukupne varijance objašnjen svakom glavnom komponentom, a u 4. je dan kumulativni niz postotaka iz drugog stupca.

Tako je npr prvom glavnom komponentom

objašnjeno 72.18% ukupne varijance,

drugom 10.62%, odnosno s prve dvije

glavne komponente protumačeno je

82.80% ukupne varijance.

Page 42: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Drugi način gledanja na relativnu važnost pojedinih komponenata je uspoređivanje njihovih varijanci s varijancama ulaznih standardiziranih varijabli (koje su jednake 1).

Prva glavna komponenta ima varijancu 3.609 puta

veću od varijance originalnih standardiziranih

varijabli, druga ima varijancu samo 0.531 od

varijance originalnih standardiziranih varijabli, a

preostale glavne komponente objašnjavaju još manji

dio varijacija. To potvrđuje važnost prve glavne

komponente u odnosu na ostale.

Page 43: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Svojstveni vektori korelacijske

matrice

Page 44: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 45: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Vrijednosti glavnih komponenata mogu

se koristiti za daljnje analize. One se

računaju iz standardiziranih varijabli.

Page 46: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

U slijedećoj tabeli tabeli navedene su sredine (Means) i

standardne devijacije (Std. Dev.) ulaznih varijabli:

Page 47: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Standardizirane vrijednosti mjerenja za prvog vrapca

su:

-0.329370.001374

20.8265)-(20.5)(Z

0.05425564286.0

)4694.185.18()(Z

0.177182794753.0

)4592.316.31()(Z

0.724862067822.5

)3265.241245()(Z

-0.51165709475.3

)8980.157156()(

55

51515

44

41414

33

31313

22

21212

11

11111

X

X

X

X

XZ

Page 48: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Vrijednost prve glavne komponente za prvog vrapca je:

079.005452.0470349.0

177182.0452537.0724862.0461962.0)51165.0(450380.011

Y

543212 88494.0169774.0312784.0299784.0018718.0 ZZZZZY

pa je vrijednost druge glavne komponente za prvog vrapca:

583.0)32937.0(88494.00552.0169774.0

177182.0312784.0724862.0299784.0)51165.0(018718.012

Y

Page 49: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Vrijednosti (za prva četiri vrapca) su predočene u

slijedećoj tabeli:

Page 50: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Promatrane ptice pokupljene su nakon

snažne oluje. Prvih 21 vrabaca se oporavilo i

preživjelo, a ostalih 28 je uginulo. Pitanje,

pokazuju li preživjeli i uginuli vrapci bilo

kakve razlike. Sa stajališta analize glavnih

komponenata može se promatrati dijagram

rasipanja za 49 vrijednosti prve i druge

glavne komponente podijeljene u dvije

grupe: preživjeli (označeni plavim krugom) i

uginuli (označeni crvenim kvadratom):

Page 51: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog
Page 52: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• Na dijagramu rasipanja se jasno vidi da

ptice s ekstremnim vrijednostima na

prvoj (a jednako tako i na drugoj

komponenti) nisu preživjele.

Page 53: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

Broj glavnih komponenata

• Uvijek se postavlja pitanje: Koliko glavnih komponenata treba zadržati?

• Ne postoji konačni odgovor na to pitanje. Pomoć pri donošenju odluke može pružiti scree-dijagram. To je dijagram koji dužinama povezuje točke u ravnini, čija je apscisa jednaka rednom broju svojstvene vrijednosti, a ordinata njenoj veličini. S obzirom da su svojstvene vrijednosti poredane u padajući niz, dobivena izlomljena linija je opadajuća. Smatra se da je broj glavnih komponenata koje ostaju određen točkom na pregibu iza koje su svojstvene vrijednosti male i koje se značajno ne razlikuju.

Page 54: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

E ig e n va lu e s o f co va ria n ce m a tri x

A cti ve va ria b l e s o n l y

7 2 ,1 8 %

1 0 ,6 2 % 7 ,7 8 %

6 ,2 2 % 3 ,2 1 %

0 ,0 0 ,5 1 ,0 1 ,5 2 ,0 2 ,5 3 ,0 3 ,5 4 ,0 4 ,5 5 ,0 5 ,5 6 ,0

E ig e n va lu e n u m b e r

-0 ,5

0 ,0

0 ,5

1 ,0

1 ,5

2 ,0

2 ,5

3 ,0

3 ,5

4 ,0

Eig

en

va

lue

Page 55: ANALIZA GLAVNIH KOMPONENATA - matf.bg.ac.rs · •Analiza glavnih komponenata bavi se tumačenjem strukture matrice varijanci i kovarijanci skupa izvornih varijabli pomoću malog

• U promatranom primjeru pregib je za

i=2. Svojstvene vrijednosti iza su male,

te se mogu zadržati prve dvije glavne

komponente.