4
MULITVARIJACIONA ANALIZA VARIJANSE Problem testiranja hipoteze o vrednosti sredine razmatran je u 3. Glavi. Tamo izlo`en statisti~ki postupak testiranja na osnovu slu~ajnog uzorka vi{edimenzione slu~ajne promenljive iz jedne populacije predstavlja uop{tenje jednodimenzionog t testa. Za pore| enje sredina nekoliko populacija koristi se jedna od najpoznatijih statisti~kih metoda poznata pod nazivom analiza varijanse (u oznaci ANOVA). Za testiranje jednakosti sredine vi{edimenzione slu~ajne promenljive kod nekoliko populacija koristi se vi{edimenziono uop{tenje ove metode, odnosno multivarijaciona analiza varijanse (u oznaci MANOVA). Pre nego {to postupnosti radi, izlo`imo postupke pore|enja sredina vektora za slu~aj dve populacije, u uvodnom poglavlju ukaza}emo na situacije i pitanja na koja metodi iz ove glave daju odgovore. Sme{taju}i problem pore|enja sredina populacija u {iri kontekst planiranja eksperimenta razlikova}emo dva slu~aja. Prvi, kada se koristi potpuno slu~ajan plan za generisanje uzorka iz vi{e populacija i drugi kada su iste jedinice posmatranja podvrgnute razli~itim eksperimentalnim situacijama. U ovom drugom slu~aju re~ je o tzv. planu ponovljenih merenja. Kod pore|enja sredina vi{e populacija razmatramo dva osnovna modela analize. Prvi, kod koga ispitujemo dejstvo jednog faktora na varijabilitet podatka, tzv. model MANOVA sa jednim faktorom i drugi, kod koga ispitujemo dejstvo dva faktora na varijabilitet podatka, tzv. model MANOVA sa dva faktora. Posebno poglavlje posve}ujemo tzv. analizi profila u okviru koga postupno, preko niza hipoteza, odgovoramo na pitanje o jednakosti sredina nekoliko populacija. UVOD Metodi pore|enja sredina u bliskoj su vezi sa planiranjem eksperimenta kod koga direktno kontroli{emo jednu ili vi{e nezavisnih promenljivih (naj~e{}e su u pitanju kvalitativne promenljive) da bismo odredili njene efekte na jednu ili vi{e zavisnih promenljivih. Najpoznatiji plan eksperimenta jeste potpuno slu~ajan plan kod koga nezavisna promenljiva (u planiranju eksperimenta koristimo izraz - faktor) uzima dve vrednosti (nazivamo ih tretmani ili nivoi faktora). Kod njega ispitujemo uticaj jednog faktora na zavisnu promenljivu, a na potpuno slu~ajan na~in primenjujemo jedan ili drugi tretman (nivo faktora) na eksperimentalne jedinice, {to zna~i da na svaku jedinicu posmatranja mo`emo primeniti jedan ili drugi tretman sa podjednakom verovatno}om. Sredina zavisne promenljive kod eksperimentalnih

Mulitvarijaciona Analiza Varijanse Salih

Embed Size (px)

Citation preview

Page 1: Mulitvarijaciona Analiza Varijanse Salih

MULITVARIJACIONA ANALIZA VARIJANSE

Problem testiranja hipoteze o vrednosti sredine razmatran je u 3. Glavi. Tamo izlo`en statisti~ki postupak testiranja na osnovu slu~ajnog uzorka vi{edimenzione slu~ajne promenljive iz jedne populacije predstavlja uop{tenje jednodimenzionog t testa. Za pore|enje sredina nekoliko populacija koristi se jedna od najpoznatijih statisti~kih metoda poznata pod nazivom analiza varijanse (u oznaci ANOVA). Za testiranje jednakosti sredine vi{edimenzione slu~ajne promenljive kod nekoliko populacija koristi se vi{edimenziono uop{tenje ove metode, odnosno multivarijaciona analiza varijanse (u oznaci MANOVA).

Pre nego {to postupnosti radi, izlo`imo postupke pore|enja sredina vektora za slu~aj dve populacije, u uvodnom poglavlju ukaza}emo na situacije i pitanja na koja metodi iz ove glave daju odgovore. Sme{taju}i problem pore|enja sredina populacija u {iri kontekst planiranja eksperimenta razlikova}emo dva slu~aja. Prvi, kada se koristi potpuno slu~ajan plan za generisanje uzorka iz vi{e populacija i drugi kada su iste jedinice posmatranja podvrgnute razli~itim eksperimentalnim situacijama. U ovom drugom slu~aju re~ je o tzv. planu ponovljenih merenja. Kod pore|enja sredina vi{e populacija razmatramo dva osnovna modela analize. Prvi, kod koga ispitujemo dejstvo jednog faktora na varijabilitet podatka, tzv. model MANOVA sa jednim faktorom i drugi, kod koga ispitujemo dejstvo dva faktora na varijabilitet podatka, tzv. model MANOVA sa dva faktora. Posebno poglavlje posve}ujemo tzv. analizi profila u okviru koga postupno, preko niza hipoteza, odgovoramo na pitanje o jednakosti sredina nekoliko populacija.

UVOD

Metodi pore|enja sredina u bliskoj su vezi sa planiranjem eksperimenta kod koga direktno kontroli{emo jednu ili vi{e nezavisnih promenljivih (naj~e{}e su u pitanju kvalitativne promenljive) da bismo odredili njene efekte na jednu ili vi{e zavisnih promenljivih. Najpoznatiji plan eksperimenta jeste potpuno slu~ajan plan kod koga nezavisna promenljiva (u planiranju eksperimenta koristimo izraz - faktor) uzima dve vrednosti (nazivamo ih tretmani ili nivoi faktora). Kod njega ispitujemo uticaj jednog faktora na zavisnu promenljivu, a na potpuno slu~ajan na~in primenjujemo jedan ili drugi tretman (nivo faktora) na eksperimentalne jedinice, {to zna~i da na svaku jedinicu posmatranja mo`emo primeniti jedan ili drugi tretman sa podjednakom verovatno}om. Sredina zavisne promenljive kod eksperimentalnih jedinica podvrgnutih prvom ili drugom tretmanu predstavlja polaznu osnovu za ispitivanje uticaja posmatranog faktora na zavisnu promenljivu. Primer istra`ivanja na koje se odnosi navedeni plan eksperimenta je ispitivanje zna~ajnosti razlike u prodaji nekog proizvoda s obzirom na tip prodavnice (samoposluga i klasi~na prodavnica). U ovom primeru faktor identifikujemo sa tipom prodavnice, njegov prvi tretman sa prvim tipom prodavnice - samoposlugom, a drugi sa drugim tipom prodavnice - klasi~nom prodavnicom. Zavisna promenljiva predstavlja prodaju posmatranog proizvoda. Ako slu~ajno izaberemo prodavnica oba tipa (ne nu`no podjednak broj), odnosno "primenimo tretmane" na eksperimentalne jedinice, dobi}emo dva uzorka na osnovu kojih donosimo odluku u pogledu hipoteze da tip prodavnice nema uticaja na prodaju proizvoda. Operacionalizacija ove hipoteze sugeri{e jednakost prose~ne prodaje u ova dva tipa prodavnica. Na osnovu primene t testa donosimo odluku o prihvatanju ili odbacivanju navedene hipoteze. Pored prodaje proizvoda mo`emo uzeti u obzir i druge elemente u vezi posmatranog proizvoda. Na primer, op{ta zainteresovanost ili pa`nja koju kupci poklanjaju tom proizvodu s obzirom da ona mo`e rezultirati u ve}oj prodaji u narednom periodu. Sada se nalazimo u situaciji da zavisna promenljiva nije jednodimenziona ve} vi{edimenziona. U takvom slu~aju individualni pristup t testom svakom paru zavisnih promenljivih za dva tretmana zanemaruje korelaciju izme|u zavisnih promenljivih i ne dozvoljava kontrolu gre{ke prve vrste kao {to smo to pokazali u Odeljku 3.4.3 o simultanim

Page 2: Mulitvarijaciona Analiza Varijanse Salih

intervalima poverenja. Za ovaj plan eksperimenta kod koga ispitujemo uticaj faktora sa dva nivoa na vi{edimenzionu zavisnu promenljivu u Poglavlju 5.2 izla`emo statisti~ki postupak koja omogu}ava zaklju~ivanje o jednakosti sredine dve populacije. Pro{iruju}i na{ primer pretpostavi}emo da pored prodaje u samoposlugama i klasi~nim prodavnicama posmatrani proizvod kupci mogu na}i i u specijalizovanim radnjama. Uz ostale elemente koje smo ranije definisali u ovom primeru, mo`emo identifikovati plan eksperimenta koji ima karakteristike potpuno slu~ajnog plana sa nezavisnom promenljivom koja uzima tri vrednosti. Drugim re~ima, ka`emo da ispitivani faktor (tip prodavnice) ima tri nivoa ili tretmana. Statisti~ki postupak ispitivanja odsustva uticaja faktora na prodaju proizvoda u ovom pro{irenom primeru zasnovan je na metodu analize varijanse, a ukoliko pored prodaje proizvoda uzimamo u obzir i druge elemente u vezi proizvoda, na primer zainteresovanost kupaca, tada analizu ove vi{edimenzione zavisne promenljive za tri tretmana vr{imo multivarijacionom analizom varijanse. Model koji predstavlja opis izlo`enog primera naziva se model multivarijacione analize varijanse sa jednim faktorom i njime se bavimo u Poglavlju 5.4.

Ako u razmatranje uklju~imo regione u kojima su locirane prodavnice kao dodatni faktor koji uti~e na prodaju, pristup sa metodolo{kog stanovi{ta ostaje isti (multivarijaciona analiza varijanse) kao i plan eksperimenta (potpuno slu~ajan plan). Ono {to dodatno optere}uje analizu jeste eventualno prisustvo interakcije izme|u faktora. Ovaj primer u kome ispitujemo dejstvo dva faktora, tip prodavnice i region, na vi{edimenzionu zavisnu promenljivu teorijski modeliramo u Poglavlju 5.6, gde se izla`e model multivarijacione analize varijanse sa dva faktora.

Zajedni~ka nit koja se provla~i kroz sve navedene primere jeste identi~an plan eksperimenta, re~ je o potpuno slu~ajnom planu eksperimenta. Me|utim, modeli multivarijacione analize varijanse koje izla`emo u ovoj glavi primereni su i drugim planovima eksperimenata, ali se o njima mo`e pro~itati u literaturi posve}enoj planiranju eksperimenata, npr. Box i dr. (1978). Pored potpuno slu~ajnog plana eksperimenta pozabavi}emo se analizom jo{ jednog plana eksperimenta, planom ponovljenih merenja.

Za razliku od potpuno slu~ajnog plana eksperimenta kod plana ponovljenih merenja nalazimo se u eksperimentalnoj situaciji da opservacije prikupljamo u razli~ito vreme na istim eksperimentalnim jedinicima. Ovaj plan eksperimenta javlja se u situaciji kada, na primer jedna grupa ispitanika re{ava odre|eni problem pre i nakon dodatne obuke i pri tome se registruje vreme re{avanja problema. Tada se razlika u zabele`enim vremenima mo`e pripisati upravo efektima te dodatne obuke. Za pore|enje parova odziva koristimo t test, ako je zavisna promenljiva jednodimenziona, odnosno 2T test, ako je zavisna promenljiva vi{edimenziona. Statisti~ki postupak pore|enja parova izla`emo u Odeljku 5.2.2. Me|utim, puni smisao plana ponovljenih merenja sagledava se u eksperimentalnoj situaciji u kojoj bele`imo jednu promenljivu odziva na istoj eksperimentalnoj jedinici u razli~itim vremenskim trenucima, tj. nakon primene jednog po jednog tretmana u uzastopnim vremenskim periodima.

Primer u kome se javlja ovaj plan eksperimenta odnosi se na istra`ivanje uticaja tipa pakovanja (porodi~no i individualno) i vrste ambala`e (brik pakovanje i plasti~na fla{a) na prodaju osve`avaju}eg pi}a. U izabranim prodavnicama u sukcesivnim mesecima bele`imo prodaju osve`avaju}eg pi}a, pri ~emu na slu~aj u jednom mesecu primenjujemo kombinaciju odre|enog tipa pakovanja i vrste ambala`e. Dakle, u istim prodavnicama (eksperimentalnim jedinicama) bele`imo prodaju osve`avaju}eg pi}a (jedna promenljiva odziva) koja varira iz meseca u mesec pod dejstvom uslova prodaje (tretmana). Ovaj primer koristimo kao ilustraciju u Poglavlju 5.3 u kome se izla`u teorijske osnove statisti~kog postupka analize plana ponovljenih merenja.

SLUČAJ DVIJE POPULACIJE