Upload
hathuy
View
226
Download
7
Embed Size (px)
Citation preview
10/11/2016
1
UVOD U ANALIZU PODATAKA
• Novembar 2016
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
2
Oblasti izučavanja
I. Priroda i obuhvat marketinških istraživanjaII. Izvori podataka u marketinškim istraživanjimaIII. Faze istraživačkog procesaIV. Eksploratorna istraživanjaV. Deskriptivna istraživanjaVI. Merenje stavova i dizajniranje upitnikaVII. Uzročna istraživanja: Izvođenje eksperimenataVIII. Izvlačenje uzoraka, vrste uzorakaIX. Analiza podataka (1)X. Analiza podataka (2)...
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
3
IX. Analiza podataka (1)
1. Osnove analize podataka2. Testiranje hipoteza3. Regresiona i korelaciona analiza
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
4
IX.1. Osnove analize podataka
• Priprema podataka za analizu• Tabeliranje podataka• Faktori koji utiču na izbor tehnike za analizu podataka• Pregled statističkih tehnika za analizu podataka
10/11/2016
2
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
5
Priprema podataka za analizu
• Editovanje podataka• Kodiranje podataka• Statističko prilagođavanje podataka
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
6
Editovanje podataka (1)
• Sprovodi anketar ili supervizor na terenu ili istraživač pre početka analize
• Treba identifikovati sledeće probleme:– Greške anketara (daje loša/pogrešna uputstva)– Nedostajući odgovori– Nejasni odgovori (nečitki ili nejasni)– Međusobna neusklađenost odgovora (npr.
kontradiktorni) – Nedovoljna kooperativnost (npr. bira isti odgovor)– Neodgovarajući ispitanik
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
7
Editovanje podataka (2)
• Pošto se identifikuju, problemi se mogu rešiti primenom sledećih postupaka:– Ponovno kontaktiranje ispitanika, ako se smatra
značajnim– Odbaciti ceo upitnik ako je neupotrebljiv, ako ispitanik
nije razumeo anketu ili je bio nekooperativan– Odbaciti pojedinačno problematično pitanje– Kodirati nejasne odgovore u kategoriju “ne znam” ili
“nemam mišljenje”
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
8
Kodiranje
• Zatvorena pitanja– Šta su zatvorena pitanja i kada se koriste? – Prednosti i nedostaci zatvorenih pitanja– Kodiranje zatvorenih pitanja
• Otvorena pitanja– Šta su otvorena pitanja i kada se koriste? – Prednosti i nedostaci otvorenih pitanja– Kodiranje otvorenih pitanja?
10/11/2016
3
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
9
Statističko prilagođavanje podataka
• Ponderisanje;
• Respecifikacija varijabli;
• Veštačke varijable; i
• Transformacija skale.
Ponderisanje
• Procedura po kojoj se svakom odgovoru iz baze podataka, dodeljuje određeni broj (ponder) u skladu sa prethodno utvrđenim pravilom
• Koristi se da se postigne reprezentativnost uzorka – reprezentativnost u odnosu na ono što se želi izmeriti
• Ili da se bolje izmeri određena karakteristika – npr. ponderisanje tržišnim učešćem
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
10
Respecifikacija varijabli
• Procedura po kojoj se postojeći podaci modifikuju kako bi se formirale nove varijable da bi se bolje realizovali ciljevi istraživanja, npr. – veliki broj varijabli se pregrupiše u manji broj– računanje odnosa dve varijable da bi se formulisala
nova varijabla,– izvlačenje kvadratnog korena i logaritamske
transformacije, – korišćenje veštačkih varijabli.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
11
Veštačke varijable
• Nazivaju se još i instrumentalnim i kvalitativnim varijablama
• Respecifikacija kategorijske varijable• Ako postoji m nivoa kvalitativne varijable, koristi
se (m – 1) veštačka varijabla da se oni specifikuju – M-ta varijabla je definisana sa prethodnih m-1– Najlakše objasniti na dihotomnim (binarnim)
varijablama koje imaju samo dva nivoa.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
12
10/11/2016
4
Transformacija skale
• Manipulacija sa vrednostima merne skale • Da se obezbedi uporedivost, npr.
– Standardizacija se može primeniti samo na podacima koji su dati na intervalnoj ili skali odnosa
– Od svake realizovane vrednosti se oduzme srednja vrednost i podeli sa standardnom devijacijom
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
13
( ) xii sXXz −=
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
14
Tabeliranje podataka
• Raspored frekvencija• Deskriptivni statistički pokazatelji• Unakrsno tabeliranje
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
15
Tabeliranje podataka
• Koristi se za: – “Čišćenje” podataka– Određivanje empirijske raspodele (raspodele
frekvencija)– Izračunavanje deskriptivnih statističkih pokazatelja
(srednje vrednosti i procentualno učešće)
• Zatim se podaci unakrsno tabeliraju kako bi se videlo da li postoji povezanost između dve tipično nominalne varijable.
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan Najmanje jednom
nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muški 80 70 30 20
Ženski 40 60 50 50
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
16
10/11/2016
5
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
17
Raspored frekvencija
• Na kojoj skali moraju biti varijable?• Predstavlja broj dobijenih odgovora za svako
postavljeno pitanje• Može biti organizovano po klasama ili grupama
odgovora• Može se prikazati štapićastim dijagramom• Mogu se prekombinovati grupe/kategorije
pitanja, kako u zavisnosti od cilja istraživanja/vrste odgovora tako i frekvencije odgovora u pojedinim kateogrijama
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan
Najmanje jednom
nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muški 80 70 30 20 200
Ženski 40 60 50 50 200
Uk. 120 130 80 70
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
18
Koliko često kupujete Politiku?
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
190 50 100
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom mesečno
Ni jednom mesečno
ŽenaMuškarac
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
20
Deskriptivni statistički pokazatelji
• Predstavljaju sumarnu informaciju dobijenu na osnovnu rasporeda frekvencija. Mogu biti:– Mere centralne tendencije (srednja vrednost,
medijana, modus),– Mere disperzije (interval varijacije, standardna
devijacija, koeficijent varijacije),– Mere oblika rasporeda (simetričnost i spljoštenost);
• Naravno, kod upotrebe nominalnih mernih skala može se koristiti samo raspored frekvencija.
10/11/2016
6
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
21
Čebiševljeva teorema• Određuje gde se vrednosti raspodele frekvencija nekog
pokazatelja nalaze u odnosu na njegovu srednju vrednost;• Bez obzira na raspored:
– Najmanje 75% vrednosti će biti unutar intervala ± 2 stand. devijacije,– Najmanje 89% vrednosti će biti u okviru ± 3 stand. devijacije,
u odnosu na srednju vrednost posmatranog parametra;• Ako je raspored simetrična kriva u obliku zvona, onda:
– Oko 68% vrednosti u populaciji će biti u okviru ± 1 standardna devijacija,– Oko 95% vrednosti će biti u okviru ± 2 standardne devijacije,– Oko 99% vrednosti će se nalaziti u okviru ± 3 standardne devijacije
u odnosu na srednju vrednost posmatranog parametra.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
22
Unakrsno tabeliranje• Tehnika koja služi za posmatranje odnosa između dve i
više nominalnih varijabli;• Kada se obračun vrši po redovima ili kolonama, tabele
sa unakrsnim tabeliranjem se nazivaju tabele kontingencije, budući da su procenti suštinski uslovljeni ukupnim sumama po redovima ili kolonama;
• Najveći broj marketinških istraživanja ne ide dalje od unakrsnog tabeliranja, a čak i ona istraživanja koja koriste sofisticiranije analitičke metode još uvek koriste unakrsno tabeliranje kao važnu komponentu.
Primer: Koliko često kupujete Politiku?
Pol:
Svaki dan Najmanje jednom
nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac 80 70 30 20
Žena 40 60 50 50
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
23
Primer: Koliko često kupujete Politiku?
Pol:
Svaki dan
Najmanje jednom
nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muškarac
80 70 30 20 200
Žena 40 60 50 50 200
Uk. 120 130 80 70
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
24
10/11/2016
7
Koliko često kupujete Politiku?- Štapićasti dijagram -
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
250 50 100
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom mesečno
Ni jednom mesečno
ŽenaMuškarac
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
26
Faktori koji utiču na izbor tehnike za analizu podataka
• Vrsta podataka• Dizajn istraživanja• Pretpostavke na kojima se bazira testiranje statističkih pokazatelja
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
27
Vrsta podataka
• Podaci na nominalnoj skali (nemetrički):– Frekvencije, jedina mera centralne tendencije je modus, hi-
kvadrat test
• Podaci dati na ordinalnoj skali (nemetrički): – Percentili, kao i najveći broj neparametarskih testova (neki
put pogrešna primena parametarskih metoda)
• Podaci dati na intervalnoj i na skali odnosa (metrički):– Srednja vrednost (aritmetička sredina), mere disperzije,
mere oblika raspodele, i širok izbor parametarskih i neparametarskih testova
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
28
Dizajn istraživanja (1)
• Nezavisnost uzoraka, npr.:X O1 ako se ne mere na istom skupu, koristi se
O2 t-test za razliku dve srednje vrednosti; ALIO1 X O2 ako su oba merenja na istom skupu onda se
koristi t-test uparenih razlika.
• Broj grupa, npr.:X1 O1 postoje tri grupe i tri srednje vrednosti zaX2 O2 poređenje, ne može t-test za razliku srednjih
O3 vrednosti, već analiza varijanse
10/11/2016
8
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
29
Dizajn istraživanja (2)
• Broj varijabli, npr.:X O1 gde su ovo dva merenja različitih varijabli i
O2, više se ne mogu koristiti univarijacione tehn.
• Kontrola nad uticajem varijabli
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
30
Pretpostavke na kojima se bazira testiranje statističkih pokazatelja
• Neophodno odlično poznavanje pretpostavki na kojima se pojedini testovi baziraju. Npr.:– Pretpostavke t-testa, na osnovu dva uzorka sa
istom σ, su:1. Uzorci su nezavisni;2. Karakteristike koje nas zanimaju za svaku populaciju
imaju normalan raspored;3. Dve populacije imaju jednake varijanse.
t-test nije osetljiv na povredu pretpostavke o normalnom rasporedu, ali jeste na pretpostavku o jednakim varijansama.
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
31
Pregled statističkih tehnika za analizu podataka
• Univarijacione i multivarijacione tehnike• Parametarske i neparametarske tehnike• Tehnike zavisnosti i međuzavisnosti
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
32
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
10/11/2016
9
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
33
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
34
Neparametarske tehnike analize podataka
- Hi-kvadrat- Kolmogorov-Smirnov
- RUNS
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- Hi-kvadrat- Suma rangova- Kolmogorov –Smirnov
- KW ANOVA
- Test znakova- Vilkoksov test- Meknimarov test
- Kokranov Q-test
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
35
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
36
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
10/11/2016
10
Novembar 2016 Istraž ivanje trž ištaEkonomski fakultet, Beograd
37
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na vari-jablama
Fokus na predmetima posmatranja
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti