Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
17/11/2017
1
UVOD U ANALIZU PODATAKA
• Novembar 2017
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
2
Oblasti izučavanja
I. Priroda i obuhvat marketinških istraživanjaII. Izvori podataka u marketinškim istraživanjimaIII. Faze istraživačkog procesaIV. Eksploratorna istraživanjaV. Deskriptivna istraživanjaVI. Merenje stavova i dizajniranje upitnikaVII. Uzročna istraživanja: Izvođenje eksperimenataVIII. Izvlačenje uzoraka, vrste uzorakaIX. Analiza podataka (1)X. Analiza podataka (2)...
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
3
IX. Analiza podataka (1)
1. Osnove analize podataka2. Testiranje hipoteza3. Regresiona i korelaciona analiza
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
4
IX.1. Osnove analize podataka
• Priprema podataka za analizu• Tabeliranje podataka• Faktori koji utiču na izbor tehnike za analizu podataka• Pregled statističkih tehnika za analizu podataka
17/11/2017
2
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
5
Priprema podataka za analizu
• Editovanje podataka• Kodiranje podataka• Statističko prilagođavanje podataka
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
6
Editovanje podataka (1)• Sprovodi anketar ili supervizor na terenu ili
istraživač pre početka analize • Treba identifikovati sledeće probleme:
– Greške anketara (daje loša/pogrešna uputstva)– Nedostajući odgovori– Nejasni odgovori (nečitki ili nejasni)– Međusobna neusklađenost odgovora (npr.
kontradiktorni) – Nedovoljna kooperativnost (npr. bira isti odgovor)– Neodgovarajući ispitanik
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
7
Editovanje podataka (2)• Pošto se identifikuju, problemi se mogu rešiti
primenom sledećih postupaka:– Ponovno kontaktiranje ispitanika, ako se smatra
značajnim– Odbaciti ceo upitnik ako je neupotrebljiv, ako ispitanik
nije razumeo anketu ili je bio nekooperativan– Odbaciti pojedinačno problematično pitanje– Kodirati nejasne odgovore u kategoriju “ne znam” ili
“nemam mišljenje”
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
8
Kodiranje• Zatvorena pitanja
– Šta su zatvorena pitanja i kada se koriste? – Prednosti i nedostaci zatvorenih pitanja– Kodiranje zatvorenih pitanja
• Otvorena pitanja– Šta su otvorena pitanja i kada se koriste? – Prednosti i nedostaci otvorenih pitanja– Kodiranje otvorenih pitanja?
17/11/2017
3
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
9
Statističko prilagođavanje podataka
• Ponderisanje;
• Respecifikacija varijabli;
• Veštačke varijable; i
• Transformacija skale.
Ponderisanje• Procedura po kojoj se svakom odgovoru iz baze
podataka, dodeljuje određeni broj (ponder) u skladu sa prethodno utvrđenim pravilom
• Koristi se da se postigne reprezentativnost uzorka – reprezentativnost u odnosu na ono što se želi izmeriti
• Ili da se bolje izmeri određena karakteristika – npr. ponderisanje tržišnim učešćem
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
10
Respecifikacija varijabli
• Procedura po kojoj se postojeći podaci modifikuju kako bi se formirale nove varijable da bi se bolje realizovali ciljevi istraživanja, npr. – veliki broj varijabli se pregrupiše u manji broj– računanje odnosa dve varijable da bi se formulisala
nova varijabla,– izvlačenje kvadratnog korena i logaritamske
transformacije, – korišćenje veštačkih varijabli.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
11
Veštačke varijable• Nazivaju se još i instrumentalnim i kvalitativnim
varijablama• Respecifikacija kategorijske varijable• Ako postoji m nivoa kvalitativne varijable, koristi
se (m – 1) veštačka varijabla da se oni specifikuju – M-ta varijabla je definisana sa prethodnih m-1– Najlakše objasniti na dihotomnim (binarnim)
varijablama koje imaju samo dva nivoa.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
12
17/11/2017
4
Transformacija skale• Manipulacija sa vrednostima merne skale • Da se obezbedi uporedivost, npr.
– Standardizacija se može primeniti samo na podacima koji su dati na intervalnoj ili skali odnosa
– Od svake realizovane vrednosti se oduzme srednja vrednost i podeli sa standardnom devijacijom
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
13
( ) xii sXXz -=
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
14
Tabeliranje podataka
• Raspored frekvencija• Deskriptivni statistički pokazatelji• Unakrsno tabeliranje
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
15
Tabeliranje podataka• Koristi se za:
– “Čišćenje” podataka– Određivanje empirijske raspodele (raspodele
frekvencija)– Izračunavanje deskriptivnih statističkih pokazatelja
(srednje vrednosti i procentualno učešće)• Zatim se podaci unakrsno tabeliraju kako bi se
videlo da li postoji povezanost između dve tipično nominalne varijable.
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muški 80 70 30 20
Ženski 40 60 50 50
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
16
17/11/2017
5
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
17
Raspored frekvencija• Na kojoj skali moraju biti varijable?• Predstavlja broj dobijenih odgovora za svako
postavljeno pitanje• Može biti organizovano po klasama ili grupama
odgovora• Može se prikazati štapićastim dijagramom• Mogu se prekombinovati grupe/kategorije
pitanja, kako u zavisnosti od cilja istraživanja/vrste odgovora tako i frekvencije odgovora u pojedinim kateogrijama
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muški 80 70 30 20 200
Ženski 40 60 50 50 200
Uk. 120 130 80 70
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
18
Koliko često kupujete Politiku?
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
190 50 100
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom mesečno
Ni jednom mesečno
ŽenaMuškarac
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
20
Deskriptivni statistički pokazatelji
• Predstavljaju sumarnu informaciju dobijenu na osnovnu rasporeda frekvencija. Mogu biti:– Mere centralne tendencije (srednja vrednost,
medijana, modus),– Mere disperzije (interval varijacije, standardna
devijacija, koeficijent varijacije),– Mere oblika rasporeda (simetričnost i spljoštenost);
• Naravno, kod upotrebe nominalnih mernih skala može se koristiti samo raspored frekvencija.
17/11/2017
6
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
21
Čebiševljeva teorema• Određuje gde se vrednosti raspodele frekvencija nekog
pokazatelja nalaze u odnosu na njegovu srednju vrednost;• Bez obzira na raspored:
– Najmanje 75% vrednosti će biti unutar intervala ± 2 stand. devijacije,– Najmanje 89% vrednosti će biti u okviru ± 3 stand. devijacije,
u odnosu na srednju vrednost posmatranog parametra;• Ako je raspored simetrična kriva u obliku zvona, onda:
– Oko 68% vrednosti u populaciji će biti u okviru ± 1 standardna devijacija,– Oko 95% vrednosti će biti u okviru ± 2 standardne devijacije,– Oko 99% vrednosti će se nalaziti u okviru ± 3 standardne devijacije
u odnosu na srednju vrednost posmatranog parametra.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
22
Unakrsno tabeliranje• Tehnika koja služi za posmatranje odnosa između dve i
više nominalnih varijabli;• Kada se obračun vrši po redovima ili kolonama, tabele
sa unakrsnim tabeliranjem se nazivaju tabele kontingencije, budući da su procenti suštinski uslovljeni ukupnim sumama po redovima ili kolonama;
• Najveći broj marketinških istraživanja ne ide dalje od unakrsnog tabeliranja, a čak i ona istraživanja koja koriste sofisticiranije analitičke metode još uvek koriste unakrsno tabeliranje kao važnu komponentu.
Primer: Koliko često kupujete Politiku?
Pol:
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac 80 70 30 20
Žena 40 60 50 50
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
23
Primer: Koliko često kupujete Politiku?
Pol:
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muškarac
80 70 30 20 200
Žena 40 60 50 50 200
Uk. 120 130 80 70
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
24
17/11/2017
7
Koliko često kupujete Politiku?- Štapićasti dijagram -
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
250 50 100
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom mesečno
Ni jednom mesečno
ŽenaMuškarac
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
26
Faktori koji utiču na izbor tehnike za analizu podataka
• Vrsta podataka• Dizajn istraživanja• Pretpostavke na kojima se bazira
testiranje statističkih pokazatelja
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
27
Vrsta podataka• Podaci na nominalnoj skali (nemetrički):
– Frekvencije, jedina mera centralne tendencije je modus, hi-kvadrat test
• Podaci dati na ordinalnoj skali (nemetrički): – Percentili, kao i najveći broj neparametarskih testova (neki
put pogrešna primena parametarskih metoda)• Podaci dati na intervalnoj i na skali odnosa (metrički):
– Srednja vrednost (aritmetička sredina), mere disperzije, mere oblika raspodele, i širok izbor parametarskih i neparametarskih testova
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
28
Dizajn istraživanja (1)• Nezavisnost uzoraka, npr.:
X O1 ako se ne mere na istom skupu, koristi se O2 t-test za razliku dve srednje vrednosti; ALI
O1 X O2 ako su oba merenja na istom skupu onda se koristi t-test uparenih razlika.
• Broj grupa, npr.:X1 O1 postoje tri grupe i tri srednje vrednosti zaX2 O2 poređenje, ne može t-test za razliku srednjih
O3 vrednosti, već analiza varijanse
17/11/2017
8
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
29
Dizajn istraživanja (2)• Broj varijabli, npr.:
X O1 gde su ovo dva merenja različitih varijabli i O2, više se ne mogu koristiti univarijacione tehn.
• Kontrola nad uticajem varijabli
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
30
Pretpostavke na kojima se bazira testiranje statističkih pokazatelja
• Neophodno odlično poznavanje pretpostavki na kojima se pojedini testovi baziraju. Npr.:– Pretpostavke t-testa, na osnovu dva uzorka sa
istom s, su:1. Uzorci su nezavisni;2. Karakteristike koje nas zanimaju za svaku populaciju
imaju normalan raspored;3. Dve populacije imaju jednake varijanse.
t-test nije osetljiv na povredu pretpostavke o normalnom rasporedu, ali jeste na pretpostavku o jednakim varijansama.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
31
Pregled statističkih tehnika za analizu podataka
• Univarijacione i multivarijacione tehnike• Parametarske i neparametarske tehnike• Tehnike zavisnosti i međuzavisnosti
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
32
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
17/11/2017
9
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
33
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
34
Neparametarske tehnike analize podataka
- Hi-kvadrat- Kolmogorov-
Smirnov- RUNS
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- Hi-kvadrat- Suma rangova- Kolmogorov –
Smirnov- KW ANOVA
- Test znakova- Vilkoksov test- Meknimarov
test- Kokranov Q-
test
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
35
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
36
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
17/11/2017
10
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
37
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na vari-jablama
Fokus na predmetima posmatranja
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti