a Analiza Anketa Andrija Loncar

Embed Size (px)

Citation preview

Fakultet elektrotehnike i raunarstva Zagreb STATISTIKA ANALIZA ANKETA seminarski rad Andrija Lonar Predmet: Statistiko uenje Nastavnik: prof. dr. sc. Bojana Dalbelo Bai Smjer: Primijenjeno raunarstvo k. god. 2010 / 2011 Zagreb, kolovoz 2011. Statistiko uenje Statistika analiza anketa 2 Sadraj Uvod ........................................................................................................................................... 3 Dizajn anketa .............................................................................................................................. 4 Tipovi skala, Likertova skala ..................................................................................................... 6 Nominalna skala ................................................................................................................. 6 Ordinalna skala ................................................................................................................... 6 Intervalna skala .................................................................................................................. 6 Proporcijska skala .............................................................................................................. 7 Likertova skala ................................................................................................................... 7 Statistike veliine u analizi anketa ........................................................................................... 9 Mod .................................................................................................................................... 9 Medijan ............................................................................................................................... 9 Srednja vrijednost (aritmetika sredina) .......................................................................... 10 Standardna devijacija ....................................................................................................... 10 Ostale veliine bitne za statistiku analizu anketa ........................................................... 11 Grupiranje i napredne analitike metode ................................................................................. 12 Grupiranje pitanja u anketi ............................................................................................... 12 Grupiranje ispitanika ........................................................................................................ 12 Regresijska analiza ........................................................................................................... 12 Hi-kvadrat test .................................................................................................................. 14 Ostale statistike metode za naprednu analizu anketa ..................................................... 15 Primjer online sustava za dizajn anketa, anketiranje i analizu anketnih rezultata ................... 16 Zakljuak i rezultati .................................................................................................................. 20 Literatura .................................................................................................................................. 21 Statistiko uenje Statistika analiza anketa 3 Uvod Jedan od najee koritenih alata za istraivanje i prikupljanje statistikih podataka je anketa. Ankete se razlikuju po prirodi i sadraju no za openitu definiciju ankete moemo rei da se radi o skupu pitanja ili izjava na koje populacija ispitanika daje odgovore. Odgovori prikupljeni anketiranjem niza ispitanika se prikupljaju i analiziraju, te se iz analize izvlae zakljuci. Jedan od pionira koritenja anketa kao alata u istraivake svrhe je bio Sir Frances Galton koji ih je intenzivno koristio tijekom druge polovice 19-tog u svrhu prouavanja nasljednih osobina i utjecaja odgoja i okolia na ljude [1].Pristupi u dizajnu i namjeni anketa su mnogobrojni, a mnogobrojni su i naini izvoenja i prikupljanja rezultata kao i odabira ispitanika. Samim tim problematika analize anketa predstavlja vrlo iroko podruje.Neke od potekoa pri izradi i analizi anketa su neiskrenost i subjektivnost ispitanika te problemi sa ispravnim razumijevanjem pitanja. Ispravnost metodologije koritene u pojedinim anketama je esto predmet diskusija, a zakljuci dobiveni analizom provedenih anketa mogu biti pristrani. Ankete takoer mogu biti tako formulirane da je statistika analiza prikupljenih podataka nemogua, te se analiza obavlja na nivou ispitanika. Statistiki alati koriteni u analizi anketa su obino neke od osnovnih statistikih vrijednosti poput srednje vrijednosti, moda, medijana, standardne devijacije i sl., no znaaj pojedine statistike uvelike ovisi o tipu pitanja i setu ponuenih vrijednosti. Prilikom analize dobivenih podataka nerijetko se koriste regresijske metode kojima ustanovljavamo stupanj korelacije izmeu podataka prikupljenih u anketi. Statistiko uenje Statistika analiza anketa 4 Dizajn anketa Prilikom oblikovanja ankete mora se obratiti panja na cijeli niz parametara, posebno u sluaju da se podaci dobiveni anketom trebaju statistiki obraivati. Iz toga je razloga potrebno odabrati pogodan oblik pitanja i ponuenih odgovora. Ispitaniku se moe ponuditi ogranien set odgovora (closed-ended) ili mu dozvoliti slobodu vlastitog formuliranja odgovora (open-ended). Za statistiku analizu se uglavnom koriste pitanja sa predefiniranim odgovorima, te meu njima razlikujemo [1]: -Dihotomne u kojima su ponuene samo dvije opcije -Nominalne politomne u kojima je ponueno vie meusobno neureenih opcija -Ordinalne politomne u kojima je ponueno vie meusobno ureenih opcija -Intervalne politomne u kojima je ponueno vie opcija sa pridruenom vrijednou -Kontinuirane u kojima je ponuen kontinuirani niz opcija Ovisno o pristupu, u ordinalne politomne ili intervalne politomne izjave odnosno pitanja spada i Likertova skala u kojoj ispitanik na odreenu izjavu treba odgovoriti odabirom izjave o slaganju ili neslaganju iz predefiniranog ordinalnog seta odgovora. Prilikom konstruiranja ankete treba paziti da grupe pitanja tvore logike cjeline, da unutar cjeline pitanja idu od openitijih do specifinijih i od objektivnih do subjektivnih. Kao ope pravilo, treba koristiti jasne i jednostavne forme pitanja razumljive svim ispitanicima, a pitanja trebaju biti konstruirana tako da kod ljudi sa razliitim stavovima ili karakteristikama rezultiraju razliitim odgovorima. Postoji vei broj naina za provoenje ankete: -Provoenje ankete osobno je metoda koja ima vrlo visoku cijenu te se odvija relativno sporo, a nazonost ispitivaa moe utjecati na iskrenost ispitanika. S druge strane postotak odgovorenih pitanja je obino visok kod ove metode. -Potanska anketa je relativno povoljna cijenom, te prua visok stupanj anonimnosti ispitanika, no s druge strane zahtjeva dosta vremena za provoenje. -Telefonsko anketiranje je vrlo esto koritena metoda u kojoj ispitiva postavlja pitanja ispitaniku putem telefona. Metoda relativno brzo daje rezultate, a ispitiva moe pojasniti pitanja ispitaniku ako ima nekih nejasnoa. Negativna strana je slab Statistiko uenje Statistika analiza anketa 5 stupanj anonimnosti ispitanika i samim time esti neiskreni odgovori kod osjetljivih tema. -Provoenje ankete elektronikim putem je novija metoda koja nudi cijeli niz pogodnosti u odnosu na ostale formate. Kao negativnu karakteristiku obino se izdvaja injenica da cijela ciljana populacija ne moe biti dobro obuhvaena anketom zbog tehnike neobrazovanosti ili nedostupnosti raunala. S druge strane elektronike odnosno raunalne metode za provoenje ankete daju vrlo brze rezultate uz niske trokove provoenja i statistike analize podataka. Ispunjavanje je obino brzo i lagano a stupanj anonimnosti moe biti vrlo visok. Pitanja mogu sadravati pojanjenja a odgovori se mogu lako ograniiti na ponuene. Iako sve navedene metode imaju prednosti i mane, za mnoga podruja se raunalne ankete pokazuju kao najbolja platforma. Najee koritena forma raunalno provoene ankete je web anketa. Web anketa je web aplikacija koja se obino sastoji od klijentskog dijela koji kombinacijom HTML-a i drugih klijentskih tehnologija prua vizualni prikaz i interakciju s anketom dok se odgovori klijenta pohranjuju u bazu podataka smjetenu na udaljenom posluitelju. Sa strane ispitanika je za obavljanje web ankete potreban samo web preglednik i veza prema Internetu. Prilikom izvoenja ankete ispitanici trebaju imati dovoljno vremena da proitaju i razumiju sva pitanja. Nadalje, njihovi odgovori trebaju biti dobrovoljni a okoli u kojem ispunjavaju anketu treba biti oputen i ulijevati povjerenje. Loe tretiranje ispitanika e u pravilu rezultirati neobjektivnim rezultatima. Ispitanici moraju imati povjerenja u anonimnost vlastitih podataka da bi iskreno odgovorili na pitanja. Pretpostavka za statistiku obradu podataka prikupljenih kroz anketu je da se radi sa pitanjima koja koriste predefinirani set odgovora (closed-ended). Ukoliko elimo raditi naprednije statistike analize nad grupama pitanja vezanim za jednu cjelinu potrebno je rabiti pitanja sa odgovorima koji koriste ordinalnu skalu. Tada se odgovor ispitanika pretvara u numeriku vrijednost pogodnu za statistiku obradu Statistiko uenje Statistika analiza anketa 6 Tipovi skala, Likertova skala Mjerne skale se razlikuju po tipu te se za razliite skale mogu koristi samo odreeni tipovi statistikih veliina. Prema psihologu Stanleyu Smithu Stevensu postoje sljedei tipovi skala i njima pridruene statistike veliine [2]: Nominalna skala Nominalna odnosno kategorijska skala svrstava podatke u grupe koje se ne mogu kvantitativno usporeivati. Mada se pojedinom tipu za potrebe obrade podataka moe pridruiti podatak u obliku broja, agregirani podaci se sa statistike strane mogu predstaviti samo sa statistikom veliinom moda odnosno dominantnog tipa u skupu podataka. Podaci poput srednje vrijednosti ili medijana su besmisleni za podatke predstavljene u ovoj skali. Ordinalna skala Ordinalna skala opisuje poredak podataka. Dakle, ordinalna skala dijeli vrijednosti u grupe za koje imamo podatke o meusobnom odnosu grupa ali ne i kvantificirane podatke o odnosu veliina, odnosno stupnju razlike izmeu grupa. Ordinalni podaci se statistiki mogu prikazati putem veliina poput moda, medijana ili percentila, no poto nemamo informaciju o stupnju razliitosti izmeu susjednih elemenata na skali veliine poput srednje vrijednosti ili standardne devijacije nemaju smisla za ovaj tip skale. Podatke se bez utjecaja na njihov poredak moe mijenjati bilo kojom monotonom funkcijom. Veina psihometriskih podataka se predstavlja ordinalnim skalama. Intervalna skalaIntervalna skala predstavlja podatke koji su mjerljivi te se njihov meusobni odnos moe kvantificirati. Intervalna skala ukazuje na konstantnu i mjerljivu veliinu intervala no ne i na odnos izmeu pridruene vrijednosti na skali i apsolutne vrijednosti mjerene veliine. Intervalna skala je pogodnija za statistiku obradu od ordinalne jer se veliine popust aritmetike srednje vrijednosti ili standardne devijacije mogu raunati za podatke smjetene na intervalnoj skali. S druge strane usporedba omjera vrijednosti na intervalnoj skali nema smisla jer nemamo podatak o izvorinoj vrijednosti. Ukoliko bi za primjer uzeli Celsiusovu skalu za temperature koja je intervalna lako je dokazati da je besmislena tvrdnja da je temperatura od 20 stupnjeva Celsiusa dvostruko vea od temperature od 10 stupnjeva Statistiko uenje Statistika analiza anketa 7 Celsiusa. Mnoge se psihometrijske veliine koje su formalno ordinalne obrauju kao intervalne s pretpostavkom da su podaci na ordinalnoj skali uglavnom sloeni u jednakim intervalima. Takav pristup ponekad rezultira sa krivo kvantificiranim zakljucima dobivenim kroz statistiku analizu. Proporcijska skala Proporcijska skala je skala koja podatke kvantificira prema njihovoj apsolutnoj vrijednosti. Podaci su predstavljeni omjerom veliine mjerenog podatka i jedinice mjere, a glavna razlika u odnosu na intervalnu skalu je stvarna a ne proizvoljna nulta vrijednost. Svaka vrijednost predstavljena na proporcijskoj skali se moe prikazati kao omjer druge vrijednosti na istoj skali i skalara. Veina statistikih veliina se moe izraunati za podatke predstavljene proporcijskom skalom, no psihometrijske vrijednosti bitne za analizu anketa rijetko moemo stavljati na tu skalu. Likertova skalaLikertova skala nazvana po izumitelju, psihologu Rensisu Likertu, je psihometrijska skala koja se vrlo esto koristi u anketama i upitnicima. Pitanja su u sluaju Likertove skale postavljena u obliku izjava a ispitanik treba ocijeniti svoje slaganje odnosno neslaganje s navedenom izjavom koristei simetrinu skalu. Skala ocrtava smjer i intenzitet osjeaja ispitanika prema ponuenoj izjavi.Skala obino kree od "uope se ne slaem" a zavrava sa "potpuno se slaem". Broj ponuenih odgovora je obino izmeu 5 i 9 pri emu su prema provedenim istraivanjima skale sa manjim brojem ponuenih odgovora rezultirale sa neto viim srednjim rezultatima [2]. Tipini set ponuenih odgovora u Likertovoj skali bi bio "uope se ne slaem", "ne slaem se", "nemam stav", "slaem se", "potpuno se slaem". Pri tome je srednja vrijednost na skali neutralna u odnosu na postavljenu izjavu. Ukoliko se eli ukloniti opcija ispitanika da ne zauzima stav o odreenoj izjavi koristi se skala sa parnim brojem odgovora. Kao i kod svake druge metode valoriziranja u anketama pojavljuju se odreeni problemi. Primjerice, ispitanici mogu izbjegavati koritenje ekstremnih vrijednosti ili davati suglasne odgovore zbog potvrdnog oblika izjava. Likertova skala je u osnovi ordinalna skala poto se slaganje ili neslaganje ne moe predstaviti kao jedan kontinuirani fenomen a ponuene razine se ne mogu jednostavno Statistiko uenje Statistika analiza anketa 8 proglasiti ekvidistantnima. Pa ipak, za potrebe analize se esto podaci prikupljeni uz pomo upitnika koji koriste Likertovu skalu interpretiraju kao intervalno skalirani podaci. Opravdanje za takav pristup je ponovno pretpostavka da je relativna distanca izmeu toaka na skali priblino jednaka te da je osjeaj neslaganja slaganja dovoljno slian osjeaju slaganja samo suprotnog polariteta. Interpretiranjem podataka prikupljenih uz pomo upitnika koji koriste Likertovu skalu kao intervalnih dobivamo mogunost za analizu nekih korisnih statistikih veliina. Tako moemo govoriti o srednjoj vrijednosti podataka koja moe biti korisna za donoenje odluka ili o standardnoj devijaciji koja e ukazati na koliinu razilaenja miljenja ispitanika. Ispitna pitanja koja koriste Likertovu skalu se esto grupiraju u tematske cjeline. Analiziranjem dobivenih podataka po grupama moemo dobiti korisne informacije o tome kako populacija ispitanika reagira na pojedine teme. Nadalje, grupiranjem pitanja i analizom po temama se mogu stvoriti i stavovi o meusobnim odnosima izmeu pojedinih tema to moe biti osobito korisno. Grupiranjem tema i analizom po grupama se smanjuje mogunost da nekemanje bitne informacije koje prilikom analize pokazuju znaajna odstupanja odvuku panju sa vanijih informacija. Statistike analize poput analize varijance se tada mogu izvoditi uz pretpostavku linearnosti modela. Da bi se pitanja odnosno izjave mogle grupirati potrebno ih je postavljati sa istim, pozitivnim predznakom, te se potrebno potruditi da budu logiki ispravno grupirani, da se tematske cjeline to manje preklapaju te da je broj pitanja po tematskoj cjelini dovoljan za grupnu analizu. Ovaj rad e se primarno baviti anketama i analizom anketa koje koriste Likertovu skalu. Razlog za to je injenica da se radi o jednoj od najpopularnijih skala koritenih u psihometrijskim ispitivanjima kao i to to su ankete koje koriste Likertovu skalu pogodnije za statistiku analizu od drugih vrsta anketa. Statistiko uenje Statistika analiza anketa 9 Statistike veliine u analizi anketa Kao to je ranije spomenuto, u analizi anketa moemo raditi sa nizom statistikih veliina no bitno je da se podaci ispravno smjeste u odgovarajuu skalu, te da se izraunavaju samo statistike veliine koje imaju smisla za koritenu skalu. ModMod je statistika veliina koja daje podatak o tome koji se element najee pojavljuje u nekoj populaciji [3]. Da bi neki element bio mod mora se pojaviti barem jedan put. Anketa koja se koristi nominalnom skalom nema drugih bitnih statistika osim moda naime u skupu nominalnih podataka moemo samo ustanoviti koji se podatak najee pojavljuje te podatke predstaviti npr. stupastim grafom sa postotnim udjelima pojedinih odgovora. Mod moemo koristiti za sve vrste anketnih upitnika osim za odgovore koji korisnici slobodno formiraju (open ended). Primjer anketnih podataka kod kojeg je mod bitna statistika bi mogle biti predizborne ankete kod kojih e se s modom rezultata upitnika predvidjeti pobjednika izbora. Medijan Medijan je pojam koji odreuje sredinu distribucije. Medijan ima smisla za bilo koje podatke prikupljene koritenjem ankete sa ordinalnom skalom [3]. Zovemo ga jo i 50-tim percentilom jer je 50% vrijednosti u skupu podataka iznad a 50% ispod njega. Za izraunavanje medijana u nekom skupu podataka potrebno je prvo sortirati podatke po veliini a zatim odabrati sredinji element kao medijan. Ukoliko je broj podataka paran kao medijan se uzima prosjena vrijednost dva sredinja elementa. { Za skup od n ordinalnih podataka Y kod kog vrijedi: Tada je medijan definiran kao: 1 2 1 n nY Y Y Y<