19
Deskriptivna statistika: Sređivanje i grafičko prikazivanje podataka, statistički pokazatelji i parametri 1.Uvod Statistika je mlada matematička disciplina koja se bavi sakupljanjem, tabelarnim i grafičkim predstavljanjem podataka te izvođenjem zaključaka nakon njihove analize. Tokom poslednjih četrdesetak godina analiza statističkih podataka je postala veoma popularna. Veća dostupnost kompjutera i statističkih softverskih paketa dodatno je povećala ulogu statistike u empirijskim istraživanjima. Ona se zbog toga koristi za istraživanja u gotovo svim oblastima, od medicine do sporta. Danasse na skoro svim fakultetima u svetu podrazumeva da studenti imaju bar jedan predmet iz statistike. Gotovo svi dnevni listovi i časopisi sadrže grafikone i članke o statističkim istraživanjima. Reč statistika ima dva značenja. U svakodnevnom životu reč statistika se odnosi na numeričke podatke. Primeri takvih numeričkih podataka su prihod porodice, starost studenta, procenatdodavanja koja je ostvario kvorterbek nekog fudbalskog tima1 i početna plata pripravnika sa univerzitetskom diplomom. Drugo značenje reči statistika odnosi se na statistiku kao naučnu disciplinu. U tom smislu, reč statistika definiše se na sledeći način: Statistika je naučni metod koji se koristi za prikupljanje, prikazivanje, analizu i interpretaciju podataka i donošenje statističkih zaključaka. Svakog dana smo u prilici da donosimo odluke koje mogu biti lične, poslovne ili neke druge. Sve te odluke se obično donose u uslovima neizvesnosti. Veoma često, za probleme sa kojima se suočavamo u stvarnosti ne postoji dovoljno precizno ili konačno rešenje. Statističke metode nam pomažu da u takvim situacijama donosimo stručne i ispravne odluke. Odluke donete na osnovu statističkih metoda nazivaju se procenama i prognozama. Odluke koje se donose bez korišćenja statističkih (ili naučnih) metoda predstavljaju 1

statistika

Embed Size (px)

DESCRIPTION

Matematika

Citation preview

Deskriptivna statistika: Sreivanje i grafiko prikazivanje podataka, statistiki pokazatelji i parametri

1. UvodStatistika je mlada matematika disciplina koja se bavi sakupljanjem, tabelarnim i grafikim predstavljanjem podataka te izvoenjem zakljuaka nakon njihove analize. Tokom poslednjih etrdesetak godina analiza statistikih podataka je postala veoma popularna. Vea dostupnost kompjutera i statistikih softverskih paketa dodatno je poveala ulogu statistike u empirijskim istraivanjima. Ona se zbog toga koristi za istraivanja u gotovo svim oblastima, od medicine do sporta. Danasse na skoro svim fakultetima u svetu podrazumeva da studenti imaju bar jedan predmet iz statistike. Gotovo svi dnevni listovi i asopisi sadre grafikone i lanke o statistikim istraivanjima.

Re statistika ima dva znaenja. U svakodnevnom ivotu re statistika se odnosi na numerikepodatke. Primeri takvih numerikih podataka su prihod porodice, starost studenta, procenatdodavanja koja je ostvario kvorterbek nekog fudbalskog tima1i poetna plata pripravnika sa univerzitetskom diplomom.

Drugo znaenje reistatistika odnosi se na statistiku kao naunu disciplinu. U tom smislu, restatistika definie se na sledei nain: Statistika je nauni metod koji se koristi za prikupljanje, prikazivanje, analizu i interpretaciju podataka i donoenje statistikih zakljuaka.

Svakog dana smo u prilici da donosimo odluke koje mogu biti line, poslovne ili neke druge. Sve te odluke se obino donose u uslovima neizvesnosti. Veoma esto, za probleme sa kojima se suoavamo u stvarnosti ne postoji dovoljno precizno ili konano reenje. Statistike metode nam pomau da u takvim situacijama donosimo strune i ispravne odluke. Odluke donete na osnovu statistikih metoda nazivaju seprocenama i prognozama.Odluke koje se donosebez korienja statistikih (ili naunih) metoda predstavljajuisto nagaanje i stoga su nepouzdane.

Kao i veina naunih disciplina, statistika ima dva aspekta: teorijski i primenjeni.Teorijska ili matematika statistikabavi se razvojem, izvoenjem i dokazivanjem statistikih teorema, formula, pravila i zakona.Primenjena statistikapodrazumeva primenu tih teorema, formula,pravila i zakona u reavanju realnih problema.

Primenjena Statistika se dijeli na deskriptivnu, bavi se sakupljanjem, obradom i tabelarnim i grafikim prikazivanjem podataka i induktivnu (na engleskom jeziku inference statistics), bavi se izvoenjem zakljuaka nakon analize prikupljenih podataka. Deskriptivna statistika je zaokruena oblast i njeno razumijevanje zahtjeva samo elementarno matematiko znanje. Induktivna statistika je aktuelna, popularna i primjenjiva matematika disciplina. Bavljenje induktivnom statistikom zahtjeva odlino znanje matematike, prije svega vjerovatnoe.

2.Sreivanje i grafiko prikazivanje podataka2.1. Raspodela frekvencijaSreivanjem podataka dobijaju se statistike serije koje se po nainu formiranja i analiziranja dele na strukturne i vremenske serije.

Serije struktura raspodele statistikog skupa po vrednostima obeleja sastoji se iz dva reda obavetenja: modaliteta i frekvencije (broja jedinica). U zavisnosti od vrste obeleja postoje serije strukture sa nominalnim (kvalitativnim) i sa numerikim (kvantitativnim) obelejem. Modaliteti atributivnih obeleja se iskazuju opisno i za njihovo grupisanje potrebno je imati jasnu emu kvalifikacije formiranu po kriterijumu koji odgovara prirodi samog obelejaVrsta sadnicaBroj

Bor140

Jela80

modaliteti

frekvencije

Kvantitativno obeleje:

Broj lanova domainstva:

Broj smena u preduzeima:

moe se prikazati raspodelom relativnih frekvencija koja se dobija tako to se za svaku moguu vrednost obeleja H utvrdi koliko elemenata statistikog skupa uzima tu vrednost.

H)Apsolutne frekvencije (f)

N

Gradiranje brojanih verdnosti obeleja se razlikuje u zavisnosti od toga da li je obeleje:

Prekidno (diskontinualno) = grupiu se po veliini (od nie ka vioj vrednosti)

Neprekidno (kontinualno) = H uzima vrednost iz konanog ili beskonanog intervala (a, b); taj interval se deli na podintervale (a, a1), , (ak, b) koji se zovu grupni intervali (koji ne moraju biti jednaki).Grupni intervaliApsolutne frekvencije (f)

N

Odreivanje grupnih intervala (broja i veliine) esto se vri uz pomo Sturgess-ovog pravila:

Veliina intervala: gde je N broj podataka Broj intervala:

Ako treba podeliti H na dva ili vie statistikih skupova, onda apsolutne frekvencije moraju da se pretvore u relativne brojeve i to uz pomo raspodele relativnih frekvencija. .H)Apsolutne frekvencije (f)Relativne frekvencije (r)Procentualne relativne frekvencije (r) (%)Kumulativne apsolutne frekvencije (S)Kumulativne relativne frekvencije (F)

N1,00100,00

Relativne frekvencije su brojevi koji zadovoljavaju sledea dva uslova:

Kumulativna frekvencija i-tog grupnog intervala se dobija kada se sve frekvencije za prethodne intervale saberu kada se podele sa brojem elemenata statistikog skupa .

2.2. Grafiko prikazivanje raspodela frekvencijaObavlja se uz pomo grafikona koji se konstruiu tako to se na horizontalnoij osi nanosi vrednost obeleja H (H=prekidno) ili granice grupnih intervala (H=neprekidno). Kod grafikona apsolutnih frekvencija na Y osi se nanose vrednosti odgovarajuih frekvencija za grupni interval ili H, i konsturiu se pravougaonici iznad grupnih intervala sa visinama jednakim frekvencijama; kada se spoje take na srednama grupnih intervala dobija se poligon apsolutnih frekvencija.

Kod relativnih frekvencija koriste se histogrami: na H osi su sredine grupnih intervala, a zatim se oko tih taaka vri konstruisanje pravougaonika ije e povrine biti jednake vrednostima relativnih frekvencija. Primer:

Ako je duina i-tog intervala:

Visina pravougaonika iznad take: treba da je: r je odgovarajua relativna frekvencija

Histogram relativnih frekvencija (na slici=>)

Histogram je veoma pogodan za poreenje raspodela frekvencija:

Raspodela H na dva skupa Kumulativne frekvencije

Na osnovu histograma koji odgovara raspodeli relativnih frekvencija neprekidnog obeleja H, moe se izabrati kriva linija koja e aproksimirati posmatranu raspodelu frekvencija. Ta linija se zove zakon verovatnoe ili funkcija gustine i predstavlja granini oblik histograma ako se broj elemenata u statistikom skupu neogranieno poveava, a duine intervala, na osnovu kojih pravimo histogram, neograneno se smanjuju.

3. Statistiki pokazatelji i parametri za analizu3.1. Srednje vrednosti obelejaZa dublju analizu nisu dovoljni relativni brojevi i raspodela frekvencije, vee se utvruju izvesni pokazatelji i parametri, ije utvrivanje omoguava donoenje zakljuaka o odreenoj pojavi ili procesu. Prva grupa tih parametara su srednje vrednosti (proseci):

Poeljne osobine srednjih vrednosti su:

- Ako su sve vrednosti obeleja H jednake i njihova srednja vrednost treba da je tolika- Ako postoje minimalna i maksimalna vrednost H onda je srednja vrednost vea od minimuma i manja od maksimuma- Srednja vrednost treba da zavisi od svih vrednosti H na celom statistikom skupu- Aritmetika sredina niza brojeva je broj koji se dobije kad se njihov zbir podeli sa ukupnim brojem lanova tog niza.

Najee se koristi, metod izraunavanja je isti za negrupisane i grupisane podatke:

Ako su utvreni

Ako je h prekidnog tipa, sa frekvencijama :

Ako je h neprekidnog tipa, sa frekvencijama :

Osim ako se prvi i poslednji grupni interval znatno razlikuju po duini od ostalih (ili ako je neki od njih beskonaan), tada je:

, gde je prosena duina preostalih intervala.

Iz raspodele relativnih frekvencija .

Pored univerzalnih (koji se mogu pokazati) aritmetika sredina ima jo neke osobine koje omoguavaju njeno lake odreivanje:

1) Zbir odstupanja vrednosti obeleja H na posmatranom skupu od njihove aritmetike sredine je jednako nuli:

2) Zbir kvadrata odstupanja vrednosti obeleja H na elementima statistikog skupa od bilo kog broja a je najmanji ako je :

minimum za

3) Ako izmeu H i Y postoji linearna zavisnost, ista takva zavisnost postoji izmeu njihovih aritmetikih sredina:

4) Pretpostavka: statistiki skup 1: ; statistiki skup 2: ; tada je aritmetika sredina za oba skupa zajedno jednaka ponderisanoj aritmetikoj sredini:

5) Posmatra se S statistikih skupova sa elemenata i aritmetikih sredinarespektivno. Tada je aritmetika sredina obeleja H na svim skupovima zajedno jednaka ponderisanoj aritmetikoj sredini:

esto se statistiki skupovi sastoje iz stratuma, tj. podskupova koji se meusobno iskljuuju, a zajedno ine ceo skup. Statistiki podaci se prikupljaju i obrauju po stratumima => analiza celog skupa, to je nekad nemogue.- Geometrijska sredina (najpogodnija u analizama vremenskih serija) niza brojeva je N-ti koren iz proizvoda njegovih lanova. Neka su vrednosti posmatranog obeleja H na elementima statistikog skupa. Geometrijska sredina je jednaka:

Kada je H dato raspodelom frekvencija :

Upotreba geometrijske sredine je mogua samo za pozitivna obeleja.

Logaritmovanjem se dobija:

Za relativne frekvencije se dobija:

Sve osobine aritmetike poseduje i geometrijska sredina.- Harmonijska sredina niza brojeva je reciprona vrednost aritmetike sredine recipronih vrednosti lanova tog niza.

Ako su vrednosti obeleja H na N elemenata statistikog skupa, tada je harmonijska sredina: .

Kada je H dato raspodelom frekvencija:

Preko relativnih frekvencija:

Cauchy-jeva teorema:

3.2. Indeksi, stope promeneSlue za najjednostavniju analizu vremenskih serija (praenje dinamikih kretanja pojava).

- Indeks je broj koji predstavlja kolinik vrednosti posmatranog obeleja H u trenutku t (Xt) i vrednosti tog obeleja u nekom drugom trenutku .

Postoje dve vrste indeksa: bazni i lanani indeks.

- Lanani indeksi su kolinici vrednosti obeleja H u trenutku t (Xt) i njegove vrednosti u prethodnom trenutku merenja t1 (Xt-1). Za lanani indeksi su:

najeeZa vremensku seriju od T podataka, dobija se (T1) lanani indeks jer se prvi podatak u seriji ne moe porediti sa prethodnim.

Ako od procentualno izraenog indeksa u trenutku t oduzmemo 100, dobiemo procentualno izraenu promenu obeleja H od momenta (t1), do momenta t koji nazivamo stopa promene.

Grafiki prikaz lananih indeksa

- Bazni indeksi slue za iskazivanje promene posmatranog obeleja u vremenskoj seriji u odnosu na jedan trenutak merenja sa kojim elimo da poredimo ostale promene:

U statistikoj analizi se esto koristi prosena stopa promene:

3.3. Odreivanje i interpretacija modusa i medijane obeleja- Modus je ona vrednost obeleja H koja ima najveu frekvenciju u posmatranom statistikom skupu ili ona vrednost u ijoj se okolini najee pojavljuju izmerene vrednosti H na statistikom skupu.

To je jedina srednja vrednost koja se moe koristiti za kvalitativna obeleja i predstavlja dobar pokazatelj za homogene statistike skupove.

Kada je H grupisano i dato raspodelom frekvencija, za modus se uzima sredina grupnog intervala sa najveom frekvencijom.- Medijana je ona vrednost obeleja H koja deli statistiki skup na dva jednaka dela.

Ako su

Za obeleje koje je grupisano i dato raspodelom frekvencija, medijanu odreujemo tako to prvo odredimo grupni interval u kome se nalazi , a zatim po dogovoru biramo jednu vrednost iz tog intervala.

Ako je H dato raspodelom: H

(f)f1f2fk

Prvo se odreuje indeks S za koji e biti zadovoljeno: .

Za medijanu se uzima vrednost H u intervalu na sledei nain:

3.4. Mera varijabiliteta obelejaUkazuje na dve innjenice: njihov iznos govori koliko su srednje vrednosti obeleja H dobri predstavnici svih njihovih vrednosti na posmatranom skupu i treba da pokau koliko se svi elementi na posmatranom skupu meusobno razlikuju u odnosu na dato obeleje H. Tj: to je varijansa manja to je srednja vrednost bolji predstavnik, i obrnuto.

- Razmak varijacije je razmak izmeu najvee i najmanje vrednosti H na posmatranom statistikom skupu:

Kada je obeleje H grupisano i dato raspodelom frekvencija , da bismo odredili R, moramo znati i . Ima najveu primenu u kontroli kvaliteta i industrijskoj proizvodnji.

- Kvartilna devijacija sklui ziskljuenje odreenog procenta elemenata statistikog skupa. Odreena je izrazom:

gornji kvartil je ona vrednost obeleja H za koju 75% elemenata stati-stikog skupa ima vrednost H manju od (25% elemenata ima H vee od )

donji kvartil je ona vrednost obeleja H za koju 25% elemenata statistikog skupa ima vrednost manju od .

Raunaju se slino kao medijana:

- Srednja devijacija (zavisi od svih vrednosti H) je aritmetika sredina apsolutnih vrednosti odstupanja od njegove aristmetike sredine na posmatranom statistikom skupu:

su obeleja, je aritmetika sredina:

Za grupisane podatke date raspodelom frekvencija:

Relativne frekvencije:

- Varijansa i standardna devijacija. Standardna devijacija je pozitivna vrednost korena varijanse. Varijansa je aritmetika sredina kvadrata odsupanja vrednosti obeleja H od njegove aritmetike sredine:

su obeleja, je aritmetika sredina:

,:

Relativne frekvencije:

- Koeficijent varijacije je procentualno izraen odnos standardne devijacije i aritmetike sredine obeleja H:

3.5. Osobine varijanse obeleja- Varijansa obeleja H je jednaka nuli, ako i samo ako je H konstantno na svim elementima statistikog skupa, tj:

- Varijansa obeleja H se moe izraziti formulom:

, tj. kada je H grupisano- Neka obeleje H ima varijansu a Y i ako postoji linearna veza tada je:

- Pretpostavimo da jedan statistiki podskup ima element, sa aritmetikom sredinom i varijansom a drugi tada je varijansa statistikog skupa:

- Uopteno (4); statistiki skup od k podskupova , tada je:

gde je: veliina statistikog skupa, a njegova aritmetika sredina.

3.6. Momenti statistikog obelejaObian momenat k-tog reda statistikog obeleja H predstavlja matematiko oekivanje k-tog stepena tog statistikog obeleja:

Ako je H prekidno:

Ako je H neprekidno:

Specijalno:

Centralni momenat k-tog reda statistikog obeleja H je oekivana vrednost k-tog stepena razlike statistikog obeleja H i oekivane vrednosti m:

Ako je H prekidno:

Ako je H neprekidno:

Specijalno:

Centralni momenti se lake odreuju preko obinih momenata: ako k-ti stepen razlike (Hm) razvijemo preko binomnog obrasca dobiemo:

, pa zbog osobie oekivane vrednosti:

Spacijalno: .

3.7. Pearson-ovi koeficijenti obeleja, Koeficijent spljotenosti obelejaKoeficijent asimetrije, za merenje asimetrinosti raspodele H slui parametar baziran na i : .

Za simetrine raspodele , asimetrine u levo za , u desno za .

Mada je jednostavan, vie se koristi Pearson-ov koeficijent:

Prvi Pearson-ov koeficijent je definisan preko kolinika , gde je trei centralni momenat.

,:

Relativne frekvencije:

raspodela H je simetrina (i obrnuto).

raspodela H asimetrina u levu stranu.

raspodela H asimetrina u desnu stranu.Koeficijent spljotenosti slui kao mera spljotenosti jedne raspodele i definie se na osnovu tzv. etvrtog centralnog momenta.

Drugi Pearson-ov koeficijent je kolinik

,:

Relativne frekvencije:

obeleje H ima normalnu spljotenost (i obrnuto).

obeleje H ima spljotenost veu od normalne.

obeleje H ima spljotenost manju od normalne.

Moe se koristiti i koeficijent koji ima normalnu spljotenost u 0.

Literatura:

- Dr. Stevan M. Stojanovi, Matematika statistika, Nauna knjiga, Beograd, 1980.- Dr. Blai M., Opta statistika, Savremena administracija, Beograd, 1986.- Dr. Biljana Popovi, Matematika statistika i statistiko modelovanje, Sven, Ni, 2003.- V. Vrani: Vjerojatnost i statistika, Tehnika knjiga, Zagreb, 1971.- I. Pavli: Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1970.Sadraj: 1.Uvod.......................................................................................................................1 2. Sreivanje i grafiko prikazivanje podataka..........................................................2 2.1. Raspodela frekvencija..........................................................................................2 2.2 Grafiko prikazivanje raspodela frekvencija ........................................................4 3 Statistiki pokazatelji i parametri za analizu............................................................5 3.1 .Srednje vrednosti obeleja..................................................................................5 3.2. Indeksi, stope promene.......................................................................................8 3.3. Odreivanje i interpretacija modusa i medijane obeleja....................................9 3.4. Mera varijabiliteta obeleja..................................................................................9 3.5. Osobine varijanse obeleja................................................................................11 3.6. Momenti statistikog obeleja............................................................................11 3.7. Pearson-ovi koeficijenti obeleja, Koeficijent spljotenosti obeleja..................12 Literatura...................................................................................................................14

1

_1227546917.unknown

_1227550972.unknown

_1227552346.unknown

_1227572241.unknown

_1227572827.unknown

_1227573128.unknown

_1227879701.unknown

_1232027923.unknown

_1232275158.unknown

_1232275197.unknown

_1396351847.unknown

_1232275186.unknown

_1232274663.unknown

_1232275141.unknown

_1228185364.unknown

_1227573322.unknown

_1227573331.unknown

_1227573338.unknown

_1227573140.unknown

_1227573288.unknown

_1227572953.unknown

_1227573068.unknown

_1227573100.unknown

_1227573046.unknown

_1227572869.unknown

_1227572916.unknown

_1227572838.unknown

_1227572402.unknown

_1227572605.unknown

_1227572782.unknown

_1227572421.unknown

_1227572364.unknown

_1227572373.unknown

_1227572277.unknown

_1227553597.unknown

_1227554247.unknown

_1227554376.unknown

_1227554628.unknown

_1227554353.unknown

_1227554058.unknown

_1227554117.unknown

_1227553936.unknown

_1227552772.unknown

_1227553452.unknown

_1227553555.unknown

_1227552823.unknown

_1227552617.unknown

_1227552691.unknown

_1227552519.unknown

_1227552402.unknown

_1227551752.unknown

_1227552043.unknown

_1227552102.unknown

_1227552173.unknown

_1227552183.unknown

_1227552257.unknown

_1227552162.unknown

_1227552074.unknown

_1227551942.unknown

_1227551973.unknown

_1227551913.unknown

_1227551452.unknown

_1227551543.unknown

_1227551560.unknown

_1227551094.unknown

_1227551318.unknown

_1227551427.unknown

_1227551214.unknown

_1227551080.unknown

_1227548387.unknown

_1227549563.unknown

_1227550791.unknown

_1227550845.unknown

_1227550864.unknown

_1227550941.unknown

_1227550832.unknown

_1227550672.unknown

_1227550686.unknown

_1227550619.unknown

_1227549346.unknown

_1227549449.unknown

_1227549468.unknown

_1227549428.unknown

_1227548761.unknown

_1227548852.unknown

_1227548648.unknown

_1227547333.unknown

_1227547897.unknown

_1227547923.unknown

_1227547963.unknown

_1227547909.unknown

_1227547488.unknown

_1227547684.unknown

_1227547391.unknown

_1227547044.unknown

_1227547206.unknown

_1227547254.unknown

_1227547140.unknown

_1227546954.unknown

_1227547022.unknown

_1227546932.unknown

_1227544982.unknown

_1227546073.unknown

_1227546734.unknown

_1227546805.unknown

_1227546815.unknown

_1227546767.unknown

_1227546134.unknown

_1227546321.unknown

_1227546091.unknown

_1227545780.unknown

_1227545897.unknown

_1227546013.unknown

_1227545883.unknown

_1227545657.unknown

_1227545712.unknown

_1227545641.unknown

_1227544126.unknown

_1227544517.unknown

_1227544565.unknown

_1227544932.unknown

_1227544530.unknown

_1227544426.unknown

_1227544437.unknown

_1227544218.unknown

_1227543436.unknown

_1227543691.unknown

_1227543725.unknown

_1227544125.unknown

_1227543581.unknown

_1227543453.unknown

_1227543309.unknown

_1227543409.unknown

_1227373846.unknown