Upload
zalosna-sova
View
8
Download
2
Embed Size (px)
DESCRIPTION
Matematika
Citation preview
Deskriptivna statistika: Sreivanje i grafiko prikazivanje podataka, statistiki pokazatelji i parametri
1. UvodStatistika je mlada matematika disciplina koja se bavi sakupljanjem, tabelarnim i grafikim predstavljanjem podataka te izvoenjem zakljuaka nakon njihove analize. Tokom poslednjih etrdesetak godina analiza statistikih podataka je postala veoma popularna. Vea dostupnost kompjutera i statistikih softverskih paketa dodatno je poveala ulogu statistike u empirijskim istraivanjima. Ona se zbog toga koristi za istraivanja u gotovo svim oblastima, od medicine do sporta. Danasse na skoro svim fakultetima u svetu podrazumeva da studenti imaju bar jedan predmet iz statistike. Gotovo svi dnevni listovi i asopisi sadre grafikone i lanke o statistikim istraivanjima.
Re statistika ima dva znaenja. U svakodnevnom ivotu re statistika se odnosi na numerikepodatke. Primeri takvih numerikih podataka su prihod porodice, starost studenta, procenatdodavanja koja je ostvario kvorterbek nekog fudbalskog tima1i poetna plata pripravnika sa univerzitetskom diplomom.
Drugo znaenje reistatistika odnosi se na statistiku kao naunu disciplinu. U tom smislu, restatistika definie se na sledei nain: Statistika je nauni metod koji se koristi za prikupljanje, prikazivanje, analizu i interpretaciju podataka i donoenje statistikih zakljuaka.
Svakog dana smo u prilici da donosimo odluke koje mogu biti line, poslovne ili neke druge. Sve te odluke se obino donose u uslovima neizvesnosti. Veoma esto, za probleme sa kojima se suoavamo u stvarnosti ne postoji dovoljno precizno ili konano reenje. Statistike metode nam pomau da u takvim situacijama donosimo strune i ispravne odluke. Odluke donete na osnovu statistikih metoda nazivaju seprocenama i prognozama.Odluke koje se donosebez korienja statistikih (ili naunih) metoda predstavljajuisto nagaanje i stoga su nepouzdane.
Kao i veina naunih disciplina, statistika ima dva aspekta: teorijski i primenjeni.Teorijska ili matematika statistikabavi se razvojem, izvoenjem i dokazivanjem statistikih teorema, formula, pravila i zakona.Primenjena statistikapodrazumeva primenu tih teorema, formula,pravila i zakona u reavanju realnih problema.
Primenjena Statistika se dijeli na deskriptivnu, bavi se sakupljanjem, obradom i tabelarnim i grafikim prikazivanjem podataka i induktivnu (na engleskom jeziku inference statistics), bavi se izvoenjem zakljuaka nakon analize prikupljenih podataka. Deskriptivna statistika je zaokruena oblast i njeno razumijevanje zahtjeva samo elementarno matematiko znanje. Induktivna statistika je aktuelna, popularna i primjenjiva matematika disciplina. Bavljenje induktivnom statistikom zahtjeva odlino znanje matematike, prije svega vjerovatnoe.
2.Sreivanje i grafiko prikazivanje podataka2.1. Raspodela frekvencijaSreivanjem podataka dobijaju se statistike serije koje se po nainu formiranja i analiziranja dele na strukturne i vremenske serije.
Serije struktura raspodele statistikog skupa po vrednostima obeleja sastoji se iz dva reda obavetenja: modaliteta i frekvencije (broja jedinica). U zavisnosti od vrste obeleja postoje serije strukture sa nominalnim (kvalitativnim) i sa numerikim (kvantitativnim) obelejem. Modaliteti atributivnih obeleja se iskazuju opisno i za njihovo grupisanje potrebno je imati jasnu emu kvalifikacije formiranu po kriterijumu koji odgovara prirodi samog obelejaVrsta sadnicaBroj
Bor140
Jela80
modaliteti
frekvencije
Kvantitativno obeleje:
Broj lanova domainstva:
Broj smena u preduzeima:
moe se prikazati raspodelom relativnih frekvencija koja se dobija tako to se za svaku moguu vrednost obeleja H utvrdi koliko elemenata statistikog skupa uzima tu vrednost.
H)Apsolutne frekvencije (f)
N
Gradiranje brojanih verdnosti obeleja se razlikuje u zavisnosti od toga da li je obeleje:
Prekidno (diskontinualno) = grupiu se po veliini (od nie ka vioj vrednosti)
Neprekidno (kontinualno) = H uzima vrednost iz konanog ili beskonanog intervala (a, b); taj interval se deli na podintervale (a, a1), , (ak, b) koji se zovu grupni intervali (koji ne moraju biti jednaki).Grupni intervaliApsolutne frekvencije (f)
N
Odreivanje grupnih intervala (broja i veliine) esto se vri uz pomo Sturgess-ovog pravila:
Veliina intervala: gde je N broj podataka Broj intervala:
Ako treba podeliti H na dva ili vie statistikih skupova, onda apsolutne frekvencije moraju da se pretvore u relativne brojeve i to uz pomo raspodele relativnih frekvencija. .H)Apsolutne frekvencije (f)Relativne frekvencije (r)Procentualne relativne frekvencije (r) (%)Kumulativne apsolutne frekvencije (S)Kumulativne relativne frekvencije (F)
N1,00100,00
Relativne frekvencije su brojevi koji zadovoljavaju sledea dva uslova:
Kumulativna frekvencija i-tog grupnog intervala se dobija kada se sve frekvencije za prethodne intervale saberu kada se podele sa brojem elemenata statistikog skupa .
2.2. Grafiko prikazivanje raspodela frekvencijaObavlja se uz pomo grafikona koji se konstruiu tako to se na horizontalnoij osi nanosi vrednost obeleja H (H=prekidno) ili granice grupnih intervala (H=neprekidno). Kod grafikona apsolutnih frekvencija na Y osi se nanose vrednosti odgovarajuih frekvencija za grupni interval ili H, i konsturiu se pravougaonici iznad grupnih intervala sa visinama jednakim frekvencijama; kada se spoje take na srednama grupnih intervala dobija se poligon apsolutnih frekvencija.
Kod relativnih frekvencija koriste se histogrami: na H osi su sredine grupnih intervala, a zatim se oko tih taaka vri konstruisanje pravougaonika ije e povrine biti jednake vrednostima relativnih frekvencija. Primer:
Ako je duina i-tog intervala:
Visina pravougaonika iznad take: treba da je: r je odgovarajua relativna frekvencija
Histogram relativnih frekvencija (na slici=>)
Histogram je veoma pogodan za poreenje raspodela frekvencija:
Raspodela H na dva skupa Kumulativne frekvencije
Na osnovu histograma koji odgovara raspodeli relativnih frekvencija neprekidnog obeleja H, moe se izabrati kriva linija koja e aproksimirati posmatranu raspodelu frekvencija. Ta linija se zove zakon verovatnoe ili funkcija gustine i predstavlja granini oblik histograma ako se broj elemenata u statistikom skupu neogranieno poveava, a duine intervala, na osnovu kojih pravimo histogram, neograneno se smanjuju.
3. Statistiki pokazatelji i parametri za analizu3.1. Srednje vrednosti obelejaZa dublju analizu nisu dovoljni relativni brojevi i raspodela frekvencije, vee se utvruju izvesni pokazatelji i parametri, ije utvrivanje omoguava donoenje zakljuaka o odreenoj pojavi ili procesu. Prva grupa tih parametara su srednje vrednosti (proseci):
Poeljne osobine srednjih vrednosti su:
- Ako su sve vrednosti obeleja H jednake i njihova srednja vrednost treba da je tolika- Ako postoje minimalna i maksimalna vrednost H onda je srednja vrednost vea od minimuma i manja od maksimuma- Srednja vrednost treba da zavisi od svih vrednosti H na celom statistikom skupu- Aritmetika sredina niza brojeva je broj koji se dobije kad se njihov zbir podeli sa ukupnim brojem lanova tog niza.
Najee se koristi, metod izraunavanja je isti za negrupisane i grupisane podatke:
Ako su utvreni
Ako je h prekidnog tipa, sa frekvencijama :
Ako je h neprekidnog tipa, sa frekvencijama :
Osim ako se prvi i poslednji grupni interval znatno razlikuju po duini od ostalih (ili ako je neki od njih beskonaan), tada je:
, gde je prosena duina preostalih intervala.
Iz raspodele relativnih frekvencija .
Pored univerzalnih (koji se mogu pokazati) aritmetika sredina ima jo neke osobine koje omoguavaju njeno lake odreivanje:
1) Zbir odstupanja vrednosti obeleja H na posmatranom skupu od njihove aritmetike sredine je jednako nuli:
2) Zbir kvadrata odstupanja vrednosti obeleja H na elementima statistikog skupa od bilo kog broja a je najmanji ako je :
minimum za
3) Ako izmeu H i Y postoji linearna zavisnost, ista takva zavisnost postoji izmeu njihovih aritmetikih sredina:
4) Pretpostavka: statistiki skup 1: ; statistiki skup 2: ; tada je aritmetika sredina za oba skupa zajedno jednaka ponderisanoj aritmetikoj sredini:
5) Posmatra se S statistikih skupova sa elemenata i aritmetikih sredinarespektivno. Tada je aritmetika sredina obeleja H na svim skupovima zajedno jednaka ponderisanoj aritmetikoj sredini:
esto se statistiki skupovi sastoje iz stratuma, tj. podskupova koji se meusobno iskljuuju, a zajedno ine ceo skup. Statistiki podaci se prikupljaju i obrauju po stratumima => analiza celog skupa, to je nekad nemogue.- Geometrijska sredina (najpogodnija u analizama vremenskih serija) niza brojeva je N-ti koren iz proizvoda njegovih lanova. Neka su vrednosti posmatranog obeleja H na elementima statistikog skupa. Geometrijska sredina je jednaka:
Kada je H dato raspodelom frekvencija :
Upotreba geometrijske sredine je mogua samo za pozitivna obeleja.
Logaritmovanjem se dobija:
Za relativne frekvencije se dobija:
Sve osobine aritmetike poseduje i geometrijska sredina.- Harmonijska sredina niza brojeva je reciprona vrednost aritmetike sredine recipronih vrednosti lanova tog niza.
Ako su vrednosti obeleja H na N elemenata statistikog skupa, tada je harmonijska sredina: .
Kada je H dato raspodelom frekvencija:
Preko relativnih frekvencija:
Cauchy-jeva teorema:
3.2. Indeksi, stope promeneSlue za najjednostavniju analizu vremenskih serija (praenje dinamikih kretanja pojava).
- Indeks je broj koji predstavlja kolinik vrednosti posmatranog obeleja H u trenutku t (Xt) i vrednosti tog obeleja u nekom drugom trenutku .
Postoje dve vrste indeksa: bazni i lanani indeks.
- Lanani indeksi su kolinici vrednosti obeleja H u trenutku t (Xt) i njegove vrednosti u prethodnom trenutku merenja t1 (Xt-1). Za lanani indeksi su:
najeeZa vremensku seriju od T podataka, dobija se (T1) lanani indeks jer se prvi podatak u seriji ne moe porediti sa prethodnim.
Ako od procentualno izraenog indeksa u trenutku t oduzmemo 100, dobiemo procentualno izraenu promenu obeleja H od momenta (t1), do momenta t koji nazivamo stopa promene.
Grafiki prikaz lananih indeksa
- Bazni indeksi slue za iskazivanje promene posmatranog obeleja u vremenskoj seriji u odnosu na jedan trenutak merenja sa kojim elimo da poredimo ostale promene:
U statistikoj analizi se esto koristi prosena stopa promene:
3.3. Odreivanje i interpretacija modusa i medijane obeleja- Modus je ona vrednost obeleja H koja ima najveu frekvenciju u posmatranom statistikom skupu ili ona vrednost u ijoj se okolini najee pojavljuju izmerene vrednosti H na statistikom skupu.
To je jedina srednja vrednost koja se moe koristiti za kvalitativna obeleja i predstavlja dobar pokazatelj za homogene statistike skupove.
Kada je H grupisano i dato raspodelom frekvencija, za modus se uzima sredina grupnog intervala sa najveom frekvencijom.- Medijana je ona vrednost obeleja H koja deli statistiki skup na dva jednaka dela.
Ako su
Za obeleje koje je grupisano i dato raspodelom frekvencija, medijanu odreujemo tako to prvo odredimo grupni interval u kome se nalazi , a zatim po dogovoru biramo jednu vrednost iz tog intervala.
Ako je H dato raspodelom: H
(f)f1f2fk
Prvo se odreuje indeks S za koji e biti zadovoljeno: .
Za medijanu se uzima vrednost H u intervalu na sledei nain:
3.4. Mera varijabiliteta obelejaUkazuje na dve innjenice: njihov iznos govori koliko su srednje vrednosti obeleja H dobri predstavnici svih njihovih vrednosti na posmatranom skupu i treba da pokau koliko se svi elementi na posmatranom skupu meusobno razlikuju u odnosu na dato obeleje H. Tj: to je varijansa manja to je srednja vrednost bolji predstavnik, i obrnuto.
- Razmak varijacije je razmak izmeu najvee i najmanje vrednosti H na posmatranom statistikom skupu:
Kada je obeleje H grupisano i dato raspodelom frekvencija , da bismo odredili R, moramo znati i . Ima najveu primenu u kontroli kvaliteta i industrijskoj proizvodnji.
- Kvartilna devijacija sklui ziskljuenje odreenog procenta elemenata statistikog skupa. Odreena je izrazom:
gornji kvartil je ona vrednost obeleja H za koju 75% elemenata stati-stikog skupa ima vrednost H manju od (25% elemenata ima H vee od )
donji kvartil je ona vrednost obeleja H za koju 25% elemenata statistikog skupa ima vrednost manju od .
Raunaju se slino kao medijana:
- Srednja devijacija (zavisi od svih vrednosti H) je aritmetika sredina apsolutnih vrednosti odstupanja od njegove aristmetike sredine na posmatranom statistikom skupu:
su obeleja, je aritmetika sredina:
Za grupisane podatke date raspodelom frekvencija:
Relativne frekvencije:
- Varijansa i standardna devijacija. Standardna devijacija je pozitivna vrednost korena varijanse. Varijansa je aritmetika sredina kvadrata odsupanja vrednosti obeleja H od njegove aritmetike sredine:
su obeleja, je aritmetika sredina:
,:
Relativne frekvencije:
- Koeficijent varijacije je procentualno izraen odnos standardne devijacije i aritmetike sredine obeleja H:
3.5. Osobine varijanse obeleja- Varijansa obeleja H je jednaka nuli, ako i samo ako je H konstantno na svim elementima statistikog skupa, tj:
- Varijansa obeleja H se moe izraziti formulom:
, tj. kada je H grupisano- Neka obeleje H ima varijansu a Y i ako postoji linearna veza tada je:
- Pretpostavimo da jedan statistiki podskup ima element, sa aritmetikom sredinom i varijansom a drugi tada je varijansa statistikog skupa:
- Uopteno (4); statistiki skup od k podskupova , tada je:
gde je: veliina statistikog skupa, a njegova aritmetika sredina.
3.6. Momenti statistikog obelejaObian momenat k-tog reda statistikog obeleja H predstavlja matematiko oekivanje k-tog stepena tog statistikog obeleja:
Ako je H prekidno:
Ako je H neprekidno:
Specijalno:
Centralni momenat k-tog reda statistikog obeleja H je oekivana vrednost k-tog stepena razlike statistikog obeleja H i oekivane vrednosti m:
Ako je H prekidno:
Ako je H neprekidno:
Specijalno:
Centralni momenti se lake odreuju preko obinih momenata: ako k-ti stepen razlike (Hm) razvijemo preko binomnog obrasca dobiemo:
, pa zbog osobie oekivane vrednosti:
Spacijalno: .
3.7. Pearson-ovi koeficijenti obeleja, Koeficijent spljotenosti obelejaKoeficijent asimetrije, za merenje asimetrinosti raspodele H slui parametar baziran na i : .
Za simetrine raspodele , asimetrine u levo za , u desno za .
Mada je jednostavan, vie se koristi Pearson-ov koeficijent:
Prvi Pearson-ov koeficijent je definisan preko kolinika , gde je trei centralni momenat.
,:
Relativne frekvencije:
raspodela H je simetrina (i obrnuto).
raspodela H asimetrina u levu stranu.
raspodela H asimetrina u desnu stranu.Koeficijent spljotenosti slui kao mera spljotenosti jedne raspodele i definie se na osnovu tzv. etvrtog centralnog momenta.
Drugi Pearson-ov koeficijent je kolinik
,:
Relativne frekvencije:
obeleje H ima normalnu spljotenost (i obrnuto).
obeleje H ima spljotenost veu od normalne.
obeleje H ima spljotenost manju od normalne.
Moe se koristiti i koeficijent koji ima normalnu spljotenost u 0.
Literatura:
- Dr. Stevan M. Stojanovi, Matematika statistika, Nauna knjiga, Beograd, 1980.- Dr. Blai M., Opta statistika, Savremena administracija, Beograd, 1986.- Dr. Biljana Popovi, Matematika statistika i statistiko modelovanje, Sven, Ni, 2003.- V. Vrani: Vjerojatnost i statistika, Tehnika knjiga, Zagreb, 1971.- I. Pavli: Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1970.Sadraj: 1.Uvod.......................................................................................................................1 2. Sreivanje i grafiko prikazivanje podataka..........................................................2 2.1. Raspodela frekvencija..........................................................................................2 2.2 Grafiko prikazivanje raspodela frekvencija ........................................................4 3 Statistiki pokazatelji i parametri za analizu............................................................5 3.1 .Srednje vrednosti obeleja..................................................................................5 3.2. Indeksi, stope promene.......................................................................................8 3.3. Odreivanje i interpretacija modusa i medijane obeleja....................................9 3.4. Mera varijabiliteta obeleja..................................................................................9 3.5. Osobine varijanse obeleja................................................................................11 3.6. Momenti statistikog obeleja............................................................................11 3.7. Pearson-ovi koeficijenti obeleja, Koeficijent spljotenosti obeleja..................12 Literatura...................................................................................................................14
1
_1227546917.unknown
_1227550972.unknown
_1227552346.unknown
_1227572241.unknown
_1227572827.unknown
_1227573128.unknown
_1227879701.unknown
_1232027923.unknown
_1232275158.unknown
_1232275197.unknown
_1396351847.unknown
_1232275186.unknown
_1232274663.unknown
_1232275141.unknown
_1228185364.unknown
_1227573322.unknown
_1227573331.unknown
_1227573338.unknown
_1227573140.unknown
_1227573288.unknown
_1227572953.unknown
_1227573068.unknown
_1227573100.unknown
_1227573046.unknown
_1227572869.unknown
_1227572916.unknown
_1227572838.unknown
_1227572402.unknown
_1227572605.unknown
_1227572782.unknown
_1227572421.unknown
_1227572364.unknown
_1227572373.unknown
_1227572277.unknown
_1227553597.unknown
_1227554247.unknown
_1227554376.unknown
_1227554628.unknown
_1227554353.unknown
_1227554058.unknown
_1227554117.unknown
_1227553936.unknown
_1227552772.unknown
_1227553452.unknown
_1227553555.unknown
_1227552823.unknown
_1227552617.unknown
_1227552691.unknown
_1227552519.unknown
_1227552402.unknown
_1227551752.unknown
_1227552043.unknown
_1227552102.unknown
_1227552173.unknown
_1227552183.unknown
_1227552257.unknown
_1227552162.unknown
_1227552074.unknown
_1227551942.unknown
_1227551973.unknown
_1227551913.unknown
_1227551452.unknown
_1227551543.unknown
_1227551560.unknown
_1227551094.unknown
_1227551318.unknown
_1227551427.unknown
_1227551214.unknown
_1227551080.unknown
_1227548387.unknown
_1227549563.unknown
_1227550791.unknown
_1227550845.unknown
_1227550864.unknown
_1227550941.unknown
_1227550832.unknown
_1227550672.unknown
_1227550686.unknown
_1227550619.unknown
_1227549346.unknown
_1227549449.unknown
_1227549468.unknown
_1227549428.unknown
_1227548761.unknown
_1227548852.unknown
_1227548648.unknown
_1227547333.unknown
_1227547897.unknown
_1227547923.unknown
_1227547963.unknown
_1227547909.unknown
_1227547488.unknown
_1227547684.unknown
_1227547391.unknown
_1227547044.unknown
_1227547206.unknown
_1227547254.unknown
_1227547140.unknown
_1227546954.unknown
_1227547022.unknown
_1227546932.unknown
_1227544982.unknown
_1227546073.unknown
_1227546734.unknown
_1227546805.unknown
_1227546815.unknown
_1227546767.unknown
_1227546134.unknown
_1227546321.unknown
_1227546091.unknown
_1227545780.unknown
_1227545897.unknown
_1227546013.unknown
_1227545883.unknown
_1227545657.unknown
_1227545712.unknown
_1227545641.unknown
_1227544126.unknown
_1227544517.unknown
_1227544565.unknown
_1227544932.unknown
_1227544530.unknown
_1227544426.unknown
_1227544437.unknown
_1227544218.unknown
_1227543436.unknown
_1227543691.unknown
_1227543725.unknown
_1227544125.unknown
_1227543581.unknown
_1227543453.unknown
_1227543309.unknown
_1227543409.unknown
_1227373846.unknown