173
Zoran Milošević Dragan Bogdanović STATISTIKA I INFORMATIKA u oblasti medicinskih nauka Niš, 2012.

Statistika i informatika 1.pdf

  • Upload
    boka

  • View
    869

  • Download
    126

Embed Size (px)

Citation preview

  • Zoran Miloevi Dragan Bogdanovi

    STATISTIKA I INFORMATIKA

    u oblasti medicinskih nauka

    Ni, 2012.

  • Autori: Zoran Miloevi, vanredni profesor Medicinskog fakulteta Univerziteta u Niu Dragan Bogdanovi, docent Dravnog univerziteta u Novom Pazaru Izdava: GALAKSIJA Za izdavaa: Mlaan Ranelovi Recenzenti: Prof. dr Vera Gruji, Medicinski fakultet u Novom Sadu Prof. dr Erebet A Nikoli, Medicinski fakultet u Novom Sadu Prof. dr Tatjana Ille, Medicinski fakultet u Beogradu Tehniki urednik: Dipl. ing. Stefan Bogdanovi tampa: GALAKSIJA - Lukovo Tira: 500 ISBN 978-86-6233-010-9 Zabranjeno pretampavanje i kopiranje bez saglasnosti autora i izdavaa. Odlukom Nastavno-naunog vea Medicinskog fakulteta Univerziteta u Niu broj 14-7454-5/2-1 od 01.10.2012. godine odobreno je tampanje ove knjige u vidu udbenika. CIP - ,

  • PREDGOVOR

    Udbenik je rezultat viegodinjeg rada autora i njihovih saradnika sa Instituta za javno zdravlje i Medicinskog fakulteta Univerziteta u Niu. Studenti e u njemu pronai potreban materijal da se savladaju osnove medicinske statistike i informatike.

    Autori su uloili veliki napor kako bi u ovom udbeniku studenti na jednom mestu mogli pronai materijal za sticanje znanja i razumevanje statistike metodologije u oblasti biomedicinskih nauka. Uz svako poglavlje dati su i odgovarajui primeri za praktinu primenu. Obradjena su sva znaajna poglavlja deskriptivne i analitike statistike. Udbenik je napisan tako da studentima daje smernice za nauno istraivaki rad i upuuje ih u osnove primene raunarskih statistikih paketa u biomedicinskim naukama.

    Udbenik je namenjen studentima osnovnih studija medicine, stomatologije, farmacije i strukovnih studija. Pored njih udbenik mogu koristiti i studenti svih poslediplomskih studija i zdravstveni radnici i saradnici za obnavljanje steenih znanja i njihovo unapredjivanje i reavanje praktinih nauno istraivakih problema.

    Na savetima korisnim za pisanje ovog udbenika autori duguju zahvalnost recenzentima: prof. dr Veri Gruji i prof. dr Erebet A Nikoli sa Medicinskog fakulteta Univerziteta u Novom Sadu, kao i prof. dr Tatjani Ille sa Medicinskog fakulteta Univerziteta u Beogradu.

    Autori su zainteresovani za sve predloge i primedbe na rukopis koji je u udbeniku sa eljom da u sledeem izdanju on bude jo kvalitetniji i sadrajniji.

    Ni, oktobar 2012. godine Autori

  • Izvod iz recenzija

    Knjiga je napisana razumljivo, smisleno i u skladu je sa nastavnim planom i potrebama za razumevanje i prihvatanje biostatistike i informatike koji se realizuje na Medicinskom i srodnim fakultetima.

    Poglavlja su koncipirana tako da lagano uvode itaoca u biostatistiku, njene mogunosti i upuuju na korienje SPSS.

    Prof. dr Tatjana Ille

    Svako poglavlje je ilustrovano primerima, a na kraju svakog poglavlja su zadaci za vebu. Posebna vrednost knjige je to sadri uputstvo i nain primene statistikog programa SPSS za sve prezentovane statistike analize.

    Koncepcija i redosled poglavlja su logini, knjiga je napisana struno i razumljivim jezikom za korisnike ije bazino obrazovanje nije iz matematike i nauka baziranih na matematici.

    Prof. dr Erebet A Nikoli

    Knjiga autora Zorana Miloevia i Dragana Bogdanovia predstavlja

    celinu u kojoj autori izlau sloenu problematiku precizno, struno, kritiki i analitiki, vodei organizaciju sadraja postepeno i logino od optih ka konkretnim pitanjima.

    Ova knjiga je namenjena studentima medicine, farmacije, stomatologije, ali ne samo njima. Ona moe posluiti i studentima drugih fakulteta i svima onima koji koriste statistiku u svom radu.

    Stoga, knjigu Statistika i informatika u oblasti medicinskih nauka preporuujem kao univerzitetski udbenik i predlaem njeno tampanje, kako bi se omoguilo njeno korienje i u najiroj strunoj javnosti.

    Prof. dr Vera Gruji

  • 5

    1. MEDICINSKA STATISTIKA 1.1. Definicija i predmet prouavanja

    Statistika nije nauka koja prouava zakone po kojima se odvijaju razne pojave u ivoj prirodi i drutvu, nego nauna metodologija kojom se ove pojave istrauju.

    Kako se ova metodologija zasniva na merenju, brojanju i raunanju, odnosno na primenjenoj matematici, najprimerenija definicija bi bila:

    Statistika je nauni metod kvantitativnog prouavanja masovnih pojava u prirodi i drutvu.

    Izraz statistika se u poetku odnosio na prikupljanje i korienje podataka koji su bili od znaaja za dravu, kao to su evidencije o stanovnitvu, posedima i prihodima, a vodi poreklo od italijanske rei state to znai drava.

    Potreba za efikasnijom dravnom administracijom, kao i osnivanje prvih osiguravajuih drutava uticali su na razvoj vitalne statistike (praenje i analiza raanja i umiranja) u imperijalnoj Engleskoj XVII veka, a pioniri u ovoj oblasti bili su Don Graunt (1620-1674. g.) i Vilijam Peti (1623-1687. g.). Gotovo u isto vreme Blejz Paskal (1623-1662. g.) i Pjer de Fermat (1601-1665. g.) postavili su osnove teorije verovatnoe, a u svrhu poveanja uspeha u igrama na sreu, koje su bile popularne u visokim drutvenim krugovima u Francuskoj.

    Dalji podsticaj za razvoj statistike metodologije dala je astronomija, gde je rezultate mnogih pojedinanih posmatranja bilo potrebno objediniti u jedinstvenu teoriju. Vodee linosti u ovoj oblasti bili su Pjer Simon Laplas (1749-1827. g.) u Francuskoj i Karl Fridrih Gaus (1777-1855. g.) u Nemakoj.

    Belgijski astronom i matematiar Adolfo Katlet (1796-1874. g.) je prvi poeo da primenjuje statistiku metodologiju u biolokim, medicinskim i sociolokim istaivanjima, dok je englez Fransis Galton (1822-1911. g.) uveo analizu varijabilnosti i meuzavisnosti izmeu vrednosti razliitih obeleja (regresije i korelacije) u biolokim merenjima. Karl Pirson (1857-1936. g.) i Rafael Veldon (1860-1906. g.), profesori Univerzitetskog Koleda u Londonu, nastavili su dalji razvoj primene statistike metodologije u biologiji i uveli pojam biometrije za vrstu studija kojima su se bavili. Dominantna linost u razvoju statistike i biometrije u XX veku bio je Ronald Fier (1890-1962. g.), statistiar, biolog i genetiar iz Engleske.

    iroka primena raunarske tehnologije od osamdesetih godina XX veka doprinela je da statistika postane jedna od naunih oblasti sa najveim stepenom razvoja. Predmet prouavanja statistike su masovne pojave u prirodi i drutvu. One se sastoje iz mase pojedinanih elemenata, koji kao nosioci prirode tih pojava u statistikom smislu predstavljaju statistike jedinice.

    Masovna pojava definisana pojmovno, prostorno i vremenski predstavlja osnovni skup ili populaciju.

  • 6

    Definisanje osnovnog skupa: Pojmovno odreivanje elemenata skupa npr. starost stanovnika, sadraj knjige, vrste telesnih povreda... Prostorno odreivanje prostora npr. Ni, Niavski okrug... Vremensko odreivanje vremenskog trenutka ili razdoblja Statistike jedinice osnovnog skupa su sve istovrsne, ali ne i istovetne. Obeleja statitistikih jedinica koja ih ine neistovetnima predstavljaju

    predmet statistikih istraivanja. Nejednakost nekog obeleja izmeu jedinica naziva se varijabilnost. Najee prouavani osnovni skup u medicinskim istraivanjima je

    stanovnitvo ili populacija. Ljudi u ovom skupu predstavljaju statistike jedinice, a obeleja koja ih ine

    neistovetnim su brojna: pol, uzrast, obrazovanje, zanimanje, zdravstveno stanje, vakcinalni status i dr.

    1.2. Razlike u prouavanju ive i neive prirode

    NEIVA PRIRODA IVA PRIRODA Jedna pojava se identifikuje kao uzrok, a druga kao posledica.

    esto nije mogue izvriti identifikaciju uzroka i posledice.

    Izmeu pojava postoji striktna uzrono - posledina veza.

    Izmeu pojava ne postoji striktna uzrono - posledina veza.

    Jedan isti uzrok daje uvek istu posledicu.

    Nije 100% sigurno. Prodiranje virusa u organizam ne znai obavezno oboljevanje.

    Srazmerno dejstvu uzroka menja se i posledica.

    Promena posledice nije srazmerna dejstvu uzroka.

    Mogu da se iskljue svi sporedni faktori.

    Na posledicu utiu i sporedni faktori koji se ne mogu iskljuiti.

    Izmeu pojava postoji matematika ili funkcionalna veza.

    Izmeu pojava postoji stohastika ili statistika veza.

    Ispitivanjem jednog elementa donosi se zakljuak o celoj masi jer su elementi meusobno istovetni i istorodni.

    Pojave ispoljavaju svoje zakonitosti tek na masi elemenata, a elementi su meusobno istorodni ali nisu istovetni.

    Hipoteza se proverava klasinim eksperimentom - ogledom.

    Hipoteza se proverava posebnim statistikim testovima.

    1.3. Teorija verovatnoe i zakon velikih brojeva Statistika je kao nauno istraivaki metod zasnovan na teoriji verovatnoe i

    njenom postulatu zakonu velikih brojeva. TEORIJA VEROVATNOE se bavi utvrdjivanjem mogunosti za nastajanje

    dogaaja ili dobijanja nekih vrednosti.

  • 7

    Verovatnoa javljanja nekog dogaaja jednaka je:

    NnP

    Gde je: n broj oekivanih (eljenih) dogaaja, a N ukupan broj moguih dogaaja. Verovatnoa se kree u intervalu od 0 do 1 (0 do 100%). 0 - potpuno odsustvo verovatnoe 1 - puna verovatnoa Potpuno odsustvo verovatnoe (0) ne moe nastati ako postoji bar jedna oekivana eventualnost, kao to i puna, totalna verovatnoa (1) nije mogua im postoje vie moguih dogaaja od jednog.

    Kod statistike (stohastike) veze verovatnoa je uvek manja od 1. Kod matematike veze verovatnoa moe da bude i 1. P=1 dogaaj je nuan P>0,5 dogaaj je verovatan P=0,5 dogaaj je neizvestan P

  • 8

    - Pravilo mnoenja (multiplikacije): ako su dva dogaaja (A i B) meusobno nezavisni, verovatnoa da se dogode oba dogaaja (A i B) jednaka je proizvodu njihovih verovatnoa:

    P(A i B) = P(A) P(B) Primer: verovatnoa da e pri dva bacanja kocke pasti prvo petica pa estica

    iznosi: P(petica i estica) = P(petica) P(estica) =0,170,17=0,03

    Sluajno promenljivo obeleje je obeleje koje poprima pojedinane modalitete

    ili vrednosti sa odreenom verovatnoom. Distribucija (raspodela) verovatnoe prikazuje nain na koji je ukupna verovatnoa (koja je jednaka 1) raspodeljena na pojedine vrednosti sluajno promenljivog obeleja.

    Svaku distribuciju verovatnoe odreuju neki od statistikih parametara (npr. aritmetika sredina, standardna devijacija).

    Distribucije verovatnoa delimo na diskontinuirane i kontinuirane. Postoje razliiti pristupi u raunanju verovatnoe:

    subjektivan pristup podrazumeva lini stepen verovanja (npr. da e svet propasti 2050. godine);

    frekvencijski pristup temelji se na brojanju dogaaja pri ponavljanju eksperimenta (npr. koliko puta e novi pasti na glavu ako ga 1000 puta bacimo);

    a priori pristup pretpostavlja poznavanje teorijskog modela, tj. distribucije svih moguih verovatnosti nekog dogaaja (npr. boja oiju deteta majke s plavim i oca sa smeim oima).

    1.3.1. Verovatnoa a priori Pre nego to bacimo kocku, teorijska a priori verovatnoa da emo iz jednog bacanja baciti broj 6 iznosi: P = 1/6 = 0,17 = 17% Verovatnoa da emo jednim bacanjem novia dobiti ,,glavu'' (ili ,,pismo'') je P = 1/2 = 0,5 = 50%

    Ako smo tri puta bacali novi i sva tri puta dobili pismo da li to znai da je verovatnoa da u etvrtom bacanju dobijemo glavu sada vea?

    Ona i dalje iznosi 50%! Teorija verovatnoe vai samo na velikom broju sluajeva i tek ako se on pribliava beskonanosti, verovatnoa se manifestuje u pravom odnosu. Ovakva deavanja prouavao je u 17. veku vajcarski matematiar ak Bernuli, a u 18. veku teoriju su dalje razvili francuski matematiari Laplas i Puason. 1.3.2. Verovatnoa a posteriori

    Prikaimo jedan ogled u duhu Bernulija: U kutiji imamo veliki, ali nepoznat broj crnih i belih kuglica. elimo da

    saznamo udeo belih kuglica, odnosno verovatnou da emo izvlaenjem samo jedne kuglice iz kutije izvui ba belu.

  • 9

    Ovakva verovatnoa naziva se a posteriori. Verovatnoa izvlaenja bele kuglice je:

    gde je: n broj izvuenih belih kuglica, a N broj ukupno izvuenih kuglica

    Posle 10 izvlaenja dobili smo 5 belih i 5 crnih kuglica. Na osnovu samo ovih ponavljanja moemo predpostaviti da je verovatnoa

    izvlaenja bele kuglice: Verovatnoa izvlaenja crne kuglice je odatle:

    Posle 100 izvlaenja dobili smo 55 belih i 45 crnih kuglica. Sada predpostavljamo da je verovatnoa izvlaenja bele kuglice:

    Ali posle 1000 izvlaenja dobili smo 600 belih i 400 crnih kuglica. Tek sada sa veom sigurnou moemo tvrditi da je verovatnoa izvlaenja

    bele kuglice:

    a da je odnos belih i crnih kuglica: 6:4 Pravi odnos se manifestovao tek posle velikog broja izvlaenja.

    1.3.3. Puasonov zakon velikih brojeva Pri prouavanju masovnih pojava dobijae se sve taniji rezultati ukoliko se

    prouavanje primenjuje na to vie posebnih javljanja prouavane pojave. Ako bi bilo mogue obuhvatiti i prouiti sve posebne manifestacije, rezultati

    prouavanja bi verno i istinito objasnili pojavu. Zakon velikih brojeva predstavlja postulat teorije verovatnoe i tek njegovom

    primenom u prouavanju masovnih pojava dokazano je da se one ne ponaaju haotino ve da i u njihovom javljanju postoje odreeni odnosi i zakonitosti.

    NnP

    %505,0105 P

    5,05,011 P

    %5555,010055 P

    %606,01000600 P

  • 10

    2. STATISTIKO SREIVANJE I PRIKAZIVANJE PODATAKA 2.1. Tipovi podataka

    Na poetku bilo kakvog istraivakog procesa potrebno je definisati statistiku masu tj. skup jedinica na kojima treba izvriti planirano istraivanje. Ovako definisan skup naziva se u statistici osnovni skup, koji se sastoji od statistikih jedinica.

    Statistike jedinice su istovrsne, tj. imaju odreene iste osobine ili bar jednu osobinu na osnovu koje se svrstavaju u osnovni skup. Osobine po kojima se statistike jedinice meusobno razlikuju nazivaju se obeleja i ona su predmet prouavanja tokom istraivanja. Razliiti vidovi u kojima se obeleja mogu javiti nazivaju se modaliteti ili kategorije obeleja.

    Obeleja u statistici mogu se podeliti na prosta i sloena. Prosta obeleja imaju jasne granice izmeu modaliteta npr. pol, brano stanje.

    Kod sloenih obeleja ne postoji mogunost da se uspostavi jasna granica izmeu modaliteta ili postoji veliki broj modaliteta npr. uzrok smrti, zdravstveno stanje i dr.

    Obeleja se prema obliku u kome se iskazuju dele na numerika i atributivna. Sa statistikog aspekta najvanije je da li se obeleja mogu izraziti

    kvantitativno ili ne. Sva obeleja koja se mogu izraziti brojano nazivaju se numerika obeleja, npr. telesna teina, nivo holesterola, koncentracija hemoglobina, broj bolesnika.

    Numerika obeleja se dalje mogu podeliti na neprekidna (kontinuirana) i prekidna (diskontinuirana).

    Neprekidna numerika obeleja dobijaju se u procesu merenja i njihova karakterisitka je da ona mogu da uzmu bilo koju vrednost. Telesna teina novoroeneta moe biti izmerena na vagi koja pokazuje jednu decimalu, pa e i telesna teina nekog novoroeneta biti npr. 3,3kg, ali ako imamo vagu koja meri na 4 decimale teina e biti prikazana kao 3,3482kg. To znai da kod neprekidnih numerikih obeleja brojane vrednosti koje se dobiju zavise od tehnikih mogunosti mernih instrumenata. Ova obeleja se izraavaju u odreenim jedinicama mere.

    Nasuprot neprekidnim obelejima, prekidna nastaju u procesu brojanja i predstavljaju se u vidu celih brojeva. Primer ovakvog obeleja je broj bolesnika, ocena na ispitu, broj novoroenadi i dr.

    Postoje obeleja koja se ne mogu meriti i ne mogu izraziti brojano. Takva obeleja se nazivaju opisna ili atributivna i njihove osobine se opisuju: pol, brano stanje, zdravstveno stanje (oboleli, nisu oboleli) i dr. Po svom karakteru ova obeleja su diskontinuirana.

  • 11

    2.2. Merne skale

    Mere svojstva obeleja pridruivanjem brojeva ili oznaka Postoji etiri nivoa merenja i etiri merne skale vrednosti obeleja: Nominalna skala (a = b) Zasniva se na atributivnim karakteristikama. Obeleja se klasifikuju u jedan od moguih modaliteta. Ova skala pokazuje da se jedan modalitet razlikuje od drugog, ali ne daje

    informaciju o smeru i veliini te razlike. Primeri su: pol, brano stanje, dijagnoza bolesti i dr. Podaci koji se na ovoj skali prikazuju su po svojoj prirodi razliiti. Neka

    svojstva (obeleja, atributi, varijable) nabrajamo, neka merimo. Pol biva oznaen reima ili simbolom m/ ili sa 1 za muko 2 za ensko ili binarno (tako e pol biti pretvoren u dve varijable: muko 1 0, a ensko 0 1). Pol kao varijabla ne moe primiti drugu vrednost.

    Boja oiju moe biti zelena, plava ili smea. Na ovaj nain prikazali smo tri kategorije, ali se za njih ne moe rei da predstavljaju skalu sreenog intenziteta.

    Takva svojstva kao to su pol ili boja oiju zovemo nominalno merenim svojstvima (lat. nomen, nominis = ime).

    Ordinarna skala (ab, a=b) Rangira modalitete obeleja prema unapred usvojenim kriterijumima njihovog

    znaaja. Rangiranje moe biti opisno ili brojano, ali nema informacije o veliini razlike izmeu rangova.

    Na primer, obeleje ishod leenja moemo rangirati u 5 modaliteta, opisno, ali i brojano:

    1- izleen, 2- stanje poboljano, 3- stanje nepromenjeno, 4- stanje pogorano i 5- umro. Prvi rang je bolji od drugog, drugi od treeg i td. Ilustrativni primer ove merne skale je i prikaz intenziteta opekotina, njih

    moemo rangirati u etiri stepena. Pojedinano svaki stepen predstavlja u stvari dogovornu kategoriju intenziteta

    opekotina. Takvo svojstvo zovemo ordinalno merenim svojstvom (lat. ordo, ordinis = red, vrsta).

    Uobiajeno je da se ocene na ispitu kreu u rasponu 5-10, to je takoe ordinalno mereno svojstvo.

    Intervalna skala (a-b) Koristi merne jedinice koje predstavljaju identine intervale i zbog toga nam

    mogu pruiti informacije o apsolutnim razlikama izmeu izmerenih vrednosti. Formirane su tako da nemaju stvarnu nultu vrednost i zbog toga nam ne daju

    obavetenje o relativnim razlikama izmeu izmerenih vrednosti.

  • 12

    Kao najbolji primer moe posluiti temperatura izmerena u stepenima Celzijusove skale. Ukoliko telesna temperatura kod jednog bolesnika pre primene leka iznosi 39C, a sat vremena posle primene je 37C, moemo zakljuiti:

    - da je telesna temperatura opala, - da apsolutna razlika izmeu ovih vrednosti iznosi 39-37=2C. Meutim, ne moemo tvrditi da je temperatura opala za 2/39*100=5% jer se

    apsolutna nula kod ove skale nalazi na -272C, a ne na 0C. Skala odnosa (a-b i a/b) omoguava najvii nivo merenja. Obezbeuje uvid u sve odnose izmeu izmerenih vrednosti: redosled, apsolutnu

    i relativnu razliku izmeu njih. Ovo je mogue jer moe da se izmeri i nulta vrednost. Primer su: teina, visina i dr. Ako je osoba pre dijete bila teka 100kg, a posle nje 84kg, moemo zakljuiti: - da je osoba izgubila na telesnoj teini, - da je apsolutna razlika u teini 100-84=16kg i - da je osoba umanjila teinu za 16/100*100=16%.

    2.3. Metode prikupljanja podataka Tokom istraivakog procesa ispitivana pojava moe biti posmatrana u celoj

    populaciji (potpuno posmatranje) ili na delu populacije (delimino posmatranje). Metode potpunog posmatranja su metod popisa i metod registracije i

    izvetaja. Metod popisa snima stanje neke masovne pojave u tano odreenom trenutku.

    Popis je odreen kritinim momentom pojave koji predstavlja trenutak koji odreuje koje e statistike jedinice ui u popis, kao i vremenom trajanja popisa.

    Metod registracije i izvetaja, za razliku od metode popisa, registruje podatke za odreeni vremenski period.

    Medicinska dokumentacija predstavlja grupu sredstava za usklaeno evidentiranje i prikupljanje podataka o dogaajima i aktivnostima u sistemu zdravstvene zatite.

    Funkcije medicinske dokumentacije: Daje uvid u zdravstveno stanje bolesnika Omoguava postavljanje dijagnoze i odabir terapije Olakava komunikaciju izmeu lekara i bolesnika Predstavlja temelj za razliite zdravstveno-statistike analize Sudsko-medicinski dokaz sprovedinih postupaka Indikator kvaliteta rada zdravstvene slube Baza podataka za nauna istraivanja Osnovnu medicinsku dokumentaciju ine: zdravstveni karton, istorija bolesti,

    temperaturno-terapijsko-dijetetska lista, karton o potronji lekova, karton vakcinacije, otpusna lista sa epikrizom, protokol bolesnika, protokol za registrovanje rezultata medicinskog rada, protokol operisanih i umrlih, matina knjiga lica smetenih u stacionarnoj zdravstvenoj ustanovi, lista anestezije.

  • 13

    Postoje i pomona sredstva za voenje evidencija, a to su: registar kartoteke, dnevna evidencija o posetama i radu, tekua evidencija o utvrenim stanjima i oboljenjima, dnevna evidencija o kretanju bolesnika u stacionaru.

    Metode deliminog posmatranja su anketa i statistiki eksperiment. Anketa (upitnik) je izvor podataka ili merni instrument sainjen od pitanja koja

    su odtampana na papiru ili na drugom pogodnom medijumu, najee raunaru. Upitnik je namenjen prikupljanju podataka, ispitivanju stavova i ponaanja kod manje grupe ispitanika. U pripremi ankete potrebno je izvriti dobru selekciju ispitanika koji e biti anketirani.

    Na poetku upitnika mora da se naglasi svrha anketiranja, ko sprovodi anketu, da li je anonimna ili nije. Pitanja koja se postavljaju mogu biti otvorenog ili zatvorenog tipa. Kod otvorenog tipa pitanja ispitanik sam pie svoj odgovor, a kod zatvorenog tipa ispitanik zaokruuje ili na neki drugi nain oznaava jedan od ponuenih odgovora. Na kraju ankete potrebno je ostaviti prostor za primedbe i sugestije ispitanika.

    Pravila prilikom formiranja ankete su sledea: pitanja treba da budu kratka, jasna, precizna, da nisu dvosmislena, da ne navode na odgovor. Aneketa treba da bude primerena intelektualnom nivou ispitanika i ne sme da bude predugaka.

    Anketa moe biti sprovedena lino, slanjem putem pote ili elektronske pote, postavljena na veb sajtu.

    2.4. Metode sreivanja podataka Prikupljeni podaci predstavljaju sirov materijal koji se ne moe podvrgnuti

    statistikoj analizi. Ovako prikazani podaci predstavljaju osnovnu empirijsku seriju, gde su vrednosti obeleja prikazane redom kako su prikupljane. Potrebno je ove nesreene podatke urediti po nekom kriterijumu ime se formira osnovna serija, najee se podaci sreuju po veliini.

    Institut za javno zdravlje sproveo je anketu meu enama starosti 3040 godina koliko puta godinje odlaze na kontrolne ginekoloke preglede. Dobijeni su sledei podaci:

    0 0 3 4 2 2 4 3 1 0 1 3 2 4 4 3 2 0 1 2 2 4 3 0 2 1 4 2 3 1 0 2 2 1 2 3 2 1 0 1 2 1 3 1 0 2 4 3 3 1 Na osnovu ovako prikazanih podataka nismo u mogunosti da formiramo sliku

    o navikama ena odreenog uzrasta da poseuju ginekologa. Kako bi zakljuili kakve su navike ena potrebno je prvo srediti podatke po veliini.

    0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 Nakon sreivanja podataka po veliini potrebno je saeti podatke u vidu proste

    (osnovne) distribucije frekvencije. Distribucija frekvencije predstavlja takvu statistiku seriju gde se vrednosti obeleja upisuju u jednu kolonu, a uestalost tj. frekvencije tih vrednosti u drugu kolonu. Dakle, distribucija frekvencije pokazuje kako je rasporeen

  • 14

    broj jedinica posmatranja po pojedinim vrednostima obeleja. Za gore pomenute podatke formirana je prosta distribucija frekvencije.

    broj poseta f

    0 8 1 11 2 14 3 10 4 7 50

    Na osnovu ovako sreenih podataka moe se zakljuiti da najvei broj ena

    poseuje ginekologa dva puta godinje. Nain sreivanja podataka zavisi od tipa obeleja. Atributivna i numerika

    diskontinuirana obeleja predstavljaju se prostom distribucijom frekvencije, a numerika kontinuirana obeleja se predstavljaju distribucijom frekvencije sa klasnim (grupnim) intrevalima.

    Distribucija frekvencije sa klasnim (grupnim) intervalima odreena je brojem intervala, veliinom intervala i granicama intervala. Osim toga, potrebno je voditi rauna o tome da intervali budu meusobno jednaki, jer se time omoguava meusobno uporeivanje grupa.

    Broj intervala oznaava se sa K i odreuje se Sturgesovom formulom. K = 1+3,32192 log10N, log10N predstavlja logaritam ukupnog broja jedinica posmatranja (N) za osnovu

    10. Podsetimo, logaritam nekog broja (u ovom sluaju N) predstavlja vrednost kojom treba stepenovati osnovu (u ovom sluaju 10) da bi se dobio taj broj.

    Veliina intervala odreuje se po formuli:

    Veliina intervala = K

    XX minmax Treba voditi rauna da granice intervala budu jasne i precizne, ime se jasno

    pokazuje kom intervalu pripada vrednost posmatranog obeleja, zatim, mora se voditi rauna da kraj jednog intervala ne bude i poetak drugog, jer se time izbegava situacija da se ne zna kom intervalu pripada ispitivana vrednost.

    Kod 30 bolesnika odreivane su vrednosti glikemije (eera u krvi) u mmol/L i dobijene su sledee vrednosti:

    8,6 7,7 6,2 6,6 8,0 9,3 7,3 8,5 10,9 11,1 8,4 9,4 6,9 12,3 13,1 11,9 10,5 9,2 12,6 11,4

    13,7 9,0 6,6 11,4 11,0 8,1 7,3 13,9 12,1 8,0

  • 15

    Na osnovu prikupljenih podataka nije mogue doneti zakljuak o vrednosti glikemije kod ispitivanih bolesnika. Stoga je potrebno srediti i saeti podatke u vidu ditribucije frekvenicije sa klasnim (grupnim) intervalima.

    Potrebno je odrediti broj intervala: K = 1+3,32192 log10N K = 1+3,32192 log1030 = 1+3,321921,48 = 5,91 6

    Veliina intervala = K

    XX minmax =6

    2,69,13 =1,28 1,3

    Za gore prikazane podatke potrebno je formirati distribuciju frekvencije sa 6

    intervala, gde je veliina intervala 1,3.

    Ovakav nain formiranja intervala nije ispravan, jer dolazi do preklapanja

    vrednosti. U datom primeru, postavlja se pitanje u koji interval uvrstiti vrednost od 11,4?

    Ovako formirana distribucija frekvencije sa klasnim intervalima je ispravna i

    pokazuje da najvei broj bolesnika ima vrednost glikemije izmeu 7,5 8,79 mmol/L.

    Glikemija f 6,2 7,5 .... 7,5 8,8 .... 8,8 10,1 ....

    10,1 11,4 .... 11,4 12,7 .... 12,7 14,0 ....

    ....

    Glikemija f 6,20 7,49 6 7,50 8,79 7

    8,80 10,09 4 10,10 11,39 4 11,40 12,69 6 12,70 13,99 3

    30

  • 16

    2.5. Prikazivanje podataka

    Nakon sreivanja podataka potrebno je iste prikazati to jasnije i preciznije.

    Prikazivanje podatka moe biti tabelarno i grafiki.

    2.5.1. Tabelarno prikazivanje podataka Tabela je prikaz podataka sastavljen od redova i kolona. Svaka tabela mora da

    ima naslov, zaglavlje i predkolonu.

    Naslov tabele

    Tabele mogu biti proste, sloene i kombinovane. Proste tabele prikazuju samo jednu statistiku seriju. U tabeli 1 je prikazan broj

    stanovnika u periodu od 2003. do 2007. godine.

    Tabela 1. Broj stanovnika u Srbiji u periodu 2003-2007. godine

    Godina Br. stanovnika 2003. 7532613 2004. 7463157 2005. 7440769 2006. 7411569 2007. 7381579

    Sloene tabele prikazuju vie statistikih serija. U tabeli 2 prikazani su podaci o

    broju stanovnika, broju ivoroenih i broju mrtvoroenih u Niavskom regionu u periodu od 2003. do 2007. godine, to predstavlja prikazivanje tri statistike serije u odreenom periodu.

    Tabela 2. Vitalna statistika u Niavskom regionu u periodu 2003-2007. godine

    Godina Br. stanovnika ivoroeni Mrtvoroeni 2007. 376946 3425 21 2006. 378059 3558 23 2005. 379076 3550 23 2004. 379829 3691 24 2003. 380976 3603 19

    ZAGLAVLJE SUMA REDOVA Polje

    PREDKOLONA

    SUMA KOLONA

  • 17

    Kombinovane tabele prikazuju serije podataka dobijenih ukrtanjem dva ili vie

    obeleja.

    Tabela 3. Broj obolelih kod vakcinisanih i nevakcinisanih mukaraca i ena

    Oboleli Zdravi Mukarci ene Mukarci ene Vakcinisani 345 273 567 534 1719

    Nevakcinisani 673 652 321 283 1929 1018 925 888 817 3648

    2.5.2. Grafiko prikazivanje podataka

    Grafiko prikazivanje podataka nudi upadljivije i jasnije utvrivanje razlika meu prikazanim serijama podataka. Grafikoni predstavljaju vizuelnu ilustraciju tabela, ali nisu njihova zamena, ve dopuna. Nedostatak grafikona je to njihova konstrukcija zavisi od postavljene srazmere, drugi nedostatak to ponekad u istoj razmeri nije mogue prikazati sve vrednosti, npr. najmanje i najvee vrednosti.

    Grafikoni se dele na takaste, linijske i povrinske. Kod takastog dijagrama take predstavljaju parove vrednosti dva obeleja u

    pravouglom koordinatnom sistemu kako bi se prikazao odnos izmeu ovih obeleja kod svih jedinica posmatranja. Na x-osu (apscisu) moemo naneti kako razliite modalitete (kategorije) nekog atributivnog obeleja, tako i razliite vrednosti nekog numerikog obeleja. Na y-osu (ordinatu) nanosimo numerike vrednosti drugog obeleja. Osim podataka u vidu taaka, na ovom dijagramu se moe prikazati i regresiona linija tj. prava koja najbolje odraava meusobni odnos izmeu posmatranih obeleja.

    0

    20

    40

    60

    80

    100

    155 160 165 170 175 180 185 190 195

    Telesna visina (cm)

    Tel

    esna

    mas

    a (k

    g)

    Meuzavisnost izmeu telesne visine i telesne mase kod 20 ispitanika

    Linijski dijagrami se dele na: poligon i kriva frekvencije, vremenski linijski

    dijagram, kumulativni i polarni dijagram.

  • 18

    Kriva frekvencije koristi se za kontinuirana obeleja, na apscisu se nanose mali intervali obeleja, formira se niz taaka, ijim spajanjem se formira kriva. U statistici je najpoznatija i najvie se primenjuje Gausova kriva.

    Gausova kriva

    Vremenski linijski dijagram prati jedno ili vie obeleja kroz vreme. Na

    apscisu se nanosi vreme, a na ordinatu vrednosti obeleja. Upotrebljava se za praenje trenda.

    374000

    375000

    376000

    377000

    378000

    379000

    380000

    381000

    382000

    2003 2004 2005 2006 2007

    Broj stanovnika u Niavskom regionu u periodu 2003-2007. godine Povrinski dijagrami se dele na: tapiasti dijagram, histogram, kruni

    dijagram i kartogram. tapiasti dijagram se sastoji od stubia iste irine ija visina predstavlja

    frekvenciju razliitih modaliteta atributivnih obeleja ili razliitih vrednosti diskontinuiranih numerikih obeleja. Izmeu susednih stubia ostavlja se malo rastojanje.

  • 19

    Nivo uhranjenosti 100 studenata medicine

    Histogram je tip povrinskog dijagrama kojim se prikazuju numerika

    kontinuirana obeleja. Sastoji se od spojenih stubia, gde irina stubia predstavlja irinu klasnog intervala, a visina frekvenciju. Ukoliko se spoje sredine stubia formira se poligon frekvencije.

    Histogram frekvencija za visinu 100 studentkinja

    Kruni dijagrami se koriste za prikazivanje delova neke strukture. Ceo krug

    predstavlja 100% strukture.

    Zastupljenost puenja kod odraslog stanovnitva Srbije

    Kartogrami su dijagrami po geografskoj karti, gde se za svaki region ili

    podruje upisuje vrednost ispitivane pojave.

  • 20

    2.6. Primenjena statistika u MS Excelu Unos statistikih podataka

    Unos podataka, tj formiranje datoteke, prvi je korak u radu s podacima

    dobijenim u nekom istraivanju. Ispravno formiranje datoteke, nuan je korak za dalju analizu unetih podataka.

    Kada se pokrene program Excel, na ekranu se pojavi radni list (Sheet ili Spreadsheet), u obliku tabele. Svaki radni list se sastoji od redova oznaenih brojevima i kolona oznaenih slovima. Radni listovi ine radnu knjigu (Book), unutar koje se smeta celokupna datoteka. Najmanja jedinica, definisana presekom reda i kolone, naziva se elija (Cell).

    Pri unosu podataka u Excel, treba imati na umu sledee: 1. U jedan red se unose podaci za jednog ispitanika; 2. U jednu kolonu se unose podaci za jednu varijablu (obeleje). U prvi red se unose nazivi varijabli. 3. Kod atributivnih varijabli, modalitete (kategorije) je potrebno obeleavati brojevima (npr. muki pol=1, enski pol=2) 4. Ako je vrednost numerikog obeleja 0 ne ostavljati praznu eliju, ve upisati 0. 5. Kod unoenja decimalnih brojeva, potrebno je koristiti zarez za razdvajanje decimala, a ne taku. Dokaz da je broj pravilno uneen je da se on po automatizmu ravna desno u eliji. Podaci koji se automatski ravnaju levo u eliji tretiraju se kao tekst i izuzimaju se iz prorauna.

    Grupisanje atributivnih obeleja

    Grupisanje atributivnih (kategorijskih) varijabli vri se prikazivanjem u

    tabelama, preko apsolutnih i relativnih frekvencija. Najbolje objanjenje emo prikazati kroz primer:

    Primer: U ambulantama u gradu Niu je analizirano kojim se danima najvei broj pacijenata javlja lekaru. Sakupljene su informacije iz 20 ambulanti i dobijeni sledei podaci:

    Ambulanta Dan Ambulanta Dan 1 Pon 11 Petak 2 Uto 12 Subota 3 Sreda 13 Nedelja 4 etvrtak 14 Ponedeljak5 Sreda 15 sreda 6 Petak 16 Sreda 7 Subota 17 etvrtak 8 Nedelja 18 Sreda 9 Ponedeljak 19 Sreda 10 sreda 20 sreda

  • 21

    Reenje: Dobijene podatke unesemo u list MS Excela na sledei nain:

    Procedura koja se koristi za grupisanje podataka se naziva Histogram i ona

    pored grupisanja omoguava i grafiko prikazivanje podataka. Postupak je sledei: U glavnom meniju kliknemo na Tools, iz padajueg menija izaberemo opciju Data Analysis, u radnom prozoru oznaimo Histogram i kliknemo na OK.

    Napomena: Ukoliko se opcija Data Analyse ne nalazi u Tools, treba je ukljuiti tako to se klikne na Tools/Add-Ins i oznai Analysis ToolPak-VBA.

    Na ekranu se dobija sledei prozor:

    U okvir Input Range unosimo adrese elija u kojima se nalaze sirovi podaci

    (B1:B21), a u Bin Range unosimo adrese elija sa oznakama modaliteta obeleja koje

  • 22

    smo sami upisali (C1:C8). Oznaimo opciju Labels, jer smo uneli i adrese elija u kojima se nalaze naslovi (B1 i C1).

    Kliknemo na OK i dobijemo sledei ispis:

    Dani Frequency Cumulative %1 3 15.00%2 1 20.00%3 8 60.00%4 2 70.00%5 2 80.00%6 2 90.00%7 2 100.00%

    More 0 100.00% Dani su prikazani brojevima od 1 do 7, gde je ponedeljak=1, a nedelja=7.

    Sledea kolona predstavlja apsolutne frekvencije, a trea kolona kumulativni procenat. Ukoliko je potrebno da pored apsolutnih frekvencija izraunamo i relativne potrebno je uraditi sledee:

    U eliji ispod druge kolone izraunamo sumu. Novu kolonu oznaimo sa %, to nam ukazuje na procentualnu (relativnu) strukturu. U eliju ispod toga zadamo formulu za izraunavanje =F13/$F$21*100, ime zapravo apsolutnu vrednost frekvencije, delimo sa sumom i mnoimo sa 100. Znak $ unosimo kako bismo fiksirali eliju sa kojom delimo. Zadatu formulu u prvoj eliji kopiramo do poslednje i tako zadamo izraunavanje relativne strukture za sve vrednosti.

    Grafiko prikazivanje statistikih podataka

    Grafiko prikazivanje rezultata je jako bitan element statistike analize, jer

    izmeu ostalog prua najeksplicitniji uvid u rezultate rada, i omoguava nam brzu i lako razumljivu sliku o analiziranim pojavama. Excel je svakako jedan od najboljih i najlakih za korienje programa za grafiko prikazivanje.

  • 23

    Primer: U decembarskom ispitnom roku statistiku je polagalo 200 studenata i rezultati su bili sledei:

    Ocena iz statistike Broj studenata5 10 6 20 7 40 8 60 9 35

    10 35

    Potrebno je dobijene podatke predstavi grafiki (krunim dijagramom). Reenje: Podatke iz tabele unesemo u Excel kao na slici. Kliknemo na ikonu Chart

    Wizard na liniji sa alatima i otvara se sledei radni prozor:

    Izaberemo Pie (pitica) iz menija Chart Type i kliknemo Next. Otvara se sledei prozor:

  • 24

    Oznaimo Columns i u Data Range unesemo opseg elija koje sadre potrebne

    podatke. Klikom na Next dobili bi dijaloge za definisanje naslova tabele i drugih ispisa, ali se mi zadravamo na ovom koraku i klikom na Finish dobijamo krajnji oblik krunog dijagrama:

    Na isti nain je mogue kreirati i druge vrste grafika, tapiaste, histograme itd,

    izabirom tipa grafika u prozoru Chart Type, to e praktino i biti demonstrirano na vebama iz medicinske statistike i informatike.

  • 25

    Zadaci za vebanje

    1. Kod 30 ena odreivan je nivo jednog hormona. Dobijena su sledee vrednosti:

    25,3 18,6 20,4 15,0 27,8 19,4 11,0 19,4 18,6 12,5 23,5 14,0 19,8 16,7 17,2 22,4 23,5 20,0 18,7 26,6 18,8 15,4 19,5 27,0 16,8 21,0 22,4 14,7 19,5 21,4

    Srediti podatke u vidu distribucije frekvencije sa klasnim intervalima i

    prikazati grafiki.

    2. Na klinici za plastinu hirurgiju registrovane su opekotine razliitog stepana u toku jedne godine. Dobijeni su sledei podaci:

    I III II IV I I II III II II III IV IV I I I II III I II II II II III III I I I I I II III I I II I I I III II II I II I I I II I I II II I I III II II II I I I II III I Podatke srediti u vidu proste distribucije frekvencija, grafiki prikazati podatke u vidu tapiastog i krunog dijagrama.

    3. Dati su podaci o starosti pacijenata obelelih od hepatitisa A u Nikom regionu u toku 2008. godine.

    33 31 37 24 32 43 34 39 27 37 34 43 19 47 30 27 34 29 33 38 29 35 41 19 48 37 28 38 41 33 Podatke srediti u distribuciju frekvencije sa klasnim intervalima, prikazati podatke tabelarno i grafiki.

    4. U tabeli je prikazan broj prekida trudnoe u Srbiji u periodu od 2000. do

    2007. godine.

    Godina 2000. 2001. 2002. 2003. 2004. 2005. 2006. 2007. Broj prekida trudnoe 23749 22356 24897 23678 25603 26645 25665 24273 Prikazati podatke grafiki i ocenite trend prekida trudnoe u datom periodu.

    5. U mikrobiolokoj laboratoriji praen je broj deca kolskog uzrasta sa urednim nalazom brisa grla. Utvreno je da je 130 devojica imalo uredan nalaz od ukupno 200 pregledanih. Od 250 deaka 176 imalo je uredan nalaz. Prikazi podatke u vidu tabela kontigencije i konstruii grafikon.

  • 26

    3. RELATIVNI BROJEVI

    U procesu prikupljanja podataka i njihovog tumaenja esto dolazi do nemogunosti poreenja podataka i pravilnog zakluivanja ukoliko su podaci prikazani u vidu apsolutnih brojeva. Apsolutni brojevi se dobijaju kao osnovni izvorni podaci, a do njih se dolazi prebrojavanjem ili merenjem jedinica posmatranja, odnosno grupisanjem prikupljenih vrednosti numerikih obeleja neke masovne pojave. Obino su dovoljni za neku manje optu analazu, ali za savremenu statistiku analizu potrebno je apsolutne brojeve prevesti u relativne. Apsolutnim brojevima se prikazuje neka pojava i njena struktura, ali ne postoji mogunost adekvatnog vremenskog i prostornog poreenja. Za takav vid statistike analize koriste se relativni brojevi. Relativni broj predstavlja odnos dva apsolutna broja, odnosno kolinik dva apsolutna broja.

    Relativni broj =A B ili B

    Relativnim brojevima je apsolutni broj samo poetna, odnosno polazna

    vrednost. Relativni brojevi su pogodniji u statistikoj analizi jer se njima mogu vriti poreenja dve razliite pojave bez obzira na apsolutne vrednosti iz kojih su apsolutni brojevi izvedeni. Uz pomo relativnih brojeva moemo porediti dve pojave koje su rasporeene kroz vreme ili na razliitim prostorima. Npr. natalitet bez obzira na broj stanovnika odreenog podruja ili natalitet u razliitim regionima u zemlji ili izmeu razliitih zemalja. Relativni brojevi nisu zamena apsolutnim, ve su njihova dopuna.

    Priroda ispitivane pojave, kao i logika povezanost pojava odreuje koja e se vrednost nai u brojitelju, a koja u imenitelju. Brojitelj je vrednost pojave koju uporeujemo, a imenitelj vrednost pojave na osnovu koje vrimo poreenje.

    Relativni brojevi se dele na: 1. Indekse strukture 2. Koeficijente intenziteta 3. Indekse dinamike

    3.1. Indeksi strukture Indeksi strukture pokazuju relativni odnos neke pojave u odnosu na celinu. Ovi

    relativni brojevi se prikazuju procentualno (0 100%) ili u vidu proporcije (0 1). Pokazuju sastav jedne celine, odnosno iz kojih i kavih delova se sastoji statistika masa ili posmatrani skup, ili kakvi su koliinski odnosi pojedinih delova statistike mase u odnosu na celinu ili posmatrani osnovni skup. Indeks strukture se izraunava na sledei nain:

    Indeks strukture = 100celina

    mase deo

  • 27

    Tabela 1. Stanovnitvo u Republici Srbiji po dobnim grupama i polu prema proceni za 2007. godinu

    Starost (godine) Pol Svega 19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-64 65

    Muko 3588957 815288 255127 260965 255674 237651 238686 256981 292754 438775 537056 ensko 3792622 773802 245415 252413 253124 239408 244762 265481 301678 482291 734249 Ukupno 7381579 1589090 500542 513378 508798 477059 483448 522462 594432 921066 1271304

    Tabela 1 pokazuje broj stanovnika u Srbiji po dobnim grupama prema proceni

    iz 2007. godine. Ova tabela je puna podataka koji su teki za interpretaciju i iz nje se ne mogu doneti vani zakljuci. Zato se prelazi na izraunavanje relativnih brojeva koji e pokazati udeo stanovnika prema starosnoj strukturi i prema polu.

    19 1589090 0,2153 100 21,53%7381579

    20-24 500542 0,0678 100 6,78%7381579

    25-29 513378 0,0695 100 6,95%

    7381579

    30-34 508798 0,0689 100 6,89%

    7381579

    35-39 477059 0,0646 100 6,46%

    7381579

    40-44 483448 0,0655 100 6,55%

    7381579

    45-49 522462 0,0708 100 7,08%7381579

    50-54 594432 0,0805 100 8,05%7381579

    55-64 921066 0,1248 100 12,48%7381579

    65 1271304 0,1722 100 17,22%7381579

    100%

    Tabela 2. Starosna struktura stanovnitva Srbije (procentualno izraena)

    Starost Pol 19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-64 65 Muko 11,04 3,46 3,54 3,46 3,22 3,23 3,48 3,97 5,94 7,28 ensko 10,48 3,32 3,42 3,43 3,24 3,32 3,60 4,09 6,53 9,95 Ukupno 21,53 6,78 6,95 6,89 6,46 6,55 7,08 8,05 12,48 17,22

  • 28

    Na osnovu izraunatih indeksa strukture moe se zakljuiti da je procentualno najzastupljenije stanovnitvo starosti do 19 godina, dok je najmanje zastupljena starosna kategorija od 35-39 godina.

    Na ovaj nain odreena dobna struktura stanovnitva moe biti prikazana tabelarno (tabela 2) i grafiki. Grafiki se najee struktura neke pojave prikazuje povrinskim krunim dijagramom. Jedan procenat strukture na grafiku predstavlja 3,6 ugla, to znai da se dobijeni procenti mnoe sa 3,6 i dobijaju se vrednosti ugla koji predstavlja deo odreene strukture na krunom dijagramu.

    21,53%

    6,78%

    6,95%

    6,89%

    6,46%6,55%7,08%

    8,05%

    12,48%

    17,22%

    65

    Grafikon 1. Dobna struktura stanovnitva u Srbiji

    3.2. Koeficijenti intenziteta

    Koeficijent intenziteta (stopa) je relativni broj koji predstavlja odnos dve

    masovne pojave, koje su na neki nain meusobno povezane. U takozvanoj vitalnoj statistici masovna pojava koja predstavlja baznu vrednost uglavnom je ukupan broj stanovnika Srbije u odreenom vremenskom trenutku. Stope u epidemiologiji i socijalnoj medicini imaju iroku primenu jer se njima iskazuje kretanje broja stanovnika, rasprostranjenost i uestalost oboljenja, invalidnost, povreivanje itd.

    Relativni odnos, tj. broj koji se dobije poreenjem dve masovne pojave mnoi se odreenim koeficijentom. Vrednost koeficijenta zavisi od veliine dobijenog relativnog broja. to je brojana vrednost manja koeficijent je vei.

    Koeficijenti: x 100 = procenti x 1000 = promili x 10000 = decili x 100000 = decimili

  • 29

    Pokazatelji raanja i umiranja Osnovni pokazatelji raanja i umiranja populacije su:

    br. ivoroene deceNatalitet = 1000br. stanovnika

    ukupan br. umrlihMortalitet = 1000

    br. stanovnika

    Prirodni prirataj = Natalitet Mortalitet

    br. ivoroenih - br. umrlihPrirodni prirataj = 1000br. stanovnika

    br. ivoroene deceFertilitet = 1000

    br. ena starosti 15-45 godina

    br. umrlih od neke bolestiSpecifini mortalitet = 1000

    br. stanovnika

    br. umrle odojadi u toku godineMortalitet odojadi = 1000br. ivoroene dece u istoj godini

    br. umrlih od odreene bolesti Letalitet = 100

    ukupan br. obolelih od iste bolesti

    Pokazatelji oboljevanja stanovitva Analiza zdravstvenog stanja stanovnitva neke drave ili nekog regiona, pored

    pokazatelja umiranja, uglavnom se bazira na pokazateljima oboljevanja stanovnitva. Na osnovu ovih podataka vri se organizacija i unapreenje zdravstvene zatite.

    Morbiditet predstavlja oboljevanje stanovnika od neke bolesti u datom trenutku. Morbiditet moe biti opti i specifini kada se rauna za neku odreenu bolest. Radi se o stopi koja nije precizno definisana. Zato se danas najee koriste incidencija i prevalencija.

    Incidencija je mera uestalosti nekog oboljenja. Ona pokazuje broj novootkrivenih sluajeva odreene bolesti u toku godine u odnosu na ukupan broj stanovnika sredinom te godine.

    br. novoregistrovanih od nekog oboljenja u toku godineIncidencija = 1000 ili 10.000 ili 100.000

    br. stanovnika sredinom godine

  • 30

    Prevalencija se smatra stopom rasprostranjenosti neke bolesti. Ona predstavlja ukupan broj obolelih na nekom podruju od odreene bolesti u odnosu na ukupan broj stanovnika sredinom godine.

    br. ukupno obolelih od neke bolesti na dan 31.12.Prevalencija = 1000 ili 10.000 ili 100.000

    br. stanovnika sredinom godine

    3.3. Indeksi dinamike Obzirom da veina pojava vezanih za zdravstveno stanje stanovnitva pokazuje

    izrazitu varijabilnost, za praenje promena neke pojave koje nastaju kroz vreme koriste se indeksi dinamike. U zavisnosti da li je bazna vrednost tj. vrednost u odnosu na koju se prati dinamika neke promene stalna ili promenljiva, ovi indeksi se dele na bazine i lanane. Bazna vrednost se izjednaava sa 100%. Vrednosti indeksa dinamike manje od 100% pokazuju da se pojava smanjuje, a ako su vee od 100% pokazuju da se promena poveava.

    Bazini indeksi imaju stalnu baznu vrednost u odnosu na koju se porede sve ostale vrednosti u uzastopnim vremenskim intervalima. Bazini indeksi pokazuju razvoj neke pojave kroz vreme. Kao stalna baza ne mora se uvek uzeti stanje pojave iz prvog vremenskog perioda, ve bi trebalo uzeti stanje iz onog perioda kada pojava pokazuje normalnost i stabilnost.

    Lanani indeksi nemaju stalnu bazu, tj. bazna vrednost je uvek vrednost neke pojave iz prethodnog vremenskog perioda. Dakle, lanani indeksi pokazuju tempo razvoja pojave, odnosno brzinu kretanja posmatrane pojave.

    ematski je prikazana razlika u izraunavanju baznih i lananih indeksa neke

    pojave u periodu od 2000. do 2008. godine.

    2000

    2001

    2002

    2003

    2004

    2005

    2006

    2007

    2008

    Bazini indeksi

    Lanani indeksi

  • 31

    Primer: U tabeli je prikazan broj obolelih od infarkta miokarda u Srbiji u periodu od 2005. do 2008. godine po polu. Proceniti kakav je razvoj oboljevanja od infarkta miokarda tokom vremena i kakav je tempo razvoja ove bolesti?

    Na osnovu izraunatih bazinih indeksa moe se zakljuiti da je kod mukaraca

    oboljevanje od infarkta miokarda bilo u konstantnom opadanju u posmatranom periodu, da bi u 2008. godini broj obolelih iznosio 49,2% od broja u 2005. godini. Lanani indeksi pokazuju da je najvei relativni pad broja obolelih nastupio izmeu 2006. i 2007. godine i to za 35,6% (100-64,4=35,6%), a najmanje relativno umanjenje broja obolelih je nastupilo izmeu 2007. i 2008. godine i to za 3,6%.

    Kod ena bazini indeksi pokazuju porast broja obolelih u posmatranom periodu. Lanani indeksi ukazuju da je relativni porast broja obolelih ena nastupio izmeu 2005. i 2006. godine i to za 50,4%, a nii porast je evidentiran izmeu 2007. i 2008. godine i to za 3,4%, dok je izmeu 2006. i 2007. godine broj obolelih ena opao za 31,8%.

    God. Mu. Bazini indeks Lanani indeks en. Bazini indeks Lanani indeks

    2005 4211 100% - 2871 100% -

    2006 3338 3338 100 79,3%4211

    3338 100 79,3%4211

    4317 4317 100 150, 4%2817

    4317 100 150, 4%2817

    2007 2151 2151 100 51,1%4211

    2151 100 64, 4%3338

    2946 2946 100 102, 6%2871

    2946 100 68, 2%4317

    2008 2073 2073 100 49, 2%4211

    2073 100 96, 4%2151

    3045 3045 100 106,1%2871

    3045 100 103, 4%2946

  • 32

    Zadaci za vebanje 1. U tabeli 1 su prikazani osnovni podaci vitalne statistike u Srbiji u periodu

    od 20032007. godine.

    Godina Br. stanovnika ivoroeni Umrli Mrtvoroeni Umrla odojad 2007 7.381.579 68.102 102.805 369 484 2006 7.411.569 70.997 102.884 365 525 2005 7.440.769 72.180 106.771 361 579 2004 7.463.157 78.186 104.320 419 633 2003 7.532.613 79.025 103.964 411 711

    Izraunati natalitet, mortalitet i prirodni prirataj u 2007. godini. Izraunati smrtnost odojadi u 2005. Odrediti kada je bila najnia stopa smrtnost odojadi u odnosu na 2003. godinu, i kakav je bio tempo smrtnosti u ispitivanom periodu.

    2. Ako je ukupan broj ena u reproduktovnom periodu od 1945 godina 1.235.122 u 2007. godini na osnovu podataka iz tabele 1 odrediti fertilitet.

    3. Preme podacima od 31.12.2007. godine u primarnoj zdravstvenoj zatiti u

    Niu i Novom Sadu bilo je zapoljeno doktora medicine, stomatologa i farmaceuta u zdravstvenim ustanovama:

    Grad Opta medicina Specijalisti medicine Stomatolozi Farmaceuti

    Ni 99 1.254 170 93 Novi Sad 180 1.182 133 89

    Ako je sredinom 2007. godine broj stanovnika u Niu bio 239.645, a u

    Novom Sadu 319.259 izraunati gde su zdravstveni radnici bili optereeniji brojem potencijalnih korisnika?

    4. U Srbiji je u 2007. godini od infarkta miokarda obolelo 5.097, a umrlo

    1.139 osoba. Ako je broj stanovnika sredinom godine bio 7.381.579 izraunati specifini mortalitet i letalitet.

    5. Prema podacima populacionog registra za dijabetes u Srbiji je u 2007.

    godini evidentirano 16.606 novoobolelih osoba svih uzrasta od dijabetesa tipa 2, dok je ukupan broj obolelih iznosio 398.764. Izraunati incidenciju i prevalenciju dijabetesa, ako znamo da je broj stanovnika sredinom 2007. godine bio 7.381.579.

  • 33

    4. MERE CENTRALNE TENDENCIJE SREDNJE VREDNOSTI

    Mere centralne tendencije imaju za cilj da odrede centar osnovnog skupa.

    Jednostavnije reeno, ove mere treba da daju informaciju o onome to je tipino, zajedniko za sve elemente (jedinice) jednog skupa. Vrednosti distribucija frekvencija (serija) saimamo toliko, da ih svodimo na jednu jedinu vrednost. Postoje vie mera centralne tendencije i svaka ima svoje prednosti i nedostatke. Dele se na:

    - potpune (matematike): aritmetika sredina, harmonijska sredina i geometrijska sredina i

    - poloajne: medijana i mod.

    4.1. Aritmetika sredina prosek Najee koriena mera centralne tendencije je aritmetika sredina ili prosek.

    Njena definicija je jednostavna: suma vrednosti podataka podeljena brojem podataka. Matematika definicija aritmetike sredine je:

    1 2 3 nx + x + x + ... + x xx = =

    n n

    gde je: x - aritmetika sredina (x - bar),

    1 2 3 nx , x , x , ... x - vrednosti obeleja kod pojedinih ispitanika, n - broj podataka ili veliina uzorka i - grko veliko slovo sigma, koje oznaava zbir ili sumu (oznaava sabiranje pojedinanih vrednosti obeleja x).

    Primer: Telesna masa petoro sluajno izabrane novorodjenadi iznosila je: 3,2; 4,8; 3,7; 5,0 i 4,3 kg. Kolika je prosena teina ove grupe novoroenadi?

    Reenje: Koristei navedenu optu formulu i opte simbole neophodno je prvo sabrati vrednosti: x1=3,2; x2=4,8; x3=3,7; x4=5,0 i x5=4,3 kg, pa njihov zbir podeliti sa 5 opservacija u uzorku (veliina uzorka: n=5). Dakle, aritmetika sredina telesne mase ove grupe novoroenadi je:

    3,2 4,8 3,7 5,0 4,3 4,25

    x kg

    Prosena telesna masa pri roenju ove grupe novoroenadi iznosi 4,2 kg. Dati nain izraunavanja aritmetike sredine, kao centralne vrednosti skupa ili

    uzroka, moe da se primeni samo kod malih uzoraka i kada su podaci dati u vidu empirijske serije, odnosno kada nisu sreeni u vidu distribucije frekvencija.

    Aritmetika sredina za prostu distribuciju frekvencija izraunava se na taj

    nain to se vrednosti distribucije (x) mnoe (ponderiu) svojim odgovarajuim

  • 34

    frekvencijama (f), pa se dobijeni zbir proizvoda (fx), podeli sa ukupnom frek-vencijom. Matematika definicija ponderisane aritmetike sredine je:

    1 1 2 2 3 3 n n

    1 2 3 n

    f x + f x + f x + ... + f x f xx = = f + f + f + ... + f f

    gde je f - broj elemenata uzorka.

    Primer: Izraunajmo prosek lanova po jednom domainstvu u jednoj zgradi,

    na osnovu podataka tabele br. 1. Radi pravilnog postupka i dobijanja tanih vrednosti treba prvo formirati radnu tabelu.

    Radna tabela za izraunavanje ponderisane aritmetike sredine

    Broj lanova domainstva x

    Broj domainstava f fx

    1 8 1 8 = 8 2 11 2 11 = 22 3 29 3 29 = 87 4 11 4 11 = 44 5 4 5 4 = 20 63 181

    Na osnovu podataka iz radne tabele sledi:

    fx 181x = = = 2,87f 63

    Dakle, navedena zgrada sa 63 domainstva u proseku je imala 2,87 lana po jednom domainstvu. Pri izraunavanju aritmetike sredine, esto se dobijaju apsurdne vrednosti, kao 2,87 lana po domainstvu (gornji primer), ili 5,6 pregleda po jednom korisniku, 2,3 dijagnoze po jednom bolesniku itd. Meutim, ove se vrednosti u statis-tikim izraunavanjima upotrebljavaju kao takve, pa treba izbegavati zaokruivanje na cele brojeve.

    Aritmetika sredina za distribuciju frekvencije sa grupnim intervalima

    izraunava se po slinom postupku, s tim to se grupni intervali zamene svojim arit-metikim sredinama ( ix ), pa se te vrednosti mnoe odgovarajuim frekvencijama. Aritmetika sredina grupnog intervala se odreuje na taj nain, to se saberu poetna (donja) vrednost intervala i zavrna (gornja) vrednost intervala, pa se dobijeni zbir podeli sa 2. Matematika definicija aritmetike sredine za distribuciju frekvencija sa grupnim intervalima je:

    1 2 3 n1 2 3 n

    1 2 3 n

    f x + f x + f x + ... + f x f xx = = f + f + f + ... + f f

    i

    gde je: ix - aritmetika sredina grupnog intervala.

  • 35

    Primer: Teina 32 uenika je data u vidu distribucije frekvencija sa grupnim intervalima, koja je predstavljena u prve dve kolone sledee tabele. Da bi izraunali prosenu teinu uenika potrebno je formirati radnu tabelu uvoenjem jo dve kolone.

    Radna tabela za izraunavanje aritmetike sredine na osnovu distribucije

    frekvencija sa grupnim intervalima Telesna masa u kg

    x Broj uenika

    f ix ixf 70-74,99 5 (70+74,99)/2=72,5 362,5 75-79,99 8 (75+79,99)/2=77,5 620,0 80-84,99 14 (80+84,99)/2=82,5 1155,0 85-89,99 5 (85+89,99)/2=87,5 437,5

    32 2575,0 Iz podataka tabele sledi:

    47,8032

    0,2575

    fxf

    xi

    Prosena teina uenika je 80,47 kg.

    iroka primena aritmetike sredine kao mere centralne tendencije nije sluajna. Ona ne samo da je jednostavna, razumljiva i laka za raunanje, ve ima jo mnoge poeljne osobine:

    1. Moe da se izrauna za bilo koji niz intervalnih podataka, to znai da uvek postoji;

    2. Bilo koji niz podataka ima samo jednu aritmetiku sredinu, to znai da je ona jedinstvena vrednost bilo kog niza;

    3. Za njeno izraunavanje uzimaju se u obzir svi podaci, to znai da na njenu veliinu utiu sve vrednosti niza, od najmanje do najvee;

    4. Suma pojedinanih odstupanja lanova statistike serije od aritmetike sre-dine uvek je jednaka 0. Kao ilustraciju uzmimo pet novoroenadi iju smo aritmetiku sredinu ve izraunali: x =4,2.

    n Vrednost xx 1 3,2 3,2-4,2=-1,0 2 4,8 4,8-4,2=0,6 3 3,7 3,7-4,2=-0,5 4 5,0 5,0-4,2=0,8 5 4,3 4,3-4,2=0,1

    0

    5. Zbir kvadrata odstupanja pojedinanih vrednosti od aritmetike sredine jednak je minimumu:

    min)( 2xx

  • 36

    Drugim reima, zbir kvadrata odstupanja od bilo koje druge vrednosti niza, pa i od medijane i moda, kao mera centralne tendencije vei je od zbira kvadrata odstupanja od aritmetike sredine:

    Ovo je veoma vana osobina aritmetike sredine jer ona omoguava primenu

    metoda najmanjih kvadrata. Aritmetiku sredinu nema smisla raunati ako raspodela nije simetrina, kada

    imamo mali broj podataka i kada je izraena velika varijabilnost podataka. Pored aritmetike sredine, koja predstavlja najee korienu meru centralne

    tendencije, pomenuemo i harmonijsku i geometrijsku sredinu koje takoe spadaju u matematike mere centralne tendencije.

    Harmonijska sredina upotrebljava se ree i to kod serija u kojima postoje

    ekstremne vrednosti ili u situacijama kada su vrednosti kojima raspolaemo izraene u proporcijama ili kada su obeleja izraena u merama koje predstavljaju proporcije (na primer km/h). U tim sluajevima je harmonijska sredina tanija mera centralne tendencije nego aritmetika sredina.

    Ona se rauna po formuli:

    Iz formule moemo videti da harmonijska sredina predstavlja recipronu vrednost aritmetike sredine recipronih vrednosti za koje se sredina izraunava.

    Harmonijska sredina je uvek manja i od geometrijske i od aritmetike, osim ako svi lanovi niza nisu jednaki.

    Tipian primer, koji nije iz medicine, ali iz koga je najlake razumeti primenu harmonijske sredine bi bio sledei: Ako udaljenost od 200km voza pree vozei u jednom smeru prosenom brzinom od 50km/h, a u drugom smeru brzinom od 100km/h, kolika je prosena brzina tog vozaa tokom celog puta? Ona nije (50+100)/2=75km/h jer tada u obzir nije uzeto i ukupno vreme putovanja, ve iznosi:

    I zaista, vozau je trebalo 4 sata da pree 200km vozei 50km/h u jednom

    smeru i jo 2 sata da pree tih 200km vozei 100km/h, prema tome ukupno 6 sati za 400km. Odatle je prosena brzina iznosila 400/6=66,7km/h, to je rezultat isti kao i kada smo u formuli za harmonijsku sredinu primenili samo vrednosti dve prosene brzine.

    Primer: U tri laboratorije radi se ista vrsta analize. Iz ovih laboratorija smo

    dobili podatke da proseno vreme potrebno za jednu analizu u njima iznosi: u prvoj 1,20 minuta, u drugoj 0,96 minuta i u treoj 0,60 minuta. Nismo dobili informaciju o tome koliko je analiza uraeno u kojoj laboratoriji, niti za koliko dana se navedeni podaci odnose. Potrebno je da odgovorimo na sledea pitanja:

    22 )()( XXMeX 22 )()( XXModX

    1 2 3 1 2 3

    11 1 1 1 1 1 1 1 1... ...

    n n

    nH

    X X X X n X X X X

    2 2 2 66,7 /1 1 1 1 3 0,031 2 50 100 100

    nH km h

    X X

  • 37

    Kolika je prosena produktivnost sve tri laboratorije izraena utrokom vremena po jednoj analizi?

    Koliko analiza moe da se uradi u sve tri laboratorije za 8 sati (jedan radni dan)?

    Kada bi na ova pitanja odgovorili na osnovu izraunavanja aritmetike sredine, rezultati bi bili sledei:

    (1,20+0,96+0,60)/3=0,92 minuta iznosi prosean utroak vremena po jednoj analizi i

    3x60x8/0,92=1562,22 analize se mogu uraditi u sve 3 laboratorije za jedan dan. Kada bi na ova pitanja odgovorili na osnovu izraunavanja harmonijske

    sredine, rezultati bi bili sledei: 3 0,851 1 1

    1,20 0,96 0,60

    H

    minuta je utroak vremena po jednoj analizi i

    3x60x8/0,85=1694,12 analiza moe da se uradi za jedan dan. U situaciji kada ne raspolaemo informacijom o tome koliko je dana koja od

    laboratorija pratila svoju produktivnost, odnosno sa koliko su analiza delili koliko minuta da bi izraunali vrednosti koje smo mi od njih dobili (1,20, 0,96 i 0,60 minuta po jednoj analizi) sa vie poverenja moemo prihvatiti rezultate dobijene na osnovu izraunavanja harmonijske sredine.

    Geometrijska sredina se primenjuje u analizi vremenskih nizova i pomou nje

    se izraunava prosena stopa promene pojave. Kao i svaka srednja vrednost nalazi se izmeu najvee i najmanje vrednosti niza za koji se izraunava i brojano se razlikuje od aritmetike sredine, osim ako svi lanovi niza nisu jednaki. Geometrijska sredina je uvek manja od aritmetike. Izraunava se kao n-ti koren iz proizvoda njegovih lanova:

    1 2 3 ...n nG X X X X

    Primer: Ako je nakon oralne primene nekog leka njegova koncentracija u plazmi u prvom satu iznosila 2 g/mL, u drugom 9 g/mL, a u treem satu 18 g/mL, onda je koncentracija u drugom satu bila 9/2=4,5 puta vea nego u prvom, a u treem satu je bila 18/9=2 puta vea nego u drugom satu. Pitanje je koliko je puta koncentracija rasla u svakom satu?

    Odgovor: 22 4,5 2 9 3 putaG Odnos izmeu aritmetike, harmonijske i geometrijske sredine Date su vrednosti numerike varijable X: 22, 35, 25, 25, 32, 28, 31, 24, 30, 34, 34, 23. Izraunajte: aritmetiku, harmonijsku i geometrijsku sredinu?

  • 38

    343 28,5812

    xx

    N 12 22 35 25 ... 23 28,23G

    12 27,871 0,43055nH

    x

    27,87

  • 39

    Za paran niz vrednosti, medijana se odreuje kao aritmetika sredina dva cen-tralna lana. Mesta centralnih lanova odreuju se prema obrascima:

    lanaprvogmestoN 2

    lanadrugogmestoN 2

    2

    Primer: Dodajmo, prethodnom primeru jo jedno novoroene sa telesnom

    masom od 5,2 kg. Uslov je da vrednosti sredimo po veliini:

    N x 1 3,2 2 3,7

    I cen. l.3 4,3 N/2=6/2=3 mesto prvog centralnog lana Me=(4,3+4,8)/2=9,1/2=4,55kg

    II cen. l.4 4,8 (N+2)/2=(6+2)/2=4 mesto drugog centralnog lana 5 5,0 6 5,2

    Centralne lanove navedenog niza predstavljaju teine 3. i 4. novoroeneta, a

    medijana je aritmetika sredina ovih telesnih masa. Kod parnog niza, 50% novorenadi imaju manju telesnu masu od medijane, a 50% veu.

    Odreivanje mesta medijane i vrednosti medijane za podatke sreene u vidu distribucije frekvencije, zahteva sloeniji matematiki postupak, pa emo ovde izneti samo postupak odreivanja medijane za osnovnu distribuciju frekvencija (bez klasnih intervala).

    Kod distribucije frekvencije, takoe, treba voditi rauna da li je ukupna frek-vencija paran ili neparan broj. Mesto medijane, tj. element ija vrednost predstavlja medijanu izraunava se na sledei nain:

    brojparanfjeakoMeMf2 brojneparanfjeakoMeMf2

    1

    Odreeni element ija vrednost predstavlja medijanu pronalazimo pomou

    kumulativnog zbira apsolutnih frekvencija.

    Primer: Uzmimo ve poznatu distribuciju frekvencija domainstava prema broju lanova:

    X f Kumulativni zbir (odozgo) Kumulativni zbir (odozdo)

    1 8 8 63 2 11 19 55 3 29 48 44 4 11 59 15 5 4 63 4 63 - -

  • 40

    322

    1632

    1 fMeM Broj lanova 32. domainstva predstavljaja mesto medijane. Kumulativni zbir

    odozgo pokazuje da se to domainstvo nalazi izmeu 48 domainstava koja imaju tri lana, pa je Me=3 lana. I u ovom sluaju 50% domainstava imaju manju ili istu vrednost kao medijana, a 50% domainstava istu ili veu vrednost od medijane.

    I da na kraju rezimiramo: Medijana je grublja ocena od aritmetike sredine. Na nju ne utiu ekstremne vrednosti niza; ona moe da se izrauna i kada minimalna i maksimalna vrednost serije nisu poznate.

    Primenjuje se kao mera centralne tendencije kod izrazito heterogenih skupova.

    4.3. Modus Mod, modus, tipina vrednost, je poloajna mera centralne tendencije i to je

    ona vrednost obeleja ili onaj modalitet obeleja, koji ima najveu frekvenciju, najveu zastupljenost u okviru ukupne frekvencije.

    U primeru u kome je data distribucija frekvencija domainstava prema broju lanova, najveu frekvenciju pokazuju domainstva koja imaju 3 lana. Prema tome, vrednost moda je 3 lana.

    Danas se kae za Centralnu Srbiju i Vojvodinu da su tipina domainstva sa po 3 lana (roditelji i jedno dete). Tuberkuloza i zarazne bolesti su tipine za nerazvijene, siromane zemlje. Kardiovaskularne bolesti i rak su tipini za razvijene zemlje.

    Tipino je ono to preovladava. Neke pojave mogu da imaju i dve modalne vrednosti, pa kaemo da su bimodalne.

    Znai, mod nije jedna jedina vrednost skupa, kao to je to aritmetika sredina. Primer: Data je distribucija frekvencija sto studenata prema visini ocene iz

    statistike.

    Ocena Broj studenata 5 6 7 8 9

    10

    10 28 12 10 30 10

    100

    f

    0

    10

    20

    30

    5 6 7 8 9 10

    12 10

    30 28

    10 10

  • 41

    Tipine ocene na ispitu iz Statistike su estica (studenti koji ne dolaze na predavanja) i devetka (studenti koji dolaze na predavanja).

    4.4. Meusobni odnos mera centralne tendencije

    Ako se vrednosti posmatranog obeleja (x) rasporeuju oko svog proseka tako da je najvei broj manjih i veih vrednosti simetrian u odnosu na centar, onda se dobija simetrian raspored, koji se grafiki manifestuje kao simetrina zvonasta linija kao na sledeem grafikonu.

    ModMex ModMex ModMex

    Kod ovog rasporeda, aritmetika sredina, medijana i mod su meusobno

    jednaki (a). Ako u distribuciji frekvencije preovlauju ekstremno vee vrednosti od centra

    onda se dobija kriva, koja je iskrivljena udesno (pozitivna iskrivljenost). Centralne vrednosti se pomeraju tako da je aritmetika sredina udesno (zbog veeg uea visokih ekstremnih vrednosti). Ona ima i najveu vrednost u ovom sluaju meu merama centralne tendencije (b).

    Kad distribucije frekvencije gde preovlauju ekstremno niske vrednosti iskrivljenost je na levoj strani (negativna iskrivljenost) i aritmetika sredina ima manju vrednost i od medijane i od moda (c) .

    Medijana se kod oba navedena rasporeda nalazi izmeu aritmetike sredine i moda, ali je po vrednosti blia vrednosti aritmetike sredine. Iz ovog odnosa proizilazi i aproksimativna matematika veza izmeu mera centralne tendencije:

    3 2Mod Me x Izbor mere, koja e da predstavlja osnovni skup zavisi od stepena iskrivljenosti,

    odnosno od stepena varijabilnosti vrednosti posmatranog obeleja.

  • 42

    4.5. Mere centralne tendencije - izraunavanje u MS Excelu Primer: Na ispitu iz statistike polagalo je 15 studenata medicine i 15 stomatologije.

    Dobili su sledee ocene: Medicinari: 10, 6, 9, 10, 10, 5, 6, 9, 8, 7, 10, 8, 9, 8, 10 Stomatolozi: 6, 5, 5, 6, 7, 9, 8, 5, 5, 6, 8, 7, 6, 9, 10, Izraunati prosenu ocenu studenata medicine i studenata stomatologije? Reenje: U radni list Excela unesemo podatke u dve kolone. Kliknemo na praznu eliju u

    kojoj elimo da se prikae rezultat, na primer A18. Za izraunavanje aritmetike sredine iz negrupisanih podataka koristimo funkciju =AVERAGE (raspon podataka).

    Zadavanje funkcija je mogue na dva naina. Jedan je Insert/Function a drugi direktnim klikom na fx. U oba sluaja otvara se sledei radni prozor:

    U prozoru Insert Function, u polje Or select a category izaberemo Statistical.

    U polju Select a function, imamo veliki broj statistikih funkcija, od kojih je potrebno da izaberemo AVERAGE. Kliknemo na OK i otvara se sledei prozor:

  • 43

    Kliknemo na polje Number1, a zatim oznaimo elije od A2 do A16 (ocene

    studenata medicine). Na desnoj strani prozora ispod polja Number2 ve vidimo Formula result, odnosno prosenu ocenu studenata medicine. Kliknemo OK i u eliji A18 dobijamo prosenu ocenu 15 studenata medicine.

    Za izraunavanje prosene ocene studenata stomatologije, odnosno statistikog niza u koloni B, dovoljno je kopirati formulu iz elije A18 u eliju B18. Kliknemo na A18 i dovedemo kursor na mali crni kvadrat u desnom donjem uglu. Kada veliki krsti postane manji, pritisnemo levi taster mia i razvuemo u desno, i tako funkciju zadamo i na polje B18.

    Medijana i mod: Medijanu i mod izraunavamo na slian nain, birajui u polju Select a function

    funkcije MEDIAN ili MODE, a zatim ponavljamo postupke prikazane za izraunavanje aritmetike sredine.

  • 44

    5. MERE VARIJABILNOSTI DISPERZIJE

    Osnovna karakteristika vrednosti jednog istog obeleja je, da ta vrednost varira od jedne do druge statistike jedinice osnovnog skupa. Te vrednosti, mere centralne tendencije, a pre svega aritmetika sredina, saimaju u jednu brojanu vrednost koja je reprezentativna za sve vrednosti. Njena reprezentativnost zavisi od stepena varijabilnosti pojedinanih vrednosti u odnosu na centralnu vrednost, konkretno u odnosu na aritmetiku sredinu. Ukoliko je varijabilnost manja, utoliko su vrednosti obeleja sabijenije oko aritmetike sredine (manje odstupaju) i ona je reprezentativnija, a za takav skup kaemo da je homogen. Obrnuto, ako je varijabilnost vea, odstupanje pojedinanih vrednosti od aritmetike sredine je vee, a reprezentativnost aritmetike sredine je manja i za takav skup kaemo da je heterogen.

    Ako imamo informaciju da je prosek leenja u jednoj bolnici 8 dana, a u drugoj takoe 8 dana, to navodi na zakljuak da je duina trajanja leenja kod pojedinih sluajeva u veini jednaka u obe bolnice. Drugim reima, da su rasporedi duine trajanja leenja po pacijentu, jednaki u obe bolnice. Meutim, to moe ali ne mora da bude tako. Da bi smo mogli da poredimo dve ili vie serija, pored informacije o prosenoj vrednosti, moramo da imamo i informaciju o odstupanju pojedinanih vrednosti od proseka. Sledi zakljuak da mere varijabilnosti zapravo ukazuju na reprezentativnost mera centralne tendencije. Manja mera varijabilnosti ukazuje na veu reprezentativnost srednje vrednosti i obrnuto. Mere varijabilnosti nas opredeljuju koju od mera centralne tendencije treba da koristimo, aritmetiku sredinu (ukoliko je skup homogen), ili medijanu (ukoliko je skup heterogen).

    Varijabilnost, disperzija, odstupanje pojedinanih vrednosti ispitivanog obeleja u odnosu na prosek merimo tzv. merama varijabilnosti ili disperzije. One mogu da budu, prema brojanom izrazu apsolutne i relativne.

    Apsolutne mere varijabilnosti: 1) Interval varijacije; 2) Interkvartilna razlika; 3) Varijansa i 4) Standardna devijacija. Relativne mere varijabilnosti: 1) Koeficijent varijacije i 2) Standardizovano odstupanje ili z-vrednost.

  • 45

    5.1. Apsolutne mere disperzije 5.1.1. Interval varijacije rang (opseg) vrednosti

    Interval varijacije je gruba i orijentaciona mera varijacije i predstavlja razliku

    izmeu maksimalne i minimalne vrednosti serije. Izraunava se po formuli:

    Iv=Xmax-Xmin

    Primer: U prethodnom primeru, o duini leenja u dve bolnice, najdue leenje jednog bolesnika je iznosilo 22 dana, a najkrae leenje je bilo 6 dana. U drugoj bolnici najdue leenje je bilo 18 dana, a najkrae 5 dana. Na osnovu ovih podataka:

    Iv =Xmax-Xmin = 22-6=16 dana prva bolnica Iv = Xmax-Xmin= 18-5=13 dana druga bolnica

    Na osnovu dobijenih vrednosti za interval varijacije zakljuujemo: 1. U prvoj bolnici su ekstremne vrednosti udaljenije od centralne vrednosti

    serije nego u drugoj bolnici; 2. Vie se sluajeva u drugoj bolnici po duini leenja grupie oko proseka u

    odnosu na prvu bolnicu. Manji interval varijabilnosti koincidira sa veom grupisanou lanova serije oko centralne vrednosti;

    3. to je vei interval varijacije to je vea varijabilnost pojedinanih vrednosti oko proseka, to je prosek manje reprezentativan i obrnuto, manja vrednost, manja varijabilnost, vea sabijenost, vea reprezentativnost proseka.

    Nedostaci: a) Uzima u obzir samo dve vrednosti, odnosno, samo dva lana serije, sa najveom i najmanjom vrednou i b) Obzirom da se radi o ekstremnim vrednostima to one mogu da budu veoma

    udaljene od osnovne koncentracije ostalih vrednosti serije.

    5.1.2. Interkvartilna razlika

    Primer: Izmerena je telesna masa 11 novoroenadi i dobijene vrednosti su sreene po veliini:

    N 1 2 3 4 5 6 7 8 9 10 11 X 2,8 3,2 3,4 3,6 3,7 3,8 4,0 4,4 4,6 4,8 5,0 Q1 Q2 Q3

    Medijanu ovog statistikog skupa predstavlja telesna masa estog novoroen-

    eta pa je Me=3,8 kg. Kao to nam je ve poznato, medijana deli niz na 50% vrednosti manje od medijane i na 50% vrednosti vee od medijane. Ako svaku od ove dve polovine podelimo na jo po pola, dobijamo etiri jednaka dela statistike serije od kojih svaki sadri po 25% vrednosti serije. Ovako ustrojeni delovi serije nazivaju se kvartilima (Q), etvrtinama.

  • 46

    Kako jedan kvartil predstavlja etvrtinu serije, to se njihova mesta u nizu vrednosti izraunavaju na sledei nain:

    1. Mesto prvog kvartila 11 12 3

    4 4NMQ . Teina treeg novoroeneta

    predstavlja vrednost prvog kvartila (Q1), pa je Q1=3,4 kg. U intervalu od 2,8 (minimalna vrednost) do 3,4 kg nalazi se 25% svih vrednosti

    serije i ovo su 25% najmanjih vrednosti od ukupnog broja vrednosti (od 100% vrednosti, od svih vrednosti).

    2. Mesto drugog kvartila 21 12 6

    2 2NMQ . Telesna masa estog

    novoroeneta predstavlja vrednost drugog kvartila, pa je Q2=3,8 kg. Medijana je u stvari drugi kvartil serije, pa je Me=Q2. U intervalu izmeu drugog (medijane) i prvog kvartila nalazi se 25% vrednosti, koje su vee od vrednosti intervala prvog kvartila, ali su manje od svih ostalih vrednosti. U naem primeru ovaj interval je izmeu 3,4 i 3,8 kg.

    3. Mesto treeg kvartila 3 3 1 36 94 4NMQ . Telesna masa devetog

    novoroeneta predstavlja vrednost treeg kvartila, pa je Q3=4,6 kg. U intervalu izmeu Q2 (medijane) i Q3 nalaze se 25% vrednosti serije vee od 50% prethodnih vrednosti ali manje od ostalih 25% vrednosti serije. Za na primer to je interval od 3,8 kg (Q2=Me) do 4,6 kg (Q3).

    4. Vrednost etvrtog intervala predstavlja maksimalnu vrednost serije, pa je u

    naem primeru Q4=5,0 kg.

    Osnovni zakljuak je: Izmeu prvog (Q1) i treeg (Q3) kvartila nalaze se 50% svih vrednosti serije, a van ovog intervala ostaju jo 50% vrednosti, od kojih 25% manjih od Q1 (ekstremno najmanje vrednosti) i 25% vrednosti vee od Q3 (ekstremno najvee vrednosti).

    Zato se razlika izmeu treeg i prvog kvartila uzima kao mera varijabilnosti jer ova mera, za razliku od intervala varijacije iskljuuje ekstremno male i ekstremno velike vrednosti.1

    Dakle, interkvartilnu razliku, moemo da definiemo kao distancu izmeu prvog i treeg kvartila, pa je formula za njegovo izraunavanje:

    3 1Iq Q Q

    Za na primer: Iq = Q3-Q1 = 4,6 3,4 = 1,2 kg U intervalu izmeu 3,4 kg i 4,6 kg, nalazi se telesna masa 50% novoroenadi,

    odnosno u intervalu od 1,2 kg.

    Za sve izvedene radnje i konstatacije uslov je i da je serija sreena po veliini vrednosti od najmanje do najvee ili obrnuto. Drugo, izneti primeri se odnose samo na osnovnu seriju (prost statistiki niz) i sa neparnim brojem podataka u njemu.

  • 47

    to je interkvartilna razlika manja to je varijabilnost vrednosti u seriji manja, a sabijenost oko centra vea i obrnuto.

    Interkvartilna razlika i interval varijacije mogu da se uporeuju i ako je inter-kvartilna razlika znatno manja od intervala varijacije (vie od dva puta), to znai da na krajevima serije postoje ekstremno niske i ekstremno visoke vrednosti. U naim primeru za telesnu masu novoroenadi:

    a) Iv= Xmax Xmin = 5,0 2,8 = 2,2 kg b) Iq = Q3-Q1 = 4,6 3,4 = 1,2 kg c) Iv/Iq = 2,2/1,2 = 1,8 Interval varijacije je manje od dva puta vei od interkvartilne razlike, to znai

    da nema novoroenadi sa ekstremnim vrednostima u odnosu na prosek.

    5.1.3. Varijansa i standardna devijacija Dok interval varijacije obuhvata samo dve vrednosti serije, a interkvartilna

    razlika 50% vrednosti, dotle varijansa i standardna devijacija obuhvataju distancu svih vrednosti u odnosu na prosek (centar), odnosno u odnosu na aritmetiku sredinu.

    Kako je zbir odstupanja svih lanova serije od aritmetike sredine jednak nuli, to nije mogue izraunati prosek odstupanja.2 Da bi se izbegla 0, pristupilo se kvadriranju razlika pojedinanih vrednosti od aritmetike sredine i iz njihovog zbira se izraunava proseno kvadratno odstupanje varijansa (SD2), ija je matematika definicija:

    22 X XSDn

    Transformacijom gore navedene formule dobija se radna formula za

    izraunavanje prosenog kvadratnog odstupanja svih vrednosti serije od aritmetike sre-dine:

    222 XSD X

    n

    Primer: Uzmimo telesne mase 11 novoroenadi iz prethodnog poglavlja:

    2,9 3,0 3,2 3,4 3,5 3,7 3,9 4,1 4,2 4,5 4,7

    Pitanje je: Kolika je vrednost varijanse za datu seriju podataka?

    2 Moe da se izrauna i apsolutno proseno odstupanje od proseka, kada se

    zanemare plus i minus vrednosti, ali ono ne omoguava dalje statistike operacije, pa ovde kao takvo nije ni obraeno.

  • 48

    Reenje: Radi izraunavanja varijanse po navedenim formulama treba konstruisati sledeu radnu tabelu:

    N X XX 2XX X2 1 2,9 2,9 - 3,73 = -0,83 0,6889 8,41 2 3,0 3,0 - 3,73 = -0,73 0,5329 9,00 3 3,2 3,2 - 3,73 = -0,53 0,2809 10,24 4 3,4 3,4 - 3,73 = -0,33 0,1089 11,56 5 3,5 3,5 - 3,73 = -0,23 0,0529 12,25 6 3,7 3,7 - 3,73 = -0,03 0,0009 13,69 7 3,9 3,9 - 3,73 = +0,17 0,0289 15,21 8 4,1 4,1 3,73 = +0,37 0,1369 16,81 9 4,2 4,2 - 3,73 = +0,47 0,2209 17,64

    10 4,5 4,5 - 3,73 = +0,77 0,5929 20,25 11 4,7 4,7 - 3,73 = +0,97 0,9409 22,09 41,1 0,00 3,5859 157,15

    Postupak

    1. Prvo izraunamo aritmetiku sredinu: kg

    nX

    X 73,311

    1,41 2. Zatim izraunamo razlike izmeu svake vrednosti i vrednosti aritmetike sredine:

    X-3,73 kg (trea kolona u radnoj tabeli). Obavezno treba proveriti da li je suma razlika jednaka 0. Ako nije, onda postoji greka u izraunavanju aritmetike sredine. Zanemarljiva razlika, kao u naem primeru moe da se javi zbog zaokruivanja decimala.

    3. Dobijene razlike kvadriramo i kvadrate saberemo i na taj nain dobijemo ukupnu sumu kvadratnog odstupanja (etvrta kolona u radnoj tabeli):

    2 3,5859X X 4. Na osnovu podataka iz radne tabele, a na osnovu formule, dobijamo: 22 23,5858 0,33

    11

    X XSD kg

    n

    Po drugoj formuli, koja se obino i naziva radnom formulom za varijansu, znatno je jednostavnije izraunati varijansu, a vrednost je ista. Umesto tree i etvrte kolone iz predhodne radne tabele, dovoljno je formirati kolonu sa kvadratima svake vrednosti (X2) i dobijene kvadrate sabrati (X2).

    Kako je za na primer X2 = 157,15 (peta kolona u prikazanoj radnoj tabeli) to je:

    22 2157,15 13,91 0,33

    11X

    SD X kgn

    I ovim postupkom je dobijena ista vrednost za varijansu, pa ga zbog jednostav-

    nosti treba primenjivati u praksi.

  • 49

    Treba uoiti da je dobijena vrednost varijanse iskazana kao drugi stepen merne jedinice, odnosno 0,33 kg2, to je apsurdna vrednost i nepogodna je za poreenje.

    Izraunavanjem kvadratnog korena iz varijanse dobija se vrednost standardne devijacije, najee koriene mere varijabilnosti, koja predstavlja proseno odstupanje od aritmetike sredine izraeno u istim mernim jedinicama u kojima je izraena i vrednost posmatranog obeleja.

    Formule za njeno izraunavanje su: 2 2

    22 2 ( ) iliX X X

    SD SD SD Xn n

    Standardna devijacija za na primer bi imala vrednost:

    kgSDSD 57,033,02

    Zakljuivanje: to je vrednost standardne devijacije manja, to je sabijenost vrednosti oko aritmetike sredine vea, pa je i njena reprezentativnost za seriju (uzorak ili osnovni skup) vea i obrnuto, vea vrednost standardne devijacije - vea varijabilnost i sve ostalo to sledi iz toga.

    Nedostatak: Standardna devijacija omoguava poreenje izmeu varijabilnosti dve serije ako su vrednosti date u istim mernim jedinicama i ako su aritmetike sredine serija meusobno jednake. Meutim, i pored ovog nedostatka, kao to emo videti, u statistikoj metodologiji pored aritmetike sredine, standardna devijacija je odigrala najznaajniju ulogu.

    Varijansa i standardna devijacija za distribuciju frekvencije, kao i aritmetika sredina, zahtevaju sloenije matematike postupke, mada u principu postoji analogija sa izraunavanjem kao kod proste statistike serije.

    a) Varijansa i standardna devijacija za osnovnu distribuciju frekvencije (bez

    grupnih intervala) izraunavaju se po formulama: 2 2 22 2 ili f X X fXSD SD X

    f f

    , a podsetimo se: fXXf

    2 2 22 ili f X X fXSD SD SD Xf f

    U praksi treba koristiti drugu formulu za koju je sadraj radne tabele:

    X f fX fX2 X1 f1 f1 X1 (f1 X1)X1 = f1 X12 X2 f2 f2 X2 (f2 X2)X2 = f2 X22 X3 f3 f3 X3 (f3 X3)X3 = f3 X32 Xn fn fn Xn (fn Xn)Xn = fn Xn2 f f X fX2

  • 50

    b) Varijansa i standardna devijacija za distribuciju frekvencije sa grupnim

    intervalima izraunavaju se po formulama: 2 2

    2 22 2 i i ifX fX

    SD X SD SD Xf f

    Podsetimo se: 1. Aritmetika sredina grupnog intervala izraunava se tako to se poetna

    (donja, manja) vrednost i zavrna vrednost (gornja, vea) intervala saberu, pa se dobijeni zbir podeli sa 2.

    2. Formula aritmetike sredine za distribuciju frekvencija sa grupnim intervalima je:

    ifXXf

    5.2. Relativne mere disperzije

    Osnovni nedostatak apsolutnih mera varijabilnosti, pa i standardne devijacije

    kao najrelevantnije, je u tome to se njihove vrednosti moraju da iskazuju u mernim jedinicama u kojima je iskazano posmatrano obeleje, pa nije mogue poreenje varijabilnosti dve serije sa razliitim mernim jedinicama. Ovaj problem je razreen relativnim merama varijabilnosti (1) Koeficijentom varijacije i (2) z -vrednou.

    5.2.1. Koeficijent varijacije

    Koeficijent varijacije (Cv) je odnos (kolinik) izmeu standardne devijacije i aritmetike sredine. Obino se iskazuje u procentima, pa je njegova formula:

    100vSDCX

    Primer: Kod 11 novoroenadi telesna masa je u proseku iznosila X =3,73 kg

    sa SD=0,57 kg, dok je njihova telesna duina u proseku bila X =50 cm sa SD=10 cm. Da li je duina novoroenadi varijabilnija od telesne mase pri roenju?

    Za telesnu masu koeficijent varijacije je: 0,57100 100 15,28%3,73

    SDCvX

    a za telesnu duinu on iznosi:

    10100 100 20,00%50

    SDCvX

    Zakljuivanje: to je relativna vrednost koeficijenta varijabilnosti manja, to je i

    varijabilnost manja, a sabijenost oko proseka vea.

  • 51

    Postoji pravilo po kome ako je relativna vrednost koeficijenta varijacije manja od 30%, statistiki niz (uzorak, osnovni skup) moe se smatrati homogenim, a aritmetika sredina reprezentativnom centralnom vrednou.

    Cv < 30% - homogeni skup Cv > 30% - heterogeni skup

    Prema ovom pravilu, i telesna masa i telesna duina 11 novoroenadi pred-

    stavljaju homogen uzorak (Cv=15,28%

  • 52

    Jedan od ispitanika je imao vrednost testa stajanja od 50 minuta, a testa hodanja od 1300 metara. Drugi ispitanik je imao vrednost testa stajanja od 40 minuta, a testa hodanja od 1400 metara. Pitanja su:

    1. Koliko su vrednosti testova stajanja i hodanja kod svakog od ovih ispitanika odstupale od prosenih vrednosti kod svih ispitanika?

    2. Koje obeleje je iskazalo vee odstupanje od prosene vrednosti kod svakog od ovih ispitanika?

    3. Koji ispitanik je imao povoljnije rezultate, kako po vrednostima svakog od testova, tako i posmatrajui rezultate oba testa u celini?

    I ispitanik II ispitanik

    Test stajanja 50 45 0,50

    10Z

    40 45 0,50

    10Z

    Test hodanja

    1300 1500 0,67300

    Z

    1400 1500 0,33300

    Z

    Kumulativna vrednost oba testa (0,50) ( 0,67) 0,50 0,67 0,17Z ( 0,50) ( 0,33) 0,50 0,33 0,83Z Odgovori: 1. Vrednost testa stajanja je kod prvog ispitanika bila za 0,50 standardnih

    devijacija vea (Z=0,50), a kod drugog za 0,50 standardnih devijacija manja (Z=-0,50) od prosene vrednosti kod svih ispitanika. Vrednosti testa hodanja su kod oba ispitanika bile manje od prosene vrednosti kod svih ispitanika, kod prvog za 0,67 (Z=-0,67), a kod drugog za 0,33 standardnih devijacija (Z=-0,33).

    2. Kod prvog ispitanika je vrednost testa hodanja pokazala vee odstupanje od prosene vrednosti, a kod drugog ispitanika vrednost testa stajanja.

    3. Na testu stajanja je prvi ispitanik imao povoljniji rezultat jer je njegova vrednost testa bila vea od prosene, a drugi ispitanik je imao manju vrednost od prosene. Na testu hodanja su oba ispitanika imala manje vrednosti testa od prosene, ali je odstupanje bilo manje kod drugog ispitanika to predstavlja povoljniji rezultat. Zbir odstupanja vrednosti oba testa je kod prvog ispitanika iznosio Z=-0,17 standardnih devijacija, a kod drugog Z=-0,83 standardnih devijacija i zakljuujemo da prvi ispitanik ima povoljniji rezultat u celini.

    5.3. Mere varijabiliteta - izraunavanje u MS Excelu Varijansa i standardna devijacija:

    Varijansu iz negrupisanih podataka izraunavamo pomou funkcije: =VAR(raspon podataka) Za izraunavanje standardne devijacije koristimo funkciju: =STDEV(raspon podataka)

  • 53

    Za izraunavanje intervala varijacije, interkvartilne razlike, koeficijenta varijacije i Z vrednosti u MS Excel-u ne postoje direktne funkcije ve se svaka od njih dobija kroz nekoliko koraka. U sledeem primeru prikazaemo kako bi izraunali sve prikazane mere centralne tendencije i varijabiliteta, odnosno kako bi u potpunosti opisali statistiku seriju podataka za telesnu masu 11 novoroenadi3. Prvo u kolonu A radnog lista, koju smo oznaili sa TELESNA MASA, unesemo vrednosti telesne mase novoroenadi u elije od A2 do A12. Zatim u zasebnim elijama, koje smo sa leve strane oznaili nazivima parametara, unoenjem funkcija i opsega elija sa podacima izraunamo sve statistike parametre za koje u Excelu postoje definisane funkcije, a to su: Parametar: Funkcija: Aritmetika sredina AVERAGE(A2:A12), Medijana MEDIAN(A2:A12), Mod MODE(A2:A12), Maksimalna vrednost MAX(A2:A12), Minimalna vrednost MIN(A2:A12), Varijansa VAR(A2:A12), Standardna devijacija STDEV(A2:A12), Prvi kvartil QUARTILE(A2:A12;1),4 Trei kvartil QUARTILE(A2:A12;3)

    3 Jednu vrednost od 3,4kg smo zamenili sa 3,5gk kako bi serija imala i Mod. 4 Za kvartile je u posebnom polju radnog prozora funkcije potrebno upisati i koji kvartil zelimo da izracunamo

    (1., 2. ili 3.)

  • 54

    Interval varijacije izraunavamo tako to u posebnu eliju (u naem primeru D11, koju smo predhodno oznaili nazivom parametra sa leve strane) ukucamo znak =, zatim kliknemo na eliju D5 (tu nam se nalazi izraunata maksimalna vrednost), potom ukucamo znak -, zatim kliknemo na eliju D6 (tu nam se nalazi izraunata maksimalna vrednost) i na kraju pritisnemo dugme Enter na tastaturi. U eliji D11 se pojavljuje vrednost intervala varijacije od 1,80, a u formula baru se vidi formula koju smo upisali u eliju, odnosno =D5-D6.

    Za izraunavanje interkvartilne razlike u eliju D12 upiemo znak =, kliknemo na eliju D10 (tu nam se nalazi izraunata vrednost treeg kvartila), upiemo znak -, kliknemo na eliju D9 (tu nam se nalazi izraunata vrednost prvog kvartila) i pritisnemo dugme Enter. U eliji D12 se pojavljuje vrednost interkvartilne razlike od 0,80, a u formula baru se vidi formula koju smo upisali u eliju, odnosno =D10-D9. Za izraunavanje koeficijenta varijacije u eliju D13 upiemo znak =, kliknemo na eliju D8 (tu nam se nalazi izraunata vrednost standardne devijacije), upiemo znak /, kliknemo na eliju D2 (tu nam se nalazi izraunata vrednost aritmetike sredine), ukucamo *100 i pritisnemo dugme Enter. U eliji D13 se pojavljuje vrednost koeficijenta varijacije od 15,86, a u formula baru se vidi formula koju smo upisali u eliju, odnosno =D8/D2*100. Ukoliko bi eleli da izraunamo Z vrednost za neku pojedinanu vrednost, na primer za 3,5 kg, u eliju D14 upiemo =(3,5- zatim kliknemo na eliju D2 (tu nam se nalazi izraunata vrednost aritmetike sredine), potom upiemo )/, zatim kliknemo na eliju D8 (tu nam se nalazi izraunata vrednost standardne devijacije) i pritisnemo dugme Enter. U eliji D14 se pojavljuje Z vrednost od -0,41, a u formula baru se vidi formula koju smo upisali u eliju, odnosno =(3,5-D2)/D8.

  • 55

  • 56

    Pitanja i zadaci za vebu

    1. Definii pojmove: masovna pojava; statistika jedinica; obeleje; osnovni skup i varijabilnost?

    2. U emu je bitna razlika izmeu ive i neive prirode? 3. U emu je razlika izmeu osnovne empirijske serije i distribucije frekvencije? 4. Da li atributivna obeleja mogu da uzmu svaku brojanu vrednost? 5. Saini anketu o nekom problemu i sprovedi je meu licima iz okoline za koja

    smatra da su zainteresovana za taj problem. Sredi podatke iz ankete u vidu serija, tabela i prikai grafiki. Analiziraj dobijene informacije.

    6. Dati su originalni podaci o ocenama studenata na ispitu iz Statistike: