17
VISOKA HEMIJSKO TEHNOLOŠKA ŠKOLA KRUŠEVAC Seminarski rad EMPIRIJSKA RASPODELA Student: Nikola Tomić 78 Profesor: Branko Grubić Kruševac, 2014

Seminarski Empirijska Raspodela Adobe

Embed Size (px)

DESCRIPTION

Seminarski Rad + Empirijska RaspodelaPredmet + Matematicka Statistika

Citation preview

  • VISOKA HEMIJSKO TEHNOLOKA KOLA KRUEVAC

    Seminarski rad

    EMPIRIJSKA RASPODELA

    Student: Nikola Tomi 78 Profesor: Branko Grubi

    Kruevac, 2014

  • 2

    SADRAJ

    1.0 EMPIRIJSKA RASPODELA ........................................................................................................ 3

    1.1 GRUPISANJE PODATAKA ....................................................................................................... 3

    2.0 OBLIK EMPIRIJSKE RASPODELE ............................................................................................ 9

    2.1 ASIMTERIAN OBLIK RASPODELE ..................................................................................... 10

    3.0 DESKRIPTIVNE MERE EMPIRIJSKIH RASPODELA ........................................................... 12

    3.1 MERE CENTRALNE TENDENCIJE ....................................................................................... 12

    3.2 MERE VARIJABILITETA ......................................................................................................... 13

    3.3 ODNOSI I PROPORCIJA ........................................................................................................ 13

    PRIMER ............................................................................................................................................. 13

    LITERATURA ................................................................................................................................... 17

  • 3

    1.0 EMPIRIJSKA RASPODELA

    Empirisjka raspodela je raspodela uestalosti vrednosti obeleja posmatranja.

    Nastaju grupisanjem (sreivanjem, razvrstavanjem, organizovanjem) i prebrojavanjem jedinica opservacije koje odgovaraju odreenoj vrednosti obeleja. Uestalost (frekvencija) je broj jedinica opservacije koje odgovaraju odreenoj vrednosti obeleja.

    Prikazuju se tabelarno i grafiki.

    1.1 GRUPISANJE PODATAKA

    Grupisanje razvrstavanje jedinica posmatranja po gradacijama vrednosti posmatranog obeleja.

    Za nominalne i ordinalne podatake grupisanje se obavlja po kategorijama modalitetima

    Za numerike diskontinuirane podatke grupisanje se obavalja po grupama koje odgovaraju diskretnim vrednostima, a ako je raspon veliki onda po klasnim

    intervalima

    Za numeriko kontinuirano obeleje grupisanje se obavlja po klasnim intervalima

    Uestalosti apsolutne i relativne, parcijalne i kumulativne

    Apsolutne uestalosti nastaju prebrojavanjem.

    Relativne uestalosti odnos apsolutnih uestalosti i ukupnog broja jedinica opservacija.

    Parcijalne uestalosti uestalosti pojedinanih kategorija ili grupnih intervala.

    Kumulativne uestalosti sukcesivni zbirovi uestalosti pojedinih kategorija ili grupnih intervala.

    Nominalni podaci - tabelarni prikaz raspodele uestalosti

    Apsolutne frekvencije Relativne frekvencije

    Navika puenja n %

    Puai 23 46

    Nepuai 27 54

    Ukupno 50 100

  • 4

    Nominalni podaci grafiki prikaz raspodele uestalosti krunim dijagramom i stubiastim dijagramom

    27

    23

    Nepuai 54%

    Puai 46%

    21

    22

    23

    24

    25

    26

    27

    28

    Puai Nepuai

    Ue

    stal

    ost

    Stubiasti dijagram

  • 5

    Ordinalni podaci - tabelarni prikaz raspodele uestalosti

    Parcijalne frekvencije Kumulativne frekvencije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Zadovoljstvo

    zdr . zatitom n % n %

    Vrlo

    nezadovoljan

    4 8 4 8

    Nezadovoljan 6 12 10 20

    Neutralan 20 40 30 60

    Zadovoljan 16 32 46 92

    Vrlo

    zadovoljan

    4 8 50 100

    Ukupno 50 100

    Ordinalni podaci grafiki prikaz raspodele uestalosti krunim dijagramom i stubiastim dijagramom

    32%8%

    12%

    8%

    40%

    Zadovoljan

    Vrlo zadovoljan

    Nezadovoljan

    Vrlo nezadovoljan

    Neutralan

  • 6

    Numeriki diskontinuirani podaci tabelarni prikaz raspodele uestalosti

    Parcijalne frekvencije Kumulativne frekvencije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Br. resp.

    infekcija

    N % N %

    0 13 26 13 26

    1 12 24 25 50

    2 10 20 35 70

    3 10 20 45 90

    4 3 6 48 96

    5 2 4 50 100

    Ukupno 50 100

    Zadovoljan Vrlo zadovoljan Nezadovoljan Vrlonezadovoljan

    Neutralan

    0

    5

    10

    15

    20

    25

    Ordinalni prikaz - Stubiasti dijagram

    Ue

    stal

    ost

  • 7

    Numeriki diskontinuirani podaci prikaz raspodele uestalosti tapiastim dijagramom

    Numeriki kontinuirani podaci tabelarni prikaz raspodele uestalosti

    Parcijalne frekvencije Kumulativne frekvencije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Apsolutne

    frekvecije

    Relativne

    frekvecije

    Starost

    (godine)

    N % N %

    15 - 19 2 4 2 4

    20 - 24 6 12 8 16

    25 - 29 7 14 15 30

    30 - 34 16 32 31 62

    35 - 39 5 10 36 72

    40 - 44 5 10 41 82

    45 - 49 5 10 46 92

    50 - 54 4 8 50 100

    Ukupno 50 100

    0 1 2 3 4 5

    0

    2

    4

    6

    8

    10

    12

    14

    Ue

    stal

    ost

    Broj respiratornih infekcija

  • 8

    Numeriki kontinuirani podaci prikaz raspodele uestalosti histogramom i poligonom frekvencija

    2

    67

    16

    5 5 54

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54

    Histogram - prikaz uestalosti

    Starost

    15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    Ue

    stal

    ost

    Starost

  • 9

    2.0 OBLIK EMPIRIJSKE RASPODELE

    Osnovne informacije o obliku empirijske raspodele se mogu dobiti iz grafikih prikaza (histogram, poligon frekvencija, tapiasti dijagrm, stubiasti dijagram)

    Oblik se obino klasifikuje kao unimodalan, bimodalan ili multimodalan. Unimodalan oblik moe biti simetrian ili asimetrian (pozitivno ili desno iskoen, negativno ili levo iskoen).

    1 3 4 5 6 9 11 12 16 18 17 14 11 8 5 4 3 2 2 1

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    Ue

    stal

    ost

    Unimodalna raspodela

    1 3 7 12 18 13 9 4 2 1 1 3 6 11 18 12 10 4 2 1

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    Ue

    stal

    ost

    Bimodalna raspodela

  • 10

    2.1 ASIMTERIAN OBLIK RASPODELE

    Vrednost skjunisa vea od 1 ukazuje na desnu iskoenost, a vrednost manja od - 1 na levu iskoenost

    Desna iskoenost

    Leva iskoenost

    Zailjenost / zaravnjenost raspodele

    Vrednosti kurtosisa vee od 1 ukazuju nailjatu raspodelu, a manje od - 1 ukazuju na zaravnjenu raspodelu

    Mezokurtina

  • 11

    Leptokurtina Zailjena

    Platikurtina Zaravnjena

    Grafikon kutije (boxplot)

    Prikazuje minimalnu i maksimalnu vrednost (produeci), kvartile (duina kutije) i medijanu (linija koja preseca kutiju).

  • 12

    Produeci pokazuju minimalnu i maksimalnu vrednost ako su one unutar 1.5 duine kutije od same kutije (interkvartilni opseg). Vrednosti koje su udaljene od kutije 1.5 do 3 njene duine oznavaavaju se kao neobine vrednosti (outlier), a vrednosti koje su udaljene vie od 3 duine kutije nazivaju ekstremnim vrednostima.

    Neobine i ekstremne vrednosti zahtevaju proveru i eventualnu korekciju ako je u pitanju pogrean podatak.

    3.0 DESKRIPTIVNE MERE EMPIRIJSKIH RASPODELA

    3.1 MERE CENTRALNE TENDENCIJE

    Aritmetika sredina

    =

    Aritmetiku sredinu koristiti kada postoji priblino simetrina raspodela. Ne koristiti je kod asimetrine raspodele, raspodele sa ekstremnim vrednostima i bimodalne raspodele.

    Medijana

    Centralna vrednost, srednja poziciona vrednost. Centralna vrednost u nizu podataka poreanih po veliini. Deli distribuciju na dva jednaka dela. 50% vrednosti se nalazi ispod medijane, a 50% vrednosti iznad medijane. Medijana je bolja mera centralne tendencije od aritmetike sredine kada je raspodela iskoena ili sadri ekstremne vrednosti.

    Mod

    Tipina vrednost. Vrednost sa najveom frekvencijom. Pogodan za primenu kod nominalnih i ordinalnih podataka.

    Kvantili

    Dele raspodelu uestalosti na n jednakih delova.

    Frakcija Naziv

    Medijana

    1/3 Tercil

    Kvartil

    1/5 Kvintil

    1/10 Decil

    1/100 Percentil

  • 13

    3.2 MERE VARIJABILITETA

    Apsolutne

    mere

    varijabiliteta

    Interval varijacije

    Varijansa 2 =( )

    2

    1

    Standardna devijacija = ( )2

    1

    Interkvartilni opseg 1 3

    Relativne

    mere

    varijabiliteta

    Koeficijent varijacije =

    100

    Standardizovana vrednost =

    3.3 ODNOSI I PROPORCIJA

    Odnos pokazuje relativan odnos dva kvanatiteta a/b. Odnos je bez dimenzija ako su oba kvantiteta

    iskazana istim jedinicima. Primer odnosa ukljuuje odnos ansi i odnos rizika.

    Proporcija je specifian tip odnosa gde je brojilac deo imenioca - odnos apsolutne frekvencije (x) jedinica opservacije sa datom karakteristikom i totalnog broja (n) jedinica opservacije: p=x/n.

    Vrednosti proporcije su ograniene na interval od 0.0 do 1.0. Ova relativna frekvencija moe biti interpretirana ekvivalentno veroavtnoi. Proporcija se moe iskazati u procentima p(%)=100*x/n.

    Stopa

    Stopa je broj (frekvencija) dogaaja, kao to su roenje, bolest ili smrt, koji se mogu pojaviti u odreenom periodu, podeljeno prosenom populacijom tokom tog perioda. Stopa je proprocija ako je brojilac deo imenioca. Ova vrednost je najee pomnoena konstantom da bi se izbegle decimale:

    =

    PRIMER U grupi od 25 studenata II godine studija su anketiranjem dobijeni podaci o starosti u godinama: 22, 21, 20, 23, 22, 24, 25, 21, 22, 23, 21, 22, 21, 23, 22, 22, 21, 25, 21, 26, 23, 21, 22, 21, 21

    Treba formirati empirijsku raspodelu starosti studenata u apsolutnim i relativnim iznosima.

  • 14

    Reenje:

    Prvo treba formirati varijacioni niz na sledei nain: U kolonu C se upisuju se podaci o starosti u godinama, oni se mogu prepisati redom iz zadataka, nakon toga sortirati. Sortiranje podatak u tabeli se vri tako to se obelee podaci i klikne na ikonicu

    Sort Ascending

    i kao rezultat dobija se kolona C koja izgleda kao na slici (desno). Nakon toga korienjem funkcije COUNT prebrojavaju se podaci. Funkcija se dobija iz padajueg menija Insert, opcije Function, i iz

    statistikih funkcija odabere COUNT.

    Argumente funkcije predstavljaju lanovi varijacionog niza. U

    sledeem koraku formira se nova tabela, ona sadri grupisane

    podatke o broju godina.

    Vrednosti za m se dobijaju opet korienjem funkcije COUNT, i to

    prebrojavanjem podataka za odreenu vrednost x*, na primer :

    I na kraju se izraunavaju vrednosti , i to kao odnos m i n, za odgovarajuu grupu podataka. Ovde

    se pri kopiranju formula na ostatak reda mora voditi rauna o tome da je n konstanta, i da njen

    poloaj mora biti fiksiran, tj. da se ispred oznake reda i kolone mora staviti znak $.

  • 15

    Poto je tabela konano formirana crta se grafik. Iako je crtanje grafika ve prethodno objanjeno,

    ovde e jo jednom biti prikazano na konkretnom primeru. Crtanje se zapoinje ili odabirom Chart iz padajueg menija Insert, ili klikom na ikonicu Chart Wizard. Tada se otvara novi prozor, u kome se bira tip grafika (Chart type), i odabere se XY (Scatter).

    Klikne se na Next, i u sledeem prozoru odabere kartica Series, gde e se obeleiti podaci na osnovu kojih se crta grafik. Na x osi treba da budu vrednosti za x*, a na y osi za m i . Serije podataka se dodaju klikom na dugme Add, a zatim se u poljima X values i Y values upisuju odgovarajue

    vrednosti.

    Klikne se na Next, i u sledeem prozoru urade ostala podeavanja grafika, kao to su oznake za x i y osu, naziv grafika i slino. Nakon toga se ponovo klikne na Next i u sledeem prozoru na Finish,

    ime se crtanje grafika zavrava, a dodatna podeavanja se rade na grafiku, kada se desnim tasterom

    mia klikne na grafik i odabere opcija format.

  • 16

    Poto bi ovde trebalo prikazati zavisnost od x* na sekundarnoj osi, desnim tasterom se klikne na seriju , Format Data Series, kada se otvori novi prozor klikne se na karticu Axis i odabere opcija Plot Series on Secondary axis, potvruje se sa OK.

    Kao rezultat dobija se grafik sa primarnom i sekundarnom osom, tj. poligon raspodele starosti studenata u apsolutnim i relativnim i znosima.

  • 17

    LITERATURA [1] Matematika i statistika http://en.wikipedia.org/wiki/Mathematical_statistics [2] Empirijska raspodela Tehnoloki fakultet Novi Sad

    http://www.tf.uns.ac.rs/~omorr/radovan_omorjan_003_is/Mcad/Empirijska%20raspodela-2001.htm

    [3] Statistika Elektronski fakultet Ni

    http://www.tf.uns.ac.rs/~omorr/radovan_omorjan_003_is/Mcad/Empir-ijska%20raspodela-2001.htm

    [4] Praktikum Excel slideshare.net http://www.slideshare.net/gaja972/praktikum-excel