68
PRAKTIKUM IZ STATISTIKE (za smer veterinarska medicina) Beba Mutavdžić, Tihomir Novaković, Dragana Tekić

PRAKTIKUM IZ STATISTIKE...Praktikum se sastoji iz osam poglavlja, koja čine strukturnu i sadržajnu celinu: • Prvo poglavlje - Formiranje distribucije frekvencija • Drugo poglavlje

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

  • PRAKTIKUM IZ STATISTIKE (za smer veterinarska medicina)

    Beba Mutavdžić, Tihomir Novaković, Dragana Tekić

  • SADRŽAJ

    FORMIRANJE DISTRIBUCIJA FREKVENCIJA .................................................................. 1

    POKAZATELJI CENTRALNE TENDENCIJE ...................................................................... 7

    POKAZATELJI VARIJABILITETA ..................................................................................... 14

    POKAZATELJI OBLIKA DISTRIBUCIJE ........................................................................... 21

    NORMALNA RASPODELA ................................................................................................. 27

    OCENE NA OSNOVU UZORKA ......................................................................................... 34

    TESTIRANJE STATISTIČKIH HIPOTEZA ......................................................................... 40

    REGRESIONA I KORELACIONA ANALIZA .................................................................... 57

    LITERATURA ....................................................................................................................... 64

  • PREDGOVOR

    Praktikum za predmet „Statistika”, koji se proučava na prvoj godini smera Veterinarska

    medicina Poljoprivrednog fakulteta, Univerziteta u Novom Sadu obuhvata materiju koja je u

    skladu sa aktuelnim akreditovanim programom za navedeni predmet i navedeni smer.

    Praktikum se sastoji iz osam poglavlja, koja čine strukturnu i sadržajnu celinu:

    • Prvo poglavlje - Formiranje distribucije frekvencija

    • Drugo poglavlje - Pokazatelji centralne tendencije

    • Treće poglavlje – Pokazatelji varijabiliteta

    • Četvrto poglavlje – Pokazatelji oblika distribucije

    • Peto poglavlje – Normalna raspodela

    • Šesto poglavlje – Ocene na osnovu uzorka

    • Sedmo poglavlje – Testiranje statističkih hipoteza

    • Osmo poglavlje – Regresiona i korelaciona analiza

    Svako poglavlje obuhvata jedan ili više radnih zadataka, kao i primere za vežbanje. Formule

    u primerima date su samo kao radni obrasci.

    Autori se nadaju da će ovaj praktikum olakšati studentima upotrebu osnovnih statističkih

    metoda u rešavanju problema koji su u domenu poljoprivrednih i bioloških nauka, odnosno

    konkretno problema iz oblasti veterinarske medicine. Ideja autora je da se studenti upoznaju

    sa deskriptivnim metodama, kao i metodama analize rezultata ogleda.

    Zahvaljujemo se svima koji su na direktan ili indirektan način pomogli izradu ove knjige, a

    naročito recenzentima: prof. dr Otiliji Sedlak i Mr Emiliji Nikolić-Đorić na korisnim

    sugestijama.

    Novi Sad, AUTORI

    2020. godine

  • 1

    FORMIRANJE DISTRIBUCIJA FREKVENCIJA

    Prekidno obeležje

    Primer 1. Na osnovu broja svinja kod 24 poljoprivredna gazdinstva formirati neintervalnu i

    intervalnu distribuciju frekvencija:

    12 5 6 7 5 8 10 9 5 12 9 8

    8 7 7 10 11 8 10 10 11 9 12 8

    Uređena statistička serija:

    5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 11, 11, 12, 12, 12.

    Neintervalna serija:

    Broj svinja Broj

    gazdinstava

    5 3

    6 1

    7 3

    8 5

    9 3

    10 4

    11 2

    12 3

    Ukupno 24

    Intervalna serija:

    Broj svinja Broj gazdinstava

    5-6 4

    7-8 8

    9-10 7

    11-12 5

    Ukupno 24

  • 2

    Neprekidno obeležje

    Primer 2. Dnevna mlečnost (lit.) 20 ispitivanih krava je data u sledećoj seriji:

    10,1 12,0 17,6 14,5 18,4 12,7 16,2 15,8 16,4 13,0

    19,9 12,1 13,5 15,1 17,9 13,3 17,0 19,3 16,5 14,5

    a) Formirati intervalnu distribuciju frekvencija (i=2); b) izračunati relativne frekvencije (strukturu); c) formirati kumulativnu distribuciju frekvencija d) formirati kumulaciju strukture e) podatke grafički predstaviti histogramom i poligonom

    Dijagram stablo-list:

    10 1

    11

    12 0 1 7

    13 0 3 5

    14 5 5

    15 1 8

    16 2 4 5

    17 0 6 9

    18 4

    19 3 9

    Radna tabela:

    Dnevna

    mlečnost

    (Xi)

    Broj

    krava (fi)

    Relativna frekvencija

    (struktura)

    Kumulativ Kumulativ

    strukture

    Ispod Iznad Ispod Iznad

    10,0-11,9 1 1/20=0,05 5% 1 20 5% 100%

    12,0-13,9 6 6/20=0,3 30% 7 19 35% 95%

    14,0-15,9 4 4/20=0,2 20% 11 13 55% 65%

    16,0-17,9 6 6/20=0,3 30% 17 9 85% 45%

    18,0-19,9 3 3/20=0,15 15% 20 3 100% 15%

    Ukupno 20 1,00 100%

  • 3

    Grafički prikaz (histogram i poligon):

    Histogram:

    Poligon:

    0

    1

    2

    3

    4

    5

    6

    7

    10 11 12 13 14 15 16 17 18 19 20

    Bro

    j kra

    va

    Dnevna mlečnost

  • 4

    Zadaci za vežbu:

    1. Na osnovu podataka o broju teladi kod 30 poljoprivrednih gazdinstava formirati

    neintervalnu distribuciju frekvencija i grafički je predstaviti primenom poligona:

    7 8 10 8 11 10 10 12 5 10 8 7 11 11 6

    8 10 7 11 5 10 10 11 12 8 12 11 9 8 5

    2. Dužina butne kosti (cm) merena je kod 40 pasa. Dobijene su sledeće vrednosti:

    17,6 14,1 13,9 13,1 16,8 14,7 13,2 15,7 13,5 15,4

    14,3 13,9 13,2 13,6 15,3 13,2 16,6 14,7 18,1 18,4

    15,6 15,5 15,4 14,7 17,6 14,4 19,8 13,6 14,7 14,7

    13,9 17,8 18,2 13,8 13,1 13,5 13,6 14,9 14,7 14,1

    Formirati dijagram stablo list i na osnovu njega intervalnu seriju distribucije frekvencija ako

    je i=0,5. Utvrditi strukturu raspodele, kumulativ i kumulativ strukture. Dati komentar za

    kumulativne vrednosti najfrekventnije vrednosti obeležja. Grafički predstaviti podatke

    primenom histograma.

    3. Dati su podaci o plućnoj ventilaciji (lit/min) 25 odraslih ovaca:

    8,3 8,0 9,9 6,1 5,5

    10,3 6,5 7,6 7,6 7,6

    6,9 10,3 7,8 7,3 8,9

    10,1 7,6 9,1 8,3 4,8

    10,2 6,5 9,1 7,0 11,9

    Formirati dijagram stablo list i intervalnu distribuciju frekvencija ako je dužina grupnog

    interval 1,5 (lit/min). Podatke grafički predstaviti.

  • 5

  • 6

  • 7

    POKAZATELJI CENTRALNE TENDENCIJE

    Pokazatelji centralne tendencije predstavljaju vrednosti koje kvantifikuju tendenciju podataka

    u seriji prema njihovom “centru”, odnosno sredini.

    U pokazatelje centralne tendencije ubrajaju se:

    - Aritmetička sredina - Geometrijska sredina - Harmonijska sredina - Medijana - Modus - Kvantili

    Aritmetička sredina

    Aritmetička sredina predstavlja izračunatu prosečnu vrednost posmatrane promenljive i

    računa se kao količnik zbira vrednosti obeležja i ukupnog broja podataka. Razlikuje se

    izračunavanje proste (za negrupisane podatke) i ponderisane (za grupisane podatke)

    aritmetičke sredine.

    Primer 1. Izračunati prosečnu vrednost dnevnog prirasta svinja (kg) na osnovu sledeće serije

    podataka:

    Prirast (kg) (Xi) 0,80 0,74 0,83 0,82 0,66 0,78

    �̅� =∑ 𝑋𝑖

    𝑛𝑖=1

    𝑛=

    4,63

    6= 0,77 (𝑘𝑔)

    Primer 2. Utvrditi prosečanu dnevnu mlečnost (lit.) 20 ispitivanih krava na osnovu sledeće

    serije podataka:

    Dnevna mlečnost (lit.)

    (Xi)

    Broj krava

    (fi)

    𝑿𝒊𝒇𝒊

    11 2 22

    13 4 52

    15 6 90

    17 5 85

    19 3 57

    Ukupno 20 306

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =306

    20= 15,3 (𝑙𝑖𝑡)

  • 8

    Primer 3. Utvrditi prosečan broj teladi po radnoj organizaciji na osnovu sledeće serije

    podataka:

    Broj teladi Poljoprivredne radne

    organizacije

    𝑿𝒊 𝑿𝒊𝒇𝒊

    30-39 3 35 105

    40-49 4 45 180

    50-59 4 55 220

    60-69 6 65 390

    70-79 3 75 225

    80-89 3 85 255

    90-99 2 95 190

    Ukupno 1565

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =1565

    25= 62,6

    Medijana

    Medijana je pozicioni pokazatelj centralne tendencije i predstavlja vrednost obeležja koja

    uređenu statističku seriju deli na dva jednaka dela. Za neintervalne statističke serije potrebno

    je prethodno utvrditi da li je ukupan broj podataka paran ili neparan broj. Kod intervalnih

    serija koristi se korigovana formula.

    Primer 1. Utvrditi medijalnu vrednost za sledeće serije podataka:

    Xi 1230 1320 1200 1500 1600

    Uređena serija 1200 1230 1320 1500 1600

    𝑀𝑒 = 𝑋𝑛+12

    = 𝑋5+12

    = 𝑋3 = 1320

    Xi 2110 1900 2170 1980 2100 2000

    Uređena serija 1900 1980 2000 2100 2110 2170

    𝑀𝑒 =𝑋𝑛

    2+ 𝑋𝑛

    2+1

    2=

    𝑋62

    + 𝑋62+1

    2=

    𝑋3 + 𝑋4

    2=

    2000 + 2100

    2= 2050

  • 9

    Primer 2. Utvrditi medijalnu vrednost za sledeću seriju:

    Masa jagnjadi (Xi) Broj jagnjadi (fi) Kumulativ

    3,9 8 8

    4,2 12 20

    4,3 20 40

    4,5 15 55

    4,6 5 60

    Ukupno 60

    𝑀𝑒 =𝑋𝑛

    2+𝑋𝑛

    2+1

    2=

    𝑋602

    +𝑋602

    +1

    2 =

    𝑋30+𝑋31

    2=

    4,3+4,3

    2= 4,3

    Primer 3. Utvrditi medijalnu vrednost (primenom korigovane formule) za sledeću seriju:

    Dužina trupa

    (Xi)

    Broj goveda

    (fi)

    Kumulativ

    148,1-152 10 10

    152,1-156 19 29

    156,1-160 23 52

    160,1-164 34 86

    164,1-168 34 120

    168,1-172 28 148

    172,1-176 13 161

    176,1-180 3 164

    Ukupno 164

    𝑀𝑒 = 𝐿 + (𝑛

    2−𝐹𝑀𝑒−1

    𝑓𝑀𝑒) × 𝑖 = 160 + (

    164

    2−52

    34) ∙ 4 = 163,53

  • 10

    Modus

    Modus je najučestalija vrednost obeležja u statističkoj seriji. Prema broju modusa statističke

    serije mogu biti unimodalne, bimodalne ili mogu imati tri modusa.

    Primer 1. Utvrditi modus za sledeću seriju podataka:

    Xi 75 45 50 70 55 65 60 65 70

    Uređena serija 45 50 55 60 65 65 70 70 75

    𝑀𝑂1 = 65

    𝑀𝑂2 = 70

    Primer 2. Utvrditi najčešći broj larvi skočibuba po 1 m2 na posmatranom lokalitetu:

    Prosečan broj larvi po 1 m2 (Xi) Broj parcela (fi)

    4,5 10

    7,5 24

    10,5 36

    13,5 90

    𝑀𝑂 = 13,5 𝑙𝑎𝑟𝑣𝑖 𝑝𝑜 1 m2

    Primer 3. Utvrditi modus (primenom korigovane formule) za sledeću seriju podataka:

    Prinos kukuruza (t/ha) Površina (ha)

    4,01-5,00 3

    5,01-6,00 3

    6,01-7,00 4

    7,01-8,00 5

    8,01-9,00 6

    9,01-10,00 3

    ∑ 24

    𝑀𝑂 = 𝐿 + (𝑑1

    𝑑1 + 𝑑2) × 𝑖 = 8 + (

    1

    1 + 3) ∙ 1 = 8,25

    𝑑1 =6-5=1 𝑑2 =6-3=3

  • 11

    Zadaci za vežbu:

    1. Odrediti aritmetičku sredinu, modus i medijanu za sledeće vrednosti numeričkog obeležja:

    2 3 4 13 1 6 6 7 6 8 11

    2. Na osnovu podataka uzorka na jednoj farmi koja ima 250 krmača utvrditi aritmetičku

    sredinu, modus i medijanu.

    Broj prasadi Broj krmača

    5 1

    6 0

    7 2

    8 3

    9 3

    10 10

    11 8

    12 5

    13 3

    14 2

    3. Za podatke koji se odnose na masu teladi (kg) na jednoj farmi izračunati aritmetičku

    sredinu, modus i medijanu.

    Masa teladi (kg) Broj teladi

    60,1-70,0 2

    70,1-80,0 6

    80,1-90,0 11

    90,1-100,0 17

    100,1-110,0 26

    110,1-120,0 19

    120,1-130,0 12

    130,1-140,0 6

    140,1-150,0 1

  • 12

  • 13

  • 14

    POKAZATELJI VARIJABILITETA

    Pokazatelji varijabiliteta predstavljaju meru disperzije vrednosti obeležja u okviru jedne

    statističke serije. Razlikuju se apsolutni i relativni pokazatelji varijabiliteta.

    Apsolutni pokazatelji varijabiliteta su:

    - Interval varijacije - Srednje apsolutno odstupanje - Standardna devijacija - Varijansa

    Relativni pokazatelji varijabiliteta su:

    - Koeficijent varijacije - Standardizovano (normalizovano) odstupanje

    Interval varijacije

    Interval varijacije predstavlja razliku između ekstremnih vrednosti obeležja u nekoj

    statističkoj seriji.

    Primer 1. Na osnovu podataka iz uzorka ustanovljene su sledeće težine proizvoda (kg):

    Težina proizvoda (kg) (Xi) 4,8 4,9 5,9 5,2 4,9 5,0 5,4 5,3 5,1

    Uređena serija 4,8 4,9 4,9 5,0 5,1 5,2 5,3 5,4 5,9

    𝐼 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 5,9 − 4,8 = 1,1(𝑘𝑔 )

    Srednje apsolutno odstupanje

    Srednje apsolutno odstupanje predstavlja količnik zbira apsolutnih vrednosti odstupanja

    pojedinačnih vrednosti obeležja od njihovog proseka i ukupnog broja podataka. Izražava se u

    jedinicama mere obeležja.

    Primer 2. Izračunati srednje aposlutno odstupanje za seriju podataka koja se odnosi na

    dužinu polutki svinja (cm):

    Dužina polutki (cm) (Xi) 𝑿𝒊 − �̅� |𝑿𝒊 − �̅�| 80 -19,14 19,14

    89 -10,14 10,14

    93 -6,14 6,14

    100 0,86 0,86

    105 5,86 5,86

    112 12,86 12,86

    115 15,86 15,86

    ∑ 70,86

  • 15

    𝑆𝑂 =∑ |𝑋𝑖 − �̅�|

    𝑛𝑖=1

    𝑛=

    70,86

    7= 10,12 (𝑐𝑚)

    �̅� =∑ 𝑋𝑖

    𝑛=

    694

    7= 99,14(𝑐𝑚)

    Primer 3. Izračunati srednje apsolutno odstupanje za sledeću seriju podataka koja se odnosi

    na mlečnost krava:

    Mlečnost po kravi

    (lit.) (Xi)

    Broj krava

    (fi)

    𝑿𝒊𝒇𝒊 |𝑋𝑖 − �̅�| 𝑓𝑖|𝑋𝑖 − �̅�|

    8 40 320 4,43 177,2

    10 8 80 2,43 19,44

    12 25 300 0,43 10,75

    16 5 80 3,57 17,85

    20 25 500 7,57 189,25

    ∑ 1280 414,49

    𝑆𝑂 =∑ 𝑓𝑖|𝑋𝑖−�̅�|

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =414,49

    103= 4,02 (𝑙𝑖𝑡)

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =1280

    103= 12,43(𝑙𝑖𝑡)

  • 16

    Standardna devijacija i varijansa

    Standardna devijacija je kvadratni koren iz sredine kvadrata odstupanja vrednosti obeležja od

    aritmetičke sredine. Vrednost standardne devijacije pokazuje koliko su udaljene grupisane

    vrednosti obeležja od aritmetičke sredine. Izražava se u jedinicama mere obeležja.

    Primer 4. Izračunati standardnu devijaciju za sledeću seriju podatka koja se odnosi na masu

    prasića (kg):

    Masa prasića (kg)

    (Xi) (𝑋𝑖 − �̅�) (𝑋𝑖 − �̅�)

    2 𝑋𝑖

    2

    19 -4,29 18,36734694 361

    20 -3,29 10,79591837 400

    22 -1,29 1,653061224 484

    23 -0,29 0,081632653 529

    25 1,71 2,93877551 625

    26 2,71 7,367346939 676

    28 4,71 22,2244898 784

    163 63,43 3859

    I način: 𝜎 = √∑ (𝑋𝑖−�̅�)

    2𝑛𝑖=1

    𝑛= √

    63,43

    7= 3,01(𝑘𝑔)

    II način: 𝜎 =√∑ 𝑋𝑖

    2− (∑ 𝑋𝑖

    𝑛𝑖=1 )

    2

    𝑛𝑛𝑖=1

    𝑛= √

    3859− (163²

    7)

    7= 3,01(𝑘𝑔)

    Primer 5. Izračunati standardnu devijaciju za sledeću seriju podataka koja se odnosi na

    potrošnju mleka:

    Potrošnja

    mleka (lit.)

    (Xi)

    Broj

    domaćinstava

    (fi)

    𝑿𝒊 𝑿𝒊𝒇𝒊 (𝑿𝒊 − �̅�) 𝒇𝒊(𝑿𝒊 − �̅�)𝟐 𝑿𝒊

    𝟐𝒇𝒊

    12,0-19,9 12 16 192 -18,32 4027,469 3072

    20,0-27,9 23 24 552 -10,32 2449,555 13248

    28,0-35,9 85 32 2720 -2,32 457,504 87040

    36,0-43,9 55 40 2200 5,68 1774,432 88000

    44,0-51,9 25 48 1200 13,68 4678,56 57600

    ∑ 200 6864 13387,52 248960

  • 17

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =6864

    200= 34,32

    I način: 𝜎 = √∑ 𝑓𝑖(𝑋𝑖−�̅�)

    2𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    = √13387,52

    200= 8,18 (𝑙𝑖𝑡)

    II način: 𝜎 =√

    ∑ 𝑋𝑖2𝑓𝑖−

    (∑ 𝑋𝑖𝑓𝑖𝑘𝑖=1 )

    2

    ∑ 𝑓𝑖𝑘𝑖=1

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    = √248960−(

    6864²

    200)

    200= 8,18 (𝑙𝑖𝑡)

    Koeficijent varijacije

    Koeficijent varijacije je relativni pokazatelj varijabiliteta koji svoju primenu pronalazi

    prilikom poređenja varijabiliteta pojava koje su izražene u različitim jedinicama mere.

    Izražava se u procentima

    Primer 6. U jednom prasilištu prosečan broj prasadi po leglu je 12 komada sa standardnom

    devijacijom 2 komada. Prosečna telesna masa prasadi iznosi 8 kg dok je varijansa 2,56 kg2.

    Uporediti varijabilitet telesne mase i broja prasadi.

    𝑉1 =𝜎1

    �̅�1× 100 (%) =

    2

    12× 100 (%) = 16,67%

    𝑉2 =𝜎2

    �̅�2× 100 (%) =

    √2,56

    8× 100 (%) = 20%

    V2 > V1 – varijabilitet telesne mase je veći od varijabiliteta broja

    prasadi.

  • 18

    Standardizovano (normalizovano) odstupanje

    Standardizovano odstupanje je mera udaljenosti pojedinih vrednosti obeležja od aritmetičke

    sredine iskazana u odnosu na standardnu devijaciju. Standardizovano odstupanje je takođe

    relativni pokazatelj disperzije obeležja i nema jedinicu mere.

    Primer 7. Utvrditi standardizovano odstupanje najučestalije vrednosti obeležja za seriju

    podataka koja se odnosi na dnevnu mlečnost (lit.) 20 ispitivanih krava.

    Dnevna

    mlečnost

    (lit.) (Xi)

    Broj krava

    (fi)

    𝑿𝒊 𝑿𝒊𝒇𝒊 𝑿𝒊𝟐𝒇𝒊 (𝑿𝒊 − �̅�)

    10,1-12,0 2 11 22 242 -4,3

    12,1-14,0 4 13 52 676 -2,3

    14,1-16,0 6 15 90 1350 -0,3

    16,1-18,0 5 17 85 1445 1,7

    18,1-20,0 3 19 57 1083 3,7

    ∑ 20 306 4796

    Najučestalija vrednost obeležja (modus) je 15.

    𝑍𝑖 =𝑋𝑖 − �̅�

    𝜎=

    15 − 15,3

    2,39= −0,13

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =306

    20= 15,3

    𝜎 =√

    ∑ 𝑋𝑖2𝑓𝑖 −

    (∑ 𝑋𝑖𝑓𝑖𝑘𝑖=1 )

    2

    ∑ 𝑓𝑖𝑘𝑖=1

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =√4796 − (

    306²20

    )

    20= 2,39

  • 19

    Zadaci za vežbu:

    1. Dati su podaci koji se odnose na prirast pilića starosti 3 nedelje.

    Prirast (g)

    392

    402

    385

    440

    415

    397

    400

    Izračunati apsolutne pokazatelje varijabiliteta.

    2. Dati su podaci koji se odnose na sadržaj glikoze u prednjoj komori oka i koncentraciji u

    serumu krvi 30 zdravih pasa:

    Koncentracija glikoze (%) Broj pasa

    70-79 8

    80-89 15

    90-99 4

    100-109 3

    Izračunati apsolutne pokazatelje varijabiliteta i standardizovano odstupanje za vrednost

    obeležja X=100.

    3. Date su vrednosti numeričkog obeležja X: 10, 30, 50, 70, 90. Varijansa datog obeležja je

    𝜎𝑥2 = 800 . Uporediti varijabilitet obeležja X i obeležja Y=2X+3.

    4. Uporediti varijabilnost 2 serije podataka ukoliko su njihove vrednosti sledeće:

    �̅�1 = 70 (𝑐𝑚); 𝜎12 = 25 (𝑐𝑚)2; �̅�2 = 35 (𝑔); 𝜎2 = 4 (𝑔).

  • 20

  • 21

    POKAZATELJI OBLIKA DISTRIBUCIJE

    Pokazatelji oblika distribucije sagledavaju dve karakteristike, asimetričnost i spljoštenost.

    Najčešće korišćeni pokazatelji ovih karakteristika distribucije su:

    - Mera asimetričnosti – I Pirsonov koeficijent (𝛽1) - Mera spljoštenosti – II Pirsonov koeficijent 𝛽2).

    Za izračunavanje ovih koeficijenata potrebno je prvo da se izračunaju centralni momenti. Pod

    centralnim momentom k-tog reda – podrazumeva se sredina sume odstupanja vrednosti

    obeležja od aritmetičke sredine stepenovana na k-ti stepen.

    Primer 1. Na osnovu podataka o broju tovne junadi (000 komada) na jednoj teritoriji utvrditi

    pokazatelje oblika distribucije i dati odgovarajući komentar.

    Broj junadi

    (Xi) (𝑿𝒊 − �̅�) (𝑿𝒊 − �̅�)

    𝟐 (𝑿𝒊 − �̅�)𝟑 (𝑿𝒊 − �̅�)

    𝟒

    3 -7 49 -343 2401

    5 -5 25 -125 625

    7 -3 9 -27 81

    10 0 0 0 0

    15 5 25 125 625

    20 10 100 1000 10000

    ∑ 60 208 630 13732

    �̅� =∑ 𝑋𝑖

    𝑛𝑖=1

    𝑛=

    60

    6= 10

    𝛽1 =𝜇3

    2

    𝜇23 =

    105²

    34,67³= 0,264

    𝛽2 =𝜇4

    𝜇22 =

    2288,67

    34,67²= 1,904

    𝜇2 =∑ (𝑿𝒊 − �̅�)

    𝟐𝑛𝑖=1

    𝑛=

    208

    6= 34,67

    𝜇3 =∑ (𝑿𝒊 − �̅�)

    𝟑𝑛𝑖=1

    𝑛=

    630

    6= 105

  • 22

    𝜇4 =∑ (𝑿𝒊 − �̅�)

    𝟒𝑛𝑖=1

    𝑛=

    13732

    6= 2288,67

    Serija je pozitivno asimterična i spljoštenija u odnosu na normalnu distribuciju.

    Primer 2. Utvrditi oblik raspodele podataka koji se odnose na mesečnu potrošnju svinjskog

    mesa u 100 slučajno odabranih gazdinstava na teritoriji Grada Novog Sada.

    Potrošnja

    mesa

    (Xi)

    Broj

    domaćinstava

    (fi)

    (𝑿𝒊 − �̅�) (𝑿𝒊 − �̅�)𝟐 𝒇𝒊(𝑿𝒊 − �̅�)

    𝟐 𝒇𝒊(𝑿𝒊 − �̅�)𝟑 𝒇𝒊(𝑿𝒊 − �̅�)

    𝟒

    2,2 10 -0,66 0,4356 4,356 -2,875 189,74736

    2,8 15 -0,06 0,0036 0,054 -0,0032 0,0001944

    3,0 40 0,14 0,0196 0,784 0,10976 24,58624

    3,3 20 0,44 0,1936 3,872 1,70368 0,7496192

    3,8 10 0,94 0,8836 8,836 8,30584 780,74896

    4,0 5 1,14 1,2996 6,498 7,40772 8,4448008

    ∑ 100 24,4 14,65 1004,28

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =286

    100= 2,86

    𝛽1 =𝜇3

    2

    𝜇23 =

    0,1465²

    0,244³= 1,477

    𝛽2 =𝜇4

    𝜇22 =

    10,0428

    0,244²= 168,84

    𝜇2 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)

    𝟐𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =24,4

    100= 0,244

    𝜇3 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)

    𝟑𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =14,65

    100= 0,1465

  • 23

    𝜇4 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)

    𝟒𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =1004,28

    100= 10,0428

    Serija je pozitivno asimetrična i izduženija u odnosu na normalnu raspodelu.

    Primer 3. Za datu seriju podataka utvrditi aritmetičku sredinu, modus i medijanu, a zatim na

    osnovu izračunatih pokazatelja centralne tendencije opisati oblik date raspodele.

    Masa jagnjadi (kg)

    (Xi)

    Broj jagnjadi

    (fi)

    𝑿𝒊𝒇𝒊 Kumulativ

    3,9 8 31,2 8

    4,2 12 50,4 20

    4,3 20 86 40

    4,5 15 67,5 55

    4,6 5 23 60

    ∑ 60 258,1

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =258,1

    60= 4,302(𝑘𝑔)

    𝑀𝑂 = 4,3 (𝑘𝑔)

    𝑀𝑒 = 4,3(𝑘𝑔)

    �̅� = 𝑀𝑂 = 𝑀𝑒 Serija je simetrična.

  • 24

    Zadaci za vežbu:

    1. Na osnovu podataka o distribuciji nove smeše za ishranu koka nosilja po maloprodajnim

    objektima, dobijeni su sledeći rezultati: 𝜎2 = 12,25, 𝜇3 = −5,27 i 𝜇4 = 291,7. Ispitati asimetriju i oblik ove empirijske distribucije frekvencija?

    2. Na osnovu N=100 vrednosti obeležja formirana je intervalna serija distribucije frekvencija

    i izračunate su sledeće sume:

    ∑ 𝑓(𝑥 − �̅�)2 = 688, ∑ 𝑓(𝑥 − �̅�)3 = −144, ∑ 𝑓(𝑥 − �̅�)4 = 12544. Izračunati vrednosti prvog i drugog Pirsonovog koeficijenta i uporediti ih sa vrednostima

    normalne raspodele.

    3. Na osnovu datih podataka koji se odnose na mesečnu potrošnju mesa po domaćinstvu

    izračunati pokazatelje centralne tendencije i preko njih ispitati oblik date raspodele.

    Mesečna potrošnja (kg) Broj domaćinstava

    2,2 10

    2,8 40

    3,0 15

    3,3 20

    3,8 10

    4,0 5

  • 25

  • 26

  • 27

    NORMALNA RASPODELA

    Normalna raspodela je najvažniji model teorijske distribucije verovatnoće. Značaj ovog

    oblika distribucije u statističkoj teoriji i statističkim istraživanjima se ogleda u tome što se

    mnoge empirijske pojave modeliraju normalnom distribucijom. Parametarska statistika je

    zasnovana na pretpostavci da osnovni skup kome pripada uzorak ima normalnu distribuciju.

    Primena Normalne raspodele:

    1. 𝑃 (−𝑎 ≤ 𝑥 ≤ 𝑎) = 2𝛷(𝑎)

    Primer1. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -1 do 1 ako važi

    da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).

    Tražena verovatnoća se može zapisati:

    𝑃 (−1 ≤ 𝑥 ≤ 1) = 2𝛷(1)

    Da bi se izračunala odgovarajuća verovatnoća, neophodno je utvrditi osenčenu površinu ispod krive.

    Kako se iz tablica Normalne raspodele raspolaže sa ukupnom površinom jedne polovine ispod krive,

    neophodno je najpre izračunati 𝛷(1) što iznosi 0,3413. S obzirom na to da su leva i desna strana

    površine ispod krive jednake, konačno rešenje glasi: 2𝛷(1) = 0,6826.

  • 28

    2. 𝑃 (𝑎 ≤ 𝑥 ≤ 𝑏) = 𝛷(𝑏) − 𝛷(𝑎)

    Primer 2. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od 0,5 do 1,5, ako

    važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).

    Tražena verovatnoća se može zapisati:

    𝑃 (0,5 ≤ 𝑥 ≤ 1,5) = 𝛷(1,5) − 𝛷(0,5)

    Kako se na osnovu vrednosti iz tablice Normalne raspodele može utvrditi površina odsečaka samo za

    jednu polovinu površine ispod krive, potrebno je najpre utvrditi 𝛷(1,5) = 0,4332 a zatim od te

    površine oduzeti 𝛷(0,5) = 0,1915. Tražena verovatnoća glasi:

    𝑃 (0,5 ≤ 𝑥 ≤ 1,5) = 0,2417

  • 29

    3. 𝑃 (−𝑏 ≤ 𝑥 ≤ 𝑎) = 𝛷(𝑎) + 𝛷(𝑏)

    Primer 3. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -1,2 do 0,7, ako

    važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).

    Tražena verovatnoća se može zapisati:

    𝑃 (−1,2 ≤ 𝑥 ≤ 0,7) = 𝛷(−1,2) + 𝛷(0,7)

    Do tražene površine će se doći tako što se prvobitno utvrditi 𝛷(−1,2) (ili može se reći i 𝛷(1,2) jer su

    leva i desna strana površine ispod krive jednake) što iznosi 0,3849. Zatim se utvrdi 𝛷(0,7) što iznosi

    0,2580. Tražena verovatnoća glasi:

    𝑃 (−1,2 ≤ 𝑥 ≤ 0,7) = 𝛷(−1,2) + 𝛷(0,7) = 0,3849 + 0,2580 = 0,6429

  • 30

    4. 𝑃(−𝑏 ≤ 𝑥 ≤ −𝑎) = 𝛷(−𝑏) − 𝛷(−𝑎) = 𝛷(𝑏) − 𝛷(𝑎)

    Primer 4. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -2,3 do -1,2,

    ako važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).

    Tražena verovatnoća je:

    𝑃(−2,3 ≤ 𝑥 ≤ −1,2) = 𝛷(−2,3) − 𝛷(−1,2) = 𝛷(2,3) − 𝛷(1,2)

    Da bi se utvrdila tražena verovatnoća pristup je isti kao u primeru 2, samo što se inicijalne

    vrednosti nalaze na levoj strani X ose. Konačno rešenje glasi:

    𝑃(−2,3 ≤ 𝑥 ≤ −1,2) = 𝛷(−2,3) − 𝛷(−1,2) = 𝛷(2,3) − 𝛷(1,2) == 0,4893 − 0,3849

    = 0,1044

  • 31

    Primer 5. Kod 250 junadi prosečan dnevni prirast iznosi 0.8 kg sa varijansom 0.0625kg2.

    a) Izračunati verovatnoću da je prosečan dnevni prirast junadi 0.6-0.8kg. b) Izračunati očekivan broj junadi sa prosečnim dnevnim prirastom 0.6-0.8kg.

    Ukupan broj podataka iznosi 250 (N=250), aritmetička sredina 0,8kg a varijansa 0,0625 kg2. Kako je

    prekršen uslov da je aritmetička sredina 1 a varijansa 0, neophodno je izvršiti transformaciju obeležja

    primenom sledećeg obrasca: 𝑋−𝜇

    𝜎 .

    X1=0,6

    X2=0,8

    μ=0,8

    σ2=0,0625=𝜎 = √𝜎2 = √0,0625 = 0,25

    a)

    𝑃 (0,6 ≤ 𝑥 ≤ 0,8) = 𝑃 (0,6−0,8

    0,25≤ 𝑥 ≤

    0,8−0,8

    0,25) = 𝑃(−0,8 ≤ 𝑥 ≤ 0) = 𝛷(−0,8) = 𝛷(0,8) =

    0,2881

    Dakle, verovatnoća da će se prosečan dnevni prirast kretati u interval od 0,6 do 0,8 kg iznosi 0,2881.

    b)

    Da bi utvrdili očekivani broj prasadi sa prethodno utvrđenim prirastom neophodno je izračunatu

    verovatnoću pomnožiti sa ukupnim broj junadi:

    Fi = Pi*N=0,2881*250 = 72,025 ≈ 72

  • 32

    Zadaci za vežbu:

    1. Slučajno promenljiva Z ima normalnu raspodelu sa parametrima μ=0 i σ=1. Odrediti a

    ukuliko osenčena površina zauzima 97% površine ispod krive.

    a

    2. Odrediti vrednost z za standardizovanu normalnu krivu tako da je površina na levom kraju

    raspodele 0,04.

    3. Odrediti verdnost z za standardizovanu normalnu krivu gde verovatnoća da se vrednost

    slučajne promenljive X nalazi između –z i z iznosi 0,5.

    0.4

    0.3

    0.2

    0.1

    0.0

    X

    f

    -z

    0.5

    0 z

  • 33

    4. Pretpostavljajući da je sadržaj gvožđa u serumu psa slučajna promenljiva koja ima

    normalnu raspodelu sa parametrima μ = 25(μmol/l) i varijansom σ2 = 4(μmol/l).

    a) Izračunati verovatnoću da je sadržaj gvožđa u serumu psa 21-29 (μmol/l).

    b) Izračunati verovatnoću da je sadržaj gvožđa u serumu 19-31 (μmol/l).

  • 34

    OCENE NA OSNOVU UZORKA

    U praktičnom radu, u svrhu donošenja zaključaka o karakteristikama osnovnog skupa, uzima

    se jedan ili više prostih slučajnih uzoraka dovoljne veličine na osnovu kojeg se ocenjuju,

    odnosno procenjuju nepoznati parametri osnovnog skupa.

    U slučaju da je poznata veličina osnovnog skupa moguće je izračunati i total osnovnog

    skupa.

    Interval poverenja za ocenu nepoznate sredine osnovnog skupa

    Intervali poverenja za ocenu nepoznate aritmetičke sredine osnovnog skupa na osnovu

    uzorka se razlikuju prema tome da li je poznat varijavilitet osnovnog skupa ili nije.

    Poznat varijabilitet osnovnog skupa

    Ukoliko je poznat varijabilitet osnovnog skupa u intervalu poverenja figuriraju tačkasta

    ocena aritmetičke sredine iz uzorka (�̅�), prava standardna greška aritmetičke sredine (𝜎�̅�) i kritične vrednosti iz tablice Normalne raspodele (𝑍𝛼).

    Primer 1. U rejonu od 10.000 domaćinstava izabran je uzorak čiji su rezultati dati sledećim

    vrednostima:

    Mesečna potrošnja

    goveđeg mesa (kg)

    (𝑿𝒊)

    Broj domaćinstava

    (𝒇𝒊) 𝑿𝒊𝒇𝒊

    1 10 10

    1,6 15 24

    1,8 40 72

    2,1 20 42

    2,6 10 26

    2,8 5 14

    Ukupno 100 188

    Oceniti prosečnu mesečnu i ukupnu potrošnju goveđeg mesa sa pouzdanošću od 95 procenata

    ako je od ranije poznat varijabilitet osnovnog skupa 𝜎2 = 3,4 kg2.

    �̅� − 𝑍𝛼 ∙ 𝜎𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝜎𝑥

    1,88-1,96*0,1834

  • 35

    𝜎𝑥 =𝜎

    √𝑛√

    𝑁 − 𝑛

    𝑁 − 1=

    1,843

    √100√

    10000 − 100

    10000 − 1= 0,1834

    Nije poznat varijabilitet osnovnog skupa

    S druge strane, ukoliko varijabilitet osnovnog skupa nije poznat, pored tačkaste ocene

    aritmetičke sredine iz uzorka u intervalu poverenja figuriraju još i ocenjena standardna

    greška aritemtičke sredine (𝑆�̅�), kao i kritične vrednosti iz tablice Normalne raspodele (za velike uzorke) odnosno kritične vrednosti iz tablice Studentove raspodele (za male uzorke)

    (𝑡𝛼;𝑛−1).

    Primer 1. Na osnovu podataka o mlečnosti 57 istočno-frizijskih krava na jednoj farmi u toku

    305 dana laktacije oceniti prosečnu količinu dobijenog mleka po kravi za posmatrani period.

    Formirati 95% i 99% interval poverenja.

    Količina mleka (lit.)

    (𝑿𝒊) Broj krava

    (𝒇𝒊) 𝑿𝒊𝒇𝒊 𝑿𝒊

    𝟐𝒇𝒊

    3.600 3 10800 38880000

    3.800 4 15200 57760000

    4.000 7 28000 112000000

    4.200 10 42000 176400000

    4.400 15 66000 290400000

    4.600 9 41400 190440000

    4.800 4 19200 92160000

    5.000 3 15000 75000000

    5.200 2 10400 54080000

    Σ 57 248000 1087120000

    �̅� − 𝑍𝛼 ∙ 𝑆𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝑆𝑥

    95% 4350,877-1,96*50,382

  • 36

    𝑆𝑥 =√∑ 𝑋²𝑖𝑓𝑖 −

    (∑ 𝑋𝑖𝑓𝑖𝑘𝑖 )²

    𝑛𝑘𝑖

    𝑛(𝑛 − 1) = √

    1087120000 −(248000)²

    5757(57 − 1)

    = 50,382

    Primer 2. Primenom prostog slučajnog uzorka bez ponavljanja odabrano je 5 od 200 pilića

    koji su hranjeni određenim koncentratom. Prirast pilića u periodu od 3 nedelje je dat u tabeli.

    Odrediti 95% i 99% interval poverenja za prosečan i ukupan prirast.

    Prirast (g)

    (𝑿𝒊) 𝑿𝒊

    𝟐

    391 152881

    401 160801

    405 164025

    418 174724

    432 186624

    2047 839055

    �̅� − 𝑍𝛼 ∙ 𝑆𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝑆𝑥

    95% 409,4-1,96*7,028

  • 37

    Interval poverenja za ocenu nepoznate proporcije osnovnog skupa

    Primer 1. Dati su podaci o potrošnji svinjskog mesa. Sa pouzdanošću od 95 i 99% oceniti

    proporciju domaćinstava sa potrošnjom manjom od 2,5 kg. Sa istom pouzdanošću oceniti

    ukupan broj domaćinstava sa potrošnjom manjom od 2,5 kg. ukoliko je poznato da je broj

    domaćinstava u osnovnom skupu 1.000.

    Mesečna potrošnja

    (𝑿𝒊) Broj domaćinstava

    (𝒇𝒊) 2,2 10

    2,8 15

    3,0 40

    3,3 20

    3,8 10

    4,0 5

    Ukupno 100

    �̂� =𝑎

    𝑛=

    10

    100= 0,1

    𝑆𝑝 = √�̂��̂�

    𝑛= √

    0,1 ∗ 0,9

    100= 0.03

    95% �̂� − 𝑍𝛼∙𝑆�̂� < 𝑝 < �̂� − 𝑍𝛼∙𝑆𝑝

    0,1-1,96*0,03

  • 38

    Zadaci za vežbu:

    1. Date su vrednosti prekidnog numeričkog obeležja koje se odnose na uzorak veličine n=20:

    87 109 79 80 96 95 90 92 96 98

    101 91 78 112 94 98 94 107 81 96

    Ako je poznat varijabilitet osnovnog skupa 𝜎 = 4,4, odrediti granice 98% interval poverenja za aritmetičku sredinu osnovnog skupa.

    2. Iz osnovnog skupa od 1000 gazdinstava izabran je uzorak radi ispitivanja broja tovnih

    svinja. Odrediti 95% i 99% interval poverenja za prosečan i ukupan broj svinja u osnovnom

    skupu, ako je poznato da je primenjen prost slučajan uzorak bez ponavljanja.

    Broj tovnih svinja (𝑿𝒊) 0 1 2 3 4 5 8 Broj gazdinstava (𝒇𝒊) 4 5 11 37 30 10 3

    3. Metodom slučajnog izbora na teritoriji jedne opštine izabran je prost slučajan uzorak od 25

    parcela od po jednog hektara zasejanih kukuruzom na kojima su dobijeni sledeći prinosi

    (t/ha):

    Prinos (t/ha)(𝑿𝒊) 2,51-3,50 3,51-4,50 4,51-5,50 5,51-6,50 Broj parcela (𝒇𝒊) 3 10 8 4

    Odrediti granice 95% i 99% interval poverenja u kojima se može očekivati da se nalazi

    prosečan prinos po hektaru u celoj opštini.

    4. U uzorku od 100 pasa koji su dobili prvu vakcinu obolelo je 7 pasa. Odrediti 95% i 99%

    interval poverenja za proporciju obolelih pasa. Koliki se broj obolelih pasa može očekivati

    ako je poznato da osnovni skup broji 500 pasa

  • 39

  • 40

    TESTIRANJE STATISTIČKIH HIPOTEZA

    Pod hipotezom se podrazumeva naučna pretpostavka zasnovana na poznatim činjenicama

    radi izvođenja nekog zaključka. Predmet statističkog testiranja mogu biti različiti parametri, a

    najčešće su to aritmetička sredina i proporcija.

    Testovi aritmetičkih sredina

    Postoje sledeći osnovni testovi za testiranja aritmetičkih sredina:

    1. Upoređivanje aritmetičke sredine uzorka sa aritmetičkom sredinom osnovnog skupa ili sa

    nekom hipotetičkom vrednošću – test značajnosti jedne sredine;

    2. Upoređivanje dve aritmetičke sredine iz dva nezavisna uzorka – test značajnosti razlike

    dve sredine;

    3. Upoređivanje više od dve sredine iz više od dva uzorka – metod analize varijanse.

    1. Test značajnosti jedne sredine

    Primer 1. Rezultati uzorka, n=70, pokazali su da je prosečan prirast prasića starosti do 6

    nedelja 395 g/dan. Od ranije je poznato da je prosečan prirast prasića starosti do 6 nedelja

    430 g/dan sa standardnom devijacijom 30 g/dan. Da li je postignuti prirast na nivou

    očekivanog?

    𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0

    𝑍 =�̅� − 𝜇

    𝜎�̅�=

    395 − 430

    3,586= −9,76 ∗∗

    𝜎�̅� =𝜎

    √𝑛=

    30

    √70= 3,586

    |𝑍| = 9,76 > 𝑍0,05 = 1,96 → 𝐻1

    |𝑍| = 9,76 > 𝑍0,01 = 2,58 → 𝐻1

  • 41

    Primer 2. Dati su podaci o prosečnom utrošku hrane 25 pilića starosti od dva meseca

    izabranih primenom prostog slučajnog uzorka bez ponavljanja od ukupnog broja od 500

    pilića koliko ih ima na farmi:

    Utrošak hrane po piletu (g) 196 198 200 202

    Broj pilića 3 10 7 5

    Da li može da se prihvati nulta hipoteza da je prosečan utrošak hrane u osnovnom skupu

    μ=199(g)?

    Utrošak hrane po

    piletu (g)

    Broj pilića 𝑿𝒊𝒇𝒊 𝑿𝒊𝟐𝒇𝒊

    196 3 588 115248

    198 10 1980 392040

    200 7 1400 280000

    202 5 1010 204020

    25 4978 991308

    𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0

    𝑡 =�̅� − 𝜇

    𝑆𝑋=

    199,12 − 199

    0,3746= 0,3203

    �̅� =∑ 𝑋𝑖𝑓𝑖

    𝑘𝑖=1

    ∑ 𝑓𝑖𝑘𝑖=1

    =4978

    25= 199,12

    𝑆𝑥 =√∑ 𝑋²𝑖𝑓𝑖 −

    (∑ 𝑋𝑖𝑓𝑖𝑘𝑖 )²

    𝑛𝑘𝑖

    𝑛(𝑛 − 1)∙

    𝑁 − 𝑛

    𝑁= √

    991308 −(4978)²

    2525(25 − 1)

    ∙500 − 25

    500= 0.3746

    𝑡 = 0,3203 < 𝑡(24)0.05 = 2,064 → 𝐻𝑜

    𝑡 = 0,3203 < 𝑡(24)0.01 = 2,797 → 𝐻𝑜

  • 42

    2. Test značajnosti razlike dve sredine

    Primer 1. Na osnovu ogleda u kome se ispituje razlika u prirastu (g) dve grupe životinja kod

    kojih su primenjena dva načina ishrane A i B dobijeni su rezultati koji se odnose na veličine

    prostih slučajnih nezavisnih uzoraka, aritmetičke sredine i standardne devijacije osnovnih

    skupova koje su od ranije poznate. Testirati nultu hipotezu da je prosečan prirast kod obe

    grupe isti nezavisno od primenjennog načina ishrane.

    Ishrana A Ishrana B

    n1=15 n2=12

    �̅�1 = 68,4 �̅�2 = 83,42 𝜎1 = 16,47 𝜎2 = 17,63

    𝐻0: 𝜇1 = 𝜇2

    𝐻1: 𝜇1 ≠ 𝜇2

    𝑍 =�̅�1 − �̅�2𝜎(�̅�1−�̅�2)

    =68,4 − 83,42

    4,643= −3,235 ∗∗

    𝜎(�̅�1−�̅�2) = √𝜎1

    2 + 𝜎22

    𝑛1 + 𝑛2= √

    16,472 + 17,63²

    15 + 12= 4,643

    |𝑍| = 3,235 > 𝑍0,05 = 1,96 → 𝐻1

    |𝑍| = 3,235 > 𝑍0,01 = 2,58 → 𝐻1

  • 43

    Primer 2. Pri ispitivanju uticaja dve vrste hraniva u ishrani junadi postavljen je ogled sa dve

    grupe od po deset grla. Rezultati eksperimenta se odnose na prosečan dnevni prirast junadi

    (kg) što je predstavljeno u sledećoj tabeli:

    Uzorak 1 Uzorak 2 𝑿𝟏𝟐 𝑿𝟐

    𝟐

    1,40 1,31 1,96 1,7161

    1,38 1,30 1,9044 1,69

    1,41 1,33 1,9881 1,7689

    1,35 1,37 1,8225 1,8769

    1,42 1,39 2,0164 1,9321

    1,37 1,36 1,8769 1,8496

    1,42 1,35 2,0164 1,8225

    1,40 1,32 1,96 1,7424

    1,43 1,31 2,0449 1,7161

    1,45 1,35 2,1025 1,8225

    14,03 13,39 19,6921 17,9371

    Testirati hipotezu o jednakosti sredina dva nezavisna uzorka.

    𝐻0: 𝜇1 = 𝜇2

    𝐻1: 𝜇1 ≠ 𝜇2

    𝑡 =�̅�1 − �̅�2𝑆(�̅�1−�̅�2)

    =1,403 − 1,339

    0,0126= 5,709 ∗∗

    �̅�1 =∑ 𝑋1

    𝑛1=

    14,03

    10= 1,403

    �̅�2 =∑ 𝑋2

    𝑛2=

    13,39

    10= 1,339

    𝑆(�̅�1−�̅�2) =√

    2 ∙ 𝑆1+22

    𝑛= √

    2 ∙ 0,000795

    10= 0,0126

    𝑆1+22 =

    ∑ 𝑋12

    𝑖−

    (∑ 𝑋1𝑖)2

    𝑛1+ ∑ 𝑋2

    2

    𝑖−

    (∑ 𝑋2𝑖)2

    𝑛2𝑛1 + 𝑛2

    =19,6921 −

    14,032

    10 + 17,9371 −13,392

    1010 + 10

    = 0,000795

    𝑡 = 5,079 > 𝑡(18)0.05 = 2,101 → 𝐻1

    𝑡 = 5,079 > 𝑡(18)0.01 = 2,676 → 𝐻1

  • 44

    Zadaci za vežbu:

    1. U štali sa 10 krava ostvarena je dnevna mlečnost (lit.): 3, 4, 5, 7, 8, 9, 7, 10, 9, 10.

    Ako je varijansa osnovnog skupa poznata i iznosi 6, testirati 𝐻0: �̅� = 𝜇 protiv alternativne hipoteze 𝐻1: �̅� ≠ 𝜇, ako važi da je μ=7,8 (lit.).

    2. Na osnovu podataka datih u tabeli o inkubaciji tetanusa (danima) i broju obolelih životinja

    testirati nultu hipotezu da je prosečna inkubacija 16 dana.

    Inkubacija tetanusa Broj obolelih životinja

    5-8 5

    9-12 5

    13-16 4

    17-20 3

    21-24 2

    25-28 1

    3. Prosečna dnevna potrošnja svežeg mleka, u uzorku od 30 poljoprivrednih domaćinstava

    iznosi 2,1 litar, sa standardnom devijacijom osnovnog skupa 0,9. U uzorku od 20 radničkih

    domaćinstava prosečna dnevna potrošnja svežeg mleka je 1,5 litara sa varijansom osnovnog

    skupa 0,49. Da li se statistički značajno razlikuje prosečna dnevna potrošnja svežeg mleka

    poljoprivrednih i radničkih domaćinstava?

    4. Dati su podaci o broju dana potrebnih za dresiranje pasa ukoliko se pri treniranju

    primenjuje nagrada (I grupa) ili kazna (II grupa).

    A 43 41 48 44 51 48 47 35

    B 42 47 57 53 74 59 65 54 46

    Testirati nultu hipotezu da ne postoji statistički značajna razlika u prosečnom vremenu

    potrebnom za dresiranje pasa u zavisnosti od načina dresiranja.

    5. Da bi se utvrdilo da li postoji statistički značajna razlika u brzini delovanja dva leka A i B

    protiv bola, istraživač je primenio lekove na dva uzorka slučajno odabranih pacijenata.

    Rezultati testa su dati u sledećoj tabeli. Prosečno vreme i sume kvadrata odstupanja

    aritmetičke sredine vremena od početka delovanja leka u uzorcima (minutima) dati su u

    tabeli:

    Lek Veličina uzorka Prosečno vreme do početka

    delovanja leka

    Sume kvadrata odstupanja

    od aritmetičke sredine

    А 19 40 ∑(𝑋1 − �̅�1)² = 1815 B 12 50 ∑(𝑋2 − �̅�2)² = 729

    Da li postoji statistički značajna razlika u prosečnom vremenu do početka delovanja lekova

    A i B?

  • 45

  • 46

  • 47

    3. Analiza varijanse

    Primer 1. U jednom poljoprivrednom preduzeću organizovana je ishrana svinja na tri

    različita načina. Da bi se ispitalo da li način ishrane značajno utiče na tov svinja iz svake

    grupe, formiran je slučajan uzorak sa po 8 svinja. Ustanovljen je sledeći prirast u težini (kg)

    za dve nedelje:

    Redni broj Prirast

    I II III

    1 15 10 20

    2 13 25 22

    3 16 19 14

    4 20 18 17

    5 24 16 13

    6 18 20 18

    7 18 22 15

    8 23 14 10

    a) Da li postoji statistički značajna razlika u prosečnom prirastu svinja u zavisnosti od načina ishrane?

    b) Primenom t-testa i testa najmanje značajne razlike uporediti aritmetičke sredine tretmana.

    Nulta hipoteza: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘

    Alternativna hipoteza: 𝐻1: ∃(𝑖, 𝑗) 𝑖 ≠ 𝑗 𝜇𝑖 ≠ 𝜇𝑗 1 ≤ 𝑖 ≤ 𝑘

    Izvori

    varijacije

    Stepeni

    slobode

    Sume

    kvadrata

    Sredine

    suma kvadrata

    (varijanse)

    F- odnos F – tablično

    (r1=k-1; r2=N-k)

    0,05 0,01

    Tretmani k-1= 2 QT= 23,25 ST2= 11,625 ST2/SP2= 0,673 3,47 5,78

    Pogreška N-k= 21 QP= 362,75 SP2= 17,27

    Total N-1=23 Q=386

    k (broj tretmana) – 3

    n (veličina uzorka) – 8

    N (ukupan broj podataka) – 24

    Sume kvadrata

    =−===

    CQij

    n

    j

    k

    i

    i

    2

    11

    Q = 15² + 13² + 16² + ... + 15² + 10² - 7350= 386

  • 48

    C – je korektivni faktor =

    ===

    NC

    ij

    n

    j

    k

    i

    i2

    11 420²

    24= 7350

    =−

    ===

    Cn

    Qij

    n

    j

    k

    i

    T

    i2

    11

    𝑄𝑇 = 1472 + 1442 + 129²

    8− 7350 = 23,25

    =−=TP

    QQQ𝒅𝒈𝒂

    𝑄𝑝 = 386 − 23,25 = 362,75

    Sredine suma kvadrata

    =−

    =1

    2

    k

    QS T

    T =

    −=

    kN

    QS P

    P

    2

    𝑆𝑇2 =

    23,25

    2= 11,625 𝑆𝑝

    2 =362,75

    21= 17,27

    𝐹 = 0,673 < 𝐹(2,21)0.05 = 3,47 → 𝐻0

    𝐹 = 0,673 < 𝐹(2,21)0.01 = 5,78 → 𝐻0

    t-test

    𝐻0: 𝜇𝑖 = 𝜇𝑗

    𝐻1: 𝜇𝑖 ≠ 𝜇𝑗

    𝑆(�̅�𝑖−�̅�𝑗) =√

    2 ∙ 𝑆𝑝2

    𝑛= √

    2 ∙ 17,27

    8= 2,078

    𝑡1 =�̅�1 − �̅�2𝑆(�̅�𝑖−�̅�𝑗)

    =18,375 − 18

    2,078= 0,18

  • 49

    𝑡2 =�̅�1 − �̅�3𝑆(�̅�𝑖−�̅�𝑗)

    =18,375 − 16,125

    2,078= 1,08

    𝑡3 =�̅�2 − �̅�3𝑆(�̅�𝑖−�̅�𝑗)

    =18 − 16,125

    2,078= 0,90

    𝑡21:0,05 = 2,080

    𝑡21:0,01 = 2,831

    |𝑡| < 𝑡𝑁−𝑘;𝛼 → 𝐻𝑜

    |𝑡| > 𝑡𝑁−𝑘;𝛼 → 𝐻1

    Test najmanje značajne razlike

    𝐻0: 𝜇𝑖 = 𝜇𝑗

    𝐻1: 𝜇𝑖 ≠ 𝜇𝑗

    𝑆(�̅�𝑖−�̅�𝑗) =√

    2 ∙ 𝑆𝑝2

    𝑛= √

    2 ∙ 17,27

    8= 2,078

    𝑁𝑍𝑅𝛼 = 𝑡𝑁−𝑘;𝛼 ∙ 𝑆(�̅�𝑖−�̅�𝑗)

    𝑁𝑍𝑅0,05 = 2,080 ∙ 2,078 = 4,322

    𝑁𝑍𝑅0,01 = 2,831 ∙ 2,078 = 5,883

  • 50

    Tretman �̅�𝒊 �̅�𝒊 − �̅�𝑰𝑰𝑰 �̅�𝒊 − �̅�𝑰𝑰 I 18, 375 2,25 0,375

    II 18 1,875

    III 16,125

    Zadaci za vežbu:

    1. Da bi se utvrdilo da li prosečan dnevni prirast zavisi od vrste žitarica primenjene u ishrani,

    izveden je eksperiment u kome je svakoj grupi od 7 miševa dat obrok jedne od četiri vrste

    žitarica. Prirast (g) dat je u sledećoj tabeli:

    T R E T M A N I

    A B C D

    9 5 2 3

    7 4 1 8

    8 6 1 5

    8 4 2 9

    7 5 2 2

    8 7 3 7

    8 3 2 8

    a) Testirati nultu hipotezu da se prosečni prinos statistički značajno ne razlikuje u zavisnosti od načina ishrane;

    b) Primenom testa najmanje značajne razlike uporediti aritmetičke sredine parova tretmana.

    2. U eksperimentu organizovanom po planu potpuno slučajnog rasporeda ispituje se

    efikasnost tri hemijska preparata. Intezitet iritantnosti je označen 0-10 i izmeren je na 8

    eksperimentalnih životinja:

    Preparati 1 2 3 4 5 6 7 8

    I 6 9 6 5 7 5 6 6

    II 5 9 9 8 8 7 7 7

    III 3 4 3 6 8 5 5 6

    a) Testirati nultu hipotezu da je efikasnost sva tri preparata jednaka. b) Testirati značajnost razlike parova tretmana primenom NZR testa.

  • 51

  • 52

  • 53

    Testovi proporcija

    Postoje sledeći osnovni testovi za testiranja proporcija:

    1. kada upoređujeno proporciju iz prostog slučajnog uzorka sa pretpostavljenom proporcijom

    osnovnog skupa ili sa nekom teorijskom vrednošću – test značajnosti jedne proporcije

    2. kada upoređujemo dve proporcije iz dva nezavisna prosta slučajna uzorka- test značajnosti

    razlike dve proporcije.

    Test značajnosti jedne proporcije

    Primer 1. U uzorku od 164 grla jedne rase bilo je 52 goveda sa dužinom trupa ispod 160 cm.

    Može li se prihvatiti nulta hipoteza da u osnovnom skupu proporcija goveda sa dužinom

    trupa ispod 160 cm iznosi 0,4?

    n=164 𝐻0: 𝑝 = 0,4

    a=52 𝐻1: 𝑝 ≠ 0,4

    𝑝0 = 0,4

    𝑍 =�̂� − 𝑝

    𝑆�̂�=

    0,317 − 0,4

    0,036= −2,306 ∗

    �̂� =𝑎

    𝑛=

    52

    164= 0,317

    𝑆𝑝 = √�̂��̂�

    𝑛= √

    0,317 ∗ 0,683

    164= 0.036

    |𝑍| > 𝑍0,05 → 𝐻1

    |𝑍| < 𝑍0,01 → 𝐻0

    Test značajnosti razlike dve proporcije

    Primer 2. U uzorcima od po 110 grla goveda dve rase, obolela grla učestvuju sa 6% i 13%.

    Utvrditi da li je otpornost dve rase goveda prema ispitivanoj bolesti ista.

    𝐻𝑜: 𝑝1 = 𝑝2

    𝐻1: 𝑝1 ≠ 𝑝2

  • 54

    𝑛1 = 110 �̂�1 = 0,06

    𝑛2 = 110 �̂�2 = 0,13

    𝑍 =�̂�1 − �̂�2𝑆(𝑝1−�̂�2)

    =0,06 − 0,13

    0,0396= −1,768

    �̅� =�̂�1𝑛1 + �̂�2𝑛2

    𝑛1 + 𝑛2=

    0,06 ∙ 110 + 0,13 ∙ 110

    110 + 110= 0,095

    𝑆(�̂�1−𝑝2) = √𝑝𝑞̅̅ ̅ ∙ (1

    𝑛1+

    1

    𝑛2) = √0,095 ∙ 0,905 ∙ (

    1

    110+

    1

    110) = 0,0396

    |𝑍| < 𝑍0,05 → 𝐻0

    |𝑍| < 𝑍0,01 → 𝐻0

    Zadaci za vežbu:

    1. U uzorku od 100 jedinki vrste Tribolium castaneum rastvorom aktivne supstance

    hlorprifos metila posle 24 časa je registrovan mortalitet 73 jedinki. Očekivana proporcija

    smrtnosti je 0,9. Može li se smatrati da razlika konstatovane i očekivane smrtnosti nije

    statistički značajna?

    2. Ispitivanjem prostog slučajnog uzorka od 200 životinja utvrđeno je da je 4 životinje

    obolelo. Proporcija obolelih životinja u uzorku je_______, dok je ocena za standardnu grešku

    uzoračke proporcije__________. Nulta hipoteza da je uzoračka proporcija statistički

    značajna se sa rizikom od 5%_______________.

    3. Ispituje se efikasnost dve vakcine A i B. Prva vakcina je primenjena na uzorku od 32

    životinje i bila je uspešna u 24 slučaja. Druga vakcina je primenjena na uzorku od 26

    životinja i bila je efikasna u 18 slučajeva. Da li postoji statistički značajna razlika u

    efikasnosti vakcina?

  • 55

  • 56

  • 57

    REGRESIONA I KORELACIONA ANALIZA

    Regresiona i korelaciona analiza se primenjuje s namerom da se opiše, predvidi i kontroliše

    zavisna promenljiva u odnosu na jednu ili više nezavisno promenljivih, kao i da se utvrdi

    postojanje i intenzitet veze između zavisne i nezavisnih promenljivih.

    Primer 1. Dati su podaci o mlečnosti koze (kg/24h) u zavisnosti od dana laktacije:

    Mlečnost (Y) 1,84 1,75 1,50 1,62 1,51 1,25 1,26 1,15

    Dani laktacije (X) 14 24 34 44 54 64 74 84

    Na osnovu datih parova vrednosti izvesti sledeća računanja:

    a) Formirati dijagram rasturanja; b) Oceniti regresioni model, izračunati ocenjene vrednosti zavisno promenljive i ucrtati

    liniju regresije na dijagramu rasturanja;

    c) Izračunati standardnu grešku regresije; d) Izračunati vrednost koeficijenta korelacije, determinacije i nedetrminacije; e) Na osnovu jednačine regresije oceniti mlečnost 67. dana laktacije.

    a) Dijagram rasturanja:

    Radna tabela:

    X Y XY X² Y² �̂� (𝒀𝒊 − �̂�𝒊) (𝒀𝒊 − �̂�𝒊)²

    14 1,84 25,76 196 3,3856 1,82414 0,01586 0,00025154

    24 1,75 42 576 3,0625 1,72724 0,02276 0,000518018

    34 1,5 51 1156 2,25 1,63034 -0,13034 0,016988516

    44 1,62 71,28 1936 2,6244 1,53344 0,08656 0,007492634

    54 1,51 81,54 2916 2,2801 1,43654 0,07346 0,005396372

    64 1,25 80 4096 1,5625 1,33964 -0,08964 0,00803533

    74 1,26 93,24 5476 1,5876 1,24274 0,01726 0,000297908

    84 1,15 96,6 7056 1,3225 1,14584 0,00416 1,73056E-05

    392 11,88 541,42 23408 18,0752 11,87992 0,038997621

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2

    0 20 40 60 80 100

  • 58

    b) Ocena parametara:

    �̂�𝑖 = 𝑎 + 𝑏𝑋𝑖

    𝑏 =∑ 𝑋𝑌 −

    (∑ 𝑋)(∑ 𝑌)𝑛

    ∑ 𝑋2 −(∑ 𝑋)²

    𝑛

    =541,42 −

    392 ∙ 11,888

    23408 −(392)²

    8

    = −0,00969

    𝑎 = �̅� − 𝑏�̅� = 1,485 − (−0,00969) ∗ 49 = 1,9598

    �̂�𝑖 = 1,9598 − 0,00969𝑋𝑖

    Grafički prikaz:

    c) Standardna greška regresije:

    𝑆𝑒 = √∑((𝑌𝑖 − �̂�𝑖)²)

    𝑛 − 2= √

    0,03899

    8 − 2= 0,0806

    d) Koeficijent korelacije:

    𝑟 =∑ 𝑋𝑌 −

    (∑ 𝑋)(∑ 𝑌)𝑛

    √[∑ 𝑋2 −(∑ 𝑋)2

    𝑛 ] ∙ [∑ 𝑌2 −

    (∑ 𝑌)2

    𝑛 ]

    =541,42 −

    392 ∙ 11,888

    √23408 −(392)2

    8 ∙ 18,0752 −(11,88)2

    8

    = −0,954

    y = -0.0097x + 1.9598

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2

    0 10 20 30 40 50 60 70 80 90

  • 59

    Koeficijent determinacije: r²=(-0,954)²= 0,9101 (91,01%)

    Koeficijent nedeterminacije: k²= 1- 0,9101=0,0899 (8,99%)

    e) �̂�67 = 1,9598 − 0,00969 ∙ 67 = 1,31057(kg/24h)

  • 60

    Primer 2. Rezultati ispitivanja uticaja vitamina holina, dodatog smeši hrane, na prirast kod

    ispitivanih prasadi dati su sledećim vrednostima:

    Prosečan dnevni prirast (kg) (Y) 420 405 387 377

    Dodatak holina (mg/kg hrane) (X) 0 250 500 1000

    Na osnovu datih parova vrednosti izvesti sledeća računanja:

    f) Formirati dijagram rasturanja; g) Oceniti regresioni model, izračunati ocenjene vrednosti zavisno promenljive i ucrtati

    liniju regresije na dijagramu rasturanja;

    h) Izračunati standardnu grešku regresije; i) Izračunati vrednost koeficijenta korelacije, determinacije i nedetrminacije; j) Na osnovu jednačine regresije oceniti prosečan dnevni prirast za dodatak holina od

    750 mg/kg hrane.

    Dijagram rasturanja:

  • 61

    Radna tabela:

    X Y

  • 62

    Zadaci za vežbu:

    1. Dati su podaci o dozi leka i vremenu izlečenja:

    Doza leka 0 1 2 3 4 5 6

    Vreme izlečenja 15,4 12,2 13,7 9,2 9,9 6,1 4,1

    a) Oceniti parametre linearnog regresionog modela i objasniti njihovo značenje; b) Izračunati koeficijent determinacije; c) izračunati standardnu grešku regresije.

    2. Na osnovu podataka o težini 10 teladi pri rođenju i njihovom prirastu izračunato je:

    ∑X=410, ∑Y=304, ∑XY=12665, ∑X2=16974, ∑Y2=9508. Izračunati koeficijente koralcije i

    detreminacije i objasniti njihovo značenje. Da li telad koja imaju veću težinu pri rođenju

    imaju i veći očekivani prirast?

    3. Na osnovu podataka o proizvodnji mleka (000 lit.) i količini hrane (t) 10 krava izračunate

    su sledeće sume: ∑X=1530, ∑Y= 748, ∑XY=116210, ∑X²=248700. Oceniti linearni

    regresioni model i objasniti značenje regresionog koeficijenta.

  • 63

  • 64

    LITERATURA

    1. Čobanović Katarina (2003), Primeri za vežbanje iz statistike, Poljoprivredni fakultet, Univerzitet u Novom Sadu, Republika Srbija

    2. Lozanov-Crvenković Zagorka (2002), Statistika, Prirodno-matematički fakultet, Univerzitet u Novom Sadu, Republika Srbija

    3. Man S.P. (2017), Uvod u statistiku, deveto izdanje, John Wiley & Sons

    4. Mutavdžić Beba, Nikolić-Đorić Emilija (2018), Statistika (za smer Veterinarska medicina), Poljoprivredni fakultet, Univerzitet u Novom Sadu, Republika Srbija