Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
PRAKTIKUM IZ STATISTIKE (za smer veterinarska medicina)
Beba Mutavdžić, Tihomir Novaković, Dragana Tekić
SADRŽAJ
FORMIRANJE DISTRIBUCIJA FREKVENCIJA .................................................................. 1
POKAZATELJI CENTRALNE TENDENCIJE ...................................................................... 7
POKAZATELJI VARIJABILITETA ..................................................................................... 14
POKAZATELJI OBLIKA DISTRIBUCIJE ........................................................................... 21
NORMALNA RASPODELA ................................................................................................. 27
OCENE NA OSNOVU UZORKA ......................................................................................... 34
TESTIRANJE STATISTIČKIH HIPOTEZA ......................................................................... 40
REGRESIONA I KORELACIONA ANALIZA .................................................................... 57
LITERATURA ....................................................................................................................... 64
PREDGOVOR
Praktikum za predmet „Statistika”, koji se proučava na prvoj godini smera Veterinarska
medicina Poljoprivrednog fakulteta, Univerziteta u Novom Sadu obuhvata materiju koja je u
skladu sa aktuelnim akreditovanim programom za navedeni predmet i navedeni smer.
Praktikum se sastoji iz osam poglavlja, koja čine strukturnu i sadržajnu celinu:
• Prvo poglavlje - Formiranje distribucije frekvencija
• Drugo poglavlje - Pokazatelji centralne tendencije
• Treće poglavlje – Pokazatelji varijabiliteta
• Četvrto poglavlje – Pokazatelji oblika distribucije
• Peto poglavlje – Normalna raspodela
• Šesto poglavlje – Ocene na osnovu uzorka
• Sedmo poglavlje – Testiranje statističkih hipoteza
• Osmo poglavlje – Regresiona i korelaciona analiza
Svako poglavlje obuhvata jedan ili više radnih zadataka, kao i primere za vežbanje. Formule
u primerima date su samo kao radni obrasci.
Autori se nadaju da će ovaj praktikum olakšati studentima upotrebu osnovnih statističkih
metoda u rešavanju problema koji su u domenu poljoprivrednih i bioloških nauka, odnosno
konkretno problema iz oblasti veterinarske medicine. Ideja autora je da se studenti upoznaju
sa deskriptivnim metodama, kao i metodama analize rezultata ogleda.
Zahvaljujemo se svima koji su na direktan ili indirektan način pomogli izradu ove knjige, a
naročito recenzentima: prof. dr Otiliji Sedlak i Mr Emiliji Nikolić-Đorić na korisnim
sugestijama.
Novi Sad, AUTORI
2020. godine
1
FORMIRANJE DISTRIBUCIJA FREKVENCIJA
Prekidno obeležje
Primer 1. Na osnovu broja svinja kod 24 poljoprivredna gazdinstva formirati neintervalnu i
intervalnu distribuciju frekvencija:
12 5 6 7 5 8 10 9 5 12 9 8
8 7 7 10 11 8 10 10 11 9 12 8
Uređena statistička serija:
5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 11, 11, 12, 12, 12.
Neintervalna serija:
Broj svinja Broj
gazdinstava
5 3
6 1
7 3
8 5
9 3
10 4
11 2
12 3
Ukupno 24
Intervalna serija:
Broj svinja Broj gazdinstava
5-6 4
7-8 8
9-10 7
11-12 5
Ukupno 24
2
Neprekidno obeležje
Primer 2. Dnevna mlečnost (lit.) 20 ispitivanih krava je data u sledećoj seriji:
10,1 12,0 17,6 14,5 18,4 12,7 16,2 15,8 16,4 13,0
19,9 12,1 13,5 15,1 17,9 13,3 17,0 19,3 16,5 14,5
a) Formirati intervalnu distribuciju frekvencija (i=2); b) izračunati relativne frekvencije (strukturu); c) formirati kumulativnu distribuciju frekvencija d) formirati kumulaciju strukture e) podatke grafički predstaviti histogramom i poligonom
Dijagram stablo-list:
10 1
11
12 0 1 7
13 0 3 5
14 5 5
15 1 8
16 2 4 5
17 0 6 9
18 4
19 3 9
Radna tabela:
Dnevna
mlečnost
(Xi)
Broj
krava (fi)
Relativna frekvencija
(struktura)
Kumulativ Kumulativ
strukture
Ispod Iznad Ispod Iznad
10,0-11,9 1 1/20=0,05 5% 1 20 5% 100%
12,0-13,9 6 6/20=0,3 30% 7 19 35% 95%
14,0-15,9 4 4/20=0,2 20% 11 13 55% 65%
16,0-17,9 6 6/20=0,3 30% 17 9 85% 45%
18,0-19,9 3 3/20=0,15 15% 20 3 100% 15%
Ukupno 20 1,00 100%
3
Grafički prikaz (histogram i poligon):
Histogram:
Poligon:
0
1
2
3
4
5
6
7
10 11 12 13 14 15 16 17 18 19 20
Bro
j kra
va
Dnevna mlečnost
4
Zadaci za vežbu:
1. Na osnovu podataka o broju teladi kod 30 poljoprivrednih gazdinstava formirati
neintervalnu distribuciju frekvencija i grafički je predstaviti primenom poligona:
7 8 10 8 11 10 10 12 5 10 8 7 11 11 6
8 10 7 11 5 10 10 11 12 8 12 11 9 8 5
2. Dužina butne kosti (cm) merena je kod 40 pasa. Dobijene su sledeće vrednosti:
17,6 14,1 13,9 13,1 16,8 14,7 13,2 15,7 13,5 15,4
14,3 13,9 13,2 13,6 15,3 13,2 16,6 14,7 18,1 18,4
15,6 15,5 15,4 14,7 17,6 14,4 19,8 13,6 14,7 14,7
13,9 17,8 18,2 13,8 13,1 13,5 13,6 14,9 14,7 14,1
Formirati dijagram stablo list i na osnovu njega intervalnu seriju distribucije frekvencija ako
je i=0,5. Utvrditi strukturu raspodele, kumulativ i kumulativ strukture. Dati komentar za
kumulativne vrednosti najfrekventnije vrednosti obeležja. Grafički predstaviti podatke
primenom histograma.
3. Dati su podaci o plućnoj ventilaciji (lit/min) 25 odraslih ovaca:
8,3 8,0 9,9 6,1 5,5
10,3 6,5 7,6 7,6 7,6
6,9 10,3 7,8 7,3 8,9
10,1 7,6 9,1 8,3 4,8
10,2 6,5 9,1 7,0 11,9
Formirati dijagram stablo list i intervalnu distribuciju frekvencija ako je dužina grupnog
interval 1,5 (lit/min). Podatke grafički predstaviti.
5
6
7
POKAZATELJI CENTRALNE TENDENCIJE
Pokazatelji centralne tendencije predstavljaju vrednosti koje kvantifikuju tendenciju podataka
u seriji prema njihovom “centru”, odnosno sredini.
U pokazatelje centralne tendencije ubrajaju se:
- Aritmetička sredina - Geometrijska sredina - Harmonijska sredina - Medijana - Modus - Kvantili
Aritmetička sredina
Aritmetička sredina predstavlja izračunatu prosečnu vrednost posmatrane promenljive i
računa se kao količnik zbira vrednosti obeležja i ukupnog broja podataka. Razlikuje se
izračunavanje proste (za negrupisane podatke) i ponderisane (za grupisane podatke)
aritmetičke sredine.
Primer 1. Izračunati prosečnu vrednost dnevnog prirasta svinja (kg) na osnovu sledeće serije
podataka:
Prirast (kg) (Xi) 0,80 0,74 0,83 0,82 0,66 0,78
�̅� =∑ 𝑋𝑖
𝑛𝑖=1
𝑛=
4,63
6= 0,77 (𝑘𝑔)
Primer 2. Utvrditi prosečanu dnevnu mlečnost (lit.) 20 ispitivanih krava na osnovu sledeće
serije podataka:
Dnevna mlečnost (lit.)
(Xi)
Broj krava
(fi)
𝑿𝒊𝒇𝒊
11 2 22
13 4 52
15 6 90
17 5 85
19 3 57
Ukupno 20 306
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=306
20= 15,3 (𝑙𝑖𝑡)
8
Primer 3. Utvrditi prosečan broj teladi po radnoj organizaciji na osnovu sledeće serije
podataka:
Broj teladi Poljoprivredne radne
organizacije
𝑿𝒊 𝑿𝒊𝒇𝒊
30-39 3 35 105
40-49 4 45 180
50-59 4 55 220
60-69 6 65 390
70-79 3 75 225
80-89 3 85 255
90-99 2 95 190
Ukupno 1565
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=1565
25= 62,6
Medijana
Medijana je pozicioni pokazatelj centralne tendencije i predstavlja vrednost obeležja koja
uređenu statističku seriju deli na dva jednaka dela. Za neintervalne statističke serije potrebno
je prethodno utvrditi da li je ukupan broj podataka paran ili neparan broj. Kod intervalnih
serija koristi se korigovana formula.
Primer 1. Utvrditi medijalnu vrednost za sledeće serije podataka:
Xi 1230 1320 1200 1500 1600
Uređena serija 1200 1230 1320 1500 1600
𝑀𝑒 = 𝑋𝑛+12
= 𝑋5+12
= 𝑋3 = 1320
Xi 2110 1900 2170 1980 2100 2000
Uređena serija 1900 1980 2000 2100 2110 2170
𝑀𝑒 =𝑋𝑛
2+ 𝑋𝑛
2+1
2=
𝑋62
+ 𝑋62+1
2=
𝑋3 + 𝑋4
2=
2000 + 2100
2= 2050
9
Primer 2. Utvrditi medijalnu vrednost za sledeću seriju:
Masa jagnjadi (Xi) Broj jagnjadi (fi) Kumulativ
3,9 8 8
4,2 12 20
4,3 20 40
4,5 15 55
4,6 5 60
Ukupno 60
𝑀𝑒 =𝑋𝑛
2+𝑋𝑛
2+1
2=
𝑋602
+𝑋602
+1
2 =
𝑋30+𝑋31
2=
4,3+4,3
2= 4,3
Primer 3. Utvrditi medijalnu vrednost (primenom korigovane formule) za sledeću seriju:
Dužina trupa
(Xi)
Broj goveda
(fi)
Kumulativ
148,1-152 10 10
152,1-156 19 29
156,1-160 23 52
160,1-164 34 86
164,1-168 34 120
168,1-172 28 148
172,1-176 13 161
176,1-180 3 164
Ukupno 164
𝑀𝑒 = 𝐿 + (𝑛
2−𝐹𝑀𝑒−1
𝑓𝑀𝑒) × 𝑖 = 160 + (
164
2−52
34) ∙ 4 = 163,53
10
Modus
Modus je najučestalija vrednost obeležja u statističkoj seriji. Prema broju modusa statističke
serije mogu biti unimodalne, bimodalne ili mogu imati tri modusa.
Primer 1. Utvrditi modus za sledeću seriju podataka:
Xi 75 45 50 70 55 65 60 65 70
Uređena serija 45 50 55 60 65 65 70 70 75
𝑀𝑂1 = 65
𝑀𝑂2 = 70
Primer 2. Utvrditi najčešći broj larvi skočibuba po 1 m2 na posmatranom lokalitetu:
Prosečan broj larvi po 1 m2 (Xi) Broj parcela (fi)
4,5 10
7,5 24
10,5 36
13,5 90
𝑀𝑂 = 13,5 𝑙𝑎𝑟𝑣𝑖 𝑝𝑜 1 m2
Primer 3. Utvrditi modus (primenom korigovane formule) za sledeću seriju podataka:
Prinos kukuruza (t/ha) Površina (ha)
4,01-5,00 3
5,01-6,00 3
6,01-7,00 4
7,01-8,00 5
8,01-9,00 6
9,01-10,00 3
∑ 24
𝑀𝑂 = 𝐿 + (𝑑1
𝑑1 + 𝑑2) × 𝑖 = 8 + (
1
1 + 3) ∙ 1 = 8,25
𝑑1 =6-5=1 𝑑2 =6-3=3
11
Zadaci za vežbu:
1. Odrediti aritmetičku sredinu, modus i medijanu za sledeće vrednosti numeričkog obeležja:
2 3 4 13 1 6 6 7 6 8 11
2. Na osnovu podataka uzorka na jednoj farmi koja ima 250 krmača utvrditi aritmetičku
sredinu, modus i medijanu.
Broj prasadi Broj krmača
5 1
6 0
7 2
8 3
9 3
10 10
11 8
12 5
13 3
14 2
3. Za podatke koji se odnose na masu teladi (kg) na jednoj farmi izračunati aritmetičku
sredinu, modus i medijanu.
Masa teladi (kg) Broj teladi
60,1-70,0 2
70,1-80,0 6
80,1-90,0 11
90,1-100,0 17
100,1-110,0 26
110,1-120,0 19
120,1-130,0 12
130,1-140,0 6
140,1-150,0 1
12
13
14
POKAZATELJI VARIJABILITETA
Pokazatelji varijabiliteta predstavljaju meru disperzije vrednosti obeležja u okviru jedne
statističke serije. Razlikuju se apsolutni i relativni pokazatelji varijabiliteta.
Apsolutni pokazatelji varijabiliteta su:
- Interval varijacije - Srednje apsolutno odstupanje - Standardna devijacija - Varijansa
Relativni pokazatelji varijabiliteta su:
- Koeficijent varijacije - Standardizovano (normalizovano) odstupanje
Interval varijacije
Interval varijacije predstavlja razliku između ekstremnih vrednosti obeležja u nekoj
statističkoj seriji.
Primer 1. Na osnovu podataka iz uzorka ustanovljene su sledeće težine proizvoda (kg):
Težina proizvoda (kg) (Xi) 4,8 4,9 5,9 5,2 4,9 5,0 5,4 5,3 5,1
Uređena serija 4,8 4,9 4,9 5,0 5,1 5,2 5,3 5,4 5,9
𝐼 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 5,9 − 4,8 = 1,1(𝑘𝑔 )
Srednje apsolutno odstupanje
Srednje apsolutno odstupanje predstavlja količnik zbira apsolutnih vrednosti odstupanja
pojedinačnih vrednosti obeležja od njihovog proseka i ukupnog broja podataka. Izražava se u
jedinicama mere obeležja.
Primer 2. Izračunati srednje aposlutno odstupanje za seriju podataka koja se odnosi na
dužinu polutki svinja (cm):
Dužina polutki (cm) (Xi) 𝑿𝒊 − �̅� |𝑿𝒊 − �̅�| 80 -19,14 19,14
89 -10,14 10,14
93 -6,14 6,14
100 0,86 0,86
105 5,86 5,86
112 12,86 12,86
115 15,86 15,86
∑ 70,86
15
𝑆𝑂 =∑ |𝑋𝑖 − �̅�|
𝑛𝑖=1
𝑛=
70,86
7= 10,12 (𝑐𝑚)
�̅� =∑ 𝑋𝑖
𝑛=
694
7= 99,14(𝑐𝑚)
Primer 3. Izračunati srednje apsolutno odstupanje za sledeću seriju podataka koja se odnosi
na mlečnost krava:
Mlečnost po kravi
(lit.) (Xi)
Broj krava
(fi)
𝑿𝒊𝒇𝒊 |𝑋𝑖 − �̅�| 𝑓𝑖|𝑋𝑖 − �̅�|
8 40 320 4,43 177,2
10 8 80 2,43 19,44
12 25 300 0,43 10,75
16 5 80 3,57 17,85
20 25 500 7,57 189,25
∑ 1280 414,49
𝑆𝑂 =∑ 𝑓𝑖|𝑋𝑖−�̅�|
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=414,49
103= 4,02 (𝑙𝑖𝑡)
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=1280
103= 12,43(𝑙𝑖𝑡)
16
Standardna devijacija i varijansa
Standardna devijacija je kvadratni koren iz sredine kvadrata odstupanja vrednosti obeležja od
aritmetičke sredine. Vrednost standardne devijacije pokazuje koliko su udaljene grupisane
vrednosti obeležja od aritmetičke sredine. Izražava se u jedinicama mere obeležja.
Primer 4. Izračunati standardnu devijaciju za sledeću seriju podatka koja se odnosi na masu
prasića (kg):
Masa prasića (kg)
(Xi) (𝑋𝑖 − �̅�) (𝑋𝑖 − �̅�)
2 𝑋𝑖
2
19 -4,29 18,36734694 361
20 -3,29 10,79591837 400
22 -1,29 1,653061224 484
23 -0,29 0,081632653 529
25 1,71 2,93877551 625
26 2,71 7,367346939 676
28 4,71 22,2244898 784
163 63,43 3859
I način: 𝜎 = √∑ (𝑋𝑖−�̅�)
2𝑛𝑖=1
𝑛= √
63,43
7= 3,01(𝑘𝑔)
II način: 𝜎 =√∑ 𝑋𝑖
2− (∑ 𝑋𝑖
𝑛𝑖=1 )
2
𝑛𝑛𝑖=1
𝑛= √
3859− (163²
7)
7= 3,01(𝑘𝑔)
Primer 5. Izračunati standardnu devijaciju za sledeću seriju podataka koja se odnosi na
potrošnju mleka:
Potrošnja
mleka (lit.)
(Xi)
Broj
domaćinstava
(fi)
𝑿𝒊 𝑿𝒊𝒇𝒊 (𝑿𝒊 − �̅�) 𝒇𝒊(𝑿𝒊 − �̅�)𝟐 𝑿𝒊
𝟐𝒇𝒊
12,0-19,9 12 16 192 -18,32 4027,469 3072
20,0-27,9 23 24 552 -10,32 2449,555 13248
28,0-35,9 85 32 2720 -2,32 457,504 87040
36,0-43,9 55 40 2200 5,68 1774,432 88000
44,0-51,9 25 48 1200 13,68 4678,56 57600
∑ 200 6864 13387,52 248960
17
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=6864
200= 34,32
I način: 𝜎 = √∑ 𝑓𝑖(𝑋𝑖−�̅�)
2𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
= √13387,52
200= 8,18 (𝑙𝑖𝑡)
II način: 𝜎 =√
∑ 𝑋𝑖2𝑓𝑖−
(∑ 𝑋𝑖𝑓𝑖𝑘𝑖=1 )
2
∑ 𝑓𝑖𝑘𝑖=1
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
= √248960−(
6864²
200)
200= 8,18 (𝑙𝑖𝑡)
Koeficijent varijacije
Koeficijent varijacije je relativni pokazatelj varijabiliteta koji svoju primenu pronalazi
prilikom poređenja varijabiliteta pojava koje su izražene u različitim jedinicama mere.
Izražava se u procentima
Primer 6. U jednom prasilištu prosečan broj prasadi po leglu je 12 komada sa standardnom
devijacijom 2 komada. Prosečna telesna masa prasadi iznosi 8 kg dok je varijansa 2,56 kg2.
Uporediti varijabilitet telesne mase i broja prasadi.
𝑉1 =𝜎1
�̅�1× 100 (%) =
2
12× 100 (%) = 16,67%
𝑉2 =𝜎2
�̅�2× 100 (%) =
√2,56
8× 100 (%) = 20%
V2 > V1 – varijabilitet telesne mase je veći od varijabiliteta broja
prasadi.
18
Standardizovano (normalizovano) odstupanje
Standardizovano odstupanje je mera udaljenosti pojedinih vrednosti obeležja od aritmetičke
sredine iskazana u odnosu na standardnu devijaciju. Standardizovano odstupanje je takođe
relativni pokazatelj disperzije obeležja i nema jedinicu mere.
Primer 7. Utvrditi standardizovano odstupanje najučestalije vrednosti obeležja za seriju
podataka koja se odnosi na dnevnu mlečnost (lit.) 20 ispitivanih krava.
Dnevna
mlečnost
(lit.) (Xi)
Broj krava
(fi)
𝑿𝒊 𝑿𝒊𝒇𝒊 𝑿𝒊𝟐𝒇𝒊 (𝑿𝒊 − �̅�)
10,1-12,0 2 11 22 242 -4,3
12,1-14,0 4 13 52 676 -2,3
14,1-16,0 6 15 90 1350 -0,3
16,1-18,0 5 17 85 1445 1,7
18,1-20,0 3 19 57 1083 3,7
∑ 20 306 4796
Najučestalija vrednost obeležja (modus) je 15.
𝑍𝑖 =𝑋𝑖 − �̅�
𝜎=
15 − 15,3
2,39= −0,13
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=306
20= 15,3
𝜎 =√
∑ 𝑋𝑖2𝑓𝑖 −
(∑ 𝑋𝑖𝑓𝑖𝑘𝑖=1 )
2
∑ 𝑓𝑖𝑘𝑖=1
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=√4796 − (
306²20
)
20= 2,39
19
Zadaci za vežbu:
1. Dati su podaci koji se odnose na prirast pilića starosti 3 nedelje.
Prirast (g)
392
402
385
440
415
397
400
Izračunati apsolutne pokazatelje varijabiliteta.
2. Dati su podaci koji se odnose na sadržaj glikoze u prednjoj komori oka i koncentraciji u
serumu krvi 30 zdravih pasa:
Koncentracija glikoze (%) Broj pasa
70-79 8
80-89 15
90-99 4
100-109 3
Izračunati apsolutne pokazatelje varijabiliteta i standardizovano odstupanje za vrednost
obeležja X=100.
3. Date su vrednosti numeričkog obeležja X: 10, 30, 50, 70, 90. Varijansa datog obeležja je
𝜎𝑥2 = 800 . Uporediti varijabilitet obeležja X i obeležja Y=2X+3.
4. Uporediti varijabilnost 2 serije podataka ukoliko su njihove vrednosti sledeće:
�̅�1 = 70 (𝑐𝑚); 𝜎12 = 25 (𝑐𝑚)2; �̅�2 = 35 (𝑔); 𝜎2 = 4 (𝑔).
20
21
POKAZATELJI OBLIKA DISTRIBUCIJE
Pokazatelji oblika distribucije sagledavaju dve karakteristike, asimetričnost i spljoštenost.
Najčešće korišćeni pokazatelji ovih karakteristika distribucije su:
- Mera asimetričnosti – I Pirsonov koeficijent (𝛽1) - Mera spljoštenosti – II Pirsonov koeficijent 𝛽2).
Za izračunavanje ovih koeficijenata potrebno je prvo da se izračunaju centralni momenti. Pod
centralnim momentom k-tog reda – podrazumeva se sredina sume odstupanja vrednosti
obeležja od aritmetičke sredine stepenovana na k-ti stepen.
Primer 1. Na osnovu podataka o broju tovne junadi (000 komada) na jednoj teritoriji utvrditi
pokazatelje oblika distribucije i dati odgovarajući komentar.
Broj junadi
(Xi) (𝑿𝒊 − �̅�) (𝑿𝒊 − �̅�)
𝟐 (𝑿𝒊 − �̅�)𝟑 (𝑿𝒊 − �̅�)
𝟒
3 -7 49 -343 2401
5 -5 25 -125 625
7 -3 9 -27 81
10 0 0 0 0
15 5 25 125 625
20 10 100 1000 10000
∑ 60 208 630 13732
�̅� =∑ 𝑋𝑖
𝑛𝑖=1
𝑛=
60
6= 10
𝛽1 =𝜇3
2
𝜇23 =
105²
34,67³= 0,264
𝛽2 =𝜇4
𝜇22 =
2288,67
34,67²= 1,904
𝜇2 =∑ (𝑿𝒊 − �̅�)
𝟐𝑛𝑖=1
𝑛=
208
6= 34,67
𝜇3 =∑ (𝑿𝒊 − �̅�)
𝟑𝑛𝑖=1
𝑛=
630
6= 105
22
𝜇4 =∑ (𝑿𝒊 − �̅�)
𝟒𝑛𝑖=1
𝑛=
13732
6= 2288,67
Serija je pozitivno asimterična i spljoštenija u odnosu na normalnu distribuciju.
Primer 2. Utvrditi oblik raspodele podataka koji se odnose na mesečnu potrošnju svinjskog
mesa u 100 slučajno odabranih gazdinstava na teritoriji Grada Novog Sada.
Potrošnja
mesa
(Xi)
Broj
domaćinstava
(fi)
(𝑿𝒊 − �̅�) (𝑿𝒊 − �̅�)𝟐 𝒇𝒊(𝑿𝒊 − �̅�)
𝟐 𝒇𝒊(𝑿𝒊 − �̅�)𝟑 𝒇𝒊(𝑿𝒊 − �̅�)
𝟒
2,2 10 -0,66 0,4356 4,356 -2,875 189,74736
2,8 15 -0,06 0,0036 0,054 -0,0032 0,0001944
3,0 40 0,14 0,0196 0,784 0,10976 24,58624
3,3 20 0,44 0,1936 3,872 1,70368 0,7496192
3,8 10 0,94 0,8836 8,836 8,30584 780,74896
4,0 5 1,14 1,2996 6,498 7,40772 8,4448008
∑ 100 24,4 14,65 1004,28
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=286
100= 2,86
𝛽1 =𝜇3
2
𝜇23 =
0,1465²
0,244³= 1,477
𝛽2 =𝜇4
𝜇22 =
10,0428
0,244²= 168,84
𝜇2 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)
𝟐𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=24,4
100= 0,244
𝜇3 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)
𝟑𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=14,65
100= 0,1465
23
𝜇4 =∑ 𝒇𝒊(𝑿𝒊 − �̅�)
𝟒𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=1004,28
100= 10,0428
Serija je pozitivno asimetrična i izduženija u odnosu na normalnu raspodelu.
Primer 3. Za datu seriju podataka utvrditi aritmetičku sredinu, modus i medijanu, a zatim na
osnovu izračunatih pokazatelja centralne tendencije opisati oblik date raspodele.
Masa jagnjadi (kg)
(Xi)
Broj jagnjadi
(fi)
𝑿𝒊𝒇𝒊 Kumulativ
3,9 8 31,2 8
4,2 12 50,4 20
4,3 20 86 40
4,5 15 67,5 55
4,6 5 23 60
∑ 60 258,1
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=258,1
60= 4,302(𝑘𝑔)
𝑀𝑂 = 4,3 (𝑘𝑔)
𝑀𝑒 = 4,3(𝑘𝑔)
�̅� = 𝑀𝑂 = 𝑀𝑒 Serija je simetrična.
24
Zadaci za vežbu:
1. Na osnovu podataka o distribuciji nove smeše za ishranu koka nosilja po maloprodajnim
objektima, dobijeni su sledeći rezultati: 𝜎2 = 12,25, 𝜇3 = −5,27 i 𝜇4 = 291,7. Ispitati asimetriju i oblik ove empirijske distribucije frekvencija?
2. Na osnovu N=100 vrednosti obeležja formirana je intervalna serija distribucije frekvencija
i izračunate su sledeće sume:
∑ 𝑓(𝑥 − �̅�)2 = 688, ∑ 𝑓(𝑥 − �̅�)3 = −144, ∑ 𝑓(𝑥 − �̅�)4 = 12544. Izračunati vrednosti prvog i drugog Pirsonovog koeficijenta i uporediti ih sa vrednostima
normalne raspodele.
3. Na osnovu datih podataka koji se odnose na mesečnu potrošnju mesa po domaćinstvu
izračunati pokazatelje centralne tendencije i preko njih ispitati oblik date raspodele.
Mesečna potrošnja (kg) Broj domaćinstava
2,2 10
2,8 40
3,0 15
3,3 20
3,8 10
4,0 5
25
26
27
NORMALNA RASPODELA
Normalna raspodela je najvažniji model teorijske distribucije verovatnoće. Značaj ovog
oblika distribucije u statističkoj teoriji i statističkim istraživanjima se ogleda u tome što se
mnoge empirijske pojave modeliraju normalnom distribucijom. Parametarska statistika je
zasnovana na pretpostavci da osnovni skup kome pripada uzorak ima normalnu distribuciju.
Primena Normalne raspodele:
1. 𝑃 (−𝑎 ≤ 𝑥 ≤ 𝑎) = 2𝛷(𝑎)
Primer1. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -1 do 1 ako važi
da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).
Tražena verovatnoća se može zapisati:
𝑃 (−1 ≤ 𝑥 ≤ 1) = 2𝛷(1)
Da bi se izračunala odgovarajuća verovatnoća, neophodno je utvrditi osenčenu površinu ispod krive.
Kako se iz tablica Normalne raspodele raspolaže sa ukupnom površinom jedne polovine ispod krive,
neophodno je najpre izračunati 𝛷(1) što iznosi 0,3413. S obzirom na to da su leva i desna strana
površine ispod krive jednake, konačno rešenje glasi: 2𝛷(1) = 0,6826.
28
2. 𝑃 (𝑎 ≤ 𝑥 ≤ 𝑏) = 𝛷(𝑏) − 𝛷(𝑎)
Primer 2. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od 0,5 do 1,5, ako
važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).
Tražena verovatnoća se može zapisati:
𝑃 (0,5 ≤ 𝑥 ≤ 1,5) = 𝛷(1,5) − 𝛷(0,5)
Kako se na osnovu vrednosti iz tablice Normalne raspodele može utvrditi površina odsečaka samo za
jednu polovinu površine ispod krive, potrebno je najpre utvrditi 𝛷(1,5) = 0,4332 a zatim od te
površine oduzeti 𝛷(0,5) = 0,1915. Tražena verovatnoća glasi:
𝑃 (0,5 ≤ 𝑥 ≤ 1,5) = 0,2417
29
3. 𝑃 (−𝑏 ≤ 𝑥 ≤ 𝑎) = 𝛷(𝑎) + 𝛷(𝑏)
Primer 3. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -1,2 do 0,7, ako
važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).
Tražena verovatnoća se može zapisati:
𝑃 (−1,2 ≤ 𝑥 ≤ 0,7) = 𝛷(−1,2) + 𝛷(0,7)
Do tražene površine će se doći tako što se prvobitno utvrditi 𝛷(−1,2) (ili može se reći i 𝛷(1,2) jer su
leva i desna strana površine ispod krive jednake) što iznosi 0,3849. Zatim se utvrdi 𝛷(0,7) što iznosi
0,2580. Tražena verovatnoća glasi:
𝑃 (−1,2 ≤ 𝑥 ≤ 0,7) = 𝛷(−1,2) + 𝛷(0,7) = 0,3849 + 0,2580 = 0,6429
30
4. 𝑃(−𝑏 ≤ 𝑥 ≤ −𝑎) = 𝛷(−𝑏) − 𝛷(−𝑎) = 𝛷(𝑏) − 𝛷(𝑎)
Primer 4. Utvrditi verovatnoću da će se slučajno promenljiva X naći u intervalu od -2,3 do -1,2,
ako važi da je aritmetička sredina 0 (μ=0) i varijansa 1 (σ2=1).
Tražena verovatnoća je:
𝑃(−2,3 ≤ 𝑥 ≤ −1,2) = 𝛷(−2,3) − 𝛷(−1,2) = 𝛷(2,3) − 𝛷(1,2)
Da bi se utvrdila tražena verovatnoća pristup je isti kao u primeru 2, samo što se inicijalne
vrednosti nalaze na levoj strani X ose. Konačno rešenje glasi:
𝑃(−2,3 ≤ 𝑥 ≤ −1,2) = 𝛷(−2,3) − 𝛷(−1,2) = 𝛷(2,3) − 𝛷(1,2) == 0,4893 − 0,3849
= 0,1044
31
Primer 5. Kod 250 junadi prosečan dnevni prirast iznosi 0.8 kg sa varijansom 0.0625kg2.
a) Izračunati verovatnoću da je prosečan dnevni prirast junadi 0.6-0.8kg. b) Izračunati očekivan broj junadi sa prosečnim dnevnim prirastom 0.6-0.8kg.
Ukupan broj podataka iznosi 250 (N=250), aritmetička sredina 0,8kg a varijansa 0,0625 kg2. Kako je
prekršen uslov da je aritmetička sredina 1 a varijansa 0, neophodno je izvršiti transformaciju obeležja
primenom sledećeg obrasca: 𝑋−𝜇
𝜎 .
X1=0,6
X2=0,8
μ=0,8
σ2=0,0625=𝜎 = √𝜎2 = √0,0625 = 0,25
a)
𝑃 (0,6 ≤ 𝑥 ≤ 0,8) = 𝑃 (0,6−0,8
0,25≤ 𝑥 ≤
0,8−0,8
0,25) = 𝑃(−0,8 ≤ 𝑥 ≤ 0) = 𝛷(−0,8) = 𝛷(0,8) =
0,2881
Dakle, verovatnoća da će se prosečan dnevni prirast kretati u interval od 0,6 do 0,8 kg iznosi 0,2881.
b)
Da bi utvrdili očekivani broj prasadi sa prethodno utvrđenim prirastom neophodno je izračunatu
verovatnoću pomnožiti sa ukupnim broj junadi:
Fi = Pi*N=0,2881*250 = 72,025 ≈ 72
32
Zadaci za vežbu:
1. Slučajno promenljiva Z ima normalnu raspodelu sa parametrima μ=0 i σ=1. Odrediti a
ukuliko osenčena površina zauzima 97% površine ispod krive.
a
2. Odrediti vrednost z za standardizovanu normalnu krivu tako da je površina na levom kraju
raspodele 0,04.
3. Odrediti verdnost z za standardizovanu normalnu krivu gde verovatnoća da se vrednost
slučajne promenljive X nalazi između –z i z iznosi 0,5.
0.4
0.3
0.2
0.1
0.0
X
f
-z
0.5
0 z
33
4. Pretpostavljajući da je sadržaj gvožđa u serumu psa slučajna promenljiva koja ima
normalnu raspodelu sa parametrima μ = 25(μmol/l) i varijansom σ2 = 4(μmol/l).
a) Izračunati verovatnoću da je sadržaj gvožđa u serumu psa 21-29 (μmol/l).
b) Izračunati verovatnoću da je sadržaj gvožđa u serumu 19-31 (μmol/l).
34
OCENE NA OSNOVU UZORKA
U praktičnom radu, u svrhu donošenja zaključaka o karakteristikama osnovnog skupa, uzima
se jedan ili više prostih slučajnih uzoraka dovoljne veličine na osnovu kojeg se ocenjuju,
odnosno procenjuju nepoznati parametri osnovnog skupa.
U slučaju da je poznata veličina osnovnog skupa moguće je izračunati i total osnovnog
skupa.
Interval poverenja za ocenu nepoznate sredine osnovnog skupa
Intervali poverenja za ocenu nepoznate aritmetičke sredine osnovnog skupa na osnovu
uzorka se razlikuju prema tome da li je poznat varijavilitet osnovnog skupa ili nije.
Poznat varijabilitet osnovnog skupa
Ukoliko je poznat varijabilitet osnovnog skupa u intervalu poverenja figuriraju tačkasta
ocena aritmetičke sredine iz uzorka (�̅�), prava standardna greška aritmetičke sredine (𝜎�̅�) i kritične vrednosti iz tablice Normalne raspodele (𝑍𝛼).
Primer 1. U rejonu od 10.000 domaćinstava izabran je uzorak čiji su rezultati dati sledećim
vrednostima:
Mesečna potrošnja
goveđeg mesa (kg)
(𝑿𝒊)
Broj domaćinstava
(𝒇𝒊) 𝑿𝒊𝒇𝒊
1 10 10
1,6 15 24
1,8 40 72
2,1 20 42
2,6 10 26
2,8 5 14
Ukupno 100 188
Oceniti prosečnu mesečnu i ukupnu potrošnju goveđeg mesa sa pouzdanošću od 95 procenata
ako je od ranije poznat varijabilitet osnovnog skupa 𝜎2 = 3,4 kg2.
�̅� − 𝑍𝛼 ∙ 𝜎𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝜎𝑥
1,88-1,96*0,1834
35
𝜎𝑥 =𝜎
√𝑛√
𝑁 − 𝑛
𝑁 − 1=
1,843
√100√
10000 − 100
10000 − 1= 0,1834
Nije poznat varijabilitet osnovnog skupa
S druge strane, ukoliko varijabilitet osnovnog skupa nije poznat, pored tačkaste ocene
aritmetičke sredine iz uzorka u intervalu poverenja figuriraju još i ocenjena standardna
greška aritemtičke sredine (𝑆�̅�), kao i kritične vrednosti iz tablice Normalne raspodele (za velike uzorke) odnosno kritične vrednosti iz tablice Studentove raspodele (za male uzorke)
(𝑡𝛼;𝑛−1).
Primer 1. Na osnovu podataka o mlečnosti 57 istočno-frizijskih krava na jednoj farmi u toku
305 dana laktacije oceniti prosečnu količinu dobijenog mleka po kravi za posmatrani period.
Formirati 95% i 99% interval poverenja.
Količina mleka (lit.)
(𝑿𝒊) Broj krava
(𝒇𝒊) 𝑿𝒊𝒇𝒊 𝑿𝒊
𝟐𝒇𝒊
3.600 3 10800 38880000
3.800 4 15200 57760000
4.000 7 28000 112000000
4.200 10 42000 176400000
4.400 15 66000 290400000
4.600 9 41400 190440000
4.800 4 19200 92160000
5.000 3 15000 75000000
5.200 2 10400 54080000
Σ 57 248000 1087120000
�̅� − 𝑍𝛼 ∙ 𝑆𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝑆𝑥
95% 4350,877-1,96*50,382
36
𝑆𝑥 =√∑ 𝑋²𝑖𝑓𝑖 −
(∑ 𝑋𝑖𝑓𝑖𝑘𝑖 )²
𝑛𝑘𝑖
𝑛(𝑛 − 1) = √
1087120000 −(248000)²
5757(57 − 1)
= 50,382
Primer 2. Primenom prostog slučajnog uzorka bez ponavljanja odabrano je 5 od 200 pilića
koji su hranjeni određenim koncentratom. Prirast pilića u periodu od 3 nedelje je dat u tabeli.
Odrediti 95% i 99% interval poverenja za prosečan i ukupan prirast.
Prirast (g)
(𝑿𝒊) 𝑿𝒊
𝟐
391 152881
401 160801
405 164025
418 174724
432 186624
2047 839055
�̅� − 𝑍𝛼 ∙ 𝑆𝑥 < 𝜇 < �̅� − 𝑍𝛼 ∙ 𝑆𝑥
95% 409,4-1,96*7,028
37
Interval poverenja za ocenu nepoznate proporcije osnovnog skupa
Primer 1. Dati su podaci o potrošnji svinjskog mesa. Sa pouzdanošću od 95 i 99% oceniti
proporciju domaćinstava sa potrošnjom manjom od 2,5 kg. Sa istom pouzdanošću oceniti
ukupan broj domaćinstava sa potrošnjom manjom od 2,5 kg. ukoliko je poznato da je broj
domaćinstava u osnovnom skupu 1.000.
Mesečna potrošnja
(𝑿𝒊) Broj domaćinstava
(𝒇𝒊) 2,2 10
2,8 15
3,0 40
3,3 20
3,8 10
4,0 5
Ukupno 100
�̂� =𝑎
𝑛=
10
100= 0,1
𝑆𝑝 = √�̂��̂�
𝑛= √
0,1 ∗ 0,9
100= 0.03
95% �̂� − 𝑍𝛼∙𝑆�̂� < 𝑝 < �̂� − 𝑍𝛼∙𝑆𝑝
0,1-1,96*0,03
38
Zadaci za vežbu:
1. Date su vrednosti prekidnog numeričkog obeležja koje se odnose na uzorak veličine n=20:
87 109 79 80 96 95 90 92 96 98
101 91 78 112 94 98 94 107 81 96
Ako je poznat varijabilitet osnovnog skupa 𝜎 = 4,4, odrediti granice 98% interval poverenja za aritmetičku sredinu osnovnog skupa.
2. Iz osnovnog skupa od 1000 gazdinstava izabran je uzorak radi ispitivanja broja tovnih
svinja. Odrediti 95% i 99% interval poverenja za prosečan i ukupan broj svinja u osnovnom
skupu, ako je poznato da je primenjen prost slučajan uzorak bez ponavljanja.
Broj tovnih svinja (𝑿𝒊) 0 1 2 3 4 5 8 Broj gazdinstava (𝒇𝒊) 4 5 11 37 30 10 3
3. Metodom slučajnog izbora na teritoriji jedne opštine izabran je prost slučajan uzorak od 25
parcela od po jednog hektara zasejanih kukuruzom na kojima su dobijeni sledeći prinosi
(t/ha):
Prinos (t/ha)(𝑿𝒊) 2,51-3,50 3,51-4,50 4,51-5,50 5,51-6,50 Broj parcela (𝒇𝒊) 3 10 8 4
Odrediti granice 95% i 99% interval poverenja u kojima se može očekivati da se nalazi
prosečan prinos po hektaru u celoj opštini.
4. U uzorku od 100 pasa koji su dobili prvu vakcinu obolelo je 7 pasa. Odrediti 95% i 99%
interval poverenja za proporciju obolelih pasa. Koliki se broj obolelih pasa može očekivati
ako je poznato da osnovni skup broji 500 pasa
39
40
TESTIRANJE STATISTIČKIH HIPOTEZA
Pod hipotezom se podrazumeva naučna pretpostavka zasnovana na poznatim činjenicama
radi izvođenja nekog zaključka. Predmet statističkog testiranja mogu biti različiti parametri, a
najčešće su to aritmetička sredina i proporcija.
Testovi aritmetičkih sredina
Postoje sledeći osnovni testovi za testiranja aritmetičkih sredina:
1. Upoređivanje aritmetičke sredine uzorka sa aritmetičkom sredinom osnovnog skupa ili sa
nekom hipotetičkom vrednošću – test značajnosti jedne sredine;
2. Upoređivanje dve aritmetičke sredine iz dva nezavisna uzorka – test značajnosti razlike
dve sredine;
3. Upoređivanje više od dve sredine iz više od dva uzorka – metod analize varijanse.
1. Test značajnosti jedne sredine
Primer 1. Rezultati uzorka, n=70, pokazali su da je prosečan prirast prasića starosti do 6
nedelja 395 g/dan. Od ranije je poznato da je prosečan prirast prasića starosti do 6 nedelja
430 g/dan sa standardnom devijacijom 30 g/dan. Da li je postignuti prirast na nivou
očekivanog?
𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0
𝑍 =�̅� − 𝜇
𝜎�̅�=
395 − 430
3,586= −9,76 ∗∗
𝜎�̅� =𝜎
√𝑛=
30
√70= 3,586
|𝑍| = 9,76 > 𝑍0,05 = 1,96 → 𝐻1
|𝑍| = 9,76 > 𝑍0,01 = 2,58 → 𝐻1
41
Primer 2. Dati su podaci o prosečnom utrošku hrane 25 pilića starosti od dva meseca
izabranih primenom prostog slučajnog uzorka bez ponavljanja od ukupnog broja od 500
pilića koliko ih ima na farmi:
Utrošak hrane po piletu (g) 196 198 200 202
Broj pilića 3 10 7 5
Da li može da se prihvati nulta hipoteza da je prosečan utrošak hrane u osnovnom skupu
μ=199(g)?
Utrošak hrane po
piletu (g)
Broj pilića 𝑿𝒊𝒇𝒊 𝑿𝒊𝟐𝒇𝒊
196 3 588 115248
198 10 1980 392040
200 7 1400 280000
202 5 1010 204020
25 4978 991308
𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0
𝑡 =�̅� − 𝜇
𝑆𝑋=
199,12 − 199
0,3746= 0,3203
�̅� =∑ 𝑋𝑖𝑓𝑖
𝑘𝑖=1
∑ 𝑓𝑖𝑘𝑖=1
=4978
25= 199,12
𝑆𝑥 =√∑ 𝑋²𝑖𝑓𝑖 −
(∑ 𝑋𝑖𝑓𝑖𝑘𝑖 )²
𝑛𝑘𝑖
𝑛(𝑛 − 1)∙
𝑁 − 𝑛
𝑁= √
991308 −(4978)²
2525(25 − 1)
∙500 − 25
500= 0.3746
𝑡 = 0,3203 < 𝑡(24)0.05 = 2,064 → 𝐻𝑜
𝑡 = 0,3203 < 𝑡(24)0.01 = 2,797 → 𝐻𝑜
42
2. Test značajnosti razlike dve sredine
Primer 1. Na osnovu ogleda u kome se ispituje razlika u prirastu (g) dve grupe životinja kod
kojih su primenjena dva načina ishrane A i B dobijeni su rezultati koji se odnose na veličine
prostih slučajnih nezavisnih uzoraka, aritmetičke sredine i standardne devijacije osnovnih
skupova koje su od ranije poznate. Testirati nultu hipotezu da je prosečan prirast kod obe
grupe isti nezavisno od primenjennog načina ishrane.
Ishrana A Ishrana B
n1=15 n2=12
�̅�1 = 68,4 �̅�2 = 83,42 𝜎1 = 16,47 𝜎2 = 17,63
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
𝑍 =�̅�1 − �̅�2𝜎(�̅�1−�̅�2)
=68,4 − 83,42
4,643= −3,235 ∗∗
𝜎(�̅�1−�̅�2) = √𝜎1
2 + 𝜎22
𝑛1 + 𝑛2= √
16,472 + 17,63²
15 + 12= 4,643
|𝑍| = 3,235 > 𝑍0,05 = 1,96 → 𝐻1
|𝑍| = 3,235 > 𝑍0,01 = 2,58 → 𝐻1
43
Primer 2. Pri ispitivanju uticaja dve vrste hraniva u ishrani junadi postavljen je ogled sa dve
grupe od po deset grla. Rezultati eksperimenta se odnose na prosečan dnevni prirast junadi
(kg) što je predstavljeno u sledećoj tabeli:
Uzorak 1 Uzorak 2 𝑿𝟏𝟐 𝑿𝟐
𝟐
1,40 1,31 1,96 1,7161
1,38 1,30 1,9044 1,69
1,41 1,33 1,9881 1,7689
1,35 1,37 1,8225 1,8769
1,42 1,39 2,0164 1,9321
1,37 1,36 1,8769 1,8496
1,42 1,35 2,0164 1,8225
1,40 1,32 1,96 1,7424
1,43 1,31 2,0449 1,7161
1,45 1,35 2,1025 1,8225
14,03 13,39 19,6921 17,9371
Testirati hipotezu o jednakosti sredina dva nezavisna uzorka.
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
𝑡 =�̅�1 − �̅�2𝑆(�̅�1−�̅�2)
=1,403 − 1,339
0,0126= 5,709 ∗∗
�̅�1 =∑ 𝑋1
𝑛1=
14,03
10= 1,403
�̅�2 =∑ 𝑋2
𝑛2=
13,39
10= 1,339
𝑆(�̅�1−�̅�2) =√
2 ∙ 𝑆1+22
𝑛= √
2 ∙ 0,000795
10= 0,0126
𝑆1+22 =
∑ 𝑋12
𝑖−
(∑ 𝑋1𝑖)2
𝑛1+ ∑ 𝑋2
2
𝑖−
(∑ 𝑋2𝑖)2
𝑛2𝑛1 + 𝑛2
=19,6921 −
14,032
10 + 17,9371 −13,392
1010 + 10
= 0,000795
𝑡 = 5,079 > 𝑡(18)0.05 = 2,101 → 𝐻1
𝑡 = 5,079 > 𝑡(18)0.01 = 2,676 → 𝐻1
44
Zadaci za vežbu:
1. U štali sa 10 krava ostvarena je dnevna mlečnost (lit.): 3, 4, 5, 7, 8, 9, 7, 10, 9, 10.
Ako je varijansa osnovnog skupa poznata i iznosi 6, testirati 𝐻0: �̅� = 𝜇 protiv alternativne hipoteze 𝐻1: �̅� ≠ 𝜇, ako važi da je μ=7,8 (lit.).
2. Na osnovu podataka datih u tabeli o inkubaciji tetanusa (danima) i broju obolelih životinja
testirati nultu hipotezu da je prosečna inkubacija 16 dana.
Inkubacija tetanusa Broj obolelih životinja
5-8 5
9-12 5
13-16 4
17-20 3
21-24 2
25-28 1
3. Prosečna dnevna potrošnja svežeg mleka, u uzorku od 30 poljoprivrednih domaćinstava
iznosi 2,1 litar, sa standardnom devijacijom osnovnog skupa 0,9. U uzorku od 20 radničkih
domaćinstava prosečna dnevna potrošnja svežeg mleka je 1,5 litara sa varijansom osnovnog
skupa 0,49. Da li se statistički značajno razlikuje prosečna dnevna potrošnja svežeg mleka
poljoprivrednih i radničkih domaćinstava?
4. Dati su podaci o broju dana potrebnih za dresiranje pasa ukoliko se pri treniranju
primenjuje nagrada (I grupa) ili kazna (II grupa).
A 43 41 48 44 51 48 47 35
B 42 47 57 53 74 59 65 54 46
Testirati nultu hipotezu da ne postoji statistički značajna razlika u prosečnom vremenu
potrebnom za dresiranje pasa u zavisnosti od načina dresiranja.
5. Da bi se utvrdilo da li postoji statistički značajna razlika u brzini delovanja dva leka A i B
protiv bola, istraživač je primenio lekove na dva uzorka slučajno odabranih pacijenata.
Rezultati testa su dati u sledećoj tabeli. Prosečno vreme i sume kvadrata odstupanja
aritmetičke sredine vremena od početka delovanja leka u uzorcima (minutima) dati su u
tabeli:
Lek Veličina uzorka Prosečno vreme do početka
delovanja leka
Sume kvadrata odstupanja
od aritmetičke sredine
А 19 40 ∑(𝑋1 − �̅�1)² = 1815 B 12 50 ∑(𝑋2 − �̅�2)² = 729
Da li postoji statistički značajna razlika u prosečnom vremenu do početka delovanja lekova
A i B?
45
46
47
3. Analiza varijanse
Primer 1. U jednom poljoprivrednom preduzeću organizovana je ishrana svinja na tri
različita načina. Da bi se ispitalo da li način ishrane značajno utiče na tov svinja iz svake
grupe, formiran je slučajan uzorak sa po 8 svinja. Ustanovljen je sledeći prirast u težini (kg)
za dve nedelje:
Redni broj Prirast
I II III
1 15 10 20
2 13 25 22
3 16 19 14
4 20 18 17
5 24 16 13
6 18 20 18
7 18 22 15
8 23 14 10
a) Da li postoji statistički značajna razlika u prosečnom prirastu svinja u zavisnosti od načina ishrane?
b) Primenom t-testa i testa najmanje značajne razlike uporediti aritmetičke sredine tretmana.
Nulta hipoteza: 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘
Alternativna hipoteza: 𝐻1: ∃(𝑖, 𝑗) 𝑖 ≠ 𝑗 𝜇𝑖 ≠ 𝜇𝑗 1 ≤ 𝑖 ≤ 𝑘
Izvori
varijacije
Stepeni
slobode
Sume
kvadrata
Sredine
suma kvadrata
(varijanse)
F- odnos F – tablično
(r1=k-1; r2=N-k)
0,05 0,01
Tretmani k-1= 2 QT= 23,25 ST2= 11,625 ST2/SP2= 0,673 3,47 5,78
Pogreška N-k= 21 QP= 362,75 SP2= 17,27
Total N-1=23 Q=386
k (broj tretmana) – 3
n (veličina uzorka) – 8
N (ukupan broj podataka) – 24
Sume kvadrata
=−===
CQij
n
j
k
i
i
2
11
Q = 15² + 13² + 16² + ... + 15² + 10² - 7350= 386
48
C – je korektivni faktor =
===
NC
ij
n
j
k
i
i2
11 420²
24= 7350
=−
===
Cn
Qij
n
j
k
i
T
i2
11
𝑄𝑇 = 1472 + 1442 + 129²
8− 7350 = 23,25
=−=TP
QQQ𝒅𝒈𝒂
𝑄𝑝 = 386 − 23,25 = 362,75
Sredine suma kvadrata
=−
=1
2
k
QS T
T =
−=
kN
QS P
P
2
𝑆𝑇2 =
23,25
2= 11,625 𝑆𝑝
2 =362,75
21= 17,27
𝐹 = 0,673 < 𝐹(2,21)0.05 = 3,47 → 𝐻0
𝐹 = 0,673 < 𝐹(2,21)0.01 = 5,78 → 𝐻0
t-test
𝐻0: 𝜇𝑖 = 𝜇𝑗
𝐻1: 𝜇𝑖 ≠ 𝜇𝑗
𝑆(�̅�𝑖−�̅�𝑗) =√
2 ∙ 𝑆𝑝2
𝑛= √
2 ∙ 17,27
8= 2,078
𝑡1 =�̅�1 − �̅�2𝑆(�̅�𝑖−�̅�𝑗)
=18,375 − 18
2,078= 0,18
49
𝑡2 =�̅�1 − �̅�3𝑆(�̅�𝑖−�̅�𝑗)
=18,375 − 16,125
2,078= 1,08
𝑡3 =�̅�2 − �̅�3𝑆(�̅�𝑖−�̅�𝑗)
=18 − 16,125
2,078= 0,90
𝑡21:0,05 = 2,080
𝑡21:0,01 = 2,831
|𝑡| < 𝑡𝑁−𝑘;𝛼 → 𝐻𝑜
|𝑡| > 𝑡𝑁−𝑘;𝛼 → 𝐻1
Test najmanje značajne razlike
𝐻0: 𝜇𝑖 = 𝜇𝑗
𝐻1: 𝜇𝑖 ≠ 𝜇𝑗
𝑆(�̅�𝑖−�̅�𝑗) =√
2 ∙ 𝑆𝑝2
𝑛= √
2 ∙ 17,27
8= 2,078
𝑁𝑍𝑅𝛼 = 𝑡𝑁−𝑘;𝛼 ∙ 𝑆(�̅�𝑖−�̅�𝑗)
𝑁𝑍𝑅0,05 = 2,080 ∙ 2,078 = 4,322
𝑁𝑍𝑅0,01 = 2,831 ∙ 2,078 = 5,883
50
Tretman �̅�𝒊 �̅�𝒊 − �̅�𝑰𝑰𝑰 �̅�𝒊 − �̅�𝑰𝑰 I 18, 375 2,25 0,375
II 18 1,875
III 16,125
Zadaci za vežbu:
1. Da bi se utvrdilo da li prosečan dnevni prirast zavisi od vrste žitarica primenjene u ishrani,
izveden je eksperiment u kome je svakoj grupi od 7 miševa dat obrok jedne od četiri vrste
žitarica. Prirast (g) dat je u sledećoj tabeli:
T R E T M A N I
A B C D
9 5 2 3
7 4 1 8
8 6 1 5
8 4 2 9
7 5 2 2
8 7 3 7
8 3 2 8
a) Testirati nultu hipotezu da se prosečni prinos statistički značajno ne razlikuje u zavisnosti od načina ishrane;
b) Primenom testa najmanje značajne razlike uporediti aritmetičke sredine parova tretmana.
2. U eksperimentu organizovanom po planu potpuno slučajnog rasporeda ispituje se
efikasnost tri hemijska preparata. Intezitet iritantnosti je označen 0-10 i izmeren je na 8
eksperimentalnih životinja:
Preparati 1 2 3 4 5 6 7 8
I 6 9 6 5 7 5 6 6
II 5 9 9 8 8 7 7 7
III 3 4 3 6 8 5 5 6
a) Testirati nultu hipotezu da je efikasnost sva tri preparata jednaka. b) Testirati značajnost razlike parova tretmana primenom NZR testa.
51
52
53
Testovi proporcija
Postoje sledeći osnovni testovi za testiranja proporcija:
1. kada upoređujeno proporciju iz prostog slučajnog uzorka sa pretpostavljenom proporcijom
osnovnog skupa ili sa nekom teorijskom vrednošću – test značajnosti jedne proporcije
2. kada upoređujemo dve proporcije iz dva nezavisna prosta slučajna uzorka- test značajnosti
razlike dve proporcije.
Test značajnosti jedne proporcije
Primer 1. U uzorku od 164 grla jedne rase bilo je 52 goveda sa dužinom trupa ispod 160 cm.
Može li se prihvatiti nulta hipoteza da u osnovnom skupu proporcija goveda sa dužinom
trupa ispod 160 cm iznosi 0,4?
n=164 𝐻0: 𝑝 = 0,4
a=52 𝐻1: 𝑝 ≠ 0,4
𝑝0 = 0,4
𝑍 =�̂� − 𝑝
𝑆�̂�=
0,317 − 0,4
0,036= −2,306 ∗
�̂� =𝑎
𝑛=
52
164= 0,317
𝑆𝑝 = √�̂��̂�
𝑛= √
0,317 ∗ 0,683
164= 0.036
|𝑍| > 𝑍0,05 → 𝐻1
|𝑍| < 𝑍0,01 → 𝐻0
Test značajnosti razlike dve proporcije
Primer 2. U uzorcima od po 110 grla goveda dve rase, obolela grla učestvuju sa 6% i 13%.
Utvrditi da li je otpornost dve rase goveda prema ispitivanoj bolesti ista.
𝐻𝑜: 𝑝1 = 𝑝2
𝐻1: 𝑝1 ≠ 𝑝2
54
𝑛1 = 110 �̂�1 = 0,06
𝑛2 = 110 �̂�2 = 0,13
𝑍 =�̂�1 − �̂�2𝑆(𝑝1−�̂�2)
=0,06 − 0,13
0,0396= −1,768
�̅� =�̂�1𝑛1 + �̂�2𝑛2
𝑛1 + 𝑛2=
0,06 ∙ 110 + 0,13 ∙ 110
110 + 110= 0,095
𝑆(�̂�1−𝑝2) = √𝑝𝑞̅̅ ̅ ∙ (1
𝑛1+
1
𝑛2) = √0,095 ∙ 0,905 ∙ (
1
110+
1
110) = 0,0396
|𝑍| < 𝑍0,05 → 𝐻0
|𝑍| < 𝑍0,01 → 𝐻0
Zadaci za vežbu:
1. U uzorku od 100 jedinki vrste Tribolium castaneum rastvorom aktivne supstance
hlorprifos metila posle 24 časa je registrovan mortalitet 73 jedinki. Očekivana proporcija
smrtnosti je 0,9. Može li se smatrati da razlika konstatovane i očekivane smrtnosti nije
statistički značajna?
2. Ispitivanjem prostog slučajnog uzorka od 200 životinja utvrđeno je da je 4 životinje
obolelo. Proporcija obolelih životinja u uzorku je_______, dok je ocena za standardnu grešku
uzoračke proporcije__________. Nulta hipoteza da je uzoračka proporcija statistički
značajna se sa rizikom od 5%_______________.
3. Ispituje se efikasnost dve vakcine A i B. Prva vakcina je primenjena na uzorku od 32
životinje i bila je uspešna u 24 slučaja. Druga vakcina je primenjena na uzorku od 26
životinja i bila je efikasna u 18 slučajeva. Da li postoji statistički značajna razlika u
efikasnosti vakcina?
55
56
57
REGRESIONA I KORELACIONA ANALIZA
Regresiona i korelaciona analiza se primenjuje s namerom da se opiše, predvidi i kontroliše
zavisna promenljiva u odnosu na jednu ili više nezavisno promenljivih, kao i da se utvrdi
postojanje i intenzitet veze između zavisne i nezavisnih promenljivih.
Primer 1. Dati su podaci o mlečnosti koze (kg/24h) u zavisnosti od dana laktacije:
Mlečnost (Y) 1,84 1,75 1,50 1,62 1,51 1,25 1,26 1,15
Dani laktacije (X) 14 24 34 44 54 64 74 84
Na osnovu datih parova vrednosti izvesti sledeća računanja:
a) Formirati dijagram rasturanja; b) Oceniti regresioni model, izračunati ocenjene vrednosti zavisno promenljive i ucrtati
liniju regresije na dijagramu rasturanja;
c) Izračunati standardnu grešku regresije; d) Izračunati vrednost koeficijenta korelacije, determinacije i nedetrminacije; e) Na osnovu jednačine regresije oceniti mlečnost 67. dana laktacije.
a) Dijagram rasturanja:
Radna tabela:
X Y XY X² Y² �̂� (𝒀𝒊 − �̂�𝒊) (𝒀𝒊 − �̂�𝒊)²
14 1,84 25,76 196 3,3856 1,82414 0,01586 0,00025154
24 1,75 42 576 3,0625 1,72724 0,02276 0,000518018
34 1,5 51 1156 2,25 1,63034 -0,13034 0,016988516
44 1,62 71,28 1936 2,6244 1,53344 0,08656 0,007492634
54 1,51 81,54 2916 2,2801 1,43654 0,07346 0,005396372
64 1,25 80 4096 1,5625 1,33964 -0,08964 0,00803533
74 1,26 93,24 5476 1,5876 1,24274 0,01726 0,000297908
84 1,15 96,6 7056 1,3225 1,14584 0,00416 1,73056E-05
392 11,88 541,42 23408 18,0752 11,87992 0,038997621
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
0 20 40 60 80 100
58
b) Ocena parametara:
�̂�𝑖 = 𝑎 + 𝑏𝑋𝑖
𝑏 =∑ 𝑋𝑌 −
(∑ 𝑋)(∑ 𝑌)𝑛
∑ 𝑋2 −(∑ 𝑋)²
𝑛
=541,42 −
392 ∙ 11,888
23408 −(392)²
8
= −0,00969
𝑎 = �̅� − 𝑏�̅� = 1,485 − (−0,00969) ∗ 49 = 1,9598
�̂�𝑖 = 1,9598 − 0,00969𝑋𝑖
Grafički prikaz:
c) Standardna greška regresije:
𝑆𝑒 = √∑((𝑌𝑖 − �̂�𝑖)²)
𝑛 − 2= √
0,03899
8 − 2= 0,0806
d) Koeficijent korelacije:
𝑟 =∑ 𝑋𝑌 −
(∑ 𝑋)(∑ 𝑌)𝑛
√[∑ 𝑋2 −(∑ 𝑋)2
𝑛 ] ∙ [∑ 𝑌2 −
(∑ 𝑌)2
𝑛 ]
=541,42 −
392 ∙ 11,888
√23408 −(392)2
8 ∙ 18,0752 −(11,88)2
8
= −0,954
y = -0.0097x + 1.9598
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
0 10 20 30 40 50 60 70 80 90
59
Koeficijent determinacije: r²=(-0,954)²= 0,9101 (91,01%)
Koeficijent nedeterminacije: k²= 1- 0,9101=0,0899 (8,99%)
e) �̂�67 = 1,9598 − 0,00969 ∙ 67 = 1,31057(kg/24h)
60
Primer 2. Rezultati ispitivanja uticaja vitamina holina, dodatog smeši hrane, na prirast kod
ispitivanih prasadi dati su sledećim vrednostima:
Prosečan dnevni prirast (kg) (Y) 420 405 387 377
Dodatak holina (mg/kg hrane) (X) 0 250 500 1000
Na osnovu datih parova vrednosti izvesti sledeća računanja:
f) Formirati dijagram rasturanja; g) Oceniti regresioni model, izračunati ocenjene vrednosti zavisno promenljive i ucrtati
liniju regresije na dijagramu rasturanja;
h) Izračunati standardnu grešku regresije; i) Izračunati vrednost koeficijenta korelacije, determinacije i nedetrminacije; j) Na osnovu jednačine regresije oceniti prosečan dnevni prirast za dodatak holina od
750 mg/kg hrane.
Dijagram rasturanja:
61
Radna tabela:
X Y
62
Zadaci za vežbu:
1. Dati su podaci o dozi leka i vremenu izlečenja:
Doza leka 0 1 2 3 4 5 6
Vreme izlečenja 15,4 12,2 13,7 9,2 9,9 6,1 4,1
a) Oceniti parametre linearnog regresionog modela i objasniti njihovo značenje; b) Izračunati koeficijent determinacije; c) izračunati standardnu grešku regresije.
2. Na osnovu podataka o težini 10 teladi pri rođenju i njihovom prirastu izračunato je:
∑X=410, ∑Y=304, ∑XY=12665, ∑X2=16974, ∑Y2=9508. Izračunati koeficijente koralcije i
detreminacije i objasniti njihovo značenje. Da li telad koja imaju veću težinu pri rođenju
imaju i veći očekivani prirast?
3. Na osnovu podataka o proizvodnji mleka (000 lit.) i količini hrane (t) 10 krava izračunate
su sledeće sume: ∑X=1530, ∑Y= 748, ∑XY=116210, ∑X²=248700. Oceniti linearni
regresioni model i objasniti značenje regresionog koeficijenta.
63
64
LITERATURA
1. Čobanović Katarina (2003), Primeri za vežbanje iz statistike, Poljoprivredni fakultet, Univerzitet u Novom Sadu, Republika Srbija
2. Lozanov-Crvenković Zagorka (2002), Statistika, Prirodno-matematički fakultet, Univerzitet u Novom Sadu, Republika Srbija
3. Man S.P. (2017), Uvod u statistiku, deveto izdanje, John Wiley & Sons
4. Mutavdžić Beba, Nikolić-Đorić Emilija (2018), Statistika (za smer Veterinarska medicina), Poljoprivredni fakultet, Univerzitet u Novom Sadu, Republika Srbija