Upload
ender-bueken
View
2.222
Download
11
Embed Size (px)
Citation preview
I. STATSTK VE OLASILIKDo. Dr. rfan Yolcubal Kocaeli niversitesi Jeoloji Mh. Blm
Ders KitabStatistical analysis of Geological data (Koch G. S., ve Link, R. F., 1980. Dover Publications) A data-based approach to statistics (Iman, R. L., 1994) Basic statistics for Business and Economics (Lind, D. A., and Mason, R. D., 1997) statistik Analiz Metotlar (Prof. Dr. Bilge Aloba)
1
DEERLENDRMEDevam zorunlu (% 70) 2 Snav (Ara vize + Final) dev Grup almas OK dev kopyalamak yasak
DERS PROGRAMIData toplama ve sunum ekilleri rnek vs. Poplasyon kavramlar Data toplama teknikleri Data sunum ekilleri Pasta diyagramlar Histogramlar Bar grafikler Kmlatif rlatif sklk grafikleri Dalm grafikleri (X-Y)
Datalarn DeerlendirilmesiTarifsel istatistik Analitik ve analitik olmayan ortalamalar standart sapma, varyans, standart hata, gvenilirlik aral vb
2
DERS PROGRAMI devamOlaslk ve Olaslk dalmlar (Probability density functions) Binom Logaritmik Normal Poisson
Tahmin ve Hipotez testi t-test z-testi Varyans analizi (ANOVA)
Korelasyon ve Regresyon Linear regresyon Jeolojide rnekleme ve jeolojik datalardaki deikenlik
STATSTK NEDR?statistik ksaca, data analizini kapsayan matematik biliminin alt bir daldr. Datalarn toplanmas, derlenmesi, zetlenmesi,sunumu, analizi ve ayn zamanda verilerden geerli bir sonu karlmas istatistik dalnn balca ilgi alanlardr.
3
STATSTN UYGULAMA ALANIstatistiksel metotlar, Jeolojide olduu gibi, modern yaamn byk bir alannda da, datalarn deerlendirilmesinde ve analizinde yaygn bir ekilde kullanlmaktadr.Japon rnlerini dnyada popler yapan kalite-kontrol tekniklerinin uygulanmasnda Ozon tabakasndaki incelmenin tahmininde Nfus saymnda TOP 40 hit listesinin belirlenmesinde Hava tahminlerinde TV reytinglerin belirlenmesinde Kiisel bilgisayarnzdaki paralarn performanslarnn gelitirilmesinde Seim tahminlerinde Risk analizinde Ve daha bir ok alanda
STATSTK TRLERTarifsel (Descriptive) istatistik: nmerik verileri derlemek, dzenlemek, ve zetlemek iin kullanlan prosedrler Tmevarmsal (Inferential) istatistik: rneklemeye dayanarak bir poplasyon hakknda bilgi elde etmek iin kullanlan metotlar
4
DATALARIN TOPLANMASI: Kavramlarrnek (Sample) : nceleme yaplan poplasyonun bir blm Poplasyon: Hakknda bilgi edinilmeye allan birimlerin ( kiiler, nesneler, deneysel sonular, vb. gibi) toplamn oluturmakta.
Deiken TrleriKantitatif (Quantitative) Deiken:Saysal lekte ifade edilir. Miktar hakknda bilgi verir. Hesabnzdaki bakiye, pilin mr, snftaki rencilerin says vb.
Kualitatif (Qualitative)Deiken :Nmerik olmayan deikenlerdir. Doum yeri, gz rengi, rk, vb
5
Deikenlerin Snflandrlmas
DATA TOPLANMASIrneklemeye gemeden nce inceleme yaplan poplasyonun iyi bir ekilde belirlenmesi gerekmektedir. Uygun rnekleme teknii ve protokol: Toplanan rneklerin incelenen poplasyonu tam anlamyla yanstmas gerekmektedir.
6
DATA TOPLANMASITm poplasyonu incelemek (Saym) yerine neden rneklemeyi kullanyoruz?Dk maliyet Zaman Dikkatlice alnm rnekler baz durumlarda bir saymdan daha doru bilgi verebilir. Baz durumlarda imkansz olabilir. rnlerin yok edilerek test ediliinden rnekleme tek bana yeterli olabilir.
RNEKLEME PLANININ AMAIYksek kalite: Toplanan verilerin doruluk derecesi Savunabilirlik: Plann geerlilii ile ilgili dokmantasyonun mevcut olmas Tekrarlanabilirlik: rnekleme plann takip ederek verilerin tekrar retilebilmesi Temsil edici olmas: ncelenen poplasyonu tamamyla temsil etmesi Faydal olmas: Toplanan veriler plann amacna ulamasnda kullanlabilir olmas
7
RNEKLEME PLANIrnekleme plannn hazrlannda rneklerin nerede ve ne zaman alnacana karar vermek gerekmektedir. rneklerin says, lokasyonu, ve zaman rnekleme btesini amadan istatistiksel olarak geerli bir rnek almaya yeterli olmaldr. Bunu salamak iin uygun bir rnekleme stratejisi belirlemek gerekmektedir.
RNEKLEME EKLLERRasgele (Random): Her rnein ayn saydaki gzlemde eit olaslkla olarak seilebilmesi Sistematik: Karara dayal (Judgemental):
8
RNEKLEME EKLLERNE BR RNEK
Karara dayal
Rasgele
Sistematik
rnekleme Hatas (Sampling Error)statistiksel anlamda hatadan ziyade rneklerin birbirlerinden olan doal deikenliklerini temsil etmektedir. Tm toplanan rneklerde bir tane ortak zellik bulunmakta: rneklerin hibirisinin tamamyla tm poplasyonu temsil etmemesi Dolaysyla, rneklemeye dayal tahminler ile poplasyonun gerek karakteristii arasnda daima farkllk olacaktr.
9
VER GRAFKLEME TRLERPasta diyagramlar (Pie Charts) Bar grafikler Histogramlar Kartezyen (X-Y) grafikleri Frekans Dalm grafikleri
Pasta DiyagramlarFarkl yada kantitatif datalarn oran yada yzde ekilde sunulmasnda kullanlr.
10
BAR GRAFKLER
Dey bar grafikleri:niversite mezunu erkek ve bayanlarn ya gruplarna gre gelir dalmn gsteren bar grafiklerine bir rnek
11
X-Y GRAFKLER
II. VERLERN ORGANZE EDLMES VE SUNULMASI
12
TasnifBir kitlenin veya grubun zelliklerine gre yapsn ortaya karabilmek amacyla, elde edilen bilgileri bir vasf veya vasflar bakmndan eitli klara ayrarak ayn kk ait birimleri kmeler halinde bir araya getirme ilemine denir. Veri saysnn snrl olduu durumlarda uygulanabilir.
Tasnife rnek: 100 kiilik bir snftaki rencileri ya vasfna gre tasnif edersek
13
GruplamaEer tasnif edilecek veri says ok fazla ise bunlar tasnif yoluyla kmelere ayrmak mmkn olsa bile anlaml ve ilemlere elverili olmayabilir. Byle durumlarda bir vasfn birbirine yakn olan klarn gruplar halinde toplamaya, yani gruplamaya bavurulabilir.
Gruplamaya rnek: Dnyadaki 29 en byk ehir nfus itibariyle gruplanarak bir frekans dalm veya blnmesi eklinde ifade edilebilir.
14
Gruplamaya rnek:(Hatal) Bir endstri dalnda faaliyet gsteren iletmelerde altrlan ii saysna gre gruplamak istersek
FREKANS DAILIMLARI YADA BLNMELER (Frequency Distributions) Verilerin her bir snf aralna den gzlem saysn(frekans) gsterecek ekilde gruplandrlmas ilemi.
15
Snf aral, Snf snrlar, snf orta noktas kavramlarSnf aral: Snfn alt ve st snrlar arasndaki fark Snf snrlar:Snfa ait minimum ve maksimum snr deerleri Snf orta noktas veya noktas: Snfn alt ve st snrlarn ortalamas
Frekans Dalmnn oluturulmas rnek: Bir tatn yl iindeki sat fiyatlarnn organize edilmemi hali: Ham data
16
Snf Saysnn Belirlenmesi
Snf Aralnn Belirlenmesi
17
FREKANS DAILIM TABLOSU:
FREKANS DAILIM GRAFG (HSTOGRAM)
18
FREKANS DAILIMLARININ OLUTURULMASINDA DKKAT EDLEEK HUSUSLARFrekans dalmlarnn oluturulmasnda mmkn olduu kadar eit snf aralklar seilmeli Eit olmayan snf aralklar frekans dalmlar grafik edilirken sorun yaratabilirler. Fakat baz durumlarda (ok sayda bo snf oluturmaktan kanmak iin) eit olmayan snf aralkl frekans dalmlarnn oluturulmasnda kullanlabilir.
Uygun olarak seilmemi snf saysna gre oluturulmu frekans dalmlar, verinin frekans dalm hakknda faydal bilgiler sunmayabilir. rnek:
19
Nispi frekans dalmlar (relative frequency distributions)Bir ok durumda bir snfn mutlak frekansndan ok toplam iindeki nispi frekansn bilmek gerekmektedir. Snfn nispi frekans, o snfn frekansnn toplam frekansa orandr.
20
Nispi frekans dalm
21
KMLATF FREKANS DAILIMLARIKmlatif frekans dalmlarnn en nemli zellikleri belirli bir dzeyin altnda veya stnde bulunan birimlerin frekansn gsterebilmeleridir. Kmlatif frekans dalmlar snf aralklar farkl serilerin kyaslanmasn kolaylatrr. Kyaslamann salkl olabilmesi iin nceden mutlak frekanslarn nispi frekanslara evrilmesi gerekir.
Kmlatif frekans dalmlarnn oluturulmas: rnek:Bir snftaki rencilerin boy uzunluklarnn frekans dalmlar
22
Kmlatif Frekans Dalmlar
23
FREKANS POLGONLARIBu grafiklerde snf aral yerine snf orta noktasnn snf frekansna gre dalm izgisel olarak grafiklenir. Frekans poligonlarnn histogramlara gre bir avantaj 2 veya daha fazla frekans dalm grafiinin kolaylkla birbirleri ile karlatrlmasna imkan tanmasdr ( Frekans dalmlarnn snf says ve aral ayn olmak koulu ile)
24
II. Merkezi Eilim lleriDo. Dr. rfan Yolcubal Kocaeli niv. Jeoloji Mh. Bl.
Analitik OrtalamalarBir rneklemede tm veri deerlerini dikkate alan merkezi eilim lleridir.Aritmetik ortalama Arlkl ortalama Geometrik ortalama Harmonik ortalama
1
Aritmetik Ortalama (Aritmetic mean)Gruplanmam yani ham veriler iin aritmetik ortalama, tm veri deerlerinin toplamnn toplam veri saysna orandr.
X =
Xi =1
n
N
=
X 1 + X 2 + X 3 + ....... X n N
X : Aritmetik ortalamaN: Toplam veri says X: veri deeri
Tekrarlanan gzlemlerin veri deerlerinin hesabBir rnekte gzlem deerleri bir ok kez tekrarlanabilir. rnein, 20 kiilik bir snfta istatistik dersinden geen rencilerin notu u ekilde sralanmaktadr: 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10 Bu snfn istatistik dersinin aritmetik ortalamas nedir?
X = n =
1 n
fi
k
i =1
fi X
i
k
i =1
fi: bir rnekteki Xi`nin frekans k: rnekteki gzlem says Xi: i.gzlem deeri n=toplam veri says
X =
( 5 * 5 ) + ( 3 * 6 ) + ( 2 * 7 ) + ( 3 * 8 ) + ( 3 * 9 ) + ( 4 * 10 ) = 7 .4 20
2
Aritmetik Ortalamann zellikleriBir serideki her bir veri deerinin aritmetik ortalamadan olan sapmalarnn toplam daima sfrdr.
( X X ) = 0rnek: 3, 8, ve 4 deerlerin aritmetik ortalamas 5`dir.
( X X ) = (3 5) + (8 5) + (4 5) = 2 + 3 1 = 0Aritmetik ortalamann hesaplannda veri setindeki tm veri deerleri kullanlr. Bir veri setinin yalnzca bir aritmetik ortalamas vardr.
Aritmetik Ortalamann DezavantajAritmetik ortalamann dezavantaj, veri setindeki ar deerlerden kolay etkilenmesidir. Bir veri setindeki verilerden bir ka ok yksek yada dk deerler ieriyor ise, aritmetik ortalama, veri setinin merkezi eilim lmn temsil etmek iin uygun olmayabilir. rnek: 5 rencinin bir snavda alm olduu notlar 70, 70, 70, 70, ve 100`dir. Aritmetik ortalama 76 olacaktr. Bu aritmetik ortalama veri setinin iyi bir ekilde temsil etmemektedir.
Ak snf aralkl frekans dalm tablolarnda aritmetik ortalama uygun deildir.
3
Arlkl Ortalama(Weighted Mean)Aritmetik ortalamada, her bir veri deerinin neminin eit olduu varsaylmaktadr. Fakat baz deerlerin nemi dierlerinden farkl olabilir. Bu durumlarda arlkl ortalama kullanlr.
X
W
=
X 1W 1 + X 2W 2 + X 3W 3 + ........ + X n W n W 1 + W 2 + W 3 + .......... + W n X =
Wi =1 n i =1
n
i
X
i
W
W
W: Her bir veri deerinin arln yani nemini ifade etmektir. X W : Arlkl ortalama
Arlkl Ortalama`ya rnekBir renci matematik dersinden 6, edebiyat dersinden 7, mzik dersinden 10 ve ngilizce dersinden 9 almtr. Bu rencinin ders ortalamasn hesaplayalm. Ders kredileri: Matematik:3, edebiyat: 2, mzik:1, ngilizce: 1
XW =
(6 * 3) + (7 * 2) + (9 *1) + (10 *1) 51 = = 7.3 3 + 2 +1+1 7
X=
6 + 7 + 9 + 10 =8 4
4
Arlkl Ortalama: rnek 2Sarar normal perakende sat fiyat zerinden ($400) 95 adet Kl marka takm elbiseyi satmtr. Bahar indiriminde ayn takm elbiseyi 200 dolara indirerek 126 adet, en son indirimde de 100 dolara 79 adet takm elbise satmtr. Sarar takm elbisesinin arlkl ortalama fiyat nedir? Sarar her bir takm elbiseye birim fiyat olarak $200 demitir. Sararn bu sattaki toplam kazanc ne kadardr?
rnek 2
X X
W
=
W
( 95 * 400 ) + ( 126 * 200 ) + ( 79 * 100 ) 95 + 126 + 79 71100 = = $ 237 300 = $ 37 = $ 12100
Birim Kazan : 237 200 Toplam Kazan : 37 * 300
5
Geometrik Ortalama (Geometric Mean) Geometrik ortalama iktisat ve iletme alanlarnda yaygn olarak kullanlan bir ortalama trdr. Geometrik ortalama zellikle 1) deiim oranlarnn (yzde, oran, vb.) ortalamasnn hesaplanmasnda 2) bir zaman aral ierisindeki bir retimin yada satn art miktarnn ortalamasnn belirlenmesinde yaygn olarak kullanlmaktadr.
G .O . =
n
( X 1 )( X 2 )( X 3 ).......( X n )
Not: Eer veri deerlerinden bir 0 yada negatif deerlikli ise Geometrik ortalama hesaplanamaz.
log G .O . =
1 n
log X
i
Veri says ok olduu durumlarda hesaplar kolaylatrmak amacyla logaritmalardan yararlanlmaktadr.
Geometrik Ortalama: rnek 1Bir inaat irketinin drt projedeki ortalama kr yzdeleri 3, 2, 4, Ve 6`dr. Bu irketin ortalama kr nedir?G .O . = 4 3 * 2 * 4 * 6 = 4 144 = % 3 .46 X = 3+ 2+ 4+6 = % 3 .75 4
Geometrik ortalama daha tutucu bir kar deeri vermektedir. nk ar deerlerden aritmetik ortalamaya gre o kadar fazla etkilenmemektedir. Bu nedenle geometrik ortalama ya aritmetik ortalamaya eit olacaktr yada kk olacaktr.
6
Geometrik Ortalama: rnek 2Trkiye'nin nfusu 1990 ylnda 50.7 milyondan 1995 ylnda 56.5 milyona ykselmitir. Bu 5 yl iinde nfusun ortalama art hz ne olmutur?
G.O. = n 1
bir periyotun sonundaki deger 1 bir periyotun baslangicindeki deger
n : periyot araligi
G .O . =
5 1
56 . 5 1 = 50 . 7
4
1 . 11 1 = % 2 . 47
Harmonik Ortalama(Harmonic mean)
Baz zel durumlarda bavurulan bir ortalama olup hz, fiyat, verimlilik gibi oransal olarak belirtilebilen baz deiken deerlerin ortalamalarnn hesaplannda kullanlr.H = N = 1 1 1 1 + + + .... + X1 X2 X3 Xn N
1 Xi
Deikenlerden birinin sabit, dierinin ise deiken olduu durumlarda bavurulan bir ortalamadr. Veri deerlerinde sfr bulunmas yada veri deerlerinin farkl iaret tamalar durumunda harmonik ortalama kullanlmaz.
7
Harmonik Ortalama: rnekki kasaba arasndaki mesafe gidite saatte 75 km. hzla, dnte ise 50 km hzla kat edilmektedir. Bu durumda ortalama hz nedir? ki kasaba arasndaki mesafe 150 km varsaylr ise gidi iin gerekli sre 150/75: 2 saat, dn iin ise 150/50: 3 saat Burada mesafe unsuru sabit fakat zaman unsuru ise sabit olmadndan harmonik ortalama kullanlmtr.
H =
2 1 1 + 75 50
= 60 km
X=
75 + 50 = 62.5km 2
ANALTK OLMAYAN MERKEZ ELM LLER
Bir rnekteki btn veri deerlerini dikkate almayan merkezi eilim lleridir. Medyan (Median) Mod (Mode)
8
Medyan (Ortanca)Baz durumlarda rnein bir yada iki tane ok yksek yada dk deerler ierebileceinden bahsetmitik. Bu gibi durumlarda aritmetik ortalama rnein merkezi eilimini yanstmaz. Byle problemlerde medyan deeri kullanlarak rnein merkezi eilimi llebilir.Veri deerleri bykten ke yada kkten bye sralandktan sonra, tam ortadaki yani veri dizisini 2 eit frekansa ayran deerdir. Dzenlenmemi verilerde medyan`n yerini kolaylkla tespit etmek iin aadaki formlden yararlanlabilir.
medyan degerinin yeri = n = toplam veri sayisi
n +1 2
Medyan: rnek1
Bir klinikte pansuman iin denen miktarlar aadaki gibi sralanmaktadr: 65, 29, 30, 25, 32, 35 TL. Medyan fiyat nedir? 25 29 30 Medyan : (30+32)/2= 31 TL. 32 35 65
9
Medyan: rnek 2
Yuvack Kalc konutlarndaki kira fiyatlar aadaki gibi sralanmaktadr: 120,100, 110, 115, 125, 105, 70 TL. Ortalama kira fiyat nedir.
Medyan: rnek 2
70 100 105 110 115 120 125
Medyan
10
Medyann zellikleri
Her bir veri setinin tek bir medyan vardr. Veri setindeki ar deerlerden etkilenmedii iin verilerin merkezi eiliminin belirlenmesinde aritmetik ortalamaya nazaran daha doru bir bilgi sunar. Aritmetik ortalamann aksine ak snf aralkl frekans dalmlarnn merkezi eiliminin lmnde kullanlabilirler.
ModBir veri setindeki btn deerleri dikkate almayan (hassas olmayan) bir baka merkezi eilim lmdr. Mod, bir data setinde en sk olarak gzlenen veri deeridir.
11
Mod: rnekler
4, 6. 5, 8, 7, 10, 9, 11
Mod ?
4, 6, 5, 4, 7, 5.5, 4, 6.5, 7, 8, 4, 6, 4, 5, 4, 4 Mod ? 4, 6, 4, 5, 6, 5, 6, 6, 5, 6, 5, 5 Mod ?
Gruplanm Verilerde Aritmetik Ortalama, Medyan, Mod
Baz durumlarda veri deerleri gruplandrlp, frekans dalmlar oluturulmu olabilir ve ham veriler mevcut bulunmayabilir. Bu gibi durumlarda aritmetik ortalama, medyan ve mod frekans dalm tablolarndan hesaplanabilir. Bu deerler gerek ham verilerden hesaplanan deerlerden farkl olabilir.
12
Aritmetik Ortalamann Frekans Dalmndan Hesaplan
X=
fXN
X: her bir snfn orta noktas f: her bir snf frekans N: Toplam veri says yada frekanslarn toplam deeri
rnekNet geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 thalat says 1 4 10 3 2
Net gelirin aritmetik ortalamasn hesaplaynz?
13
Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam
thalat says (f) 1 4 10 3 2 20
Snf orta noktas (X) 3.5 6.5 9.5 12.5 15.5
fX 3.5 26 95 37.5 31 193
X=
fXN
=
193 = 9.65 20
Frekans Dalmndan Medyann Hesaplan
N CF Medyan = L + 2 (i ) fL: Medyan snfn alt snr N: Toplam frekans deeri CF: Medyan snfndan nceki snflarn frekanslarnn toplam f: medyan snfnn frekans i: medyan snfnn aral
14
Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam
thalat says (f) 1 4 10 3 2 20
Snf orta noktas (X) 3.5 6.5 9.5 12.5 15.5
CF 1 5 15 18 20
20 5 medyan = 8000000+ 2 (3000000) 10 medyan = 9500000
Frekans Dalmndan Modun Hesaplan
Frekans dalm eklinde gruplanm veriler iin mod, frekans says en fazla olan snfn orta noktas deeridir. Eer frekans dalmnda 2 snf maksimum frekansa sahip ise bu tr dalmlara bimodal dalmlar denilmektedir.
15
Bir rnn sat fiyatn gruplandrlm ekli.
Net sat ($ dolar) 1-4 4-7 7-10 10-13 13 ve daha fazlas
Toplam yzdesi 13 14 40 23 10
Net satn medyan ve modu hesaplaynz? Bu tr tablolara ne ad verilmektedir.
Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki
Aritmetik ortalama= mod=medyan Simetrik frekans dalm erileri
16
Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki
Mod X Med Asimetrisi negatif olan Frekans dalmlar(sola arpk)
X Med Asimetrisi pozitif olan frekans Dalmlar(saa arpk)
Mod
Tek modlu ve asimetrileri ok fazla olmayan veriler iin Aadaki iliki kullanlabilir. Aritmetik ortalama-Mod= 3(Aritmetik Ort-Medyan)
17
III. DAILMA YADA DEKENLK LLER (MEASURE OF DISPERSION)
Do. Dr. rfan Yolcubal Kocaeli niv. Jeoloji Mh. Bl.
Dalma (deikenlik) llerinin analizinin nedeniBir veri setinin merkezi eilim lsnn deerlendirilmesi 2 veya daha fazla veri setinin dalmnn karlatrlmas
1
Dalma yada deikenlik lleriDeikenlik aral (Range) Ortalama sapma (mean deviation) Varyans (Variance) Standard sapma (Standard deviation)
Gruplanmam verilerde dalmn lmDeikenlik aral (Range): Bir veri serisindeki en yksek deer ile en dk deer arasndaki farka eittir.R= Maksimum deer- Minimum deer
2
Deikenlik aral (Range)Seri 1 2 3 6 7 8 10 Seri 2 5 5 5 6 7 8
X=6R=10-2=8
X=6R=8-5=3
Gruplanm verilerde deikenlik aralnn(Range) belirlenmesiSaatlik cret(lira) Frekans
5-10 10-15 15-20 20-25
10 21 9 5
R= 25-5=20 TL
3
Ortalama yada Mutlak Ortalama Sapma (Mean Deviation or Mean Absolute Deviation)
Bir poplasyondaki tm veri deerlerinin poplasyonun aritmetik ortalamasndan olan mutlak sapmalarnn aritmetik ortalamasdr.
O.S . =
X X N
X X = mutlak sapma
Ortalama Sapma (Gruplanmam Verilerde)15, 16, 18, 21, 25 deerlerinden meydana gelmi serinin ortalama sapmasn hesaplayalm. Veriler 15 16 18 21 25X X X X
15-19 16-19 18-19 21-19 25-19 TOPLAM
4 3 1 2 6 16
O. S . =
16 = 3.2 5
4
Ortalama sapma (Gruplanm Verilerde)Snf frekans (f) 7 14 16 9 5 51 Snf orta noktas (X) 15 25 35 45 55
fx105 350 560 405 275 1695
X X15-33.2 25-33.2 35-33.2 45-33.2 55-33.2
X X f X X18.2 8.2 1.8 11.8 21.8 127.4 114.8 28.8 106.2 109 486.2
10-20 20-30 30-40 40-50 50-60 Toplam
X=
fX = 1695 = 33.2N 51
O. S . =
f
X X 486.2 = = 9.53 51 N
Varyans (Variance) ve Standart sapma (Standard deviation)Varyans, bir veri setindeki tm veri deerlerinin, ortalamadan olan sapmalarn karesinin aritmetik ortalamasdr.
2
X X = NPoplasyona ait
(
)
2
2 =
X X N 1
(
)
2
rneklemeye ait
5
Standart SapmaBir veri setinin varyansnn karekkne eittir.
=
X X N
(
)
2
X X = N 1
(
)
2
Poplasyona ait
rneklemeye ait
Standart sapma ve varyansn zellikleriBir serideki deerlere bir sabitin (ann) eklenmesi veya bu deerlerden bir sabitin karlmas ile serinin varyans ve standart sapmas deimez.
2 ( X a) = 2 ( X ) 2 ( X + a) = 2 ( X )
Bir serideki deerlerin her birinin belirli bir sabit ( c ) ile arplmas sonucu meydana kan serinin varyans, orijinal serinin varyansnn sabitin karesi ile arpmna eittir. Ancak standart sapmas, orijinal serinin standart sapmasnn sabitin kendisi ile arpmna eit olmaktadr.
2 (cX ) = c 2 2 ( X ) ( cX ) = c ( X )
6
Standart Sapma ve Varyans (Gruplanmam verilerde) 22, 25, 28, 30, ve 35 deerlerinden oluan poplasyonun varyans ve standart sapmasn hesaplayalm.
X 22 25 28 30 35
(X X)
( X X )2
X=
-6 -3 0 2 7X) = 0
36 9 0 4 49
140 = 28 5
X = 140 ( X
(X
98 = = 196 . 5 = 196 = 443 . .2
X ) 2 = 98
Standard Sapma ve Varyans Hesab (Gruplanm verilerde)- Poplasyon rneisnflar frekans (f) Snf orta noktas (X) fX2 (X X) (X X)
f ( X X )2
0-200 200-400 400-600 600-800 Toplam 32
8 11 7 6
100 300 500 700
800 3300 3500 4200 11800
-270 -70 130 330
72900 4900 16900 108900
583200 53900 118300 653400 1408800
X=
11800 1408800 = 370 2 = = 44025 32 32
= 44025 = 20982 .7
Gruplanm verilerin varyans ve standart sapmasSnflandrlm verilerde, snf orta noktas her zaman bu ksmn arlkl orta noktas olmayacandan, ham verilere gre gruplandrlm deerlerde daha yksek varyans deeri bulunur. Bunu nlemek iin Sheppard dzeltmesi yaplr.
Sh=c2/12 c=snf aral Sh=sheppard dzeltmesi Dzeltilmi varyans = 2-Sh
VaryansTek bir veri seti iin varyans deerinin yorumlanmas zordur. Deikenlik aral ve ortalama sapmada olduu gibi varyans, 2 veya daha fazla data setindeki verilerin deikinlik derecelerin karlatrlmasnda kullanlr.
8
Simetrik frekans dalm grafiklerinde standart sapma ve aritmetik ortalama arasndaki iliki
-3 -2 -1 X 1 2 3 %68 %95 %99.7
X 1
X 2X 3
Nisbi Dalma(Relative Dispersion)Deiim katsays (Coefficient of variation): % olarak ifade edilir. Bir data setinin standart sapmasnn aritmetik ortalamasna orandr.
Degisim Katsayisi(%) =
X
*100
Birimleri farkl olan farkl 2 data setinin kyaslanmasnda (cm, TL) Birimleri ayn fakat ortalamalar birbirinden ok farkl olan data setlerin kyaslanmasnda deiim katsays kullanlr.
X = 500000, = 50000 X = 12000, = 2000
50000 * 100 = 10% 500000 2000 Degisim katsayisi = * 100 = 16.7% 12000 Degisim katsayisi =
9
Gruplanmam verilerde arpklkFrekans dalm grafiklerinin arpklk derecesini tarif etmektedir.
(x x) k =i
3
n 3
arplk genellikle 3 ile +3 deerleri arasnda deimektedir.
Simetrik arpklk=0
Pozitif arpklk
Negatif arpklk
Gruplanm verilerde arpklk
k =
fi xi x fi 3
(
)
3
Carpiklik =
3(X medyan)
eklinde de hesaplanabilir.
10
Gruplanmam verilerde Kurtosis (Basklk-Sivrilik)Frekans dalm erisinin yksekliini belirten bir parametre.
(x x) Kur =i
4
Ham verilerde Gruplanm verilerde
ni
4
f (x x) Kur = fi 4 i
4
Kur=3 (mesokurtik, yada normal dalm) Kur>3 (Leptokurtik, sivri-orta ksmlar u ksmlara gre daha yi boylanm yada sivrilemi can erisi Kur