Upload
tacettin-inandi
View
322
Download
7
Embed Size (px)
Citation preview
Dağılım Ölçütleri
Tacettin İnandı, Doç. Dr.Mustafa Kemal Üniversitesi Tıp Fakültesi Halk Sağlığı
e-posta: [email protected]
1
Sunum Kapsamı1. Ön Tanımlar, Kavramlar2. Dağılım ölçütleri ne anlama gelir3. Dağılım ölçütleri nelerdir4. Nasıl hesaplanırlar5. Nerede kullanılırlar, hangi durumda hangi ölçütler seçilir
2
Ön Tanımlar• Değişken• Veri, veri dizisi, (seti)• Dağılım• Ölçüt: bir yargıya varmak ya da değer biçmek için başvurulan ilke,
kıstas, mısdak, kriter
3
DeğişkenGözlem-ölçüm
Veri dizisiDağılım
Ölçütler
Dağılım ölçütleri ne işe yarar?
Yüzlerce binlerce kişiden, denekten elde edilmiş veri dizilerini tanımlanmasıBüyük bir veri setinin özelliklerini birkaç rakamla özetlenmesi
4
Dağılım ölçütleri nelerdir
5
1. Merkezi Eğilim Ölçütleri: Yer gösteren ölçütler
2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri
3. Çarpıklık 4. Basıklık
Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.
Ortanca (median)Tepe değeri (mode)ÇeyrekYüzdelikler
Değişim genişliği , aralığı (range)
Değişim-VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer
Çarpıklık katsayıları
Basıklık katsayıları
1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)
6
Ortalamalar• Aritmetik ortalama• Geometrik ortalama• Harmonik ortalama
7
Aritmetik ortalama nasıl hesaplanır
Veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilir
Örneklemin aritmetik ortalaması ile Evrenin aritmetik ortalaması μ (mu) ile gösterilir
Veri seti: 10 23 17 5 64 28 3Denek sayısı: n: 7
• Aritmetik ortalama = = x1+x2+ …..x7
• = 21.43 8
9
Aritmetik ortalamanın özellikleri
Sık kullanılan ölçütlerden biridirGenellikle standart sapma ile birlikte verilir = 12.1 ±2.1
Sınıflandırılmış verilerde hesaplama farklıdır
10
Sayısal verilerde sınıflandırma
Sınıf Sayısı: Veri dizisindeki grup sayısı (k)Değişim Aralığı: En büyük değer – En küçük değer (R)
Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubuSınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c)Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır)Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s)
Sınıf Frekansı: Sınıftaki değer sayısını gösterir. (f)
Sınıf Göreli Frekansı (%): Sınıfın frekansının toplam değer sayısı (n) içindeki payını gösterir. (%f)
Sınıflandırılmış verilerde aritmetik ortalama
12
Örnek: Sıklık çizelgesi hazırlanmış yaş değişkenleri
Sınıf Sıklık=fj Sınıf değeri=sj fj*sj
19-21 2 20 2*20=40 22-24 4 23 4*23=92 25-27 6 26 6*26=156 28-30 14 29 14*29=406 31-33 7 32 7*32=224 34-36 12 35 12*35=420 37-39 2 38 2*38=76 40-42 3 41 3*41=123 Toplam 50 1537
Aşırı değerlerden etkilenirYeniden ölçüm yapılabilirÇıkartılabilirEn yakın değere yakın bir değer atanabilir
Aşırı değerlerden etkilenir, özellikle denek sayılarının az olması durumunda aşırı değerlerden fazla etkilenir0,1,2,3,4,5,6,7,8,9,40
= 0+1+2+3+….= 85/11 =7.72
= 0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,40 = 125/21= 5.95
14
15
Aritmetik ortalamayı ne zaman kullanmalı? - merkezi dağılımda
- dağılım yaklaşık olarak simetrikse
OK
Geometrik ortalama• İki sayının çarpımının karekökü olarak
tanımlanabilecek geometrik ortalama, n adet sayı olması halinde bu sayıların çarpımının n.inci dereceden kökü
G geometrik ortalama sembolüdür
16
Geometrik ortalama nerede kullanır
• Ortalama oranları
• Değişim oranları
• Logaritmik dağılım gösteren bakterilerin çoğalması,
nüfus artışı gibi durumlar
• Fiyat indeksleri, faiz oranları
17
Geometrik Ortalamanın özellikleri
• Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir.
• Eğer tek bir veri değer sıfır ise, geometrik ortalama almak anlamsız olacaktır.
• Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir
18
Harmonik Ortalama
Bir veri setinde bulunan n adet elemanın çarpma işleminegöre terslerinin ortalamasının tersinin alınmasıyla elde edilenyer ölçüsüdür. Genellikle basit seriler için kullanışlıdır.
19
Harmonik Ortalama’nın Kullanım Alanları• • Belirli fiyat tipleri,• • Zaman serileri,• için kullanışlıdır.• Örnek: Zaman birimi başına hız, para birimi başına• satın alınan birim sayısı.
20
1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)
21
Ortanca - Medyan• Dağılımı büyükten küçüğe ya da küçükten büyüğe sıraladığımızda
ortada yer alan değer
Dağılımı iki eşit parçaya bölen değişken değeri:
Değerlerin %50’si ortancanın altında
Değerlerin %50’si ortancanın üzerinde• 10, 23, 17, 5, 64, 19, 28, 3
3, 5, 17, 19, 23, 28, 64
Ortanca genellikle en küçük ve en büyük değerlerle birlikte verilir
22
23
Bir niceliksel değişkenin 80’lik sıralanmış değeri11.0 21.3 37.8 51.711.5 21.8 38.2 51.713.1 22.9 38.4 52.513.7 23.0 38.6 52.714.0 23.8 39.0 53.414.3 24.3 39.2 54.515.4 25.7 39.4 56.415.5 26.6 39.7 57.916.3 27.9 41.1 58.116.8 28.0 43.4 58.217.1 30.0 43.4 58.417.4 31.3 43.5 58.417.5 31.7 44.0 58.518.2 31.7 45.1 59.018.2 32.0 45.6 59.219.0 33.6 45.8 59.919.1 33.9 47.8 61.219.6 34.9 49.1 62.119.7 35.6 49.2 63.520.8 37.7 51.4 66.6
Ortanca : 2
37,8 37,7
= 37.75
Ortancanın özelliği
• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir.
• Medyan, veri setindeki tüm elemanlardan etkilenmez• Birim sayısındaki değişmelerden etkilenir, uç değerlerden etkilenmez• Medyanın standart hatası, aritmetik ortalamanınkinden daha
büyüktür
24
1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)
25
Tepe Değeri - Mode
• Bir dağılımda en çok tekrarlayan değerdir• 1,2,2,3,3,3,3,4,5,6,6,7• En çok tekrarlayan değer
26
Tepe değerinin özellikleri• Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir. • Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe
değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde yeniden düzenlenir.
• Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç değerlerden etkilenmez.
• Nicel ve nitel verilerin her iki türü için de uygundur. • Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.
27
28
Tepe değeriDeğişkenin en sık görülen değeri
0
2
4
6
8
10
12
14
16
18
20
Tepe Değeri
Tepe Değeri
29Kaynak: https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php
İki tepe değeri
30
Kaynak: https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php
Tepe değeri
31
Ortalama, ortanca ve tepe değeri seçimi
Değişken Türü Çarpıklık Ölçüt seçimiİsimsel Tepe değeriSıralı Ortanca
Eşit aralıklı /oranlı Yok Ortalama
Eşit aralıklı/oranlı Var Ortanca
32
Değişken türleri ile ortalama, ortanca ve tepe değeri
Değişken Türü Ölçütler
İsimsel Tepe değeri
Sıralı Ortanca, tepe değeri
Eşit aralıklı /oranlı/sürekli Ortalama, ortanca, tepe değeri
33
Çarpık dağılımlar
34
Mod, Medyan ve Aritmetik Ortalama Karşılaştırılması
• Dağılımında(+)asimetri varsa: x > medyan > mod
• Dağılımında(-)asimetri varsa: x < medyan < mod
35
1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)
36
Çeyrek ve yüzdelikler• Bir veri setini büyükten küçüğe veya küçükten büyüğe
sıraladığımızda dört eşit parçaya ayıran üç değere çeyrek adı verilir.
• İlk % 25 birinci çeyrek (Q1)• % 50’lik değere ikinci çeyrek (Q2) = medyan, ortanca• % 75’lik değere üçüncü çeyrek (Q3)
37
Çeyrekler
38
ORTANCA
(Q2)X
maximumXminimum Q1 Q3
25% 25% 25% 25%
12 30 45 57 70
1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)
39
Ortasınır değer• En küçük değer ile en büyük değerin toplanıp ikiye bölünmesi
ile elde edilir• Sık kullanılan bir ölçü değildir
40
Dağılım türü ile ortalama, ortanca ve tepe değeri ilişkisi
41
Değişken Türü Ölçütler
İsimsel (Nominal) Tepe değeri (Mode)
Sıralı (Ordinal) Ortanca, tepe değeri (Median, mode)
Eşit aralıklı /oranlı/sürekli (Interval/Ratio/continious)
Ortalama, ortanca, tepe değeri (Mean, median, mode)
Dağılım ölçütleri nelerdir
42
1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler
2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri
3. Çarpıklık 4. Basıklık
Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.
Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler
Değişim genişliği , aralığı (range)
VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer
Çarpıklık katsayıları
Basıklık katsayıları
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Değişim- Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
43
Genişlik = xen büyük – xen küçük
22 23 31 35 36 37 38 39 40 41 42 43 44
Genişlik = 44 - 22 = 22
Örnek:
Değişim Genişliği (Range, R)
En küçük ve en büyük değerin çıkartılması ile elde edilir
44
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Değişim - Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
45
Değişim - Varyans
• Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir ölçü
• Birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir
• Kitle (evren) varyansı s2 , örneklem varyansı s2 ile gösterilir.
46
Değişim - Varyans
47
Yüksek
Düşük
Değişim (variance)
48
Farkın ortalamaya göre toplamı= 0
Farkın karesinin toplamı
Varyans = farkın karesinin toplamının, ortalamaya göreortalaması
Ortalama
Değişim - Varyans
49
Fark: x - xi
Farkın karesi: (x - xi)²Farkın karesi toplamı: S (x - xi)²
x : ortalamaxi : değerN : sayı
Varyans =
( )( )N
²x x iå - ( )
N
x - ²x
iiå
å
= N
²
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Varyans
• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
50
Standart Sapma
• Ortalamalardan ayrılışları gösterir• Kitle standart sapması s, örneklem standart sapması s ile
gösterilir.
• Sık kullanılan değişim ölçüsü• Standart sapma varyansın kareköküdür (Standart
sapmanın karesi varyansı verir)
51
Standart Sapma
52
Standart sapma = Varyansın karekökü
s =
s =
σ²
s²
m = 36.5 Kg
s² = 257 Kg2
s 2= = 16 Kg257
53
0
2
4
6
8
10
12
14
Ortalama
StandartSapma
Standart Sapma
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
54
Değişim Katsayısı (coefficient of variaton)
• Standart sapmanın ortalamaya göre yüzde olarak anlatımı
ÖrnekHb ortalaması, = 12.4Standar sapma, s = 1.2
Değişim katsayısı: (1.2/12.4) x 100 = 9.8
55
Değişim katsayısı
56
Yüksek
Düşük
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı
• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
57
Standart Hata (SE, SEM)• Örneklem ortalamasının toplum (evren) ortalamasını temsil
ederken oluşan hata• Standart sapma bir veri dizisinde değişkenlerin ortalmaya göre
ne kadar saptığını gösterirken, standart hata ortalamanın toplumdaki dağılımı hakkında bilgi verir
• Standart hata bir kestirim hatasıdır• Standart hata ne kadar küçükse örneklem istatistiği anakütle
parametresine o derece yakın , parametre hakkında o kadar duyarlı bir kestirim olacaktır.
• Standart hata büyüdükçe bu kestirimin duyarlılığı o derece duyarlı olmaktan çıkacaktır
58
Standart Hata
s = örneklemin standart sapmasın = örneklem sayısı
Örneklem büyüklüğü arttıkça standart hata azalır
59
2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir
• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer
60
Sapan Değer ve Kutu Çizimleri
Minimum 1st Median 3rd Maximum Quartile Quartile
Kutu çizimleri, verilerin çeyrek değerlerine dayalı grafiklerdir.
1- Birinci çeyrek değer, ortanca, üçüncü çeyrek değer bir çizgi üzerinde sıralanır.
2- Ortancadan yatay çizgiye bir dik çizilir.
3- Birinci ve üçüncü çeyrek değerlerden de dik çıkılarak bir kutu oluşturulur.
4- En küçük değer A=Q1-1,5(Q3-Q1)
5- En büyük değer B=Q3+1,5(Q3-Q1) belirlenir. 61
Uç Değer Verilerimizde A dan daha küçük olan
veri ya da B den daha büyük olan veri var ise bu değerlere uç değer denir.
Uç değerin sapan değer olup olmadığı belirlenen alt ve üst sınırlar ile saptanır
Alt sınır A=(Q1-1,5d) Üst sınır B=(Q3+1,5d) d=Q3-Q1
Uç değer A dan küçük ise ya da B den büyük ise sapan değerdir.
62
Dağılım ölçütleri nelerdir
63
1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler
2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri
3. Çarpıklık 4. Basıklık
Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.
Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler
Değişim genişliği , aralığı (range)
Değişim-varyansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer
Çarpıklık katsayıları
Basıklık katsayıları
3. Dağılımın Çarpıklığı• Dağılımın simetrik olamayışının ölçülmesidir.• Çarpıklık üçüncü standardize edilmiş moment • Pozitif çarpıklık: Bu halde sağdaki kuyruk daha uzundur.
Dağılımın kütlesi grafiğin sol tarafında konsantre olmustur. Bu türlü dağılım sağdan çarpıkolarak anılır.
• Negatif çarpıklık: Bu halde soldaki kuyruk daha uzundur ve dağılımın kütlesi grafiğin sağ tarafında konsantre olmustur. Bu türlü dağılım soldan çarpıkolarak anılır.
64
Çarpıklık Ölçütleri• Pearson asimetrisi• Bowley asimetrisi
65
3
1
3)(
Sn
xx
ÇK
n
jj
Burada: ÇK: Çarpıklık katsayısıXj:j inci gözlemin değeriS3: standart sapmanın küpü
ÇK=0 ise dağılım simetriktir.ÇK<0 ise dağılım sola(eksi yöne) çarpıktır.ÇK>0 ise dağılım sağa(artı yöne) çarpıktır. 66
Çarpıklık Katsayısı• ÇK=0 ise dağılım simetriktir.• ÇK<0 ise dağılım soldan(eksi yöne) çarpıktır.• ÇK>0 ise dağılım sağdan(artı yöne) çarpıktır
67
Çeyrek değerlerle dağılım özelliğinin incelenmesi
68
Sağa ÇarpıkSola Çarpık Simetrik
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Dağılım ölçütleri nelerdir
69
1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler
2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri
3. Çarpıklık 4. Basıklık
Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.
Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler
Değişim genişliği , aralığı (range)
VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer
Çarpıklık katsayıları
Basıklık katsayıları
4. Sivrilik- Basıklık Ölçütleri• Veri setinin basıklık karekteri pek dikkate alınmayan bir özelliği
• Dördüncü standarize edilmiş moment şöyle tanımlanır;• Dördüncü standardize edilmiş moment için en küçük
değer 1dir; bu nedenle en küçük basıklık fazlalığı değeri -2 olur. Dördüncü moment ve kümülant değeri için üst bir sınırlama yoktur ve üst değer artı sonsuz kadar büyük olabilir. Bu nedenle basıklık ölçüsü değeri -2 ile artı sonsuzluk arasında bulunabilir.
• Basıklık ölçütü -2 ile + 70
Basıklık Katsayısı
• Basıklığın ölçüsü basıklık katsayısı ile belirlenir.
71
Daha basık dagılım
Basık dağılım
4
1
4)(
Sn
xx
BK
n
jj
Burada: BK: Basıklık katsayısıXj:j inci gözlemin değeriS4: standart sapmanın dördüncü kuvvetiBK=3 ise dağılımın basıklığı normal ağılım ile aynıdır.BK>3 ise dağılım normal dağılımdan daha dikdir.BK<3 ise dağılım normal dağılımdan daha basıktır. 72
Dağılım ölçütleri nelerdir
73
1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler
2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri
3. Çarpıklık 4. Basıklık
Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.
Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler
Değişim genişliği , aralığı (range)
Değişim-varyansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer
Çarpıklık katsayıları
Basıklık katsayıları
SORULAR
74
Tüm verri dizileri ortalama ortanca ve tepe değeri içerir mi?
75
Hayır
Eşit aralıklı ve oranlı bir değişkenden elde edilmiş ancak normal dağılım özelliği göstermeyen bir veri setinde hangi merkezi eğilim ölçütünü kullanmak uygundur?
Ortanca
76
Genellikle ortalama ile birlikte kullanılan yaygınlık ölçütü hangisidir?
Standart sapma
77
Bir örneklem ortalamasının evren ortalamasını temsil etme yeteneği hangi ölçüt ile gösterilir?
Standart hata
78
Normal dağılımda kullanılan merkezi eğilim ölçütü hangisidir?
Ortanca
79
Teşekkürler
80