Dağılım ölçütleri

Preview:

Citation preview

Dağılım Ölçütleri

Tacettin İnandı, Doç. Dr.Mustafa Kemal Üniversitesi Tıp Fakültesi Halk Sağlığı

e-posta: inandit@gmail.com

1

Sunum Kapsamı1. Ön Tanımlar, Kavramlar2. Dağılım ölçütleri ne anlama gelir3. Dağılım ölçütleri nelerdir4. Nasıl hesaplanırlar5. Nerede kullanılırlar, hangi durumda hangi ölçütler seçilir

2

Ön Tanımlar• Değişken• Veri, veri dizisi, (seti)• Dağılım• Ölçüt: bir yargıya varmak ya da değer biçmek için başvurulan ilke,

kıstas, mısdak, kriter

3

DeğişkenGözlem-ölçüm

Veri dizisiDağılım

Ölçütler

Dağılım ölçütleri ne işe yarar?

Yüzlerce binlerce kişiden, denekten elde edilmiş veri dizilerini tanımlanmasıBüyük bir veri setinin özelliklerini birkaç rakamla özetlenmesi

4

Dağılım ölçütleri nelerdir

5

1. Merkezi Eğilim Ölçütleri: Yer gösteren ölçütler

2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri

3. Çarpıklık 4. Basıklık

Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.

Ortanca (median)Tepe değeri (mode)ÇeyrekYüzdelikler

Değişim genişliği , aralığı (range)

Değişim-VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer

Çarpıklık katsayıları

Basıklık katsayıları

1. Merkezi Eğilim Ölçütleri

• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)

6

Ortalamalar• Aritmetik ortalama• Geometrik ortalama• Harmonik ortalama

7

Aritmetik ortalama nasıl hesaplanır

Veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilir

Örneklemin aritmetik ortalaması ile Evrenin aritmetik ortalaması μ (mu) ile gösterilir

Veri seti: 10 23 17 5 64 28 3Denek sayısı: n: 7

• Aritmetik ortalama = = x1+x2+ …..x7

• = 21.43 8

9

Aritmetik ortalamanın özellikleri

Sık kullanılan ölçütlerden biridirGenellikle standart sapma ile birlikte verilir = 12.1 ±2.1

Sınıflandırılmış verilerde hesaplama farklıdır

10

Sayısal verilerde sınıflandırma

Sınıf Sayısı: Veri dizisindeki grup sayısı (k)Değişim Aralığı: En büyük değer – En küçük değer (R)

Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubuSınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c)Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır)Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s)

Sınıf Frekansı: Sınıftaki değer sayısını gösterir. (f)

Sınıf Göreli Frekansı (%): Sınıfın frekansının toplam değer sayısı (n) içindeki payını gösterir. (%f)

Sınıflandırılmış verilerde aritmetik ortalama

12

Örnek: Sıklık çizelgesi hazırlanmış yaş değişkenleri

Sınıf Sıklık=fj Sınıf değeri=sj fj*sj

19-21 2 20 2*20=40 22-24 4 23 4*23=92 25-27 6 26 6*26=156 28-30 14 29 14*29=406 31-33 7 32 7*32=224 34-36 12 35 12*35=420 37-39 2 38 2*38=76 40-42 3 41 3*41=123 Toplam 50 1537

Aşırı değerlerden etkilenirYeniden ölçüm yapılabilirÇıkartılabilirEn yakın değere yakın bir değer atanabilir

Aşırı değerlerden etkilenir, özellikle denek sayılarının az olması durumunda aşırı değerlerden fazla etkilenir0,1,2,3,4,5,6,7,8,9,40

= 0+1+2+3+….= 85/11 =7.72

= 0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,40 = 125/21= 5.95

14

15

Aritmetik ortalamayı ne zaman kullanmalı? - merkezi dağılımda

- dağılım yaklaşık olarak simetrikse

OK

Geometrik ortalama• İki sayının çarpımının karekökü olarak

tanımlanabilecek geometrik ortalama, n adet sayı olması halinde bu sayıların çarpımının n.inci dereceden kökü

G geometrik ortalama sembolüdür

16

Geometrik ortalama nerede kullanır

• Ortalama oranları

• Değişim oranları

• Logaritmik dağılım gösteren bakterilerin çoğalması,

nüfus artışı gibi durumlar

• Fiyat indeksleri, faiz oranları

17

Geometrik Ortalamanın özellikleri

• Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir.

• Eğer tek bir veri değer sıfır ise, geometrik ortalama almak anlamsız olacaktır.

• Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir

18

Harmonik Ortalama

Bir veri setinde bulunan n adet elemanın çarpma işleminegöre terslerinin ortalamasının tersinin alınmasıyla elde edilenyer ölçüsüdür. Genellikle basit seriler için kullanışlıdır.

19

Harmonik Ortalama’nın Kullanım Alanları• • Belirli fiyat tipleri,• • Zaman serileri,• için kullanışlıdır.• Örnek: Zaman birimi başına hız, para birimi başına• satın alınan birim sayısı.

20

1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)

21

Ortanca - Medyan• Dağılımı büyükten küçüğe ya da küçükten büyüğe sıraladığımızda

ortada yer alan değer

Dağılımı iki eşit parçaya bölen değişken değeri:

Değerlerin %50’si ortancanın altında

Değerlerin %50’si ortancanın üzerinde• 10, 23, 17, 5, 64, 19, 28, 3

3, 5, 17, 19, 23, 28, 64

Ortanca genellikle en küçük ve en büyük değerlerle birlikte verilir

22

23

Bir niceliksel değişkenin 80’lik sıralanmış değeri11.0 21.3 37.8 51.711.5 21.8 38.2 51.713.1 22.9 38.4 52.513.7 23.0 38.6 52.714.0 23.8 39.0 53.414.3 24.3 39.2 54.515.4 25.7 39.4 56.415.5 26.6 39.7 57.916.3 27.9 41.1 58.116.8 28.0 43.4 58.217.1 30.0 43.4 58.417.4 31.3 43.5 58.417.5 31.7 44.0 58.518.2 31.7 45.1 59.018.2 32.0 45.6 59.219.0 33.6 45.8 59.919.1 33.9 47.8 61.219.6 34.9 49.1 62.119.7 35.6 49.2 63.520.8 37.7 51.4 66.6

Ortanca : 2

37,8 37,7

= 37.75

Ortancanın özelliği

• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir.

• Medyan, veri setindeki tüm elemanlardan etkilenmez• Birim sayısındaki değişmelerden etkilenir, uç değerlerden etkilenmez• Medyanın standart hatası, aritmetik ortalamanınkinden daha

büyüktür

24

1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)

25

Tepe Değeri - Mode

• Bir dağılımda en çok tekrarlayan değerdir• 1,2,2,3,3,3,3,4,5,6,6,7• En çok tekrarlayan değer

26

Tepe değerinin özellikleri• Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir. • Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe

değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde yeniden düzenlenir.

• Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç değerlerden etkilenmez.

• Nicel ve nitel verilerin her iki türü için de uygundur. • Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.

27

28

Tepe değeriDeğişkenin en sık görülen değeri

0

2

4

6

8

10

12

14

16

18

20

Tepe Değeri

Tepe Değeri

29Kaynak: https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

İki tepe değeri

30

Kaynak: https://statistics.laerd.com/statistical-guides/measures-central-tendency-mean-mode-median.php

Tepe değeri

31

Ortalama, ortanca ve tepe değeri seçimi

Değişken Türü Çarpıklık Ölçüt seçimiİsimsel Tepe değeriSıralı Ortanca

Eşit aralıklı /oranlı Yok Ortalama

Eşit aralıklı/oranlı Var Ortanca

32

Değişken türleri ile ortalama, ortanca ve tepe değeri

Değişken Türü Ölçütler

İsimsel Tepe değeri

Sıralı Ortanca, tepe değeri

Eşit aralıklı /oranlı/sürekli Ortalama, ortanca, tepe değeri

33

Çarpık dağılımlar

34

Mod, Medyan ve Aritmetik Ortalama Karşılaştırılması

• Dağılımında(+)asimetri varsa: x > medyan > mod

• Dağılımında(-)asimetri varsa: x < medyan < mod

35

1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)

36

Çeyrek ve yüzdelikler• Bir veri setini büyükten küçüğe veya küçükten büyüğe

sıraladığımızda dört eşit parçaya ayıran üç değere çeyrek adı verilir.

• İlk % 25 birinci çeyrek (Q1)• % 50’lik değere ikinci çeyrek (Q2) = medyan, ortanca• % 75’lik değere üçüncü çeyrek (Q3)

37

Çeyrekler

38

ORTANCA

(Q2)X

maximumXminimum Q1 Q3

25% 25% 25% 25%

12 30 45 57 70

1. Merkezi Eğilim Ölçütleri• Ortalama (mean)• Ortanca (median)• Tepe değeri (mode)• Çeyrek ve yüzdelikler (Quartiles and percentiles)• Ortasınır değer( Mid-range value)

39

Ortasınır değer• En küçük değer ile en büyük değerin toplanıp ikiye bölünmesi

ile elde edilir• Sık kullanılan bir ölçü değildir

40

Dağılım türü ile ortalama, ortanca ve tepe değeri ilişkisi

41

Değişken Türü Ölçütler

İsimsel (Nominal) Tepe değeri (Mode)

Sıralı (Ordinal) Ortanca, tepe değeri (Median, mode)

Eşit aralıklı /oranlı/sürekli (Interval/Ratio/continious)

Ortalama, ortanca, tepe değeri (Mean, median, mode)

Dağılım ölçütleri nelerdir

42

1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler

2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri

3. Çarpıklık 4. Basıklık

Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.

Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler

Değişim genişliği , aralığı (range)

VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer

Çarpıklık katsayıları

Basıklık katsayıları

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Değişim- Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

43

Genişlik = xen büyük – xen küçük

22 23 31 35 36 37 38 39 40 41 42 43 44

Genişlik = 44 - 22 = 22

Örnek:

Değişim Genişliği (Range, R)

En küçük ve en büyük değerin çıkartılması ile elde edilir

44

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Değişim - Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

45

Değişim - Varyans

• Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir ölçü

• Birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile elde edilir

• Kitle (evren) varyansı s2 , örneklem varyansı s2 ile gösterilir.

46

Değişim - Varyans

47

Yüksek

Düşük

Değişim (variance)

48

Farkın ortalamaya göre toplamı= 0

Farkın karesinin toplamı

Varyans = farkın karesinin toplamının, ortalamaya göreortalaması

Ortalama

Değişim - Varyans

49

Fark: x - xi

Farkın karesi: (x - xi)²Farkın karesi toplamı: S (x - xi)²

x : ortalamaxi : değerN : sayı

Varyans =

( )( )N

²x x iå - ( )

N

x - ²x

iiå

å

= N

²

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Varyans

• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

50

Standart Sapma

• Ortalamalardan ayrılışları gösterir• Kitle standart sapması s, örneklem standart sapması s ile

gösterilir.

• Sık kullanılan değişim ölçüsü• Standart sapma varyansın kareköküdür (Standart

sapmanın karesi varyansı verir)

51

Standart Sapma

52

Standart sapma = Varyansın karekökü

s =

s =

σ²

m = 36.5 Kg

s² = 257 Kg2

s 2= = 16 Kg257

53

0

2

4

6

8

10

12

14

Ortalama

StandartSapma

Standart Sapma

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

54

Değişim Katsayısı (coefficient of variaton)

• Standart sapmanın ortalamaya göre yüzde olarak anlatımı

ÖrnekHb ortalaması, = 12.4Standar sapma, s = 1.2

Değişim katsayısı: (1.2/12.4) x 100 = 9.8

55

Değişim katsayısı

56

Yüksek

Düşük

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı

• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

57

Standart Hata (SE, SEM)• Örneklem ortalamasının toplum (evren) ortalamasını temsil

ederken oluşan hata• Standart sapma bir veri dizisinde değişkenlerin ortalmaya göre

ne kadar saptığını gösterirken, standart hata ortalamanın toplumdaki dağılımı hakkında bilgi verir

• Standart hata bir kestirim hatasıdır• Standart hata ne kadar küçükse örneklem istatistiği anakütle

parametresine o derece yakın , parametre hakkında o kadar duyarlı bir kestirim olacaktır.

• Standart hata büyüdükçe bu kestirimin duyarlılığı o derece duyarlı olmaktan çıkacaktır

58

Standart Hata

s = örneklemin standart sapmasın = örneklem sayısı

Örneklem büyüklüğü arttıkça standart hata azalır

59

2. Değişim gösteren ölçütler

• Verilerin belli bir konumdan olan uzaklaşmalarını gösterir

• Değişim genişliği , aralığı (range)• Varyans• Standart sapma• Değişim katsayısı• Standart hata• Çeyrek sapma• Uç değer, aşırı değer

60

Sapan Değer ve Kutu Çizimleri

Minimum 1st Median 3rd Maximum Quartile Quartile

Kutu çizimleri, verilerin çeyrek değerlerine dayalı grafiklerdir.

1- Birinci çeyrek değer, ortanca, üçüncü çeyrek değer bir çizgi üzerinde sıralanır.

2- Ortancadan yatay çizgiye bir dik çizilir.

3- Birinci ve üçüncü çeyrek değerlerden de dik çıkılarak bir kutu oluşturulur.

4- En küçük değer A=Q1-1,5(Q3-Q1)

5- En büyük değer B=Q3+1,5(Q3-Q1) belirlenir. 61

Uç Değer Verilerimizde A dan daha küçük olan

veri ya da B den daha büyük olan veri var ise bu değerlere uç değer denir.

Uç değerin sapan değer olup olmadığı belirlenen alt ve üst sınırlar ile saptanır

Alt sınır A=(Q1-1,5d) Üst sınır B=(Q3+1,5d) d=Q3-Q1

Uç değer A dan küçük ise ya da B den büyük ise sapan değerdir.

62

Dağılım ölçütleri nelerdir

63

1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler

2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri

3. Çarpıklık 4. Basıklık

Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.

Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler

Değişim genişliği , aralığı (range)

Değişim-varyansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer

Çarpıklık katsayıları

Basıklık katsayıları

3. Dağılımın Çarpıklığı• Dağılımın simetrik olamayışının ölçülmesidir.• Çarpıklık üçüncü standardize edilmiş moment • Pozitif çarpıklık: Bu halde sağdaki kuyruk daha uzundur.

Dağılımın kütlesi grafiğin sol tarafında konsantre olmustur. Bu türlü dağılım sağdan çarpıkolarak anılır.

• Negatif çarpıklık: Bu halde soldaki kuyruk daha uzundur ve dağılımın kütlesi grafiğin sağ tarafında konsantre olmustur. Bu türlü dağılım soldan çarpıkolarak anılır.

64

Çarpıklık Ölçütleri• Pearson asimetrisi• Bowley asimetrisi

65

3

1

3)(

Sn

xx

ÇK

n

jj

Burada: ÇK: Çarpıklık katsayısıXj:j inci gözlemin değeriS3: standart sapmanın küpü

ÇK=0 ise dağılım simetriktir.ÇK<0 ise dağılım sola(eksi yöne) çarpıktır.ÇK>0 ise dağılım sağa(artı yöne) çarpıktır. 66

Çarpıklık Katsayısı• ÇK=0 ise dağılım simetriktir.• ÇK<0 ise dağılım soldan(eksi yöne) çarpıktır.• ÇK>0 ise dağılım sağdan(artı yöne) çarpıktır

67

Çeyrek değerlerle dağılım özelliğinin incelenmesi

68

Sağa ÇarpıkSola Çarpık Simetrik

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

Dağılım ölçütleri nelerdir

69

1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler

2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri

3. Çarpıklık 4. Basıklık

Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.

Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler

Değişim genişliği , aralığı (range)

VaryansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer

Çarpıklık katsayıları

Basıklık katsayıları

4. Sivrilik- Basıklık Ölçütleri• Veri setinin basıklık karekteri pek dikkate alınmayan bir özelliği

• Dördüncü standarize edilmiş moment şöyle tanımlanır;• Dördüncü standardize edilmiş moment için en küçük

değer 1dir; bu nedenle en küçük basıklık fazlalığı değeri -2 olur. Dördüncü moment ve kümülant değeri için üst bir sınırlama yoktur ve üst değer artı sonsuz kadar büyük olabilir. Bu nedenle basıklık ölçüsü değeri -2 ile artı sonsuzluk arasında bulunabilir.

• Basıklık ölçütü -2 ile + 70

Basıklık Katsayısı

• Basıklığın ölçüsü basıklık katsayısı ile belirlenir.

71

Daha basık dagılım

Basık dağılım

4

1

4)(

Sn

xx

BK

n

jj

Burada: BK: Basıklık katsayısıXj:j inci gözlemin değeriS4: standart sapmanın dördüncü kuvvetiBK=3 ise dağılımın basıklığı normal ağılım ile aynıdır.BK>3 ise dağılım normal dağılımdan daha dikdir.BK<3 ise dağılım normal dağılımdan daha basıktır. 72

Dağılım ölçütleri nelerdir

73

1. Merkezi Eğilim Ölçütleri Yer gösteren ölçütler

2. Değişimi Gösteren Ölçütler: Yaygınlık ölçütleri

3. Çarpıklık 4. Basıklık

Ortalama (mean)• Aritmetik o.• Geometrik o.• Diğer o.

Ortanca (median)Tepe değeri (mode)ÇeyreklerYüzdelikler

Değişim genişliği , aralığı (range)

Değişim-varyansStandart sapmaStandart hataDeğişim katsayısıÇeyrek sapmaUç değer, aşırı değer

Çarpıklık katsayıları

Basıklık katsayıları

SORULAR

74

Tüm verri dizileri ortalama ortanca ve tepe değeri içerir mi?

75

Hayır

Eşit aralıklı ve oranlı bir değişkenden elde edilmiş ancak normal dağılım özelliği göstermeyen bir veri setinde hangi merkezi eğilim ölçütünü kullanmak uygundur?

Ortanca

76

Genellikle ortalama ile birlikte kullanılan yaygınlık ölçütü hangisidir?

Standart sapma

77

Bir örneklem ortalamasının evren ortalamasını temsil etme yeteneği hangi ölçüt ile gösterilir?

Standart hata

78

Normal dağılımda kullanılan merkezi eğilim ölçütü hangisidir?

Ortanca

79

Teşekkürler

80

Recommended