31
6 DAĞILIM ÖLÇÜLERİ

dağılım ölçüleri(fazlası için )

Embed Size (px)

Citation preview

Page 1: dağılım ölçüleri(fazlası için )

6 DAĞILIM ÖLÇÜLERİ

Page 2: dağılım ölçüleri(fazlası için )

Dağılım• Toplum ya da bir örnek grubu içindeki verilerin değerlerini

tanımlamak için ortalamalar kullanılır.

• Verilerin dağılımı hakkında bilgi sahibi olunurken ortalamalar yalnız başlarına yeterli olamazlar.

• Ortalamalar yalnız verilerin yığılım yaptıkları yeri gösterirler. • Yığılma noktasına olan uzaklıklar ve yığılma derecesi hakkında bir

bilgi veremezler.

• Yığılmaya ilişkin bilgileri ölçmek için dağılım ölçüleri adı verilen ayrı ölçüler kullanılmaktadır.

• örneklerden elde edilen veriler aynı değere eşit olmayıp grubun aritmetik ortalaması etrafında bir dağılım gösterirler.

• Verilerden söz edilirken, onların aritmetik ortalaması ile birlikte dağılımının da bilinmesinde yarar vardır.

Page 3: dağılım ölçüleri(fazlası için )

• Her iki grupta aritmetik ortalama 25 yıldır. Ortalamalara bakarak gruplar hakkında karar vermek yanıltıcı olur.

• Yaş ortalaması ikisinde de eşit olmasına karşın A grubunda yaş 22-29 arası değişirken diğerinde 5-70 aralığına yayılmıştır.

• Dağılımın fazla olması, hatayı artırmasından dolayı istenmeyen bir etkendir.

• Bir gruptaki dağılımı ölçmek için değişik dağılım ölçüleri kullanılmaktadır.

• Bunlar dağılım aralığı, ortalama sapma, variyans, standart sapma, değişme katsayısı ve kuartil sapmadır.

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Page 4: dağılım ölçüleri(fazlası için )

Dağılım Aralığı• Verilerin dağıldığı aralığın büyüklüğünü

gösteren bir dağılım ölçüsüdür. • Yalnız iki uç değere göre hesaplanır. Diğer

verilerin bir katkısı olmaz. • Aşırı uçlardan etkilendiği ve yalnız uç

değerlere göre hesaplandığı için kaba bir ölçüdür. Bu nedenle, gerçek dağılımı belirleyemez.

• Gruptaki en büyük değerden en küçük değerin çıkarılmasıyla bulunur.

Page 5: dağılım ölçüleri(fazlası için )

• Dağılım aralığı,

A grubu için 29-22= 7

B grubu için 70-5= 65

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Page 6: dağılım ölçüleri(fazlası için )

Ortalama Sapma • Gruptaki verilerin hepsinin katkısıyla bulunan bir

dağılım ölçüsüdür.

• Verilerin aritmetik ortalamadan olan sapmalarının mutlak büyüklüklerinin aritmetik ortalaması olarak tanımlanır.

• Verilerin aritmetik ortalamadan olan farkları toplamı sıfır olduğu için farkların mutlak değerleri alınmaktadır.

Page 7: dağılım ölçüleri(fazlası için )

• n, veri sayısını ve x de verileri göstermek üzere ortalama sapma

O Sx x

n. .=

−∑

Örnek 6.2: A ve B grubundaki verilerin O.S. değerlerini bulalım.

A grubu için:

x

O S x

= == ∑ − = =250 10 25

25 10 18 10 1 8

/

. . ( ) / / .

B grubu için:

5.1110/11510/)25(..

2510/250

==−∑===

xSO

x

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Page 8: dağılım ölçüleri(fazlası için )

Varyans

• Verilerin aritmetik ortalamadan olan fark karelerinin aritmetik ortalaması varyans olarak adlandırılır.

• Varyans, fark kareleri toplamının serbestlik derecesi olan (n-1)'e bölünmesiyle bulunan bir değerdir. Yani fark karelerinin ortalamasıdır.

Page 9: dağılım ölçüleri(fazlası için )

• x, verileri ve n de veri sayısını göstermek üzere varyans değeri ,

Formülde geçen, n tane farktan (n-1) tanesi bağımsız olup 1 tanesi, toplamı sıfır yapacak şekilde bağımlı olarak değişir. Bu nedenle, aritmetik ortalama tanımına göre, fark kareleri toplamı n yerine serbest oluşan (n-1)'e bölünür.

(n-1)'in kullanılmasının başka bir nedeni de, toplum değerine göre daima küçük çıkan örnek varyansını büyülterek gerçek değere yaklaştırmaktır.

1

)( 22

−−

= ∑n

xxS i

Page 10: dağılım ölçüleri(fazlası için )

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

Örnek 6.3: B grubundaki verilerin varyans değerini bulalım.

5 -20 400 10 -15 225 15 -10 100 20 -5 25 22 -3 9 30 5 25 23 -2 4 27 2 4 28 3 9 70 45 2025

Toplam: 2826 n=10

Page 11: dağılım ölçüleri(fazlası için )

Standart Sapma • Varyansın karekökünün alınmış hali standart

sapmadır

• Standart sapma İstatistiki hesaplamalarda dağılım ölçüsü olarak kullanılır.

• Aynı ölçü birimine sahip grupların dağılımlarının karşılaştırılmasında önemli bir yeri olan standart sapma, normal dağılımdaki birimlerin dağılımını da oransal olarak belirleyen bir istatistiktir.

1

2

−−

= ∑n

)xx(s i

Page 12: dağılım ölçüleri(fazlası için )

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun Örnek 6.4: İki gruba ait standart sapma değerlerini bulalım. A grubu için:

, n=10

B grubu için:

, n=10

Page 13: dağılım ölçüleri(fazlası için )

Sınıflandırılmış frekans tablosundan standart sapma değerlerinin

hesaplanması,

Sfu

fun

nC=

∑ − ∑

−⋅

22

1

( )

f : frekans

u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama

n : veri sayısı

C : sınıf aralığı

Page 14: dağılım ölçüleri(fazlası için )

Örnek: Sınıflandırılmış frekans tablosundan standart sapma değerlerini bulalım.

fu = -12, fu²=1256, n=100, C=2

S =− −

⋅ =1256

12100

992 7 1

2( )

.

Sfu

fun

nC=

∑ − ∑

−⋅

22

1

( )

f : frekans

u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama

n : veri sayısı

C : sınıf aralığı

Page 15: dağılım ölçüleri(fazlası için )

Değişme Katsayısı • Standart sapma değerleri, ölçü birimi aynı olan

dağılımların karşılaştırılmasında iyi bir istatistiktir.

• Değişik ölçü birimlerine sahip dağılımların karşılaştırılmasında kullanılamaz.

• Bir grup insanın kan basıncı değerleri dağılımı ile nabız sayısı değerleri dağılımı D.K. ile karşılaştırılabilir

• Standart sapma değeri grupların aritmetik ortalamalarına göre orantılı olarak değişkenlik gösteriyorsa, karşılaştırma için standart sapma kullanılması hatalı sonuç verir.

Page 16: dağılım ölçüleri(fazlası için )

• Bir grubun standart sapmasının aritmetik ortalamasına göre yüzde değeri, değişme katsayısı olarak adlandırılır

• Değişme katsayısının başka bir yararı, verilerin sonuca olan etkilerinin güvenilirliği hakkında karar vermededir.

• Verilerin değişme katsayısı ne kadar küçük olursa, bunlardan elde edilecek sonuç da o denli güvenilir olur.

• Sağlık bilimlerindeki veriler için D.K.<10 olması, gerçeği tahmin bakımından çok iyidir.

• D.K. 30'dan büyük olduğu zaman doğruyu tahmin etme derecesi kötüdür.

• Bu değer 10-20 arası için normal ve 20 - 30 arası için kritik olarak kabul edilir.

D KS

A O. .

. .= ⋅100

Page 17: dağılım ölçüleri(fazlası için )

Örnek 6.6: iki gruba ait değişme katsayılarını bulalım.

xA = 25, SA = 2.3, xB = 25, SB = 17.7

A grubu için, D K. ..

% .= ⋅ =2 3

25100 9 2

B grubu için, D K. ..

% .= ⋅ =17 7

25100 70 8

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Page 18: dağılım ölçüleri(fazlası için )

Kuartil Sapma • Aritmetik ortalama yerine ortanca değerin kullanıldığı dağılımlar için

geçerli olan bir dağılım ölçüsüdür. • Üçüncü ve birinci çeyrek değerleri farkının ikiye bölünmesiyle

bulunur.

K SÇ Ç

. .= −3 1

2

Page 19: dağılım ölçüleri(fazlası için )

Örnek 6.7: Sınıflandırılmış frekans tablosunda verilen verilerin kuartil sapma değerlerini bulalım.

Ç1=25.7 ve Ç3=36 olarak bulunmuşlardı

K S. ..

.= − =36 25 7

25 15

Page 20: dağılım ölçüleri(fazlası için )

Standart Hata

• Ortalamalar bölümünde tanımları verilen aritmetik ortalama ve oran değerleri, örnekten bulunan istatistik değerleri olup, ait oldukları örneğin alındığı toplumdaki aritmetik ortalama (µ ) ve oranın (P) tahmini değerleridir.

• Çeşitli etkenlere bağlı olarak, örnekten bulunan bu istatistik değerleri toplumdaki tahmini yapılacak parametre değerlerine tam eşit olmayıp bir sapma gösterirler. Ortaya çıkan sapmanın ölçüsü standart hata ile belirtilir.

• Standart hata, bir toplumdan seçilmiş örneklerden bulunan istatistik değerlerinin toplum parametresinden olan sapmalarının bir ölçüsüdür.

• Standart hata sıfır olduğu zaman, örnekten bulunan aritmetik ortalama ve oran değerleri toplumdaki parametre değerlerine eşit olurlar.

Page 21: dağılım ölçüleri(fazlası için )

• Standart hata sıfırdan farklı olduğu zaman, örnekteki değerin gerçek değere eşit olmadığı anlaşılır.

• Bu durumda, toplumdaki parametre değerinin belirli bir olasılıkla hangi değerler arasında bulunacağı hesaplanabilir.

• Bu nedenle, toplum parametrelerinin tahmininin yapılabilmesi için bir örnekten bulunan aritmetik ortalama ve oran değerinin önüne ± işareti ile birlikte onun standart hatası da verilir.

• Bu sayede toplum parametresinin belirli bir olasılıkla hangi aralıkta olacağı tahmin edilebilir.

Page 22: dağılım ölçüleri(fazlası için )

• Bir istatistiğin standart hatası, bir toplumdan n birimli çok sayıda seçilen örneğe ait istatistik değerlerinin oluşturduğu dağılımın standart sapması olarak tanımlanır.

• İstatistik değeri eğer aritmetik ortalama ise, standart hata aritmetik ortalamaya ve istatistik değeri eğer oran ise o zaman da standart hata orana ait olur.

• Standart hata, örnekteki birim sayısı arttıkça ve örneğin standart sapması azaldıkça azalır, aksi halde artar.

Page 23: dağılım ölçüleri(fazlası için )

• Bir toplumdan seçilen örneklerin istatistik değerlerinin dağılımı örnekteki birim sayısına göre değişir.

• Değişim, dağılımın standart sapmasında ve aynı zamanda standart hata değerinde olur.

• n büyüdükçe dağılım sivrileşir ve standart hata değeri küçülür. Aksi olduğunda dağılım basıklaşır ve standart hata değeri büyür.

• Belirsiz toplumlarda n =∞ ve belirli toplumlarda n = N durumunda standart hata sıfır ve örneğin istatistik değerleri de toplum parametrelerine eşit olurlar.

Page 24: dağılım ölçüleri(fazlası için )

• Örnekten bulunan her istatistik değerinin bir standart hatası vardır.

• Toplumdaki parametre değerlerini tahmin bakımından bu hata değerlerinin, istatistik değeri ile birlikte verilmeleri çok uygun olur.

• Aritmetik ortalama ve oran için bu hataları gösterme işi,

x SH x± ve P

SHP ˆˆ ±

Page 25: dağılım ölçüleri(fazlası için )
Page 26: dağılım ölçüleri(fazlası için )

Örnek Ortalamalarının Standart Hatası

Bir toplumdan seçilen n birimli örneklerin

aritmetik ortalamalarının dağılımının standart sapmasının,

n büyüdükçe σ/ n değerine yaklaşmaktadır

Bu nedenle aritmetik ortalamanın standart hatası,

SHn

x = σ

σ : Topluma ait standart sapma

n : Örnekteki birim sayısı

Çoğu uygulamalarda toplumun standart sapması bilinemez.

Bunun yerine, standart hatayı bulurken

örnekten bulunan standart sapma (S) değeri kullanılır.

Page 27: dağılım ölçüleri(fazlası için )

ise

ya da

Örnekleme iadeli bir şekilde yapılmışsa,

aritmetik ortalamanın standart hatası

ise

Standart hata formülüne bir düzeltme faktörü

eklemek gerekir. Bu koşullarda standart hata,

Page 28: dağılım ölçüleri(fazlası için )

Örnek 6.8: 100 annenin yaşı için standart sapma S=7.1 , x = 30 26.

aritmetik ortalama değerinin standart hatasını bulalım.

Örneğin seçildiği toplumdaki anne sayısı bilinmediği için

düzeltme faktörü kullanılmadan standart hatayı bulmak zorundayız.

Formülde geçen σ yerine de örnekten bulunan

standart sapma değeri kullanılacaktır.

XSH

S

n− = = =

7 1

1000 71

..

Örnek 6.9: Örnek 6.8'de belirtilen örneğin,

bölgede yaşayan 800 anne arasından seçildiğini varsayalım.

Bu durumda n> (1/10) N olacağı için standart hatayı

düzeltme faktörünü ilave ederek bulalım.

XSH

S

n

N n

N− = ⋅ −

−= ⋅ ⋅ − =

1

7 1

100

800 100

7990 66.

Page 29: dağılım ölçüleri(fazlası için )

Örnek Oranlarının Standart Hatası

Belirli bir özelliği gösteren birimlerin oranının P olduğu

bir binomial toplumdan

n birimli çok sayıda örnekler alındığını varsayalım.

Bu örneklerdeki aynı özelliği gösteren birimlerin oranlarını da P̂ şeklinde belirtelim.

n≥30 durumunda ya da np, nq>5 durumunda P̂ 'lerin dağılımı bir normal dağılım olur.

Bu normal dağılım, ortalaması P

ve

standart sapması da pq n/ 'e yaklaşır.

Page 30: dağılım ölçüleri(fazlası için )

Dağılımın standart sapması o dağılımı oluşturan istatistik değerinin standart hatası olduğuna göre,

örnek oranı P̂ 'nin standart hatası,

pqn

pqSH p

−=

=

1

ˆ

n≥(1/10)N durumunda, düzeltme faktörü ilave edilerek hesaplama yapmak gerekir.

1ˆ −−⋅=

N

nN

n

pqSH p

Formülde geçen p, topluma ait bir orandır. Bu bilinmediği zaman yerine örnekten bulunan oran kullanılır.

Page 31: dağılım ölçüleri(fazlası için )

Örnek 6.10: Bir ilçeden seçilen 2000 kişilik bir örnekte tüberkülozluların sayısı 10 olarak bulunuyor.

a) İlçe nüfusu belli olmadığına göre,

b) İlçe nüfusu 18000 olduğuna göre,

örnekten bulunan oranın standart hata değerlerini bulalım.

a) P̂ =10/2000=0.005, n=2000, q=1-0.005= 0.995

0016.02000

995.0005.0SH

=×=

b) N=18000 ve n>(1/10) N olduğuna göre,

0015.0118000

200018000

2000

995.0005.0SH P̂

=−

−⋅×=