Upload
wwwtipfakultesi-org
View
797
Download
0
Embed Size (px)
Citation preview
6 DAĞILIM ÖLÇÜLERİ
Dağılım• Toplum ya da bir örnek grubu içindeki verilerin değerlerini
tanımlamak için ortalamalar kullanılır.
• Verilerin dağılımı hakkında bilgi sahibi olunurken ortalamalar yalnız başlarına yeterli olamazlar.
• Ortalamalar yalnız verilerin yığılım yaptıkları yeri gösterirler. • Yığılma noktasına olan uzaklıklar ve yığılma derecesi hakkında bir
bilgi veremezler.
• Yığılmaya ilişkin bilgileri ölçmek için dağılım ölçüleri adı verilen ayrı ölçüler kullanılmaktadır.
• örneklerden elde edilen veriler aynı değere eşit olmayıp grubun aritmetik ortalaması etrafında bir dağılım gösterirler.
• Verilerden söz edilirken, onların aritmetik ortalaması ile birlikte dağılımının da bilinmesinde yarar vardır.
• Her iki grupta aritmetik ortalama 25 yıldır. Ortalamalara bakarak gruplar hakkında karar vermek yanıltıcı olur.
• Yaş ortalaması ikisinde de eşit olmasına karşın A grubunda yaş 22-29 arası değişirken diğerinde 5-70 aralığına yayılmıştır.
• Dağılımın fazla olması, hatayı artırmasından dolayı istenmeyen bir etkendir.
• Bir gruptaki dağılımı ölçmek için değişik dağılım ölçüleri kullanılmaktadır.
• Bunlar dağılım aralığı, ortalama sapma, variyans, standart sapma, değişme katsayısı ve kuartil sapmadır.
Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,
A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
şeklinde olsun
Dağılım Aralığı• Verilerin dağıldığı aralığın büyüklüğünü
gösteren bir dağılım ölçüsüdür. • Yalnız iki uç değere göre hesaplanır. Diğer
verilerin bir katkısı olmaz. • Aşırı uçlardan etkilendiği ve yalnız uç
değerlere göre hesaplandığı için kaba bir ölçüdür. Bu nedenle, gerçek dağılımı belirleyemez.
• Gruptaki en büyük değerden en küçük değerin çıkarılmasıyla bulunur.
• Dağılım aralığı,
A grubu için 29-22= 7
B grubu için 70-5= 65
Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,
A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
şeklinde olsun
Ortalama Sapma • Gruptaki verilerin hepsinin katkısıyla bulunan bir
dağılım ölçüsüdür.
• Verilerin aritmetik ortalamadan olan sapmalarının mutlak büyüklüklerinin aritmetik ortalaması olarak tanımlanır.
• Verilerin aritmetik ortalamadan olan farkları toplamı sıfır olduğu için farkların mutlak değerleri alınmaktadır.
• n, veri sayısını ve x de verileri göstermek üzere ortalama sapma
O Sx x
n. .=
−∑
Örnek 6.2: A ve B grubundaki verilerin O.S. değerlerini bulalım.
A grubu için:
x
O S x
= == ∑ − = =250 10 25
25 10 18 10 1 8
/
. . ( ) / / .
B grubu için:
5.1110/11510/)25(..
2510/250
==−∑===
xSO
x
Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,
A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
şeklinde olsun
Varyans
• Verilerin aritmetik ortalamadan olan fark karelerinin aritmetik ortalaması varyans olarak adlandırılır.
• Varyans, fark kareleri toplamının serbestlik derecesi olan (n-1)'e bölünmesiyle bulunan bir değerdir. Yani fark karelerinin ortalamasıdır.
• x, verileri ve n de veri sayısını göstermek üzere varyans değeri ,
Formülde geçen, n tane farktan (n-1) tanesi bağımsız olup 1 tanesi, toplamı sıfır yapacak şekilde bağımlı olarak değişir. Bu nedenle, aritmetik ortalama tanımına göre, fark kareleri toplamı n yerine serbest oluşan (n-1)'e bölünür.
(n-1)'in kullanılmasının başka bir nedeni de, toplum değerine göre daima küçük çıkan örnek varyansını büyülterek gerçek değere yaklaştırmaktır.
1
)( 22
−−
= ∑n
xxS i
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
Örnek 6.3: B grubundaki verilerin varyans değerini bulalım.
5 -20 400 10 -15 225 15 -10 100 20 -5 25 22 -3 9 30 5 25 23 -2 4 27 2 4 28 3 9 70 45 2025
Toplam: 2826 n=10
Standart Sapma • Varyansın karekökünün alınmış hali standart
sapmadır
• Standart sapma İstatistiki hesaplamalarda dağılım ölçüsü olarak kullanılır.
• Aynı ölçü birimine sahip grupların dağılımlarının karşılaştırılmasında önemli bir yeri olan standart sapma, normal dağılımdaki birimlerin dağılımını da oransal olarak belirleyen bir istatistiktir.
1
2
−−
= ∑n
)xx(s i
Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,
A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
şeklinde olsun Örnek 6.4: İki gruba ait standart sapma değerlerini bulalım. A grubu için:
, n=10
B grubu için:
, n=10
Sınıflandırılmış frekans tablosundan standart sapma değerlerinin
hesaplanması,
Sfu
fun
nC=
∑ − ∑
−⋅
22
1
( )
f : frekans
u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama
n : veri sayısı
C : sınıf aralığı
Örnek: Sınıflandırılmış frekans tablosundan standart sapma değerlerini bulalım.
fu = -12, fu²=1256, n=100, C=2
S =− −
⋅ =1256
12100
992 7 1
2( )
.
Sfu
fun
nC=
∑ − ∑
−⋅
22
1
( )
f : frekans
u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama
n : veri sayısı
C : sınıf aralığı
Değişme Katsayısı • Standart sapma değerleri, ölçü birimi aynı olan
dağılımların karşılaştırılmasında iyi bir istatistiktir.
• Değişik ölçü birimlerine sahip dağılımların karşılaştırılmasında kullanılamaz.
• Bir grup insanın kan basıncı değerleri dağılımı ile nabız sayısı değerleri dağılımı D.K. ile karşılaştırılabilir
• Standart sapma değeri grupların aritmetik ortalamalarına göre orantılı olarak değişkenlik gösteriyorsa, karşılaştırma için standart sapma kullanılması hatalı sonuç verir.
• Bir grubun standart sapmasının aritmetik ortalamasına göre yüzde değeri, değişme katsayısı olarak adlandırılır
• Değişme katsayısının başka bir yararı, verilerin sonuca olan etkilerinin güvenilirliği hakkında karar vermededir.
• Verilerin değişme katsayısı ne kadar küçük olursa, bunlardan elde edilecek sonuç da o denli güvenilir olur.
• Sağlık bilimlerindeki veriler için D.K.<10 olması, gerçeği tahmin bakımından çok iyidir.
• D.K. 30'dan büyük olduğu zaman doğruyu tahmin etme derecesi kötüdür.
• Bu değer 10-20 arası için normal ve 20 - 30 arası için kritik olarak kabul edilir.
D KS
A O. .
. .= ⋅100
Örnek 6.6: iki gruba ait değişme katsayılarını bulalım.
xA = 25, SA = 2.3, xB = 25, SB = 17.7
A grubu için, D K. ..
% .= ⋅ =2 3
25100 9 2
B grubu için, D K. ..
% .= ⋅ =17 7
25100 70 8
Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,
A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25
B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25
şeklinde olsun
Kuartil Sapma • Aritmetik ortalama yerine ortanca değerin kullanıldığı dağılımlar için
geçerli olan bir dağılım ölçüsüdür. • Üçüncü ve birinci çeyrek değerleri farkının ikiye bölünmesiyle
bulunur.
K SÇ Ç
. .= −3 1
2
Örnek 6.7: Sınıflandırılmış frekans tablosunda verilen verilerin kuartil sapma değerlerini bulalım.
Ç1=25.7 ve Ç3=36 olarak bulunmuşlardı
K S. ..
.= − =36 25 7
25 15
Standart Hata
• Ortalamalar bölümünde tanımları verilen aritmetik ortalama ve oran değerleri, örnekten bulunan istatistik değerleri olup, ait oldukları örneğin alındığı toplumdaki aritmetik ortalama (µ ) ve oranın (P) tahmini değerleridir.
• Çeşitli etkenlere bağlı olarak, örnekten bulunan bu istatistik değerleri toplumdaki tahmini yapılacak parametre değerlerine tam eşit olmayıp bir sapma gösterirler. Ortaya çıkan sapmanın ölçüsü standart hata ile belirtilir.
• Standart hata, bir toplumdan seçilmiş örneklerden bulunan istatistik değerlerinin toplum parametresinden olan sapmalarının bir ölçüsüdür.
• Standart hata sıfır olduğu zaman, örnekten bulunan aritmetik ortalama ve oran değerleri toplumdaki parametre değerlerine eşit olurlar.
• Standart hata sıfırdan farklı olduğu zaman, örnekteki değerin gerçek değere eşit olmadığı anlaşılır.
• Bu durumda, toplumdaki parametre değerinin belirli bir olasılıkla hangi değerler arasında bulunacağı hesaplanabilir.
• Bu nedenle, toplum parametrelerinin tahmininin yapılabilmesi için bir örnekten bulunan aritmetik ortalama ve oran değerinin önüne ± işareti ile birlikte onun standart hatası da verilir.
• Bu sayede toplum parametresinin belirli bir olasılıkla hangi aralıkta olacağı tahmin edilebilir.
• Bir istatistiğin standart hatası, bir toplumdan n birimli çok sayıda seçilen örneğe ait istatistik değerlerinin oluşturduğu dağılımın standart sapması olarak tanımlanır.
• İstatistik değeri eğer aritmetik ortalama ise, standart hata aritmetik ortalamaya ve istatistik değeri eğer oran ise o zaman da standart hata orana ait olur.
• Standart hata, örnekteki birim sayısı arttıkça ve örneğin standart sapması azaldıkça azalır, aksi halde artar.
• Bir toplumdan seçilen örneklerin istatistik değerlerinin dağılımı örnekteki birim sayısına göre değişir.
• Değişim, dağılımın standart sapmasında ve aynı zamanda standart hata değerinde olur.
• n büyüdükçe dağılım sivrileşir ve standart hata değeri küçülür. Aksi olduğunda dağılım basıklaşır ve standart hata değeri büyür.
• Belirsiz toplumlarda n =∞ ve belirli toplumlarda n = N durumunda standart hata sıfır ve örneğin istatistik değerleri de toplum parametrelerine eşit olurlar.
• Örnekten bulunan her istatistik değerinin bir standart hatası vardır.
• Toplumdaki parametre değerlerini tahmin bakımından bu hata değerlerinin, istatistik değeri ile birlikte verilmeleri çok uygun olur.
• Aritmetik ortalama ve oran için bu hataları gösterme işi,
x SH x± ve P
SHP ˆˆ ±
Örnek Ortalamalarının Standart Hatası
Bir toplumdan seçilen n birimli örneklerin
aritmetik ortalamalarının dağılımının standart sapmasının,
n büyüdükçe σ/ n değerine yaklaşmaktadır
Bu nedenle aritmetik ortalamanın standart hatası,
SHn
x = σ
σ : Topluma ait standart sapma
n : Örnekteki birim sayısı
Çoğu uygulamalarda toplumun standart sapması bilinemez.
Bunun yerine, standart hatayı bulurken
örnekten bulunan standart sapma (S) değeri kullanılır.
ise
ya da
Örnekleme iadeli bir şekilde yapılmışsa,
aritmetik ortalamanın standart hatası
ise
Standart hata formülüne bir düzeltme faktörü
eklemek gerekir. Bu koşullarda standart hata,
Örnek 6.8: 100 annenin yaşı için standart sapma S=7.1 , x = 30 26.
aritmetik ortalama değerinin standart hatasını bulalım.
Örneğin seçildiği toplumdaki anne sayısı bilinmediği için
düzeltme faktörü kullanılmadan standart hatayı bulmak zorundayız.
Formülde geçen σ yerine de örnekten bulunan
standart sapma değeri kullanılacaktır.
XSH
S
n− = = =
7 1
1000 71
..
Örnek 6.9: Örnek 6.8'de belirtilen örneğin,
bölgede yaşayan 800 anne arasından seçildiğini varsayalım.
Bu durumda n> (1/10) N olacağı için standart hatayı
düzeltme faktörünü ilave ederek bulalım.
XSH
S
n
N n
N− = ⋅ −
−= ⋅ ⋅ − =
1
7 1
100
800 100
7990 66.
Örnek Oranlarının Standart Hatası
Belirli bir özelliği gösteren birimlerin oranının P olduğu
bir binomial toplumdan
n birimli çok sayıda örnekler alındığını varsayalım.
Bu örneklerdeki aynı özelliği gösteren birimlerin oranlarını da P̂ şeklinde belirtelim.
n≥30 durumunda ya da np, nq>5 durumunda P̂ 'lerin dağılımı bir normal dağılım olur.
Bu normal dağılım, ortalaması P
ve
standart sapması da pq n/ 'e yaklaşır.
Dağılımın standart sapması o dağılımı oluşturan istatistik değerinin standart hatası olduğuna göre,
örnek oranı P̂ 'nin standart hatası,
pqn
pqSH p
−=
=
1
ˆ
n≥(1/10)N durumunda, düzeltme faktörü ilave edilerek hesaplama yapmak gerekir.
1ˆ −−⋅=
N
nN
n
pqSH p
Formülde geçen p, topluma ait bir orandır. Bu bilinmediği zaman yerine örnekten bulunan oran kullanılır.
Örnek 6.10: Bir ilçeden seçilen 2000 kişilik bir örnekte tüberkülozluların sayısı 10 olarak bulunuyor.
a) İlçe nüfusu belli olmadığına göre,
b) İlçe nüfusu 18000 olduğuna göre,
örnekten bulunan oranın standart hata değerlerini bulalım.
a) P̂ =10/2000=0.005, n=2000, q=1-0.005= 0.995
0016.02000
995.0005.0SH
P̂
=×=
b) N=18000 ve n>(1/10) N olduğuna göre,
0015.0118000
200018000
2000
995.0005.0SH P̂
=−
−⋅×=