Upload
others
View
13
Download
2
Embed Size (px)
Citation preview
Biyoistatistiğin Tanımı Biyoistatistikte Kullanılan Terimler Değişken Tipleri Parametre ve İstatistik Tanımlayıcı İstatistikler
Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı
Biyoistatistiğin Tanımı
İstatistik, toplumdan kurallara uygun olarak,
rastgele bir mekanizma içerisinde, doğru ve yeterli
sayıda veri toplama, veri işleme ve verilerden
topluma ilişkin çıkarsamalar yapmaya yönelik
yöntemler içeren ve geliştiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
İstatistik bilimi iki ana bölüme ayrılır:
• Matematiksel İstatistik
• Uygulamalı İstatistik
Biyoistatistiğin Tanımı
Matematiksel istatistik,
istatistik teorisini kuran, istatistiksel çıkarsamalar
için yeni yöntemler geliştiren ve soyut matematik
bilgisi gerektiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
Uygulamalı istatistik,
matematiksel istatistiğin geliştirdiği teknikleri çeşitli
alanlara uygulayan (örneğin biyoloji, ekonomi,
eğitim, sağlık eczacılık vb.), işleyişlerini kontrol
eden ve uygulama alanlarına özgü yeni teknikler
geliştiren bir istatistik bilim dalıdır.
Biyoistatistiğin Tanımı
Biyoistatistik,
uygulamalı bir istatistik dalı olup, istatistiksel
tekniklerin tıp ve sağlık bilimlerinde uygulamalarını
ve bu alanlara özgü olarak geliştirilen yöntemleri
içeren ve aynı zamanda da bu alanlara has yeni
teknikler geliştiren bir bilim dalıdır.
Biyoistatistiğin Tanımı
Genel olarak istatistik iki şekilde tanımlanır.
• Tanımlayıcı (Descriptive) istatistik
• Çıkarsamalı (Inferential) istatistik
Biyoistatistiğin Tanımı
Tanımlayıcı istatistik,
çalışma yapılan toplumu tanıtan, örnek birimlerden
elde edilen verileri özetleyen, değişkenler hakkında
tanımlayıcı bilgiler veren istatistiksel yöntemleri
içerir. Kesinlikle toplum hakkında herhangi bir
karara ya da genellemeye gitmemizi sağlamaz.
Biyoistatistiğin Tanımı
Çıkarsamalı istatistik,
topluma ilişkin tahminlerde bulunulması, uygun
kararların alınması ve topluma ilişkin genellemelere
gidilmesi ile ilgilidir. Çıkarsamalı istatistik yöntemler
genel olarak parametrelere ilişkin tahminleme
yöntemleri ile istatistiksel hipotez testleridir.
Biyoistatistikte Kullanılan Terimler
Olay: Toplumdaki birimlerde ortaya çıkan ve
üzerinde çalışmalar yapmak gereği duyulan
oluşumlara olay denir.
Biyoistatistikte Kullanılan Terimler
İstatistiksel Olay: Araştırmaya, incelemeye konu
teşkil eden, gözlenebilen, deneysel olarak varlığı
kanıtlanabilen ve sayılarak, ölçülerek sayısal
biçimde ifade edilebilen olaya istatistiksel olay
denir.
Biyoistatistikte Kullanılan Terimler
Toplum (Popülasyon, Anakütle, Evren): İstatistiksel
olayın gözlendiği, gözlenebildiği birimler
topluluğuna toplum denir. Toplumdaki birim sayısı
büyük “N” harfi ile gösterilir.
Biyoistatistikte Kullanılan Terimler
Birim: İncelenen olayın gözlendiği en küçük toplum
parçasına, toplum ögesine birim denir.
Gözlem: Birimlerin gözlemlenmesi sonucunda
incelenen özelliklerinin sayısal değerine gözlem
denir.
Biyoistatistikte Kullanılan Terimler
Örnek: Toplumu temsil edebilecek özellikte ve
sayıda olan, örnekleme yöntemleri ile elde edilmiş
toplumun bir parçasına örnek denir. Örnekteki
birim sayısı küçük “n” harfi ile gösterilir.
Değişken ve Değişken Tipleri
Değişken: Birimlerin incelenen ve gözlenebilen
özelliklerine değişken denir. Birimden birime farklı
değerler alır.
Örneğin boy uzunluğu bir değişkendir. Sağlıklı 20
erkek birey içeren bir örnekte tüm birimlerin boy
uzunluğunun aynı olması beklenemez.
Değişken ve Değişken Tipleri
Değişkenler özelliklerine göre çeşitli biçimlerde
sınıflandırılırlar.
Gözlenme biçimlerine göre nitel ve nicel,
ölçümleme tekniklerine göre isimsel, sıralı, aralıklı
ve oransal, ölçülen değerlerin matematiksel
durumuna göre ise kesikli ve sürekli olarak
sınıflandırılırlar.
Değişken ve Değişken Tipleri
Nitel Değişkenler: Birimlerin kategorik ya da isimsel
olarak belirtilebilen karakteristik özelliklerini,
durumlarını ve pozisyonlarını belirten
değişkenlerdir.
Örneğin, birimlerin cinsiyeti, kan grubu, eğitim
durumu, geçirmiş olduğu hastalıkların türleri,
hastalık şiddeti, tedavi sonuçları vb.
Değişken ve Değişken Tipleri
Nicel Değişkenler: Değerleri ölçüm sonucu
saptanan, sayısal olarak gözlenebilen
değişkenlerdir.
Örneğin birimlerin, boy uzunluğu, vücut ağırlıkları,
kan basınçları, kolesterol düzeyleri gibi özellikleri
nicel değişkenlerdir.
Değişken ve Değişken Tipleri
İsimsel Değişkenler: İncelenen değişkenin değeri
isimsel olarak seçenekler halinde saptanıyorsa bu
değişkene isimsel ölçekli değişken, elde edilen
veriye ise isimsel veri denir. Örneğin birimlerin
cinsiyeti, medeni durumu, geçirdiği hastalıklar vb.
Değişken ve Değişken Tipleri
Sıralı Değişkenler: Değişkenin değerleri isimsel ve
birbirlerini ardışık olarak artan biçimde izleyen
değerler içeriyorsa bu değişkene sıralı ölçekli
değişken, elde edilen veriye ise sıralı veri denir.
İsimsel kategoriler arasında bir hiyerarşi söz
konusudur. Örneğin hastalığın düzeyi evre I, evre II,
evre III ve evre IV, ağrı şiddeti yok, az, orta, çok gibi.
Değişken ve Değişken Tipleri
Aralıklı Değişkenler: Dünyaca kabul edilmiş bir
başlangıç noktası olmayan, ölçüm sonucu değeri
sayısal olarak gözlemlenen ve kat ya da oran hesabı
yapılamayan nicel değişkene aralıklı ölçekli
değişken, elde edilen veriye ise aralıklı veri denir.
Değişken ve Değişken Tipleri
Örneğin sıcaklık birimi santigrat derece bir aralıklı
ölçektir. Örneğin bir odanın sıcaklığını ölçelim.
Sıcaklığı santigrat ile ölçelim ve 25 santigrat derece
olsun. Aynı odayı Fahrenhayt ile ölçtüğümüzde 77
Fahrenhayt olarak belirleriz.
Değişken ve Değişken Tipleri
Odayı ısıtalım ve sıcaklığı 50 santigrat dereceye
yükseltelim. Bu defa bu odanın sıcaklığını
Fahrenhayt ile ölçtüğümüzde 122 Fahrenhayt
olarak belirleriz. Halbuki sıcaklığı santigrat olarak 2
katına çıkardığımızda Fahrenhayt olarak 2 kat bir
sıcaklık ölçemedik.
Değişken ve Değişken Tipleri
Oransal Değişken: Değişkenin değeri uluslararası
ölçü birimlerinden uygun bir ölçekle elde
ediliyorsa, dünyaca kabul edilmiş bir sıfır
(başlangıç) noktası varsa ve sayısal olarak
gözlemleniyorsa bu değişkene oransal ölçekli
değişken denir ve elde edilen veriye ise oransal veri
denir. Kat ve oran hesabı yapılabilen bir ölçektir.
Değişken ve Değişken Tipleri
Kesikli Değişken: Değerler seti içinde sadece
tamsayı değerler alabilen değişkenlerdir. Çocuk
sayısı, dakikada nabız atım sayısı vb.
Sürekli Değişken: Değerler seti içinde her türlü
değeri alabilen (tamsayı ve kesirli) değişkenlerdir.
Boy uzunluğu, ağırlık, yaş, sistolik kan basıncı,
kreatinin değeri vb.
Değişken ve Değişken Tipleri
Bağımlı Değişken: İncelenen bir olayda değeri
başka değişkenlerce belirlenebilen ve dışsal
faktörlerden etkilenerek değer alan değişkenlerdir.
Bağımsız Değişken: İncelenen bir olayda değeri
rasgele oluşan, başka değişkenlerin üzerinde etkili
olan değişkendir.
Değişken ve Değişken Tipleri
Bağımlı ve bağımsız değişken tanımlarında
“incelenen bir olayda” ifadesini vurgulamak gerekir
çünkü bir değişken incelenen olayın özelliklerine
göre bağımlı ya da bağımsız değişken olabilir.
Değişken ve Değişken Tipleri
Veri: İki ya da daha fazla birimden elde edilmiş ve
kaydedilmiş bir ya da daha fazla değişkenin
değerlerinin rakamlar setine veri denir.
Frekans (sıklık): Bir değişkenin belli bir değerinin ya
da belli bir değer aralığının gözlendiği birim
sayısıdır.
Parametre ve İstatistik
Parametre: İncelenen değişkenin toplumdaki tipik
değeridir. Parametre hesaplanan sayısal değerdir.
İstatistik: n sayıda birimden oluşan örnekten elde
edilen verilerden hesaplanmış değerdir. İstatistik
parametrenin bir tahmincisidir.
Parametre ve İstatistik
Parametre İstatistik
x
S
r
Tanımlayıcı İstatistikler
Elde edilen veri seti ile ilgili olarak yapılacak ilk
adım veri setini tanımlamak ve özetlemektir. Küçük
veri setlerinde bu adım, tüm veri seti içindeki
değişkenler ve değişkenlere ait ölçümler
listelenerek gerçekleştirebilir. Genelde bu işlem
uzun sürer ve etkili bir yaklaşım değildir. Ayrıca
büyük veri setleri içinde bu işlem imkansız olabilir.
Tanımlayıcı İstatistikler
Çeşitli değişkenlere ait verileri özetleyen, birimlerin
yığıldıkları tipik değerleri ve bu değerler etrafındaki
yayılımlarını, dağılımlarını gösteren, birimlere ait
değişkenler hakkında genel olarak bilgi veren ve bu
değişkenleri tanımlayan istatistiklere tanımlayıcı
istatistikler (descriptive statistics) denir.
Tanımlayıcı İstatistikler
Özetle, eldeki mevcut veri setini nümerik
yöntemler ile özetleyen, tanımlayan istatistiklere
tanımlayıcı istatistikler denir.
iki kategoride yer alır.
• Merkezi eğilim ölçüleri
• Dağılım ölçüleri
Merkezi Eğilim Ölçüleri
Verilerin hangi değerlerde yığıldığını, toplandığını
gösteren, birimlerin genel eğilimlerinin hangi
değerlere doğru olduğunu belirten, veri setinin
merkezi noktalarının neler olduğunu bildiren
istatistiklerdir.
Merkezi Eğilim Ölçüleri Ortalama
Nicel veri setlerinde birimlerin toplandığı kabul
edilen merkezi tipik değere ortalama denir. Veri
setindeki değerler kümesinin ağırlık noktasını
gösterir. Hesaplamada değerlerin kullanım
biçimlerine göre en sık kullanılan üç farklı tipi
vardır.
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
En sık kullanılan ortalama türüdür. Tüm gözlem
değerlerinin toplamının birim sayısına
bölünmesiyle elde edilir. Genel olarak değişken ismi
üzeri çizgi ile gösterilir.
ZYX ,,
n
XXX
n
X
X n
n
i
i
...211
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı
kadına ait FEV1 (Forced Expiratory Volume in One
Second) (litre) değerleri ölçülmüş ve 2.82 2.78 2.88
2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde
edilmiştir. FEV1 değeri aşağıdaki gibi hesaplanır.
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
FEV1 değerlerinin aritmetik ortalaması aşağıdaki
gibi hesaplanır.
10
87.280.286.280.276.291.270.288.278.282.21
FEVX
818.210
18.281
FEV
X
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
•
•
•
xnxn
i i 1
01
n
i i xx
n
i i ax1
2 İfadesi a= olduğunda en
küçük olur.
x
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
Aritmetik ortalamanın zayıf yönü aşırı uç değerlere
oldukça duyarlıdır. Örneğin aşağıda yer alan verileri
düşünelim.
1 1 2 4 5 7 8 9 12 12 13 130
Merkezi Eğilim Ölçüleri Aritmetik Ortalama
Aritmetik Ortalamanın Özellikleri:
1 1 2 4 5 7 8 9 12 12 13 130
aritmetik ortalama 17 olarak elde edilmiştir. Ancak
12 veriden 11 tanesi hesaplanan aritmetik
ortalama değerinden küçüktür. Buda bize
hesaplanan değerin eldeki mevcut verilerin merkezi
olmadığını göstermektedir.
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Veri setindeki değerler artan ya da azalan bir diziyi
izliyorsa ya da değişim oranlarının (yüzde, oran gibi)
değerler içeriyorsa bu durumda geometrik
ortalama hesaplanır.
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Veri setindeki değerlerin çarpımlarının birim sayısı
cinsinden kökünün alınması ile ya da verilerin
logaritmalarının toplamının birim sayısına
bölünmesi ve hesaplanan logaritmik ortalamanın
anti logaritmasının alınması ile hesaplanır.
Merkezi Eğilim Ölçüleri Geometrik Ortalama
nn
n
n
i
iG XXXXX
...21
1
n
X
antiX
n
i
i
G1
)log(
log
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Örnek: Bir bölgede son 10 yıla ait hava kirliliği
ölçümünde kullanılan SO2 (kükürtdioksit) (µg/m3)
değerleri 3, 7, 8, 10, 12, 14, 16, 18, 22, 24 olarak
ölçülmüştür. Son 10 yılın ortalama SO2 değeri
nedir?
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Veri seti incelendiğinde artan bir eğilim
gözlenmektedir. Bu durumda geometrik ortalama
hesaplamak daha uygun olacaktır.
5682.1124...7310
)2(
SOGX
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Geometrik ortalama sürekli artan ya da azalan
yapıda çarpık dağılıma sahip verilerde kullanılır
çünkü aritmetik ortalama çarpık dağılımlarda
merkezden uzaklaşmakta ve aşırı uçlardan
etkilenmektedir.
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Gözlem sonuçları arasındaki oransal (nisbi) farkların
mutlak farklardan daha önemli olduğu durumlarda
kullanılır. Gözlem sonuçlarının her biri bir önceki
gözlem sonucuna bağlı olarak değişiyorsa ve bu
değişimin hızı saptanmak isteniyorsa geometrik
ortalama sağlıklı sonuçlar verir.
Merkezi Eğilim Ölçüleri Geometrik Ortalama
Geometrik Ortalamanın Özellikleri:
Geometrik ortalama pozitif değer içeren veri
setlerinde kullanılır çünkü sıfırın ve negatif sayıların
logaritması tanımsızdır.
Merkezi Eğilim Ölçüleri Harmonik Ortalama
Zamana bağlı hız, verimlilik gibi oransal değişimleri
gösteren verilere ait ortalama hesaplanmasında
kullanılır. Veri setindeki değerler bir zaman serisi,
eşit şartlarda yapılmış k sayıda deneyin sonuçları
gibi değerler içeriyor ise harmonik ortalama sağlıklı
sonuçlar verir.
Merkezi Eğilim Ölçüleri Harmonik Ortalama
Harmonik ortalama değerlerin çarpmaya göre
terslerinin ortalamasının tersidir. Aşağıdaki şekilde
hesaplanır.
n
n
i i
H
XXX
n
X
nX
1...
111
211
Merkezi Eğilim Ölçüleri Harmonik Ortalama
Örnek: Bir bölgede son bir yıl içerisinde üst
solunum yolu enfeksiyonundan dolayı sağlık
ocağına başvuran hasta sayısı aylara göre aşağıda
verilmiştir. Aylık verilere göre ortalama hasta sayısı
nedir?
Ocak Şubat Mart Nisan Mayıs Haziran Temmuz Ağustos Eylül Ekim Kasım Aralık
125 158 103 95 74 30 13 14 38 156 208 205
Merkezi Eğilim Ölçüleri Harmonik Ortalama
Ocak Şubat Mart Nisan Mayıs Haziran Temmuz Ağustos Eylül Ekim Kasım Aralık
125 158 103 95 74 30 13 14 38 156 208 205
0894.44
205
1...
158
1
125
1
12
H
X
Merkezi Eğilim Ölçüleri Harmonik Ortalama
Harmonik Ortalamanın Özellikleri:
Zamana bağlı hız, verimlilik gibi oransal değişimleri
gösteren verilere ait ortalama hesaplanmasında
kullanılır.
Harmonik ortalama sıfır içermeyen veri setlerinde
kullanılır çünkü sıfırın tersi tanımsızdır.
Merkezi Eğilim Ölçüleri Medyan
Aritmetik ortalamadan sonra en yaygın kullanılan
merkezi eğilim ölçüsü medyandır. Ortanca değer
olarak da adlandırılmaktadır.
Veri setini tam olarak iki eşit parçaya bölen
değerdir.
Merkezi Eğilim Ölçüleri Medyan
n birimlik bir örnekte veriler küçükten büyüğe
doğru sıralanmış olsun. Eğer n tek sayı ise medyan
[(n+1)/2]’inci sırada yer alan değerdir. Eğer n çift
sayı ise medyan [n/2]’ci ve [(n/2)+1]’ci değerlerin
ortalamasıdır.
Merkezi Eğilim Ölçüleri Medyan
Örnek: 7 yeni doğanın doğum ağırlıkları 3200,
3500, 3400, 3460, 3100, 7800, 2900 gram olarak
ölçülmüştür.
Bu ölçümlerin ortanca değeri kaçtır?
Merkezi Eğilim Ölçüleri Medyan
Öncelikle veriler küçükten büyüğe doğru sıralanır.
X[1]=2900, X[2]=3100, X[3]=3200, X[4]=3400,
X[5]=3460, X[6]=3500 ve X[7]=7800.
n=7 sayısı tek olduğundan
Medyan = X[(7+1)/2] = X[4] = 3400
şeklinde elde edilir.
Merkezi Eğilim Ölçüleri Medyan
Örnek: 6 yeni doğanın doğum ağırlıkları 3200,
3500, 3400, 3100, 7800, 2900 gram olarak
ölçülmüştür.
Bu ölçümlerin ortanca değeri kaçtır?
Merkezi Eğilim Ölçüleri Medyan
Öncelikle veriler küçükten büyüğe doğru sıralanır.
X[1]=2900, X[2]=3100, X[3]=3200, X[4]=3400,
X[5]=3500, ve X[6]=7800.
n=6 sayısı çift olduğundan
Medyan = (X[3]+X[4])/2 = (3200+3400)/2 = 3300
şeklinde elde edilir.
Merkezi Eğilim Ölçüleri Medyan
Medyanın Özellikleri:
Aşırı derecede tekrar etmeyen ölçümleri içeren
büyük veri setlerinde veri setinin yarısı medyan
değerinden küçük, diğer yarısı da medyan
değerinden büyük ölçümlere sahiptir. Ancak veri
seti aşırı derecede tekrar eden verileri içeriyorsa
yukarıdaki sonuç doğru olmaz.
Merkezi Eğilim Ölçüleri Medyan
Medyanın Özellikleri:
Örneğin 100 aileyi içeren bir örnekte 20 aile 2
kişiden, 40 aile 3 kişiden ve 40 ailede 4 kişiden
oluşuyorsa bu veri setine ait medyan değerini
hesaplayalım.
Gözlem 2 . . . 2 3 . . . 3 3 . . . 3 4 . . . 4
Sıra No 1 . . . 20 21 . . . 50 51 . . . 60 61 . . . 100
Merkezi Eğilim Ölçüleri Medyan
Medyanın Özellikleri:
Örnek büyüklüğü n=100 olduğundan medyan
değeri 50’ci ve 51’ci sırada yer alan değerlerin
ortalamasıdır. Bu durumda medyan değeri 3 olarak
hesaplanır. Ancak 3’den küçük veri sayısı sadece
20’dir. Bu durumda yukarıdaki sonuç yanlış olur.
Gözlem 2 . . . 2 3 . . . 3 3 . . . 3 4 . . . 4
Sıra No 1 . . . 20 21 . . . 50 51 . . . 60 61 . . . 100
Merkezi Eğilim Ölçüleri Medyan
Medyanın Özellikleri:
Medyan aşırı uç değerlerden etkilenmez. Bu özelliği
nedeniyle sapan değer içeren veri setlerinde
aritmetik ortalamaya göre tercih edilen bir merkezi
eğilim ölçüsüdür.
Merkezi Eğilim Ölçüleri Mod
Bir veri setinde en çok gözlemlenen, en çok tekrar
eden değere mod ya da tepe değeri denir. Bir
seride benzer sayıda tekrarlanan birden fazla değer
varsa o seriye çok tepeli seri denir.
Merkezi Eğilim Ölçüleri Mod
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise
bu veri setinin Mod=11 olarak elde edilir.
Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler
Dörttebirlikler: Büyüklük sırasına dizilmiş bir veri
setini dört eşit parçaya bölen istatistiklere
dörttebirlik denir. Dörttebirliklerin hesaplanması
ortanca değer hesaplanmasına benzer.
Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler
Birinci dörttebirlik Q1 ile gösterilir ve veri setinin ilk
çeyreğini yani %25. değerini belirtir. Q1=x[n/4] olarak
hesaplanır. İkinci dörttebirlik Q2 ile gösterilir yani
bu aynı zamanda ortanca değerdir ve veri setinin
%50. değerini gösterir. Üçüncü dörttebirilik Q3 ile
gösterilir ve veri setinin %75. değerini belirtir.
Q3=x[3n/4] olarak hesaplanır.
Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler
Yüzdebirlikler: Büyüklük sırasına dizilmiş bir veri
setini yüzdelik bölümlere ayıran istatistiklerdir. P(%)
olarak gösterilirler. Örneğin P(5) veri setinin %5.
değerini gösterir. Örneğin,
P(5)=x[5n/100], P(90)=x[90n/100], P(80)=x[80n/100] olarak
hesaplanır.
Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler
Dörttebirliklerin ve yüzdebirliklerin
hesaplanmasında farklı hesaplama yöntemleri
kullanılmaktadır.
Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler
En yaygın kullanılan hesaplama yöntemi aşağıdaki
gibidir. Hesaplanacak yüzdelik değeri p olsun. Bu
durumda pn/100=k değeri tam sayı ise p. yüzdelik
değeri (k). ve (k+1). sırada yer alan gözlemlerin
ortalamasıdır. Eğer pn/100=k değeri tam sayı değil
ise p. yüzdelik değeri [[k]]+1’inci sırada yer alan
gözlem değeridir.
Dağılım Ölçüleri
Bir değişkenin dağılımını, değerler aralığındaki
serpilmesini ve ortalama etrafında yayılışlarını,
belirli değerlerde yığılma eğilimlerini belirlemeye
yarayan belirtici istatistiklere dağılım ölçüleri adı
verilir.
Dağılım Ölçüleri
Dağılım ölçüleri, merkezi eğilim ölçülerini
destekleyen ve verilerin merkezi eğilim ölçüleri
etrafında yayılışlarını, dağılımlarını ve serpilmelerini
gösteren ölçülerdir.
Dağılım Ölçüleri Dağılım Aralığı
Dizideki en büyük ve en küçük değer arasındaki
farka dağılım aralığı denir. R ile gösterilir.
R = Xmax - Xmin şeklinde hesaplanır.
Dizideki değerlerin kabaca kaç birimlik yayılış
gösterdiğini belirtir.
Dağılım Ölçüleri Dağılım Aralığı
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise
bu veri setinin dağılım aralığı,R aşağıdaki gibi
hesaplanır.
R = Xmax – Xmin = 16 – 9 = 7
Dağılım Ölçüleri Dağılım Aralığı
Dağılım Aralığının Özellikleri:
Dağılım aralığı sadece en küçük ve en büyük değeri
hesaplamaya katar. Dolayısıyla sapan değerlerden
etkilenir. Örneğin veri setinde yer alan ölçümlerin
çoğu birbirine yakın değerler içeriyor ancak çok
büyük sadece bir ölçüm bile olsa dağılım aralığı
büyük çıkacak ve genel dağılımı yansıtmayacaktır.
Dağılım Ölçüleri Dağılım Aralığı
Dağılım Aralığının Özellikleri:
Dağılım aralığı veri setinin örnek büyüklüğünden
etkilenmektedir. Örnek büyüklüğü arttıkça dağılım
aralığı da artma eğilimi göstermektedir.
Dağılım Ölçüleri Çeyrekler Aralığı
Dağılım aralığı en küçük ve en büyük değerlere
bağlı olduğundan dolayı, modifiye edilmiş bir diğer
dağılım aralığı olan çeyrekler aralığı kullanılır.
Çeyrekler aralığı orta nokta olan medyan
etrafındaki dağılımı özetler. Q3 ile Q1 arasındaki
farkı verir.
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Dağılım Ölçüleri Ortalama Mutlak Sapma
Ortalama mutlak sapma her bir gözlem değerinin
kendi ortalamasından mutlak farklarının ortalaması
olarak tanımlanır. Gözlem değerlerinin kendi
ortalamasından farklarının toplamı sıfır olduğundan
mutlak sapma kullanılmıştır.
𝑂𝑀𝑆 = 𝑥𝑖 − 𝑥 𝑛𝑖=1
𝑛
Dağılım Ölçüleri Ortalama Mutlak Sapma
Ortalama mutlak sapma bir dağılım ölçüsü olarak
kullanılır ancak incelenen değişkenin dağılımı
normal dağılım gösteriyorsa standart sapma ya da
varyans daha uygun bir dağılım ölçüsü olur çünkü
normal dağılımın bir parametresi de standart
sapmadır ve dağılımı karakterize eder.
Dağılım Ölçüleri Varyans
Verilerin kendi ortalaması etrafında nasıl bir dağılım
gösterdiğini, yayılış ve serpilmenin durumunu
değişkenin ölçü biriminin karesi olarak belirten
dağılım ölçüdür. S2 ya da değişken adına göre V(X),
V(Y)... ile gösterilir.
𝑆2 = 𝑥𝑖 − 𝑥 2𝑛𝑖=1
𝑛 − 1= 𝑥𝑖
2𝑛𝑖=1 −
𝑥𝑖𝑛𝑖=1
2
𝑛𝑛 − 1
Dağılım Ölçüleri Standart Sapma
Varyans ölçü biriminin karesi olarak ifade
edilmektedir. Örneğin gözlem değerleri metre ise
hesaplanan varyans, metrekare olarak karşımıza
çıkar.
Çoğunlukla kullanılan ölçü biriminde dağılım
ölçüsünün ifade edilmesi istenir.
Dağılım Ölçüleri Standart Sapma
Dolayısıyla varyasın karekökü orijinal ölçü birimine
tekrar dönüş olacaktır. Varyansın karekökü standart
sapma olarak isimlendirilir ve ortalama ile birlikte
(aynı ölçü birimde olduklarından) kullanılır. S harfi
ile gösterilir.
𝑆 = 𝑆2
Dağılım Ölçüleri Standart Sapma
Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı
kadına ait FEV1 (litre) değerleri ölçülmüş ve 2.82
2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87
değerleri elde edilmiştir. FEV1 ölçümlerine ait
standart sapma değeri aşağıdaki gibi hesaplanır.
Dağılım Ölçüleri Değişim Katsayısı
Birim sayıları ve ölçü birimleri birbirlerinden farklı
olan değişkenlerin ortalamaya göre yayılışlarını
karşılaştırmak için yararlanılan ve değişkenin
ortalama ve standart sapmasından yararlanılarak
hesaplanan bir dağılım ölçüsüdür. DK ile gösterilir.
𝐷𝐾 = 100𝑆
𝑥
Dağılım Ölçüleri Değişim Katsayısı
Örnek: 15 bireye ait hemoglobin değerleri 11, 12,
14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15
olarak belirlenmiştir.
40 yaşında 165 cm. boyunda 10 sağlıklı kadına ait
FEV1 (litre) değerleri ölçülmüş ve 2.82 2.78 2.88
2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde
edilmiştir.
Dağılım Ölçüleri Değişim Katsayısı
Acaba bu iki değişkeninden hangisi daha fazla
dağılım göstermektedir?
Bu soruyu cevaplamak için her iki değişkene ait
değişim katsayısı hesaplanmalıdır. Eğer
değişkenlerin standart sapmalarını doğrudan
karşılaştıracak olursak hata yapmış oluruz çünkü
değişkenlerin ölçü birimleri birbirinden farklıdır.
Dağılım Ölçüleri Değişim Katsayısı
Acaba bu iki değişkeninden hangisi daha fazla
dağılım göstermektedir?
Bu soruyu cevaplamak için her iki değişkene ait
değişim katsayısı hesaplanmalıdır. Eğer
değişkenlerin standart sapmalarını doğrudan
karşılaştıracak olursak hata yapmış oluruz çünkü
değişkenlerin ölçü birimleri birbirinden farklıdır.
Dağılım Ölçüleri Değişim Katsayısı
FEV1 değişkenine ait değişim katsayısı
DK(FEV1)=(0.063/2.818) x 100 = % 2.235
Hemoglobin değişkenine ait değişim katsayısı
DK(HG)= (2.131/12.6) x 100 = %16.9 olarak
hesaplanır. Bu sonuçlara göre Hemoglobin
değişkeni FEV1 değişkenine göre daha fazla dağılım
göstermektedir.