View
322
Download
8
Category
Preview:
Citation preview
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin normal dağılıma uyması gerekir. Örneğin, Ki-Kare Testleri normal dağılımı da içeren her hangi bir dağılıma uygulanabilir. Bu bölümde dağılımların normallik testinde kullanılabilecek iki parametrik olmayan test tekniği açıklanmıştır. Bu teknikler Kolmogorov-Smirnov K-S veya Lilliefors testi olarak bilinirler. K-S testi daha kolay uygulanmaktadır.
K-S Testi
K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.
xXPXF ()( )
Örnek yığılmalı dağılım fonksiyonu S(x), seçilen bir x değerine eşit veya daha küçük olan örnek değerinin oranını tanımlar. S(x) aşağıdaki gibi hesaplanır.
Örnek: 10 gözlemli bir çalışmada: 110 89 102 80 93 121 108 97 105 103 olsun
Önce gözlem değerleri küçükten büyüğe doğru sıralanır.
80 89 93 97 102 103 105 108 110 121
X=80, toplam gözlem değerinin en küçüğü olduğundan bu değere eşit veya daha küçük değerde olan gözlemlerin oranı ;
S(80)=1/10 =0.10 olur.
Benzer olarak, 10 değerin 2 si 89’a eşit veya daha küçüktür. (80 ve 89) bunların oranı ise; S(89)=2/10=0.20 olur. Kalanları benzer olarak düzenleyelim.
X 80 89 93 97 102 103 105 108 110 121 S(x) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Bu gözlem değerlerinin ortalaması µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği varsayılırsa,
H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği söylene bilir mi?
H 1: Hayır veriler normal dağılıştan çekilmemiştir.
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
X için yığılımlı F(X) hesaplanması
)80()80( xPF
0228.0)2(10
10080)80(
ZPxPF olur
Benzer hesaplamalarla xler e karşı gelen ölçümler yapılır.
X F(X)=P(X≤x) 80 P(X≤80)=P(Z≤-2)=0.0228 89 P(X≤89)=P(Z≤-1.1)=0.1357 93 P(X≤93)=P(Z≤-0.7)=0.2420 97 P(X≤97)=P(Z≤-0.3)=0.3821 102 P(X≤102)=P(Z≤0.2)=0.5793 103 P(X≤103)=P(Z≤0.3)=0.6179 105 P(X≤105)=P(Z≤0.5)=0.6915 108 P(X≤108)=P(Z≤0.8)=0.7881 110 P(X≤110)=P(Z≤1.0)=0.8413 121 P(X≤121)=P(Z≤2.1)=0.9821 Eğer H0 : Hipotezi doğru ise, bütün x değerleri için F(X) ve S(X) değerleri benzer olmalıdır. Buna karşın, eğer H0 hipotezi yanlış ise , en azından bazı x değerleri için F(X) ile S(x) arasında büyük farklar olacaktır. F(X) ile S(X) arasındaki farkların en büyüğünün mutlak değeri (D) test istatistiği olarak tanımlanır.
Test istatistiği;
D=max [F(X)-S(X)] olur
D nin hesaplanması için, önce her bir x değeri için F(X) ile S(X) arasındaki fark hesaplanır. Bu farkların en büyük mutlak değere sahip olanı test istatistiği olarak belirlenir. Farklar aşağıda hesaplanmıştır.
X F(X) S(X) F(X)-S(X) [F(X)-S(X)] 80 0.0228 0.10 -0.0772 0.0772 89 0.1357 0.20 -0.0643 0.0643 93 0.242 0.30 -0.0580 0.058 97 0.3821 0.40 -0.0179 0.0179 102 0.5793 0.50 0.093 0.0793=D 103 0.6179 0.60 0.0179 0.0179 105 0.6915 0.70 -0.0085 0.0085 108 0.7881 0.80 -0.0119 0.0119 110 0.8413 0.90 -0.0587 0.0587 121 0.9821 1.00 -0.0179 0.0179
Değerler incelendiğinde en büyük mutlak fark değerinin D=0.0793 olduğu görülür. Eğer, D değeri D >F(X)-S(X) ise H0 hipotezi ret edilir.
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Bu farkın büyüklüğüne karar vermek için ilgili tablo Ek çizelge 10 da verilmiştir. Kritik değerler α=0.05, α=0.10, ve α=0.20 önem seviyelerinde n=1…… 40 a kadar için verilmiştir.
Eğer , örnek hacmi n>40 ise, kritik değer
Α- α=0.20 için n
TH 07.1 , olur.
B- α=0.10 için n
TH 22.1 , olur
C- α=0.050 için n
TH 36.1 , olur
D- α=0.02 için n
TH 52.1 , olur
Ağer,
Sonuç: Yukarıdaki örnek veriler için hesaplanan test istatistiği D= 0.0793 değeri, α=0.05 önem seviyesindeki n=10 değerine karşılık gelen kritik tablo değeri olan 0.409 değeri ile karşılaştırılır. D=0.0793 ≤ 0.409 olduğundan Ho hipotezi kabul edilir.
Yorum: Verilerin µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiğini söylemek için yeterli destek bulunmaktadır.
Çoğu uygulamada , normallik testi yapılacak populasyonun ortalaması ve varyansı bilinmemektedir. Oysa K-S Testinde, bu parametrelerin bilindiği kabul edilmektedir.
İşte bu Lilliefors Testi K-S testine benzemektedir. Ama , Lilliefors testi Populasyon varyansı ve ortalamasının bilinmediği populasyonların normallik testinin yapılmasına yarar.
Aradaki fark nedir diye sorulursa; F(X) in hesaplanmasında (µ ve σ yerine) örnek ortalaması ve standart sapması s nin kullanıldığını bileceğiz. X, S örnek sonuçları istatistiktir.
Örnek yığılımlı dağılım fonksiyonu S(X) in hesaplanması ve test istatistiği D nin hesaplanması , K-S testindekilerle aynıdır. Hesaplanan D, test istatistiği Lilliefors test tablo sonuçları ile karşılaştırılır. Eğer D> Tablo değeri ise Ho hipotezi ret edilir.
ÖRNEK: Bizim işletmede günlük süt üretimi kakında hipotez testi yapmak üzere rasgele seçilen 15 günlük süt üretim miktarları litre olarak hesaplanmış ve aşağıda verilmiştir.
91 95 93 103 101 105 96 94 101 98 88 102 94 95 92 Bu bulgulara göre, işletmemizin günlük süt üretiminin normal dağılıp dağılmadığını α=0.05 önem seviyesinde test ediniz.
II- LİLLİEFORS TESTİ
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
ÇÖZÜM:
Populasyon ortalamsı ve varyansı bilinmediğinden, normallik testi Lilliefors testi ile yapılabilir. Verilerin ortalama ve standart sapma değerlerini hesaplayalım. X=96.47 , s=4.85 olarak bulunur. Testin uygulanması K_S testindeki işlemlerle aynıdır. Veriler sıraya dizilecek,
S(X) , F(X) ve mutlak değeleri tabloda verilmiştir. Hesaplamalardan sonra F(X) ve S(X) farkları ve en büyük mutlak fark değeri bulunacak. D istatistiğ tablo değeri ile karşılaştırılacaktır.
Örnek ve populayon Yığılmalı Olasılık değerleri
X S(X) F(X) 88 1/15=0.067
0401.0)75.1(85.4
47.9688)88(
ZPxxP
91 2/15=0.133 1292.0)13.1(
85.447.9691)91(
ZPxxP
92 3/15=0.200 1788.0)92.0(
85.447.9692)92(
ZPxxP
93 4/15=0.267 2358.0)72.0(
85.447.9693)93(
ZPxxP
94 6/15=0.400 3050.0)51.0(
85.447.9694)94(
ZPxxP
95 8/15=0.533 381.0)30.0(
85.447.9695)95(
ZPxxP
96 9/15=0.600 4602.0)10.0(
85.447.9696)96(
ZPxxP
98 10/15=0.667 6255.0)32.0(
85.447.9698)98(
ZPxxP
101 13/15=0.867 8238.0)93.0(
85.447.96101)101(
ZPxxP
103 14/15=0.933 9115.0)3592.1(
85.447.96103)103(
ZPxxP
105 15/15=1.00 9608.0)76.1(
85.447.96105)105(
ZPxxP
İlgili Teorik tabloda n=15 ve α=0.01 için kritik değer =0.257 olarak bulunuyor.
D=0.1509 ≤0.257 olduğundan, Ho Hipotezi kabul edilir. İşletmemizdeki günlük süt üretiminin verileri NORMAL dağılır diyebiliriz.
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
MUTLAK FARKLAR VE LİLLİEFORS TEST İSTATİSTİĞİ
X F(X) S(X) F(X)-S(X) |F(X)-S(X)| 88 0.0401 0.067 -0.0269 0.0269 91 0.1292 0.133 -0.0038 0.0038 92 0.1788 0.200 -0.0212 0.0212 93 0.2358 0.267 -0.0312 0.0312 94 0.3050 0.400 -0.0950 0.095 95 0.3821 0.533 -0.1509 0.1509=D 96 0.4602 0.600 -0.1398 0.1398 98 0.6255 0.667 -0.0415 0.0415 101 0.8238 0.867 -0.0432 0.0432 103 0.9115 0.933 -0.0215 0.0215 105 0.9608 1.00 -0.0392 0.0392
Örnekteki verilere birde SPSS Paket programında Normallik testi uygulayalım. Örnek : 80 89 93 97 102 103 105 108 110 121 olsun. H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği söylene bilir mi?
H1: Hayır veriler normal dağılıştan çekilmemiştir.
1. Adım
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
2. Adım
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
3. Adım
4. Adım
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
5. Adım
Descriptives
Statistic Std. Error
Gunluk süt üretimi Mean 100,8000 3,67514
95% Confidence Interval for
Mean
Lower Bound 92,4863
Upper Bound 109,1137
5% Trimmed Mean 100,8333
Median 102,5000
Variance 135,067
Std. Deviation 11,62182
Minimum 80,00
Maximum 121,00
Range 41,00
Interquartile Range 16,50
Skewness -,150 ,687
Kurtosis ,293 1,334
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Gunluk süt üretimi ,141 10 ,200* ,989 10 ,995
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
VERİLERİN NORMAL DAĞILIŞA UYDUĞU GÖRÜLÜYOR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Örnek: Kız ve Erkek öğrencilerin Biyoistatistik sınav hata puanları dağılımı verilmiştir
Tablo Kız ve Erkeklerin Puan dağılımı
Hata Puanı 24 28 32 36 40 44 48 52 fK 0 0 0 0 3 2 3 2 fE 1 1 3 2 3 0 0 0 Kız ve Erkek öğrencilein hata puanlarına göre dağılımlarında fark olup olmadığını iki örnek K-S testi ile test ediniz.
SPSS te veriler X= Hata PUANI stununa girilir.. Cinsiyet değişkeni için de Y=Cinsiyet stununa girilir. (Cinsiyet E=1, Cinsiyet K=0) olarak kodlanır . Çözüm K-S Testi için Non Parametri test kısmında 2 Independent Sample seçeneği seçilerek veriler ilgili yerlere atanır.
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Çözüm:
SPSS te veri girişi için
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Çıktılar şöyledir.
Two-Sample Kolmogorov-Smirnov Test
Frequencies
Cinsiyet N
Hata Puani ,00 10
1,00 10
Total 20
Test Statisticsa
Hata Puani
Most Extreme Differences Absolute ,700
Positive ,000
Negative -,700
Kolmogorov-Smirnov Z 1,565
Asymp. Sig. (2-tailed) ,015
a. Grouping Variable: Cinsiyet
Yorum: ERKEK ve KIZ öğrencilerin hata puanları türdeş değildir. Kızların hata puanları
dağılımı, erkeklerin hata puanı dağılımından önemli düzeyde pozitif uçta yer almaktadır.
Kızların hata Puanları , Erkeklerin hata puanlarından daha yüksektir.
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
K-S Tek Örnek Testi Örnek çözüm: Hasta kal. Gun Sayısı Birey Sayısı 5 1 6 0 7 2 8 3 9 2 10 1 11 0 12 1 Bireylerin Tifoya yakalanma ve hastanede kalma günlerine göre dağılımlarında veriler normal dağılışa uyuyor mu? K-S testi ile Test ediniz. KAYNAK:
AlimIşık Prof.Dr. İstatistik - II BETA BASIM A.Ş. BAYRAMPAŞA /İSTANBUL 2006
Kazım Özdamar. Paket Programlar ile İstatistiksel veri Analizi KAAN KİTAP EVİ 1999
Prof. Dr. Ömer SATICI Biyoistatistik ders notu
Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR
Yorum: Tifoya yakalananların hastanede kalış günleri Normal dağılışa uyuyor P=0.953
Recommended