Upload
wwwtipfakultesi-org
View
200
Download
0
Embed Size (px)
Citation preview
İstatistik Kavramları 19.02.2016
Kartal Dr. Lütfi Kırdar Eğitim ve Araştırma Hastanesi Aile Hekimliği Kliniği
Tanımlar
İSTATİSTİK
Veri toplama, verileri organize etme, özetleme, analiz etme ve bu verilerden bir sonuç çıkarma
bilimidir.
(SPSS, Stata, MedCalc, GenStat, BMDP, Minitab, NCSS, StatXact…………)
VERİ
• Bir araştırma sırasında elde ettiğiniz ölçüm, bilgi, belge, veya gözlemlere verilen genel isimdir.
• Bir çalışma boyunca gerçekleştirilen gerçek ölçümlerdir.
DEĞİŞKEN
• Gözlemden gözleme değişik değerler alabilen özelliklere ya da durumlara verilen addır.
• Parametre: Tüm toplumdan elde edilen değişken
İstatislik
Tanımlayıcı Dolaylı İstatislik
Tanımlayıcı
Verilerin toplanm
asıOrganizasyo
nuÖzetlenm
esiSunulma
sı
Dolaylı İstatislik
Sonuç çıkarma
Hipotez test
etme
İlişkileri saptam
a
Tahminde
bulunma
Veri tipleri
Değişken Tipleri
1- Kategorik a- Nominal: cinsiyet, kan grubu…b- Ordinal: memnuniyet derecesi, eğitim…Dikotom: cinsiyet, sigara tüketimi (evet/hayır)
2- Numerik a- Sürekli: VKİ, yaş, AKŞ, kan basıncı... b- Kesikli: KOAH akut alevlenme atağı sayısı/ay, ailedeki çocuk sayısı…
• Numerik değişken Kategorik
• Kategorik değişken Numerik
• Numerik ortalama ± standart sapma
• Kategorik n (%)
• İstatislik harf tanımaz, sadece rakamları tanımlar.
Merkezi Ölçütler
• Ortalama (mean) aritmetrik ortalama
• Ortanca (median)
• Tepe değeri (mod)
• Geometrik Ortalama
ARİTMETİK ORTALAMA(ORTALAMA)
Ortalama
• Veri normal dağılıma uyuyorsa
• Aritmetik ortalama = tüm değerlerin toplamının / değer sayısı
x₁ + x₂ +…… + xn / n
• Tüm veri setini kullanır, kolay ölçülür • Aşırı değerlerden etkilenir
İBS sıklığı araştıran bir çalışmada yaş ortalaması:
52, 55, 56, 58 ve 59
Yaşlarının toplamı = 280 (52+55+56+58+59)
n = 5
280 / 5 = 56 Ortalama yaş
Dikkat ....
Örneğimize 92 yaşında olan altıncı bir hasta ekleyelim.
Kadınların yaşlarının toplamı:52+55+56+58+59+92 = 372 Kadınların sayısı = 6
372 / 6 = 62 Ortalama yaş
Ortanca (Medyan)
• Dağılımın orta noktasındaki değerdir.
• Değerlerin %50’sinin ortanca değerinden küçük, %50’sinin büyük olduğu noktadır.
• Veri dağılımı, simetrik değil, çarpık olduğunda kullanılır.
Ortanca (medyan)
• Dağılımın orta noktasındaki değerdir.
• n = tek sayı (n + 1) / 2. değer n = çift sayı [(n/2). değer + [(n+2)/2] .değer / 2. değer]
• Veri setinde aşırı değerlerin bulunduğu dağılımlarda “medyan” değeri daha uygundur.
• Aşırı değerlerden etkilenmez ☺• Veri grubunu etkin kullanmaz
İBS sıklığı araştıran bir çalışmada yaş ortalaması:
52, 55, 56, 58 ve 59
Ortanca
• Hastaların yarısının yaşı 56’dan büyük, yarısının yaşı ise 56’dan küçüktür.
• Örneğimize 92 yaşında olan altıncı bir hasta ekleyelim.
52, 55, 56, 58, 59, 92
(56+58) / 2 = 57
Ortanca
TEPE DEĞERİ(MOD)
Tepe Değeri• Tepe değeri (mod), bir grup olayın arasında en
sık gerçekleşendir.
• Çok sık gerçekleşen olaylar için kullanılır.
• Bi-modal dağılımda yararsız!!!…
• Göz kliniğine başvuran 100 hastanın göz renkleri kaydedilmiştir.
75 kişi kahverengi, 13 kişi mavi, 10 kişi yeşil, 2 kişi ela
• Mod: Kahverengi
20 kişinin katıldığı bir araştırma: Diyastolik Kan Basıncı (mm Hg)
60, 65, 68, 69, 69, 70, 70, 70, 70, 72, 73, 74, 75, 75, 76, 77, 78, 80, 80, 85
Ortalama? Medyan? Mod?
Geometrik ortalama• Katlanarak çoğalan verilerde ortalama
hesaplanmak istendiğinde (Ör: Nüfus artışı, mikroorganizma çoğalması)
• Genelde ortancaya yakın ve ortalamadan daha küçüktür.
• G. O. = n√ x1x2…….xn
• Bağımlı değişken / Bağımsız değişken
• Bağımlı grup / Bağımsız grup
Bağımlı değişken ≠ Bağımlı grup
Bağımsız değişken ≠ Bağımsız grup
Verilerin özetlenmesi
Verilerin özetlenmesi• Sıklık dağılımları, tanımlayıcı istatistikler
• Sayı, yüzde, çeyrek, persentil, ortalama, ortanca, tepe noktası, minimum, maksimum, standart sapma…..
• Tablo ve grafikler• Sütun grafikler• Daire dilimleri• Histogramlar• Box-plot
Histogram
• Sütun grafiğine benzer ama aralarda boşluk yoktur.
• Sütun bir değeri değil, belli bir aralıktaki değeri temsil eder.
• Dağılımı değerlendirmek amacıyla (simetrik / asimetrik)
Box Plot
• Beş noktada özet
• Minimum, 1. çeyrek, medyan, 3. çeyrek, Maksimum
• Bu verilerin Box Plot (Box-Whisker plot) şeklinde gösterimi
Box Plot
control (s=43)case (n=131)
350
300
250
200
150
100
50
0
HDL
LDL
VLDL
triglycerides
cholesterol
Yaygınlık ölçütleri ve dağılımın şekli
Dağılımın Yaygınlık Ölçütleri
• Standart Sapma
• Her bir değerin ortalamaya uzaklığını, dağılımın ne yaygınlıkta olduğunu gösterir.
• Varyansın kareköküdür.
• SS büyüdükçe dağılımın yaygınlığı artar.
11
2
n
xxs
n
ii
Dağılımın Yaygınlık Ölçütleri• Standart hata (SE: standart error)
SE= Varyans / √n
Örneklem büyüdükçe küçülür.Güven aralığı hesaplanmasında kullanılır
• Standart sapma ≠ Standart hata
• Standart sapma (δ): Bir değişkenin aritmetik ortalamadan ne kadar saptığı
• Standart hata: Aynı bireyde birden çok ölçüm yaptığımızda farklı sonuçlar
Teorik dağılımlar
Normal (Gaussian) dağılım
Simetrik dağılım
• Simetrik dağılımlarda ortalama = ortanca = mod
• Sola kayma mod < ortanca < ortalama• Sağa kayma ortalama < ortanca < mod (sağlık çalışmalarında)
• Simetrik dağılım
• sola kayma
Merkezi Limit Teoremin ne kadar büyükse dağılım o kadar çok normal dağılıma benzer.
Örneklem Hesaplanması
• Örneklem = Toplumu temsil eden grup
• Minitab, PASS, Raosoft, Russ Lenht, G-Power…
• Yetersiz sayıda örnekleme veya aşırı miktarda yüksek örnekleme sahip araştırmalar zaman, kaynak kullanımı açısından israftır.
Araştırma Gücüne Etkileyen Faktörler
Güç
n
δ
α
EG
• n = Örneklem büyüklüğü
• δ = Variabilite
• α = Alfa önemlilik düzeyi
• E.G. = Etki genişliği = Cohen’s Delta = r (0,1=küçük; 0,3=orta; 0,5=büyük)
• α hata araştırmacı tarafından kabul edilir. (0,05; 0,01; 0,001)
• β hata denetimimiz altında değil (0,20)
• α β
• α sabit iken n β
Hipotez Testi Sonucu
H0 red H0 kabul
Gerçek Durum
H0 doğru Yanlış karar Tip 1 hata =
α hata
Doğru karar
1- αH0 yanlış Doğru
karar1- β
Güç
Yanlış karar Tip 2 hata =
β hata
Araştırma gücü artar…
• Örneklem arttıkça (Büyük bir örneklem küçük bir fark)
• Gözlemler arasındaki değişkenlik düştükçe
• Anlamlılık düzeyini yüksek tuttuğumuzda
Örneklem Formülleri
• Tanımlayıcı araştırmalar1- Sonuç ölçütü kategorik
Evrendeki birey sayısı biliniyorEvrendeki birey sayısı bilinmiyor
2- Sonuç ölçütü numerik
• Hipotez testleri için örneklem hesabı