67
İSTATİSTİK Zehra DAĞLI

İstatistik Kavramları

Embed Size (px)

Citation preview

Page 1: İstatistik Kavramları

İSTATİSTİK

Zehra DAĞLI

Page 2: İstatistik Kavramları

NEDIR? NEREDE KULLANıLıR?

CANLILARIN ÖZELLİKLERİ VE BUNLARI

ETKİLEYEN ÖGELER ARASINDAKİ NEDENSELLİK

BAĞLARINI, YÖNTEMBİLİMSEL DEĞERLENDİRME

KURGULARI VE OLASILIK KURAMI ÇERÇEVESİNDE

AÇIKLAMAYA ÇALIŞAN BİLİM DALIDIR....

Page 3: İstatistik Kavramları

NORMALLIK SıNıRı VE P DEĞERI

Toplum normlarına göre, denetlenen farkın

normal ya da anormal (anlamlı farklı) olduğu,

başlangıçta kabul edilen güven düzeyi (%95)

temelinde yargılanır.

Bahsedilen güven düzeyinin dışında kalan

olasılık yanılgı payı ( =%5) olarak

değerlendirilir ve uygulanan tüm istatistiksel

testlerin sonucu bu p olasılığına kadar

indirgenerek yorumlanır.

Page 4: İstatistik Kavramları

BILIMSEL ARAŞTıRMA BASAMAKLARı

Gözlem-Sezgi

Hipotez

Gerçekleme

Genelleme

Page 5: İstatistik Kavramları

HİPOTEZİN KURGULANMASI

Hipotez, araştırmacının kendi bilgi birikiminden

veya daha önce yapılmış gözlemlerden faydalanarak

önerilir. Örneğin, tedavi grupları arasında fark

vardır.

H1 (alternatif hipotez); araştırmacının geçerliliğini

denetleyeceği başlangıçta doğru olarak kabul ettiği

hipotez. (FARK VAR)

H0 (sıfır hipotezi); H1 Hipotezinin doğru olmadığını

öne süren doğal hipotez. (FARK YOK)

Page 6: İstatistik Kavramları

HİPOTEZ

H1

Para ile mutluluk arasında ilişki vardır

Para arttıkça mutluluk artar

Para arttıkça mutluluk azalır

H0

Para ile mutluluk arasında ilişki yoktur

H1

Kadınlarla erkekler arasında dedikodu yapma oranları farklıdır

Kadınlar erkeklerden daha çok dedikodu yapar

Erkekler kadınlardan daha çok dedikodu yapar

H0

Kadınlar ve erkekler arasında dedikodu yapma oranları bakımından fark yoktur

Page 7: İstatistik Kavramları

HİPOTEZ

H1

Para ile mutluluk arasında ilişki vardır (r ≠ 0)

Para arttıkça mutluluk artar (r > 0) +

Para arttıkça mutluluk azalır (r < 0) -

H0

Para ile mutluluk arasında ilişki yoktur (r = 0)

H1

Kadınlarla erkekler arasında dedikodu yapma oranları farklıdır (m1 ≠ m2)

Kadınlar erkeklerden daha çok dedikodu yapar (m1 < m2)

Erkekler kadınlardan daha çok dedikodu yapar (m1 > m2)

H0

Kadınlar ve erkekler arasında dedikodu yapma oranları bakımından fark yoktur (m1 = m2)

Page 8: İstatistik Kavramları

İSTATISTIKSEL DEĞERLENDIRME

Hangi hipotez doğru?

p<0.05 => H1 DOĞRU KABUL EDİLİR

Yani hipotez (çok düşük bir yanılma payı ile) genel

geçerliliği olan yeni bir sonuç olarak kabul edilir.

p>0.05 => H0 KABUL EDİLİR

Hipotez kabul edilemeyecek kadar çok yanılmaktadır

KABUL

RED %95

%2,5

RED

%2,5

Page 9: İstatistik Kavramları

p değeri:

bir fark olduğunu söylerken onun gerçekte

olmama olasılığıdır

Page 10: İstatistik Kavramları

1.TİP HATA() Gerçekte FARKSIZLARA yanlış olarak FARKLI denmesi.

2.TİP HATA() Gerçekte FARKLILARA yanlış olarak FARKSIZ denmesi.

Karar Hataları

EVRENSEL GERÇEK

ARAŞTIRMA

SONUCU

KARAR

Ho DOĞRU H1 DOĞRU

Ho DOĞRU

Ho Kabul

H1 DOĞRU

Ho Red

2.Tip

HATA

()

1.Tip

HATA

()

DOĞRU

KARAR

DOĞRU

KARAR

(1- =Power)

Page 11: İstatistik Kavramları

GERÇEKLEME

1. Uygun kurgunun tasarlanması

2. Değişkenlerin Saptanması -Değişken

sayısının belirlenmesi

3. Verilerin doğru ve güvenilir

toplanması (Veri girişi)

4. Verilerin uygun analizi

5. Verilerin doğru sunumu

Page 12: İstatistik Kavramları

İSTATİSTİK ANALİZE HAZIRLIK

Veri tabanı oluşturun

Verileri kodlayın ve bilgisayara ortamına aktarın.

Verilerde hata kontrolünü yapın.

Eksik verilere ne yapılacağına karar verin.

Aşırı değerlere ne yapacağınıza karar verin

Yeniden kodlamaları yapın

Değişkenlerin dağılımını belirleyin (çok önemli)

Page 13: İstatistik Kavramları

VERILERIN DAĞıLıM ÖZELLIĞI NIÇIN

ÖNEMLIDIR?

İstatistikte dağılımın normal olup olmadığının belirlenmesi çok önemlidir.

Farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır.

Parametrik testlerin tümünün uygulanabilmesi için verilerin dağılımının normal olması gerekir.

Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile araştırılır.

Page 14: İstatistik Kavramları

NORMAL DAĞıLıM

Doğadaki ve toplumdaki çok şeyin dağılımı

çan eğrisine benzer

Page 15: İstatistik Kavramları

Skewness

Denekler ortalamadan daha büyük değerlerde

toplanıyorlarsa, negatif basık ya da soldan basık

(negatively skewed, skewed to the left), küçük

değerlerde toplanıyorlarsa, pozitif basık ya da

sağdan basık (positively skewed, skewed to the right)

dağılımdan söz edilir .

Mean, median ve mode farklıdır. Unimodal’da mean kuyruğa doğru çekilir. Median mean ile mode arasına düşer.

Page 16: İstatistik Kavramları

KURTOSıS

Dağılımın şeklinin ölçüsüdür. Pozitif

değerler dağılımın dik, negatif değerler

ise yassı olduğunu gösterir.

Page 17: İstatistik Kavramları

BAŞARI

4 yaşında başarı ....donuna işememektir. 12 yaşında başarı..........arkadaş bulabilmektir. 16 yaşında başarı.................araba sürebilmektir. 20 yaşında başarı........................seks yapabilmektir. 35 yaşında başarı .......................para kazanabilmektir. 50 yaşında başarı .......................çok para kazanabilmektir. 60 yaşında başarı ........................seks yapabilmektir. 70 yaşında başarı ................araba sürebilmektir. 75 yaşında başarı .........arkadaş bulabilmektir. 80 yaşında başarı ....donuna işememektir. Buna ÇAN EĞRİSİ denir!.. Prof. Albert Follanberg

Page 18: İstatistik Kavramları

NORMAL DAĞıLıM NASıL ANLAŞıLıR?

1. Grafikler ile

2. Merkezi ölçütler ve Dağılım

ölçütleri ile

3. Skewness ve kurtosis değerleri ile

4. Hipotez testleri ile

Page 19: İstatistik Kavramları

1. GRAFIKLER ILE

1. Değerlerin histogramını

çizerek

2. Ya da "normal olasılık

grafiği" (normal probability

plot) adı verilen grafiğini

çizerek araştırılabilir.

Page 20: İstatistik Kavramları

1. Ortalama, median ve mod birbirine yakın

olmalı

2. Standart Sapma Ortalamanın yaklaşık ¼ ü

3. Skewness ve Kurtosis sıfıra yakın olmalı

2. Merkezi ve yayılım Ölçütleri ile

3. Basıklık ve çarpıklık değerleri ile

1. Skewness ve Kurtosis sıfıra yakın

olmalı

Page 21: İstatistik Kavramları

1. Shapiro-Wilks’ ve Kolmogorov Smirnov

testleri bu amaç için sıklıkla kullanılan

testlerdir.

p değeri < 0.05 ise, dağılım normal değil.

Özellikle denek sayısı fazlaysa, genellikle

tüm normal dağılım testleri ile "p < 0.05"

bulunabilir. Bu nedenle bu durumlarda

grafik değerlendirmeler yapılmalı

4. Testlerle

Page 22: İstatistik Kavramları

DAĞıLıM ŞEKLI ÖLÇÜTLERI VERILERIN

DAĞıLıM ÖZELLIĞI NIÇIN ÖNEMLIDIR?

İstatistikte dağılımın normal olup olmadığının

belirlenmesi çok önemlidir. Farklı dağılım

gösteren verilere uygulanacak tanımlayıcı ve

analitik istatistik yöntemleri de farklıdır.

1. Veriyi tablolarda hangi ölçütler ile özetleyeceğiniz

2. Hangi grafiği seçeceğiniz

3. Hangi hipotez testini seçeceğiniz

Dağılıma bağlıdır

Page 23: İstatistik Kavramları

NORMALLER

TEHLIKELIDIR

Page 24: İstatistik Kavramları

VERILERIN ANALIZI

Page 25: İstatistik Kavramları

Değişkenin örnek ya da

toplum özelliklerini yansıtan

değerlere tanımlayıcı

istatistikler adı verilir.

İki ana gruba ayrılır.

Tanımlayıcı İstatistikler

Page 26: İstatistik Kavramları

Tanımlayıcı İstatistikler

Merkezi Eğilim Ölçütleri

Mean (Aritmetik ortalama)

Median (Ortanca)

Mod (Tepe noktası)

Yayılım Ölçütleri

Değer aralığı (range)

Standart sapma ve varyans, standart hata

Değişim (varyasyon) katsayısı

Persentil

Çeyrekler arası aralık

Güvenirlik aralıkları

Page 27: İstatistik Kavramları

Aritmetik Ortalama

Değerlerin toplamının denek sayısına bölünmesiyle elde edilen aritmetik ortalama en sık kullanılan merkezi eğilim ölçütüdür.

Sayısal değişkenler için merkezi eğilim ölçütü olarak ortalama kullanılır.

Medyan-Ortanca

Küçükten büyüğe (ya da büyükten küçüğe) doğru sıralandığında tam ortadaki deneğin değeridir.

Ordinal veriler için en iyi merkezi dağılım ölçütüdür

Ortanca aşırı değerlerden etkilenmez. Bu nedenle aşırı uç değerler varsa, sayısal veriler için de ortanca tercih edilmelidir.

Mod

En sık tekrarlayan değer Not: Dağılım normal ise ortalamayı,

normal değil ise medyanı verin

Page 28: İstatistik Kavramları

YAYILIM ÖLÇÜTLERİ

STANDART SAPMA VE VARYANS:

SD, sd ya da s ile gösterilen standart sapma, değişken

değerlerinin ortalamanın etrafındaki yayılmasını temsil

eden bir yayılma ölçütüdür. Değerler arasında farklar

arttıkça standart sapma ve varyans büyür.

Standart sapmanın karesine varyans adı verilir. Standart

sapma ve varyans, birçok istatistik analiz yönteminin

temelini oluşturur.

Page 29: İstatistik Kavramları

YAYILIM ÖLÇÜTLERİ

DEĞER ARALIĞI (Range): Değişken

değerlerinin dağılımını belirten yararlı bir

ölçüttür. En büyük ve en küçük değer

arasındaki fark değer aralığıdır (range).

Değer aralığı da, ortalama gibi uç değerlerden

çok etkilenir. Üstelik en uçtaki iki değer

arasında kalan değerler hakkında bilgi

vermez.

Page 30: İstatistik Kavramları

YAYILIM ÖLÇÜTLERİ

PERCENTİLLER: Çeyreklikler

Laboratuar değerlerinin alt ve üst normal sınırlarının

belirlenmesinde kullanılır. Genellikle kabul edilen alt

normal sınır 2.5 persentil ve üst normal sınır 97.5

persentildir.

ÇEYREKLER ARASI ARALIK: 25. ve 75. persentil

değerleri arasındaki farka çeyreklerarası aralık

(interquartile range) adı verilir. Yani değerlerin ortada yer

alan %50’si, çeyrekler arası aralıktır.

Page 31: İstatistik Kavramları

GÜVEN ARALIKLARI

Güven Aralığı: Verilerin evren içinde bulunabileceği

aralığın, bu aralıkta bulunma olasılığı ile birlikte

verilmesidir. (%95, %99 güven aralığı, gibi)

Ortalama için güven aralıkları: Evren ortalamasının

içine düşmesinin beklendiği bir (a,b) aralığıdır.

Oranlar için güven aralıkları: Evren oranının içine

düşmesinin beklendiği bir (p1, p2) aralığıdır.

Page 32: İstatistik Kavramları

NE ZAMAN HANGISINI KULLANALıM?

1. Dağılım normal ise mean

2. Dağılım normal değil ise median

1. Merkezi eğilim ölçütü olarak ortalama kullanıldığı

zaman, yayılma ölçütü olarak da standart sapma

kullanılır. Ortalama ± SS

2. Ortanca kullanılacaksa minimum maksimum değerleri

verilir. Medyan (min-max)

Page 33: İstatistik Kavramları

VERİNİN ÖLÇÜM BİÇİMİ

Bazı veriler ölçülür: boy uzunluğu,

ağırlık, hemoglobin değeri,

kolesterol miktarı, hastanede

yatılan gün sayısı, günlük diyetle

alınan yağ miktarı.

Bazıları ise isimlendirilir: cinsiyet,

meslek, hastalık cinsi,, yapılan

ameliyatın türü, alınan ilaç.

Page 34: İstatistik Kavramları

BAĞIMLI VE BAĞIMSIZ

GRUPLAR

İki ya da daha çok grup karşılaştırılması yapılıyorsa, grupların bağımlı ya da bağımsız olduğunu bilmek çok önemlidir.

Bağımlı grup: 1 birey (birim) den birden fazla ölçüm alınması ile oluştuğu durumdur.

Bağımsız grup: Ölçümlerin birbirinden farklı birey ya da gruplarda yapıldığı durumdur.

Page 35: İstatistik Kavramları

Bağımsız grup

A ilacının

5.dakikadaki

kalp atım hızı ile

B ilacının

5.dakikadaki

kalp atım hızı

A ilacının

5.dakikadaki

kalp atım hızı ile

A ilacının

10.dakikadaki

kalp atım hızı

Bağımlı grup

Page 36: İstatistik Kavramları

GRUP SAYISI

1. Tek grup

2. 2 grup

3. 3 ve daha fazla grup

Page 37: İstatistik Kavramları

GRUP SAYıSı VE ÖLÇÜM SAYıSı

1. Tek grup

2. 2 grup

3. Tek grupta 2 zamanlı ölçüm

4. 2 ve daha fazla grup

5. Tek grup 2 den fazla ölçüm

6. 2 den fazla grup 2 den fazla

ölçüm

Page 38: İstatistik Kavramları

Tek grup-Panik hastalarda ank. skoru

2 grup- Panik ve OKB ank. skoru

Tek grupta 2 zamanlı ölçüm-Panik hastalarda A ilacı öncesi ve 3 ay sonrası ank. skoru

3 ve daha fazla grup- Panik, OKB ve sağlıklı kontrollerde ank skoru

Tek grup 2 den fazla ölçüm-Panik hastalarda başlangıç, 1 ay 3 ay 6 ay sonrasında ank skoru

3 den fazla grup 3 den fazla ölçüm- Panik hastalara A ilacı; 1, 3, 6 ay ank skoru; panik hastalara kognitif terapi; 1,3, 6 ay ank. skoru

GRUP SAYıSı VE ÖLÇÜM SAYıSı

Page 39: İstatistik Kavramları

GRUPLARDAKİ KİŞİ SAYISI (N)

Önemlilik testlerinde ‘30’ sayısı; istatistiksel teori

içinde anlam taşıdığından önemlidir.

30 ve daha büyük örnekli gruplara test gücü daha

fazla olan parametrik testler uygulanır.-merkezi limit

teoremine dayanır

Asıl dayanak dağılımın normal olmasıdır. n

sayısı 500 de olsa değişken normal dağılmıyorsa

parametrik test seçilemez

Page 40: İstatistik Kavramları

NNT

Tedavi için gerekli sayı

Number needed to treat (NNT)

İstenen olumlu sonuca ulaşılacak her bir

hasta için, tedavi edilmesi gereken hasta

sayısı

1/ ARR = 1/ EER-CER

Page 41: İstatistik Kavramları

•Tıpta tanı yöntemleri ile ilgili araştırmaların

büyük bir bölümü, tanı yöntemlerinin

doğruluğunun kestirilmesi ve

karşılaştırılmasına ayrılmıştır.

•Tanı doğruluğunu gösterecek değişik ölçüler

geliştirilmiş, bu amaç için klinik çalışma

düzenleri tanımlanmıştır.

•Son yıllarda giderek artan öneminin

nedenlerinden biri de hasta bakım maliyetleri

üzerine olan etkisidir.

TIPTA KARAR VERME

Page 42: İstatistik Kavramları

Tanı testinin kullanılabilir olması için

I- Hastanın durumu hakkında güvenilir bilgi

sağlaması

II- Hastanın tedavisi ile ilgili hekimin planları

üzerinde etkili olabilmesi

III- Hastalar üzerinde test tekrarlandığında

hastalık mekanizmalarını yada hastalığın doğal

seyrini anlatabilmesi

Page 43: İstatistik Kavramları

TANı TESTı PERFORMANSLARı NASıL

DEĞERLENDıRıLıR

A - Özgün oranlar

B - Kestirim gücü

C- ROC eğrisi

Kappa katsayısı,

Mc-Nemar testi;

Page 44: İstatistik Kavramları

DUYARLILIK

Testin toplumdaki hastaları saptayabilme gücü

Payda (toplumdaki) gerçek hastalar

Page 45: İstatistik Kavramları

SEÇİCİLİK

Testin toplumdaki sağlamları saptayabilme gücü

Payda (toplumdaki) gerçek sağlamlar

Page 46: İstatistik Kavramları

Duyarlılık (Sensitivity): Gerçekte hasta olanlar

arasında testin pozitif sonuç verme oranı

Seçicilik (Specificity): Gerçekte hastalığa sahip

olmayanlar arasında testin negatif sonuç verme

oranı

Yanlış pozitif oran: Gerçekte hastalığa sahip

olmayanlar arasında testin yanlışlıkla pozitif

sonuç verme oranı=1-Seçicilik

Yanlış negatif oran: Gerçekte hasta olanlar

arasında testin yanlışlıkla negatif sonuç verme

oranı=1-Duyarlılık

Page 47: İstatistik Kavramları

TANı VE TARAMA TESTLERI

a

b

c

d a/a+b = + PD

1-Seçicilik

d/c+d = - PD

1-Duyarlılık

Altın Test

+ -

Test

+

-

a/a+c = Duyarlılık

Doğru pozitif oran

d/b+d = Seçicilik

Doğru negatif oran

Page 48: İstatistik Kavramları

YN Tedavinin gecikmesi

YP Riskli, gereksiz, ileri tetkikler,

Yanlış tedavi, Yanlış tanımlama

DP-DN Hastalık şiddeti, anatomik

özellikler, hasta özellikleri

DP ve DN oranlar

hastalık prevelansından etkilenmezler.

Page 49: İstatistik Kavramları

LIKELIHOOD RATIO

OLABILIRLIK ORANı

•OLABİLİRLİK ORANI Bir tanı testinin

duyarlılığını ve seçiciliğini birleştirerek kullanan

performans ölçüsüdür

Pozitif Olabilirlik Oranı; Bir testin hasta

kişide pozitif çıkma olasılığının, sağlam

kişide pozitif çıkma olasılığına oranı

LR (+) = duyarlılık / (1-seçicilik)

Page 50: İstatistik Kavramları

• POO=Duyarlılık/(1-Seçicilik)=DP/YP

• Bir tanı testinin, her doğru pozitif sonuca

karşılık kaç tane yanlış pozitif sonuç verdiğini

gösterir. DP=0,80 ve DN=0,90 olan bir test

için;

• POO=0.80/0.10 = 8

• Bu test, her 8 doğru pozitif sonuca karşılık 1

yanlış pozitif sonuç verir.

• Dokuz pozitif sonucun 8’i doğru, biri yanlıştır.

LIKELIHOOD RATIO

Pozitif Olabilirlik Oranı

Page 51: İstatistik Kavramları

LIKELIHOOD RATIO

NEGATIF OLABILIRLIK ORANı

Bir testin hasta kişide negatif

çıkma olasılığının, sağlam

kişide negatif çıkma olasılığına

oranı

LR (-) = (1- duyarlılık)/seçicilik

Page 52: İstatistik Kavramları

• NOO=(1-Duyarlılık)/Seçicilik=YN/DN

• Bir tanı testinin, her yanlış negatif sonuca

karşılık kaç tane doğru negatif sonuç verdiğini

gösterir. DP=0,80 ve DN=0,90 olan bir test için;

• NOO=0.2/0.9=2/9

• Bu test, her 2 yanlış negatif sonuca karşılık 9

doğru negatif sonuç verir.

• Onbir negatif sonucun 9’u doğru, ikisi yanlıştır.

• POO’nın olabildiğince büyük,

NOO’nın olabildiğince küçük olması

istenir.

Negatif Olabilirlik Oranı

Page 53: İstatistik Kavramları

• +LR>10 veya

• -LR<0.1 ise önemliliğe götürür

• +LR 5-10

• -LR 0.1-0.2 ise orta

• +LR 2-5 veya

• -LR 0.5-0.2 küçük ama bazen önemli

• +LR 1-2

• -LR 0.5-1 ise küçük ve çok az önemli

Olabilirlik Oranı

Page 54: İstatistik Kavramları

B - KESTİRİM GÜCÜ

Gerçekte araştırmacıların yanıt aradığı en

önemli soru; “Tanı testi sonucu pozitif olanın,

gerçek bir hasta olma olasılığı nedir? (veya

Tanı testi sonucu negatif olanın gerçekten

sağlam olma olasılığı nedir ?)” sorusudur. Bu

kavram “KESTİRİM DEĞERİ” adını alır ve

Bayes kuramı çerçevesinde çözümlenir.

Page 55: İstatistik Kavramları

1) POZİTİF SONUCUN KESTİRİM DEĞERİ

(PKD): Tanı testi hasta yargısı verdiğinde,

gerçekten hasta olma olasılığıdır.

2) NEGATİF SONUCUN KESTİRİM DEĞERİ

(NKD): Tanı Testi sağlam dediğinde

gerçekten sağlam olma olasılığıdır. Bu

oran ne kadar küçük olursa tanı testi,

sağlamları o derecede iyi ayırmaktadır.

B - KESTİRİM GÜCÜ

Page 56: İstatistik Kavramları

Klinisyenler için önemli olan

soru, bir test sonucunun ne

anlama geldiği sorusudur. Pozitif

sonuca sahip bir kişinin hasta

olması ya da negatif sonuca sahip

bir kişinin hastalıksız olması

olasılıklarının ne olduğu

önemlidir.

Page 57: İstatistik Kavramları

• Bu amaca hizmet eden olasılıklar TEST SONRASI

OLASILIKLAR olarak adlandırılır ve iki farklı test

sonrası olasılık vardır. Bunlar:

• POZİTİF TAHMİNİ DEĞER (POSITIVE

PREDICTIVE VALUE) ya da POZİTİF TEST

SONUCUNUN TAHMİNİ DEĞERİ

ve

• NEGATİF TAHMİNİ DEĞER (NEGATIVE

PREDICTIVE VALUE) ya da NEGATİF TEST

SONUCUNUN TAHMİNİ DEĞERİ dir.

Page 58: İstatistik Kavramları

Pozitif Tahmini Değer (PTD), tanı testi

sonucu pozitif olan bir kişinin hasta

olması olasılığını gösterir. Test

istenmeden önceki hastalık olasılığına ve

testin performans ölçütlerine bağlıdır.

Page 59: İstatistik Kavramları

Pozitif Tahmini Değer (PTD), tanı testi

sonucu pozitif olan bir kişinin hasta olması

olasılığını gösterir. Test istenmeden önceki

hastalık olasılığına ve testin performans

ölçütlerine bağlıdır.

Burada Se: Testin Duyarlılığı

Sp: Testin Seçiciliği

Pr: Test Öncesi Hastalık Olasılığı

Pr)1(x)S1(PrxS

PrxSPTD

pe

e

Page 60: İstatistik Kavramları

Negatif Tahmini Değer (NTD), tanı testi

sonucu negatif olan bir kişinin hasta

olmaması olasılığını gösterir. Test istenmeden

önceki hastalık olasılığına ve testin

performans ölçütlerine bağlıdır.

Burada Se: Testin Duyarlılığı

Sp: Testin Seçiciliği

Pr: Test Öncesi Hastalık Olasılığı

Prx)S1(Pr)1(xS

Pr)1(xSNTD

ep

p

Page 61: İstatistik Kavramları

ROC EĞRıSı YÖNTEMı;

Testin ayırt etme gücünün belirlenmesine,

Çeşitli testlerin etkinliklerinin kıyaslanmasına,

Uygun pozitiflik eşiğinin belirlenmesine,

Laboratuar sonuçlarının kalitesinin

izlenmesine,

Uygulayıcının gelişiminin izlenmesine ve

Farklı uygulayıcıların etkinliklerinin

kıyaslanmasına olanak sağlar.

Page 62: İstatistik Kavramları

Receiver Operating Characteristic Curve

ROC EĞRİSİ

Bir çift duyarlılık ve seçicilik değeri

kullanmanın getirdiği dezavantajları ortadan

kaldıracak bir yöntem olarak geliştirilmiştir.

Testin kendi doğruluğunu (prevelanstan

bağımsız olarak) tanımlaması ve testler

arasında en doğru karşılaştırma yapmaya

olanak sağlaması açısından sıklıkla

kullanılmaktadır.

Page 63: İstatistik Kavramları

ROC Curve

Diagonal segments are produced by ties.

1 - Specificity

1,00,75,50,250,00

Se

nsitiv

ity

1,00

,75

,50

,25

0,00ROC eğrisi, değişik kesim

noktalarında testin duyarlılığının (y-

ekseni), testin YP oranına (x-ekseni)

karşı noktalanması ile elde edilir. Her

kesim noktasındaki DP ve YP’e

karşılık gelen noktalar birleştirilerek

ROC eğrisi çizilir.

Page 64: İstatistik Kavramları

ROC Eğrisi Altında Kalan Alan:

Testin doğruluğunu tek bir sayısal değerle

özetlemek için kullanılır. En büyük “1” değerini

alabilir. Pratik olarak alabileceği en küçük

değer “0.50” dir. Hastalarla sağlamlar

tamamen şansa bağlı olarak (örneğin para atışı

ile) ayırt edilirse bu durum ortaya çıkar

Page 65: İstatistik Kavramları

ROC eğrisi altında kalan alan herzaman çok

bilgilendirici olmayabilir. Kimi zaman, testin

yüksek seçici (yüksek duyarlı) olması istendiğinde

düşük seçicilik değerleri (düşük duyarlılık

değerleri) ile değil, ROC eğrisinde yüksek

seçiciliğe (yüksek duyarlılığa) karşılık gelen bölge

ile ilgilenebiliriz.

İki test aynı ROC eğrisi altında kalan alan

değerine sahip olabilir, ancak işleyişleri farklıdır.

ROC Eğrisi Altında Kalan Alan:

Page 66: İstatistik Kavramları

Düşük yanlış pozitif oran

(yüksek seçicilik) gerekli

ise, B test A testine tercih

edilebilir.

Bu nedenle ROC eğrisinin ilgilenilen bölümünü

kullanmak, böyle bir bölgeyi kullanan ölçülerle

ilgilenmek daha akılcı olabilir.

ROC Eğrisi Altında Kalan Alan:

Page 67: İstatistik Kavramları

Teşekkürler