Upload
irina
View
83
Download
7
Embed Size (px)
DESCRIPTION
İstatistikte Bazı Temel Kavramlar. Kaynaklar. Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme İstatistik Yöntemler ve Uygulaması, H.Arıcı. Evren Gözlem alanına giren obje ya da bireylerin tümü Örneklem Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup. - PowerPoint PPT Presentation
Citation preview
İstatistikte Bazı Temel Kavramlar
• EvrenEvren– Gözlem alanına giren obje ya da bireylerin Gözlem alanına giren obje ya da bireylerin
tümütümü
• ÖrneklemÖrneklem– Bir evrenden seçilmiş daha küçük sayıdaki Bir evrenden seçilmiş daha küçük sayıdaki
obje ya da bireylerin oluşturduğu grupobje ya da bireylerin oluşturduğu grup
Kaynaklar• Fiziksel Ölçmeler ve Değerlendirmesi, İ.EşmeFiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme• İstatistik Yöntemler ve Uygulaması, H.Arıcıİstatistik Yöntemler ve Uygulaması, H.Arıcı
• DeğişkenDeğişken• Her gözleme göre farklı değerler alabilen objelere, Her gözleme göre farklı değerler alabilen objelere,
özelliklere ya da durumlara denirözelliklere ya da durumlara denir
• Değişkenler nicel ya da nitel olabilir.Değişkenler nicel ya da nitel olabilir.
• Nitel verilerNitel veriler• Sayısal verilerSayısal veriler-kesikli sayısal veriler (maç kazanma sayısı)-kesikli sayısal veriler (maç kazanma sayısı)-sürekli sayısal veriler (boy, kilo)-sürekli sayısal veriler (boy, kilo)• Nitelik ve sayısal veriler arasındaki ilişki Nitelik ve sayısal veriler arasındaki ilişki
(boy sınıflandırması)(boy sınıflandırması)
• ÖlçmeÖlçme– objelere ya da bireylere belirli bir değere sahip objelere ya da bireylere belirli bir değere sahip
oluş derecelerini belirtmek için sembolik oluş derecelerini belirtmek için sembolik değerler verme işlemidir.değerler verme işlemidir.
– Değişkenler hakkında bilgi edinmek için yapılırDeğişkenler hakkında bilgi edinmek için yapılır
• ÖlçümÖlçüm– Ölçme sonucunda elde edilen değerÖlçme sonucunda elde edilen değer
X=2.8
0 1 2 3 4 5 6
X=5.0
5 cm = 5,0cm
• Anlamlı rakamAnlamlı rakam
• Sayıları yuvarlamaSayıları yuvarlama5,387123 = 5,39 = 5,4 = 55,387123 = 5,39 = 5,4 = 5
İstatistikte Bazı Temel kavramlar
• Aritmetik OrtalamaAritmetik Ortalama• Aralık (range)Aralık (range)• SapmaSapma• Standart sapma Standart sapma • Ölçümlerin dağılımı ve standart Ölçümlerin dağılımı ve standart
sapma ile ilişkisisapma ile ilişkisi
RangeDeğişken
d1
Aritmetik ortalama
Sapma
d2
X= değerlerin toplamı/değer sayısı
Standart sapma: • Bir dizi ölçümün gösterdiği değişimin en Bir dizi ölçümün gösterdiği değişimin en
güvenilir ölçüsüdür.güvenilir ölçüsüdür.
• Dağılım fazlaysa standart sapma büyük, Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür. dağılım dar alanda ise küçüktür.
• Standart Sapma istatistiksel analizde Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır sapmalarının kareli ortalaması"dır
Standart sapma: • Standart sapma /bütün elemanların
ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir.
[ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi)
ve yukarıdaki ifadenin karekökü..
ortalama değer
Ortanca (medyan)
• 50. yüzdeliğe ortanca denir. Denek sayısı 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2tek sayılı değer ise n+1/2
• Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.• Veriler büyükten küçüğe doğru sıralanır Veriler büyükten küçüğe doğru sıralanır
ortadaki iki değerin aritmetik ortalaması ortadaki iki değerin aritmetik ortalaması alınır alınır
• 5,5,6,5,5,6,66,7,9,9, 7+1/2 ,7,9,9, 7+1/2 • 5,5,6,5,5,6,66,,77,9,9,10 8/2=4, 8+2/4=5,9,9,10 8/2=4, 8+2/4=5• 6+7=13/2=6+7=13/2=6,56,5
Tepe değer (mod)
• Dağılımda en fazla tekrarlanan Dağılımda en fazla tekrarlanan değerdir. değerdir.
• Frekansı en fazla olan sınıfın Frekansı en fazla olan sınıfın değeridir. değeridir.
• 5,5,6,5,5,6,66,6,7,9,9,10,6,7,9,9,10
Ölçme Sonucunun Gösterilmesi
X = 5,8 ± 0,25
X = 58 ± 0,2
X = 58.3 ± 2
Yanlış Gösterim
X = 58.3 ± 0.2 Doğru Gösterim
İstatistiksel Verileri Tasnif Etme
• İstatistiksel verileri anlamlı hale İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:getirmenin 5 ayrı yolu:
1.1. Sözel ifadelerle açıklamaSözel ifadelerle açıklama
2.2. Tablolar halinde düzenlemeTablolar halinde düzenleme
3.3. Grafikle göstermeGrafikle gösterme
4.4. Verileri değerlendirerek istatistiksel ölçüler bulmaVerileri değerlendirerek istatistiksel ölçüler bulma
5.5. Bu yöntemlerde birkaçını birlikte uygulamaBu yöntemlerde birkaçını birlikte uygulama
İstatistiksel Verileri Tasnif Etme
Verilerin grafikle gösterilmesiVerilerin grafikle gösterilmesi
– Çizgi grafiğiÇizgi grafiği
– Çubuk grafik (Histogram)Çubuk grafik (Histogram)
– Pasta grafiğiPasta grafiğiF
reka
ns
Puan
2
46
8
1012
30 40 50 60 70 80 9040
Fre
kan
s
Puan
3
45
6
78
30 40 50 60 70 80 9040
0
5
10
15
20
25
2000 2001 2002
TÜRKÇE
SOSYAL
MATEMATİK
FEN
Yıllar
Pasta grafiği
İstatistiksel Verileri Tasnif Etme
36%
64%
Genel lise Meslek lisesi
Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır
60%19%
10%
11%
Yerleşemeyen
Açık Öğr
Önlisans
Lisans
Doğru Grafik Seçme
3565
0
50
100
Ge
ne
lL
ise
Me
sle
kL
ise
si
AB Ülkelerinde Genel Lise Meslek Lisesi Oranları
İkisi de olabilir. Birincisi daha uygun
Doğru Grafik Seçme
4,6
9,4
8,3
6,5
Dünya
Avrupa 15'ler
Doğu Avrupa
Türkiye
6,5
8,39,4
4,6
0
2
4
6
8
10
Dün
ya
Avr
upa
15'le
r
Doğ
uA
vrup
a
Tür
kiye
Ülkelere Göre Eğitim Yaşı
Doğru Yanlış
Doğru Grafik Seçme
Yıllara göre okul yaşı
2,73,2
3,8
4,8
6,8
0
2
4
6
8
1975 1980 1985 1990 2000
2,7
3,2
3,8
4,8
6,8
1975
1980
1985
1990
2000
Doğru Yanlış
NORMAL DAĞILIM NEDIR
– İstatistik analiz yapılırken, dağılımın özelliği İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. çok önemlidir.
– Çünkü farklı dağılım gösteren verilere Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. yöntemleri de farklıdır.
– Parametrik testlerin uygulanabilmesi için, Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması dağılımın normal ya da normale yakın olması gerekir.gerekir.
• Standart sapmasıStandart sapması• Frekans eğrisi çan şeklinde olan Frekans eğrisi çan şeklinde olan
simetrik dağılımdır. simetrik dağılımdır. • Normal dağılım simetrik olduğu Normal dağılım simetrik olduğu
için, normal dağılım gösteren için, normal dağılım gösteren değişkenlerin ortalama, ortanca değişkenlerin ortalama, ortanca ve modları eşittirve modları eşittir
Normal dağılım,
• Dağılım şekli ölçütleri : Çarpıklık Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır. –1 ve +1 arasında yer alır.
• Denekler ortalamadan daha Denekler ortalamadan daha büyük değerlerde toplanıyorsa, büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, negatif basık ya da soldan basık,
• Küçük değerlerde toplanıyorsa Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık pozitif basık ya da sağdan basık dağılımdan söz edilir. dağılımdan söz edilir.
Dağılım özelliğinin önemi nedir
• Parametrik testlerin tümünün uygulanabilmesi için Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. aralığı hesaplanır.
• Bu durumda, doğru bir hipotezi reddetme olasılığı Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilirfark varmış gibi sonuç elde edilebilir
NORMAL DAĞILIMIN KRİTERLERİ
• Dağılımın normal olup olmadığı grafik ve istatistik analiz Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. yöntemleri ile anlaşılır.
• Histogram, dal ve yaprak grafiği ve normal olasılık Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.hakkında fikir edinilebilir.
• Ama bu izlenimin istatistik yöntemlerle de test edilmesi Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefikolmagorw simirnov. Yada shefi testleri bu amaçla testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır. ise dağılımın normal olmadığı sonucuna varılır.
Verilerin normal dağılmadığı Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :durumlarda iki işlem yapılabilir :
1. Verilere dönüşüm uygulayarak, 1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını onların normal dağılıma uymalarını sağlamak.sağlamak.
2. Varolan verilere parametrik 2. Varolan verilere parametrik olmayan bir test uygulamakolmayan bir test uygulamak
KESTİRİM
• Bilimsel çalışmaların amacı, örneklem Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılırsınırları ya da hipotez testleri kullanılır
• Güven aralığı ve güven sınırları : Belirli bir Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. değerler aralığıdır.
• Sıklıkla %95, bazen de %90 ve %99 güven Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.sınırları kullanılmaktadır.
Hipotez testleri :
• Farklılık olmadığının varsayıldığı hipoteze, Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve hipotezi, başlangıç hipotezi adı verilir ve HHoo ile gösterilir. ile gösterilir.
• HH11 ile gösterilen alternatif hipotez adı ile gösterilen alternatif hipotez adı
verilen hipotez ise, Hverilen hipotez ise, Hoo hipotezinin tam hipotezinin tam
tersidirtersidir..
P değeri ve yanılma düzeyi :
• HHoo hipotezinin reddedilmesi için hipotezinin reddedilmesi için
hesaplanan olasılığın %5 ya da hesaplanan olasılığın %5 ya da daha az olması genellikle kabul daha az olması genellikle kabul edilen sınırdır; yani Hedilen sınırdır; yani Hoo
hipotezinin doğruluğu için hipotezinin doğruluğu için hesaplanan olasılık %5 ya da hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin daha küçükse, bu hipotezin kabul edilemeyeceği yargısına kabul edilemeyeceği yargısına varılırvarılır
• Parametrik ve nonparametrik Parametrik ve nonparametrik testlertestler : Istatistiksel analiz : Istatistiksel analiz yapılmadan önce, verilerin yapılmadan önce, verilerin kategorik (nominal, ordinal) ya kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. olmadığına bakılmalıdır.
• Kategorik verilerde parametrik Kategorik verilerde parametrik olmayan isatistikler kullanılırken, olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik sürekli verilerde ise parametrik istatistikler kullanılıristatistikler kullanılır
Testler
Parametrik Parametrik olmayan
İki ortalama arasındaki farkın anlamlılık testi t. test
Mann-Witney U testi
Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi
İki eş arasındaki farkın anlamlılık testi (t test)
Wilcoxon eşleştirilmiş iki örnek testi
Tekrarlı ölçümlerde varyans analizi (f testi)
4 gözlü Ki-Kare testi
Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi)
Bağımlı örneklerde ki-kare testi (McNemer testi)
Bağımlı gurup- bağımsız gurup kavramı
• Bağımlı gurupBağımlı gurup: bir gözlem : bir gözlem (denek) üzerinde birden çok (denek) üzerinde birden çok gözlem yapıldığında guruplar gözlem yapıldığında guruplar bağımlı olurbağımlı olur
• Bağımsız gurupBağımsız gurup: bir gurupta : bir gurupta bulunan gözlem (birey ) diğer bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup gurpta bulunmuyorsa gurup bağımsız olur.bağımsız olur.
TESTLER
BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI
• İki ortalama arasındaki farkın anlamlılık testiİki ortalama arasındaki farkın anlamlılık testi• T. Testi T. Testi • Gerekli koşullarGerekli koşullar1.Karşılaştırılacak iki gurup vardır1.Karşılaştırılacak iki gurup vardır2. Guruplar birbirinden bağımsızdır2. Guruplar birbirinden bağımsızdır3. Veriler sürekli veri gurubundadır3. Veriler sürekli veri gurubundadır4: evren dağılımları normal dağılım gösterir4: evren dağılımları normal dağılım gösterir5. Evren varyansları eşitti. 5. Evren varyansları eşitti.
Mann-Witney U testi
• İki ortalama arasındaki farkın İki ortalama arasındaki farkın anlamlılık testinin nonparametrik anlamlılık testinin nonparametrik karşılığıdır. karşılığıdır.
• Parametrik koşulları Parametrik koşulları sağlanmadığı durumda kullanılırsağlanmadığı durumda kullanılır
Bağımsız ikiden çok gurubun karşılaştırılması
• Tek yönlü varyans analizi Tek yönlü varyans analizi • İkiden çok bağımsız gurup İkiden çok bağımsız gurup
olduğunda ve parametrik olduğunda ve parametrik koşullar sağlandığında koşullar sağlandığında uygulanır.uygulanır.
• Nanparametdrik karşılığıNanparametdrik karşılığı Kruscal-WallisKruscal-Wallis varyans analizidir. varyans analizidir.
Varyans analizinde farkın kaynaklandığı gurubu belirleme
• Varyans analizinde guruplar arasındaki Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan farkın hangi gurup yada guruplardan kaynaklandığını belirlemede kaynaklandığını belirlemede
• 1. duncan yöntemi1. duncan yöntemi
• Tukey HSD yöntemiTukey HSD yöntemi
• Dunnet yöntemiDunnet yöntemi
• Student nevman-Keuls Yöntemi kullanılırStudent nevman-Keuls Yöntemi kullanılır
• Korelasyon: iki değişken Korelasyon: iki değişken arasında bağıntı olup olmadığını arasında bağıntı olup olmadığını araştırmaaraştırma
• Korelasyon katsayısı – r -Korelasyon katsayısı – r -
• Regrasyon analizi: bağıntının Regrasyon analizi: bağıntının türünü bulma türünü bulma
Korelasyon
Korelasyon
Matematik Notları
Fiz
ik N
otl
arı
Korelasyon kararı için bir-kaç veri yeter mi?
Ülke nüfusu
Ort
alam
a ö
mü
r
Korelasyon var mı?
Matematik Notları
Res
im N
otl
arı
Korelasyon var mı?
Frekans r*
5 0,878
10 0,632
15 0,514
20 0,444
30 0,361
40 0,312
Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.
Grafik Analizi
• Basit korelasyon işlemlerinde kullanılır.Basit korelasyon işlemlerinde kullanılır.
• Grafik çizimi işlem sırası:Grafik çizimi işlem sırası:
– Eksenlerin belirlenmesiEksenlerin belirlenmesi
– Uygun ölçek seçimiUygun ölçek seçimi
– Verilerin yerleştirilmesiVerilerin yerleştirilmesi
– Lineer grafik elde edilmesiLineer grafik elde edilmesi
– Eğim bulunması Eğim bulunması
Grafik Analizi
Eksenlerin belirlenmesi
Serbest değişken (birim)
Ba
ğlı
değ
işke
n(b
irim
)
Ölçek Seçimi
Hacim
Kü
tle
Her iki ölçek uygun değil
Ölçek Seçimi
Hacim
Kü
tle
Y ölçeği uygun değil
Ölçek Seçimi
X ölçeği uygun değil
Hacim
Kü
tle
Ölçek Seçimi
Hacim
Kü
tle
Uygun ölçek seçimi
Doğru çizimi
Hacim
Kü
tle
Doğru çizim
Yanlış çizim
Doğru çizimi
Hacim
Kü
tleYanlış ç
izim
Yanlış çizim
Doğru çizim
Eğim Bulunması
Zaman
Hız
Eğim= Hız/zaman = Tan!
Dikkat!