Upload
zeynep-oeztuerk
View
447
Download
0
Embed Size (px)
Citation preview
BÖLÜM 1: Temel Kavramlar
İSTATİSTİK
İstatistik Nedir?
İstatistik, belirsizliğin veya eksik bilginin söz konusu
olduğu durumlarda çıkarımlar yapmak ve karar
vermek için sayısal verilerin toplanması, analizi ve
kullanılmasını içeren bir disiplindir. İstatistik bir çok
bilim dalının kullandığı bir araçtır.
İstatistik doğal olarak görülen değişkenlik üzerine
vurgu yapar
Değişkenler
Bir nesnenin özelliklerini ölçtüğümüz zaman,
nesneden nesneye fark eden bir değer elde
ederiz. Örneğin bu sınıftaki kişileri nesne ve kişilerin
boylarını onların özelliği olarak düşünebiliriz
Boy özelliği nesneden nesneye değişim gösterir. Bu
özelliğinden dolayı da değişken olarak adlandırılır.
Veri Türleri (Veri Ölçüm Düzeyleri)
Değişkenler 4 farklı ölçüm seviyesinde ölçülebilirler
Bu farklı ölçüm düzeylerini bilmeniz ve anlamanız
oldukça önemlidir.
1. Nominal - Kategorik
Veriler bir yada daha fazla kategoriye göre
sınıflandırılarak ölçüldükleri zaman, veri nominal
seviyede ölçülmüş demektir.
Ör: Renk, Cinsiyet, Dini ve politik tercihler, vs.
2. Sıralı (Ordinal)
Ölçümün farklı kategorileri arasında bir sıra (öncelik) durumu var ancak sıralar arasındaki mesafe eşit veya ölçülebilir değilse, ölçüm seviyesi sıralıdır.
Ör: Eğitim durumu, askeri rütbe, elbise büyüklüğü, vs.
Kategoriler arasıda bir sıra farkı vardır ancak bu farkın büyüklüğü belirli değildir.
3. Aralık (Interval)
Ölçüm değerleri arasında büyüklük olarak ölçülen
bir farklılık var ancak mutlak bir sıfır noktası yoksa,
ölçüm seviyesi aralık seviyesindedir.
Hava sıcaklığı en iyi örnektir.
4. Oran (Ratio)
Veriler arasındaki fark sayısal olarak belirli ve
mutlak bir sıfır noktası var ise, ölçüm seviyesi oran
olarak adlandırılır.
Ör: Ağırlık, yaş, boy, vs.
İstatistik Türleri
Tanımlayıcı (descriptive) İstatistik
Verileri toplama, sunma ve açıklama
Çıkarımsal (inferential) İstatistik
Örneklem verilerine dayalı olarak ana kütle
hakkında çıkarımlar yapma veya karar verme
Tanımlayıcı İstatistik
Veri Toplama
Ör: Anket, Gözlem, Deney
Verileri Sunma
Ör: Grafikler
Veri Özelliklerini Belirleme
Ör: Ortalama = n
x i
Çıkarımsal İstatistik
Örneklem (sample) sonuçlarına bakarak ana kütle
(population) hakkında yorumlarda bulunmak
Örneklem istatistikleri Ana kütle parametreleri
(biliniyor) Çıkarım (bilinmiyor, ancak
örnekleme bakılarak
tahmin edilebilir)
SamplePopulation
Çıkarımsal İstatistik
Bir ana kütle hakkında örneklem sonuçlarına dayalı olarak
çıkarımlarda bulunmak veya karar vermek.
Tahmin
Ör: Ana kütledeki ortalama ağırlığı örneklem ortalama
ağırlığını kullanarak tahmin etmek
Hipotez Testi
Ör: Örneklem verilerine dayalı olarak ana kütle ortalama
ağırlığının 60 kg. olduğu iddiasını test etmek
Örneklem Alma
Bilimsel araştırmalarda çoğu zaman bir örneklem üzerinden toplanan veriler kullanılarak analizler yapar ve çıkarımlarda bulunuruz. Araştırma sonuçlarının geçerliliği bu örneklemin ana kütleyi temsil gücüne bağlıdır. Bu nedenle örneklemin ana kütleyi temsil etmesi oldukça önemlidir.
Bir örnekleme dayalı olarak yapılan çıkarımların kalitesi hem örnekleme yöntemi hem de örneklemin büyüklüğü ile ilişkilidir. Dolayısıyla uygun yöntem ve büyüklükte örneklem oluşturmak oldukça önemlidir.
Örneklem Alma…
Ana kütle araştırmanın ilgilendiği kişi, nesne veya olayların bütününe verilen isimdir. Eğer bir çalışmada ana kütlenin tümünden veri toplanırsa buna tamsayım denir.
Örneklem bir ana kütleden seçilen elemanların oluşturduğu kümedir.
Örneklem almamıza neden olan şey ana kütlenin tümü hakkında veri toplamanın gerektirdiği çaba, zaman ve maliyetin yüksek oluşu veya bazen imkansız oluşudur.
Örneklem almanın amacı ise yukarıdaki sayılan nedenlerle tüm verileri ölçülemeyen ana kütle hakkında ondan seçilen örneklemden edinilen bilgilere dayalı olarak çıkarımlarda bulunmaktır.
Örneklem Alma…
Ana kütle parametresi: Ana kütlenin herhangi bir özelliği. Yunan harfleri ve büyük harfler ile gösterilir (N,µ)
Örneklem istatistiği: Örneklemin ölçülen bir özelliği. Latin harfleri ve küçük harfler ile gösterilir (n,s)
Örneklem Hatası: Genellikle araştırmalarda tamsayım yapılıp ana kütle parametresi hesaplanmaz. Ancak ana kütleden seçilen bir örneklemin istatistiği hesaplanır ve bu istatistiğe dayalı olarak ana kütle parametresi tahmin edilmeye çalışılır. Tamsayım yerine örneklem alındığı için oluşan hata örneklem hatası olarak adlandırılır.
Örneklem Alma…
Örneklem çerçevesi: Örnekleme girebilecek bütün
birimleri içeren liste (seçmen kütükleri, bir şirketteki
işçi kayıtları, öğrenci işleri veritabanı, vb.)
Örneklem alma yöntemleri
Örneklem alma yöntemleri tesadüfi olan ve olmayan olmak üzere iki ana grupta toplanabilir. Tesadüfi olan yöntemlerde bütün birimlerin örnekleme girme şansı varken tesadüfi olmayan yöntemlerde bu durum söz konusu değildir. Aşağıda her iki gruba giren temel yöntemler verilmiştir
1. Tesadüfi (rassal, random) örnekleme yöntemleri
a. Basit rassal
b. Sistematik
c. Tabakalı
d. Küme
2. Tesadüfi olmayan (non-random) örnekleme yöntemleri
a. Kolayda
b. Yargısal
c. Kota
d. Kartopu
Basit rassal örnekleme
Her birimin örnekleme girme şansı eşittir.
Torbadan isimleri seçme yerine günümüzde rastsal
sayı üreten bilgisayar yazılımları kullanılıyor.
Sistematik Örnekleme
Seçilecek örneklem büyüklüğünü belirle (n)
G = N / n
1 ile G arasından rastgele bir sayı seç (X)
X, G+X, 2G+X… elemanları seç
N = 64
n = 8
k = 8 1. grup
Tabakalı örnekleme
Basit rassal örneklemede yeterince büyüklükte bir örneklem oluşturulmazsa,
ana kütledeki bütün gruplar alınan örneklem içinde yeterince temsil
edilmeyebilir. Bu nedenle ana kütle önemli özelliklere göre gruplara
(tabakalara) ayrılıp her grubu temsil edecek tabakalardan seçme yapılır.
Amaç daha az bir maliyetle daha temsili bir örneklem oluşturmaktır.
Öncelikle ana kütle tabakalara ayrılır. Her tabakadan rastsal bir şekilde
örneklem seçilir.
Tabakaları oluşturmak zor olabilir.
Ana kütle 4
tabakaya
bölünmüş
Örneklem
Küme Örneklemesi
Ana kütlenin zaman veya mekan açısından dağınık olduğu ve
bu nedenle örneklemenin maliyetli olacağı durumlarda
örnekleme işinin belirli kümelerden (ör: bölgelerden) rassal bir
şekilde yapılmasıdır.
Örneğin bir şehirdeki ilköğretim öğrencileri ile ilgili yapılacak
bir çalışmada bütün ilköğretim okullarını çalışmaya dahil etmek
yerine belirli semtlerdeki ilköğretim okullarından rastgele
örneklem almak küme örneklemesidir.
Ana kütle 16
kümeye ayrılmış
Bu kümelerden
rastgele bir kısmı
seçiliyor
Kolayda (fırsat) örneklemesi
Araştırmacının kolaylıkla ulaşabildiği birimlerden
veri toplamasıdır. Örneğin üniversite öğrencileri
hakkında araştırma yapan bir araştırmacının
üniversite karşılaştığı ilk150 öğrenci ile anket
yapması gibi
Kolaydır ancak elde edilen sonuçlar
genelleştirilemez
Yargısal örnekleme
Araştırmacının araştırma örneklemi belirlerken bir
yargıya göre hareket ederek örneklem
oluşturmasıdır. Örneğin öğretim üyelerinin sorunları
hakkında araştırma yaparken konuyu en iyi
profesörlerin bileceğinin düşünerek sadece onları
örnekleme dahil eden bir araştırmacı yargısal bir
örnekleme oluşturmuş olur.
Kota örneklemesi
Tabakalı örneklemede olduğu gibi ana kütle
gruplara ayrılır. Daha sonra örneklem büyüklüğüne
bağlı olarak her gruptan ne kadar (kota) örneklem
seçileceğine karar verilir. Grup kotaları
dolduruluncaya kadar veri toplanır. Bu verilerin
tesadüfi olarak toplanmasına bakılmaz sadece kota
doldurulmaya çalışılır.
Kartopu örneklemesi
Örneklem çerçevesinin oluşturulmasının mümkün veya
çok zor olduğu durumlarda kullanılır. Örneğin
madde bağımlı çocuklarla ilgili yapılan bir
çalışmada madde bağımlısı bir veya birkaç
çocuktan veri toplanır. Daha sonra bunların tanıdığı
başka madde bağımlısı çocuk bulunur ve onlardan
veri toplanır. Böylece veri kümesi kartopu gibi
büyüyerek örneklem oluşturulmuş olur.