Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Belirli bir amaç için toplanmış verileri anlamlı haline getirmenin farklı yolları vardır.
Verileri sözel ifadelerle açıklama
Verileri tablolar halinde düzenleme
Verileri grafiklerle gösterme
Veriler üzerinde hesaplamalar yaparak istatistiksel ölçüler (ortalama gibi) elde etme
9/27/2018 2Yrd. Doç. Dr. Sedat Şen
Veriler üzerinde her zaman ilk yapılacak işlem veri değerlerini sıraya dizmektir. Bu sıralama işlemi büyükten küçüğe olabileceği gibi küçükten büyüğe olacak şekilde de yapılabilir.
Üzerinde herhangi bir işlem yapılmamış veriye ham veri denir.
9/27/2018 3Yrd. Doç. Dr. Sedat Şen
ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN
AHMET 42 FATMA 97 NURCAN 98
AHMET 81 GÜLLÜ 86 ÖMER 88
AYBERK 61 HACER 98 RAHİME 93
AYŞE 93 HASAN 75 SAİT 36
AYŞEGÜL 84 HAZARE 79 SALİH 69
BEDİA 80 İMRAN 88 SEDAT 71
BETÜL 84 KEMAL 79 SONGÜL 86
BÜŞRA 93 KÜBRA 93 TUBA 93
CUMA 81 MEDİNE 79 TUBA 95
ELİF 87 MEHMET 52 ÜMRAN 87
ESMA 86 MEHMET 69 YASEMİN 73
FATMA 91 MEHMET 84 ZEYNEP 77
FATMA 93 MERVE 85 ZEYNEP 86
Yrd. Doç. Dr. Sedat Şen 4
Hiçbir şekilde işlenmemiş üzerinde herhangi bir işlem yapılmamış puanlardan oluşan veriye ham veri denir.
9/27/2018
İlgilenilen değişkenin almış olduğu değerlerin küçükten büyüğe veya büyükten küçüğe sıralanmasıyla oluşan seriye “basit seri” denir.
Ancak, gözlem sayısının çok fazla olduğu basit seri ile hangi değer çevresinde
yığılma olduğunu görmek zordur. Bu nedenle, basit serinin frekans veya gruplandırılmış seriye dönüştürülmesi daha yararlı olabilir.
9/27/2018 5Yrd. Doç. Dr. Sedat Şen
Verilerin düzenlenmesi,puanların büyükten küçüğe ya da küçüktenbüyüğe doğru
sıralanmasıyoluyla yapılır. Puanlar sıralandıktan
sonra puan dizisinin üst ve alt sınırları rahatça belirlenir.
Puanlar 36 ile 98 arasında değişiklik göstermekte ve bazı puanlar birden fazla
gözlenmektedir.
Yrd. Doç. Dr. Sedat Şen
ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN
SAİT 36 BEDİA 80 ÖMER 88
AHMET 42 AHMET 81 İMRAN 88
MEHMET 52 CUMA 81 FATMA 91
AYBERK 61 MEHMET 84 KÜBRA 93
MEHMET 69 BETÜL 84 TUBA 93
SALİH 69 AYŞEGÜL 84 AYŞE 93
SEDAT 71 MERVE 85 RAHİME 93
YASEMİN 73 ESMA 86 FATMA 93
HASAN 75 GÜLLÜ 86 BÜŞRA 93
ZEYNEP 77 ZEYNEP 86 TUBA 95
KEMAL 79 SONGÜL 86 FATMA 97
HAZARE 79 ELİF 87 HACER 98
MEDİNE 79 ÜMRAN 87 NURCAN 98
69/27/2018
Puanlar Frekans Yüzde
36 1 2.56
42 1 2.56
52 1 2.56
61 1 2.56
69 2 5.13
71 1 2.56
73 1 2.56
75 1 2.56
77 1 2.56
79 3 7.69
80 1 2.56
81 2 5.13
84 3 7.69
85 1 2.56
86 4 10.26
87 2 5.13
88 2 5.13
91 1 2.56
93 6 15.38
95 1 2.56
97 1 2.56
98 2 5.13
Yrd. Doç. Dr. Sedat Şen 79/27/2018
İlgilenilen değişkenin almış olduğu farklı değerlerin küçükten büyüğe sıralanması ve bu değerlerin karşıısına kaç kez tekrar ettiğinin (frekansı) yazılmasıyla oluşturulan istatistik serisine “frekans serisi” denir.
9/27/2018 8Yrd. Doç. Dr. Sedat Şen
Öğrenci Yaş
Ahmet 20
Ayşe 20
Fatma 22
Mehmet 23
Derya 22
Gökhan 21
Hakan 22
Zeynep 23
Yunus 23
Zehra 23
9/27/2018 9Yrd. Doç. Dr. Sedat Şen
İlgilenilen değişken değerlerinin, belirlenen sınıflara (aralıklara) ayrılması ve bu sınıflara giren gözlem sayısının ayrı bir sütuna yerleştirilmesiyle oluşan seriye “gruplandırılmış seri” denir.
Frekans serisini, gruplandırılmış seri haline dönüştürürken sınıf aralığı büyüklüğü SturgesKuralı ya da araştırmacının görüşüne bağlı olarak belirlenir.
Sınıf aralığının keyfî olarak belirlenmesinde göz önüne alınması gereken kriter birbirine yakın gözlem değerlerinin bir araya getirilmesidir. Genellikle, en az 5 en fazla 20 sınıf sayısı önerilir.
9/27/2018 11Yrd. Doç. Dr. Sedat Şen
Elde edilen frekans tablosu uzunsa, bundan anlam çıkarmayı ve ilgili istatistiksel işlemleri kolaylaştırmak için, gözlenen ölçümleri teker teker sıralama yerine gruplama adı verilen bir işlem uygulanır. Gruplamanın amacı ardışık ölçümleri bir grup ya da kategoride toplamaktır. Bu sayede hem tabloyu kısaltabiliriz hem de istatistiksel hesaplamaları kolaylaştırabiliriz. Verileri gruplamaya karar verdikten sonra yapılacak ilk iş grup sayısına ve grup aralığına karar vermektir.
9/27/2018 12Yrd. Doç. Dr. Sedat Şen
Frekans tablosunda hem puanlar sıralanır, hem de puandan kaç tane olduğu sayılarak frekanslar bulunur. Ancak hem puan dağılımının hem genel durumu daha iyi görebilmek hem de hesaplamaları kolaylaştırmak için verilerin gruplandırılması gerekmektedir.
Verileri gruplandırırken öncelikle grup sayısı saptanır. Grup sayısının puan dağılımının gerçek özelliklerinin kaybolmaması için küçük seçilmemesine ve hesaplama işlemlerinin kolaylığı için büyük seçilmemesine dikkat edilmelidir. Ayrıca grup sayısının tek olması, puan dağılımında simetri sağladığı için, puanların 7,9,11 ve 13 gibi tek sayıda gruba ayrılması tavsiye edilir.
Yrd. Doç. Dr. Sedat Şen 139/27/2018
Veriyi gruplandırma yaparken:
Frekans tablosunun yaklaşık olarak kaç grup ya da kategoriden oluşması istendiği saptanır
Gözlenen en büyük ölçümden en küçük ölçüm çıkarılır.
En büyük ölçümle en küçük ölçüm arasındaki fark grup sayısına bölünür.
9/27/2018 14Yrd. Doç. Dr. Sedat Şen
Seçilecek olan aralık katsayısının durumu istatistiksel işlemleri etkiler. Aralık katsayısının çarpma ve bölme gibi işlemleri kullanacaksak kolaylık sağlaması açısından tam sayı olması daha iyidir.
9/27/2018 15Yrd. Doç. Dr. Sedat Şen
Puan Aralığı
Çetele Frekans Toplamlı Frekans
36-44 // 2 2
45-53 / 1 3
54-62 / 1 4
63-71 /// 3 7
72-80 /////// 7 14
81-89 ////////////// 14 28
90-98 //////////// 11 39
Yrd. Doç. Dr. Sedat Şen
(98-36)/7=8.9 aralık genişliği olarak hesaplanır. Bu katsayının 9 alınması uygun olur.
16
Puan Dağılımını7 gruba ayırmak istiyoruz
9/27/2018
Çalışmalarda, bazen istatistik serilerinde belli bir “değerden az” veya “değerden çok” gözlem sayılarına kolayca ulaşılmak istenebilir. Bu durumda, “birikimli seriler” söz konusudur. Gruplandırılmış seride her sınıfın frekansına, izleyen sınıfların frekansları eklenerek (veya toplam frekanstan eksiltilerek) oluşturulan seriye birikimli seri; birikimli seride her sınıfa karşı gelen frekansa da birikimli frekans ya da toplamlı frekans denir.
Birikimli seriler “-den az” ve “-den çok” olmak üzere iki şekilde oluşturulur.
Eğer, seride frekanslar eklenerek küçükten büyüğe doğru oluşturuluyorsa “-den az” serisi; büyükten küçüğe doğru eksiltilerek oluşturuluyorsa “-den çok” serisi söz konusudur.
9/27/2018 17Yrd. Doç. Dr. Sedat Şen
Aylık harcama Frekans Birikimli frekans
100-107’den az 3 3
108-114’den az 10 13
115-121’den az 12 25
122-128’den az 18 43
9/27/2018 18Yrd. Doç. Dr. Sedat Şen
Puanlar Frekans Toplamlı Frekans
36 1 1
42 1 2
52 1 3
61 1 4
69 2 6
71 1 7
73 1 8
75 1 9
77 1 10
79 3 13
80 1 14
81 2 16
84 3 19
85 1 20
86 4 24
87 2 26
88 2 28
91 1 29
93 6 35
95 1 36
97 1 37
98 2 39Yrd. Doç. Dr. Sedat Şen 199/27/2018
Toplamlı frekansın en altındaki değer sınıf mevcudunu verir. Bu veriye göre sınıf mevcudu 39’dur.
Yaş Frekans Birikimli Frekans
20 2 2
21 1 3
22 3 6
23 4 10
Tabloya göre 21 ve 21 yaş altındaki öğrenci sayısı 3’tür.Tabloya göre 21 yaş altındaki öğrenci sayısı 2’dir.
9/27/2018 20Yrd. Doç. Dr. Sedat Şen
iki veya daha fazla değişkene göre aldığı değerleri birlikte gösteren serilere “bileşik seri” denir. Değişken sayısı birden fazla olduğu için bu durumda değişkenlerden herhangi birine göre gözlem değerleri küçükten büyüğe doğru sıralanır ve diğer değişken değerleri de yeni sıralamaya göre düzenlenir. Bileşik seriler de basit, frekans ve gruplandırılmış seri olarak gösterilebilir.
9/27/2018 21Yrd. Doç. Dr. Sedat Şen
Boy (cm) Kilo (kg)
160 45
162 49
164 48
165 52
168 75
170 65
171 75
175 80
Bu tablo boy uzunluğuna göre sıralanmıştır.
9/27/2018 22Yrd. Doç. Dr. Sedat Şen
Günlük hayatta olsun, bilimsel çalışmalarda olsun, ilgilenilen olaya ilişkin sayılar
veya serilerin grafikle gösterimi daha yaygın olarak kullanılmaktadır. Çünkü, sayılara veya serilere bakıldığında görülemeyen birçok artış, azalış, eğilim gibi davranışlar grafik gösterimle kolayca görülebilir.
Pasta grafiği Çubuk grafiği Histogram Çizgi grafiği Serpilme grafiği
9/27/2018 23Yrd. Doç. Dr. Sedat Şen
21
1
3
7
14
11
Frekans
36-44
45-53
54-62
63-71
72-80
81-89
90-98
9/27/2018 24Yrd. Doç. Dr. Sedat Şen
Yrd. Doç. Dr. Sedat Şen
39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren çizgi grafiği
25
Frekans
Puan0
2
4
6
8
10
12
14
16
36-44 45-53 54-62 63-71 72-80 81-89 90-98
9/27/2018
Yrd. Doç. Dr. Sedat Şen
39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren bar grafiği
27
Puan
Frekans
0
2
4
6
8
10
12
14
16
36-44 45-53 54-62 63-71 72-80 81-89 90-98
9/27/2018
Bu da aynı verinin histogram grafiği ile gösterilmesi.
Yrd. Doç. Dr. Sedat Şen 289/27/2018
0
2
4
6
8
10
12
14
16
36-44 45-53 54-62 63-71 72-80 81-89 90-98
F
r
e
k
a
n
s
Puan Grubu
Histogram
Frekans
Bileşik serilerde değişkenler arasındaki ilişkiyi gösteren grafiğe serpilme grafiği (diyagram›) denir. Serpilme grafiğinde yatay eksende değişkenlerden biri, düşey eksende bir diğeri olmak üzere, istatistik birimine ilişkin iki değişken için sayı çifti işaretlenir. İşaretlenen bu noktaların dağılması (serpilmesi) değişkenler arasındaki ilişki hakkında görsel olarak bilgi verir.
4549 48
52
75
65
7580
0
10
20
30
40
50
60
70
80
90
155 160 165 170 175 180
K
i
l
o
Boy
Boy-Kilo Grafiği
Kilo
Linear (Kilo)
9/27/2018 29Yrd. Doç. Dr. Sedat Şen