Upload
others
View
9
Download
1
Embed Size (px)
Citation preview
Dr. Musa KILIÇ http://kisi.deu.edu.tr/musa.kilic
Değişkenler Arasındaki İlişkiler
Regresyon ve Korelasyon
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
1. Giriş • Bundan önceki bölümlerde incelediğimiz konular, bir tek
değişken için yorumlamalar yapmaya yönelik istatistik
yöntemler üzerinde yoğunlaşmıştı.
• Bu bölümde ise iki değişken arasındaki ilişkiler
incelenecektir. Bu kapsamda, değişkenlerin birbirlerinden
etkilenmeleri ve bu etkilenmelerin şekli ve derecesi
önemlidir.
2
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
1. Giriş • Örneğin; DEÜ’ndeki öğrencilerin
boy uzunlukları ve ağırlıkları arasında, – Bir ilişki var mıdır? – Varsa nasıl bir ilişki vardır? – Bu değişkenlerden birinin değeri
artarken veya azalırken diğeri nasıl etkilenir?
– Bu ilişki ne kadar güçlüdür?
• Ya da günlük hava sıcaklığı değişkeni ile günlük dondurma tüketimi değişkeni arasında, – Bir ilişki var mıdır? – Varsa nasıl bir ilişki vardır? – …
3
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
1. Giriş
4
Boy Uzunluğu – Ağırlık İlişkisi
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
1. Giriş
5
İplik Uzunluğu Boyunca Çap – Büküm Sayısı İlişkisi
Nm 64 numara yün ipliği
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
1. Giriş
6
İplik Uzunluğu Boyunca Çap – Mukavemet İlişkisi
Nm 64 numara yün ipliği
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
2. Değişkenler Arasındaki İlişkiler 2.1. Fonksiyonel İlişkiler İki değişken arasındaki fonksiyonel bir ilişki, kesin matematiksel bir formülle ifade
edilir.
• Örneğin, yere düşmekte olan cismin bırakıldığı yükseklik (h) ile düşme zamanı (t)
arasındaki ilişki günümüzde geçerliliği kanıtlanmış sağlam bir teoriye dayanır ve matematik bir fonksiyonla ifade edilir.
• Örneğin, bir malın satış miktarı (x) ile kazanılan TL (y) arasındaki ilişkiyi incelersek:
7
2 /t h g=
( )y f x=
Gözlenen değerler
düz bir çizgi
üzerinde yer
alırlar
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
2. Değişkenler Arasındaki İlişkiler 2.2. İstatistiksel İlişkiler İstatistiksel ilişki, fonksiyonel ilişkilerde olduğu gibi mükemmel değildir.
Değişkenler arasında istatistiksel ilişki varsa, gözlenen değerler düz bir çizgi boyunca yer almazlar.
Bu tip ilişkiler daha çok günlük hayattan deney ve gözlemler sonucunda elde edilen veriler arasındaki ilişkileri açıklamak üzere kurulur.
Bu tip ilişkiler açıklamak üzere kesin bir matematik formülle ifade edilen bir teori ya da kanun yoktur.
Örneğin; UZUNLUK-AĞIRLIK Burada gözlenen değerlerin arasındaki ilişkiler için kesin bir formül yoktur. Ancak gözlenen değerlere dayanarak bu ilişkiyi açıklayan bir matematik model oluşturulabilir. Daha sonra bu model belirli bir boy uzunluğundaki herhangi bir öğrencinin ağırlığını
tahminlemek için kullanılabilir.
8
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Bağımsız Değişkenler x Değerlerini ya biz arzumuza göre
belirleriz ya da kontrol etmeden aldıkları değerleri gözleriz.
9
3. Regresyon Analizinde Değişken Türleri Bağımlı Değişkenler y Bağımsız değişkenlerin
değerlerinin değişmesi ile bunlara bağlı olarak değerleri değişen değişkenlerdir.
Dependent Response
Independent Explanatory Predictor
ÖRNEK: Gübre (x) – Verim (y)
Hava Sıc. (x) – Dondurma Tük. (y)
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
İki değişken arasındaki ilişkiyi açıklarken doğru denklemi kullandığımız regresyon modelidir.
Burada, β0 ve β1 sabit sayılardır. β1 : Doğrunun eğimidir. β0 : Doğrunun y eksenini kesme noktasıdır.
10
4. Basit Doğrusal Regresyon
0 1y xβ β= +
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Grafik incelendiğinde genel olarak boy uzunluğu arttıkça ağırlığın da arttığı görülmektedir.
Ancak, oluşan noktalar düz bir çizgi üzerinde değildirler.
Pratik amaçlar için ilişkinin bir doğru şeklinde olduğunu ve bu doğrudan sapmaların şansa bağlı olarak meydana geldiğini varsayabiliriz.
Bu varsayım altında ilişkinin matematik ifadesi:
şeklindedir. Burada, yi: Bir öğrencinin ağırlığını xi: o öğrencinin boy uzunluğunu εi: o öğrencinin ağırlığının, ilişkiyi
açıklayan doğrudan ne kadar saptığını gösterir. HATA (ERROR) olarak isimlendirilir.
11
4. Basit Doğrusal Regresyon
ε1
ε2
0 1 1, 2,3,...,i i iy x i nβ β ε= + + =Bu doğrunun hesaplanabilmesi için β0 ve β1
değerlerinin bilinmesi gerekir. Ancak β0 ve β1 birer parametredir ve hesaplanmaları için
populasyona ait tüm değerler bilinmelidir. Bu mümkün olmadığından örneklemden giderek β0 ve β1’in tahminleri olan b0 ve b1 değerleri
hesaplanır.
Bu da gözlenen değerlerden geçen en iyi doğru denkleminin bulunması anlamına gelmektedir. (En Küçük Kareler Yön.)
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Gözlemleri en iyi açıklayan doğrunun belirlenmesi için çeşitli yöntemler ileri sürülebilir.
Günümüzde en çok kullanılan yöntem “En Küçük Kareler” adı ile bilinen yöntemdir.
En Küçük Kareler yöntemi, gözlemlerin belirlenen doğrudan olan uzaklıklarının kareleri toplamının en küçük yapılmasına dayanan yöntemdir.
12
5. En Küçük Kareler Yöntemi (Method of Least Squares)
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Modelin hata terimi: En Küçük Kareler yöntemine göre bu eşitliğin her i = 1, 2, 3, …, n değeri için karelerinin toplamı alınır. Daha sonra bu ifadeyi en küçük yapan, β0 ve β1’in tahminleri olan b0 ve b1’i bulabilmek için yukarıdaki eşitliğin β0 ve β1’e göre türevleri alınıp 0’a eşitlenir.
13
5. En Küçük Kareler Yöntemi (Method of Least Squares)
0 1( )i i iy xε β β= − +
0 1 1, 2,3,...,i i iy x i nβ β ε= + + =
0 1i i iy xε β β= − −
2 20 1
1 1( )
n n
i i ii i
y xε β β= =
= − −∑ ∑
20 1 0 1
1( , ) ( )
n
i ii
H y xβ β β β=
= − −∑
0 110
2 ( ) 0n
i ii
H y xδ β βδβ =
= − − − =∑
0 111
2 ( ) 0n
i i ii
H x y xδ β βδβ =
= − − − =∑
Bu denklemleri β0 ve β1’in tahminleri olan b0 ve b1’i yerlerine koyarak çözersek:
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Böylece verilerimizden geçen en iyi doğrunun denklemi: olarak bulunur.
14
5. En Küçük Kareler Yöntemi (Method of Least Squares)
1 1
11 2
2 1
1
1, 2,3,...,
n n
i ini i
i ii
n
ini
ii
x yx y
nb i nx
xn
= =
=
=
=
−= =
−
∑ ∑∑
∑∑
0 1b y b x= −
0 1y b b x= +
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Regresyon denklemi tahminlendikten sonra bu denklemin ilişkiyi ne derece açıkladığının ve bu denklem kullanılarak yapılacak tahminlerin ne derece hassas olacağının araştırılması gerekir.
15
6. Regresyon Belirleme Katsayısı ˆ ˆ( ) ( ) ( )i i i iy y y y y y− = − + −
2 2 2ˆ ˆ( ) ( ) ( )i i i iy y y y y y− = − + −∑ ∑ ∑
Eğer gözlenen değerlerin hepsi tahmin edilen doğru üzerinde olsa idi “Hata Kareler Toplamı (SSE)” “0” olacak ve uyumun çok iyi olduğu söylenebilecekti.
Buradan giderek, regresyon doğrusunun ne derece iyi bir tahminleyici olduğunu “Regresyon Kareler Toplamı (SSR)”nın “Genel Kareler Toplamı (SSTO)”na oranına bakarak söyleyebiliriz. Bu oran “Regresyon Belirleme Katsayısı” olarak bilinir ve r2 olarak gösterilir.
( )( )
22 22 12
22 2
/ˆ( )Regresyon Kareler Toplamı SSRGenel Kareler Toplamı SSTO ( ) /
i ii
i i i
b x x ny yr
y y y y n
−− = = = =− −
∑ ∑∑∑ ∑ ∑
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 16
6. Regresyon Belirleme Katsayısı
İspat:
( )( )
22 22 1
22 2
/ˆ( )( ) /
i ii
i i i
b x x ny yy y y y n
−− =− −
∑ ∑∑∑ ∑ ∑
[ ]
( )( )
2 20 1 0 1
21
2 2 21
2 2 21
2
2 21 2
ˆ( ) ( )
( )
( 2 )
2
2
i i
i
i i
i i
iii i
y y b b x b b x
b x x
b x x x x
b x x x nx
xxb x x n
n n
b
− = + − −
= −
= − +
= − +
= − +
=
∑ ∑∑∑∑ ∑
∑∑∑ ∑
( )2
2 21
ii
xx
n
−
∑∑
( )
( )
2 2 2
2 2
2
22
2
2
( ) ( 2 )
2 1
2
i i i
i i
iii i
ii
y y y y y y
y y y y
yyy y n
n n
yy
n
− = − +
= − +
= − +
= −
∑ ∑∑ ∑ ∑
∑∑∑ ∑
∑∑
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
• Korelasyon (Fr. Corrélation) TDK’ya göre: – Bağıntı, – Bağlılık, – Bağlılaşım, – Her ikisi de nicel olan herhangi bir x tesadüfi değişkeniyle y
tesadüfi değişkenin aldığı değerler dizisi arasında bir uygunluk hâlinin olup olmadığını araştıran yöntem.
• İki değişken arasındaki ilişkiye korelasyon, bu ilişkinin derecesini belirleyen sayısal ifadeye de korelasyon katsayısı denilmektedir.
• Korelasyon katsayısı, bağımlı değişken ile bağımsız değişken arasında bir ilişki bulunup bulunmadığını; ilişki varsa bu ilişkinin gücünü belirlemeye yarar.
17
7. Korelasyon
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
• Korelasyon katsayısı “r” ile gösterilmektedir ve -1 ile +1 arasında değer almaktadır.
• Korelasyon katsayısının işareti ilişkinin yönünü belirlemektedir: – r>0 değişkenlerden
birinin değeri artarken diğerinin de değeri artar.
– r<0 değişkenlerden birinin değeri artarken diğerinin değeri azalır.
– r=0 iki değişken arasında doğrusal bir ilişki yoktur.
18
7. Korelasyon
r > 0 r < 0
r = 0
r = +1
r = -1
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 19
7. Korelasyon
Korelasyon Katsayısı:
( ) ( )2 2
2 2
1, 2,3,...,i i
i i
i ii i
x yx y
nr i nx y
x yn n
−= =
− −
∑ ∑∑
∑ ∑∑ ∑
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
Örnek 1 Aşağıdaki tabloda 20 yaşındaki erkek öğrencilerin boy uzunluğu (cm) ve ağırlık (kg) değerleri yer almaktadır.
a. Bağımlı ve bağımsız değişkenleri belirleyiniz.
b. Tablodaki değerleri serpme diyagramı şeklinde gösteriniz.
c. Sizce bu iki değişken arasında herhangi bir ilişki var mıdır?
d. İlişki varsa sizce nasıl bir ilişkidir? e. Boy uzunluğu ve ağırlık değişkenleri için
regresyon denklemini bulunuz. f. 3 m boyundaki bir gencin ağırlığı kaç kg
olabilir? g. Regresyon belirleme katsayısı kaçtır?
20
Boy Uzunluğu (cm) Ağırlık (kg) 170 68 165 63 155 52 185 89 176 83 159 60 173 82 188 92 174 75 161 68 166 70 180 75 157 51 157 63 169 76 183 90 181 85
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
• Buca’da yapılan bir araştırma sonucunda 11 apartman dairesinin metrekare alanları ve kiralarına ilişkin değerler aşağıdaki tabloda verilmiştir:
• Bağımsız ve bağımlı değişkenleri belirleyiniz.
• Serpme diyagramını çiziniz.
• İki değişken arasında ilişki var mıdır? (korelasyon katsayısını bulunuz)
• Gözlemleri en iyi açıklayan doğrunun denklemini bulunuz.
(regresyon denklemini bulunuz)
• Dairelerin alanlarındaki değişim ev kiralarındaki değişimin ne kadarını açıklamaktadır?
(regresyon belirleme katsayısını bulunuz) 21
Örnek 2
Dairenin Alanı (m2) Kira (TL)
130 450
120 400
90 250
100 350
160 700
150 650
105 375
80 225
140 500
125 440
110 360
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic
• DEÜ Tekstil Mühendisliği Bölümü’nde “İstatistiğe Giriş” dersini alan öğrenciler arasında yapılan bir araştırma sonucunda öğrencilerin devamsızlıkları ile geçme notları aşağıdaki gibi belirlenmiştir. Öğrencilerin devamsızlıkları ve geçme notları arasında istatistiksel açıdan önemli bir ilişki bulunup bulunmadığını belirleyiniz.
22
Örnek 3
Devamsızlık (Hafta) Not 4 3 1 4 6 2 3 3 2 3 9 1 7 1 4 3 2 4 5 2
http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 23
Devamsızlık (Hafta) xi
Not yi xi
2 yi2 xiyi
4 3 16 9 12 1 4 1 16 4 6 2 36 4 12 3 3 9 9 9 2 3 4 9 6 9 1 81 1 9 7 1 49 1 7 4 3 16 9 12 2 4 4 16 8 5 2 25 4 10
Toplam 43 26 241 78 89
Çözüm 3
( ) ( )2 2
2 2
i ii i
i ii i
x yx y
nrx y
x yn n
−=
− −
∑ ∑∑
∑ ∑∑ ∑
0,944r = −
• α = 0,05 ve (n – 2) = (10 – 2) = 8 serbestlik derecesi için rkritik = 0,632
• r > rkritik
• 0,944 > 0,632
• YORUM: α = 0,05 için öğrencilerin devamsızlıkları ile geçme notları arasındaki ilişki istatistiksel açıdan önemlidir.