23
Dr. Musa KILIÇ http://kisi.deu.edu.tr/musa.kilic Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyon

Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

  • Upload
    others

  • View
    9

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

Dr. Musa KILIÇ http://kisi.deu.edu.tr/musa.kilic

Değişkenler Arasındaki İlişkiler

Regresyon ve Korelasyon

Page 2: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

1. Giriş • Bundan önceki bölümlerde incelediğimiz konular, bir tek

değişken için yorumlamalar yapmaya yönelik istatistik

yöntemler üzerinde yoğunlaşmıştı.

• Bu bölümde ise iki değişken arasındaki ilişkiler

incelenecektir. Bu kapsamda, değişkenlerin birbirlerinden

etkilenmeleri ve bu etkilenmelerin şekli ve derecesi

önemlidir.

2

Page 3: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

1. Giriş • Örneğin; DEÜ’ndeki öğrencilerin

boy uzunlukları ve ağırlıkları arasında, – Bir ilişki var mıdır? – Varsa nasıl bir ilişki vardır? – Bu değişkenlerden birinin değeri

artarken veya azalırken diğeri nasıl etkilenir?

– Bu ilişki ne kadar güçlüdür?

• Ya da günlük hava sıcaklığı değişkeni ile günlük dondurma tüketimi değişkeni arasında, – Bir ilişki var mıdır? – Varsa nasıl bir ilişki vardır? – …

3

Page 4: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

1. Giriş

4

Boy Uzunluğu – Ağırlık İlişkisi

Page 5: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

1. Giriş

5

İplik Uzunluğu Boyunca Çap – Büküm Sayısı İlişkisi

Nm 64 numara yün ipliği

Page 6: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

1. Giriş

6

İplik Uzunluğu Boyunca Çap – Mukavemet İlişkisi

Nm 64 numara yün ipliği

Page 7: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

2. Değişkenler Arasındaki İlişkiler 2.1. Fonksiyonel İlişkiler İki değişken arasındaki fonksiyonel bir ilişki, kesin matematiksel bir formülle ifade

edilir.

• Örneğin, yere düşmekte olan cismin bırakıldığı yükseklik (h) ile düşme zamanı (t)

arasındaki ilişki günümüzde geçerliliği kanıtlanmış sağlam bir teoriye dayanır ve matematik bir fonksiyonla ifade edilir.

• Örneğin, bir malın satış miktarı (x) ile kazanılan TL (y) arasındaki ilişkiyi incelersek:

7

2 /t h g=

( )y f x=

Gözlenen değerler

düz bir çizgi

üzerinde yer

alırlar

Page 8: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

2. Değişkenler Arasındaki İlişkiler 2.2. İstatistiksel İlişkiler İstatistiksel ilişki, fonksiyonel ilişkilerde olduğu gibi mükemmel değildir.

Değişkenler arasında istatistiksel ilişki varsa, gözlenen değerler düz bir çizgi boyunca yer almazlar.

Bu tip ilişkiler daha çok günlük hayattan deney ve gözlemler sonucunda elde edilen veriler arasındaki ilişkileri açıklamak üzere kurulur.

Bu tip ilişkiler açıklamak üzere kesin bir matematik formülle ifade edilen bir teori ya da kanun yoktur.

Örneğin; UZUNLUK-AĞIRLIK Burada gözlenen değerlerin arasındaki ilişkiler için kesin bir formül yoktur. Ancak gözlenen değerlere dayanarak bu ilişkiyi açıklayan bir matematik model oluşturulabilir. Daha sonra bu model belirli bir boy uzunluğundaki herhangi bir öğrencinin ağırlığını

tahminlemek için kullanılabilir.

8

Page 9: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Bağımsız Değişkenler x Değerlerini ya biz arzumuza göre

belirleriz ya da kontrol etmeden aldıkları değerleri gözleriz.

9

3. Regresyon Analizinde Değişken Türleri Bağımlı Değişkenler y Bağımsız değişkenlerin

değerlerinin değişmesi ile bunlara bağlı olarak değerleri değişen değişkenlerdir.

Dependent Response

Independent Explanatory Predictor

ÖRNEK: Gübre (x) – Verim (y)

Hava Sıc. (x) – Dondurma Tük. (y)

Page 10: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

İki değişken arasındaki ilişkiyi açıklarken doğru denklemi kullandığımız regresyon modelidir.

Burada, β0 ve β1 sabit sayılardır. β1 : Doğrunun eğimidir. β0 : Doğrunun y eksenini kesme noktasıdır.

10

4. Basit Doğrusal Regresyon

0 1y xβ β= +

Page 11: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Grafik incelendiğinde genel olarak boy uzunluğu arttıkça ağırlığın da arttığı görülmektedir.

Ancak, oluşan noktalar düz bir çizgi üzerinde değildirler.

Pratik amaçlar için ilişkinin bir doğru şeklinde olduğunu ve bu doğrudan sapmaların şansa bağlı olarak meydana geldiğini varsayabiliriz.

Bu varsayım altında ilişkinin matematik ifadesi:

şeklindedir. Burada, yi: Bir öğrencinin ağırlığını xi: o öğrencinin boy uzunluğunu εi: o öğrencinin ağırlığının, ilişkiyi

açıklayan doğrudan ne kadar saptığını gösterir. HATA (ERROR) olarak isimlendirilir.

11

4. Basit Doğrusal Regresyon

ε1

ε2

0 1 1, 2,3,...,i i iy x i nβ β ε= + + =Bu doğrunun hesaplanabilmesi için β0 ve β1

değerlerinin bilinmesi gerekir. Ancak β0 ve β1 birer parametredir ve hesaplanmaları için

populasyona ait tüm değerler bilinmelidir. Bu mümkün olmadığından örneklemden giderek β0 ve β1’in tahminleri olan b0 ve b1 değerleri

hesaplanır.

Bu da gözlenen değerlerden geçen en iyi doğru denkleminin bulunması anlamına gelmektedir. (En Küçük Kareler Yön.)

Page 12: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Gözlemleri en iyi açıklayan doğrunun belirlenmesi için çeşitli yöntemler ileri sürülebilir.

Günümüzde en çok kullanılan yöntem “En Küçük Kareler” adı ile bilinen yöntemdir.

En Küçük Kareler yöntemi, gözlemlerin belirlenen doğrudan olan uzaklıklarının kareleri toplamının en küçük yapılmasına dayanan yöntemdir.

12

5. En Küçük Kareler Yöntemi (Method of Least Squares)

Page 13: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Modelin hata terimi: En Küçük Kareler yöntemine göre bu eşitliğin her i = 1, 2, 3, …, n değeri için karelerinin toplamı alınır. Daha sonra bu ifadeyi en küçük yapan, β0 ve β1’in tahminleri olan b0 ve b1’i bulabilmek için yukarıdaki eşitliğin β0 ve β1’e göre türevleri alınıp 0’a eşitlenir.

13

5. En Küçük Kareler Yöntemi (Method of Least Squares)

0 1( )i i iy xε β β= − +

0 1 1, 2,3,...,i i iy x i nβ β ε= + + =

0 1i i iy xε β β= − −

2 20 1

1 1( )

n n

i i ii i

y xε β β= =

= − −∑ ∑

20 1 0 1

1( , ) ( )

n

i ii

H y xβ β β β=

= − −∑

0 110

2 ( ) 0n

i ii

H y xδ β βδβ =

= − − − =∑

0 111

2 ( ) 0n

i i ii

H x y xδ β βδβ =

= − − − =∑

Bu denklemleri β0 ve β1’in tahminleri olan b0 ve b1’i yerlerine koyarak çözersek:

Page 14: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Böylece verilerimizden geçen en iyi doğrunun denklemi: olarak bulunur.

14

5. En Küçük Kareler Yöntemi (Method of Least Squares)

1 1

11 2

2 1

1

1, 2,3,...,

n n

i ini i

i ii

n

ini

ii

x yx y

nb i nx

xn

= =

=

=

=

−= =

∑ ∑∑

∑∑

0 1b y b x= −

0 1y b b x= +

Page 15: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Regresyon denklemi tahminlendikten sonra bu denklemin ilişkiyi ne derece açıkladığının ve bu denklem kullanılarak yapılacak tahminlerin ne derece hassas olacağının araştırılması gerekir.

15

6. Regresyon Belirleme Katsayısı ˆ ˆ( ) ( ) ( )i i i iy y y y y y− = − + −

2 2 2ˆ ˆ( ) ( ) ( )i i i iy y y y y y− = − + −∑ ∑ ∑

Eğer gözlenen değerlerin hepsi tahmin edilen doğru üzerinde olsa idi “Hata Kareler Toplamı (SSE)” “0” olacak ve uyumun çok iyi olduğu söylenebilecekti.

Buradan giderek, regresyon doğrusunun ne derece iyi bir tahminleyici olduğunu “Regresyon Kareler Toplamı (SSR)”nın “Genel Kareler Toplamı (SSTO)”na oranına bakarak söyleyebiliriz. Bu oran “Regresyon Belirleme Katsayısı” olarak bilinir ve r2 olarak gösterilir.

( )( )

22 22 12

22 2

/ˆ( )Regresyon Kareler Toplamı SSRGenel Kareler Toplamı SSTO ( ) /

i ii

i i i

b x x ny yr

y y y y n

−− = = = =− −

∑ ∑∑∑ ∑ ∑

Page 16: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 16

6. Regresyon Belirleme Katsayısı

İspat:

( )( )

22 22 1

22 2

/ˆ( )( ) /

i ii

i i i

b x x ny yy y y y n

−− =− −

∑ ∑∑∑ ∑ ∑

[ ]

( )( )

2 20 1 0 1

21

2 2 21

2 2 21

2

2 21 2

ˆ( ) ( )

( )

( 2 )

2

2

i i

i

i i

i i

iii i

y y b b x b b x

b x x

b x x x x

b x x x nx

xxb x x n

n n

b

− = + − −

= −

= − +

= − +

= − +

=

∑ ∑∑∑∑ ∑

∑∑∑ ∑

( )2

2 21

ii

xx

n

∑∑

( )

( )

2 2 2

2 2

2

22

2

2

( ) ( 2 )

2 1

2

i i i

i i

iii i

ii

y y y y y y

y y y y

yyy y n

n n

yy

n

− = − +

= − +

= − +

= −

∑ ∑∑ ∑ ∑

∑∑∑ ∑

∑∑

Page 17: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

• Korelasyon (Fr. Corrélation) TDK’ya göre: – Bağıntı, – Bağlılık, – Bağlılaşım, – Her ikisi de nicel olan herhangi bir x tesadüfi değişkeniyle y

tesadüfi değişkenin aldığı değerler dizisi arasında bir uygunluk hâlinin olup olmadığını araştıran yöntem.

• İki değişken arasındaki ilişkiye korelasyon, bu ilişkinin derecesini belirleyen sayısal ifadeye de korelasyon katsayısı denilmektedir.

• Korelasyon katsayısı, bağımlı değişken ile bağımsız değişken arasında bir ilişki bulunup bulunmadığını; ilişki varsa bu ilişkinin gücünü belirlemeye yarar.

17

7. Korelasyon

Page 18: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

• Korelasyon katsayısı “r” ile gösterilmektedir ve -1 ile +1 arasında değer almaktadır.

• Korelasyon katsayısının işareti ilişkinin yönünü belirlemektedir: – r>0 değişkenlerden

birinin değeri artarken diğerinin de değeri artar.

– r<0 değişkenlerden birinin değeri artarken diğerinin değeri azalır.

– r=0 iki değişken arasında doğrusal bir ilişki yoktur.

18

7. Korelasyon

r > 0 r < 0

r = 0

r = +1

r = -1

Page 19: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 19

7. Korelasyon

Korelasyon Katsayısı:

( ) ( )2 2

2 2

1, 2,3,...,i i

i i

i ii i

x yx y

nr i nx y

x yn n

−= =

− −

∑ ∑∑

∑ ∑∑ ∑

Page 20: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

Örnek 1 Aşağıdaki tabloda 20 yaşındaki erkek öğrencilerin boy uzunluğu (cm) ve ağırlık (kg) değerleri yer almaktadır.

a. Bağımlı ve bağımsız değişkenleri belirleyiniz.

b. Tablodaki değerleri serpme diyagramı şeklinde gösteriniz.

c. Sizce bu iki değişken arasında herhangi bir ilişki var mıdır?

d. İlişki varsa sizce nasıl bir ilişkidir? e. Boy uzunluğu ve ağırlık değişkenleri için

regresyon denklemini bulunuz. f. 3 m boyundaki bir gencin ağırlığı kaç kg

olabilir? g. Regresyon belirleme katsayısı kaçtır?

20

Boy Uzunluğu (cm) Ağırlık (kg) 170 68 165 63 155 52 185 89 176 83 159 60 173 82 188 92 174 75 161 68 166 70 180 75 157 51 157 63 169 76 183 90 181 85

Page 21: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

• Buca’da yapılan bir araştırma sonucunda 11 apartman dairesinin metrekare alanları ve kiralarına ilişkin değerler aşağıdaki tabloda verilmiştir:

• Bağımsız ve bağımlı değişkenleri belirleyiniz.

• Serpme diyagramını çiziniz.

• İki değişken arasında ilişki var mıdır? (korelasyon katsayısını bulunuz)

• Gözlemleri en iyi açıklayan doğrunun denklemini bulunuz.

(regresyon denklemini bulunuz)

• Dairelerin alanlarındaki değişim ev kiralarındaki değişimin ne kadarını açıklamaktadır?

(regresyon belirleme katsayısını bulunuz) 21

Örnek 2

Dairenin Alanı (m2) Kira (TL)

130 450

120 400

90 250

100 350

160 700

150 650

105 375

80 225

140 500

125 440

110 360

Page 22: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic

• DEÜ Tekstil Mühendisliği Bölümü’nde “İstatistiğe Giriş” dersini alan öğrenciler arasında yapılan bir araştırma sonucunda öğrencilerin devamsızlıkları ile geçme notları aşağıdaki gibi belirlenmiştir. Öğrencilerin devamsızlıkları ve geçme notları arasında istatistiksel açıdan önemli bir ilişki bulunup bulunmadığını belirleyiniz.

22

Örnek 3

Devamsızlık (Hafta) Not 4 3 1 4 6 2 3 3 2 3 9 1 7 1 4 3 2 4 5 2

Page 23: Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyondebis.deu.edu.tr/userweb/musa.kilic/tks4062/050... · 2013-05-23 · Buradan giderek, regresyon doğrusunun ne derece

http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic 23

Devamsızlık (Hafta) xi

Not yi xi

2 yi2 xiyi

4 3 16 9 12 1 4 1 16 4 6 2 36 4 12 3 3 9 9 9 2 3 4 9 6 9 1 81 1 9 7 1 49 1 7 4 3 16 9 12 2 4 4 16 8 5 2 25 4 10

Toplam 43 26 241 78 89

Çözüm 3

( ) ( )2 2

2 2

i ii i

i ii i

x yx y

nrx y

x yn n

−=

− −

∑ ∑∑

∑ ∑∑ ∑

0,944r = −

• α = 0,05 ve (n – 2) = (10 – 2) = 8 serbestlik derecesi için rkritik = 0,632

• r > rkritik

• 0,944 > 0,632

• YORUM: α = 0,05 için öğrencilerin devamsızlıkları ile geçme notları arasındaki ilişki istatistiksel açıdan önemlidir.