View
11
Download
0
Category
Preview:
Citation preview
www.ekonomianaliz.com
ÇOKLU REGRESYON ANALİZİNDE VARSAYIMLARDAN
SAPMALARIN İNCELENMESİ
1. ÇOKLU REGRESYON ANALİZİ VE VARSAYIMALARDAN SAPMALAR
1.1. Çoklu Regresyon modeli Varsayımları
1.2. Tahmincilerin anlamlılığının sınanması (R^2)
1.3. Regresyon Katsayılarının Anlamlığı için t Testi
1.4. Varyans analizi
2. VARSAYIMLARDAN SAPMALARIN İNCELENMESİ VE ÇÖZÜMYOLLARI
2.1. OTOKORELASYONUN SAPTANMASI (ARDIŞIK BAĞIMLILIK)
2.1.1. Otokorelasyonun Saptanması
2.1.1.1. Grafik Yöntemi
2.1.1.2. Durbin- Watson d İstatistiği
2.2. DEĞİŞEN VARYANS
2.2.1. Değişen varyansın nedenleri
2.2.2. Değişen Varyans Sınamaları
2.2.2.1. Park Testi
2.2.2.2. Glejser Testi
2.2.2.3. Guldfeld- Quandt Testi
2.2.2.4. Breusch-Pagan-Godfrey (BPG) Testi
2.3. ÇOKLU DOĞRUSAL BAĞLANTI
2.3.1. Çoklu Doğrusallığın Nedenleri
2.3.2. Çoklu Doğrusallığın Sonuçları
2.3.3. Çoklu Doğrusallığın Ortaya Çıkarılması
2.3.4. Çoklu Doğrusallığı Düzeltici Önlemler
2.4. NORMALLİKTEN SAPMALAR
Bu ders notu Fatih YAZ tarafından derlenmiştir.
1
www.ekonomianaliz.com
1. ÇOKLU REGRESYON ANALİZİ VE VARSAYIMALARDAN SAPMALAR
Ekonomi ve işletmecilik alanlarında herhangi bir bağımlı değişkeni tek bir bağımsız
değişken ile açıklamak mümkün değildir. Ekonomik modeller, genellikle birden fazla sebebin
sonucudurlar. Çok fazla sayıda değişken bir araya gelerek bir diğer değişkeni
etkileyebilmektedirler.
Bir değişkeni etkileyen iki ve daha fazla bağımsız değişken arasındaki neden- sonuç
ilişkilerini doğrusal bir modelle açıklamak ve bu bağımsız değişkenlerin etki düzeylerini
belirlemek için yararlanılan yönteme çoklu doğrusal regresyon analizi denir.1
Çoklu doğrusal regresyonda, bağımlı değişkeni etkileyen birden çok bağımsız değişken
1. Bağımlı değişkeni etkilediği düşünülen bağımsız değişkenlerden hangisi ya da hangilerinin
bağımlı değişkeni daha çok etkilediğini bulmak.
2. Bağımlı değişkeni etkilediği belirlenen değişkenler yardımıyla bağımlı değişken değerini
kestirebilmek.2
Olarak ifade edebiliriz.
’ler bağımsız değişkenleri ve Y de bağımlı değişkeni göstermek üzere en genel çoklu
regresyon denklemi;
Şeklinde yazılır.
1 Özdamar, K. (2003). SPSS ile Biyoistatistik
2 Alpar, R. (1997) . Uygulamalı Çok Değişkenli İstatistiksel Yöntemlere Giriş.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
2
www.ekonomianaliz.com
1.1. Çoklu Regresyon modeli Varsayımları
2. Model doğrusal kurulmuştur
3. X değerleri yinelenen örneklemelerde değişmez
X açıklayıcı değişkeninin yinelenen örneklemlerde aynı kaldığı düşünülür.
4. Bozucu teriminin ortalaması sıfırdır
varsayıma göre ’lerin verilmiş Xi değerlerine koşullu olan ortalaması sıfırdır.
5. ’nin varyansı (bütün Xi’ler için) aynıdır.
=
burada ‘var’ varyans demektir.
6. Bozucu (hata) terimleri arasında ardışık bağımlılık yoktur.
( )
burada i ile j farklı gözlemi, ‘orv’ ise ortak varyansı göstermektedir.
Xi’ye karşılık gelen ’ler ile Xj’ye karşılık gelen ’ler birbirinden bağımsızdır.
7. ile Xi’nin ortak varyansı sıfırdır.
Her hata terimi açıklayıcı değişkenden bağımsızdır.
8. Regresyon modeli doğru kurulmuş olmalıdır.
Başka bir değişle modelde kuruluş sapması ya da hatası bulunmamalıdır.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
3
www.ekonomianaliz.com
9. Açıklayıcı değişkenler arasında tam doğrusal ilişki bulunmamaktadır.3
Çoklu regresyon analizinde ancak bu varsayımların geçerli olması durumunda modeli
En-Küçük Kareler yöntemiyle tahmin edebiliriz. Unutmamamız gereken diğer bir varsayım da
parametrelerin NORMAL dağıldığıdır.
1.2. Tahmincilerin anlamlılığının sınanması ;
bağımlı değişkendeki değişimin % kaçının açıklayıcı değişkenlerle yapıldığını
gösterir.
∑
∑
Şeklinde yazılır ve
Arasında değer alır.
1’e yaklaştıkça bağımsız değişkenler bağımlı değişkeni tam açıklar.
0’a yaklaştıkça bağımsız değişkenler bağımlı değişkeni hiç açıklamaz.
3 Gujarati D. N. (1995); Temel Ekonometri. İSTANBUL Literatür Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
4
www.ekonomianaliz.com
1.3. Regresyon Katsayılarının Anlamlığı için t Testi
Merkezi limit teoremine göre gözlem sayısı (n) arttıkça bu rassal değişkenlerin toplam
dağılımları normal dağılıma yakınsar. Eğer normal dağılıma sahip bir yığın varsa bunların
doğrusal fonksiyonları da normal dağılır.
t testi modeldeki bağımlı değişken ile bu değişkeni açıklayan bağımsız değişkenler
arasındaki ilişkiyi gösteren parametrelerinin tek tek test edilmesinde kullanılır.4
H0: =0
HA: ≠0
Hipotezi altında t değerleri
Şeklindedir. Diğer parametreler için de aynı şekilde yazılır.
Şayet, seçilen anlamlılık düzeyinde hesaplanan t değeri kritik t* değerini aşıyorsa, sıfır
hipotezi reddedilir, değilse kabul edilir.
1.4. Varyans analizi;
t istatistiği bir regresyon denkleminde parametreleri tek tek test ederken, F istatistiği
değişkenleri içeren parametrelerin tümünü test eder; yani, bağımlı değişken ile bağımsız
değişken içeren parametreler arasında sıfırdan farklı bir ilişkinin olup olmadığına
bakmaktadır.
H0: =
HA: Parametreler aynı anda sıfır değildir.
4 Gujarati D. N. (1995); Temel Ekonometri. İSTANBUL Literatür Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
5
www.ekonomianaliz.com
Hipotezi altında F testi.
∑
⁄
∑
⁄
Şeklindedir. F testi yaptığımızda modeli tümüyle test edilir.5
2. VARSAYIMLARDAN SAPMALARIN İNCELENMESİ VE ÇÖZÜM
YOLLARI
Çoklu regresyon analizi bölümünde açıklanan varsayımlardan sapmalar olduğu
durumlarda yukarıda açıklanan yöntemlerle elde edilen sonuçların kullanılması ve ya
yorumlanmasında çok dikkatli davranmak gerekir. Bu başlık altında sapmaların nasıl
saptanacağı ve sapma belirlendiğinde nasıl davranılacağını inceleyeceğiz.
Varsayımlardan sapmalar sonucu oluşan durumları şu şekilde sıralayabiliriz;
1. Tahmin hataları arasında ( bağımlılık olması. (Otokorelasyon)
2. Tahmin hatalarının varyanslarının eşit olmaması.
3. Bağımsız değişkenler arasında bağımlılık olması.(Çoklu doğrusal bağlantı)
4. Hataların( normal dağılıma uymaması.6
Bu durmaları tek tek ele alalım;
5 KUTLAR A. (2006); Ekonometri Kılavuz kitap. ANKARA Arın Yayınları
6 ORHUNBİLGE N. (1996); Uygulamalı Regresyon ve Korelasyon Analizi. Avcıol Basım
Bu ders notu Fatih YAZ tarafından derlenmiştir.
6
www.ekonomianaliz.com
2.1. OTOKORELASYONUN SAPTANMASI (ARDIŞIK
BAĞIMLILIK)
Otokorelasyon, zaman içinde ya da mekan içinde sıralanan gözlem dizilerinin birimleri
arasındaki ilişkidir.7 Böyle bir ilişkinin olmadığı ekonometrik olarak
( ) şeklinde ifade edilir.
Ama hata terimleri arasında bir ilişki varsa yani otokorelasyon durumu söz konusu ise
( ) şeklinde ifade edilir.
Otokorelasyon durumunda parametrelerin en küçük kareler tahmincileri sapmasız ve
tutarlı olup, etkin değildir. Hata teriminin varyansının tahmincisi sapmalıdır ve bu yüzden
parametrelerin varyansları da sapmalı olur. Pozitif otokorelasyon varsa sapma negatif olur.
Yani varyanslar olduğundan küçük bulunur. Bunun sonucunda t test istatistiği değeri büyük
çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. R2 de yükselir. Dolayısıyla
F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip
yanıltıcı sonuç verirler.
Hata terimleri arasındaki otokorelasyonun varlığı genel olarak aşağıdaki ana nedenlere
dayanmaktadır8
Modele bazı açıklayıcı değişkenlerin alınmaması
Modelin matematiksel kalıbının yanlış seçilmesi
Bağımlı değişkenin ölçme hatalı olması
Verilerin sistematik incelenmesi
u’nun yanlış spesifikasyonudur.
2.1.1. Otokorelasyonun Saptanması
Otokorelasyon durumunu ortaya çıkarmada iki yöntem kullanılır. Birincisi grafik
metodu, ikincisi otokorelasyon testleridir. Durbin-Watson d istatistiği ve Breusch ve
Godfrey testleri kullanılabilir.
7 Kendall M. G. A Dictionary of statistical Terms
8 Koutsoyiannis A. (1989). Ekonometri Kuramı
Bu ders notu Fatih YAZ tarafından derlenmiştir.
7
www.ekonomianaliz.com
2.1.1.1. Grafik Yöntemi
Otokorelasyonun söz konusu olup olmadığı örnek hata terimi değerlerinden
faydalanarak grafik yoluyla tespit edilebilir. Bunun için ya zaman ile değerleri, ya da
ile değerleri alınarak elde edilen grafiklerin durumu tetkik edilir. Aşağıda pozitif ve
negatif otokorelasyon ve otokorelasyonun olmaması durumlarını gösteren bu grafikler yer
almaktadır.9
9 AKKAYA, Ş. ve PAZARLIOĞLU, V. (2000), Ekonometri-I
Bu ders notu Fatih YAZ tarafından derlenmiştir.
8
www.ekonomianaliz.com
Çizilen şekillere bakıldığında Şekil-1 ve Şekil-2’de noktalar sistematik
(düzenli) bir biçim göstermektedir. Şekil-3’te ise noktalar sistematik olmayan düzensiz bir
görünüm arz etmektedir. Şekil-1(a)’da noktalar önce sürekli artış gösteriyor, sonra belli bir
noktadan itibaren azalıp tekrar artıyor. Şekil-2(a)’da ise noktalar birden azalıp, yükseliyor. Bu
sebepten Şekil-1(a)’da pozitif, Şekil- 2(a)’da ise negatif otokorelasyon söz konusudur. Şekil-
3(a)’da noktalar zaman ekseni etrafında paralel dağılmakta ve artan veya azalan bir seyirleri
olmadığı için otokorelasyon söz konusu değildir.
2.1.1.2. Durbin- Watson d İstatistiği
Otokorelasyonu ortaya çıkarmada kullanılan en ünlü iki istatistikçilere aittir.
Testin aşamaları;
1) Hipotez yazılır
H0: =0
HA: ≠0
2) Anlamlılık seviyesi seçilir.
3) Durbin Watson d istatistiği hesaplanır.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
9
www.ekonomianaliz.com
∑
∑
normal denklemleri alınarak
∑
∑
hesaplanır ve elde edilen ρ yerine konulduğunda
d=2(1- ρ) denklemi ortaya çıkacaktır.
4) Karar durumu.
Durbin-Watson d tablosuna bakılarak değerleri bulunur. Böylece d
istatistiği aşağıdaki gibi ifade edilir;
Bu ders notu Fatih YAZ tarafından derlenmiştir.
10
www.ekonomianaliz.com
Örnek-1;10
%1 anlamlılık seviyesinde basit regresyon analizinde otokorelasyon durumunu
inceleyelim.
D
S
D
C
S
C
Z
D
%1 anlamlılık düzeyinde n=8 için d istatistiği tablomuza
baktığımızda regresyon modelinde otokorelasyon yoktur sonucuna varırız.
2.2. DEĞİŞEN VARYANS
Değişen varyans hata teriminin varyansının tüm gözlemler için aynı olmaması
durumudur.
E( ui2 ) = σ
2 ise Sabit varyans
E( ui2 ) = σi
2 ise Değişen varyans
10 ORHUNBİLGE N. (1996); Uygulamalı Regresyon ve Korelasyon Analizi. Avcıol Basım
Y X
1 2 1,25 -0,25 0,0625
2 3 2,188 -0,1875 0,035156 0,003906
3 5 4,063 -1,0625 1,128906 0,765625
5 6 5 0 0 1,128906
6 7 5,938 0,062 0,003844 0,003844
7 10 8,75 -1,75 3,0625 3,283344
8 7 5,938 2,062 4,251844 14,53134
8 8 6,875 1,125 1,265625 0,877969
TOPLAM 9,810376 20,59494
Bu ders notu Fatih YAZ tarafından derlenmiştir.
11
www.ekonomianaliz.com
değerlerine bağlı olarak ’nin koşullu varyansı, X değişkeni hangi değerleri alırsa alsın
değişmemeli, yani sabit varyanslı olmalıdır. Ortalama değişse bile ortalama etrafındaki
dağılım değişmemelidir. Aksi halde değişen varyans durumundan söz edilir.
2.2.1. Değişen varyansın nedenleri
1 - Hatasını öğrenen modeller: İnsan davranışları. Araba kullanma tecrübesi arttıkça hem
trafik hataları hem de bunların varyansı azalır. Ayrıca dersi alttan alan bir öğrencinin artık
hatasını bildiği için ikinci sefer ortalamasını yükseltebilir. Böylece ilk kez alanlarla arasında
fark oluşur.
2 - Veri derleme teknikleri: Veri derleme teknikleri geliştikçe varyans küçülür. Yani artık
ortalamadan çok fazla sapma oluşmaz.
3 - Dışa düşenlerin varlığı : Serinin çok uçtaki aşırı değerleri ortalamadan sapmalara neden
olur.
4 - Model kurma hataları: Özellikle gerekli açıklayıcı değişkenlerden biri ihmal edildiğinde
de değişen varyansa rastlanmaktadır.
Değişen varyans durumunda EKK tahmincileri doğrusal ve sapmasızdır ama etkin
değildir. Yani EDST (BLUE) değildir. Parametre tahmincilerinin varyansları da olduğundan
büyük çıkar. Bunun sonucunda t testi sonucu olduğundan küçük bulunur. Yani anlamlı bir
katsayının anlamsız olarak yorumlanması muhtemeldir.
Değişen varyans araştırması için grafik yöntemi ve bazı testler kullanılmaktadır.
Bunlar; Park testi, Goldfeld-Quandt testi, Glejser testi, Spearman sıra korelâsyon testi,
Breusch-Pagan-Godfrey testi ve White nR-kare testi.11
Grafik üzerindeki değişkenin
durumuna göre hata teriminin artan veya azalan olmaması, sabit olup belli bir ortalama
etrafında dağılması gerekir.12
11 Gujarati D. N. (1995); Temel Ekonometri. İSTANBUL Literatür Yayınları
12 KUTLAR A. (2006); Ekonometri Kılavuz kitap. ANKARA Arın Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
12
www.ekonomianaliz.com
2.2.2. Değişen Varyans Sınamaları
2.2.2.1. Park Testi: Park testi bir anlamda grafiği formülize etmektir.
Şayet anlamlıysa verilerde değişen varyansın olduğu kabul edilir.
Örnek-2:
Aşağıdaki verileri kullanarak değişen varyansın olup olmadığını göstermek için Park
sınaması yapalım.
ABD Endüstrisinde ortalama tazminat(Yi) ve ortalama verimlilik(Xi)
Regresyon modelinin EKK ile tahmin ettiğimizde
Yi=1992+0,233Xi bulunur.
ikinci aşamada
denklemi tahmin edilir.
burada 2,80 parametresinin t testi ile anlamlılığına bakılır.
t testi sonucu 2,80 parametresi anlamlı çıkmıştır.
Yi Xi Ui
3396 9355 -775,658 601645,333 13,307 9,144
3787 8584 -205,048 42044,682 10,646 9,058
4013 7962 165,851 27506,554 10,222 8,982
4104 8275 183,936 33832,452 10,429 9,021
4146 8389 199,378 39751,587 10,590 9,035
4241 9418 54,666 2988,372 8,002 9,150
4387 9795 112,841 12733,091 9,452 9,190
4538 10281 150,624 22687,589 10,030 9,238
4843 11750 113,410 12861,828 9,462 9,372
Bu ders notu Fatih YAZ tarafından derlenmiştir.
13
www.ekonomianaliz.com
Yani Hata terimleri arasında değişen varyansın olmadığı sonucuna varılır.13
2.2.2.2. Glejser Testi:
Glejser testi de Park testine benzer, ilk başta regresyon denklemi bulunur ve daha
sonra elde edilen ui’nin mutlak değeri Xi’ler ile regrese edilir.
Matematiksel gösterimi;
EKK ile tahmin edildiğinde
√
Şeklinde gösterilir.
parametresi anlamlıysa Değişen varyans durumuyla karşılaşırız.
2.2.2.3. Guldfeld- Quandt Testi:
Bu metot açıklayıcı değişkenlerden biri ile pozitif bir ilişki içerisinde olduğu durumda
uygulanır.
denkleminde ,Xi ile pozitif ilişkili olsun,
Yukarıdaki denkleme göre Xi’nin değeri büyüdükçe ’de büyüyecektir. Böyle bir durumda
modelde değişen varyansın olacağı beklenir.
Guldfeld- Quandt testini uygulamak için;
1) Bağımsız değişken küçükten büyüğe doru sıralanır.
13
Gujarati D. N. (1995); Temel Ekonometri. İSTANBUL Literatür Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
14
www.ekonomianaliz.com
2) Bir C sayısı belirlenir ve serinin ortasındaki C kadar gözlem seriden atılır. Seri (n-C)/2
şeklinde ikiye ayrılır.
3) İlk dilime ve son dilime EKK uygulanır ve Hata kareleri Toplamı (HKT) iki seri için
ayrı ayrı hesaplanır.
4) Daha sonra F istatistiğine uyumlu değeri hesaplanır.
Şayet değeri tablodaki kritik F* değerini aşıyorsa değişen varyanstan söz edilebilir.
2.2.2.4. Breusch-Pagan-Godfrey (BPG) Testi:
k değişkenli regresyon denklemini ele alalım;
1) Model tahmin edilir ve Hata terimleri ile maksimum olabilirlik tahmin edicisi elde
edilir.
2) Pi gibi bir değişken belirlenir.
3) Pi, M ile regrese edilir.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
15
www.ekonomianaliz.com
4) Hipotezimiz kurulur.
H0:
HA:
(
)
∑
5) H0 hipotezi kabul edilirse parametreler anlamsızdır. Değişen varyans yoktur.
Örnek -3:
BPG yöntemiyle değişen varyans olup olmadığını inceleyelim.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
16
www.ekonomianaliz.com
H0 Reddedilir. En az biri sıfırdan farklı. Değişen varyans vardır.14
Değişen varyan durumunu ortadan kaldırılması için önerilen çözümler;
Unutulmuş önemli bir açıklayıcı değişken varsa bu değişkenin modele ilave edilmesi.
Değişkenlerde dönüşümler yapılması.
Ağırlıklı en küçük kareler yönteminin uygulanması.
2.3. ÇOKLU DOĞRUSAL BAĞLANTI
Bir regresyon modelinde açıklayıcı değişkenlerin tümü veya bir kısmı aralarında tam
veya tama yakın bir doğrusal ilişkinin var olması anlamına gelir. Regresyon denklemlerinde
kullanılan açıklayıcı değişkenler arasında bazen doğruya yakın bir ilişki vardır. Yani bu
değişkenler arasında korelasyon katsayısı birdir. Böyle bir durumda parametreleri hesaplamak
imkânsızlaşır. Açıklayıcı değişkenler arası mükemmele yakın bir ilişki EKK metodunu
kullanılmaz hale getirir.
2.3.1. Çoklu Doğrusallığın Nedenleri;
Kullanılan veri toplama metodu,ana kütle içinde sadece sınırlı sayıda verilerin ele
alınması.
Değişkenlerin aynı etmenlerden etkilenmeleri.
Gibi çoğaltılabilir.
14
KUTLAR A. (2006); Ekonometri Kılavuz kitap. ANKARA Arın Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
17
www.ekonomianaliz.com
2.3.2. Çoklu Doğrusallığın Sonuçları;
Çoklu doğrusallığın olduğu durumlarda parametreleri tahmin etmek imkânsızlaşır.
Standart hata sonsuzlaşır.
EKK edicileri büyük varyans ve kovaryansa sahip olduklarından, kesin tahminlerde
bulunmak güçleşir.
Yukarıdaki sonuçtan dolayı güven aralığı genişler.
Bir ve birden fazla katsayının t oranı istatistiki olarak anlamsız hale gelir.
, uyum iyiliği mükemmele yakın olabilir.
2.3.3. Çoklu Doğrusallığın Ortaya Çıkarılması;
1) Yüksek ve düşük t değeri
Çoklu doğrusallığın en önemli belirtilerinden birisidir.Regresyon denkleminin
yüksek belirlilik katsayı (örn. ) ve parametrelerin düşük t değeri
taşımalarıdır. Yani özetle model tümüyle yüksek anlam gücüne sahipken
parametrelerin anlamsız olması.
2) Açıklayıcı değişkenler arasında yüksek korelasyon ilişkisi
İki açıklayıcı değişken arasındaki korelasyon 0,80’in üstünde ise, ciddi bir
doğrusallıktan bahsedilebilir.
3) Yardımcı regresyon
Hangi X değişkeninin öteki X değişkenleriyle ilişkili olduğunu bulmanın bir
yolu, her bir Xi’nin öteki X değişkenlerine göre regresyonunu bulup buna karşılık
gelen, diyeceğimiz değerini hesaplamaktır.
değişkeni, k-2 ve n-k+1 sd ile F dağılımına uyar.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
18
www.ekonomianaliz.com
, Xi değişkeninin kalan X değişkenlerine göre regresyonunun
belirlilik katsayısını gösterir.
Hesaplanan F, seçilmiş anlamlılık düzeyinde kritik F değerini aşıyorsa, bunun anlamı
Xi’nin öteki X’lerle doğrusal olduğudur.
4) Hoşgörü ve Varyans şişirme faktörü (VŞF)
Varyans ve kovaryansı büyüten faktör, varyans şişirme faktörü olarak ifade
edilir.
∑
, X3 arasında çoklu doğrusallık olduğu durumda bir’e yaklaşır, VŞF ise sonsuz
olur. Şayet değişkenler arasında çoklu doğrusallık ilişkisi yoksa sıfır olur ve VŞF
bir’e eşit olur.
5) Kısmi korelasyonların incelenmesi
kısmi korelasyon katsayılarından en az biri ‘den büyükse çoklu bağlantıdan
şüphelenebiliriz.
Çoklu doğrusal bağlantıyı ortaya çıkarmadaki yukarıdaki maddelerin sadece bir
tanesinin sağlanması çoklu doğrusal bağlantının kesin var olduğunun kanıtı değildir. Birden
çok durumun aynı anda gözükmesi gerekir.15
16
15
KUTLAR A. (2006); Ekonometri Kılavuz kitap. ANKARA Arın Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
19
www.ekonomianaliz.com
Örnek-4
EKK yöntemi ile tahmin edilen para talebi (Mt) modelini inceleyip, çoklu
doğrusal bağlantı olup olmadığına karar verelim.
r: Faiz
P: Fiyat
Çoklu doğrusal bağlantı durumuna bakalım;
kısmi korelasyon katsayılarından bir tanesi modelin belirlilik
katsayısından büyük. Bu durumda çoklu doğrusal bağlantı var diyebiliriz.
Kritik tablo değerimiz.
Parametrelerin tek tek t testlerine baktığımızda
H0:
HA:
Hipotezi altında
F testine bakalım
H0:
HA:
16
Gujarati D. N. (1995); Temel Ekonometri. İSTANBUL Literatür Yayınları
Bu ders notu Fatih YAZ tarafından derlenmiştir.
20
www.ekonomianaliz.com
Ho reddedilir
Model tümüyle anlamlıdır.
Model tümüyle anlamlı çıkmasına rağmen t testi sonucunda parametrelerin
iki tanesi anlamsız çıkmıştır. Bu durumda çoklu doğrusal bağlantı olduğuna
dair şüphelerim devam etmektedir.
VŞF’ye bakalım
( )
∑
Açıklayıcı değişkenler arasında çok ciddi çoklu doğrusal bağlantı vardır
diyebiliriz.
2.3.4. Çoklu Doğrusallığı Düzeltici Önlemler:
Önsel Bilgi: Modeli oluşturmadan önce değişkenler arasındaki ilişki biliniyorsa model
farklı oluşturulabilir.
Kesit veriyle zaman serisi verilerini bir araya toplama(Panel Veriler): Zaman
serilerinde çoklu dorusallığa sık rastlanır. Bunun için zaman serileri ve yatay kesit
verileri bir arada kullanılarak çoklu doğrusal bağlantı önemli ölçüde önlenebilir.
Bu ders notu Fatih YAZ tarafından derlenmiştir.
21
www.ekonomianaliz.com
Değişkenleri Modelden Atmak: Birbiriyle ilişkili olan iki açıklayıcı değişkenden biri
modelden çıkarılabilir. Örneğin; tüketim, gelir ve zenginlik ilişkisinde; zenginlik ile
gelir arasında doğrusal bir ilişki olduğundan biri kullanılabilir.
İlave Veri Kullanılması: Eldeki veriler kullanıldığında açıklayıcı değişkenler
arasında çoklu doğrusallık varsa, aynı sorunun verilerin artışıyla devam edeceği kesin
değildir. Verilerin artışıyla çoklu doğrusallık azaltılabilir.17
2.4. NORMALLİKTEN SAPMALAR
Aralık tahmini ve regresyon katsayılarının testlerinin yapılabilmesi için hataların
dağılımı hakkında bir varsayım yapılmış olması gerekir. Bu varsayım hata terimlerinin
dağılımının normal dağılıma uyduğu varsayımıydı
1. Bozucu teriminin ortalaması sıfırdır
varsayıma göre ’lerin verilmiş Xi değerlerine koşullu olan ortalaması sıfırdır.
2. ’nin varyansı (bütün Xi’ler için) aynıdır.
=
burada ‘var’ varyans demektir.
Varsayımları altında hata terimi (ui) ortalaması sıfır, varyansı sabit olacak şekilde normal
dağılmaktadır.
Normallikten sapma olup olmadığının araştırılmasında;
17
Kennedy P. (2000), Ekonometri El Kitabı. ANKARA Gazi Kitabevi
Bu ders notu Fatih YAZ tarafından derlenmiştir.
22
www.ekonomianaliz.com
Çarpıklık ve basıklık ölçüleri. Genel olarak çarpıklık katsayısı sıfır, basıklık
katsayısı üçtür. Bu katsayılara yaklaştıkça elimizdeki seri normal dağılım gösterir.
Kolmogov – Smirnov testi
Ki-kare uygunluk testi uygulanabilir.18
Hataların normal dağılım varsayımı, anlamlılık testlerinde ve tahmin aralıklarının
saptanmasında önem kazanır.
Normal dağılımdan sapmalar görüldüğünde;
En küçük kareler yöntemine alternatif teknikler (Güçlü Regresyon)
Normalliğe yaklaştırmak için değişkenlerin ikisine birden veya sadece birine
logaritmik veya kareköklü dönüşümler uygulanabilir.
Modele dâhil edilmesi gerekirken unutulmuş olan önemli bir açıklayıcı değişken
modele dâhil edilerek de hataların normal dağılım göstermesi sağlanabilir.19
Modelin farkını alarak normal dağılıma yakınsanabilir.
Başka bir yaklaşıma göre hataların normal dağılmadığı durumlarda çözüm hataların
karelerini minimize etmek yerine, hataların mutlak değerlerinin minimize edilmesidir.
∑
Elimizdeki veri seti normal dağılıma uymuyorsa ve seriye yaptığımız dönüşümler ve
farklı uygulamalar da veri setini normal dağılım haline getirmiyorsa kuracağımız regresyon
modelini En Küçük Kareler yöntemi ile tahmin edemeyiz.
Normal dağılmayan veri setleri için En Yüksek Olabilirlik yöntemi kullanılır. En
yüksek olabilirlik yöntemi EKK gibi kolay hesaplanamaz. Bunun için paket programlar tercih
edilir.
18
Bu testler için ilgili kitaba bakılabilir. Gürtan Kenan; İstatistik ve Araştırma Metodları 19
ORHUNBİLGE N. (1996); Uygulamalı Regresyon ve Korelasyon Analizi. Avcıol Basım
Recommended