Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
21
Örnek büyüklüğü arttıkça hata terimi normal dağılıma
yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük
kareler yöntemi kullanılsa, modelin her iki tarafı ye
bölünüp model değişimi yapılsa bile normallik ve değişen
varyans varsayımlarıyla ilgili sakıncaları giderebilmek için
logit ve probit modeller geliştirilmiştir. Bu modeller, hem
şartını sağlayabilmekte ve hem de Pi
ile Xi arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler.
Yani, logit ve probit modelleri, farklı bağımsız X
değişkeninin olasılığının 0 ile 1 arasında kalmasını
sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli
bir artış karşısında, bu bağımsız değişkenin kullanılma
olasılığının değişik miktarda artmasını sağlamaktadırlar.
vi
1)(0 ii XYE
DOM’e Alternatif Model Arama
DOM’e Alternatif Model Arama
22
Günümüzde nitel değişkenlerden oluşan kukla değişken
verileri analiz etmek için çeşitli teknikler kullanılmaktadır.
Bunlardan log-linear modeller iki veya daha fazla kukla
değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir.
Bununla birlikte, log-linear modeller sayesinde, değişkenlerin
oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin
birbirine bağımlı olup olmadığını ve iki veya daha fazla
değişken arasındaki ilişkiyi neden-sonuç ilişkisine
dayandırmaksızın test etmek mümkündür.
DOM’e Alternatif Model Arama
23
•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir
•Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak
arttığını varsayar. Yani X’deki marjinal veya küçük bir artış
hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.
•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:
1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına
çıkmaması gerekmektedir.
2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.
DOM’e Alternatif Model Arama
24
Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir:
0
1 P
- + X
KDF
•Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir.
•Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde
kullanılabilir.
Logit Model
25
Logit modeller, genelleştirilmiş doğrusal modelin belirli
koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda,
eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili)
sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine
logistik regresyon kullanılmalıdır. Aynı zamanda eğer
değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit
model uygundur. Böyle bir durumda 0’la 1 arasında kalma
koşulunu sağlayabilmek için logit modelin uygulanması
önerilmektedir. Logit model, bağımlı değişkenin tahmini
değerlerini olasılık olarak hesaplayarak olasılık kurallarına
uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da
ham veri setlerini analiz eden bir istatistiksel yöntemdir.
Logit Model
26
Logistik Dağılım Fonksiyonu
i
i
P 1 1.
1-P 1
zz
z z
ee
e e
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
kümülatif lojistik dağılım fonksiyonudur.
Bahis yada olabilirlik oranı
1 2i iZ b b X
ln( ) ln1
izii e
i
PL e
P
1 1 11 1
1 1 1
i i
i i i
Z Z
Z Z Z
e eP
e e e
Bu orana ev sahibi olma lehine fark oranı denir. Lojistik modelin her
iki tarafının doğal log. alındığında
Li fark oranı logaritması olup hem X, hem parametrelere göre
doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1
arasında değişir.
Logit Model
27
i 1 2P =E(Y=1|X) ib b X
DOM’de
şeklindedir.
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
Logit modelde olasılık
iken.
Logit Modelin Özellikleri
28
Pi=1
0
1ln
11
1ln
P1
Pln
i
i = +
Pi=0
1
0ln
01
0ln
P1
Pln
i
i
= -
1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer
alır.
2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.
3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız
değişkendeki bir birimlik değişme karşısında logitteki değişmeyi
gösterir.
4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli
bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.
2
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Z
Ze
ZFp
1
1)(
)(ZF
XZ 21
Bir olayın gerçekleşme olasılığının birden büyük olması
durumundan kaçınmak için olasılığın Z’nin S şeklinde bir
fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin
fonksiyonu olarak ifade edilebilir.
Logit Model
29
3
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve
yukarıda gösterildiği gibi bunlardan biri de lojistik
fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e
gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken,
e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın
altına inmemektedir.).
XZ 21
)(ZFZ
eZFp
1
1)(
Z
Logit Model
30
En Yüksek Olabilirlik Yöntemiyle LogitModelin Elde Edilmesi
39
Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez.
ln( ) ln1
izii e i
i
PL e Z
P
Pi=1 ve Pi=0 değerleri logit Li’ deki yerine koyulduğunda ln(1/0) ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçük kareler yöntemi ile L fonksiyonundaki parametrelerin tahmin değerleri bulunamaz, fakat bu parametreler maksimum olabilirlik modeli ile tahmin edilebilir.
• Örneğin aşağıda frekanslı olmayan bir serinin en yüksek olabilirlik yöntemi ile logit model tahmini yer almaktadır:
40
41
Modeldeki katsayılar aşağıdaki gibidir;
• Logit modelde katsayılar doğrudan, bağımsız değişkenlerdeki bir değişimin bağımlı değişkenin beklenen değeri üzerindeki etkisi olarak yorumlanamamaktadır. Katsayının işareti bağımsız değişken ile olayın gerçekleşme olasılığı arasındaki ilişkinin yönünü gösterir. Modeldeki bağımsız değişkenlerin tümü olayın gerçekleşme olasılığı ile ters yönlü bir ilişki içerisindedir. Logit modelde katsayı yorumlarının yapılabilmesi için bağımsız değişkenlerin ortalamaları değerlendirmeye katılarak marjinal etkiler hesaplanır.
42
43
44
Probit Model
Probit model, y bağımlı değişkenin normal dağıldığını varsayarken, Logit model bu değişkenin lojistik eğriye dayandığını varsaymaktadır. Bu iki modelden Logit modelin dağılımda lojistik birikimli dağılım fonksiyonunun kuyruk bölgeleri Probit modele göre daha geniştir. Nitel olarak ele alındığında bu iki model benzer sonuçlar vermesine rağmen iki modelin tahmin edilen anakütle katsayılarını doğrudan karşılaştırmak mümkün değildir.
45
İki değer alabilen nitel değişkenli nitel tercih modellerinden biri olan DOM’ndeki en belirgin sorun, tahmin edilen olasılık değerlerinin 0-1 aralığının dışına çıkması sorunudur. Bu sorunun giderilmesi adına kullanılan Probit model, olasılıkların 0-1 arasında kalmasını sağlayan ve katsayılar itibariyle doğrusal olmayan bir modeldir. Probit model, genellikle gözlenemeyen bir fayda endeksi ile oluşturulduğundan, fayda endeksi hakkında bilgi verme yükümlülüğünü taşımaktadır.
46
Bağımlı kukla değişkenli modellerden kümülatif lojistik
fonksiyonundan farklı olarak, normal kümülatif dağılım
fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki
gibi formüle edilir:
1
2
02 22
Z Ze z( ) /
F(z)=
P R O B İ T (NORMAL) MODEL
Probit modeli şu şekilde tanımlayabiliriz:
Herhangi bir i hanesinin ev sahibi olma veya olmama
kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı
olduğunu varsayalım.
47
Ii* Ii ifadesi faydanın belli bir eşik değerinden sonra söz konusu
olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez.
Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii
değerleri yukarıdaki regresyon denkleminden tahmin edilir.
Tahminciler bulunur.
Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma
olasılığı aşağıdaki standartlaştırılmış normal KDF ile
hesaplanabilir:
Ii= b1 + b2 Xi
Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni.
Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma
durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev
sahibi olacak aksi durumda olmayacaktır.
Y=1 hane ev sahibi
Y=0 hane ev sahibi değil.
(1)
48
49
Endeks değerinin kendisi gibi gözlenemeyen ve Ii* ile
ifade edilen eşik değerine sahip olduğu düşünüldüğünde, eğer Ii değeri Ii
* değerini aşarsa olayın meydana gelmeyeceği söylenebilir. Ii
*
değerinin Ii değerinden küçük ya da Ii‘ye eşit olması
normallik varsayımı altında standartlaştırılmış birikimli dağılım fonksiyonlarından hareketle hesaplanmaktadır. Burada Ii gerçekte ölçülmemiş bir endeks olup normal ve sürekli bir tesadüfi değişken olarak adlandırılabilir. Belirtilmelidir ki Ii‘ler için gözlemler mevcut değildir. Ancak bu endeksin küçük ve büyük değerlerinden bireysel gözlemlerin hangi kategoriye ait oldukları bilinmektedir.
i 2I2/t dte
2
1 1
2
2 21 2
e dttb b Xi
/
=Standartlaştırılmış Normal KDF
Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii)
)1,0(Nt =standartlaştırılmış normal değişken
Pi=Bir ev sahibi olma olasılığı.
(2)
50
Probit Model
51
0
1
Pi=F(Ii)
- +
0
1
Pi=F(Ii)
- +
Pi
Ii= b1 + b2 Xi
Pi
Ii=F-1(Pi )
Ii* <=Ii verilmişken ev sahibi olma
olasılığı Pi ordinatta bulunur
Pi verilmişken, absiste Ii bulunur.
Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır.
Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi
=Probit model
F-1: normal kümülatif dağılım fonksiyonunun tersi.
52
53
58
En Yüksek Olabilirlik Yöntemiyle ProbitModelin Elde Edilmesi
En Yüksek Olabilirlik Yöntemi’nde anakütle ve bu anakütleden çekilen örnek arasındaki benzerlik ilişkisinden yararlanılarak bu örneğin elde edilme olasılığını maksimum yapan parametre değerleri tahmin edilmektedir.
En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonunun maksimizasyonundan oluşmaktadır. Bu yöntemin uygulanabilmesi için hata terimlerinin dağılımının bilinmesi gereklidir.
Logit modelin en yüksek olabilirlik yöntemiyle elde edilen örneğin probit model uygulaması şu şekilde gerçekleşmiştir:
59
60
61