DOM’e Alternatif Model Aramakisi.deu.edu.tr/hamdi.emec/2020-corona günleri/6... · DOM’e Alternatif Model Arama 23 •DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir

21

Örnek büyüklüğü arttıkça hata terimi normal dağılıma

yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük

kareler yöntemi kullanılsa, modelin her iki tarafı ye

bölünüp model değişimi yapılsa bile normallik ve değişen

varyans varsayımlarıyla ilgili sakıncaları giderebilmek için

logit ve probit modeller geliştirilmiştir. Bu modeller, hem

şartını sağlayabilmekte ve hem de Pi

ile Xi arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler.

Yani, logit ve probit modelleri, farklı bağımsız X

değişkeninin olasılığının 0 ile 1 arasında kalmasını

sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli

bir artış karşısında, bu bağımsız değişkenin kullanılma

olasılığının değişik miktarda artmasını sağlamaktadırlar.

vi

1)(0 ii XYE

DOM’e Alternatif Model Arama


22

Günümüzde nitel değişkenlerden oluşan kukla değişken

verileri analiz etmek için çeşitli teknikler kullanılmaktadır.

Bunlardan log-linear modeller iki veya daha fazla kukla

değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir.

Bununla birlikte, log-linear modeller sayesinde, değişkenlerin

oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin

birbirine bağımlı olup olmadığını ve iki veya daha fazla

değişken arasındaki ilişkiyi neden-sonuç ilişkisine

dayandırmaksızın test etmek mümkündür.


23

•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir

•Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak

arttığını varsayar. Yani X’deki marjinal veya küçük bir artış

hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.

•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:

1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına

çıkmaması gerekmektedir.

2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.


24

Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir:

0

1 P

- + X

KDF

•Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir.

•Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde

kullanılabilir.

Logit Model

25

Logit modeller, genelleştirilmiş doğrusal modelin belirli

koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda,

eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili)

sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine

logistik regresyon kullanılmalıdır. Aynı zamanda eğer

değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit

model uygundur. Böyle bir durumda 0’la 1 arasında kalma

koşulunu sağlayabilmek için logit modelin uygulanması

önerilmektedir. Logit model, bağımlı değişkenin tahmini

değerlerini olasılık olarak hesaplayarak olasılık kurallarına

uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da

ham veri setlerini analiz eden bir istatistiksel yöntemdir.

Logit Model

26

Logistik Dağılım Fonksiyonu

i

i

P 1 1.

1-P 1

zz

z z

ee

e e

1 2 ii (b b X )

1P =E(Y=1|X)

1 e

1

1 iZe

kümülatif lojistik dağılım fonksiyonudur.

Bahis yada olabilirlik oranı

1 2i iZ b b X

ln( ) ln1

izii e

i

PL e

P

1 1 11 1

1 1 1

i i

i i i

Z Z

Z Z Z

e eP

e e e

Bu orana ev sahibi olma lehine fark oranı denir. Lojistik modelin her

iki tarafının doğal log. alındığında

Li fark oranı logaritması olup hem X, hem parametrelere göre

doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1

arasında değişir.

Logit Model

27

i 1 2P =E(Y=1|X) ib b X

DOM’de

şeklindedir.

1 2 ii (b b X )

1P =E(Y=1|X)

1 e

1

1 iZe

Logit modelde olasılık

iken.

Logit Modelin Özellikleri

28

Pi=1

0

1ln

11

1ln

P1

Pln

i

i = +

Pi=0

1

0ln

01

0ln

P1

Pln

i

i

= -

1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer

alır.

2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.

3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız

değişkendeki bir birimlik değişme karşısında logitteki değişmeyi

gösterir.

4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli

bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.

2

0.00

0.25

0.50

0.75

1.00

-8 -6 -4 -2 0 2 4 6

Z

Ze

ZFp

1

1)(

)(ZF

XZ 21

Bir olayın gerçekleşme olasılığının birden büyük olması

durumundan kaçınmak için olasılığın Z’nin S şeklinde bir

fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin

fonksiyonu olarak ifade edilebilir.

Logit Model

29

3

0.00

0.25

0.50

0.75

1.00

-8 -6 -4 -2 0 2 4 6

Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve

yukarıda gösterildiği gibi bunlardan biri de lojistik

fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e

gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken,

e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın

altına inmemektedir.).

XZ 21

)(ZFZ

eZFp

1

1)(

Z

Logit Model

30

En Yüksek Olabilirlik Yöntemiyle LogitModelin Elde Edilmesi

39

Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez.

ln( ) ln1

izii e i

i

PL e Z

P

Pi=1 ve Pi=0 değerleri logit Li’ deki yerine koyulduğunda ln(1/0) ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçük kareler yöntemi ile L fonksiyonundaki parametrelerin tahmin değerleri bulunamaz, fakat bu parametreler maksimum olabilirlik modeli ile tahmin edilebilir.

• Örneğin aşağıda frekanslı olmayan bir serinin en yüksek olabilirlik yöntemi ile logit model tahmini yer almaktadır:

40

41

Modeldeki katsayılar aşağıdaki gibidir;

• Logit modelde katsayılar doğrudan, bağımsız değişkenlerdeki bir değişimin bağımlı değişkenin beklenen değeri üzerindeki etkisi olarak yorumlanamamaktadır. Katsayının işareti bağımsız değişken ile olayın gerçekleşme olasılığı arasındaki ilişkinin yönünü gösterir. Modeldeki bağımsız değişkenlerin tümü olayın gerçekleşme olasılığı ile ters yönlü bir ilişki içerisindedir. Logit modelde katsayı yorumlarının yapılabilmesi için bağımsız değişkenlerin ortalamaları değerlendirmeye katılarak marjinal etkiler hesaplanır.

42

43

44

Probit Model

Probit model, y bağımlı değişkenin normal dağıldığını varsayarken, Logit model bu değişkenin lojistik eğriye dayandığını varsaymaktadır. Bu iki modelden Logit modelin dağılımda lojistik birikimli dağılım fonksiyonunun kuyruk bölgeleri Probit modele göre daha geniştir. Nitel olarak ele alındığında bu iki model benzer sonuçlar vermesine rağmen iki modelin tahmin edilen anakütle katsayılarını doğrudan karşılaştırmak mümkün değildir.

45

İki değer alabilen nitel değişkenli nitel tercih modellerinden biri olan DOM’ndeki en belirgin sorun, tahmin edilen olasılık değerlerinin 0-1 aralığının dışına çıkması sorunudur. Bu sorunun giderilmesi adına kullanılan Probit model, olasılıkların 0-1 arasında kalmasını sağlayan ve katsayılar itibariyle doğrusal olmayan bir modeldir. Probit model, genellikle gözlenemeyen bir fayda endeksi ile oluşturulduğundan, fayda endeksi hakkında bilgi verme yükümlülüğünü taşımaktadır.

46

Bağımlı kukla değişkenli modellerden kümülatif lojistik

fonksiyonundan farklı olarak, normal kümülatif dağılım

fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki

gibi formüle edilir:

1

2

02 22

Z Ze z( ) /

F(z)=

P R O B İ T (NORMAL) MODEL

Probit modeli şu şekilde tanımlayabiliriz:

Herhangi bir i hanesinin ev sahibi olma veya olmama

kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı

olduğunu varsayalım.

47

Ii* Ii ifadesi faydanın belli bir eşik değerinden sonra söz konusu

olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez.

Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii

değerleri yukarıdaki regresyon denkleminden tahmin edilir.

Tahminciler bulunur.

Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma

olasılığı aşağıdaki standartlaştırılmış normal KDF ile

hesaplanabilir:

Ii= b1 + b2 Xi

Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni.

Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma

durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev

sahibi olacak aksi durumda olmayacaktır.

Y=1 hane ev sahibi

Y=0 hane ev sahibi değil.

(1)

48

49

Endeks değerinin kendisi gibi gözlenemeyen ve Ii* ile

ifade edilen eşik değerine sahip olduğu düşünüldüğünde, eğer Ii değeri Ii

* değerini aşarsa olayın meydana gelmeyeceği söylenebilir. Ii

*

değerinin Ii değerinden küçük ya da Ii‘ye eşit olması

normallik varsayımı altında standartlaştırılmış birikimli dağılım fonksiyonlarından hareketle hesaplanmaktadır. Burada Ii gerçekte ölçülmemiş bir endeks olup normal ve sürekli bir tesadüfi değişken olarak adlandırılabilir. Belirtilmelidir ki Ii‘ler için gözlemler mevcut değildir. Ancak bu endeksin küçük ve büyük değerlerinden bireysel gözlemlerin hangi kategoriye ait oldukları bilinmektedir.

i 2I2/t dte

2

1 1

2

2 21 2

e dttb b Xi

/

=Standartlaştırılmış Normal KDF

Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii)

)1,0(Nt =standartlaştırılmış normal değişken

Pi=Bir ev sahibi olma olasılığı.

(2)

50

Probit Model

51

0

1

Pi=F(Ii)

- +

0

1

Pi=F(Ii)

- +

Pi

Ii= b1 + b2 Xi

Pi

Ii=F-1(Pi )

Ii* <=Ii verilmişken ev sahibi olma

olasılığı Pi ordinatta bulunur

Pi verilmişken, absiste Ii bulunur.

Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır.

Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi

=Probit model

F-1: normal kümülatif dağılım fonksiyonunun tersi.

52

53

58

En Yüksek Olabilirlik Yöntemiyle ProbitModelin Elde Edilmesi

En Yüksek Olabilirlik Yöntemi’nde anakütle ve bu anakütleden çekilen örnek arasındaki benzerlik ilişkisinden yararlanılarak bu örneğin elde edilme olasılığını maksimum yapan parametre değerleri tahmin edilmektedir.

En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonunun maksimizasyonundan oluşmaktadır. Bu yöntemin uygulanabilmesi için hata terimlerinin dağılımının bilinmesi gereklidir.

Logit modelin en yüksek olabilirlik yöntemiyle elde edilen örneğin probit model uygulaması şu şekilde gerçekleşmiştir:

59

60

61

Documents

DOM’e Alternatif Model Aramakisi.deu.edu.tr/hamdi.emec/2020-corona günleri/6... · DOM’e Alternatif Model Arama 23 •DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir