Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
1
KUKLA DEĞİŞKENLİ MODELLER
• Bir kukla değişkenli modeller (Varyans Analiz Modelleri)
• Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı
modeller (Kovaryans Analizi Modeller)
• Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri
• Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler
2
Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve
bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.
Bir Kukla Değişkenli Modeller (Varyans
Analiz Modelleri) H
arc
am
a
N
Meslek Lisesi
Devlet Lisesi
Birleştirilmiş Denklem Yıllık Okul Harcaması = b1 + b2 ML + u
ML = 0 Devlet Lisesi Yıllık Okul Harcaması = b1
ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b1 + b2
3
0.0
20000.0
40000.0
60000.0
80000.0
100000.0
120000.0
1 2 3 4 5 6 7 8 9 10 1 Devlet Lisesi Meslek Lisesi
b1+b2
b1
ML = 0 Devlet Lisesi
ML= 1 Meslek Lisesi
Yıllık Okul Harcaması = b1 + b2 ML + u
4
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
Ha
rc
am
a
N
Meslek Lisesi
Devlet Lisesi
KUKLA DEĞİŞKENLERİN DİĞER KANTİTATİF DEĞİŞKENLERLE ALINDIĞI
MODELLER
(KOVARYANS ANALİZİ MODELLER)
Harcama:Okul harcaması
N:Öğrenci sayısı
Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde
nasıl yer aldıkları incelenecektir.
5
Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve
bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.
Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi
olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve
gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl
içerisinde daha fazla harcama yapmaları gerekmektedir.
Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı
görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi
oluşturmaktır.
Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı
sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir
anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak
katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden
olacaktır.
6
OCC = 0 Devlet Lisesi Harcama = b1 + b2N + u
OCC = 1 Meslek Lisesi Harcama= b1' + b2N + u
İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi
harcama denkleminin sabit terimi b1' in devlet lisesinden daha büyük
olduğunu varsayan bir hipotez kurmaktır.
Harc
am
a
N
Meslek Lisesi
Devlet Lisesi
b1
b1'
Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat
sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet
varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı
kolaylaştırmak için yapılmaktadır.
7
Harc
am
a
N
Meslek Lisesi
Devlet Lisesid
d İki sabit terim arasındaki fark olarak tanımlanabilir: d = b1' - b1.
b1
b1'
Devlet Lisesi Harcama = b1 + b2N + u
Meslek Lisesi Harcama = b1' + b2N + u
8
b1' = b1 + d olacaktır ve meslek lisesine ait harcama fonksiyonu
aşağıdaki gibi yazılabilir:
OCC = 0 Devlet Lisesi Harcama = b1 + b2N + u
OCC = 1 Meslek Lisesi Harcama = b1 + d + b2N + u
d = b1' - b1 idi.
Artık iki harcama fonksiyonunu birleştirip kukla değişken ML
oluşturulabilir. ML öğrenci devlet lisesine gidiyor ise 0 değerini,
meslek lisesine gidiyor ise 1 değerini almaktadır.
Birleştirilmiş Denklem Harcama = b1 + d ML + b2N + u
ML = 0 Devlet Lisesi Harcama = b1 + b2N + u
ML= 1 Meslek Lisesi Harcama = b1 + d + b2N + u
9
Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer
ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden
öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini
alırsa harcama fonksiyonu meslek lisesine giden öğrencilerin
harcama fonksiyonu olmaktadır.
Harc
am
a
N
Meslek Lisesi
Devlet Lisesi
d
b1
b1+d
Birleştirilmiş Denklem Harcama = b1 + d ML + b2N + u
ML = 0 Devlet Lisesi Harcama = b1 + b2N + u
ML= 1 Meslek Lisesi Harcama = b1 + d + b2N + u
10
Bu aşamada bir şehirdeki 74 lise için gerçek veri setini kullanarak
regresyon denklemi oluşturulabilir.
0
100000
200000
300000
400000
500000
600000
700000
0 500 1000 1500
N
Harc
am
a
Meslek
Lisesi
Devlet
Lisesi
11
Okul Okul Tipi Okul Harcaması N ML
1 Meslek 345,000 623 1
2 Meslek 537,000 653 1
3 Devlet 170,000 400 0
4 Meslek 526.000 663 1
5 Devlet 100,000 563 0
6 Devlet 28,000 236 0
7 Devlet 160,000 307 0
8 Meslek 45,000 173 1
9 Meslek 120,000 146 1
10 Meslek 61,000 99 1
Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan
olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N
okullardaki öğrenci sayısıdır.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
ML okul tipini gösteren kukla değişkendir.
12
. reg Harcama N ML
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 2, 71) = 56.86
Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000
Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156
---------+------------------------------ Adj R-squared = 0.6048
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254
ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1
_cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61
------------------------------------------------------------------------------
Her ne kadar ML kukla değişken olsa da yeni bir açıklayıcı
değişkenmiş gibi düşünülerek; Harcama değişkeni , N ve ML
değişkenleri üzerine regresyona tabi tutulmaktadır.
Katsayı yorumları: Regresyon sonuçları eşitlik şeklinde yeniden
yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler
türetilebilir.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
13
Devlet Lisesi
(ML = 0)
Harcama = -34,000 + 133,000ML + 331N
Harcama = -34,000 + 331N ^
^
Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık
marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit
harcamanın da -34,000 Yuan olduğu ifade edilebilir.
Kukla değişkenin katsayısı d ile tahminlenmektedir. Meslek lisesindeki
öğrenciler için extra yıllık sabit harcamayı ifade etmektedir.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
14
Devlet Lisesi
(ML= 0)
Meslek Lisesi
(ML = 1)
Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık
sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki
öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır.
Harcama = -34,000 + 133,000ML + 331N
Harcama = -34,000 + 331N
Harcama = -34,000 + 133,000 + 331N
= 99,000 + 331N
^
^
^
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
15
Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama
fonksiyonunu göstermektedir.
-100000
0
100000
200000
300000
400000
500000
600000
700000
0 500 1000 1500
Ha
rca
ma
N
Meslek Lisesi
Devlet Lisesi
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
16
. reg Harcama N ML
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 2, 71) = 56.86
Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000
Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156
---------+------------------------------ Adj R-squared = 0.6048
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254
ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1
_cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61
------------------------------------------------------------------------------
Kukla değişkeninin katsayısını test etmek için; H0: d = 0 ve H1: d ≠ 0
hipotezleri t testi yardımı ile test edilebilir. Bir başka ifadeyle, H0
hipotezi iki okul türü arasında sabit harcamalar bakımından fark
olmadığını ifade etmektedir. ML’nin katsayısının prob değeri 0.05 önem
düzeyinden küçük olduğu için H0 hipotezi reddedilebilmektedir. Yani iki
okul türünün sabit harcamaları arasında fark vardır.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
17
reg Harcama N ML
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 2, 71) = 56.86
Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000
Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156
---------+------------------------------ Adj R-squared = 0.6048
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254
ML| 133259.1 20827.59 6.398 0.000 91730.06 174788.1
_cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61
------------------------------------------------------------------------------
Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N
ele alınırsa; N ‘in katsayısının da istatistiksel olarak anlamlı olduğu
söylenebilir. Bu da bize marjinal harcamaların istatistiksel olarak
sıfırdan oldukça farklı olduğunu göstermektedir.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
18
. reg Harcama N ML
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 2, 71) = 56.86
Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000
Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156
---------+------------------------------ Adj R-squared = 0.6048
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254
ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1
_cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61
------------------------------------------------------------------------------
b1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının
anlamsız olduğu görülmektedir.
BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER
19
BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER
Harcama:Okul harcaması
Sadece bir Di kukla değişkenli modellerin yanında, D sayısı iki, üç,
hatta yirmiye kadar olan modeller de söz konusu olmaktadır.
Daha önce devlet lisesi ve meslek liseleri arasındaki harcama
fonksiyonu arasındaki farkı belirtmek için kukla değişken
kullanmıştık.
Şangay’da iki tip devlet okulu bulunmaktadır.
Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler,
diğeri ise akademik eğitim ile birlikte ticaret eğitimi veren ticaret
liseleridir.
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
20
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Ticaret okullarının öğretim programı genel liselerden çok az bir
farklılık göstermekte, sadece genel liselere göre birkaç ticaret
eğitimleri bulunmaktadır.
Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim
okulları(TEK) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir. Sonuçta
kalitatif değişkenimiz dört gruba sahiptir.
Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna
bağlı olarak diğer kukla değişkenler tanımlanmaktadır. Genellikle,
kategoriler içerisinde en basit ve normal olan kategori temel sınıf
olarak seçilmektedir.
21
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Şangay örneğinde genel liseleri temel sınıf olarak seçmek en
uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer
liseler genel liselerin birer varyasyonlarıdır. Dolayısıyla okul tiplerine
bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik
eğitim okulları için kukla değişken; eğer öğrenci teknik okula
gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken.
Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli
öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla
değişkenlerdir.
Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu
katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra
harcama maliyetlerini ifade etmektedir.
Dikkat edilirse temel kategori (referans kategori) modelde yer
almamaktadır ve çıkarılmış kategori olarak ifade edilir.
22
Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır
değerini almakta ve regresyon modeli en basit duruma
indirgenmektedir.
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0)
23
Eğer gözlem teknik lise ile ilgili ise; TEK değişkeni 1 değerini, diğer
kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise
yukarıda gösterildiği gibi olmaktadır.
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0)
Teknik Lise Harcama = (b1 + dT) + b2N + u (TEK = 1; NİT= TİC = 0)
24
Harcama = b1 + dTTEK + dNNİT + dTİTİC + b2N + u
Genel Lise Harcama = b1 + b2N + u (TEK = NİT = TİC = 0)
Teknik Lise Harcama = (b1 + dT) + b2N + u (TEK = 1; NİT = TİC = 0)
Nitelikli Öğr. Yet. Lİsesi Harcama = (b1 + dN) + b2N + u (NİT= 1; TEK = TİC = 0)
Ticaret Lisesi Harcama = (b1 + dTİ) + b2N + u (TİC = 1; TEK = NİT = 0)
Benzer şekilde gözlem nitelikli öğrenci yetiştiren lisesi yada Ticaret
lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi
oluşturulmaktadır.
25
Yukarıdaki diyagram modeli grafiksel olarak göstermektedir. d katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre
ekstra gider harcamalarını ifade etmektedir.
Harc
am
a
N
b1+dT
b1+dN
b1+dTİ
b1
Nitelikli
Ticaret
dN
dTİ
dT
Teknik
Genel
26
Dikkat edilecek olurda d katsayıların büyüklülüğü ve işaretleri için
önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden
tahminlenecektir.
Harc
am
a
N
b1+dT
b1+dN
b1+dTİ
b1
Nitelikli
Ticaret
dN
dTİ
dT
Teknik
Genel
27
Okul Tip Harcama N TEK NİT TİC
1 Teknik 345,000 623 1 0 0
2 Teknik 537,000 653 1 0 0
3 Genel 170,000 400 0 0 0
4 Nitelikli 526.000 663 0 1 0
5 Genel 100,000 563 0 0 0
6 Ticaret 28,000 236 0 0 1
7 Ticaret 160,000 307 0 0 1
8 Teknik 45,000 173 1 0 0
9 Teknik 120,000 146 1 0 0
10 Nitelikli 61,000 99 0 1 0
Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir.
Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul
tiplerine göre oluşturulmuştur.
28
Dağılma diyagramı yeni okulların verilerini göstermektedir.
0
100000
200000
300000
400000
500000
600000
700000
0 500 1000 1500
Harc
am
a
NTeknik Lise Ticaret Lisesi Genel Lise Nitelikli Lisesi
29
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Verilere ait regresyon sonuçları tabloda gösterilmiştir. N in katsayısı
her bir öğrenci için marjinal harcamayı ifade etmektedir ve yaklaşık
343 yuandır.
30
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve
53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade
etmektedir.
31
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Sabit terim genel liselerde sabit harcamaların -55000 yuan olduğunu
söylemektedir.
32
Harcama = -55,000 + 154,000TEK + 143,000NİT+ 53,000TİC + 343N
En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için
harcama fonksiyonları ayrı ayrı gösterilecektir.
^
33
Harcama= -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55,000 + 343N (TEK= NİT = TİC = 0)
Öğrenci başına yıllık marjinal harcama 343 yuandır. Öğrenci başına
yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin
edilmiştir.
^
^
34
Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55,000 + 343N (TEK= NİT = TİC = 0)
Teknik Lise Harcama = -55,000 + 154,000 + 343N
(TEK = 1; NİT = TİC = 0) = 99,000 + 343N
Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000
yuan olarak tahminlenmiştir.
^
^
^
35
Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55,000 + 343N (TEK= NİT = TİC = 0)
Teknik Lise Harcama = -55,000 + 154,000 + 343N
(TEK = 1; NİT = TİC = 0) = 99,000 + 343N
Nitelikli Lisesi Harcama = -55,000 + 143,000 + 343N
(NİT = 1; TEK = TİC = 0) = 88,000 + 343N
Ticaret Lisesi Harcama = -55,000 + 53,000 + 343N
(TİC = 1; TEK = NİT = 0) = -2,000 + 343N
Benzer şekilde nitelikli öğrenci yetiştiren ve ticaret okulunun genel
liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır.
^
^
^
^
^
36
Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak
tahmin edilmiştir.
^
^
^
^
^
Harcama = -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N
Genel Lise Harcama = -55,000 + 343N (TEK = NİT = TİC = 0)
Teknik Lise Harcama = -55,000 + 154,000 + 343N
(TEK = 1; NİT = TİC = 0) = 99,000 + 343N
Nitelikli Lisesi Harcama = -55,000 + 143,000 + 343N
(NİT = 1; TEK = TİC = 0) = 88,000 + 343N
Ticaret Lisesi Harcama = -55,000 + 53,000 + 343N
(TİC = 1; TEK = NİT = 0) = -2,000 + 343N
37
Dört harcama grafiği şekilde gösterilmiştir.
-100000
0
100000
200000
300000
400000
500000
600000
700000
0 200 400 600 800 1000 1200 1400
Harc
am
a
N
Teknik Lise Ticaret Lisesi Genel Lise Nitelikli
38
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Bütün katsayılar için t-testi yapabiliriz. N değişkenin katsayısı için
t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların
istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.
39
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK| 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Ayrıca teknik lise t-istatistiği katsayısı da istatistiksel olarak
anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının
genel liselerin sabit harcamalarından oldukça büyük olduğunu
göstermektedir.
40
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Benzer şekilde vasıflı NİT lerin t istatistiği 5.15 olarak bulunmuştur.
41
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da
ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında
yeterince farklı olmadığını göstermektedir.
Bu sonuç çok şaşırtıcı değil, çünkü ticaret lisesi genel liselerden çok
farklı bir eğitime sahip değil.
42
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek
için F testi yapabiliriz. H0: dT = dN = dTİ = 0 olarak tanımlanabilir.
Alternatif hipotez ise en az bir d sıfırdan farklıdır şeklinde
kurulmaktadır.
43
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
------------------------------------------------------------------------------
Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692
TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4
NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2
TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9
_cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748
------------------------------------------------------------------------------
Kukla değişkenli modelinde hata kareler toplamı 5.41×1011.
44
. reg Harcama N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
------------------------------------------------------------------------------
Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222
_cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65
------------------------------------------------------------------------------
Kukla değişkensiz modelin hata kareler toplamı 8.92×1011.
45
. reg Harcama N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi
uygulanabilir.
46
. reg Harcama N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
92.1469/1041.5
3/)1041.51092.8()69,3(
11
1111
F
F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken
sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni
değişken sayısına bölünmektedir.
f1 = c =3
f2 =n-k=74-5=69
47
. reg Harcama N
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
. reg Harcama N TEK NİT TİC
Source | SS df MS Number of obs = 74
---------+------------------------------ F( 4, 69) = 29.63
Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000
Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320
---------+------------------------------ Adj R-squared = 0.6107
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578
H0 hipotezi redddilebilir
92.1469/1041.5
3/)1041.51092.8()69,3(
11
1111
F 17.6)60,3( %1.0 crit, F
48
KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
1.HAL: Sabit Terimlerin Farklı Eğimlerin Eşit olması
i 1 2 i 3 i iY b b D b X u + + +
i i 1 2 3 iE(Y | D 1,X ) b b b X + +i i 1 3 iE(Y | D 0,X ) b b X +
≠
=
49
KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
2.HAL: Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali
i 1 2 i i 3 i iY b b D X b X u + + +
i i 1 2 3 iE(Y | D 1,X ) b (b b )X + +i i 1 3 iE(Y | D 0,X ) b b X +
≠
=
50
)
) b2 + b3
b3
b1
Yi
Xi
i i 1 3 iE(Y | D 0,X ) b b X +
i i 1 2 3 iE(Y | D 1,X ) b (b b )X + +
51
KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU
3.HAL: Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması
i 1 2 i 3 i i 4 i iY b b D b D X b X u + + + +
i i 1 2 3 4 iE(Y | D 1,X ) (b b ) (b b )X + + +i i 1 4 iE(Y | D 0,X ) b b X +
≠
≠
52
Yi
Xi
i i 1 4 iE(Y | D 0,X ) b b X +
i i 1 2 3 4 iE(Y | D 1,X ) (b b ) (b b )X + + +
) b4 ) b3+b4 b1
b1+b2
53
İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
i 1 2 i 3 i i 4 i iY b b D b D X b X u + + + +
2. Chow Testi
1. t testi ne bakılır.
b3 katsayısı anlamsız ve b2 anlamlı ise 1.durum (sabit
terim farklı eğimler aynı)
-b2 katsayısı anlamsız b3 anlamlı ise 2. durum (sabit terim
aynı eğimler farklı)
her iki katsayı da anlamlı ise 3. durum (iki fonk.
birbirinden farklıdır denir)
Eğim farkı Sabit terim farkı
54
İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
Uygulama: Yıllık
Sigara
Tüketimi
Cinsiyet (Di)
(Erkek = 1, Kadın =
0)
Yıllık Gelir
(Xi)
25 1 400
20 0 260
19 0 270
24 1 360
20 0 240
22 1 310
21 1 280
18 0 200
19 0 260
22 1 320
i 1 2 i 3 i i 4 i iY b b D b D X b X u + + + +
55
İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ
Dependent Variable: Y
Method: Least Squares
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 14.94231 2.598383 5.750619 0.0012
Di -3.786344 3.350850 -1.129965 0.3016
Xi 0.017308 0.010508 1.647020 0.1507
DiX 0.017555 0.012245 1.433624 0.2017
R-squared 0.955060 Mean dependent var 21.00000
Adjusted R-squared 0.932591 S.D. dependent var 2.260777
S.E. of regression 0.586972 Akaike info criterion 2.061496
Sum squared resid 2.067219 Schwarz criterion 2.182530
Log likelihood -6.307482 F-statistic 42.50422
Durbin-Watson stat 1.943502 Prob(F-statistic) 0.000195
Sabit Terim Farkı Eğim Farkı
56
Sonuç olarak
İki sınıf tüketim fonksiyonlarının aynı olduğunu söyleyebiliriz.
57
BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ
i 1 2 2 3 3 4 i iY b b D b D b X u + + + +
i 1 2 2 3 3 4 2 3 5 i iY b b D b D b D D b X u + + + + +
2
1, Erkek D
0, Kadın
3
1, Şehirde Oturanlar D
0, Kırsal Kesimde Oturanlar
i iY : Tüketim,X : Gelir
i 2 3 i 1 5 iE Y | D 0,D 0,X b b X +
i 2 3 i 1 2 3 4 5 iE Y | D 1,D 1,X b b b b b X + + + +
Erkeğin Tüketim Farkı Şehirde Oturanların
Tüketim Farkı
Şehirde Oturan bir
Erkeğin Tüketim Farkı
58
b4 katsayısının t istatistiğine bakılır. Şayet
anlamlıysa iki kukla değişkenin modelde birlikte yer
alması, bunların bireysel etkilerini azaltabilir veya
arttırabilir. Bu durumda bu katsayının modelde yer
almaması da spesifikasyon hatalarına yol açabilir.
59
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA
Üçer
Aylar
Karlar
(Milyon
Dolar)
Şatışlar
(Milyon Dolar)
1965-I 10503 114862
II 12092 123968
III 10834 121454
IV 12201 131917
1966-I 12245 129911
II 14001 140976
III 12213 137828
IV 12820 145465
D2
0
1
0
0
0
1
0
0
D3
0
0
1
0
0
0
1
0
D4
0
0
0
1
0
0
0
1
2
1, İkinci Üç Aylık Dönem D
0, Diğer Dönemler
3
1, Üçüncü Üç Aylık Dönem D
0, Diğer Dönemler
4
1, Dördüncü Üç Aylık Dönem D
0, Diğer Dönemler
60
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA
1 2 2 3 3 4 4 5 t ttKar b b D b D b D b (Satış) u + + + + +
Dependent Variable: Kar
Variable Coefficient Std. Error t-Statistic Prob.
C 6688.363 1711.366 3.908201 0.0009
D2 1322.892 638.4745 2.071957 0.0521
D3 -217.8054 632.2552 -0.344490 0.7343
D4 183.8564 654.2925 0.281000 0.7817
Satış 0.038246 0.011481 3.331281 0.0035
R2=0.525494
İstatistiki olarak
anlamsız
61
MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA
Dependent Variable: Kar
Sample: 1965:1 1970:4
VariableCoefficient Std. Error t-Statistic Prob.
C 6515.581 1623.083 4.014323 0.0006
D2 1331.352 493.0214 2.700395 0.0134
Satış 0.039310 0.010575 3.717315 0.0013
R2 = 0.515460
Mevsim dalgalanmalarının
etkisinde
62
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
UYGULAMA: 1935-1954 yıllarına arasında General Motor, Westinghouse ve
General Electric firmalarna ait yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu
(X3) verilerine ait tablo aşağıda verilmiştir.
63
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla
değişkenlerden yararlanabiliriz. Firmaların ilk üç yıllarına ait veriler ile oluşturulan
yeni tablo aşağıdaki gibidir.
Yıllar Y X2 X3 Di Firma
1935 317.6 3078.5 2.8 1 GM
1936 391.8 4661.7 52.6 1 GM
1937 410.6 5387.1 156.9 1 GM
1935 12.93 191.5 1.8 0 WE
1936 25.90 516.0 0.8 0 WE
1937 35.05 729.0 7.4 0 WE
1935 33.1 1170.6 97.8 0 GE
1936 45.0 2015.8 104.4 0 GE
1937 77.2 2803.3 118.0 0 GE
64
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
i
1, G.M gözlemleri için D
0, Diğerleri için
GM yatırımlarının diğer firma
yatırımlarından sabit terim
kadar farklı olduğunu ifade
etmektedir.
i 1 2 2 3 3 4 i iY b b X b X b D u + + + +
65
Dependent Variable: Y
Method: Least Squares
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C -61.80754 23.79039 -2.598004 0.0120
X2 0.038311 0.016752 2.286884 0.0260
X3 0.347303 0.032048 10.83683 0.0000
Di 278.5911 51.74338 5.384091 0.0000
R-squared 0.924866 Mean dependent var 251.067
Adjusted R-squared 0.920841 S.D. dependent var 311.6501
S.E. of regression 87.68352 Akaike info criterion 11.84969
Sum squared resid 430550.4 Schwarz criterion 11.9893
Log likelihood -351.4906 F-statistic 229.7778
Durbin-Watson stat 0.502776 Prob(F-statistic) 0.000000
ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI
İstatistiki olarak
anlamlı
GM yatırımları, diğer firma
yatırımlarından farklı ve fazladır.
66
ÖRNEKLER
67
Yi = a + b Di +ui
Yi = Öğretim Üyelerinin Yıllık Maaşları
Di = 1 Öğretim Üyesi Erkekse
= 0 Diğer Durumlar (yani Kadın Öğretim Üyesi)
Varyans Analiz Modelleri (ANOVA)
Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Yi|Di = 0 ) = a
Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Di = 1) = a + b
Örnek:
Özel bir üniversitede öğretim üyelerinin yıllık maaşları ile
cinsiyetleri arasında önce varyans daha sonra tecrübe değişkeni
eklenerek kovaryans modeli oluşturulacaktır:
68
Yi = 18 + 3.28 Di
(0.32) (0.44)
t (57.74)(7.44) , R2=0.8737
15
16
17
18
19
20
21
22
23
24
25
-0.5 0 0.5 1 1.5 2
3.280
18.00
21.280
69
Yi = a1 + a2 Di + b Xi + ui
Yi = Öğretim Üyelerinin Yıllık Maaşları
Xi = Öğretim Üyesinin Yıl olarak Tecrübesi
Di = 1 Öğretim Üyesi Erkekse
= 0 Diğer Durumlar (yani Kadın Öğretim Üyesi)
Kadın Öğretim Üyelerinin Ortalama Maaşları :
E( Yi|Xi,Di = 0 ) = a1+bXi
Erkek Öğretim Üyelerinin Ortalama Maaşları :
E ( Yi|Xi,Di = 1) = (a1 + a2 +bXi
70
Maaş Cinsiyet Tecrübe
22 1 16
19 0 12
18 0 12
21.7 1 15
18.5 0 10
21 1 11
20.5 1 13
17 0 8
17.5 0 9
21.2 1 14
71
Yıl
lık M
aaş
Tecrübe (yıl olarak)
Y
X
a2
a1
Ya1+bXi
Y (a1 + a2 +bXi
Kadın
Erkek
Yi = 15.051 + 2.239 Di + 0.289 Xi
s(b) (0.95) (0.44) (0.09)
p (0.000) (0.002) (0.020) , R2=0.949
Di = 1 Öğretim Üyesi Erkekse
= 0 Öğretim Üyesi Kadınsa
72
DATA7-19 1960-1988 yılları arasında Türkiye’deki Sigara Tüketimi
Q Yetişkinlerin sigara tüketim miktarı(kg), Range 1.86 - 2.723.
Y GNP(1968) TL, Range 2560 - 5723.
P Türkiye’deki sigara fiyatları Range 1.361 - 3.968.
ED1 Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş)
Range 0.112 - 0.451.
ED2 Kayıtlı üniversite mezunu oranı (20-24) Range 0.026 - 0.095.
D82 = 1 , 1982 ve sonrası
D86 = 1 , 1986 ve sonrası
73
Dependent Variable: Q
Sample: 1960 1988
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
P -0.097291 0.079389 -1.225493 0.2340
ED2 -5.547295 2.679248 -2.07046 0.0509
ED1 -2.994166 2.708828 -1.105336 0.2815
D86 -0.262700 0.090825 -2.89238 0.0087
D82 -0.288739 0.083649 -3.451774 0.0024
Y 0.000762 0.000190 4.009205 0.0006
C 5.1139345 0.34132 0.101585 0.9200
Katsayılar istatistiki olarak
anlamsız
74
Dependent Variable: Q
Method: Least Squares
Sample: 1960 1988
Included observations: 29
Variable Coefficient Std. Error t-Statistic Prob.
ED2 -6.455259 2.724204 -2.369595 0.0266
D86 -0.351822 0.078985 -4.454297 0.0002
D82 -0.269429 0.084743 -3.179385 0.0042
Y 0.000672 0.000170 3.945228 0.0006
C 58.18878 33.26618 1.749187 0.0936
75
DATA7-2
Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri
WAGE = Aylık Ücret (Range 981 - 3833)
EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range 1
- 11)
EXPER =Şirkette çalışma süresi(Range 1 - 23)
AGE = Yaş (25 - 64)
GENDER = 1, Erkek ise; 0 kadın ise
RACE = 1, beyaz ise; 0 diğerleri
CLERICAL = 1 büro memuru ise, 0 diğerleri
MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri
CRAFTS =1,usta ise; 0 diğerleri
Temel sınıf Profesyonel meslek grupları.
76
Dependent Variable: WAGE
Method: Least Squares
Included observations: 49
Variable Coefficient Std. Error t-Statistic Prob.
C 1637.202 263.6726 6.209224 0.0000
EDUC 49.33178 27.99678 1.762052 0.0855
EXPER 27.29509 9.488883 2.876533 0.0064
GENDER 473.6966 152.4818 3.106578 0.0034
RACE 207.0888 130.4491 1.587506 0.1201
CLERICAL-946.7380 174.6505 -5.420758 0.0000
MAINT -1053.424 203.4297 -5.178320 0.0000
CRAFTS -708.8822 176.0507 -4.026580 0.0002
R-squared 0.737516 Mean dependent var 1820.204
Adjusted R-squared 0.692702 S.D. dependent var 648.2687
S.E. of regression 359.3643 Akaike info criterion 14.75483
Sum squared resid 5294850. Schwarz criterion 15.06370
Log likelihood -353.4934 F-statistic 16.45717
Durbin-Watson stat 2.107977 Prob(F-statistic) 0.000000
77
DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını
göstermekte
colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85 - 3.97)
hsgpa = Lise GPA (Range 2.29 - 4.5)
vsat = Sözel derecesi (Range 200 - 700)
msat = Sayısal derecesi (Range 330 - 770)
dsci = 1 Bilim dalı için, 0 diğerleri
dsoc = 1 Sosyal bilim dallı için, 0 diğerleri
dhum = 1 Beşeri bilimdalı için 0 diğerleri
darts = 1 Sanat dalı için, 0 diğerleri
dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri
dpub = 1 Genel lise mezunu ise, 0 diğerleri
78
Dependent Variable: COLGPA
Method: Least Squares
Sample: 1 427
Included observations: 427
Variable Coefficient Std. Error t-Statistic Prob.
C 0.367296 0.224302 1.637506 0.1023
HSGPA 0.405914 0.063418 6.400630 0.0000
VSAT 0.000726 0.000290 2.503907 0.0127
MSAT 0.001086 0.000303 3.586609 0.0004
DSCI -0.027323 0.057319 -0.476673 0.6338
DSOC 0.056148 0.072778 0.771494 0.4409
DHUM -0.004059 0.141771 -0.028632 0.9772
DARTS 0.228650 0.188921 1.210294 0.2269
DCAM -0.040705 0.052162 -0.780362 0.4356
DPUB 0.029403 0.063040 0.466416 0.6412
Katsayılar istatistiki olarak
anlamsız
79
Dependent Variable: COLGPA
Variable Coefficient Std. Error t-Statistic Prob.
C 0.423249 0.219749 1.926053 0.0548
HSGPA 0.398349 0.060586 6.574882 0.0000
VSAT 0.000737 0.000281 2.627361 0.0089
MSAT 0.001015 0.000294 3.457749 0.0006