Upload
salih-kurucan
View
302
Download
8
Embed Size (px)
DESCRIPTION
İleri Araştırma Teknikleri, Basit Regresyon ve Korelasyon Analizinin İncelenmesi, Salih Kurucan
Citation preview
BASİT REGRESYON VE
KORELASYON ANALİZİ
Ahmet Salih Kurucan
İ.Ü. İşletme Fakültesi 2014-2015 Eğitim-Öğretim Yılı Güz Dönemi (Doktora)
İleri Araştırma Teknikleri
Prof. Dr. A. Neyran ORHUNBİLGE
1
Konu Başlıkları
• Analizin Önemi
• Regresyon ve Korelasyon Analizinin Türleri
• Basit Doğrusal Regresyon Analizi
• En Küçük Kareler Yöntemiyle Doğrusal Regresyon
Denklemi
• Regresyon Denklemiyle Yapılacak Tahminlerin Standart
Hatası
• En Küçük Kareler Yönteminin Varsayımları
• Korelasyon Analizi, Tanımı ve Önemi
• Basit Doğrusal Regresyon Korelasyon Katsayısı
2
Konu Başlıkları
• Anakütle Verileriyle Basit Doğrusal Regresyon ve
Korelasyon Analizi
• Örnek Verileriyle Basit Doğrusal Regresyon ve
Korelasyon Analizi
• Regresyon Katsayısının Testleri
• Korelasyon Katsayısının Testleri
• Örnek Verileriyle Tahmin ve Politikaların Belirlenmesi
3
Konu Başlıkları
• Doğrusal Olmayan (Eğrisel) Basit Regresyon Analizi
• İkinci Derece Regresyon Denkleminin Yazılışı
• İkinci Derece Regresyon Denkleminin Standart Hatası
• İkinci Derece Fonksiyona Ait Korelasyon Katsayısı (Korelasyon İndeksi)
• Örnek Verileriyle İkinci Derece Regresyon Analizi ve Testler • Regresyon Katsayılarının Testleri
• İkinci Derece Korelasyon Katsayısının Testleri
• İkinci Derece Regresyon Denklemiyle Tahmin ve Politikaların Belirlenmesi
• Basit Regresyon Analizinde Doğrusala Dönüştürme Yöntemleri
4
Analizin Önemi
• İlişki Analizi veya Regresyon Analizi veya Tahmin
Teknikleri ana başlığı altında ele alınan bu istatistik
tekniğin iki temel işlevi vardır:
•Tahmin
•Karar vericiye politika saptamak
Aynı zamanda politikaların saptanıp, planlamanın
yapılmasında yol gösterici olması regresyon analizini diğer
tahmin tekniklerinden üstün kılar.
5
Regresyon ve Korelasyon Analizi Tanım
• Regresyon Analizi: Herhangi bir değişkenin (bağımlı
değişken) bir veya birden fazla değişkenle (bağımsız-
açıklayıcı değişken) arasındaki ilişkinin matematik bir
fonksiyon şeklinde yazılmasıdır.
• Korelasyon: Bağımlı değişkenle bağımsız değişken veya
değişkenler arasındaki ilişkinin gücünü derece olarak
gösteren ve yüzde olarak ifade eden bir katsayıdır.
6
Regresyon ve Korelasyon Analizinin
Türleri
• Bağımsız değişken sayısına göre:
• Basit regresyon analizi (Tek bağımsız değişken)
• Çoklu regresyon analizi (Birden çok bağımsız değişken)
• Fonksiyon tipine göre:
• Doğrusal regresyon analizi
• Doğrusal olmayan (eğrisel) regresyon analizi
7
Regresyon ve Korelasyon Analizinin
Türleri
• Verilerin kaynağına göre: • Anakütle verileriyle regresyon analizi
• Örnek verileriyle regresyon analizi
• Zaman serilerinde regresyon analizi
• Çözüm yöntemlerine göre: • En Küçük Kareler Yöntemi
• Ağırlıklı En Küçük Kareler Yöntemi
• Taraflı Tahminleyen Yöntemi
• Asal Bileşenler Yöntemi
• Maximum Benzerlik Yöntemi
8
Regresyon ve Korelasyon Analizi
• Yarı belirleyici ve deneysel ilişkilerin (stokastik)
incelenmesi regresyon analizinin kapsamına girmektedir.
• Bağımlı değişken: Modelin ifade ettiği olay tarafından
belirlenirken,
• Bağımsız değiken: Modelin ifade edilen olaydan
bağımsız olan verileridir.
• Örneğin kişilerin gelirlerinin değişmesi, harcama
miktarının da değişmesine neden olur. Bu durumda gelir
bağımsız değişken, harcama miktarı ise bağımlı
değişkendir.
9
Basit Doğrusal ve Regresyon Analizi
• Basit doğrusal regresyon analizi, Y bağımlı değişkenin tek bir bağımsız (açıklayıcı) değişken X ile arasındaki ilişkinin doğrusal fonksiyonla ifade edilmesine dayanmaktadır.
• Anakütle için basit doğrusal regresyon denklemi:
• 𝑌 = 𝐵𝑂 + 𝐵1𝑋 + 𝜀
• Örnek için ise:
• 𝑦 = 𝑏𝑂 + 𝑏1𝑥 + 𝜀
• Hata Terimi (Kalıntı)
• 𝜀 = 𝑌 − 𝑌′
10
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • En küçük kareler yöntemi, birbirine bağlı olarak değişen
iki fiziksel büyüklük arasındaki matematiksel bağlantıyı,
mümkün olduğunca gerçeğe uygun bir denklem olarak
yazmak için kullanılan, standart bir regresyon yöntemidir.
• Formun nasıl olacağına karar verdikten sonra katsayılar
bulunur.
• Tüm örnek sonuçlarına bakılarak hata terimlerinin
karelerini en düşük yapan katsayılar türev yardımıyla
bulunur.
• Burada türevin sıfır olduğu noktanın en küçük değer
olması kuralından faydalanılır.
11
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • Fonksiyon tipinin belirlenmesi için regresyon analizine
serpilme diyagramı çizilerek başlanır. Aşağıdaki serpilme
diyagramında gözlem noktalarının dağılımının doğrusal
bir eğilimde olduğu görülebilir.
12
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • Serpilme diyagramı incelendiğinde doğrusal bir eğilim gözüküyorsa
X’in Y’e göre matematik fonksiyonunun doğrusal olduğuna karar
verebilir.
• Ancak gözlem noktaları arasından çok sayıda doğrusal fonksiyon
geçirilebilir, en uygunu Y gözlem değerine en yakın tahmini (teorik) Y’
değerini (minimum hata) veren doğrusal fonksiyon olacaktır.
• olan fonksiyon seçilmelidir.
• yapılması gerekir. Bu yönteme En Küçük Kareler Yöntemi adı verilir.
13
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • Bu fonksiyonun minimum olabilmesi için 𝑏0 ve 𝑏1
parametrelerine göre birinci dereceden türevlerin 0’a
eşitlenmesi gerekmektedir.
• Negatif işaretli terimler eşitliğin sağ tarafında geçirilerek
Normal Denklemler adı verilen aşağıdaki denklemler elde
edilir.
14
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • Bu denklemlerde X değişkenin toplamı, kareleri toplamı, Y
değişkeninin toplamı ve iki değişkenin çarpımlarının
toplamı yerine konularak cebirsel eliminasyon ile çözüm
yapıldığında 𝑏0ve 𝑏1 katsayılarının değerleri elde edilir.
• Bu denklemde x ve y gözlem değerleri yerine bu
değerlerin aritmetik ortalamadan farkları konularak
kısaltmalar sağlanabilir.
• Aritmetik ortalamadan farkların cebirsel toplamını
ifade eden terimler sıfır olur.
15
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • Birinci denklemde 𝑏0=0, ikinci denklemde ise
• elde edilecektir.
• 𝑏0=0 parametresinin değerini elde edebilmek için fonksiyonun geçtiği ortak noktalar 𝑥 ve 𝑦 ’nin denklemde x ve y’nin yerine konulması gerekir.
• Bu yolla da basit doğrusal regresyon denklemi yazılmış olur.
16
En Küçük Kareler Yöntemiyle Doğrusal
Regresyon Denklemi • 𝑏1 formülünün cebirsel açılımı yapılırsa aşağıdaki formül
elde edilebilir.
• Bu formülden yararlanıldığında, aritmetik ortalamadan farklar alınmamaktadır.
• İlk yol da olduğu gibi iki bilinmeyenli denkelmelerin çözüme de gerek kalmamaktadır.
17
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası • Tahmin standart hatası veya regresyon denkleminin
standart hatası adları da verilen değer ise genellikle S
harfiyle gösterilmektedir.
• Endisler kullanılarak hangi fonksiyonunun veya regresyon
denkleminin hatası olduğu belirlenir.
• 𝑺𝒚𝒙 doğrusal bir regresyon denkleminin standart hatasını
• 𝑺𝒀𝑿𝑿𝟐 ikinci derece bir regresyon denkleminin standart
hatasını gösterir.
18
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası
• Şartıyla elde edilen regresyon denklemiyle tahmin
yapıldığında bir tahmin hatası vardır ancak bu minimize
edilmiştir.
• Gözlenen y değeri bir tahmin değer y’ bir de e gibi
hatadan oluşmaktadır.
• Tüm y’ lere ait olan bu hataların (e’lerin) ortalama
ölçüsüne standart hatası adı verilmektedir.
19
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası • Anakütleler ve örnekler için basit doğrusal regresyon
denkleminin standart hatası:
formülleriyle hesaplanır. Anakütlede hataların kareleri
toplamı N ’e bölünürken örneklerde (n-2) ’ye bölünmekte
yani bir anlamda daha büyük hesaplanmaktadır.
• Hatalarının karelerin ortalaması alınır. Kareli
ortalamanın kullanılmasının nedeni olmasıdır.
20
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası • Standart hatanın hesaplanabilmesi için elde edilen regresyon
denkleminde x yerine sırasıyla gözlenen tüm x değerleri
yerleştirilerek n adet y’ tahmini değeri elde edilir.
• Daha sonra gözlenen y değeriyle tahmini y’ değerleri
arasındaki farkların kareli ortalaması alınır.
• Şayet fonksyion ve açıklayıcı değişken x iyi seçilmişsse y’
değeri gözlenen y değerine çok yakın çıkarak düşük standart
hata elde edilmesine neden olur.
• Aksi halde hata büyük çıkacaktır. Bu durumda fonksiyon tipi
değiştirilebilir veya x bağımsız değişkeni başka bağımsız
değişkinlerle desteklenerek çoklu regresyon analizi uygulanır.
21
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası • Basit doğrusal regresyon denkleminin standart hatasının
tahmini formülüne ulaşmak için ‘lerin ilgili
fonksiyon açılımı yapılır.
• açılımı yapıldığına;
• x ile y yerine aritmetik ortalamadan farkları
yerleştirildiğinde, aritmetik ortalamadan farkların toplamı
ve 𝒃𝟎 katsayısını içeren terimler sıfır olacağından;
22
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası
• olur. 𝒃𝟏’ler yerine formülü konulduğunda değeri:
•
• elde edilir. Gerekli sadeleştirmeler yapıldığında ve 𝑏1
ifadesine yeniden dönüldüğünde de aşağıdaki şekilde
yazılabilir.
23
Regresyon Denklemiyle Yapılacak
Tahminlerin Standart Hatası
• Basit doğrusal regresyon denkleminin standart hatasının
tahminine
• formülüyle ulaşılabilir. Anakütlede paydada N vardır.
24
En Küçük Kareler Yönteminin
Varsayımları - 1 • Varsayımları üç grupta toplamak mümkündür;
• Bağımlı değişken Y, bağımsız değişken X ’e
belirli bir ölçüde bağımlıdır. Y değişkeni tesadüfi,
X değişkeni ise araştırmacı tarafından seçilen ve
kontrol edilebilen belirlenmiş değerlerdir.
• Her iki değişkenin tesadüfi olduğu durumlarda
da regresyon analizinde doğru sonuçlar elde
edilebilir.
25
En Küçük Kareler Yönteminin
Varsayımları - 2 • Otokeralasyon (autocorrelation) : Hataların birbirinden bağımsız
olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemler sözkonusu ise önem kazanmaktadır.
• Hataların birbirinden bağımsız olmaları gerekmektedir.
• Hataların bağımlı olmasının nedenleri arasında:
• Önemli bir açıklayıcı değişkenin modelde olmaması
• Örnek birim sayısının az olması
• Seçilen fonksiyon tipinin uygun olmaması
• Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi sayılabilir.
• Herhangi bir göz yanılmasına yer vermemek için sadece grafik yöntemle karar vermemek özellikle Durbin-Watson testini uygulamak gerekir.
26
En Küçük Kareler Yönteminin
Varsayımları - 3 • Belirli X değerleri karşısındaki Y değerleri alt setlerinin ve hataların
varyansları birbirine eşittir. Buna Eşit Varyanslılık varsayımı adı verilmektedir. Bu özelliğin tersi ise Farklı Varyanslılık adını alır.
• Çeşitli X değerleri karşısında Y değerlerinin regresyon doğrusuna paralel olarak çizgiler arasında olması eşit varyanslılığı yansıtır.
• X değerleri artarken bu çizgilerin genişlemeye veya tam tersi daralmaya başlaması ise istenmeyen durum Farklı Varyanslılığı gösterir.
• Örneğin gelirler (X) artarken tüketim harcalamaları (Y) alt setleri de sürekli genişlemektedir.
• Yüksek gelirlilerin bazıları az tüketim bazıları da çok fazla tüketim yapabilirler. Düşük gelirlerin ise gelirleri az olduğu için tüketim değeri aralığı da dar olmaktadır.
27
KORELASYON ANALİZİ,
TANIMI VE ÖNEMİ
28
Korelasyon Analizi, Tanımı ve Katsayısı
• İki değişken arasındaki doğrusal ilişkinin gücünü (derecesini) ve yönünü belirlemek icin hesaplanan bir sayıdır.
• Belirli bir birimi yoktur.
• Her zaman icin -1≤r≤ 1 eşitsizliği geçerlidir.
• Anakütle verileriyle yapılan analizlerde ρ, örnek verileriyle yapılan analizlerde ise r ile gösterilen korelasyon katsayısı ±𝟏 arasında yer almaktadır.
• Korelasyon katsayısının 1’e yaklaşması ilişikinin güçlü, 0’a yaklaşması ise zayıf olduğunu göstermektedir.
29
Korelasyon Analizi, Tanımı ve Katsayısı
30
İki değişken arsında doğrusal bir ilişki yok ise korelasyon katsayısı r=0
bulunur. r>0 ise iki değişken arasında aynı yönde bir ilişki, r<0 ise de
değişkenler arasında ters yönlü bir ilişki söz konusudur.
Korelasyon Analizi, Tanımı ve Katsayısı
• Regresyon analizinde regresyon katsayısı ve standart
hata 0 olmadığı sürece kesin bir karar verilemezken,
korelasyon katsayısı incelenerek karar verebiliriz.
• Korelasyon katsayılarıyla, regresyon denklemlerin
standart hataları arasında %100’lük ters bir ilişki (negatif)
vardır.
31
Karar Verme Katsayısı (Belirlilik)
• Oluşturulan regresyon denkleminin ne derece iyi bir tahminleyici olduğunu belirleyen oran belirlilik katsayısı olarak ifade edilir ve 𝑹𝟐 (veya 𝝆𝟐) ile gösterilir.
• Bu ile modelin uygunluğu tespit edilebilir.
• 𝑹𝟐 değeri 1’e ne derece yakın ise denklem o derece iyi,
• Sıfıra ne derece yakın ise denklem o derece kötü bir tahminleyici olarak kabul edilir.
32
Korelasyon Katsayısının Hesaplanması
• Serpilme diyagramında bir regresyon doğrusu
yerleştirirsek, 𝒀 − 𝒀 arasındaki fark, 𝑿𝒐 değeri
karşısındaki Y değerinin, Y serisinin ortalamasından
• farkını yani Y’deki toplam
• Değişkenliğini gösterir.
• Bu fark (𝒀 − 𝒀), (𝒀 − 𝒀′)
• ve (𝒀′ − 𝒀 ) olmak üzere
• iki kısımdan oluşur.
33
Korelasyon Katsayısının Hesaplanması
• Bu açıklamalar aşağıdaki şekilde gösterilebilir:
• Aritmetik ortalamadan farkların cebirsel toplamını ifade
eden terimler sıfır olacağı ve burada iki terim 0’a eşit
olacağı için kareleri alınırsa;
34
Korelasyon Katsayısının Hesaplanması
• Her üç terim de (𝒚 − 𝒚 )𝟐 değerine bölünürse eşitlik
bozulmaz ancak oran şekline dönüşür:
•
• Korelasyon Katsayısı =>
35
(Belirlilik Katsayısı)
Korelasyon Katsayısının Hesaplanması
• Bu basit doğrusal korelasyon formülüyle korelasyon
katsayısının işareti belirlenemez.
• Karekök içinde ifadelerden oluştuğu için hep pozitif
çıkmak durumundadır.
• Katsayının işaretinin de belirlenebilecegi özel bir formül
elde edilmesi gerekir:
36
Korelasyon Katsayısının Hesaplanması
• Doğrusal Korelasyon katsayısına ait özel bir formül elde
etmek için formüldeki y’ yerine 𝒃𝑶 + 𝒃𝟏𝒙 yerleştirilirse
aşağıdaki form elde edilir:
• Standart hatanın hesaplanmasından aşağıdaki eşitlik elde
edilmişti:
• Bu formülde yerine konulursa,
• basit doğrusal korelasyon
• katsayısı için özel bir formül
• elde edilir:
37
Korelasyon Katsayısının Hesaplanması
• Formüldeki 𝒃𝟏 yerine regresyon hesabında bulunan formülü yazılır ve gerekli sadeleştirmeler yapılırsa aşağıdaki formüller elde edilir:
• veya:
• Bu basit doğrusal korelasyon formülüyle korelasyon katsayısının işareti de belirlenebilecektir.
38
Anakütle ve Örnek Verileriyle Regresyon
ve Korelasyon Analizi İstatistiksel Tahminleme
39
Nokta Tahmini Aralık Tahmini
𝒀′ = 𝑩𝑶 +𝑩𝟏𝑿 𝒀′ = 𝑩𝑶 +𝑩𝟏𝑿 + 𝜺
Y’ değerleri regresyon
doğrusu üzerindedir.
Tahminin bir de standart hatası vardır, bu hatanın da tahmine eklenmesi
gerekir. Çünkü en küçük kareler yöntemiyle yazılan regresyon denklemi
hataları minimize etmekte ancak tamamen ortadan kaldırmamaktadır.
Belirli bir olasılıkla (güvenle) ‘Aralık Tahmini’ yapılması gerekmektedir.
Aralık Tahmini
• Aralık tahmini yapılabilmesi için en küçük kareler yönteminin
varsayımlarının gerçekliliğinin araştırılması şarttır.
• Örneğin yeterince büyük olmaması veya bir örnekten elde
edilen istatistiğin bir başka örnekten sağlanan istatistikle aynı
olmayışı yüzünden anakütle parametresini bir noktada tahmin
etmek yanlış sonuçlar doğurabilir.
• Bu yüzden anakütle parametresi belirli bir hata seviyesi göz
önüne alınarak belirli bir aralıkta aranır.
• Hata terimini α ile gösterirsek, 1- α güven seviyesinde aralık
tahmini yapabiliriz.
40
Aralık Tahmini
41
• Hata terimi normal eğrinin her iki ucunda eşit olarak yer alır. %95 güven sınırları
için 1-0.95=0.05 dir. Bu hata normal eğrinin sağ ve sol ucuna eşit olarak
dağıtıldığında α /2 =0.05/2=0.025 dur.
• Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri vardır.
Örnek Verileriyle Regresyon ve
Korelasyon Analizi
• Örnek regresyon katsayılarının 𝒃𝟎 𝒗𝒆 𝒃𝟏 standart
hataları ile korelasyon katsayısının standart
hatasının düşük olması örnek verileriyle yapılan
regresyon korelasyon analizinin anakütle için
geçerli olduğunu gösterir.
• Bu standart hatanın düşük olması örnek birim
sayısının yeterince büyük olmasına bağlıdır.
42
Örnek Verileriyle Regresyon ve
Korelasyon Analizi • Örnekleme teorisine göre;
• Küçük örneklerden (n<30) elde edilen istatistiklerin
dağılımı t Student dağılımına uyar.
• Küçük örnek istatistiklerinin gösterdiği dağılım normal eğri
gibi simetriktir. Normal eğriye göre daha basık ve yaygın
bir şekil alır. Böylece eğrinin kuyruklarında daha büyük bir
alan oluşur.
• n>30 olduğunda ise Z (Normal) dağılımına uyar.
43
Regresyon Katsayısının Testleri
• Regresyon denkleminin en küçük kareler yöntemiyle
yazılışı ve korelasyon katsayısının hesaplanması
aşamalarında örnek ve anakütle arasında hiçbir fark
yoktur. Sadece standart hatanın hesaplanmasında
farklılık olur.
• Tüm regresyon katsayılarının (𝑏1) ile korelasyon
katsayılarının (𝑟𝑦𝑥) anakütle için geçerliliklerinin
araştırılması gerekir.
• 𝒃𝟎 katsayısı sabit olduğu için değişkenler arasında
ilişki göstermemekte bu nedenle de testi yapılmaz.
44
Regresyon Katsayısının Testleri
• Regresyon analizinde hipotez testleri dört aşamadan
oluşur:
1. Hipotezlerin yazılması
• 𝐻0: 𝐵1 = 0 Anakütle X’deki bir birimlik değişme Y’de hiçbir
değişme oluşturmaz. (iki değişken arasında ilişki yoktur.)
• 𝐻1: 𝐵1 ≠ 0 Anakütlede X’deki bir birimlik değişme Y’de
anlamlı bir değişme oluşturur.
45
Regresyon Katsayısının Testleri
2. 𝜶 (𝒂𝒍𝒇𝒂) anlamlılık düzeyinin belirlenmesi
• 𝐻0 doğru olduğu halde 𝐻0 reddildiğinde yapılan hatayı
gösterir. (Yani iki değişken arasında anlamlı bir ilişki yok)
• %5 veya %1 sıklıkla kullanılan anlamlılık düzeyidir.
• %(1 - α) = testin güven düzeyidir: %99, %95.
46
Regresyon Katsayısının Testleri
• 3. Örnek regresyon katsayısının standart tesadüfi
değişkene dönüştürülmesi
• n<30 ise n>30 ise
• 𝐻0 hipotezinde B=0
• olduğu için:
47
şeklinde yazılabilir. Bu formülle regresyon katsayısı için t
veya Z değeri elde edilebilir.
Regresyon Katsayısının Testleri
4.Karar
• 𝒁𝜶/𝟐 veya 𝒕𝜶𝟐;𝒏−𝟐 tablo değeri ≥ hesaplanan 𝒁 veya 𝒕
değeri ise 𝑯𝟎 kabul, iki değişken arasında ilişki yok,
örneklem tahminlerde kullanılamaz.
• Tablo değeri ≤ 𝒁 veya 𝒕 ise 𝑯𝟎 red, iki değişken
arasında anakütlede ilişki var, örneklem tahminlerde
kullanılabilir.
• Basit doğrusal regresyon analizinde sadece regresyon
katsayısının veya sadece korelasyon katsayısının test
edilmesi yeterlidir. (Çünkü tek katsayı var)
48
Korelasyon Katsayısının Testleri
• Basit doğrusal korelasyon katsayılarının testinde Z (𝒏 ≥ 𝟑𝟎), t (𝒏 ≤ 𝟑𝟎) veya her büyüklükteki n için F testleri kullanılabilir.
• F testi (Varyans Analizi) iki ve birden fazla değişkenli modellerde kullanılır.
• Bu nedenle tüm korelasyon katsayılarının (basit doğrusal, eğrisel, çoklu ve kısmi) testlerinde F testi uygulanabilir.
• t ve Z testleri sadece iki değişkenin söz konusu olduğu, doğrusal ve kısmi korelasyon katsayılarının testlerinde kullanılabilir.
49
Korelasyon Katsayısının Testleri
• Korelasyon katsayısının t ve Z testlerinin aşamaları,
regresyon katsayısının testiyle hemen hemen aynıdır.
1. Hipotezlerin yazılması
• 𝐻0; 𝜌𝑦𝑥 = 0 Anakütlede X ile Y arasında ilişki yoktur.
• 𝐻1; 𝜌𝑦𝑥 ≠ 0 Anakütlede X ile Y arasında anlamlı bir ilişki
var.
2. 𝜶 (𝒂𝒍𝒇𝒂) anlamlılık düzeyinin belirlenmesi
50
Korelasyon Katsayısının Testleri
3. Örnek korelasyon katsayısının standart tesadüfi
değişkene dönüştürülmesi
• Şekillerindeki formüllerden yararlanılarak t veya Z
değerleri korelasyon katsayısı elde edilebilir.
51
Korelasyon Katsayısının Testleri
4. Karar
• 𝒁𝜶/𝟐 veya 𝒕𝜶𝟐;𝒏−𝟐 tablo değeri ≥ hesaplanan 𝒁 veya 𝒕
değeri ise 𝑯𝟎 kabul, iki değişken arasında ilişki yok, X değişkeni Y’i gerçekte etkilemektedir.
• 𝒁𝜶/𝟐 veya 𝒕𝜶𝟐;𝒏−𝟐 tablo değeri < hesaplanan 𝒁 veya 𝒕
değeri ise 𝑯𝟎 red, iki değişken arasında anakütlede doğrusal bir ilişki var yani lişki anlamlıdır. X değişkeni Y değişkeninin etkilediği için X değişkeni, Y üzerinde geliştirilecek politikalarda kullanılabilir.
• Aynı zamanda doğrusal regresyon denklemi de tahminlerde kullanılabilir sonucu ortaya çıkar.
52
Örnek Verileriyle Tahmin ve
Politikaların Belirlenmesi
• Örneklemde kullanılan denklem örnek regresyon
denklemi olduğu için 𝒃𝟎 ve 𝒃𝟏 katsayılarının standart
hatalarının 𝑺 𝒃𝟎𝑣𝑒 𝑺 𝒃𝟏tahmine ilave edilmesi gerekir.
• Bu hatalar yanında, regresyon denklemiyle yapılacak
tahminlerin standart hatasının 𝑺 𝒚𝒙 da ilave edilmesi
gerekir.
53
Örnek Verileriyle Tahmin ve
Politikaların Belirlenmesi
• Bu üç hatanın birlikte tahmine ilave edilmesinde aşağıdaki
formül kullanılır:
• Y değişkeninin tahmin aralığının büyük güvenle dar
olması için, her üç hatanın da düşük olması gerekir.
54
DOĞRUSAL OLMAYAN
(EĞRİSEL) BASİT
REGRESYON ANALİZİ
55
Doğrusal olmayan (Eğrisel) Basit
Regresyon Analizi • Bağımsız değişkenlerin, bağımlı değişkenle olan ilişkisi
her zaman doğrusal değildir. Eğrisel fonksiyonlar ikinci
üçüncü ve daha üst derecelerden olabilir.
𝒃𝟎 sabit 𝒃𝟏 fonksiyonun eğimi, 𝒃𝟐 eğimin değişme oranı, 𝒃𝟑
ise bükümün derecesindeki değişme oranını gösterir.
56
Doğrusal olmayan (Eğrisel) Basit
Regresyon Analizi
• Veriler arasında ilişki tek bir bükülme noktası veriyorsa
ikinci derece bir regresyon denklemi yazmak gerekir.
• En iyi tahmini değerleri verebilecek olan ise, yine en
küçük kareler yöntemiyle yazılacak denklemdir.
57
İkinci Derece Regresyon Denkleminin
Yazılışı • Hataları yani (𝜀 = 𝑦 − 𝑦′ ‘leri) minimum yapacak olan
fonksiyonu yazabilmek için
• minimum yapacak 𝒃𝟎, 𝒃𝟏 ve 𝒃𝟐 ‘nin elde edilmesi gerekir.
• Bunun için üç katsayıya göre birinci dereceden türevler
alınıp sıfıra eşitlenir.
58
İkinci Derece Regresyon Denkleminin
Yazılışı • Negatif terimli ifadeler her üç denklemde de eşitliğin sol
tarafına alındığında, en küçük kareler yöntemiyle
fonksiyonunu yazılabilmesi için geçerli üç normal denklem
elde edilir.
• x ve y değişkenlerine, denklemlerdeki toplam, çarpım ve
karelerin alınması uygulanır ve yerlerine konularak çözüm
yapılırsa 𝒃𝟎, 𝒃𝟏 ve 𝒃𝟐 katsayıları elde edilir ve ikinci
derece regresyon denklemi yazılır:
59
İkinci Derece Regresyon Denkleminin
Standart Hatası • Örnek verileriyle yapılan analizlerde ikinci derece
fonksiyonlarda yapılacak tahminlerin standart hatası:
• açılımı yapılarak aşağıdaki
formül elde edilir:
60
İkinci Derece Fonksiyona Ait Korelasyon
Katsayısı (Korelasyon İndeksi) • Genel korelasyon formülü kullanılır:
• İkinci derece fonksiyona ait korelasyon katsayısı doğrusal
fonksiyondan hayli yüksekse (veya 1’e daha yakınsa)
anakütle verileriyle çalışılıyorsa, 2.derece fonksiyon
tahminlerde kullanılabilir.
• Örnek verileriyle çalışılmışsa bu sonuçların anakütle için
geçerliliğinin araştırılması yani katsayıların testlerin
yapılması gerekir.
61
İkinci Derecede Regresyon Katsayılarının
Testleri • Örnek verileriyle çalışıldığında, örnek regresyon
denkleminin anakütle regresyon denklemi yerine kullanılabilir nitelikte olup olmadığının test edilmesi gerekir.
• 2. derece fonksiyonlada ilişki gösteren iki katsayı 𝒃𝟏 𝐯𝐞 𝒃𝟐 olduğu için ikisinin birlikte test edilmesi zorunludur.
1. Hipotezlerin yazılması
2. 𝜶 anlamlılık düzeyinin belirlenmesi
𝒃𝟏’in testi
𝐻0: 𝐵1 = 0
𝐻1: 𝐵1 ≠ 0
𝒃𝟐’in testi
𝐻0: 𝐵𝟐 = 0
𝐻1: 𝐵𝟐 ≠ 0
62
İkinci Derecede Regresyon Katsayılarının
Testleri 3. Örnek regresyon katsayılarının standart tesadüfi
değişkene dönüştürülmesi
63
formülleriyle t veya Z değerleri elde edilebilir.
İkinci Derecede Regresyon Katsayılarının
Testleri 4. Karar
• 𝒕𝜶𝟐;𝒏−𝟑 tablo değeri ≥ 𝒕 ise 𝑯𝟎 kabul, 𝑏1 ve 𝑏2
parametreleri anlamsız. Anakütle için geçersiz.
• 𝒕𝜶𝟐;𝒏−𝟑 tablo değeri < 𝒕 ise 𝑯𝟎 red, 𝑏1 ve 𝑏2
parametreleri anlamlı. Anakütle için geçerli.
• Her iki katsayı için 𝑯𝟎 red ise, 2. derece
fonksiyon tahminlerde kullanılabilir.
64
İkinci Derecede Korelasyon Katsayısının
Testleri • Bir ve iki değişkene ait testlerde örnek büyüklüğüne bağlı
olarak t veya Z dağılımları kullanılmakta, iki ve ikiden fazla
değişken söz konusu olduğunda F testi (varyans analizi)
yapılmaktadır.
• F testi özellikle t veya Z testlerinin
uygulanamadığı ikiden fazla değişkenin testinde
kullanılabilen tek testtir.
• 2. Derece fonksiyonda da y,x ve x’in karesi olmak
üzere üç değişken olduğu için korelasyon indeksi
testinde sadece F testi uygulanabilir.
65
İkinci Derecede Korelasyon Katsayısının
Testleri 1.Hipotezin yazılması
𝐻0; 𝜌𝑦𝑥𝑥2 = 0 𝐻1; 𝜌𝑦𝑥𝑥2 ≠ 0
2. 𝜶 anlamlılık düzeyinin belirlenmesi
3. F istatistiğinin hesaplanması
4. Karar
𝐹𝛼;𝑓1−𝑓2 ≥ 𝐹 ise 𝐻0 kabul, anakütlede X ve Y arasındaki
ilişki ikinci dereceden değildir.
𝐹𝛼;𝑓1−𝑓2 < 𝐹 ise 𝐻0 red, anakütlede bu iki değişken
arasındaki ilişki ikinci derecedendir.
66
İkinci Derece Korelasyon Katsayısının
Testleri • 2. Derece regresyon analizi testlerinde korelasyon
indeksinin tek başına test edilmesi yetersizdir.
• Test sonucu 𝑯𝟎 kabul ise, 2.derece regresyon analizi
terk edilir.
• Test sonucu 𝑯𝟎 reddedilirse, mutlaka 𝑏1 ve 𝑏2
parametrelerinin de, ayrı ayrı test edilmesi gerekir.
• 𝑏1 ve 𝑏2’nin testleri sonucu 𝐻0 reddedilmişse, korelasyon
indeksinin testine gerek bile kalmaz
67