31
Экономико-математические методы в планировании и управлении Уральский федеральный университет 2014 им. первого Президента России Б.Н.Ельцина Кафедра «Экономика и управление строительством и рынком недвижимости»

лекция 8 эмм в менеджменте регресс анализ_часть ii

Embed Size (px)

Citation preview

Page 1: лекция 8 эмм в менеджменте регресс анализ_часть ii

Экономико-математические методы в планировании и управленииУральский федеральный университет

2014

им. первого Президента России Б.Н.Ельцина

Кафедра «Экономика и управление строительством и рынком недвижимости»

Page 2: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 2

Тема 7. Корреляционно-регрессионный анализ

План Парная регрессия и корреляция

Линейная модель парной регрессии Нелинейная модель парной

регрессии Множественная регрессия и

корреляция Практика применения

регрессионного анализа в оценочной деятельности

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.

Page 3: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 3

Нелинейная парная регрессия

Различают два класса нелинейных регрессий:

Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам:

полиномы различных степеней гипербола полулогарифмическая функция Регрессии, нелинейные по

оцениваемым параметрам, например: степенная показательная экспоненциальная

Page 4: лекция 8 эмм в менеджменте регресс анализ_часть ii

Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных, а дальнейшая оценка параметров производится с помощью МНК.

Парабола второй степени приводится к линейному виду с помощью замены:

В результате приходим к двухфакторному уравнению оценка параметров которого при помощи МНК:

Автор: доцент, к.ф.-м.н. В.А.Ларионова 4

Нелинейная парная регрессия

Page 5: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 5

Нелинейная парная регрессия

Гипербола приводится к линейному

уравнению простой заменой:

Система линейных уравнений при применении МНК будет выглядеть следующим образом:

Аналогичным образом приводятся к линейному виду зависимости

- замена - замена

lnz xz x

Page 6: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 6

Нелинейная парная регрессия

Регрессии нелинейные по оцениваемым параметрам делятся на два типа:

нелинейные модели внутренне линейные (приводятся к линейному виду с помощью соответствующих преобразований, например, логарифмированием)К внутренне линейным моделям относятся, например, степенная функция – , показательная –

, экспоненциальная –, логистическая – ,

обратная – . нелинейные модели внутренне

нелинейные (к линейному виду не приводятся)

Page 7: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 7

Нелинейная парная регрессия Среди нелинейных моделей наиболее

часто используется степенная функция , которая приводится к линейному виду логарифмированием:

где МНК мы применяется к преобразованным данным:

Потенцированием находится искомое уравнение.

Page 8: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 8

Нелинейная парная регрессия

Уравнение нелинейной регрессии, так же, как и в случае линейной зависимости, дополняется показателем тесноты связи. В данном случае это индекс корреляции:

где - общая дисперсия результативного признака y;

- остаточная дисперсия.

Величина данного показателя находится в пределах: .

Page 9: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 9

Нелинейная парная регрессия

Квадрат индекса корреляции носит название индекса детерминации и характеризует долю дисперсии результативного признака , объясняемую регрессией, в общей дисперсии результативного признака:

где .

Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии, тем < .

Page 10: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 10

Нелинейная парная регрессия

Индекс детерминации используется для проверки существенности в целом уравнения регрессии по F-критерию Фишера:

где n– число наблюдений, m– число параметров при переменной x. Фактическое значение F-критерия сравнивается с табличным при уровне значимости и числе степеней свободы и .

Page 11: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 11

Нелинейная парная регрессия

Рассмотрим тот же пример на парную линейную регрессию: определить стоимость объекта недвижимости, если известно, что на местном рынке зафиксированы следующие сделки c аналогичными объектами недвижимости

И предположим, что связь между признаками носит нелинейный характер, и найдем параметры следующих нелинейных уравнений:

и .

Показатель Значение показателя

Месяц от даты оценки 18 15 12 10 9

Сделка, тыс. руб. за 1 м2 240 240 270 270 280

Месяц от даты оценки 7 6 5 3 1

Сделка, тыс. руб. за 1м2 300 310 330 330 335

Page 12: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 12

Для нахождения параметров регрессии делаем замену и составляем таблицу:

Нелинейная парная регрессия

X Z=lnX Y ZY Z^2 Y^2 Yf Y-Yf (Y-Yf)^2 ABS((Y-Yf)/Yf) (Yf-Yср)^2 (Y-Yср)^218 2,890372 240 693,6892 8,354249 57600 253,932497 -13,9324972 194,114479 0,054866933 1337,182259 2550,2515 2,70805 240 649,932 7,333536 57600 260,68403 -20,6840303 427,829109 0,079345214 888,9920495 2550,2512 2,484907 270 670,9248 6,174761 72900 268,947239 1,052761052 1,10830583 0,003914378 464,521509 420,2510 2,302585 270 621,698 5,301898 72900 275,698772 -5,69877202 32,4760025 0,020670284 219,0763498 420,25

9 2,197225 280 615,2229 4,827796 78400 279,600368 0,399632262 0,15970594 0,001429298 118,8019834 110,257 1,94591 300 583,773 3,786566 90000 288,90677 11,09323041 123,059761 0,038397267 2,538383144 90,256 1,791759 310 555,4454 3,210402 96100 294,615109 15,38489054 236,694857 0,052220304 16,93412589 380,255 1,609438 330 531,1145 2,59029 108900 301,366643 28,63335747 819,86916 0,095011701 118,0839199 1560,253 1,098612 330 362,5421 1,206949 108900 320,28298 9,717020023 94,4204781 0,030338859 887,0258963 1560,251 0 335 0 0 112225 360,965592 -25,9655922 674,211979 0,071933704 4965,399686 1980,25

Xср Zср Yср ZYср Z^2ср Y^2ср СУММ ABS()ср, % СУММ СУММ8,6 1,902886 290,5 528,4342 4,278645 85552,5 2603,94384 4,481279426 9018,556163 11622,5

Page 13: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 13

Нелинейная парная регрессия

Проверка значимости уравнения регрессии:

Соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным?

Достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Качество модели определяется средней ошибкой аппроксимации:

Средняя ошибка аппроксимации не должна превышать 8–10%.

Page 14: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 14

Для изучения качества регрессионной модели применяется дисперсионный анализ, согласно которому общая сумма квадратов отклонений переменной от среднего значения раскладывается на две части – «объясненную» и «необъясненную»:

где – общая сумма квадратов отклонений; – сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений); – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.

Парная линейная регрессия

Page 15: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 15

Парная линейная регрессия

Схема дисперсионного анализа:

где n – число наблюдений, m – число параметров при переменной

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия на одну степень свободы

Общая

Факторная

Остаточная

Page 16: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 16

Оценка значимости уравнения регрессии в целом производится на основе F- критерия Фишера, который для парной линейной регрессии равен:

или

где n – количество наблюдений.Фактическое значение критерия Фишера сравнивается с табличным значением. При этом, если фактическое значение критерия больше табличного, то признается статистическая значимость уравнения в целом.

Парная линейная регрессия

Page 17: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 17

Парная линейная регрессия

В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров a и b определяется его стандартная ошибка. Для параметра b она равна:

Стандартная ошибка параметра a определяется по формуле:

Page 18: лекция 8 эмм в менеджменте регресс анализ_часть ii

Авто: доцент, к.ф.-м.н. В.А.Ларионова 18

Для оценки существенности коэффициентов регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t-критерия Стьюдента:

которое затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы n-2.

Доверительный интервал для коэффициентов регрессии определяется как

Парная линейная регрессия

Page 19: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 19

Парная линейная регрессия

Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции:

Фактическое значение -критерия Стьюдента определяется как

Существует связь между t-критерием Стьюдента и F-критерием Фишера:

Page 20: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 20

Парная линейная регрессияПример. Определить стоимость

объекта недвижимости, если известно, что на местном рынке зафиксированы следующие сделки c аналогичными объектами недвижимости:

Показатель Значение показателя

Месяц от даты оценки 18 15 12 10 9

Сделка, тыс. руб. 240 240 270 270 280

Месяц от даты оценки 7 6 5 3 1

Сделка, тыс. руб. 300 310 330 330 335

Page 21: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 21

Парная линейная регрессия

0 2 4 6 8 10 12 14 16 18 200

50

100

150

200

250

300

350

400

Page 22: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 22

Парная линейная регрессияX Y XY X^2 Y^2 Yf Y-Yf (Y-Yf)^2 ABS((Y-Yf)/Yf) (Yf-Yср)^2 (Y-Yср)^2

18 240 4320 324 57600 228,8679 11,13208 123,9231 0,0486 3798,5127 2550,2515 240 3600 225 57600 248,5377 -8,53774 72,89293 0,0344 1760,8316 2550,2512 270 3240 144 72900 268,2075 1,792453 3,212887 0,0067 496,95345 420,2510 270 2700 100 72900 281,3208 -11,3208 128,1595 0,0402 84,258544 420,25

9 280 2520 81 78400 287,8774 -7,87736 62,05278 0,0274 6,8782485 110,257 300 2100 49 90000 300,9906 -0,99057 0,981221 0,0033 110,05198 90,256 310 1860 36 96100 307,5472 2,45283 6,016376 0,0080 290,606 380,255 330 1650 25 108900 314,1038 15,89623 252,69 0,0506 557,13813 1560,253 330 990 9 108900 327,217 2,783019 7,745194 0,0085 1348,1367 1560,251 335 335 1 112225 340,3302 -5,33019 28,41091 0,0157 2483,0477 1980,25

Xср Yср XYср X^2ср Y^2ср СУММ ABS()ср, % СУММ СУММ8,6 290,5 2331,5 99,4 85552,5 686,0849 2,4332 10936,415 11622,5

Page 23: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 23

Рассчитаем параметры линейного уравнения парной регрессии .

Парная линейная регрессия

cov( , ) 2331,5 8,6 290,5 166,8x y xy x y

2

cov( , ) 166,86,5566

25,44x

x yb

22 2 299,4 8,6 25,44x x x

290,5 ( 6,5566) 8,6 346,8868a y bx

346,8868 6,5566xy a bx x

Page 24: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 24

Парная линейная регрессия

0 2 4 6 8 10 12 14 16 18 200

50

100

150

200

250

300

350

400

f(x) = − 6.55660377358491 x + 346.88679245283

Page 25: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 25

Парная линейная регрессия

Уравнение линейной регрессии всегда дополняется показателем тесноты связи – линейным коэффициентом корреляции:

  Близость коэффициента корреляции к 1 указывает на тесную линейную связь между признаками.

Коэффициент детерминации показывает, что уравнением регрессии объясняется 94% дисперсии результативного признака, а на долю прочих факторов приходится лишь 6%.

2 2( 0,97) 0,94097xyr

5,04386,5566 0,97

34,0918x

xyy

r b

Page 26: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 26

Парная линейная регрессия

Оценим качество уравнения регрессии в целом с помощью F-критерия Фишера и сравним с фактическим значением F -критерия:

Табличное значение F –критерия при k1=1, k2=10-2, =0,05 равно 5,3118. Так как , то признается статистическая значимость уравнения в целом.

2

2

0,940972 (10 2) 127,5226

1 1 0,94097xy

xy

rF n

r

Page 27: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 27

Парная линейная регрессия

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем t-критерий Стьюдента и доверительные интервалы каждого из показателей.2

2 ( ) 686,084985,7606

2 10 2x

ост

y yS

n

85,76060,58061

25,44 10ост

b

x

Sm

n

2( ) 85,7606 99,4 10

5,7886725,44 10

ост

ax

S xm

n

21 1 0,940970,0859

2 10 2r

rm

n

Page 28: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 28

Парная линейная регрессия

Фактические значения t-статистик:

Табличное значение t -критерия Стьюдента приk=10-2=8, =0,05 равно 2,3060. Так как значения коэффициентов больше табличных, то признаем статистическую значимость параметров регрессии и показателя тесноты связи.

6,556611,2926

0,58061

346,886859,9252

5,78867

0,9700411,2926

0,0859

bb

aa

rr

bt

m

at

m

rt

m

Page 29: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 29

Парная линейная регрессия

Рассчитаем доверительные интервалы для параметров регрессии:

Средняя ошибка аппроксимации:

что говорит о хорошем качестве уравнения регрессии, т.е. свидетельствует о хорошем подборе модели к исходным данным.

6,5566 2,3060 0,580611

[ 7,8955; 5,2177]

346,8868 2,3060 5,78867

[333,5381;360,2355]

табл b

табл a

b t m

b

a t m

a

( )12,43321%xy y

An y

Page 30: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 30

Парная линейная регрессияНайдем прогнозное значение результативного фактора при значении признака-фактора, составляющем 110% от среднего уровня, т.е.

Ошибка прогноза находится по формуле:

1,1 1,1 8,6 9,46346,8868 6,5566 9,46 284,8613

p

p

x xy

2 2

2

1 0,861 85,7606 1 0,1

10 25,44

9,7255

284,8613 2,3060 9,7255

[262,4342;307,2884]

p

p

p

p

y остx

y

p y

p

x xm S

n n

m

y t m

y

Page 31: лекция 8 эмм в менеджменте регресс анализ_часть ii

Автор: доцент, к.ф.-м.н. В.А.Ларионова 31

Спасибо за внимание