39
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ (УНИВЕРСИТЕТ) МИД РОССИИ Кафедра эконометрики и математических методов анализа экономики Курсовая работа на тему: «Зависимость объема продаж мясной продукции российской компании «Дымов» от экономических показателей» выполнили студенты 6,7 групп III МЭО Башмаков Н.А. Белинский А.Д. Чекмарев К.Е. Шаляшкин В.П. научный руководитель доцент, к. ф-м. н., Артамонов Н. В.

Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

Embed Size (px)

Citation preview

Page 1: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ

(УНИВЕРСИТЕТ) МИД РОССИИ

Кафедра эконометрики и математических методов анализа экономики

Курсовая работа на тему:

«Зависимость объема продаж мясной продукции

российской компании «Дымов» от экономических показателей»

выполнили студенты6,7 групп III МЭО

Башмаков Н.А.Белинский А.Д.

Чекмарев К.Е.Шаляшкин В.П.

научный руководительдоцент, к. ф-м. н., Артамонов Н. В.

Page 2: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

2Москва, 2010 год

Page 3: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

3

Оглавление

Введение........................................................................................3

Анализ данных.................................................................................4

Выбор переменных.....................................................................................................4

Описание собранных данных и их особенности......................................................5

Предварительный анализ данных и предположения насчет значений

коэффициентов...........................................................................................................6

Спецификация модели.....................................................................10

Фиктивные переменные..........................................................................................12

Окончательная модель............................................................................................15

Гетероскедастичность.......................................................................18

Автокорреляция..............................................................................27

Прогнозные значения Y.....................................................................29

Заключение, выводы........................................................................30

Список используемой литературы........................................................31

Page 4: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

4

Введение

Цель данной курсовой работы — построение регрессионной модели

объема продаж мясной продукции российской компании «Дымов», как примера

влияния экономических показателей на продажи конкретного товара.

Для построения модели были собраны данные об объемах продаж

продукции «Дымов». Все данные собирались вручную (от мерчандайзеров), за

время сбора информации было покрыто 12 супермаркетов и 1 гипермаркет, всего

получено 163 наблюдения.

Сразу стоит отметить, что в целях неразглашения коммерческой

информации мы имеем данные, выраженные в килограммах за неизвестный

период времени, но, очевидно, это никак не повлияет на конечную модель и

интерпретацию коэффициентов.

В ходе работы будет проведен первичный анализ данных, выбрана

спецификация модели и проведены тесты для корректировки данной модели для

улучшения ее прогнозных качеств.

Конечным результатом данной работы будет являться скорректированная

модель регрессии, отражающая зависимость между результирующим

показателем (объемом продаж мясной продукции «Дымов») и теми из

исследуемых факторов, которые в действительности значимо влияют на величину

зависимой переменной.

Page 5: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

5

Анализ данных

Выбор переменных

Мы ставим перед собой задачу проанализировать факторы, влияющие на

объем продаж мясной продукции «Дымов» в московских магазинах, выявить

количественные и качественные различия между различными видами

продукции. В состав объясняющих переменных мы включили:

P - Цена одного килограмма продукции. Ожидаемое влияние на

объем продаж прямое, наиболее значительное.

TOV - Количество покупателей, останавливающихся для выбора

мясной продукции за час. Выбран именно этот параметр, а не

количество покупателей в магазине в целом, так как нам кажется, что

он даст более точную оценку. Предполагаем прямую зависимость.

Q - Количество идентичного товара на полке (только продукция

«Дымов»). Ожидается, что если идентичного товара не много, то

создается впечатление, что это последнее, что осталось – брать не

будут; если же идентичного товара очень много, то брать опять же не

будут из-за «стадного чувства» (никто не берет, и я не буду)

ADV - Наличие продавца-консультанта компании «Дымов». По

нашим данным, в некоторых магазинах присутствует продавец-

консультант от компании, его наличие предположительно

существенно увеличит продажи. 1 – есть продавец-консультант, 0 -

нет

COLOUR - Выделение ценником. Товары с вынесенным на витрину

ценником будут продаваться лучше остальных. 1 – есть выделение, 0 -

нет

VERT - Расположение товара на полке по вертикали. Законы

мерчендайзинга утверждают, что лучше всего продается товар,

Page 6: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

6расположенный на уровне глаз. Мы рассматриваем три случая:

уровень глаз, выше, ниже. Для данной фиктивной переменной

возьмем разбиение: 1) VERT1 1 – выше 0 – нет; 2) VERT2 1 – ниже 0 –

нет.

HORIZ - Расположение товара на полке по горизонтали. Товар

расположенный ближе к кассам должен продаваться лучше товара

расположенного вдали от них. Опять же 3 случая: дальше от касс,

центр, ближе. Разбиение: 1) HORIZ1 1 – дальше 0 – нет; 2) HORIZ2 1 –

ближе 0 – нет

W - Необходимость взвешивания товара. То есть, нужно ли просить

продавца взвешивать товар или же он уже взвешен и лежит на полке.

Влияние данного фактора предугадать трудно. 1- надо взвешивать 0-

нет

KLIN - Наличие конкурента компании «Клинский» Проверим, влияет

ли наличие данного конкурента на продажи компании «Дымов» 1 –

есть 0 – нет

VELCOM - Наличие конкурента компании «Велком» Проверим, влияет

ли наличие данного конкурента на продажи компании «Дымов» 1 –

есть 0 - нет

BOROD - Наличие конкурента компании «Бородино» Проверим,

влияет ли наличие данного конкурента на продажи компании

«Дымов» 1 – есть 0 – нет

MARKET – Формат магазина. В ходе сбора информации мы заметили

большое различие в том, продается ли товар в супермаркете или же в

гипермаркете. 1- гипермаркет, 0 -супермаркет

Описание собранных данных и их особенности.

Page 7: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

7В полученных 163 наблюдениях объем продаж колеблется в пределах от 2

до 4785 кг. Несмотря на такой большой разброс значений, основная масса

находится в пределах от 10 до 1000 кг (Рис. №1):

0

1000

2000

3000

4000

5000

20 40 60 80 100 120 140 160

Y

Уже после сбора информации стало ясно, что некоторые наши фиктивные

переменные окажутся незначимыми и не будут включены в конечную модель.

Так, не в одном из обследованных магазинов не было продавца консультанта, так

что выявить зависимость продаж от его присутствия не получится. Также нигде не

было продукции предполагаемого конкурента «Велком». Дальнейшее

рассмотрение этих переменных не имеет смысла.

Предварительный анализ данных и предположения насчет значений коэффициентов.

Естественно ожидать, что наибольшая зависимость объема продаж будет от

цены продукции. При этом мы справедливо полагаем, что зависимость будет

иметь не линейный, а логарифмический вид, что даст возможность говорить о

коэффициенте эластичности спроса по цене. Ожидается, что эластичность будет

иметь значение меньше единицы в пределах от -0,3 до -0,9. Мясная продукция,

Рис. №1

Page 8: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

8даже премиум класса, не должна обладать эластичным спросом из логических

соображений, степень неэластичности и предстоит выявить в работе.

График зависимости объема продаж от цены (Рис. №2):

0

200

400

600

800

0 200 400 600 800 1000

Y

P

Log P vs. Log Y

Из графика видно, что зависимость будет иметь логарифмический вид.

Стоит также обратить внимание на то, что вполне возможна

гетероскедастичность, при небольших значениях цены разброс объема продаж

большой, при высокой цене, он намного меньше. Это объясняется тем, что

мясную продукция среднего ценового сегмента могут покупать как много, так и

мало в зависимости от предпочтений, сезонных изменений и т. д. Тогда как

продукцию высокого ценового сегмента покупают, очевидно, меньше и разброс

значений там естественно меньше.

Теперь рассмотрим график зависимости объема продаж от количества

аналогичного товара (Рис. №3):

Рис. №2

Page 9: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

9

0

200

400

600

800

1000

0 2 4 6 8 10

Q

Y

Y vs. Polynomial (degree=2) of Q

Предполагается параболическая зависимость от данного регрессора. В

соответствии с графиком мы ожидаем, что больше всего будут покупать

продукцию, имеющую 4,5,6 идентичных единиц рядом.

Далее проверим гипотезы о наличии структурных сдвигов:

1) Нас интересует, есть ли разница между объемом продаж в гипермаркете

и супермаркете, проведет тест Чоу, чтобы сделать вывод о наличии структурных

сдвигов1:

Гипотеза об однородности совокупности отклоняется на 5% уровне

значимости, следовательно, есть значимое различение между объемами продаж

в гипермаркете и супермаркетах;

2) Аналогично проведем тест Чоу для определения неоднородности

совокупности по переменной KLIN (наличие конкурента «Клинский»):

Chow Breakpoint Test: 112

F-statistic 3.283049 Probability 0.007614

1 тест проводился для модели LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV

Chow Breakpoint Test: 136F-statistic 2.355830 Probability 0.043021

Log likelihood ratio 12.08942 Probability 0.033583

Рис. №3

Page 10: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

10Log likelihood ratio 16.61213 Probability 0.005297

Гипотеза об однородности совокупности отклоняется на 5% уровне

значимости. Следовательно, фиктивную переменную KLIN также стоит

попробовать включить в модель.

Проведя тесты Чоу для всех фиктивных переменных, заметим, что

структурные сдвиги наблюдались по следующим переменным:

MARKET, KLIN, COLOUR, HORIZ1, HORIZ2, VERT1.

Не наблюдается структурных сдвигов (на уровне значимости 5%) по

следующим переменным:

BOROD, SEL, VELCOM, W, VERT2

Следовательно, уже на этапе подготовки к построению модели, можно

сказать, какие фиктивные переменные стоит рассматривать, а какие точно

окажутся незначимыми.

Page 11: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

11

Спецификация модели

Теперь попытаемся построить модель, наилучшим образом описывающую

зависимость объема продаж от перечисленных выше переменных. Сразу стоит

отметить, что на основании проведенного теста Чоу можем не рассматривать

такие переменные, как: BOROD, SEL, VELCOM, W, VERT2. Также необходимо

учесть, что зависимость объема продаж от реальных переменных следующая: от

цены – логарифмическая, от количества аналогичного товара на витрине –

параболическая, от оборота покупателей за определенный период времени –

линейная (см. Рис.4).

Как уже было отмечено ранее, переменная, характеризующая объем

продаж, принимает как очень маленькие значения - от 2 кг, так и очень большие -

до 4785 кг. Такой неравномерный разброс значений (см. рис. 5) может отразиться

на качестве модели, поэтому при ее построении зададим условие у>10. Казалось

бы, можно одновременно задать условие у<1500 (например), но мы не будем

этого делать, чтобы не исключить объемы продаж в гипермаркете и не сделать

заведомо переменную MARKET незначимой.

Рис.4

Page 12: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

12

0

1000

2000

3000

4000

5000

20 40 60 80 100 120 140 160

Y

Рис. 5

Page 13: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

13

Фиктивные переменные

Теперь будем последовательно включать в модель фиктивные переменные

MARKET, KLIN, COLOUR, HORIZ1, HORIZ2, VERT1.

MARKET

Начнем с переменной MARKET . Построим модель вида:

LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV + C(6)*MARKET

Sample: 1 163 IF Y>10Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 5.925938 0.804087 7.369773 0.0000

LOG(P) -0.614454 0.122674 -5.008825 0.0000Q 0.482014 0.103903 4.639080 0.0000

Q^2 -0.056295 0.011386 -4.944205 0.0000TOV 0.010030 0.001375 7.294380 0.0000

MARKET 0.485088 0.233865 2.074219 0.0397R-squared 0.705947 Mean dependent var 4.643460

Adjusted R-squared 0.696399 S.D. dependent var 1.235455S.E. of regression 0.680735 Akaike info criterion 2.105492Sum squared resid 71.36365 Schwarz criterion 2.220811

Log likelihood -162.4393 F-statistic 73.94287Durbin-Watson stat 1.650831 Prob(F-statistic) 0.000000

LOG(Y) = 5.92593793 - 0.6144540224*LOG(P) + 0.4820140094*Q -

0.05629481676*(Q^2) + 0.01003037802*TOV + 0.4850879776*MARKET

1) Рассматривая F-статистику, можем говорить о значимости полученного

уравнения в целом, т.к. вероятность равенства коэффициентов регрессии 0

очень мала, практически равна 0. Гипотеза о значимости полученного

уравнения регрессии принимается.

2) Рассматривая t-статистику, можем сделать вывод о том, что уже

рассмотренные переменные модели остались значимы на уровне значимости

1%, новая включенная переменная MARKET значима на 5% уровне, что говорит

о ее важности в нашем исследовании. Принимаем гипотезу о том, что

конкретные коэффициенты при регрессионных переменных не равны нулю.

Page 14: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

143) Теперь рассмотрим статистику R-squared: R2 увеличился до 0,7 – хороший

результат.

Также видим, что совместное включение переменных MARKET и TOV

нисколько не ухудшает качества модели, при включении их в модель по

отдельности получаем те же результаты.

Вывод: переменную MARKET необходимо учитывать в модели.

HORIZ2

Теперь включим в модель переменную HORIZ2:

LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV + C(6)*MARKET +

C(7)*HORIZ2

Sample: 1 163 IF Y>10Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 5.877846 0.780452 7.531335 0.0000

LOG(P) -0.552038 0.120591 -4.577765 0.0000Q 0.431000 0.102049 4.223460 0.0000

Q^2 -0.051377 0.011153 -4.606678 0.0000TOV 0.009381 0.001349 6.952113 0.0000

MARKET 0.466168 0.227025 2.053376 0.0417HORIZ2 -0.421818 0.130005 -3.244621 0.0014

R-squared 0.724877 Mean dependent var 4.643460Adjusted R-squared 0.714088 S.D. dependent var 1.235455S.E. of regression 0.660607 Akaike info criterion 2.051448Sum squared resid 66.76940 Schwarz criterion 2.185987

Log likelihood -157.1159 F-statistic 67.18586Durbin-Watson stat 1.699479 Prob(F-statistic) 0.000000

LOG(Y) = 5.877845541 - 0.5520381684*LOG(P) + 0.4310004055*Q -

0.05137739118*(Q^2) + 0.009380868762*TOV + 0.466168233*MARKET -

0.4218183792*HORIZ2

1) Рассматривая F-статистику, можем говорить о значимости полученного

уравнения в целом, т.к. вероятность равенства коэффициентов регрессии 0

очень мала, практически равна 0. Гипотеза о значимости полученного

уравнения регрессии принимается.

2) Рассматривая t-статистику, можем сделать вывод о том, что уже

рассмотренные переменные модели остались значимы на уровне значимости

Page 15: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

151%, переменная MARKET значима на 5% уровне, HORIZ2 – значима даже на 1%

уровне, ее необходимо учитывать в модели.

3) Теперь рассмотрим статистику R-squared: R2 увеличился до 0,725, то есть мы

идем по верному пути построения модели.

Вывод: переменную HORIZ2 необходимо учитывать в модели.

HORIZ1

Теперь включим в модель переменную HORIZ1:

LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV + C(6)*MARKET +

C(7)*HORIZ2 + C(8)*HORIZ1

Sample: 1 163 IF Y>10Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 5.858151 0.784662 7.465825 0.0000

LOG(P) -0.552295 0.120939 -4.566710 0.0000Q 0.432221 0.102400 4.220910 0.0000

Q^2 -0.051523 0.011192 -4.603402 0.0000TOV 0.009382 0.001353 6.933051 0.0000

MARKET 0.470694 0.228035 2.064134 0.0407HORIZ2 -0.402415 0.141409 -2.845748 0.0050HORIZ1 0.044498 0.125568 0.354372 0.7236

R-squared 0.725104 Mean dependent var 4.643460Adjusted R-squared 0.712445 S.D. dependent var 1.235455S.E. of regression 0.662503 Akaike info criterion 2.063122Sum squared resid 66.71428 Schwarz criterion 2.216881

Log likelihood -157.0498 F-statistic 57.27670Durbin-Watson stat 1.645511 Prob(F-statistic) 0.000000

LOG(Y) = 5.858151424 - 0.5522954741*LOG(P) + 0.4322209724*Q -

0.05152286623*(Q^2) + 0.009382022066*TOV + 0.4706942689*MARKET -

0.4024150622*HORIZ2 + 0.04449787278*HORIZ1

Несмотря на по-прежнему хорошую F-статистику и R2, t-статистика

показывает, что новая переменная HORIZ1 не значима даже на 10% уровне

значимости, то есть не оказывает существенного влияния на уровень продаж,

следовательно, ее лучше не использовать в модели. Исследуя различные модели,

Page 16: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

16где вместе с HORIZ1 используются другие переменные (KLIN, COLOUR, VERT1),

приходим к выводу, что эта переменная ухудшает качество модели.

Вывод: переменная HORIZ1 не оказывает существенного влияния на

уровень продаж, ее лучше не использовать в модели.

KLIN, COLOUR, VERT1

Аналогично, последовательное включение оставшихся переменных - KLIN,

COLOUR, VERT1 (и их различных комбинаций) в модель говорит об их

незначимости. Они не оказывают никакого влияния на объем продаж, делаем

вывод о том, что нет необходимости их использовать в модели.

Окончательная модель

Построим теперь графики, отражающие зависимость R2 и R2-adj от числа

включенных в модель переменных. Таблица №1 показывает, на каком шаге какие

переменные последовательно включались в модель:

Номер шага Число переменных R^2 R^2 adj1 3 (y, c, p) 0,25 0,2462 4 (y, c, p q) 0,31 0,33 5 (y, c, p, q, tov) 0,6977 0,68994 6 (y, c, p, q, tov, horiz1) 0,717 0,75 7 (y, c, p, q, tov, horiz1, market) 0,724 0,7146 8 (y, c, p, q, tov, horiz1, market, vert1) 0,726 0,7137 9 (y, c, p, q, tov, horiz1, market, vert1,horiz1) 0,7266 0,71248 10 (y, c, p, q, tov, horiz1, market, vert1, horiz1, klin) 0,7268 0,7129 11 (y, c, p, q, tov, horiz1, market, vert1, horiz1, klin, colour) 0,731 0,71

График R2 (рис.7) показывает, что добавление каждой новой переменной в

модель увеличивает R2, однако это не означает наличие содержательной

(имеющей экономический смысл) зависимости у от регрессоров.

Page 17: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

17

Чтобы устранить эффект, связанный с ростом R2 при возрастании числа

регрессоров, необходимо рассмотреть значения R2-adj . На графике

скорректированного R2 (рис. 8) видно, что с добавлением шестой переменной он

начинает уменьшаться (см. также таблицу №1), это означает, что все

последующие переменные (VERT1, HORIZ1, KLIN, COLOUR) не стоит включать в

модель, они только ухудшают качество модели, это в очередной раз доказывает

правильность сделанных выводов.

Таким образом, получаем наилучшую модель, описывающую зависимость

объема продаж от исследованных факторов, следующего вида:

1

2

34 5 6 7 8 9

12

34 5 6 7 8 9

Рис. 7

Рис. 8

Page 18: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

18LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV + C(6)*MARKET +

C(7)*HORIZ2

LOG(Y) = 5.878 - 0.552*LOG(P) + 0.431*Q - 0.051*(Q^2) + 0.009*TOV + 0.466*MARKET

- 0.422*HORIZ2

Page 19: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

19

Гетероскедастичность

Итак, мы получили следующую наилучшую, с нашей точки зрения, модель:

Соответствующие коэффициенты:

Исследуем эту модель на гетероскедастичность. Для этого, примем гипотезу Н0 о

наличии гомоскедастичности, следовательно, альтернативная гипотеза Н1 – о

присутствии в модели гетероскедастичности. Для осуществления этой задачи

проведем определенное количество тестов на гетероскедастичность, и,

определив характер гетероскедастичности, если это будет возможно, попытаемся

скорректировать модель.

Проведем тест Уайта (White) с перекрестными эффектами:

White Heteroskedasticity Test:F-statistic 3.197894 Probability 0.000013Obs*R-squared 56.15921 Probability 0.000134Test Equation:Dependent Variable: RESID^2Method: Least SquaresSample: 1 163 IF Y>10 Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 48.63742 13.53071 3.594595 0.0005

LOG(P) -16.65402 4.314910 -3.859644 0.0002(LOG(P))^2 1.434978 0.360640 3.978978 0.0001(LOG(P))*Q 0.226063 0.354981 0.636830 0.5253

(LOG(P))*(Q^2) -0.020845 0.037883 -0.550243 0.5831(LOG(P))*TOV -0.003892 0.005249 -0.741440 0.4597

(LOG(P))*HORIZ2 -0.215986 0.480837 -0.449188 0.6540(LOG(P))*MARKET 0.365922 0.853676 0.428643 0.6689

Q -2.029026 2.493145 -0.813842 0.4172Q^2 0.556440 0.494476 1.125314 0.2624

Q*(Q^2) -0.077341 0.067109 -1.152477 0.2511Q*TOV -0.008767 0.003950 -2.219440 0.0281

Q*HORIZ2 0.227791 0.345273 0.659743 0.5105

LOG(Y) = C(1) + C(2)*LOG(P) + C(3)*Q + C(4)*(Q^2) + C(5)*TOV + C(6)*HORIZ2

+ C(7)*MARKET

LOG(Y) = 5.8778 - 0.5520*LOG(P) + 0.4310*Q - 0.0513*(Q^2) + 0.0093*TOV -

0.4218*HORIZ2 + 0.4661*MARKET

Page 20: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

20Q*MARKET 1.174360 0.686050 1.711771 0.0892

(Q^2)^2 0.004013 0.003635 1.104057 0.2715(Q^2)*TOV 0.001245 0.000468 2.659003 0.0088

(Q^2)*HORIZ2 -0.039610 0.040750 -0.972036 0.3328(Q^2)*MARKET -0.221217 0.077857 -2.841326 0.0052

TOV 0.027707 0.035615 0.777959 0.4379TOV^2 3.03E-05 5.86E-05 0.516795 0.6061

TOV*HORIZ2 0.001887 0.004713 0.400345 0.6895TOV*MARKET -0.001038 0.008598 -0.120685 0.9041

HORIZ2 1.089796 3.007382 0.362374 0.7176MARKET -2.776178 4.666409 -0.594928 0.5529

R-squared 0.350995 Mean dependent var 0.417309Adjusted R-squared 0.241237 S.D. dependent var 0.998884S.E. of regression 0.870098 Akaike info criterion 2.697060Sum squared resid 102.9616 Schwarz criterion 3.158336Log likelihood -191.7648 F-statistic 3.197894Durbin-Watson stat 1.776034 Prob(F-statistic) 0.000013

Как показывает F-статистика, на уровне значимости =5% мы отвергаем гипотезу

о равенстве всех коэффициентов полученной нами модели нулю, т.е. уравнение в

целом значимо (тот же результат показывает величина nR2, имеющая

распределение по хи-квадрат). Таким образом, гетероскедастичность в

рассматриваемой модели присутствует. Тем самым, мы отвергаем гипотезу Н0 о

наличии гомоскедастичности в пользу альтернативной.

Аналогичный результат показывает этот же тест, но уже без перекрестного

эффекта. На уровне уже =5% мы отвергаем гипотезу о равенстве всех

коэффициентов полученной нами модели нулю, т.е. уравнение в целом значимо -

гетероскедастичность есть.

White Heteroskedasticity Test:F-statistic 3.888712 Probability 0.000186Obs*R-squared 30.26916 Probability 0.000395

Как известно, содержательный смысл теста Уайта заключается в том, что, если в

модели присутствует гетероскедастичность, то это связано, прежде всего, с тем,

что дисперсии ошибок как-то зависят от переменных модели. Но какова

функциональная форма этой зависимости, ее характер, определить с помощью

этого теста, к сожалению, невозможно.

Page 21: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

21Сам факт наличия гетероскедастичности, в принципе, приемлем. Цена, как

известно, играет решающую роль в приобретении того или иного товара. Причем

если она достаточно высока, то, как правило, спрос на такие товары небольшой

(отклонения от некоего среднего значения цены – дисперсии – невысоки), если

же цена товара низкая, то объемы продаж могут быть как высокими, так и

низкими, т.е. дисперсии ошибок будут значительными.

Рассмотрим более тщательно характер гетероскедастичности. Предположим, что

дисперсии ошибок пропорциональны одному из регрессоров модели, и

подберем подходящую функциональную форму зависимости:

Нам необходимо оценить модель вида: , где X – подозреваемая

переменная. (тест Глейзера)

Пусть X=P и с=1, тогда:

Dependent Variable: OSTATKIMethod: Least SquaresSample: 1 163 IF Y>10 Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 0.595649 0.083161 7.162584 0.0000P -0.000442 0.000244 -1.810645 0.0721

R-squared 0.020328 Mean dependent var 0.459688Adjusted R-squared 0.014127 S.D. dependent var 0.455293S.E. of regression 0.452065 Akaike info criterion 1.262442Sum squared resid 32.28938 Schwarz criterion 1.300881Log likelihood -98.99532 F-statistic 3.278436Durbin-Watson stat 1.830367 Prob(F-statistic) 0.072096

Коэффициент b незначим на уровне =5%. Следовательно, линейное уравнение

неверно.

Попробуем теперь взять с=0.2, тогда:

Dependent Variable: OSTATKIMethod: Least SquaresSample: 1 163 IF Y>10 Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 1.309473 0.369755 3.541458 0.0005

P^0.2 -0.275166 0.119176 -2.308912 0.0222

Page 22: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

22R-squared 0.032640 Mean dependent var 0.459688Adjusted R-squared 0.026517 S.D. dependent var 0.455293S.E. of regression 0.449216 Akaike info criterion 1.249795Sum squared resid 31.88359 Schwarz criterion 1.288234Log likelihood -97.98356 F-statistic 5.331073Durbin-Watson stat 1.851499 Prob(F-statistic) 0.022244

Перед нами совсем другая картина. Коэффициент b оказался значимым уже на

уровне =5%. Уравнение в целом также значимо на том же уровне. Таким

образом, нам удалось найти функциональную форму зависимости между

дисперсиями ошибок и подозреваемой переменной P. Это, в принципе, нами и

предполагалось в начале анализа.

Подтвердим наши предположения о наличии гетероскедастичности. Для этого

нам будет необходимо провести еще один тест, а именно: тест ранговой

корреляции Спирмэна.

Для его осуществления мы построим ряды значений остатков и значений

подозреваемой переменной Р и проранжируем их. Находим значение

коэффициента ранговой корреляции

. Тогда , следовательно, гипотеза Н0 о

наличии гомоскедастичности отклоняется в пользу альтернативной Н1 – о

присутствии в модели гетероскедастичности (на уровне =5%). Еще раз мы

убеждаемся, что наши предположения верны.

Наконец, наиболее точные оценки прямой зависимости дисперсии ошибок от

величины регрессора Р дает тест Голдфелда-Куандта.

Необходимо отбросить d – средних значений наблюдений (в нашем примере

)

Первая регрессионная модель будет построена для первых 60 наблюдений:

Dependent Variable: LOG(Y)Method: Least SquaresSample: 1 60 IF Y>10

Page 23: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

23Included observations: 60

Variable Coefficient Std. Error t-Statistic Prob. C 1.237422 2.521798 0.490690 0.6257

LOG(P) 0.462992 0.461729 1.002735 0.3205Q 0.019619 0.219736 0.089285 0.9292

Q^2 0.001348 0.023647 0.057010 0.9548TOV 0.010933 0.002742 3.987131 0.0002

HORIZ2 -0.875395 0.336269 -2.603256 0.0120MARKET 0.106663 0.398149 0.267897 0.7898

R-squared 0.642292 Mean dependent var 5.205644Adjusted R-squared 0.601797 S.D. dependent var 1.200052S.E. of regression 0.757273 Akaike info criterion 2.391095Sum squared resid 30.39352 Schwarz criterion 2.635435Log likelihood -64.73286 F-statistic 15.86093Durbin-Watson stat 1.581287 Prob(F-statistic) 0.000000

Откуда, .

Аналогично, для второй выборки (наблюдения с 101 по 160):

Dependent Variable: LOG(Y)Method: Least SquaresSample: 101 160 IF Y>10 Included observations: 60

Variable Coefficient Std. Error t-Statistic Prob. C 7.163971 2.439651 2.936473 0.0050

LOG(P) -0.781869 0.390198 -2.003777 0.0505Q 0.625787 0.119552 5.234431 0.0000

Q^2 -0.073415 0.012687 -5.786599 0.0000TOV 0.005277 0.001775 2.973062 0.0045

HORIZ2 -0.035963 0.146858 -0.244885 0.8075MARKET 1.172594 0.364887 3.213582 0.0023

R-squared 0.737066 Mean dependent var 3.889335Adjusted R-squared 0.705514 S.D. dependent var 0.935869S.E. of regression 0.507864 Akaike info criterion 1.597380Sum squared resid 12.89629 Schwarz criterion 1.848281Log likelihood -38.52532 F-statistic 23.36027Durbin-Watson stat 1.868480 Prob(F-statistic) 0.000000

Откуда, .

Тогда, , следовательно, мы отвергаем

гипотезу о гомоскедастичности на уровне значимости =5% - наличие

гетероскедастичности подтверждается.

Общий вывод:

Итак, на основе всех проведенных нами тестов, мы можем с уверенностью

говорить о том, что гетероскедастичность в полученной модели имеет место.

Причем ее характер нам удалось обнаружить (стандартное отклонение ошибки

Page 24: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

24пропорционально независимой переменной) путем перебора всевозможных

линейных форм зависимости. Как неоднократно утверждалось, цена и являлась

причиной появления гетероскедастичности. Более наглядное подтверждение

дает следующий график (Рис. 9):

-3

-2

-1

0

1

2

3

20 40 60 80 100 120 140 160

LOG(Y) Residuals

Действительно, на отрезке от 0 до 25 мы наблюдаем резкие изменения значений

остатков (мясную продукция среднего ценового сегмента могут покупать как

много, так и мало в зависимости от предпочтений, сезонных изменений и т. д.,

тогда как продукцию высокого ценового сегмента покупают, очевидно, меньше и

разброс значений там естественно меньше).

Примечание. Нами также были проведены все вышеперечисленные тесты на

переменные Q и TOV. Гетероскедастичности выявить не удалось (какой-либо

функциональной зависимости между дисперсиями остатков и переменными

обнаружить мы не смогли).

Попробуем теперь составить новую модель, избавившись при этом от

гетероскедастичности. Предположив, что дисперсии остатков приблизительно

пропорциональны переменной Р^0.2, единственная возможность избавиться от

гетероскедастичности в модели – это разделить все наблюдения на значение

Р^0.2:

Рис. 9

Page 25: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

25Модель с гетероскедастичностью:

LOG(Y) = 5.877845541 - 0.5520381684*LOG(P) + 0.4310004055*Q -

0.05137739118*(Q^2) + 0.009380868762*TOV - 0.4218183792*HORIZ2 +

0.466168233*MARKET

Dependent Variable: LOG(Y)Method: Least SquaresSample: 1 163 IF Y>10Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C 5.877846 0.780452 7.531335 0.0000

LOG(P) -0.552038 0.120591 -4.577765 0.0000Q 0.431000 0.102049 4.223460 0.0000

Q^2 -0.051377 0.011153 -4.606678 0.0000TOV 0.009381 0.001349 6.952113 0.0000

HORIZ2 -0.421818 0.130005 -3.244621 0.0014MARKET 0.466168 0.227025 2.053376 0.0417

R-squared 0.724877 Mean dependent var 4.643460Adjusted R-squared 0.714088 S.D. dependent var 1.235455S.E. of regression 0.660607 Akaike info criterion 2.051448Sum squared resid 66.76940 Schwarz criterion 2.185987Log likelihood -157.1159 F-statistic 67.18586Durbin-Watson stat 1.645995 Prob(F-statistic) 0.000000

Как показывают F- и t- статистики, все коэффициенты оказываются значимыми на

уровне =5%. R2 – статистика относительно высока (R2=72%).

Попробуем дать более содержательную интерпретацию полученным

результатам:

Эластичность спроса по цене равна приблизительно -0,55 (т.е. увеличение

цены на 1% уменьшает соответственно объем продаж мясной продукции на

0,55%). Как и предполагалось, это значение оказалось относительно не

высоким, тем самым, мы подтвердили наши логические соображения о

том, что спрос на товары премиум класса не должны обладать эластичным

спросом;

Зависимость между объемами продаж и количеством аналогичного товара

- параболическая (причем ветви направлены вниз – о чем говорит

отрицательный коэффициент при q^2). Рассчитаем среднее значение этого

Page 26: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

26

показателя: - т.е. среднее число идентичных товаров

равно 4 (наши ожидания оказались верными);

Каждый дополнительный покупатель в магазине увеличивает объем

продаж мясной продукции на 0,9% (величина небольшая, потому как

количество покупателей в магазинах достаточно велико);

Расположение товара относительно касс тоже имеет большое значение:

если продукция расположена достаточно далеко от касс, то объем продаж

снижается на 42% (покупатели стремятся больше приобрести того товара,

который находиться поближе к кассам);

Наконец, тип магазина оказывает большое значение на объемы продаж:

если товар реализуется в супермаркете, то его объемы продаж реально

увеличиваются на 47%

Модель без гетероскедастичности:

LOG(Y)/(P^0.2) = -15.23519294 + 8.884876838*(LOG(P)/(P^0.2)) +

0.396742191*(Q/(P^0.2)) - 0.04629510326*(Q^2/(P^0.2)) +

0.00935521619*(TOV/(P^0.2)) - 0.5074384427*(HORIZ2/(P^0.2)) +

0.4986061935*(MARKET/(P^0.2))

Dependent Variable: LOG(Y)/(P^0.2)Method: Least SquaresSample: 1 163 IF Y>10Included observations: 160

Variable Coefficient Std. Error t-Statistic Prob. C -15.23519 1.966420 -7.747681 0.0000

LOG(P)/(P^0.2) 8.884877 1.104321 8.045557 0.0000Q/(P^0.2) 0.396742 0.102720 3.862364 0.0002

Q^2/(P^0.2) -0.046295 0.011267 -4.108918 0.0001TOV/(P^0.2) 0.009355 0.001383 6.764752 0.0000

HORIZ2/(P^0.2) -0.507438 0.137140 -3.700150 0.0003MARKET/(P^0.2) 0.498606 0.226840 2.198051 0.0294

R-squared 0.810564 Mean dependent var 1.536873Adjusted R-squared 0.803135 S.D. dependent var 0.495432S.E. of regression 0.219821 Akaike info criterion -0.149245

Page 27: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

27Sum squared resid 7.393134 Schwarz criterion -0.014706Log likelihood 18.93960 F-statistic 109.1098Durbin-Watson stat 1.689559 Prob(F-statistic) 0.000000

Таким образом, лучшей моделью была признана нами именно логарифмическая

модель2. Решающими для этого стали такие факторы, как:

значимость всех регрессоров в модели;

наилучшие характеристики данной модели, в т.ч. и , t- и F-статистики;

хорошая интерпретация модели;

соответствие качественных и количественных значений модели

ожидаемым.

2 Отметим тот факт, что, избавившись от гетероскедастичности, мы не сможем в полной мере правильно проинтерпретировать новую модель, тем самым, интерпретацию будем проводить по исходной модели (с гетероскедастичностью), а проводить анализ и прогноз по модели без гетероскедастичности.

Page 28: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

28

АвтокорреляцияИсследуем эту модель на автокорреляцию. Для осуществления этой задачи

проведем два теста на автокорреляцию, и если это будет необходимо,

попытаемся скорректировать модель.

1. На первом этапе проведем тест Дарбина-Уотсона:

Sample: 1 163 IF Y>10Included observations: 160Variable Coefficient Std. Error t-Statistic Prob. C 5.877846 0.780452 7.531335 0.0000LOG(P) -0.552038 0.120591 -4.577765 0.0000Q 0.431000 0.102049 4.223460 0.0000Q^2 -0.051377 0.011153 -4.606678 0.0000TOV 0.009381 0.001349 6.952113 0.0000MARKET 0.466168 0.227025 2.053376 0.0417HORIZ2 -0.421818 0.130005 -3.244621 0.0014R-squared 0.724877 Mean dependent var 4.643460Adjusted R-squared 0.714088 S.D. dependent var 1.235455S.E. of regression 0.660607 Akaike info criterion 2.051448Sum squared resid 66.76940 Schwarz criterion 2.185987Log likelihood -157.1159 F-statistic 67.18586Durbin-Watson stat 1.699479 Prob(F-statistic) 0.000000

Критические значения статистики DW равны (1,68; 1,81) для k=6 и n=160.

dL=1,68 < DW=1,70 < dU=1,81, следовательно, ничего сказать о

положительной автокорреляции нельзя («темная зона»). Также, DW=1,70 < 4-

dU=2,19, отрицательной автокорреляции нет.

2.Для уверенности проведем также LM-тест Бройша-Годфри:

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 2.726756     Prob. F(1,152) 0.1007Obs*R-squared 2.819687     Prob. Chi-Square(1) 0.0931

Test Equation:Dependent Variable: RESIDMethod: Least SquaresSample: 1 163 IF Y>10Included observations: 160Presample and interior missing value lagged residuals set to zero.

Variable Coefficient Std. Error t-Statistic Prob.  C 0.055590 0.776815 0.071561 0.9430LOG(P) -0.004545 0.119948 -0.037888 0.9698Q -0.012742 0.101771 -0.125207 0.9005Q^2 0.001651 0.011135 0.148279 0.8823TOV -0.000102 0.001343 -0.075736 0.9397

Page 29: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

29MARKET 0.011912 0.225870 0.052740 0.9580HORIZ2 -0.008839 0.129389 -0.068313 0.9456RESID(-1) 0.134171 0.081252 1.651289 0.1007R-squared 0.017623     Mean dependent var 1.45E-15Adjusted R-squared -0.027618     S.D. dependent var 0.648023S.E. of regression 0.656910     Akaike info criterion 2.046168Sum squared resid 65.59272     Schwarz criterion 2.199927Log likelihood -155.6934     Hannan-Quinn criter. 2.108604F-statistic 0.389537     Durbin-Watson stat 1.963178Prob(F-statistic) 0.907400

В данном случае выдвигается гипотеза о присутствии автокорреляции, но

поскольку значение probability гораздо выше уровня значимости 0,05, эта

гипотеза отвергается. Следовательно, в данной модели автокорреляции нет.

Page 30: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

30

Прогнозные значения Y

C помощью Eviews были получены прогнозные значения для нашего

основного показателя - переменной LOG (Y) (логарифма объема продаж

продукции):

0

1

2

3

4

5

6

7

8

9

25 50 75 100 125 150

YF ± 2 S.E.

Forecast: YFActual: LOG(Y)Forecast sample: 1 163 IF Y>10Included observations: 160

Root Mean Squared Error 0.645994Mean Absolute Error 0.459688Mean Abs. Percent Error 10.60353Theil Inequality Coefficient 0.067542 Bias Proportion 0.000000 Variance Proportion 0.080265 Covariance Proportion 0.919735

Page 31: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

31

Заключение, выводы

В первую очередь стоит отметить определение эластичности спроса на

исследуемые продукты, которая может быть использована при ценообразовании,

в частности можно сказать, что с позиции классической науки увеличение цены на

данный вид продукции должен увеличить выручку т.к. эластичность меньше

единицы.

Далее перейдем к таким переменным как TOV (количество покупателей) и

MARKET (гипермаркет), здесь кроме слов о том, что большее количество

покупателей в магазине или его тип увеличивает объем продаж можно сказать

приблизительные значения этого увеличения (см. конечную модель и ее

интерпретацию).

Наиболее интересная часть исследования – проверка значимости не

очевидных фактов, таких как расположение товара на полке и количество его

аналогов. Мы пришли к выводу, что 4 аналогичных товара – оптимальный

вариант для удачной продажи. Другой интересный вывод делается по

расположению товара на полке. Мы считаем, что имеет смысл заплатить за то,

чтобы товар лежал в центре или ближе к кассам, главное, что не дальше. Не

следует переплачивать за место ближе к кассам, если можно сэкономить и

разместить товары в центре.

В целом, модель может вполне быть использована отделом маркетинга

компании для принятия самых разных решений и прогнозирования объемов

продаж.

Page 32: Зависимость объема продаж мясной продукции российской компании Дымов от экономических показателей

32

Список используемой литературы.

1. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997.

2. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. –

М.: Дело, 2004.

3. Wooldridge J. Econometric Analysis of Cross Section and Panel Data (2002)