Upload
candace-roberson
View
73
Download
0
Embed Size (px)
DESCRIPTION
Информационно осигуряване на иконометричния анализ. Типове данни. 3 типа данни Времеви редове Крос-секшън данни Панелни данни Въвеждане Чрез импорт от ексел В самата система Или текстови формат (аски код) (ASCII). Времеви редове. - PowerPoint PPT Presentation
Citation preview
Информационно осигуряване на иконометричния анализ
Типове данни
• 3 типа данни– Времеви редове– Крос-секшън данни– Панелни данни
• Въвеждане – Чрез импорт от ексел– В самата система– Или текстови формат (аски код) (ASCII)
Времеви редове
• Определение – : Стойностите, които даден показател приема в различни моменти на даден период от време, като тези моменти могат да бъдат през равни, или различни времеви интервали се нарича времеви ред
• Пример:– През равни интервали от време
– През различни интервали от време
година инфлация
1990 123.8
1991 438.5
1992 179.4
.....
2006 106.5
2007 112.5
12.06.2004 125
18.10.2004 142
24.01.2008 102
Времеви редове …
• Характеристики:– Брой елементи – въз основа на него и броя на факторите за анализ се
определят степените на свобода [пример: от първата таблица = 18]
– Средно на реда– Вероятностно разпределение– Вариация– Стандартно отклонение
Степени на свобода се определят като разлика от броя на елементите и брояна факторите използвани в анализа, увеличени с 1; те всъщност показватброя на свободните елементи, които подобряват качеството на оценките
Времеви редове …
• Видове: количествени и качествени показатели
• Качествени показатели: елементите приемат 2 или повече, но ограничен брой стойности
• Примери– Трудово правоотношение (зает, безработен;
трудов договор, служебен договор)– Образование (основно, средно, професионален
бакалавър ...)
Времеви редове …
• Изразяване на качествените променливи– С двоични променливи (наличието на
даденото качество 1, отсъствието му – 0)– Пример: трудов статус (зает/безработен)
1
1
0
1
Времеви редове …
• Изразяване на качествените променливи– При повече от две състояния - с 1 или
повече променливи– Пример: образование (основно (1);
средно (2); професионален бакалавър (3); бакалавър (4); магистър (5))
– С повече от една променлива: основно образование(0/1); средно (0/1); професионален бакалавър (0/1); бакалавър (0/1); магистър (0/1))
1
3
2
5
Основно
Средно
Бакалавар
1 0 0
0 0 1
Включване на качествените променливи в модели
• Модели само с качествени променливи (модели на анализ на вариациите или ANOVA модели )
• Задават се по същия начин както и моделите с количествени променливи
iii uXaaY 10
Включване на качествените променливи в модели
• Пример: Да се определи работна заплата на новоназначен служител със средно образование, при налична информация за образованието и работната заплата на останалите служители (със средно образование, бакалавър и магистър и друго образование)
Включване на качествените променливи в модели
• Данни за примера
служител Средно обр.
бакалавар магистър
друго Трудов стаж
заплата
1 0 1 0 0 5 650
2 1 0 0 0 9 590
3 0 0 0 1 12 420
4 1 0 0 0 5 540
5 1 0 0 0 15 620
6 0 0 1 0 3 690
Включване на качествените променливи в модели
• Х1 – средно образование
• Х2 – бакалавър
• Х3 – магистър
• Модел:
Yi = a0 +a1X1i+a2x2i +a3x3i+ u
Включване на качествените променливи в модели
• Графично изображение:
а0
а1а2
а3
Средна заплата на служител без образование или с др.
С колко средната заплана на хората със средно образование се различава оттази на хората с други образование (показано е нагоре, но дали е или зависи)
…. с образование бакалавър ..... средно образование
.... с образование магистър ..... образование бакалавър
Включване на качествените променливи в модели
• Интерпретация на резултатите• а0 – средна заплата на работещите с друго
образование• а1 – с колко заплатата на работещите със средно
образование е по-голяма от заплатата на работещите с друго образование
• а2 - с колко заплатата на работещите с образование бакалавър е по-голяма от заплатата на работещите със средно образование
• И т.н.
* Качествените променливи се включват в моделите по същия начин като количественитемодели, които ползват само качествен показател се наричат модели за анализ на вариациитеили ANOVA
Приложение на ANOVA моделите
• Маркетинговите и социологическите модели (наличие на качествени и субективни показатели)
• По - рядко в икономическите изследвания
Модели с качествени и количествени показатели
• Наричат се модели за анализ на ковариациите или ANCOVA модели
• В горния пример да се отрази и влиянието на трудовия стаж
• Модел:
Yi = a0 +a1X1i+a2x2i +a3x3i +a4x4i + u
Х4 – трудов стаж (в години)
ANCOVA модели
• Графично изображение:
a0
a1
a2
a4
* Отстъпките на всяко едно от тези стъпълца се определя от параметъра накачествените променливи* А наклона – от количествените променливи включени в модела
ANCOVA модели
• Интерпретация на резултатите• а0 – средна заплата на работещите с друго
образование• а1 – с колко заплатата на работещите със
средно образование е по-голяма от заплатата на работещите с друго образование
• И т.н.• А4 – с колко се променя заплатата на всеки с
увеличаване на трудовия стаж
Дъми променливи
• По същество – качествени променливи• Специфични двоични променливи, които
приемат стойност 1 при точно определени условия и стойност 0 във всички останали случаи.
• Бележат се с “D”. • Използват се в следните два основни случая:
– за отчитане на сезонни колебания;– за изключване на определени периоди с
анормални изменения на средата.
(dummy)
- тези периоди по отношение на данните се наричат структурно прекъсване на данните
Сезонни дъми променливи
• Броят им зависи от периодичността на данните, с които се работи – При тримесечни данни – 4 дъми
променливи– При месечни данни – 12 дъми променливи
• При работа с месечни данни – дълъг ред от наблюдения – броя на независимите променливи се увеличава с 12
Сезонни дъми променливи
• Тримесечни дъми променливи
• Използват се – при силни сезонни колебания
• При слаби колебания – изглаждане на данните
• Включват се в модела по стандартния начин
D1 D2 D3 D4
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
Добавен slide от Боби
• “Използват се – при силни сезонни колебания” - тогава е оправдано използването на модела
• “При слаби колебания – изглаждане на данните” – позволяват да се подобри качеството на оценката като по определени методи се обработват първични данни, за да се поизчистят сезонните колебания; най-често използвания метод за изглаждане е мотода на местещите се средни (ММС)
• ММС = средните, които се получават за всеки един от елементите на основа на елементите пред или след него като се използва симетричен интервал; ако използваме период от 3 елемента, то новия ред няма да има 1 елемент, 2-рия елемент ще се получи като разлика или частно на 2-рия елемент на предишния ред и средно аритметичното на тези 3 елемента [по този начин самото средно се мести; 2-((1+2+3)/3)]; от вида на модела, т.е. от начина по който съответната променлива ще бъде включена в модела зависи дали ще е “разлика” или “частно”
Сезонни дъми променливи
• Интерпретация на коефициента пред тях– Изменението на
зависимата променлива от периода – пример: потреблението на свинско месо през декември
Потребено количество q12101
0
0,1
0,2
0,3
0,4
0,5
0,6
мес
ец 4 8 12 4 8 12 4 8 12 4 8 12
Потребеноколичество q12101
За изключване на определени периоди при оценката
• Използват се - когато в периода, който анализираме е настъпило някакво събитие в резултат, на което стойностите на показателя рязко са се променили (стачка, криза, война, ...)съществен момент е за колко време след приключване на случайното събитие се усеща неговото влияние
• За тези периоди – структурно прекъсване на данните
• Имат стойност 1 само за критичния период и 0 за всички останали
За изключване на определени периоди при оценката
• Включват се в модела по стандартния начин
• Интерпретация на коефициента пред тях– обират ефекта на конкретното събитие
Проблеми при работа с времеви редове
• Основен проблем – серийната автокорелация на грешкатаКазваме, че в 1 ред има серийна автокорелация тогава, когато текущата стойност на показателя зависи от една или няколко негови предходни стойности; това означава, че примерно състоянието на БВП тази година зависи в някаква степен от състоянието му през миналата или предходните няколко години; серийната автокорелация произтича от самата логика/инерция на икономическите процеси
• При определени случаи – проблем с постоянната условна вариация на грешкатаВариацията в реда на грешката изчислена на база първи 3/4/5... елемента трябва да бъде една и съща!
Крос-секшън данни
• Данни за един или повече показатели събрани по два или повече критерия в даден момент от времето
• Примери – данните при анкета; преброяване на населението и т.н.
• Използват се– Когато няма регулярно събирани данни за
анализирания проблем – разработват се анкети
Крос-секшън данни
• Използват се – маркетингови и социологически проучвания
• Икономически анализи – на фирмено или национално ниво при отсъствие на информация
• Проблеми: с постоянната условна вариация на грешката– Серийната автокорелация на грешката
Панелни данни
• Комбинация от крос-секшън данни (данни по 2 показателя) и времеви редове (по единият от тях)
• Използват се:– Анализ на пазара (регионални различия
или интегриран)– Анализ на безработицата– Чисто изкуствено – за увеличаване на броя
на наблюденията
Панелни данни
район година Брутна продукция
С-И 1990 5625
1991 5324
....... .....
2007 7625
С-Ц 1990 5876
1991 5749
....... ......
Панелни данни
• Позволяват да се анализират 4 случая1. За всички панели – процесът започва от
общо начално положение и се развива с еднаква скорост (оценените параметри за отделните панели са еднакви)
2. Процесът започва от общо начално положение, но не се развива с еднаква скорост, еднакъв темп и/или посока (еднакъв свободен член и различни коефициенти пред променливите)
Панелни данни
3. Процесът започва от различно начално положение, но се развива с еднаква скорост (различен свободен член и еднакви коефициенти пред променливите)
4. Процесът започва от различно начално положение и не се развива с еднаква скорост (различен свободен член и различни коефициенти пред променливите)
Панелни данни
• Проблеми– Серийна автокорелация на грешката– Постоянна условна вариация на грешката