Теория информационных систем

Preview:

Citation preview

кандидат технических наук, доцент

Грекул Владимир Иванович

Учебный курс

Теория информационных

системЛекция 5

??Объем продаж за предыдущие 3 месяца

Март 2 345 тыс.р

Апрель 1 867 тыс. р

Май 2 480 тыс. р

Какой объем продаж следует ожидать в июне ?

0

500

1000

1500

2000

2500

3000

март апрель май июнь

???

Прогнозирование

ПроцессВнешние факторы

Внутренние факторы

Воздействие множества внешних и внутренних факторов приводит к изменениям характеристик процесса, которые можно рассматривать как случайные.

Задача прогнозирования – по имеющимся данным оценить состояние процесса в будущем.

Прогнозируемые показатели

Объем продаж;

Параметры управления запасами;

Объем выпуска продукции;

Объем закупок;

Изменение числа клиентов;

И т.д.

Временной ряд -последовательность упорядоченных во

времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления

164

143

182

121

ЗначениеВременной интервал

Значение

Время 1 2 3 4

20

15

10

Представление временных рядов

Таблицы Графики

Виды временных рядов• Стационарные• Нестационарные

Содержащие трендСодержащие сезонную составляющуюСодержащие циклическую составляющую

Нестационарный временной ряд

Стационарный временной ряд

Временной ряд с трендом

Отражает устойчивые средние изменения показателя

Временной ряд с сезонной компонентой

Отражает колебания показателя с определенным периодом

Временной ряд с циклической компонентой

Отражает непериодические колебания показателя с большой амплитудой

Прогнозирование для стационарных процессов

На практике для стационарности ряда достаточно выполнения трех условий:

E[yt] не зависит от t,D[yt] постоянная,Cov[yt,ys] - функция t-s.

0

0,05

0,1

0,15

0,2

0,25

0 5 10 15 20 25

E[yt]

E[yt] )(3 tyD

E[yt] )(2 tyD

Прогноз оправдается с вероятностью 0

При N>30 прогноз оправдается с вероятностью 0,75. (Для и нормального распределения - с вероятностью 0,95)

Прогноз оправдается с вероятностью 0,89 (0,997)

E[yt]

Прогнозирование тенденции изменения показателей

y = 0,5842x + 13,387

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11

Х

Y

=y(x)-Y

Тенденцию (тренд) определяет линия, проходящая максимально близко к точкам временного ряда

Типовые функции трендов • Линейная

• Степенная

• Показательная

• Экспоненциальная

• Гиперболическая

• Логарифмическая

bxaxy *)(

bxaxy *)(

xbaxy *)(

bxeaxy *)(

xbaxy /)(

)lg(*)( xbaxy

Различные виды тренда

Какую линию следует использовать?

Критерии оценки прогнозаАбсолютные величины

Средняя ошибка n

n

1i

i

МЕ

Среднее абсолютное отклонение n

n

1i

i

MAD

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

Значение

Время 1 2 3

20

15

10

+ -

=0

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

-2

-1

0

1

2

3

4

5

6

-5 -4 -3 -2 -1 0 1 2 3 4 5

-15

-10

-5

0

5

10

15

20

25

30

-5 -4 -3 -2 -1 0 1 2 3 4 5

При использовании среднеквадратичного отклонения функция является гладкой и допускает аналитическое исследование

При использовании абсолютного значения отклонения первая производная имеет область неопределенности , а вторая равна бесконечности

Критерии оценки прогнозаАбсолютные величины

Средняя ошибка n

n

1i

i

МЕ

Среднее абсолютное отклонение n

n

1i

i

MAD

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

Максимальное абсолютное отклонение |)max(|MAXD

Критерии оценки прогноза Относительные величины

Процентная ошибка

Среднее процентной ошибки

Абсолютное среднее процентной ошибки

100)(

t

tt

Y

tyYPE

n

PEMPE

n

i

i 1

n

PEMAPE

n

i

i 1

Максимальная процентная ошибка

)max( iPEMAXPE

Резкие колебания показателей

Построение прогноза с использованием линии тренда эффективно только при наличии устойчивого и плавного изменения показателя.

Если временной ряд содержит скачкообразные изменения показателя, среднее и тренд не обеспечивают получение достоверного прогноза.

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10

Недели

Кл

ие

нты

Метод скользящего среднего

Используется для построения краткосрочных прогнозов

Позволяет:

• Учитывать наиболее актуальную (недавнюю) информацию

• Оценить погрешность прогноза в процессе его формирования

t

Nti

YiN

ty1

1)1(

Скользящее среднее

3

11333

1)4(

i

Yiy

Скользящее среднее

Скользящее среднее

Скользящее среднее

Выявление смены тенденции

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

1 2 3 4 5 6 7 8 9 10 11 12 13

Временной ряд Короткое среднее Длинное среднее

Область роста Короткое среднее располагается выше длинного

Область спада Короткое среднее располагается ниже длинного

Индикатор смены тенденции

Прогноз для временного ряда с сезонной составляющей

Последовательность построения прогноза:

Определить период сезонной волны

Вычислить индексы сезонности Iсез для всех составляющих моментов времени

Построить временной ряд, скорректированный с учетом

сезонности Yбс = Yфакт : Iсез

Построить тренд Yтр

Построить прогноз Yпр = Yтр * Iсез

К сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность: устойчиво повторяющиеся колебания уровней (сезонную волну).

Корреляционный анализИспользуется для выявления связи между

величинами х и у. Связь существует, если |rxy|~1.

Коэффициент корреляции:

N

ii

N

ii

N

iii

xy

YyXx

YyXxr

1

2

1

2

1

)()(

))((

Где: Х, Y – средние значения переменных.

Знак коэффициента корреляции отражает вид связи:

положительная или отрицательная (возрастает или убывает у при

росте х).Коэффициент детерминации rxy

2

отражает долю изменений у, обусловленную изменениями х.

Технология дисперсионного анализаИсходные данные объединяются в две группы, соответствующие различным значениям исследуемого фактора (до и после изменения политики, в ночную и в дневную смены…)

Вычисляются межгрупповая S1 и внутригрупповая S2 дисперсии

Оценивается дисперсионное отношение

Если F>Fтабл, то исследуемый фактор оказывает

существенное влияние на значение показателя y

12

2*)(2

1

2

1

jj YY

S2

)(2

1

2

12

N

Yy

S jjij

Nj

i

2

1

S

SF

Определения дисперсионного анализаМежгрупповая дисперсия S1 – отражает колебания

групповых средних Yj относительно общей средней YВнутригрупповая дисперсия S2 - отражает колебания

значения показателя y относительно групповых средних Yj

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5 6 7 8 9 10 11 12 13

Y1

под воздействием исследуемого фактора

Изменения групповых среднихИзменения показателя y

при воздействии всех факторов

при исключении исследуемого фактора

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5 6 7 8 9 10

Y2

8

8,5

9

9,5

10

10,5

11

11,5

12

12,5

13

1 2

Y

При отсутствии существенного влияния исследуемого фактора

Изменения показателя y

при воздействии всех факторов

при исключении исследуемого фактора происходят фактически

только под воздействием остальных факторов

Изменения групповых средних

фактически не зависят от воздействия исследуемого фактора

Межгрупповая и внутригрупповая дисперсии приблизительно одинаковы поскольку все случайные величины изменяются под воздействием одних и тех же факторов, следовательно, принадлежат одной генеральной совокупности.

Множественная регрессия

Используется для выявления связи между величиной у

и множеством факторов хj , j=1,M.

- остаток - погрешность аппроксимации.

MM xxxy ...2211

Коэффициенты регрессии - отражают линейную корреляционную зависимость между результирующей величиной и каким-либо из факторовпри средних значениях других факторов.

Литература

К. Карлберг, Бизнес-анализ с помощью Excel.

Г.П. Фомин, Математические методы и модели М Финансы и статистика, 2001г

М.Г. Зайцев, Количественные методы в менеджменте М., АНХ,2001

Recommended