31
кандидат технических наук, доцент Грекул Владимир Иванович Учебный курс Теория информационных систем Лекция 5

Теория информационных систем

Embed Size (px)

Citation preview

Page 1: Теория информационных систем

кандидат технических наук, доцент

Грекул Владимир Иванович

Учебный курс

Теория информационных

системЛекция 5

Page 2: Теория информационных систем

??Объем продаж за предыдущие 3 месяца

Март 2 345 тыс.р

Апрель 1 867 тыс. р

Май 2 480 тыс. р

Какой объем продаж следует ожидать в июне ?

0

500

1000

1500

2000

2500

3000

март апрель май июнь

???

Page 3: Теория информационных систем

Прогнозирование

ПроцессВнешние факторы

Внутренние факторы

Воздействие множества внешних и внутренних факторов приводит к изменениям характеристик процесса, которые можно рассматривать как случайные.

Задача прогнозирования – по имеющимся данным оценить состояние процесса в будущем.

Page 4: Теория информационных систем

Прогнозируемые показатели

Объем продаж;

Параметры управления запасами;

Объем выпуска продукции;

Объем закупок;

Изменение числа клиентов;

И т.д.

Page 5: Теория информационных систем

Временной ряд -последовательность упорядоченных во

времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления

164

143

182

121

ЗначениеВременной интервал

Значение

Время 1 2 3 4

20

15

10

Представление временных рядов

Таблицы Графики

Page 6: Теория информационных систем

Виды временных рядов• Стационарные• Нестационарные

Содержащие трендСодержащие сезонную составляющуюСодержащие циклическую составляющую

Нестационарный временной ряд

Стационарный временной ряд

Page 7: Теория информационных систем

Временной ряд с трендом

Отражает устойчивые средние изменения показателя

Page 8: Теория информационных систем

Временной ряд с сезонной компонентой

Отражает колебания показателя с определенным периодом

Page 9: Теория информационных систем

Временной ряд с циклической компонентой

Отражает непериодические колебания показателя с большой амплитудой

Page 10: Теория информационных систем

Прогнозирование для стационарных процессов

На практике для стационарности ряда достаточно выполнения трех условий:

E[yt] не зависит от t,D[yt] постоянная,Cov[yt,ys] - функция t-s.

0

0,05

0,1

0,15

0,2

0,25

0 5 10 15 20 25

E[yt]

E[yt] )(3 tyD

E[yt] )(2 tyD

Прогноз оправдается с вероятностью 0

При N>30 прогноз оправдается с вероятностью 0,75. (Для и нормального распределения - с вероятностью 0,95)

Прогноз оправдается с вероятностью 0,89 (0,997)

E[yt]

Page 11: Теория информационных систем

Прогнозирование тенденции изменения показателей

y = 0,5842x + 13,387

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11

Х

Y

=y(x)-Y

Тенденцию (тренд) определяет линия, проходящая максимально близко к точкам временного ряда

Page 12: Теория информационных систем

Типовые функции трендов • Линейная

• Степенная

• Показательная

• Экспоненциальная

• Гиперболическая

• Логарифмическая

bxaxy *)(

bxaxy *)(

xbaxy *)(

bxeaxy *)(

xbaxy /)(

)lg(*)( xbaxy

Page 13: Теория информационных систем

Различные виды тренда

Какую линию следует использовать?

Page 14: Теория информационных систем

Критерии оценки прогнозаАбсолютные величины

Средняя ошибка n

n

1i

i

МЕ

Среднее абсолютное отклонение n

n

1i

i

MAD

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

Значение

Время 1 2 3

20

15

10

+ -

=0

Page 15: Теория информационных систем

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

-2

-1

0

1

2

3

4

5

6

-5 -4 -3 -2 -1 0 1 2 3 4 5

-15

-10

-5

0

5

10

15

20

25

30

-5 -4 -3 -2 -1 0 1 2 3 4 5

При использовании среднеквадратичного отклонения функция является гладкой и допускает аналитическое исследование

При использовании абсолютного значения отклонения первая производная имеет область неопределенности , а вторая равна бесконечности

Page 16: Теория информационных систем

Критерии оценки прогнозаАбсолютные величины

Средняя ошибка n

n

1i

i

МЕ

Среднее абсолютное отклонение n

n

1i

i

MAD

Среднеквадратичная ошибкаn

n

1i

i2

MSE

Стандартное отклонение ошибок1-n

n

1i

i2

SDE

Максимальное абсолютное отклонение |)max(|MAXD

Page 17: Теория информационных систем

Критерии оценки прогноза Относительные величины

Процентная ошибка

Среднее процентной ошибки

Абсолютное среднее процентной ошибки

100)(

t

tt

Y

tyYPE

n

PEMPE

n

i

i 1

n

PEMAPE

n

i

i 1

Максимальная процентная ошибка

)max( iPEMAXPE

Page 18: Теория информационных систем

Резкие колебания показателей

Построение прогноза с использованием линии тренда эффективно только при наличии устойчивого и плавного изменения показателя.

Если временной ряд содержит скачкообразные изменения показателя, среднее и тренд не обеспечивают получение достоверного прогноза.

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10

Недели

Кл

ие

нты

Page 19: Теория информационных систем

Метод скользящего среднего

Используется для построения краткосрочных прогнозов

Позволяет:

• Учитывать наиболее актуальную (недавнюю) информацию

• Оценить погрешность прогноза в процессе его формирования

t

Nti

YiN

ty1

1)1(

Page 20: Теория информационных систем

Скользящее среднее

3

11333

1)4(

i

Yiy

Page 21: Теория информационных систем

Скользящее среднее

Page 22: Теория информационных систем

Скользящее среднее

Page 23: Теория информационных систем

Скользящее среднее

Page 24: Теория информационных систем

Выявление смены тенденции

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

1 2 3 4 5 6 7 8 9 10 11 12 13

Временной ряд Короткое среднее Длинное среднее

Область роста Короткое среднее располагается выше длинного

Область спада Короткое среднее располагается ниже длинного

Индикатор смены тенденции

Page 25: Теория информационных систем

Прогноз для временного ряда с сезонной составляющей

Последовательность построения прогноза:

Определить период сезонной волны

Вычислить индексы сезонности Iсез для всех составляющих моментов времени

Построить временной ряд, скорректированный с учетом

сезонности Yбс = Yфакт : Iсез

Построить тренд Yтр

Построить прогноз Yпр = Yтр * Iсез

К сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность: устойчиво повторяющиеся колебания уровней (сезонную волну).

Page 26: Теория информационных систем

Корреляционный анализИспользуется для выявления связи между

величинами х и у. Связь существует, если |rxy|~1.

Коэффициент корреляции:

N

ii

N

ii

N

iii

xy

YyXx

YyXxr

1

2

1

2

1

)()(

))((

Где: Х, Y – средние значения переменных.

Знак коэффициента корреляции отражает вид связи:

положительная или отрицательная (возрастает или убывает у при

росте х).Коэффициент детерминации rxy

2

отражает долю изменений у, обусловленную изменениями х.

Page 27: Теория информационных систем

Технология дисперсионного анализаИсходные данные объединяются в две группы, соответствующие различным значениям исследуемого фактора (до и после изменения политики, в ночную и в дневную смены…)

Вычисляются межгрупповая S1 и внутригрупповая S2 дисперсии

Оценивается дисперсионное отношение

Если F>Fтабл, то исследуемый фактор оказывает

существенное влияние на значение показателя y

12

2*)(2

1

2

1

jj YY

S2

)(2

1

2

12

N

Yy

S jjij

Nj

i

2

1

S

SF

Page 28: Теория информационных систем

Определения дисперсионного анализаМежгрупповая дисперсия S1 – отражает колебания

групповых средних Yj относительно общей средней YВнутригрупповая дисперсия S2 - отражает колебания

значения показателя y относительно групповых средних Yj

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5 6 7 8 9 10 11 12 13

Y1

под воздействием исследуемого фактора

Изменения групповых среднихИзменения показателя y

при воздействии всех факторов

при исключении исследуемого фактора

0

2

4

6

8

10

12

14

16

18

20

1 2 3 4 5 6 7 8 9 10

Y2

8

8,5

9

9,5

10

10,5

11

11,5

12

12,5

13

1 2

Y

Page 29: Теория информационных систем

При отсутствии существенного влияния исследуемого фактора

Изменения показателя y

при воздействии всех факторов

при исключении исследуемого фактора происходят фактически

только под воздействием остальных факторов

Изменения групповых средних

фактически не зависят от воздействия исследуемого фактора

Межгрупповая и внутригрупповая дисперсии приблизительно одинаковы поскольку все случайные величины изменяются под воздействием одних и тех же факторов, следовательно, принадлежат одной генеральной совокупности.

Page 30: Теория информационных систем

Множественная регрессия

Используется для выявления связи между величиной у

и множеством факторов хj , j=1,M.

- остаток - погрешность аппроксимации.

MM xxxy ...2211

Коэффициенты регрессии - отражают линейную корреляционную зависимость между результирующей величиной и каким-либо из факторовпри средних значениях других факторов.

Page 31: Теория информационных систем

Литература

К. Карлберг, Бизнес-анализ с помощью Excel.

Г.П. Фомин, Математические методы и модели М Финансы и статистика, 2001г

М.Г. Зайцев, Количественные методы в менеджменте М., АНХ,2001