21
EDA pro časové řady

EDA pro časové řady

  • Upload
    veta

  • View
    49

  • Download
    0

Embed Size (px)

DESCRIPTION

EDA pro časové řady. Co je to časová řada?. numerická proměnná, jejíž hodnoty podstatně závisí na čase, v němž byly získány. Časové okamžiky, kdy byla data získána, jsou od sebe většinou stejně vzdáleny (ekvidistantní ČŘ). Např.: počty nezaměstnaných v jednotlivých měsících, - PowerPoint PPT Presentation

Citation preview

Page 1: EDA pro časové řady

EDA pro časové řady

Page 2: EDA pro časové řady

Co je to časová řada?

• numerická proměnná, jejíž hodnoty podstatně závisí na čase, v němž byly získány. Časové okamžiky, kdy byla data získána, jsou od sebe většinou stejně vzdáleny (ekvidistantní ČŘ).

• Např.:– počty nezaměstnaných v jednotlivých měsících, – počty automobilových nehod na Barandovském mostě

v jednotlivých měsících, – denní produkce mléka Veselé krávy.

Page 3: EDA pro časové řady

Jaké typy časových řad rozlišujeme?

• Intervalové - data závisí na délce intervalu, který je sledován. – Měsíční produkce cementu v ČR

Nutné očištění na standardní měsíc!!!!

• Okamžikové - data se vztahují k určitému okamžiku. – Měsíční záznamy o počtech nezaměstnaných

Page 4: EDA pro časové řady

Grafická analýza časových řad

• Spojnicový graf jedné časové řady

1 2 3 4 5 6 7 8 9 10 11 126789

101112131415

Vývoj nezaměstnanosti (Rybitví, 2010)

Měsíc

Míra

nez

aměs

tnan

osti

[%]

Page 5: EDA pro časové řady

• Spojnicový graf dvou a více časových řad

1 2 3 4 5 6 7 8 9 10 11 122

7

12

17

Vývoj nezaměstnanosti (2010)

Rybitví Barchov

MěsícMíra

nez

aměs

tnan

osti

[%]

Grafická analýza časových řad

Page 6: EDA pro časové řady

Grafická analýza časových řad

• Graf ročních hodnot sezónních časových řad

1 2 3 4 5 6 7 8 9 10 11 122500300035004000450050005500

Vývoj počtu nezaměstnaných absolventů gymnázií v SR

1993199419951996

Měsíc

Poče

t [tis

.]

Page 7: EDA pro časové řady

Průměrování časových řad

• Intervalové časové řady – klasický aritmetický průměr

• Okamžikové časové řady – chronologický průměr

122 12

1

n

yy...yy

yn

n

Page 8: EDA pro časové řady

Míry dynamiky časových řad

• Absolutní přírůstky - „o kolik“ se změnila časová řada mezi jednotlivými okamžiky.• Průměrný absolutní přírůstek - „o kolik“ se průměrně změnila časová řada za

období mezi dvěma měřeními během sledovaného období.

• Koeficienty růstu - „kolikrát“ se změnila časová řada mezi jednotlivými okamžiky.• Průměrný koeficient růstu - „kolikrát“ se průměrně změnila časová řada za období

mezi dvěma měřeními během sledovaného období. (geometrický průměr.!!!)• Meziroční koeficienty růstu - podíly hodnot časové řady ve stejných obdobích

(sezónách) v po sobě jdoucích letech.

• Relativní přírůstky [%] - „o kolik procent“ se změnila časová řada mezi jednotlivými okamžiky.

• Průměrný relativní přírůstek [%] - „o kolik %“ se průměrně změnila časová řada za období mezi dvěma měřeními během sledovaného období.

Page 9: EDA pro časové řady

Dekompozice časových řad

Rozklad časové řady na trendovou, sezónní, cyklickou a náhodnou složku.

• Trend - dlouhodobý vývoj

Page 10: EDA pro časové řady

Dekompozice časových řad

Rozklad časové řady na trendovou, sezónní, cyklickou a náhodnou složku.

• Trend - dlouhodobý vývoj• Sezónní složka - odráží periodické změny, jejichž perioda je

svázána s kalendářem

Page 11: EDA pro časové řady

Dekompozice časových řad

Rozklad časové řady na trendovou, sezónní, cyklickou a náhodnou složku.

• Trend - dlouhodobý vývoj• Sezónní složka - odráží periodické změny, jejichž perioda je

svázána s kalendářem • Cyklická složka - odráží periodické změny, jejichž perioda

neodpovídá délce nějaké kalendářní jednotky.

Page 12: EDA pro časové řady

Dekompozice časových řad

Rozklad časové řady na trendovou, sezónní, cyklickou a náhodnou složku.

• Trend - dlouhodobý vývoj• Sezónní složka - odráží periodické změny, jejichž perioda je

svázána s kalendářem • Cyklická složka - odráží periodické změny, jejichž perioda

neodpovídá délce nějaké kalendářní jednotky.• Náhodná (reziduální) složka - náhodné fluktuace, které

nemají žádný systematický charakter.

Page 13: EDA pro časové řady

Dekompozice časových řad

Rozklad časové řady na trendovou, sezónní, cyklickou a náhodnou složku.

Znalost každé jednotlivé složky nám umožní například lepší odhad vývoje daného procesu do budoucna (predikci).

Page 14: EDA pro časové řady

Hledání trendu

• Regresní metody

• Adaptivní přístup

Page 15: EDA pro časové řady

Hledání trendu(Metoda klouzavých průměrů)

2

4

6

8

10

12

14

16

18

leden 04 květen 05 říjen 06 únor 08 červenec 09 listopad 10 duben 12

Míra

nez

aměs

tnan

osti

[%]

Vývoj nezaměstnanosti (Rybitví)

MN Klouzavé průměry řádu 7 Klouzavé průměry řádu 13

Cíl: Odstranit šum vznikající působením náhodných vlivů.

Page 16: EDA pro časové řady

Metoda klouzavých průměrů

• Prosté klouzavé průměry – úseky časové řady o délce 2p+1 vyrovnáme tak, že je nahradíme prostým aritmetickým průměrem:

• p hodnot na začátku a p hodnot na konci časové řady zůstává nevyrovnáno.

• Sudá délka klouzavých průměrů se volí jen velmi zřídka.• Čím větší je délka klouzavého průměru, tím větší je

„vyhlazení“ časové řady.

pnpptp

yyyyy

py

p

pi

ptptptptitt

,...,2,1

12...

121 11

Page 17: EDA pro časové řady

Očištění časové řady od sezónní složky

1 2 3 4 5 6 7 8 9 10 11 120.02.04.06.08.0

10.012.014.0

Míra nezaměstnanosti (Rybitví)

2006 2007 2008

Měsíc

Míra

nez

aměs

tnan

osti

[%]

Page 18: EDA pro časové řady

• Sezónní faktor stanovíme pomocí odchylky časové řady a centrovaných klouzavých průměru o délce rovné periodě časové řady, nejčastěji o délce 12).

• Sezónní faktor pro určitý měsíc pak určíme jako průměrnou měsíční odchylku, tj. lednový sezónní faktor se určí jako průměr všech lednových odchylek.

Očištění časové řady od sezónní složky

Page 19: EDA pro časové řady

Očištění časové řady od sezónní složky

Page 20: EDA pro časové řady

• Časovou řadu očištěnou od sezónní složky získáme tak, že sezónní faktor odečteme od původní časové řady. Takto očištěná časová řada se pak používá pro další statistické vyhodnocení (regresní analýza, modelování časových řad, ...).

Očištění časové řady od sezónní složky

Page 21: EDA pro časové řady

Děkuji za pozornost!