38
Analiza dynamiki zjawisk masowych Wprowadzenie Analizę dynamiki zjawisk masowych przeprowadza się na podstawie szeregów czasowych. Są to ciągi (Y t ) wartości badanego zjawiska obserwowanego w kolejnych jednostkach czasu. Zmienną niezależną jest czas, a zmienną zależną – wartości liczbowe badanego zjawiska. Tomasz Górecki Analiza danych (W8)

Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Wprowadzenie

Analizę dynamiki zjawisk masowych przeprowadza się na podstawieszeregów czasowych. Są to ciągi (Yt) wartości badanego zjawiskaobserwowanego w kolejnych jednostkach czasu. Zmiennąniezależną jest czas, a zmienną zależną – wartości liczbowebadanego zjawiska.

Tomasz Górecki Analiza danych (W8)

Page 2: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Szeregi czasowe w R

Do konstrukcji szeregu czasowego wykorzystywana jest funkcja ts.Jeśli mamy już szereg czasowy, to możemy uzyskać z niego wieleinformacji. Wykorzystywane są do tego następujące funkcje: start(początkowy okres), end (końcowy okres), frequency (liczbapodokresów), deltat (odstęp czasowy pomiędzy obserwacjami, np.dla miesięcy mamy 1/12), time (wektor czasów, w których mamyobserwacje z szeregu). Do wizualizacji danych zebranych w postaciszeregu czasowego służy funkcja ts.plot, której argumentem możebyć kilka szeregów czasowych (zostaną zwizualizowane na jednymwykresie).

Tomasz Górecki Analiza danych (W8)

Page 3: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Daty w R

Podstawowe funkcje to: Sys.time (data wraz z godziną), Sys.Date(data bez godziny). Do wprowadzania danych jako dat służyfunkcja as.Date, której argumentem jest data. Domyślny formatdaty, to cztery cyfry na rok, dwie na miesiąc i dwie na dzień,oddzielone kreską lub ukośnikiem. Jeśli chcemy użyćniestandardowego formatu, należy go wyspecyfikować jako wartośćparametru format według oznaczeń zawartych w poniższej tabeli.

Oznaczenie Działanie

%d dzień miesiąca (liczba)

%m miesiąc (liczba)

%b miesiąc (skrót nazwy)

%B miesiąc (pełna nazwa)

%y rok (2 cyfry)

%Y rok (4 cyfry)

Tomasz Górecki Analiza danych (W8)

Page 4: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Daty w R

Data przechowywana jest jako liczba dni, jaka upłynęła od 1stycznia 1970 roku. Można również podać datę jako liczbę dni,która upłynęła od pewnej daty początkowej. Jeśli chcemy siędowiedzieć, jakim dniem, miesiącem lub kwartałem jest dana datamożemy użyć funkcji weekdays, months oraz quarters. Częstomożemy być zainteresowani jaka była różnica pomiędzy dwomadatami. W R różnicę tę możemy wyrazić w sekundach, minutach,godzinach, dniach i miesiącach używając funkcji difftime iokreślając parametr units na secs, mins, hours, days, weeksodpowiednio. Przy konstrukcji szeregów czasowych potrzebne namsą sekwencje dat. Można je z łatwością utworzyć korzystająca zpoznanej wcześniej funkcji seq z wykorzystaniem jej parametru by,który może przyjmować wartości będące jednostkami czasowymi.

Tomasz Górecki Analiza danych (W8)

Page 5: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Model wahań w czasie

Modelem wahań w czasie nazywamy konstrukcję teoretycznąopisującą kształtowanie się określonego zjawiska jako funkcjęczasu, wahań okresowych (periodycznych) i przypadkowych(nieregularnych). Tradycyjnie analizy prawidłowości w rozwojuzmiennej dokonuje się poprzez wyodrębnianie w szeregu czasowymjego elementów składowych, co nosi nazwę dekompozycji tegoszeregu. W najogólniejszym przypadku zakłada się, że w szereguczasowym mogą wystąpić cztery składniki:

1 trend – Tt ,2 wahania cykliczne – Ct ,3 wahania sezonowe – St ,4 wahania nieregularne, przypadkowe – It .

Tomasz Górecki Analiza danych (W8)

Page 6: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Model wahań w czasie

Trend charakteryzuje długookresową tendencję zmian w szereguczasowym. Może on oznaczać w miarę regularnie powtarzający sięwzrost lub spadek wartości zmiennej Y lub też brak wyraźnejtendencji zmian. Pozostałe trzy składniki szeregu czasowego toróżnego typu odchylenia od tendencji długookresowej. Wahaniacykliczne oznaczają powtarzające się (niekoniecznie regularnie)wahania o czasie trwania dłuższym niż rok. Wahania sezonoweoznaczają takie odchylenia od trendu, które powtarzają się wczasie w sposób regularny i których pełen cykl zawiera się w ciągujednego roku. Wahania sezonowe powtarzają się według pewnego„wzorca” każdego roku. Wahania sezonowe kształtowane są przezczynniki naturalne (pory roku, pogodę) oraz przez zwyczaje (np.różne święta). Wahania nieregularne (losowe) to te, któreobejmują wszelkie odchylenia od trendu, będące efektem działaniana badaną zmienną niepowtarzalnych, nie dających się przewidziećani prognozować zdarzeń.

Tomasz Górecki Analiza danych (W8)

Page 7: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Modelowanie szeregów czasowych

Szereg czasowy możemy modelować na dwa sposoby:

MultiplikatywnieYt = TtStCt It

Zakładamy, że zmiany odchylenia od trendu wyrażone są wprocentach, przy czym 100% oznacza brak zmian. Ten modeljest wykorzystywany częściej.

AddytywnieYt = Tt + St + Ct + It

Zakładamy, że zmiany odchylenia od trendu wyrażone są wwartościach absolutnych.

Tomasz Górecki Analiza danych (W8)

Page 8: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Trend

Tendencją rozwojową (trendem) nazywamy powolne, regularne isystematyczne zmiany określonego zjawiska, obserwowane wdostatecznie długim przedziale czasu i będące wynikiem działaniaprzyczyn głównych. Przyjmuje się, że aby wyodrębnić trend,niezbędne są co najmniej 10-letnie badania. Wyróżniamy dwiemetody wyodrębniania tendencji rozwojowej szeregów czasowych:

Metoda mechaniczna – opiera się na średnich ruchomych.Polega ona na zastąpieniu danych empirycznych średnimipoziomami z okresu badanego i kilku okresów sąsiednich.Średnie ruchome mogą być obliczane z parzystej bądźnieparzystej liczby wyrazów sąsiednich.

Metoda analityczna – polega na dopasowaniu określonejfunkcji matematycznej do całego szeregu czasowego zapomocą MNK. Istotny jest wybór klasy funkcji trendu orazprawidłowe oszacowanie jej parametrów.

Tomasz Górecki Analiza danych (W8)

Page 9: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Średnia ruchoma

Dla przykładu średnie ruchome trzyokresowe (k = 3) obliczamynastępująco:

Y2 =Y1 + Y2 + Y3

3,

Y3 =Y2 + Y3 + Y4

3,

. . . ,

Yn−1 =Yn−2 + Yn−1 + Yn

3.

Tomasz Górecki Analiza danych (W8)

Page 10: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Średnia ruchoma

Natomiast w przypadku średniej ruchomej dla parzystej liczbyokresów (k = 4) obliczenia wykonujemy według wzorów:

Y3 =1

2Y1 + Y2 + Y3 + Y4 +

1

2Y5

4,

Y4 =1

2Y2 + Y3 + Y4 + Y5 +

1

2Y6

4,

. . . ,

Yn−2 =1

2Yn−4 + Yn−3 + Yn−2 + Yn−1 +

1

2Yn

4.

Zaletą tej metody jest prostota obliczeń, wadą natomiast jestskracanie wyrównanego tą metodą szeregu czasowego. W naszymprzypadku dla k = 3 tracimy element pierwszy i ostatni, a dlak = 4 tracimy dwa pierwsze i dwa ostatnie.

Tomasz Górecki Analiza danych (W8)

Page 11: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Filtry wygładzające

Oprócz najprostszej metody średniej ruchomej można zastosować,dużo bardziej wyrafinowane metody zwane filtrami. Donajpopularniejszych należą filtr liniowy oraz wykładniczy. Filtrliniowy ma postać:

Yt =12a + 1

a∑

i=−a

Yt+i .

Jest to w zasadzie nieco zmodyfikowana średnia ruchoma.

Tomasz Górecki Analiza danych (W8)

Page 12: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Filtry wygładzające

Filtr wykładniczy, który bywa również nazywany wygładzaniemwykładniczym Browna, opiera się na założeniu, że wartośćszeregu czasowego powinna bardziej zależeć od obserwacji bliskichniż dalekich, co daje

Yt+1 = αYt−1 + (1− α)Yt .

Istotny jak widać jest w tym przypadku wybór wartości startowej,najczęściej jest za nią przyjmowana wartość początkowa szeregu Y1lub jest to średnia z pierwszych czterech lub pięciu obserwacjipoczątkowych. Takie proste wygładzanie wykładnicze używane jestw przypadku prognoz krótkoterminowych, gdy dane nie wykazujątrendu ani sezonowości.

Tomasz Górecki Analiza danych (W8)

Page 13: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Filtry wygładzające

W przypadku wystąpienia trendu używa się podwójnegowygładzania wykładniczego Holta postaci:

St = αYt + (1− α)(St−1 + bt−1), 0 < α < 1

bt = β(St − St−1) + (1− β)bt−1, 0 < β < 1

oraz

Yt+1 = St + bt

gdzie St jest wygładzoną wartością zmiennej prognozowanej wchwili t, a bt wygładzoną wartością przyrostu trendu w okresie t.Za wartości startowe przyjmuje się S1 = Y1 oraz b1 = Y2 − Y1 lubb1 = (Yn − Y1)/(n − 1). Jeśli dodatkowo uwzględnimy sezonowośćto dostaniemy potrójne wygładzanie wykładnicze, zwane równieżmetodą Wintersa (pojawia się tam dodatkowy parametr γ).Istnieją dwa jego rodzaje w zależności czy przyjmujemy modeladdytywny czy multiplikatywny sezonowości. Ogólnie wygładzeniewykładnicze jest nazywane filtrem Holta-Wintersa.

Tomasz Górecki Analiza danych (W8)

Page 14: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Filtry wygładzające w R

Filtr liniowy realizuje funkcja filter, której pierwszym argumentemjest szereg czasowy, natomiast drugim argumentem jest wektorwag. Filtrowanie wykładnicze realizuje funkcja HoltWinters, którejpierwszym argumentem jest szereg czasowy, następne trzyparametry alpha, beta i gamma określają wartości odpowiednichparametrów modelu. Jeśli nie zostaną podane (ustalenie na NULLwyklucza parametr z modelu), funkcja poszuka wartościminimalizujących błąd średniokwadratowy predykcji. Ostatniistotny parametr to seasonal, który może przyjmować wartość’additive’ lub ’multiplicative’ w zależności od wybranego modelusezonowości.

Tomasz Górecki Analiza danych (W8)

Page 15: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Metoda analityczna

Najczęściej stosowana jest funkcja liniowa postaci:

Yt = α0 + α1 · t + εt ,

gdzie εt oznacza składnik losowy. Na podstawie danych z szereguempirycznego wyznacza się oszacowanie tej funkcji:

Yt = a0 + a1 · t,

gdzie estymatory parametrów wyznaczamy według wzorów:

a1 =

12n∑

t=1

Yt · t

n3 − n−6

n∑

t=1

Yt

n2 − n,

a0 = Y − a1 · t.

Tomasz Górecki Analiza danych (W8)

Page 16: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Autokorelacja

Aby powyższe wzory były poprawne, odchylenia resztowe muszą byćlosowe oraz nie może występować autokorelacja (ACF) składnikalosowego. Autokorelacja występuje wtedy, gdy skutki działaniazmienności losowej nie wygasają w danym okresie t, lecz są przenoszonena okresy przyszłe t + 1 (autokorelacja rzędu pierwszego), t + 2(autokorelacja rzędu drugiego) itd. Autokorelacja rzędu k (popularniezwana opóźnieniem) jest funkcją, która argumentowi naturalnemu kprzypisuje wartość współczynnika korelacji Pearsona pomiędzyszeregiem czasowym, a tym samym szeregiem cofniętym o k jednostekczasu. Formalnie (dla procesów stacjonarnych):

ρ(k) =γ(k)

γ(0),

gdzie

γ(k) = cov(Yt ,Yt+k ) = E [(Yt − µ)(Yt+k − µ)]

jest autokowariancją rzędu k oraz µ = E (Yt).

Tomasz Górecki Analiza danych (W8)

Page 17: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Autokorelacja

Najczęściej spotykaną formą autokorelacji jest autokorelacjadodatnia. Dodatnio skorelowane zaburzenia losowe nie zachowująsię całkowicie chaotycznie. Jeśli w okresie t błąd losowy byłdodatni, to prawdopodobieństwo, że w okresie t + 1 będzie ontakże dodatni, jest wyższe niż prawdopodobieństwo, że w okresietym będzie on ujemny. Spowodowana jest ona zwyklerozciągnięciem na dłużej niż jeden okres skutków zdarzeń losowychwpływających na poziom zmiennej objaśnianej. Rzadziej spotykanąformą autokorelacji jest autokorelacja ujemna. W takim przypadkuprawdopodobieństwo wystąpienia po dodatnim błędzie losowymujemnego błędu jest wyższe niż prawdopodobieństwo wystąpieniadodatniego błędu. Autokorelacja może być także spowodowanaprzyjęciem błędnej postaci funkcyjnej dla estymowanego modelu.Sprawdzenie istotności autokorelacji składnika losowego następujenajczęściej za pomocą testu Durbina-Watsona, w którymhipoteza zerowa zakłada brak autokorelacji.

Tomasz Górecki Analiza danych (W8)

Page 18: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Autokorelacja – wykresy

Do wstępnej oceny autokorelacji można wykorzystać wykresy.

a) Brak autokorelacji b) autokorelacja dodatnia c) autokorelacjaujemna

a) Autokorelacja dodatnia b) autokorelacja ujemnaTomasz Górecki Analiza danych (W8)

Page 19: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Test Durbina-Watsona w R

Odpowiednia funkcja znajduje się w pakiecie car i nosi nazwędurbinWatsonTest.

Tomasz Górecki Analiza danych (W8)

Page 20: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Modelowanie szeregów czasowych z autokorelacją

Jeśli autokorelacja występuje szereg czasowy modeluje się poprzez:

Proces średniej ruchomej (MA) rzędu q postaci:

Yt = c +

q∑

j=0

βjεt−j ,

gdzie εt jest czynnikiem losowym (o wartości oczekiwanej 0oraz wariancji σ2), przy czym εi oraz εi+1 są niezależne dlakażdej wartości i .

Tomasz Górecki Analiza danych (W8)

Page 21: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Modelowanie szeregów czasowych z autokorelacją

Proces autoregresji (AR) rzędu p postaci:

Yt = α0 +

p∑

i=1

αiYt−i + εt .

W procesie AR(p) uwzględniamy wpływ p poprzednichwartości szeregu na jego wielkość w momencie t.

Tomasz Górecki Analiza danych (W8)

Page 22: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Modelowanie szeregów czasowych z autokorelacją

Proces autoregresji i średniej ruchomej (ARMA) rzędu (p, q)postaci:

Yt = α0 +

p∑

i=1

αiYt−i +

q∑

j=0

βjεt−j ,

w którym dodajemy dodatkowo efekt wpływu czynnikalosowego z poprzednich momentów czasowych na wartośćszeregu w momencie t.

Tomasz Górecki Analiza danych (W8)

Page 23: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Modelowanie szeregów czasowych z autokorelacją

Scałkowany proces autoregresji i średniej ruchomej (ARIMA)rzędu (p, d , q). Jeśli w danych występuje wyraźny trend(proces jest niestacjonarny), należy taki trend usunąć przeddalszą analizą. Trend usuwany jest poprzez różnicowanie drazy. Stopień różnicowania określony jest przez stopieńwielomianu opisującego trend (pojedyncze różnicowanie usuwatrend liniowy, podwójne kwadratowy itd.). Operacjaróżnicowania polega na d krotnym zastępowaniu szereguszeregiem różnic wyrazów sąsiednich. Przy każdej takiejoperacji długość szeregu zmniejsza się o jeden. Gdy metodąróżnicowania dojdziemy do szeregu stacjonarnego obliczającróżnice rzędu d , taki szereg nazywamy szeregiemzintegrowanym stopnia d .

Tomasz Górecki Analiza danych (W8)

Page 24: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność

Średnia szeregu czasowego (trend) nie powinna być funkcją czasu,raczej powinna być stała.

Tomasz Górecki Analiza danych (W8)

Page 25: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność

Wariancja szeregu czasowego nie powinna być funkcją czasu.

Tomasz Górecki Analiza danych (W8)

Page 26: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność

Kowariancja i -tego i (i +m)-ego składnika nie powinna byćfunkcją czasu.

Tomasz Górecki Analiza danych (W8)

Page 27: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność

Jeśli nie mamy pewności co do stacjonarności szeregu, możemyspróbować zbadać to jednym z dostępnych testów stacjonarności.Do najpopularniejszych należy test Dickeya-Fullera. Hipotezazerowa stanowi, że szereg jest niestacjonarny. Proces AR orazARMA są stacjonarne jeżeli wszystkie pierwiastki równaniacharakterystycznego są większe co do wartości bezwzględnej od 1.Jeżeli w modelu zawarto funkcję zależną od czasu t, to proces jestniestacjonarny. Proces MA jest zawsze stacjonarny.

Tomasz Górecki Analiza danych (W8)

Page 28: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność

Proces Yt =1

2Yt−1 + εt ma równanie charakterystyczne

postaci x − 2 = 0, które ma pierwiastek równy 2. Jest tozatem proces stacjonarny.

Proces Yt = Yt−1 − 14Yt−2 + εt ma równaniecharakterystyczne postaci x2 − 4x + 4 = 0, które mapierwiastek podwójny równy 2. Zatem jest to również processtacjonarny.

Proces Yt =1

2Yt−1 +

1

2Yt−2 + εt ma równanie

charakterystyczne postaci x2 + x − 2 = 0, które mapierwiastki równe -2 i 1. Ponieważ nie są oba większe co dowartości bezwzględnej od 1, zatem proces jest niestacjonarny.

Proces Yt = −14Yt−2 + εt ma równanie charakterystyczne

postaci x2 + 4 = 0, które ma dwa pierwiastki zespolonepostaci ±2i , dla których |2i | =

√22 + 02 = 2. Czyli proces

jest stacjonarny.

Tomasz Górecki Analiza danych (W8)

Page 29: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Określanie rzędu procesu

Poza autokorelacją wykorzystuje się również autokorelacjęcząstkową (PACF). Jest ona podobna do autokorelacji, zwyjątkiem tego, że podczas jej obliczania korelacje z wszystkimielementami w ramach opóźnienia zostają wyeliminowane. Jeśliopóźnienie zostało określone na 1 (tzn. nie ma żadnych elementówpośrednich wewnątrz opóźnienia), to autokorelacja cząstkowa jestrównoważna autokorelacji. Autokorelacje wizualizujemy za pomocąkorelogramów, na których nanosimy wartości kolejnychautokorelacji, przy zmieniającym się opóźnieniu. Jeśli słupki sąmałe (między liniami określającymi poziom ufności) możemywnioskowaś, że zależność autokorelacyjna nie występuje, wprzeciwnym razie możemy zaobserwować jakiego jest rzędu.

Tomasz Górecki Analiza danych (W8)

Page 30: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Określanie rzędu procesu

Z korelogramu autokorelacji możemy wnioskowaś o rzędzie średniejruchomej, natomiast z korelogramu autokorelacji cząstkowejwnioskujemy o rzędzie procesu autoregresji.ARIMA(1, d , 0): ACF – opada wykładniczo; PACF –maksimum przy opóźnieniu 1, brak korelacji dla innychopóźnień.ARIMA(2, d , 0): ACF – kształt sinusoidalny lub kombinacjazaników wykładniczych; PACF – duże wartości przyopóźnieniach 1 i 2, brak korelacji dla innych opóźnień.ARIMA(0, d , 1): ACF – maksimum przy opóźnieniu 1, brakkorelacji dla innych opóźnień; PACF – gaśnie wykładniczo.ARIMA(0, d , 2): ACF – duże wartości przy opóźnieniach 1 i 2,brak korelacji dla innych opóźnień; PACF – kształt sinusoidylub kombinacja zaników wykładniczych.ARIMA(1, d , 1): ACF – opada wykładniczo począwszy odopóźnienia 1; PACF – opada wykładniczo począwszy odopóźnienia 1.

Tomasz Górecki Analiza danych (W8)

Page 31: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Określanie rzędu procesu

Ogólnie w celu określenia rzędów procesu można wykorzystaćponiższą tabelę.

AR(p) MA(q) ARMA(p, q), p, q > 0

ACF Zmniejsza się Zanika po opóźnieniu q Zmniejsza się

PACF Zanika po opóźnieniu p Zmniejsza się Zmniejsza się

Tomasz Górecki Analiza danych (W8)

Page 32: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Określanie rzędu procesu

Jeśli jednak wciąż nie mamy pewności warto wykorzystaćrozszerzoną funkcję autokorelacji (EACF). W wyniku otrzymujemytabelę, w której w każdym wierszu otrzymujemy ACF aż doopóźnienia q dla każdego procesu AR o rzędzie k ≤ p. Rzędyprocesu wnioskujemy z położenia wierzchołka trójkąta złożonego zzer.

AR/MA 0 1 2 3 4 5 6 7 8 9 10

0 X X X X X X X X X X X1 X 0* 0 0 0 0 0 0 0 0 02 X X 0 0 0 0 0 0 0 0 03 X X X 0 0 0 0 0 0 0 04 X X X X 0 0 0 0 0 0 05 X X X X X 0 0 0 0 0 06 X X X X X X 0 0 0 0 07 X X X X X X X 0 0 0 0

Tomasz Górecki Analiza danych (W8)

Page 33: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Równania Yule’a-Walkera

Theorem

Jeśli Yt =∑p

z=1 αzYt−z + εt jest stacjonarnym procesem AR(p),wtedy jego funkcja autokorelacji spełnia następujące równanierekurencyjne

ρ(s) =

p∑

z=1

αzρ(s − z), s = 1, 2, . . .

Tomasz Górecki Analiza danych (W8)

Page 34: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Równania Yule’a-Walkera

Znajdźmy korzystając z powyższego twierdzenia funkcjęautokorelacji dla procesu AR(2) postaci

Yt = α1Yt−1 + α2Yt−2 + εt .

Mamy:

ρ(k) =

1, dla k = 0,α1

1−α2, dla k = 1,

α2

1

1−α2+ α2, dla k = 2,

0, w p.p.

Tomasz Górecki Analiza danych (W8)

Page 35: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Autokorelacja i autokowariancja z definicji

Niech

Yt = 10+ Zt + Zt−1,

gdzie Zt ,Zt−1, . . . jest ciągiem niezależnych zmiennych losowych owartości oczekiwanej zero oraz jednostkowej wariancji. Mamy:

E (Yt) = E (Yt+k) = 10,

γ(0) = Var(Yt) = 2,

γ(1) = E [(Yt − µ)(Yt+1 − µ)] = 1,

γ(2) = E [(Yt − µ)(Yt+2 − µ)] = 0.

Oraz

ρ(0) = 1,

ρ(1) = 0,5,

ρ(2) = 0.

Tomasz Górecki Analiza danych (W8)

Page 36: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Stacjonarność procesów ARIMA

Sprawdźmy czy proces ARIMA(1,1,1) jest stacjonarny. Proces takima postać:

△Yt = α△ Yt−1 + εt + βεt−1, |α| < 1, b 6= 0.

Mamy zatem

Yt − Yt−1 = α(Yt−1 − Yt−2) + εt + βεt−1,

Yt = (α+ 1)Yt−1 − αYt−2 + εt + βεt−1.

Jest to zatem proces ARMA(2,1). Równanie charakterystyczneczęści AR ma postać:

αx2 − (α+ 1)x + 1 = 0.

Ma ono pierwiastki 1 oraz 1/a. Zatem nie jest to processtacjonarny.

Tomasz Górecki Analiza danych (W8)

Page 37: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analiza dynamiki zjawisk masowych

Flowchart

Tomasz Górecki Analiza danych (W8)

Page 38: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA/W7.pdf · Model wahań w czasie ... najpopularniejszych należą filtr liniowy oraz wykładniczy

Analizadynamikizjawiskmasowych

Flowchart

TomaszGórecki

Analizadanych(W8)