Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
UNIVERSITEIT GENT
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE
ACADEMIEJAAR 2011 – 2012
Het meten en voorspellen van volatiliteit op financiële markten
Masterproef voorgedragen tot het bekomen van de graad van
Master of Science in de
Toegepaste Economische Wetenschappen: Handelsingenieur
Jens Ponnet
onder leiding van
Prof. Dr. Michael Frömmel
UNIVERSITEIT GENT
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE
ACADEMIEJAAR 2011 – 2012
Het meten en voorspellen van volatiliteit op financiële markten
Masterproef voorgedragen tot het bekomen van de graad van
Master of Science in de
Toegepaste Economische Wetenschappen: Handelsingenieur
Jens Ponnet
onder leiding van
Prof. Dr. Michael Frömmel
PERMISSION
Ondergetekende verklaart dat de inhoud van deze masterproef mag geraadpleegd en/of gereproduceerd worden, mits bronvermelding. Jens Ponnet
I
WOORD VOORAF
In oktober 2010 begon mijn zoektocht naar een onderwerp voor mijn masterproef. Mijn doelstelling
was om een onderwerp te kiezen dat me zowel interesseerde als mentaal voldoende stimuleerde. Dit
bracht me bij het onderwerp ‘Het meten en voorspellen van volatiliteit op financiële markten’,
aangeboden door prof. dr. M. Frömmel.
Graag had ik nog een paar mensen bedankt. Eerst en vooral zou ik graag mijn promotor, prof. dr. M.
Frömmel, bedanken voor het aanbieden van dit interessant onderwerp en me de kans te geven een
masterproef te schrijven die me wist te boeien. Veel dank gaat uit naar Martien Lamers die me goed
ondersteund heeft in het uitdenken van het concept en de werkwijze in deze masterproef. Ik wil ook
prof. dr. G. Everaert bedanken. Enerzijds voor het geven van de boeiende cursus ‘Financial
Econometrics’ die ik gevolgd heb als ondersteuning voor deze thesis en anderzijds voor zijn hulp bij
de praktische problemen die ik ondervond in mijn onderzoek.
Graag had ik ook mijn familie en vrienden bedankt voor hun steun. Mijn speciale dank gaat uit naar
mijn broer, Björge Ponnet, en mijn vader, Eddy Ponnet, voor het nalezen van deze masterproef. Ik wil
ook mijn dank uiten aan mijn naaste vriendenkring van de richting Handelsingenieur voor het
gezelschap in de bibliotheek tijdens het schrijven van deze scriptie. Veel dank gaat uit naar mijn
vriendin, Annelies Deleersnyder, voor het kritisch nalezen van mijn masterproef en voor de zorg en
steun die zij onvoorwaardelijk aanbood.
II
INHOUDSOPGAVE
WOORD VOORAF .............................................................................................................................................. I
INHOUDSOPGAVE ............................................................................................................................................ II
LIJST MET GEBRUIKTE AFKORTINGEN ............................................................................................................... V
LIJST VAN DE FIGUREN .................................................................................................................................... VI
LIJST VAN DE TABELLEN .................................................................................................................................. VII
ALGEMENE INLEIDING ...................................................................................................................................... 1
VOLATILITEIT .................................................................................................................................................... 5
1.1 OMSCHRIJVING BEGRIP .......................................................................................................................... 5 1.2 BELANG .................................................................................................................................................. 6 1.3 BRONNEN VAN VOLATILITEIT ................................................................................................................. 6
LITERATUURSTUDIE .......................................................................................................................................... 8
2.1 INLEIDING EN SITUERING ....................................................................................................................... 8 2.2 TRADITIONELE ANALYTISCHE VOLATILITEITSCHATTERS ......................................................................... 9
2.2.1 Historische volatiliteit ...................................................................................................................... 9 2.2.2 Exponentieel gewogen voortschrijdend gemiddelde model ............................................................ 9
2.3 IMPLICIETE VOLATILITEIT ..................................................................................................................... 10 2.4 IDENTIFICATIE GEVORDERDE ANALYTISCHE SCHATTERS IN DE LITERATUUR ....................................... 11
2.4.1 Dagelijkse range en de natuurlijke logaritme van de dagelijkse range ......................................... 11 2.4.2 Schatters gebaseerd op openings- en sluitingsprijzen................................................................... 12 2.4.3 Schatters gebaseerd op maximum en minimum prijzen ............................................................... 14 2.4.4 Beste analytische schatter door Garman & Klass (1980) .............................................................. 14 2.4.5 Samengestelde schatter ................................................................................................................ 16
2.5 ECONOMETRISCHE VOLATILITEITSMODELLERING ............................................................................... 18 2.5.1 Autoregressieve glijdend gemiddelde volatiliteitmodellen (ARMA-modellen) .............................. 19
2.5.1.1 Stationariteit / Niet-stationariteit ....................................................................................................... 20 2.5.1.2 De’ autoregressieve’- component ....................................................................................................... 21 2.5.1.3 De ‘glijdend gemiddelde’-component ................................................................................................. 22
2.5.2 Conditionele heteroscedastische autoregressieve volatiliteitsmodellen (ARCH-modellen) .......... 23 2.5.3 Veralgemeende conditionele heteroscedastische autoregressieve volatiliteitmodellen (GARCH-
modellen) ..................................................................................................................................... 25 2.5.3.1 Standaard GARCH-model .................................................................................................................... 26 2.5.3.2 GARCH-variaties .................................................................................................................................. 27
GJR-GARCH .......................................................................................................................................................... 28 EGARCH ............................................................................................................................................................... 28
ONDERZOEKSMETHODIEK .............................................................................................................................. 30
3.1 INLEIDING ............................................................................................................................................. 30 3.2 ONDERZOEKSOPZET ............................................................................................................................. 30
3.2.1 Overdraagbaarheidstudie ............................................................................................................. 31 3.2.1.1 Hypothesestelling ................................................................................................................................ 31 3.2.1.2 Modelspecificaties ............................................................................................................................... 32
GARCH met ‘range’ schatter ............................................................................................................................... 32 GJR-GARCH met ‘range’ schatter ........................................................................................................................ 33 EGARCH met ‘range’ schatter.............................................................................................................................. 33
3.2.2 Hoofdonderzoek ............................................................................................................................ 34 3.2.2.1 Hypothesestelling ................................................................................................................................ 34
III
3.2.2.2 Modelspecificaties ............................................................................................................................... 35 GARCH met analytische schatter ......................................................................................................................... 35 GJR-GARCH met analytische schatter ................................................................................................................. 36 EGARCH met analytische schatter ....................................................................................................................... 36
3.2.3 Volatiliteitsonderzoek in verschillende tijdsperiodes ..................................................................... 37 3.2.3.1 Hypothesestelling ................................................................................................................................ 37 3.2.3.2 Modelspecificaties ............................................................................................................................... 38
3.3 OVERZICHT METHODOLOGIE ............................................................................................................... 38 3.4 BEOORDELINGSMETHODEN ................................................................................................................. 41
3.4.1 Significantie en infocriteria ........................................................................................................... 41 3.4.2 Voorspellingsbeoordeling .............................................................................................................. 42
3.4.2.1 Voorspellingsmethodologie ................................................................................................................. 42 3.4.2.2 Prestatie-indicatoren voor het beoordelen van voorspellingen .......................................................... 45
Root Mean Square Error (RMSE) ......................................................................................................................... 46 Mean Absolute Error (MAE) ................................................................................................................................ 46 Mean Absolute Percentage Error (MAPE) ........................................................................................................... 47 Correlatie ............................................................................................................................................................ 47 R
2 van een aanvullende regressie met de bekomen voorspellingen ................................................................... 48
DE DATA ......................................................................................................................................................... 49
4.1 INLEIDING ............................................................................................................................................. 49 4.2 OMSCHRIJVING .................................................................................................................................... 49
4.2.1 BEL 20 index .................................................................................................................................. 50 4.3 EIGENSCHAPPEN RETURNS BEL 20-INDEX ............................................................................................ 51
4.3.1 Volatiliteitsclustering..................................................................................................................... 51 4.3.2 Leptokurtische verdeling ............................................................................................................... 52 4.3.3 Stationariteit van de returns ......................................................................................................... 53 4.3.4 ARCH-LM test ................................................................................................................................ 54
4.4 IDENTIFICATIE MEAN EQUATION ......................................................................................................... 56 4.5 BASELINE VOLATILITEIT ........................................................................................................................ 58 4.6 EIGENSCHAPPEN ‘RANGE’- SCHATTERS ................................................................................................ 59 4.7 EIGENSCHAPPEN ANALYTISCHE VOLATILITEITSCHATTERS ................................................................... 61
4.7.1 Descriptieve statistieken van de analytische schatters ................................................................. 61 4.7.2 Correlatie analytische schatters .................................................................................................... 63
4.8 IDENTIFICATIE TIJDSPERIODEN ............................................................................................................. 64 4.8.1 ‘Bull’-markt .................................................................................................................................... 64 4.8.2 ‘Bear’-markt .................................................................................................................................. 65
RESULTATEN EMPIRISCH ONDERZOEK ........................................................................................................... 67
5.1 INLEIDING ............................................................................................................................................. 67 5.2 PRAKTISCHE ELEMENTEN EN VERDUIDELIJKING VAN DE OUTPUT VAN HET EMPIRISCH ONDERZOEK . 67 5.3 RESULTATEN EN INTERPRETATIE .......................................................................................................... 70
5.3.1 Overdraagbaarheidsstudie ............................................................................................................ 70 5.3.2 Hoofdonderzoek ............................................................................................................................ 72 5.3.3 Volatiliteitsonderzoek in verschillende tijdsperiodes ..................................................................... 76
5.3.3.1 ‘bull’-markt .......................................................................................................................................... 76 5.3.3.2 ‘Bear’ market ....................................................................................................................................... 79 5.3.3.3 Besluit .................................................................................................................................................. 81
ALGEMEEN BESLUIT ....................................................................................................................................... 82
BIBLIOGRAFIE ................................................................................................................................................ VIII
BIJLAGEN ......................................................................................................................................................... IX
APPENDIX A: BEREKENING Ƒ ....................................................................................................................... APPENDIX A APPENDIX B: BEWIJS GARCH(1,1) = ARCH(∞) ........................................................................................... APPENDIX B
IV
APPENDIX C: OUTPUT ARCH-LM TESTEN ..................................................................................................... APPENDIX C APPENDIX D: BESCHRIJVENDE STATISTIEKEN ‘RANGE’ SCHATTERS ....................................................................... APPENDIX D APPENDIX E: OUTPUT OVERDRAAGBAARHEIDSTUDIE ....................................................................................... APPENDIX E APPENDIX F: OUTPUT HOOFDONDERZOEK ..................................................................................................... APPENDIX F
GARCH-modellen ............................................................................................................................ Appendix F GJR-GARCH-modellen ..................................................................................................................... Appendix F EGARCH-modellen .......................................................................................................................... Appendix F Combinatie-modellen ..................................................................................................................... Appendix F
APPENDIX G: OUTPUT VOLATILITEITONDERZOEK IN VERSCHILLENDE TIJDSPERIODES ................................................ APPENDIX G Bull markt ...................................................................................................................................... Appendix G
GARCH-modellen ........................................................................................................................................ Appendix G GJR-GARCH-modellen ................................................................................................................................. Appendix G EGARCH-modellen ...................................................................................................................................... Appendix G Output combinatie-modellen ..................................................................................................................... Appendix G
Bear markt ..................................................................................................................................... Appendix G GARCH-modellen ........................................................................................................................................ Appendix G GJR-GARCH-modellen ................................................................................................................................. Appendix G EGARCH-modellen ...................................................................................................................................... Appendix G Output combinatie-modellen ..................................................................................................................... Appendix G
V
LIJST MET GEBRUIKTE AFKORTINGEN
AIC: Akaike Criterium
AR: ‘AutoRegressive’
ARCH: ‘Autoregressive Conditional Heteroscedastic’
ARMA: ‘AutoRegressive Moving Average’
BV: BEL 20-volatiliteitsindex
DR: Dagelijkse Range
DF: Dickey-Fuller
EGVG: Exponentieel Gewogen Voortschrijdend Gemiddelde
GARCH: ‘Generalised Autoregressive Conditional Heteroscedastic’
LR: dagelijkse Log Range
MA: ‘Moving Average’
MAE: ‘Mean Absolute Error’
MAPE: ‘Mean Absolute Percentage Error’
ME: ‘Mean Equation’
ML: Maximum likelihood
OLS: ‘Ordinary Least Squares’
QML: Quasi maximum likelihood
RMSE: ‘Root Mean Squared Error’
SBC: Schwartz Bayesian Criterium
VE: ‘Variance Equation’
VI
LIJST VAN DE FIGUREN
Figuur 1: Returns BEL 20 .......................................................................................................... 5 Figuur 2: Intraday prijsverloop BEL 20-index (31/10/2011 17:35:15 - 01/11/2011 17:35:15)
(Engels) .................................................................................................................... 13 Figuur 3: Structurele onderbreking .......................................................................................... 20 Figuur 4: Lineaire trend ............................................................................................................ 20
Figuur 5: Overzicht Methodologie ........................................................................................... 40 Figuur 6: In-sample voorspelling ............................................................................................. 43 Figuur 7: Out-of-sample voorspelling ...................................................................................... 43 Figuur 8: Statische voorspelling ............................................................................................... 44 Figuur 9: Dynamische voorspelling ......................................................................................... 45
Figuur 10: Returns BEL 20 index ............................................................................................ 52 Figuur 11: Descriptieve statistieken returns BEL 20 index ..................................................... 52 Figuur 12: a) Gestandaardiseerde residuen AR(1)-model, b) Gestandaardiseerde residuen
GARCH(1,1)-model ................................................................................................ 55 Figuur 13: Descriptieve statistieken van de gestandaardiseerde residuen van een
GARCH(1,1)-model ................................................................................................ 56
Figuur 14: Grafiek AIC en SBC voor verschillende specificaties (BEL 20 returns) ............... 57 Figuur 15: Beschrijvende statistieken BEL 20-volatiliteitindex .............................................. 59 Figuur 16: Grafiek BEL 20-volatiliteitindex ............................................................................ 59
Figuur 17: Beschrijvende statistieken DRt ............................................................................... 60 Figuur 18: Beschrijvende statistieken LRt ............................................................................... 60
Figuur 19: a) Q-Q plot voor DRt, b) Q-Q plot voor LRt .......................................................... 61
Figuur 20: Voorspellingsperiode: Bull markt .......................................................................... 65
Figuur 21: Voorspellingsperiode: Bear markt .......................................................................... 66 Figuur 22: Samenvattende grafieken voorspellingsbeoordeling deel 1 ................................... 71
Figuur 23: Grafiek voorspelde volatiliteit met EGARCH-LR ................................................. 72 Figuur 24: Grafieken RSME, MAE, MAPE deel 2.................................................................. 73 Figuur 25: Grafieken regressie- en correlatieoutput deel 2 ...................................................... 74
Figuur 26: Grafiek voorspelde volatiliteit met EGARCH-E7 .................................................. 75
Figuur 27: Grafieken RSME, MAE, MAPE deel 3 ‘bull’-markt ............................................. 77 Figuur 28: Grafieken regressie- en correlatieoutput deel 3 ‘bull’-markt ................................. 78 Figuur 29: Grafiek voorspelde volatiliteit met EGARCH-LR ................................................. 78 Figuur 30: Grafieken RSME, MAE, MAPE deel 3 'bear' markt .............................................. 79 Figuur 31: Grafieken regressie- en correlatieoutput deel 3 'bear' markt .................................. 80
Figuur 32: Grafiek voorspelde volatiliteit met EGARCH-LR ................................................. 80
VII
LIJST VAN DE TABELLEN
Tabel 1: Ontbrekende observaties in basisdataset .................................................................... 50 Tabel 2: Samenstelling BEL 20 ............................................................................................... 50 Tabel 3: Basis DF test .............................................................................................................. 53 Tabel 4: AIC en SBC voor verschillende specificaties (BEL 20 returns) ................................ 57 Tabel 5: Samenvatting descriptieve statistieken geïdentificeerde schatters ............................. 62
Tabel 6: Samenvatting descriptieve statistieken geïdentificeerde schatters na aanpassing ..... 62 Tabel 7: Aantal ontbrekende waarden in de dataset ................................................................. 63 Tabel 8: Covariantie/correlatie-tabel analytische schatters ...................................................... 64 Tabel 9: Verduidelijking outputkolommen .............................................................................. 68 Tabel 10: Significantieniveaus ................................................................................................ 69
1
ALGEMENE INLEIDING Het accuraat meten en voorspellen van de volatiliteit op financiële markten is het onderwerp van een
groot deel van de bestaande literatuur over financiële producten. Het belang van de volatiliteit is dat
het een maatstaf is voor het risico dat gepaard gaat met een specifiek financieel product. Het is dan
ook logisch dat als een financieel product een hoge volatiliteit heeft de onzekerheid in de returns
toeneemt omdat een hoge volatiliteit tevens kan leiden tot grote negatieve returns. In dit opzicht is het
dus belangrijk dat er bij het berekenen van het risico rekening wordt gehouden met de volatiliteit van
een financieel product.
In de huidige literatuur bestaat er een grote basis aan modellen die de volatiliteit kunnen meten en
voorspellen. Grotendeels kunnen de bestaande modellen, die van belang zijn in deze studie, in twee
categorieën ingedeeld worden. De eerste soort zijn de analytische methodes om tot bepaalde schatters
te komen. Deze schatters zullen worden geïdentificeerd in papers van onder andere Wang & Roberts
(2004) , Garman & Klass (1980) en Yang & Zhang (2000). Wat deze schatters gemeenschappelijk
hebben is dat ze een range met betrekking tot het dagelijkse prijsverloop berekenen. Deze ‘range’
schatters zullen dan gebruikt worden om in een tweede soort modellen te integreren. Deze tweede
soort modellen zijn econometrische modellen die in staat zijn om een bekende eigenschap van returns,
de volatiliteitsclustering, te modelleren. De econometrische modellen die in deze studie zullen
gebruikt worden, zijn het GARCH-model van Bollerslev (1986), het GJR-GARCH-model van
Glosten, Jagannathan, & Runkle (1993) en het EGARCH-model van Nelson (1991). De ‘range’
schatters zullen dan worden toegevoegd in de variantievergelijking (‘variance equation’, VE) worden
toegevoegd. Met deze uitgebreide GARCH-modellen zullen er dan voorspellingen gemaakt worden
voor de volatiliteit. Deze voorspelde volatiliteit zal dan vergeleken worden met een externe
volatiliteitreeks (over dezelfde onderliggende returns).
Als returnreeks wordt de BEL 20-index gebruikt. Als externe volatiliteitserie zal de BEL 20-
volatiliteitindex worden gebruikt. De voorspellingen voor de volatiliteit door de GARCH-modellen (of
varianten) zal dan tegenover de externe volatiliteitserie, in deze studie de BEL 20-volatiliteitsindex
(BV), worden uitgezet voor alle modellen en beoordeeld worden op hoe dicht de voorspellingen
aansluiten bij de externe volatiliteitreeks. Op basis van die beoordelingsmethoden zal de
voorspellingskracht van de verschillende modellen met elkaar vergeleken worden. De gebruikte
beoordelingsmethoden zijn de ‘Root Mean Squared Error’ (RMSE), de ‘Mean Absolute Error’ (MAE)
en de ‘Mean Absolute Percentage Error’ (MAPE) die gebaseerd zijn op de voorspellingsfout. Deze
voorspellingsfout is het verschil tussen de externe ‘baseline’-volatiliteit (BEL 20-volatiliteitsindex,
BV) en de voorspelde waarden voor de volatiliteit. Er worden eveneens correlatiecoëfficiënten
berekend voor de voorspelde waarden en de BV. Ook werden er regressies opgesteld met de BV als
afhankelijke variabele en de voorspelde waarden als onafhankelijke variabele. De coëfficiënten van
2
deze regressies dienen dan als beoordelingsmethode om te controleren hoe dicht deze voorspelde
waarden bij de BV in de buurt komen.
Het onderzoek op zich is opgedeeld drie delen. Het eerste deel van het onderzoek onderzoekt of
GARCH-modellen met toevoeging van de ‘range’ schatter ‘daily range’ (DR) en/of ‘log range’ (LR)
betere voorspellingen levert dan een standaard GARCH-model. Dit eerste deel bouwt voort op een
bestaande paper van Wang & Roberts (2004) waarin de DR al in een GARCH-model wordt gebruikt
om voorspellingen te maken van de volatiliteit. Hier wordt de DR ook toegepast in een GJR-GARCH-
model en een EGARCH-model, dit wordt eveneens zo gedaan voor schatter LR in de GARCH-, GJR-
GARCH- en EGARCH-modellen. De voorspellingsperiode in dit deel loopt van begin 2004 tot en met
eind 2010. In deel 2 van het onderzoek blijft de voorspellingsperiode dezelfde. In dit deel is het echter
de bedoeling dat andere ‘range’ schatters dan deze in deel 1 van het onderzoek worden toegevoegd aan
GARCH-modellen (en varianten). Deze andere ‘range’ schatters worden geïdentificeerd in de
literatuur en worden beschreven door o.a. Garman & Klass (1980) en Yang & Zhang (2000). Deze
schatters zijn geïdentificeerd op basis van hun theoretische efficiëntie in het voorspellen van de
variantie. Er werden ook schatters geïdentificeerd die rekening houden met de periode in één dag
waarin de beurs gesloten is. Deel 3 van het onderzoek past de modellen, die in deel 1 en deel 2 van het
onderzoek werden gebruikt, toe op verschillende tijdperiodes. Deze tijdperiodes worden gekenmerkt
door de staat waarin de markt zich bevindt. Er worden twee soorten markten onderzocht, namelijk een
‘bull’-markt en een ‘bear’-markt. De ‘bull’-markt in dit onderzoek wordt gekenmerkt door relatief lage
stabiliteit en de ‘bear’-markt wordt gekenmerkt door een relatief hoge volatiliteit. In deel 3wordt de
vraag gesteld of de modelprestaties met betrekking tot het voorspellen van de volatiliteit, nog steeds
dezelfde zijn als in deel 1 en deel 2 van het onderzoek. Opnieuw wordt er ook in deel 3 getest of
schatters die rekening houden met een periode waarin de beurs gesloten is, extra informatie kunnen
toevoegen aan GARCH-modellen (en varianten) om zo betere voorspellingen van de volatiliteit te
leveren. Het uiteindelijke doel van deze studie is dat het kan bijdragen aan de bestaande literatuur over
het voorspellen met GARCH-modellen en varianten. Specifiek kan gezegd worden dat deze scriptie
wil bijdragen aan de literatuur die te maken heeft met de incorporatie van data/schatters gebaseerd op
‘range’ in de modellen van de GARCH-familie.
Uit de resultaten voor het onderzoek in deel 1 kan besloten worden dat de DR en LR er weldegelijk in
slagen om betere voorspellingen te leveren. In dit deel komt het EGARCH-model met toevoeging van
de LR er als beste model uit. In deel 2 van het onderzoek wordt gevonden dat het EGARCH-model
met schatter E7 het beste model is. De schatter E7 is echter wel niet significant. Indien de resultaten
van deel 2 met die van deel 1 worden vergeleken kan er worden besloten dat geen enkel model in deel
2 er in slaagt om betere voorspellingen te leveren dan de modellen in deel 1. Voor deel 3 komt men tot
het besluit dat de staat van de markt geen invloed heeft op welk model het best presteert in het
voorspellen van de volatiliteit. In dit deel wordt EGARCH-LR nog altijd als beste model gevonden.
3
De stelling dat de incorporatie van informatie, die rekening houdt met de periode waarin de beurs
gesloten is, in de schatter tot betere voorspellingen leidt, wordt zowel in deel 2 en deel 3 verworpen.
Er zijn een aantal belangrijke beperkingen aan dit onderzoek. Ten eerste wordt er slechts getest op één
enkele marktindex en kan er dus niet zomaar veralgemeend worden naar andere financiële markten of
producten. Ten tweede wordt in deze studie de BV als een externe ‘baseline’-volatiliteit gebruikt. In
de literatuur is het echter vaak een punt van discussie welke nu de beste ‘baseline’-volatiliteit is.
Andere volatiliteitreeksen voor de ‘baseline’ kunnen dus ook andere resultaten leveren. Ten slotte
wordt er in deze studie slechts een selectie aan ‘range’ schatters gebruikt. Dit onderzoek valt dus niet
te veralgemenen naar andere ‘range’ schatters die in deze studie niet worden gebruikt.
Deze studie is ingedeeld in vijf grote hoofdstukken. In hoofdstuk 1 wordt de betekenis, de relevantie
en het belang van de volatiliteit besproken. Hoofdstuk 2 bevat de literatuurstudie. In dit hoofdstuk
wordt er op zoek gegaan naar de verschillende elementen waaruit de modellen die in het onderzoek
gebruikt worden, bestaan. Deel 2.2 geeft een overzicht van de traditionele methodes die gebruikt
worden om volatiliteit te meten (en te voorspellen). Deel 2.3 bespreekt de impliciete volatiliteit
aangezien de BV berekend is op basis van deze volatiliteit. In deel 2.4 worden dan de ‘range’ schatters
geïdentificeerd in de literatuur die dan zullen gebruikt worden in de GARCH-modellen (en varianten).
Deel 2.5 geeft de basis mee voor het werken met GARCH-, GJR-GARCH- en EGARCH-modellen en
er wordt tevens uitgelegd hoe deze modellen in elkaar zitten. In Hoofdstuk 3 wordt de
onderzoeksmethodiek beschreven. Deel 3.2 legt de verschillende delen van het onderzoek uit. Per deel
van het onderzoek worden er hypotheses opgesteld en worden de functionele vormen van de GARCH-
modellen (en varianten) met ‘range’ schatter weergegeven. Deel 3.3 geeft een algemeen overzicht van
de gevolgde methodologie in deze studie en hoe de verschillende hoofdstukken en delen van de
hoofdstukken in elkaar passen. Deel 3.4 behandelt de beoordelingsmethoden die zullen worden
gebruikt om te bepalen hoe goed de voorspellingen van de volatiliteit bij de BV passen. In Hoofdstuk
4 worden de eigenschappen van de data besproken en de identificatie van de tijdsperiodes voor deel 3
van het onderzoek gedaan. Deel 4.2 bevat een algemene omschrijving van de BEL 20-index terwijl
deel 4.3 de eigenschappen van de returns van deze index bespreekt. Deel 4.4 bepaalt de functionele
vorm die zal gebruikt worden voor de ‘Mean equation’ (ME) in de GARCH-modellen (en varianten).
De ‘baseline’-volatiliteit en zijn eigenschappen worden besproken in deel 4.5. De eigenschappen van
de verschillende analytische schatters die werden geïdentificeerd in de literatuurstudie worden
besproken in deel 4.7. Het laatste deel van Hoofdstuk 4 (4.8) identificeert de twee soorten markten die
in deel 3 van het onderzoek een rol spelen. Ten slotte behandelt Hoofdstuk 5 de resultaten van het
empirisch onderzoek. Deel 5.2 bespreekt de praktische elementen die met het schatten van de
econometrische modellen gepaard gaan en verduidelijkt de output die in de appendix wordt
weergegeven. Deel 5.3 bevat de resultaten van het onderzoekt en bespreking/interpretatie ervan.
4
Tenslotte zal deze scriptie afgesloten worden met een conclusie evenals de vermelding van
beperkingen en (daaruit volgend) suggesties voor verder onderzoek.
5
HOOFDSTUK 1
VOLATILITEIT
1.1 OMSCHRIJVING BEGRIP
Een eenduidige definitie van volatiliteit bestaat niet, vermits er in de literatuur een uiteenlopend aantal
definities gegeven wordt. Intuïtief kan men stellen dat volatiliteit in een financiële context algemeen
omschreven wordt als een maatstaf die de mate van beweeglijkheid van de prijs van een aandeel,
index, of om het even welk ander financieel product, aanwijst. Men spreekt van een hoge volatiliteit
als de koers van een bepaalde belegging sterk op en neer beweegt. Lage volatiliteit heeft men in het
omgekeerde geval, als de koersen weinig bewegen. In figuur 1 zien we de grafiek van de returns van
de BEL 20-index. In deze figuur zou men vier periodes kunnen onderscheiden op vlak van volatiliteit.
Periode 1 en 3 vertonen een relatief lage volatiliteit omdat de returns fluctueren in de buurt van nul. In
periode 2 en 4 daarentegen merkt men een relatief hoge volatiliteit omdat de returns grotere fluctuaties
vertonen.
Figuur 1: Returns BEL 20 (bron: Datastream)
Er bestaan twee soorten volatiliteit die nauw met elkaar verwant zijn, nl. de historische volatiliteit en
de impliciete volatiliteit. Historische volatiliteit is de volatiliteit die we kunnen afleiden uit historische
prijzen en returns van een bepaald financieel product. Impliciete volatiliteit daarentegen is afgeleid uit
de marktprijzen van opties. Het is een volatiliteitsraming op basis van de opinies van beleggers over
het toekomstig fluctueren van het onderliggend aandeel. Men kan de impliciete volatiliteit bekomen
door alle parameters van de “Black & Scholes”-formule in te voeren behalve de volatiliteit. Deze twee
verschillende volatiliteiten zijn gelinkt aan elkaar doordat de verwachtingen van de beleggers over
-10
-8
-6
-4
-2
0
2
4
6
8
10
12
15
/07
/19
92
15
/07
/19
94
15
/07
/19
96
15
/07
/19
98
15
/07
/20
00
15
/07
/20
02
15
/07
/20
04
15
/07
/20
06
15
/07
/20
08
15
/07
/20
10
RETURNS BEL 20
RETURN BEL 20
Periode 1 Periode 2 Periode 3 Periode 4
Tijd
Re
turn
s
6
toekomstige volatiliteit ook deels worden beïnvloed door de historische volatiliteit. In deze
verhandeling zal voornamelijk met historische volatiliteiten gewerkt worden. Impliciete volatiliteiten
kunnen gebruikt worden om voorspellingen van volatiliteit op hun accuraatheid te testen.
1.2 BELANG
Volatiliteit is een centraal concept in financiën. Dit omhelst portfoliomanagement, het bepalen van de
prijs van een financieel product, risicomanagement, enz. Vaak is de volatiliteit een maatstaf voor het
risico van een bepaald financieel product. Men kan dit intuïtief vatten doordat een verhoogde
beweeglijkheid van de prijs gekoppeld is aan een stijgende/verhoogde kans op grotere verliezen. Deze
verhoogde kans op een groot verlies is wat een financieel product zo risicovol maakt. Het is daarom
belangrijk dat iedereen die te maken heeft met investeringen in financiële producten, een zo goed
mogelijk beeld heeft van de prijsvolatiliteit, ten einde beter het risico in te schatten van dergelijke
financiële producten.
1.3 BRONNEN VAN VOLATILITEIT
De voornaamste bron van volatiliteit is de verspreiding van nieuwe informatie die direct of indirect
met het financieel product te maken heeft. In de huidige periode van crisis blijkt het meer dan ooit dat
nieuwe informatie over een bepaald aandeel grote gevolgen kan hebben voor de prijs van dat aandeel.
Een directe invloed van nieuws op een aandeel vloeit voort uit informatie die vrijgegeven wordt door
het bedrijf of informatie door derden over het bedrijf. Een welgekend voorbeeld van een directe
invloed is een aankondiging over een lagere winstverwachting het komende jaar of kwartaal. Dit zal
een negatief effect hebben op de waarde van het aandeel gezien er door een lagere winst dus ook een
lager dividend zal worden uitgekeerd of minder middelen voor investeringen beschikbaar worden. Een
indirecte invloed van nieuwe informatie op een aandeel heeft te maken met informatie die niet meteen
gerelateerd is aan het bedrijf zelf. Deze indirecte invloed is voornamelijk te wijten aan macro-
economische dynamiek van onze globale economie. Zonder hierover verder in detail te treden kan
men als belangrijkste voorbeeld de financiële crisis van 2007-2008 aanhalen. Een concreter voorbeeld
zou bijvoorbeeld de economisch slechte situatie van Griekenland in 2011 kunnen zijn, waarbij
investeringen in dat land en zijn bedrijven minder aantrekkelijk worden waardoor de aandeelprijzen
een daling kennen.
Het verhandelen van een aandeel is ook een belangrijke bron van volatiliteit. Deze is gerelateerd aan
de vorige bron doordat men op basis van informatie zal verhandelen om zo een voordeel te bekomen
door het toepassen van een bepaalde strategie. Verhandelen gebeurt vaak op basis van heel recent
uitgebrachte informatie maar kan ook gebeuren op basis van verwachtingen. Deze verwachtingen
omvatten bijvoorbeeld winstverwachtingen, nieuws over een overname, enz. Verhandelen kan ook
7
onafhankelijk zijn van nieuwe informatie maar puur het resultaat zijn van bepaalde strategieën. Een
simpel voorbeeld hiervan is het korte termijn ‘day traden’ waarbij men uitsluitend gaat handelen op
basis van de prijsschommelingen die dagelijks plaatsvinden. Hier komt volatiliteit terug in het verhaal
als zijnde een maat voor de verhandelbaarheid van een aandeel. Hoe groter de volatiliteit van een
aandeel, hoe beter het aandeel kan verhandeld worden om winst te maken op basis van
prijsschommelingen.
8
HOOFDSTUK 2
LITERATUURSTUDIE
2.1 INLEIDING EN SITUERING
Volatiliteit is een centraal begrip binnen de financiële wereld met een enorme impact op de manier
waarop zaken worden gedaan. Een belangrijk voorbeeld hiervan is portfolio management waarin
volatiliteit een cruciale rol speelt om het risico van de effectenportefeuille te bepalen. Het lijkt dan ook
logisch dat er een grote basis aan onderzoek is naar methodes om enerzijds de volatiliteit te schatten,
en anderzijds de volatiliteit te voorspellen. Volatiliteit schatten is vooral van belang om inzicht te
krijgen in de eigenschappen en de dynamiek ervan. Het is ook van belang voor de beoordeling van de
methoden die men gebruikt om volatiliteit te voorspellen. Eenmaal een methode voldoende
eigenschappen kan vatten van de volatiliteit, zal deze methode normalerwijs ook degelijke
voorspellingen kunnen maken. Onderzoek in de literatuur richt zich dan ook voornamelijk op het
vinden van methodes om volatiliteit beter te kunnen voorspellen.
In dit hoofdstuk worden eerst de traditionele schatters voor de volatiliteit uitgelegd in deel 2.2. In dit
deel wordt eerst de historische volatiliteit toegelicht, de meeste eenvoudige methode om volatiliteit te
meten. Deze historische volatiliteit is gebaseerd op historische prijzen van financiële producten. Ten
tweede wordt het ‘exponentieel gewogen voortschrijdend gemiddelde (EGVG)’-model toegelicht in
deel 2.2.2. In deel 2.3 wordt de impliciete volatiliteit toegelicht die eerder het gevolg is van de huidige
marktdata, die de verwachtingen over de toekomst reflecteren. Deze categorie aan modellen wordt
besproken omdat de externe ‘baseline’-volatiliteit in deze studie berekend is op een impliciete manier
uit optieprijzen. Deel 2.4 gaat dieper in op de literatuur die bestaat over analytische ‘range’ schatters
voor de volatiliteit en identificeert die schatters die zullen worden gebruikt in het onderzoek. Deel
2.4.1 bevat de beschrijving van de ‘range’ schatters uit de paper van Wang & Roberts (2004). Deze
‘range’ schatters zullen worden gebruikt in deel 1 van het onderzoek. In deel 2.4.2 tot en met deel
2.4.5 wordt er verder gezocht naar analytische ‘range’ schatters in de literatuur. Deze schatters vormen
de input voor deel 2 van het onderzoek. Tenslotte worden in deel 2.5 de econometrische modellen
toegelicht die in alle delen van het onderzoek de basis vormen. Het gaat hier om het GARCH-model
van Bollerslev (1986), het GJR-GARCH-model van Glosten, Jagannathan, & Runkle (1993) en het
EGARCH-model van Nelson (1991). In deel 2.5.1 wordt een ‘AutoRegressive Moving Average
(ARMA)’-model uitgelegd en de belangrijkste elementen waaruit dit model bestaat. In deel 2.5.2
wordt dan het ARCH-model van Engle (1982) besproken, de voorloper van het GARCH-model. Deel
2.5.3 bevat de uitleg over de verschillende GARCH-modellen die als basis zullen gebruikt worden in
dit empirisch onderzoek.
9
2.2 TRADITIONELE ANALYTISCHE VOLATILITEITSCHATTERS
2.2.1 Historische volatiliteit
Traditioneel wordt de historische volatiliteit weergegeven door de standaardafwijking
(standaarddeviatie) van de returns van een aandeel. De prijzen van een aandeel zijn een gegeven op
financiële markten, maar veel belangrijker voor investeringsanalyse zijn de returns. Deze returns zijn
het verschil van de prijs in periode t en de prijs in periode t-1, dit kan zowel weergegeven worden in
absolute returns en in logaritmische returns:
1ttt PPR (1)
1tP
tP
ln*100t
R (2)
Rt wordt gedefinieerd als de return van een aandeel op tijdstip t, Pt is de prijs op tijdstip t en Pt-1 is de
prijs op tijdstip t-1. De volatiliteit wordt beschouwd als de standaardafwijking van de returns. In
Hoofdstuk 13 van Hull (2008) wordt deze standaardafwijking als volgt geformuleerd:
n
1t
2
tt RR1n
1σ
(3)
Dit is een analytische schatter voor de standaardafwijking en heeft een licht gewijzigde notatie ten
opzichte van de formule in Hull (2008). De standaardafwijking wordt geschat over een significante
periode, waarmee bedoeld wordt dat de standaardafwijking berekend wordt over een periode die het
meest representatief is voor de toekomstige standaardafwijking van het aandeel. De keuze van deze
periode in historische modellen is echter cruciaal voor een accurate volatiliteitmeting. Intuïtief gezien
zal een pre-crisis volatiliteitmeting de toekomstige volatiliteit onderschatten in vergelijking met een
mid-crisis volatiliteitmeting. Lange tijd werd deze volatiliteitproxie gebruikt in prijsmodellen voor
opties. Naargelang er meer onderzoek werd verricht naar betere methodes om de volatiliteit te
schatten, kwamen onder andere Akgiray (1989) en Chu & Freund (1996) tot de conclusie dat
gesofisticeerde modellen betere volatiliteitmetingen bezorgden voor het prijzen van opties dan
bovenstaande analytische schatter. In zowel Akgiray (1989) als Chu & Freund (1996) was dit een
GARCH-model (infra, p.25) dat betere volatiliteitmetingen leverde.
2.2.2 Exponentieel gewogen voortschrijdend gemiddelde model
Het exponentieel gewogen voortschrijdend gemiddelde model, zoals beschreven in Hoofdstuk 8 in
Brooks (2008), is een uitbreiding op het meten van volatiliteit aan de hand van de historische returns.
Dit model wordt verder het EGVG-model genoemd. Concreet wordt in een EGVG-model een groter
10
gewicht gegeven aan recentere observaties zodat oudere observaties een minder sterke invloed hebben
op het meten van de volatiliteit.
De voordelen ten opzichte van de methode in deel 2.2.1 zijn tweezijdig. Enerzijds wordt volatiliteit in
de huidige periode het meest beïnvloed door recente gebeurtenissen en minder door oudere
gebeurtenissen. Dit is ook in lijn met het fenomeen ‘volatiliteitclustering’ dat kenmerkend is voor
financiële data. Volatiliteitclustering, zoals beschreven in Hoofdstuk 8 deel 8.1 in Brooks (2008),
wordt toegelicht in hoofdstuk 4 waarin de data besproken worden (infra, p49). Anderzijds zal één
enkele gebeurtenis door de tijd heen minder impact hebben op de huidige volatiliteit. Dit heeft als
voordeel dat abnormaliteiten met betrekking tot de gangbare volatiliteit geen blijvende vertekende
impact zullen hebben op volatiliteitmetingen. Ook voor volatiliteitvoorspellingen is het belangrijk dat
dergelijke abnormaliteiten de voorspellingen niet gaan vertekenen. Mocht er bijvoorbeeld een
tijdelijke opwaartse schok in de volatiliteit zijn en men gaat op basis van een steekproef met deze
shock inbegrepen een voorspelling doen, dan zal men een relatief overschatte volatiliteit bekomen.
Concreet kan het EGVG-model wiskundig als volgt geformuleerd:
2jt0j
jt RRλλ1σ
(4)
Hierbij stelt σt de standaardafwijking in periode t voor, Rt-j de return in periode (t-j) en R de
gemiddelde return over de steekproef. Het symbool λ stelt de vervalfactor voor. Deze factor bepaalt
het gewicht die gegeven wordt aan recentere observaties. De vervalfactor kan geschat worden hoewel
er in de literatuur meestal een vaste arbitraire waarde aan gegeven wordt die door de auteur bepaald
wordt. Vergelijking 4 is gebaseerd op de formule in Hoofdstuk 8 deel 8.5 in Brooks (2008).
Er zijn twee belangrijke beperkingen aan EGVG-modellen. Ten eerste valt er op te merken dat een
dergelijk model op meerdere manieren kan worden uitgedrukt. Ten tweede slagen EGVG-modellen er
niet in om een belangrijke eigenschap van volatiliteit te vatten, namelijk dat de volatiliteit een
terugkeer naar een lange termijn gemiddelde vertoont. Dit betekent dat als de volatiliteitreeks zich op
een relatief hoog niveau bevindt dan zal de reeks terugkeren naar zijn historisch gemiddeld niveau. Dit
geldt ook in het omgekeerde geval als de reeks zich op een relatief laag niveau bevindt. Deze uitleg is
gebaseerd op Hoofdstuk 8 deel 8.5 in Brooks (2008).
2.3 IMPLICIETE VOLATILITEIT Deze klasse van volatiliteitmodellen bepalen de volatiliteit op basis van alle gegeven stukken aan
informatie in verband met een optie. Doordat de prijsmodellen voor financiële opties altijd een
schatting nodig hebben van de volatiliteit om tot een evenwichtige prijs te komen, kan men vanuit
deze modellen ook omgekeerd werken en de volatiliteit eruit afleiden indien de andere parameters
gegeven zijn. Het standaard ‘Black-Scholes’-model bijvoorbeeld, is een model waaruit men de
volatiliteit kan afleiden omdat de andere parameters gekend zijn, nl. de tijd tot maturiteit van de optie,
11
de prijs van de optie, de risicovrije intrest, de ‘strike’ prijs, en de huidige waarde van het onderliggend
actief. Al deze parameters zijn gespecificeerd ofwel in het contract van de optie ofwel zijn ze
beschikbaar omdat ze simpelweg marktinformatie zijn die voor iedereen beschikbaar is. Deze klasse
van modellen om de volatiliteit te schatten wordt niet verder uitgewerkt in deze scriptie, noch zullen
deze modellen gebruikt worden in het empirisch onderzoek. Het bestaan van dit soort modellen wordt
louter als informatie meegegeven.
2.4 IDENTIFICATIE GEVORDERDE ANALYTISCHE SCHATTERS IN DE LITERATUUR
2.4.1 Dagelijkse range en de natuurlijke logaritme van de dagelijkse range
In de paper van Wang & Roberts (2004) werd de basis gelegd voor het onderzoek in deze studie.
Hierin werd er onderzocht of de data gebaseerd op range er voor kunnen zorgen dat de voorspellingen
van de volatiliteit in GARCH accurater zouden zijn door toevoeging van deze range data in de
‘variance equation (VE)’. De VE, GARCH en andere modellen worden in deel 2.5 van dit hoofdstuk
uitgelegd. Hier worden de ‘range’ variabelen gedefinieerd die zullen gebruikt worden in deze studie.
De modellen, die deze variabelen incorporeren, zullen dienen als benchmarkmodellen. De benchmark-
modellen worden dan vergeleken met de modellen die de schatters, die gedefinieerd worden in de
hierop volgende delen van 2.4, bevatten. In Wang & Roberts (2004) worden de dagelijkse range (DR)
en de dagelijkse log range (LR) gebruikt als variabelen die extra informatie over de volatiliteit zouden
moeten bevatten. De formule voor deze schatters is dezelfde als in de paper van Wang & Roberts
(2004), nl.:
)c,(lMin)c,(hMaxDR 1tt1ttt
1tt1ttt c,lMinlogc,(hMaxloglogLR
In deze formule is ht de maximale prijs van de huidige periode, lt-1 de minimale prijs van de huidige
periode en ct-1 de sluitingsprijs van de vorige periode. De periode in deze studie bedraagt één dag
aangezien het de bedoeling is om dagelijkse volatiliteit te voorspellen.
In Wang & Roberts (2004) worden er een aantal specifieke voordelen vermeld van de LR tegenover
de DR. Hieronder wordt een korte opsomming gegeven van de voordelen van de LR tegenover de DR
uit deze paper:
De LR heeft een kleinere standaarddeviatie dan de DR wat het gebruik ervan wenselijker
maakt.
De scheefheid en de kurtosis liggen dicht in de buurt van de scheefheid en kurtosis van een
normale verdeling.
De LR is wenselijker als tijdsreeks om de volatiliteit te vatten. In de paper van Wang &
Roberts (2004) werd bewezen dat de LR beter in staat is om de volatiliteitsclustering te
12
modelleren dan de DR. De dagelijkse range wordt daarentegen gekenmerkt door meer
erratische fluctuaties.
2.4.2 Schatters gebaseerd op openings- en sluitingsprijzen
Traditioneel werden de varianties/standaardafwijkingen van de returns berekend volgens de methodes
beschreven in deel 2.2.1 en deel 2.2.2, maar op deze methodes zijn er al veel variaties voorgesteld. De
traditionele methodes gebruiken echter sluitingsprijzen als input voor volatiliteitschatters. Het grote
nadeel hiervan is dat sluitingsprijzen slechts momentopnames zijn van de prijs van een aandeel over
een bepaald tijdsinterval. Bijgevolg vertelt dit dus helemaal niets over de hoe de volatiliteit eruitzag
tijdens die periode.
In Garman & Klass (1980) wordt de basisschatter alternatief voorgesteld als:
2
01
2
0ˆ CC
(5)
waarbij C1 de sluitingsprijs van vandaag is en C0 die van gisteren. Een belangrijk voordeel van deze
klassieke schatter is dat deze een onvertekende schatter is voor de populatievariantie. Dit voordeel
werd origineel in Garman & Klass (1980) beschreven. Het is ook zo dat sluitingsprijzen vrij
beschikbaar zijn en het toepassen van deze schatter in de praktijk redelijk eenvoudig is. Het grootste
nadeel aan deze schatter is dat de dynamiek tussen twee opeenvolgende sluitingsprijzen buiten
beschouwing wordt gelaten. Zo kan het bijvoorbeeld zijn dat twee opeenvolgende sluitingsprijzen
gelijk zijn, maar dat er grote fluctuaties van de prijs hebben plaatsgevonden in dat interval. In dit geval
zal de schatter aangeven dat er geen volatiliteit was, terwijl er in werkelijkheid een grote volatiliteit
werd waargenomen. Garman & Klass (1980) vermelden dit niet specifiek maar raden wel aan om meer
beschikbare informatie in de schatter te incorporeren.
Om het verloop van deze te tekst te bevorderen, voeren we eerst een notatie in die gebaseerd is op de
notatie uit Garman & Klass (1980):
σ2 = De onbekende constante variantie van de prijswijzigingen = de populatievariantie.
ƒ = De fractie van de dag dat de beurs (het verhandelen) gesloten is.
C0 = De sluitingsprijs van de vorige periode.
C1 = De sluitingsprijs van de huidige periode.
O1 = De openingsprijs van de huidige periode.
H1 = De hoogste prijs van de huidige periode.
L1 = De laagste prijs van de huidige periode.
o = O1 – C0 = De genormaliseerde openingsprijs van de huidige periode.
u = H1 – O1 = De genormaliseerde hoogste prijs van de huidige periode.
d = L1 – O1 = De genormaliseerde laagste prijs van de huidige periode.
c = C1 – O1 = De genormaliseerde sluitingsprijs van de huidige periode.
13
Deze gegevens worden grafisch weergegeven op figuur 2.
Figuur 2: Intraday prijsverloop BEL 20-index (31/10/2011 17:35:15 - 01/11/2011 17:35:15) (Engels)
(bron: Euronext website, auteurstekening)
In figuur 2 werd een opsplitsing gemaakt tussen de periode waarin de beurs geopend is en een periode
waarin verhandelen stil ligt. Nu kan er een ƒ gedefinieerd worden als de fractie van een tijdsperiode
waarin de beurs gesloten is. In het ons specifiek geval van de BEL 20, die genoteerd staat op Euronext
Brussel en waarin de beurs gesloten is tussen 17u35 de vorige dag tot 9u00, is onze f gelijk aan 0,6421.
De groene lijn stelt het onbekend prijsverloop voor dat men niet kan waarnemen. Men kan deze niet
waarnemen omdat het zich bevindt in het interval waarin verhandelen gesloten is. De intuïtie achter dit
onbekend prijsverloop is dat de sluitingsprijs van de vorige periode vaak niet gelijk is aan de
openingsprijs van de huidige periode, wat suggereert dat er een bepaald prijsverloop moet zijn als de
markten gesloten zijn. De eigenschap dat er ook prijsdynamiek is tijdens de periode waarin de beurs
gesloten is, wordt immers ook genegeerd door de basisschatter 20σ (supra, p.12).
Om aan deze laatste tekortkoming van de basisschatter tegemoet te komen, stellen Garman & Klass
(1980) een tweede schatter voor, die rekening houdt met de periode waarin het verhandelen gesloten
is, op voorwaarde dat openingsprijzen ook gekend zijn:
f)2(1
OC
2f
COσ
211
2012
1
ˆ 1,0 f
(6)
1 Zie appendix A
1960
1980
2000
2020
2040
2060
2080
2100
2120
2140
2160
17
:35
:15
16
:27
:30
15
:24
:45
14
:22
:00
13
:18
:45
12
:15
:15
11
:11
:15
10
:08
:30
9:0
5:4
5
8:0
3:3
0
7:0
1:1
5
5:5
9:0
0
4:5
6:4
5
3:5
4:3
0
2:5
2:1
5
1:5
0:0
0
0:4
7:4
5
23
:45
:30
22
:43
:15
21
:41
:00
20
:38
:45
19
:36
:30
18
:34
:15
BEL 20-index
Quote
sluitingsprijs 31/10
Ongekend prijsverloop
Beurs gesloten Beurs open
C0O1
C1
L1
H1
Tijd
Pri
js
14
In diezelfde paper wordt de prestatie van elke voorgestelde schatter aangetoond door het berekenen
van de efficiëntie ten opzichte van de basisschatter 2
0 2. De tweede schatter
2
1 blijkt een efficiëntie
gelijk aan 2 te hebben, onafhankelijk van de waarde van ƒ. Een efficiëntie van 2 betekent een
halvering van de variantie van de schattingen van de volatiliteit. Deze stelling en de formulering van
efficiëntie zijn terug te vinden in Garman & Klass (1980). Hieruit kan dus besloten worden dat meer
informatie incorporeren in de schatter tot een betere schatting van de volatiliteit leidt.
2.4.3 Schatters gebaseerd op maximum en minimum prijzen
Net zoals openingsprijzen en sluitingsprijzen, zijn ook hoogste en laagste prijzen vrij beschikbaar voor
de meeste genoteerde aandelen en financiële producten. In Garman & Klass (1980) worden deze
prijzen toegepast in een schatter die efficiënter is dan schatter 2
1 . De schatter die uitsluitend
gebaseerd is op hoogste en laagste prijzen wordt als volgt voorgesteld (Garman & Klass (1980)):
ln24
du
ln24
LHσ
22112
2
ˆ
(7)
Hierbij veronderstellen Garman & Klass dat de fractie ƒ gelijk is aan 0. Deze schatter heeft een
efficiëntie van 5,2 wat duidelijk beter is dan de vorige schatter (Garman & Klass, 1980). Houdt men
nu wel rekening met een fractie ƒ die verschillend is van 0, en als al de noodzakelijke prijzen bekend
zijn, dan wordt er in diezelfde paper een vierde schatter voorgesteld die wel rekening houdt met een
periode waarin de beurs gesloten is:
f)4(ln2)(1
d)(ua)(1
f
)C(Oaσ
22012
3
ˆ 1,0 f
(8)
met 17,0a voor de kleinste variantie van de schatter in theorie. Deze schatter heeft een efficiëntie
van 6,2 (Garman & Klass, 1980) wat dus terug een verbetering is ten opzichte van de vorige schatter
die geen rekening hield met een fractie ƒ.
2.4.4 Beste analytische schatter door Garman & Klass (1980)
Het grootste nadeel van de schatters 2
2 en 2
3 is dat ze uitsluitend gebaseerd zijn op (u-d). Ze
houden dus geen rekening met de onderlinge interactie tussen u, d en c. Om hieraan tegemoet te
komen, hebben Garman en Klass een ‘beste’ analytische schatter opgesteld in die zin dat de variantie
minimaal is en de schatter onvertekend is. Deze schatter heeft de volgende formulering3, met als
veronderstelling dat ƒ=0:
2 Voor gedetailleerde informatie over de efficiëntie, zie (Garman & Klass, 1980)
3 Zie (Garman & Klass, 1980) voor de mathematische afleiding.
15
2
22 4 c0,3832udduc0,019du0,511σ ˆ
(9)
Als waarde voor de efficiëntie van 2
4 werd ongeveer 7,4 (Garman & Klass, 1980) gevonden wat
nogmaals een verbetering is op voorgaande schatters. Een meer praktische schatter, met een min of
meer gelijke efficiëntie, die de kleine kruisproducten elimineert, wordt aangeraden:
2 2 25 1)c(2ln2du0,5σ ˆ
(10)
In het geval dat er rekening gehouden wordt met 0<ƒ<1, m.a.w. dat er een fractie van de periode is
waarin de beurs gesloten is, dan wordt in Garman & Klass (1980) de volgende uitbreiding op de
schatter 2
4 voorgesteld:
f)(1
σa)(1
f
)C(Oaσ
24
2012
6
ˆ
ˆ
(11)
Met 12,0a opdat de variantie minimaal zou zijn. Deze a is dezelfde als in Garman & Klass (1980).
De efficiëntie van deze laatste schatter is ongeveer 8,4 volgens de paper en werd in deze paper dus ook
als meest efficiënte schatter bevonden.
De grootste nadelen aan deze schatter, die vermeldt zijn in Garman & Klass (1980), zijn :
De schatter steunt op de assumptie dat het prijspad continu is, wat in werkelijkheid niet het
geval is. In realiteit zullen prijzen pas gekend zijn na een bepaald tijdsinterval, e.g. 15
seconden voor de BEL 20, wat er dus voor zorgt dat het prijspad discreet is en niet continu.
In de financiële literatuur wordt er meestal aangenomen dat het prijsverloop van een aandeel
gekenmerkt wordt door een algemeen Wiener proces met als uitdrukking dzdtdx
met μ als ‘drift’ en σdz als de ruis of variabiliteit van het pad gevolgd door x4. In Garman &
Klass (1980) wordt verondersteld dat μ gelijk is aan nul en men geeft aan de voorgaande
vergelijking de volgende notatie: dzdx met dz een standaard Gauss-Wiener proces en
de variabele die men probeert te schatten. Het nadeel is nu net dat elk van bovenstaande
schatters vertekend zullen zijn als de drift verschillend is van nul. In Rogers & Satchell (1991)
wordt een schatter opgesteld die onafhankelijk is van de drift en zal dus bijgevolg onvertekend
zijn wat de waarde van μ ook mag zijn. Er zal hier niet verder worden op ingegaan maar de
schatter die wordt voorgesteld in de paper van Rogers en Satchell vormt wel een onderdeel
van een samengestelde schatter (infra, p16) en zal bijgevolg daar deels worden besproken. De
schatters van Garman & Klass zijn vertekend in die zin dat ze de neiging hebben om
volatiliteit te overschatten. Er moet wel opgemerkt worden dat voor tijdreeksen met dagelijkse
data de drift factor min of meer 0 zal zijn waardoor de schatters dan wel een goede benadering
4 Zie Hoofdstuk 12 deel 12.2 in (Hull, 2008).
16
zijn van de volatiliteit (Yang & Zhang, 2000). Dit geldt echter niet in sterk stijgende markten
(bv. High-tech aandelen) waarin de drift groter zal zijn dan de volatiliteit en waar deze
modellen dus toch een overschatting zullen leveren (Yang & Zhang, 2000).
Bovenstaande schatters gelden voor één periode dus als men de volatiliteit wil schatten over
een bepaalde tijdspanne, dan moet het rekenkundig gemiddelde van de schattingen over de
verschillende periodes genomen worden. De schatters 260ˆ zijn allemaal schatters gebaseerd
op één periode. Tot dit inzicht is men ook gekomen in Rogers & Satchell (1991) en de auteurs
voegen er nog een bewijs5 aan toe dat in dit geval het onmogelijk is om schatters gebaseerd op
één periode te hebben die onafhankelijk zijn van zowel de drift μ als ƒ6.
Verder werd er ook geen rekening gehouden met dividenden en discrete kapitaal uitbetalingen
bij het opstellen van de schatters en werd ieder effect apart beschouwd. Voor meer informatie
over deze nadelen en nog additionele beperkingen wordt verwezen naar Garman & Klass
(1980).
2.4.5 Samengestelde schatter
Opdat een samengestelde schatter beter zou presteren dan één van de reeds vermelde schatters, is het
een must dat er een antwoord gegeven wordt op de restricties inzake drift (μ) en openingssprong ƒ die
aan deze schatters worden toegekend. Yang & Zhang (2000) zijn er in geslaagd een schatter te
formuleren die enerzijds onafhankelijk is van de nuldrift assumptie en anderzijds onafhankelijk van
het feit of er al dan niet een openingsprong is (ĭ0). Een additioneel voordeel aan de specifieke
formulering van deze schatter is dat het de volatiliteit over een bepaalde periode niet meer het
rekenkundig gemiddelde is van de volatiliteit in de eenheidsperioden, maar er in de plaats gerekend
wordt over de verschillende periodes heen.
De schatter, voorgesteld door Yang & Zhang (2000), wordt als volgt geformuleerd:
2RS
2C
2O
27 σk)(1σkσσ ˆˆˆˆ
(12)
Met
n
1i
2i
2O )o(o
1n
1σ
n
1i
2i
2C )c(c
1n
1σ
5 Zie Rogers & Satchell (1991): p.481-482.
6 In deze paper wordt ƒ beschouwd als effectieve tijdsperiode die een openingssprong van de prijs modelleert,
weliswaar onwaarneembaar.
17
n
1iiiiiii
2RS cddcuu
n
1σ
n
1iio
n
1o
n
1iic
n
1c
De notatie in deze paper verschilt in een lichte mate van de notatie die gebruikt wordt in het werk van
Yang & Zhang (2000) maar de mathematische formulering blijft behouden.
Er moet opgemerkt worden dat 2ˆ RS de schatter is die door Rogers & Satchell (1991) is ontwikkeld.
Zoals reeds vermeld, is deze schatter driftonafhankelijk (supra. p.15) en kan er dus geen vertekening
zijn indien de driftfactor significant zou verschillen van nul. De grootste zwakte van de RS-schatter is
dat er verondersteld wordt dat er geen openingssprongen zijn (Yang & Zhang, 2000). De schatter van
Yang en Zhang is in dit opzicht beter omdat deze schatter onafhankelijk is van de openingssprong (ƒ).
Het bewijs van deze eigenschap kan in de paper zelf gevonden worden.
In deze schatter is ook nog een constante k aanwezig. Deze constante kan nu gebruikt worden om de
variantie van de samengestelde schatter te minimaliseren aangezien dit een gunstige eigenschap is die
een schatter zeker wil bezitten. In Rogers & Satchell (1991) heeft de samengestelde schatter een
minimale variantie voor k = k0, waarbij k0 de volgende uitdrukking heeft:
met n het aantal periodes. Als waarde voor α hebben de auteurs door numerieke calculaties gevonden
dat 5,1 voor verschillende waarden van de driftfactor μ. Bij een drift gelijk aan nul bekomt men
een waarde voor α van 1,331 (Yang & Zhang, 2000). Aangezien bij het werken met dagelijkse data de
drift zich heel dicht bij nul bevindt, is het nodig dat de waarde voor α geoptimaliseerd wordt in dit
specifieke geval. De auteurs (Yang & Zhang, 2000) stellen voor om in de praktijk een waarde van 1,34
toe te kennen aan α, voornamelijk in het geval er gewerkt wordt met dagelijkse data.
Het is misschien onrechtstreeks al duidelijk geworden dat k0 nooit nul kan worden doordat α begrensd
is door 1,331 als absoluut minimum, en n minimum 2 zal zijn7. Dit heeft als gevolg dat zowel de
basisschatter gebaseerd op sluitingsprijzen ( 2ˆ C ) als de schatter van Rogers & Satchell ( 2ˆ RS )
alleenstaand geen minimum variantie kunnen garanderen. De minimum variantie zal een lineaire
7 Er kan niet gedeeld worden door nul in de vergelijking voor k0, dit is het geval voor n = 1.
1n
1nα
1αk 0
18
combinatie zijn van beide schatters waarbij het grootste gewicht zal toegekend worden aan 8ˆ RS 8. De
RS-schatter heeft bijgevolg een kleinere variantie dan de basisschatter.
Een minimale variantie is van belang voor een onderlinge vergelijking van de huidige samengestelde
schatter en de basisschatter, wat wordt gereflecteerd door de efficiëntie. In Yang & Zhang (2000)
wordt dit als volgt geformuleerd:
0
22 )1(
1
)(
)(
kffVVar
VVarEff CC
(13)
De algemene regel is dat hoe hoger deze efficiëntie, hoe accurater de huidige samengestelde schatter.
Onder de condities voor minimum variantie van de schatter wordt een piekwaarde van 14 bereikt voor
de efficiëntie. Aan de andere kant van het spectrum bereikt de schatter een minimum efficiëntie als de
volatiliteit gedomineerd wordt door openingssprongen ( 1f ). Dit zijn de twee extremen, in realiteit
zal de efficiëntie voornamelijk afhangen van ƒ bij een gegeven aantal perioden n. Uit onderzoek
vonden de auteurs Yang & Zhang (2000) dat ƒ een gemiddelde waarde zal hebben van 0,25; wat tot
een efficiëntie van ongeveer zeven tot acht leidt.
Er werd reeds vermeld dat de drift (μ) heel klein zal zijn indien er met dagelijkse data gewerkt wordt.
In het geval dat drift gelijk is aan nul, is de Garmann/Klass-schatter een schatter met minimale
variantie. Roger en Satchell bewezen in hun paper dat er weinig verschil is tussen hun schatter en de
GK-schatter als deze toegepast worden op data van dagelijkse aandelenprijzen. De RS-schatter heeft
wel het voordeel dat er geen overschatting zal gemaakt worden in bepaalde specifieke gevallen (bv.
High-tech aandelen; supra, p15-16).
2.5 ECONOMETRISCHE VOLATILITEITSMODELLERING De econometrische modellen, die de basis zullen vormen voor dit onderzoek, zijn de zogenoemde
GARCH-modellen. Engle (1982) legde de basis van deze compleet nieuwe categorie aan
econometrische modellen door het ARCH-model te introduceren. Het ARCH-model werd
voornamelijk opgesteld om een specifieke eigenschap van de volatiliteit te vatten, nl. de
volatiliteitclustering. ARCH-modellen werden vooral gebruikt voor het schatten en voorspellen van de
conditionele volatiliteit van tijdsreeksen van effecten. Een verbetering op dit model werd voorgesteld
door Bollerslev (1986) na kritiek op de eenvoudige ARCH specificatie. Dit nieuw voorgesteld model
was het GARCH-model, dat de basis vormde voor vele varianten aan modellen die allemaal deel
uitmaken van de grote ARCH-familie. Hoe deze modellen opgebouwd zijn en wat hun specifieke
eigenschappen zijn, wordt in dit deel behandeld. Er kan nu reeds worden meegegeven dat een selectie
8 Voor n , k0=0,2
19
aan modellen zal worden gebruikt naargelang hun populariteit in de literatuur en prestatie-
eigenschappen.
In deel 2.5.1 worden de basisbegrippen en concepten uitgelegd die nodig zijn voor het opbouwen van
een GARCH-model. Deze concepten zijn eigen aan het regresseren van tijdreeksen, dus hier wordt een
basis verschaft die van toepassing zal zijn om het empirisch onderzoek te verstaan. In 2.5.2 wordt het
ARCH-model van Engle (1982) toegelicht. Zowel de mathematische opbouw als de tekortkomingen
van het model worden besproken. In het laatste deel, 2.5.3, wordt uiteindelijk het GARCH-model
uitgelegd die de ruggengraat van het onderzoek zal vormen. In de variantievergelijking van de
GARCH-specificatie zal dan de analytische ‘range’ schatters, die geïdentificeerd werden in de
literatuurstudie, worden ingevoegd dus een goede basis moet worden meegegeven. Verder zal er in dit
deel ook de belangrijkste variaties, die zullen gebruikt worden in het onderzoek, worden beschreven.
2.5.1 Autoregressieve glijdend gemiddelde volatiliteitmodellen (ARMA-modellen)
Het toepassen van regressieanalyse voor het verklaren en het voorspellen van waarden van een
bepaalde economische variabele noemt men tijdreeksmodellen. Specifiek toegepast op volatiliteit zal
dit een univariaat tijdreeksmodel zijn waarbij er zal gepoogd worden om een patroon te vinden dat de
volatiliteit van een aandeel kenmerkt. Belangrijk om op te merken is dat men bij univariate
tijdreeksmodellen dit patroon van een variabele zal proberen te verklaren aan de hand van de
historische waarden die deze variabele heeft aangenomen. Deze manier van werken staat in contrast
met structurele modellen die in essentie multivariaat zijn (Brooks, 2008, Hoofdstuk 5). Structurele
modellen trachten het patroon van een bepaalde variabele te verklaren aan de hand van andere
variabelen die in zekere mate gecorreleerd zijn met de variabele waarvan men iets wil onderzoeken.
Hoewel deze modellen handig zijn om verbanden tussen verschillende variabelen te modelleren, zijn
ze minder geschikt om voorspellingen te maken met betrekking tot de afhankelijke variabele. Zo kan
er bijvoorbeeld een verband bestaan tussen de S&P 500 index en de FTSE 100 maar zolang men één
van deze indexen niet kan voorspellen kan men ook geen voorspellingen gaan maken voor de andere
index. Dit minpunt aan structurele modellen leidt ons tot het gebruik van tijdreeksmodellen. Wordt een
tijdreeksmodel uitgebreid met verklarende variabelen dan spreken we van multivariate tijdreeks
modellen. Hierbij kan de impact van deze variabelen ook kan geanalyseerd worden. Dit valt echter
buiten het bereik van deze thesis.
De meest gebruikte en eenvoudigste van de tijdreeksmodellen zijn de ARMA-modellen, of volledig
‘AutoRegressive Moving Average’-modellen. In de benaming zitten 2 delen vervat die kenmerkend
zijn voor tijdreeksmodellen. De twee delen zullen hieronder besproken worden omdat ze de
bouwstenen zijn van meer geavanceerde modellen die behandeld worden in de hierop volgende
subhoofdstukken. De eerste component (AR) is een autoregressief gedeelte. De tweede component is
een glijdend gemiddelde (MA). Vooraleer we verder ingaan op deze begrippen, moet het begrip
20
stationariteit verduidelijkt worden. Dit begrip speelt een cruciale rol in alle aangehaalde modellen in
deze studie.
2.5.1.1 Stationariteit / Niet-stationariteit Stationariteit is een eigenschap van een bepaalde dataset en is uiterst belangrijk in een econometrische
omgeving. Het bepaalt namelijk de correctheid van modellen die toegepast worden op tijdreeksen.
Strikte stationariteit wordt in Hoofdstuk 1 in Everaert (2011) gedefinieerd als ‘de distributie van
waarden van een bepaalde tijdreeks die geen arbitraire verandering maakt langs de tijdsas’. In
wiskundige termen wordt dit als volgt uitgedrukt:
)f(y)f(y kt t , k
In woorden wil dit zeggen dat de distributie van de tijdreeks yt niet beïnvloed wordt (door een
arbitraire verandering) langs de tijdsas.
Een serie is zwak stationair als het aan de volgende drie voorwaarden voldoet (Everaert, 2011):
De tijdreeks heeft een constant gemiddelde: μ)E(y t
De tijdreeks heeft een constante variantie: 22
tt σμ)E(y)(yVar
De Covariantie tussen de huidige waarde van de tijdreeks en de historische waarden is
tijdsafhankelijk: kkt t ktt γμ)μ)(yE(yy,yCov , k
Dit betekent concreet dat de tijdreeks terugkeert naar een bepaald gemiddelde na een arbitraire schok
die het verloop van de reeks verstoorde en de fluctuaties rond dit gemiddelde zullen min of meer
dezelfde amplitude hebben.
Een niet-stationair proces daarentegen zal een tijdsafhankelijk gemiddelde en/of tijdsafhankelijke
variantie hebben. Typische voorbeelden van niet-stationaire tijdreeksen zijn reeksen met een
structurele onderbreking (figuur 3) en reeksen met een lineaire trend (figuur 4).
Figuur 3: Structurele onderbreking (bron:
Everaert (2011)) Figuur 4: Lineaire trend (bron: Everaert (2011))
21
Stationariteit van een tijdreeks is belangrijk omwille van het feit dat als we met niet-stationariteit te
maken hebben, een eigenschap van de tijdreeks tijdens de huidige periode niet zal gelden voor
historische of toekomstige periodes door het tijdsafhankelijk karakter van de reeks. Dit zorgt ervoor
dat men geen algemene assumpties kan maken met betrekking tot de distributie van de tijdreeks, en
heeft ook tot gevolg dat men de eigenschappen van een tijdreeks niet kan bestuderen aan de hand van
bepaalde econometrische modellen. Er zijn natuurlijk wel uitzonderingen op de regel, zoals
gecoïntegreerde variabelen, maar die vallen buiten het bereik van deze studie.
Het formeel testen op stationariteit kan op twee manieren gebeuren. Enerzijds kan er naar de grafiek
van de tijdreeks gekeken worden als een eerste indicatie. Hierbij is het belangrijk dat de tijdreeks geen
trend vertoont en min of meer rond een gemiddelde fluctueert. Anderzijds kan er een meer formelere
test worden gebruikt, namelijk een Dickey-Fuller (DF) test. Deze test gaat na of er een ‘unit root’9 in
de data kan gevonden worden. Het vinden van een ‘unit root’ komt er in principe op neer dat de
tijdreeks niet-stationair is. De uiteenzetting hieronder van een basis DF test is gebaseerd op Brooks
(2008) Hoofdstuk 7 deel 7.1.4.
De bedoeling van een DF test is te onderzoeken of de nulhypothese dat 1 in de specificatie
ttt xx 1
10 verworpen kan worden (Brooks, 2008). De alternatieve hypothese is dan dat 1 .
Er kan een alternatieve formulering van de hypothesen worden gegeven:
H0: De tijdreeks bevat een ‘unit root’, en is dus niet-stationair.
H1: De tijdreeks is stationair.
In de praktijk wordt echter de specificatie ttt xx 1 gebruikt (Brooks, 2008). Het principe
blijft hetzelfde maar nu wordt er getest met als nulhypothese dat 0 . Dit is equivalent als testen
dat 1 omdat de verschiloperator ( ) er voor zorgt dat 1 11. De formulering van de
teststatistiek en informatie hierover kan gevonden worden in hetzelfde deel in Brooks (2008) zoals
reeds vermeld. De tijdreeks zal formeel getest worden op stationariteit in Hoofdstuk 4 deel 4.3.3.
2.5.1.2 De’ autoregressieve’- component
De autoregressieve component omvat de lags (vertragingen) van een bepaalde variabele. Een lag van
een variabele is de waarde die de variabele in één van de vorige periodes aannam. Als de variabele een
notatie yt heeft, dan worden de lags van de variabele geschreven als yt-1, yt-2, yt-3, enz. In
mathematische notatie wordt een AR(p)-proces als volgt weergegeven:
9 Additionele informatie over een ‘unit root’ kan gevonden worden in Brooks (2008), Hoofdstuk 7 deel 7.1.4.
10 In deze specificatie is xt-1 een lag van de variabele xt. Dit wordt verduidelijkt in deel 3.2.1.2 van dit hoofdstuk.
11 De verschiloperator is het gevolg van de volgende mutatie:
tt
ttt
ttttt
x
xx
xxxx
1
1
111
1
22
p
1i titi0
tptp2t21t10t
εyαα
εyα...yαyααy
(14)
De orde van een autoregressieve component wordt weergegeven door de notatie AR(p) met p zijnde
de orde, i.e. het aantal lags. Het is duidelijk af te lezen uit de formule van de AR component dat de
variabele yt afhangt van de eigen historische waarden en een storingsterm εt.
Een AR proces is dus een lineaire combinatie van historische waarden van de variabele in kwestie. De
storingsterm εt kan ook gezien worden als de schok die een reeks krijgt op het huidig moment. Deze
schok zal dan een zeker aantal periodes na-ijlen in het systeem, afhankelijk van het aantal AR-
componenten. Zet men deze schokken en hun na-ijlend effect op de tijdreeks uit tegenover de lags van
de variabele, dan bekomt men de zogenaamde impuls respons-functie. Deze geeft ons een beeld van
de dynamische impact van een schok op de tijdreeks.
De belangrijkheid van stationariteit werd al benadrukt in deel 2.5.1.1 (supra, p.20) en dit blijkt ook in
de toepassing van stationariteit in AR-processen. Er kunnen namelijk twee verschillende situaties
onderscheiden worden (Everaert, 2011):
Convergentie: Dit doet zich voor als 11 voor een AR(1)-proces. Een schok zal de
huidige waarde van de variabele beïnvloeden en zal ook een aantal periodes na-ijlen maar het
effect van de schok sterft uit naarmate de tijdsperiodes vorderen.
Non-convergentie: Dit doet zich voor als 11 voor een AR(1)-proces. Een schok zal een
blijvend effect hebben in de tijdreeks doordat het alle toekomstige observaties gaat
beïnvloeden. Alle toekomstige observaties ondervinden een gelijke impact in het geval dat
11 en een stijgende impact in het geval dat 11 . Dit soort tijdreeksen zal dan ook
nooit terugkeren naar een lange termijn gemiddelde waardoor het maken van voorspellingen
zo goed als onmogelijk wordt.
Dit onderscheid tussen convergentie en non-convergentie kan veralgemeend worden naar modellen
met meerdere lags. De nodige voorwaarde voor stationariteit is dan dat 11
p
i i , terwijl de
voldoende voorwaarde 11
p
i i is12
.
2.5.1.3 De ‘glijdend gemiddelde’-component De glijdend gemiddelde component van een ARMA-model is een lineaire combinatie van ‘white
noise’ storingstermen. Deze storingstermen kunnen gezien worden als schokken of impulsen aan de
tijdreeks die van buitenaf worden veroorzaakt. Bij wijze van voorbeeld kan er gezegd worden dat een
significante verandering in het macro-economisch systeem zijn invloed zal hebben op de koers van
12
Gezien uit het onderzoek in deel 4.4 blijkt dat het model dat het best bij de data past een AR(1) proces is, zijn
deze voorwaarden voor meerdere lags echter irrelevant.
23
een financieel product. Deze schok is echter extern aan de datareeks. De glijdend gemiddelde
component wordt voornamelijk verkort aangeduid door MA(q), wat de afkorting is voor het engelse
‘Moving Average’. In deze afkorting is q het aantal lags dat het MA model bevat. Een MA model
beschrijft de dynamische impact van deze schokken op de tijdreeks. Mathematisch wordt een MA(q)-
proces als volgt weergegeven (gebaseerd op Everaert (2011)):
tqtq2t21t10t εεβ...εβεββy
Een eindig MA(q)-proces is stationair uit zichzelf, dit zolang de gewogen som van de coëfficiënten
van de verschillende ‘white noise’ processen eindig is. Voor de mathematische formules achter deze
bijzondere eigenschap wordt verwezen naar Everaert (2011).
2.5.2 Conditionele heteroscedastische autoregressieve volatiliteitsmodellen (ARCH-modellen)
Heteroscedasticiteit in een tijdreeks zorgt ervoor dat ‘Ordinary Least Squares (OLS)’ als
schattingsmethode zwakke resultaten levert. Als een tijdreeks voldoet aan de Gauss-Markov
veronderstellingen13
, dan kan er gezegd worden dat een schatter ‘BLUE’ is, ‘Best Lineair Unbiased
Estimator’. In het geval van heteroscedasticiteit word er aan één van de 10 Gauss-Markov
veronderstellingen niet voldaan, namelijk de voorwaarde dat de storingstermen homoscedastisch
moeten zijn of anders gezegd, dat de variante van de storingstermen constant moet zijn. Symbolisch
wordt dit als volgt geschreven:
2 t σ)(εVar
In het geval van heteroscedasticiteit zal de variantie van de storingstermen tijdsafhankelijk zijn:
2 t t σ)(εVar
In deze formule wordt een tijdsafhankelijke variantie aangeduid door in subscript een “t” toe te
voegen. De storingstermen worden aangeduid met t (dit zijn willekeurige storingstermen als wijze
van voorbeeld).
Gezien de zwakke eigenschappen van OLS bij het werken met tijdreeksen die heteroscedastisch zijn,
werd er gezocht naar nieuwe modellen die deze eigenschap van de tijdreeks wel zouden kunnen
modelleren. In Engle (1982) werd een nieuw model, dat rekening houdt met heteroscedasticiteit in de
data, voor het eerst uitvoerig beschreven. Dit nieuw soort modellen draagt de naam ARCH-modellen.
ARCH is de afkorting voor het Engelse ‘AutoRegressive Conditional Heteroscedasticity’. In deze
paper door Engle (1982) wordt ook de economische relevantie onderzocht door middel van een
empirisch regressie met dit nieuw model op de inflatie van het Verenigd Koninkrijk. Hieruit blijkt dat
13
Zie Hoofdstuk 4 in Brooks (2008).
24
de ARCH effecten, het feit dat de variantie van de storingstermen tijdsafhankelijk is, in de data
significant zijn. Deze paper legde de basis voor een compleet nieuwe familie aan econometrische
modellen, namelijk de GARCH (‘General AutoRegressive Conditional Heteroscedastic’) en varianten
(infra, p.25). Deze familie van econometrische modellen wordt echter niet geschat met OLS maar met
de maximum likelihood methode. De coëfficiënten van het model worden gevonden door het
maximaliseren van de loglikelihood naar iedere coefficient. Dit maximaliseren gebeurt door de eerste
afgeleide van de loglikelihoodfunctie naar elke coefficient. Er zal hier niet verder op deze
schattingsmethode worden ingegaan. Een degelijke uiteenzetting van de ML methode en verdere
beschrijving hierover kan gevonden worden in Verbeek (2004) . Het is echter wel belangrijk om op te
merken dat er een assumptie moet gemaakt worden over de verdeling van de storingstermen. Dit is een
basisvoorwaarde voor het gebruik van de ML methode.
De hierop volgende uiteenzetting over de opbouw en eigenschappen van ARCH-modellen is voor een
groot deel gebaseerd op Everaert (2011). De heteroscedastische eigenschap van de variantie impliceert
dat de huidige variantie zal afhangen van de variantie in het verleden. Door deze afhankelijkheid van
het verleden, kan de variantie beschreven worden door middel van een autoregressief proces (supra, p
21). Deze tijdsafhankelijke variantie wordt ook wel de conditionele variantie genoemd omdat de
huidige variantie afhangt van de variantie in het verleden14
. De formulering van de variantie in een
autoregressief proces wordt ook wel de ‘variance equation’ genoemd (Brooks, 2008). Dit is het deel
van een volledig ARCH-model dat de variantie modelleert. Het tweede deel van een ARCH-model
bestaat uit een ‘mean equation’. Deze ‘mean equation’ heeft als afhankelijke variabele de returns,
waarvan men de ARCH effecten eruit wil halen en modelleren. Praktisch gezien wordt dit gedaan door
de variantie in de storingstermen uit de ‘Mean Equation (ME)’ te gebruiken in de ‘Variance Equation
(VE)’. De ME kan om het even welke vorm aannemen, wat niet het geval is voor de VE.
Mathematisch heeft een volledig ARCH-model (met de returns als afhankelijke variabele) de volgende
algemene functionele vorm (gebaseerd op Brooks (2008)):
t3t32t21t10t μ...xαxαxααR (15)
ttt σνμ tν ~ 0,1N
(16)
21t10
2t μββσ (17)
waarbij vergelijking 15 de ME voorstelt en vergelijking 17 de VE. In vergelijking 16 stelt νt, de
gestandaardiseerde storingstermen voor, en deze moeten voldoen aan de voorwaarde dat ze standaard
normaal verdeeld zijn. Dit zorgt ervoor dat de conditionele distributie van de storingstermen μt
normaal verdeeld zal zijn met gemiddelde nul en een variantie 2
t (Brooks, 2008):
14
Dit in tegenstelling tot de onconditionele variantie die meer gericht is op het lange termijn gedrag van de
tijdreeks.
25
t ~ 2,0 tN
Dit is echter de conditionele distributie, wat wil zeggen dat de storingstermen μt normaal verdeeld
zullen zijn, met gemiddelde nul en variantie 2
t , die afhankelijk is van de informatie die beschikbaar
is op het tijdstip t-1. Een extra voorwaarde is dat 2
t gekend moet zijn op tijdstip t-1.
De voorwaarde dat de verdeling van de gestandaardiseerde storingstermen moet voldoen aan een
standaard normale verdeling is slechts een assumptie. Deze assumptie is gemaakt zodanig dat we een
conditionele verdeling bekomen voor de storingstermen μt. Doordat we weten dat de storingstermen μt
normaal verdeeld zijn, zal ook Rt normaal verdeeld zijn. Deze gestelde assumptie is van belang voor
het gebruik van de ML methode voor eerder vernoemde redenen (supra, p. 24).
In het empirisch onderzoek is het echter wel van belang dat de assumptie, dat bovenstaande
gestaandardiseerde storingstermen normaal verdeeld zijn, wordt getest. Dit kan door middel van een
Jarque-Bera test op de gestandaardiseerde storingstermen, met als nulhypothese dat ze normaal
verdeeld zijn. Het is echter zo dat deze storingstermen in veel gevallen niet standaard normaal
verdeeld zijn. In dit geval levert de ML methode vertekende standaardfouten en dus ook verkeerde p-
waarden. De schatting van de coëfficiënten blijft echter nog steeds consistent.
Om dit probleem van inconsistente standaardfouten op te lossen wordt de Bollerslev-Wooldridge
variantie-covariantie matrix toegepast (Hoofdstuk 8 deel 8.9.2 in (Brooks, 2008)). Deze methode staat
ook gekend als Quasi Maximum Likelihood (QML). Door het gebruik van deze methode zijn de
standaardfouten robuust voor niet-normaliteit en dus consistent. Verdere informatie over de QML-
methode kan opnieuw gevonden worden in Verbeek (2004).
Het is van enig belang dat, alvorens ARCH-modellen worden toegepast op specifieke tijdreeksen, er
wordt getest op de aanwezigheid van ARCH-effecten in de data. Dit testen gebeurd door middel van
de ARCH LM-test. Deze test zal echter hier niet behandeld worden maar zal apart worden behandeld
in Hoofdstuk 4 deel 4.3.4. In deel 4.3.4 zal een eenvoudige autoregressief proces van de orde 1 (een
AR(1) model) vergeleken worden met een standaard GARCH(1,1)-model. De keuze om met een
GARCH-model te vergelijken en niet met ARCH-model is om de reden dat een GARCH-model
bepaalde voordelen heeft ten opzichte van ARCH-modellen.
2.5.3 Veralgemeende conditionele heteroscedastische autoregressieve volatiliteitmodellen (GARCH-modellen)
De eigenlijke modellen, waarmee in het empirisch onderzoek van deze scriptie zal gewerkt worden,
zijn GARCH-modellen en enkele variaties op dat model. Dit model werd voor het eerst geïntroduceerd
door Bollerslev (1986). De keuze om eerder met GARCH-modellen te werken in plaats van met
ARCH-modellen komt voort uit het feit dat ARCH-modellen belangrijke tekortkomingen en
26
beperkingen vertonen. Dit zorgt ervoor dat de ARCH-modellen in de praktijk weinig tot nooit worden
gebruikt. Zo wordt er in Brooks (2008) de volgende tekortkomingen/moeilijkheden opgesomd:
Hoe wordt de orde van het aantal lags van de gekwadrateerde storingstermen in de VE beslist?
De likelihood ratio test kan hiervoor een uitweg bieden, al is er geen aanpak die er duidelijk
als beste methode uitkomt.
De grootte van de orde van het aantal lags kan heel groot worden. Dit omdat het model in staat
moet zijn om alle afhankelijkheid in de conditionele variantie te kunnen vatten. Het resultaat
zou dan een heel grote VE zijn dat ingaat tegen het principe van de spaarzaamheid in de
econometrische praktijk.
Hoe meer lags er in de VE equation worden opgenomen, hoe groter de kans is dat de non-
negativiteit beperking op de coefficienten niet zal worden nageleefd.
GARCH-modellen komen aan deze specifieke tekortkomingen tegemoet door een extra term toe te
voegen in de VE zodat er al een heel groot deel van de variantie wordt opgevangen door deze term.
Deze term zorgt ervoor dat het overvloedig opnemen van extra lags van de gekwadrateerde
storingstermen overbodig wordt, dit wordt in deel 2.5.3.1 verder toegelicht.
In deel 2.5.3.1 wordt de standaardvorm van het GARCH-model uitgelegd en worden de voornaamste
eigenschappen besproken. Verder wordt er ook meegegeven welke deze extra term is in de VE en
worden de implicaties ervan besproken die er voor zorgen dat de belangrijkste tekortkomingen van het
ARCH-model worden weggewerkt. Deel 2.5.3.2 bespreekt twee voorname variaties op GARCH die in
de praktijk vaak worden gebruikt. Deze variaties worden ook gebruikt in het empirisch onderzoek van
deze scriptie. Daarom is dus een toelichting van de interpretatie van de coëfficiënten nodig. De twee
besproken modellen zijn GJR-GARCH en EGARCH. In principe doen ze het zelfde maar de
functionele vorm is compleet anders.
2.5.3.1 Standaard GARCH-model De uitbreiding van een ARCH-model in een GARCH-model zit hem in een extra term, nl. de lag van
de conditionele variantie. Dit zorgt ervoor dat de conditionele variantie van de huidige periode nu ook
afhankelijk is van de eigen lags. De lags van de gekwadrateerde storingstermen uit de ME blijft wel
behouden. Deze lag van de conditionele variantie is dan ook het enige verschil tussen ARCH- en
GARCH-modellen. Het heeft echter wel gunstige implicaties. Een GARCH-model wordt meestal
aangeduid met GARCH(p,q) met p de lag-orde van de gekwadrateerde storingstermen en q de lag-
orde van de conditionele variantie (Brooks, 2008). In deze masterproef zal er uitsluitend gewerkt
worden met een GARCH(1,1) model als basis. Dit model is spaarzaam en bovendien slaagt het er in
om de ARCH-effecten in een voldoende mate te vatten (bewezen in Bollerslev (1986)). Als gevolg is
het zo dat de GARCH(1,1) het meest gebruikt is in de literatuur omwille van zijn gunstige
27
eigenschappen. In Ashley & Patterson (2010) wordt bewezen dat deze specificatie niet kan verworpen
worden als geschikt model om het proces achter de dagelijkse returns te modelleren.
De uiteenzetting van het GARCH(1,1)-model die hieronder volgt is gebaseerd op Brooks (2008) en
Everaert (2011). Mathematisch wordt een GARCH(1,1)-model als volgt weergegeven:
t3t32t21t10t μ...xαxαxααR (18)
ttt σνμ tν ~ 0,1N
21t2
21t10
2t σβμββσ (19)
In deze formulering is 2
1t de lag voor periode t-1 van de conditionele variantie en is 2
1t de lag
voor periode t-1 van de gekwadrateerde storingstermen. Door de toevoeging van de lag van de
conditionele variantie is een GARCH-model in principe gelijk aan een ARCH(∞) met geometrisch
afnemende coëfficiënten. In appendix B wordt dit mathematisch verduidelijkt. Door deze speciale
eigenschap van GARCH-modellen, heeft het een aantal voordelen ten opzichte van ARCH-modellen
die tekortkomingen beperken (Brooks, 2008):
Er worden geen overvloedig aantal lags opgenomen in de VE. Er zijn dus bijgevolg minder
parameters nodig om al de ARCH-effecten uit de tijdreeks te halen. Dat maakt het GARCH-
model veel spaarzamer dan een ARCH-model.
Als gevolg van het opnemen van minder coëfficiënten is de kans kleiner dat de non-
negativiteit beperking niet nageleefd wordt.
Door deze gunstige eigenschappen wordt een GARCH-model verkozen boven een ARCH-model in de
literatuur. Ook in deze scriptie zal er gebruikt gemaakt worden van het GARCH(1,1)-model. Hoe de
analytische schatters precies zullen toegevoegd worden aan de GARCH(1,1)-specificatie en de
variaties hierop, wordt in deel 3.2 uitgewerkt (infra, p.30). In dit hoofdstuk is het slechts de bedoeling
om een basis te voorzien voor het werken met GARCH-modellen. Hier moet ook nog opgemerkt
worden dat de coëfficiënten in de specificatie in theorie niet negatief mogen zijn.
2.5.3.2 GARCH-variaties De belangrijkste twee modellen die zullen gebruikt worden zijn het GJR-GARCH-model en het
EGARCH-model. Deze modellen hebben een gemeenschappelijk element dat in beide de basis vormt
voor het model. Dit element is dat er rekening gehouden wordt met een asymmetrische respons van de
volatiliteit op negatieve en positieve schokken (Brooks, 2008). In algemene GARCH-modellen is het
zo dat er een symmetrische respons op positieve en negatieve schokken wordt opgelegd door het
model zelf. Dit komt doordat de conditionele variantie in de VE een functie is van de grootte van de
storingstermen en niet van het teken. Asymmetrie betekent dat een negatieve schok op een tijdreeks
zal leiden tot een grotere verandering in volatiliteit dan in het geval van een positieve schok. Deze
asymmetrie in respons van de volatiliteit wordt voornamelijk toegewezen aan het ‘leverage effect’. Dit
28
effect wordt veroorzaakt doordat een negatieve schok in de prijzen ervoor zorgt dat het kapitaal van
het bedrijf zal dalen. Dit heeft tevens als gevolg dat de schuld/kapitaal ratio gaat stijgen en dus
additioneel risico met zich meebrengt. Door dit extra risico is de toekomstige stroom van cash naar de
aandeelhouders minder verzekerd en dus relatief risicovoller. Hoewel dit enkel voor aandelen en
indexen uitvoerig beschreven werd, is er geen reden om aan te nemen dat dit soort asymmetrieën niet
bestaan voor andere financiële tijdreeksen. GJR-GARCH en EGARCH worden hieronder kort
besproken.
GJR-GARCH
Dit model is genoemd naar de auteurs die dit model geintroduceerd hebben, nl. Glosten, Jagannathan
en Runkle. In Glosten, Jagannathan & Runkle (1993) werd voor het eerst met deze assymetrie
gewerkt. Het GJR-GARCH-model is een eenvoudige extensie op het GARCH(1,1)-model. Deze
extensie bestaat uit het incorporeren van een extra term om de mogelijke asymmetrieën in rekening te
brengen. Een GJR-GARCH-model heeft de volgende functionele vorm (gebaseerd op Brooks (2008)):
t3t32t21t10t μ...xαxαxααR (20)
ttt σνμ tν ~ 0,1N
1t
21t
21t2
21t10
2t Iδμσβμββσ (21)
met 1I 1t als 0μ 1t
0I 1t als 0μ 1t
De ME en de assumpties over de gestandaardiseerde storingstermen blijven dezelfde als in het
algemeen GARCH-model. In de VE is er een extra term toegevoegd. Deze term bevat een dummy die
de waarde 1 aanneemt als de storingsterm van de ME negatief blijkt te zijn, zo wordt de impact van
negatieve schokken gemeten. Indien het ‘leverage-effect’ aanwezig is, dan zou δ groter moeten zijn
dan nul (δ>0). Dit zal zo zijn als de coëfficiënt δ in de regressie van vergelijking 21 significant zal
verschillen van nul.
In deze specificatie wordt non-negativiteit van de conditionele variantie verzekerd door 0, 10 ,
02 en 01 15. Zolang deze laatste term voldaan is, mag δ negatief zijn om nog steeds een
correct model te hebben (Brooks, 2008).
EGARCH
Het exponentieel GARCH-model werd voor het eerst geïntroduceerd door Nelson (1991). Dit model
zorgt er ook voor dat asymmetrie in rekening wordt gebracht maar doet dit op een heel andere manier
dan het GJR-GARCH-model. Zoals de naam doet vermoeden wordt er in de modelspecificatie gebruik
15
In de praktijk moeten deze beperkingen niet noodzakelijk worden nageleefd. Dit wordt in deel 5.2 verder
uitgelegd.
29
gemaakt van de natuurlijke logaritme. De specificatie van de VE in het EGARCH-model kan
verschillende vormen aannemen. De functionele vorm in deze scriptie is gebaseerd op diegene in
Brooks (2008):
t3t32t21t10t μ...xαxαxααR (20)
ttt σνμ t ~ 0,1N
π
2
σ
μβ
σ
μβσlnββσln
21t
1t3
21t
1t2
21t10
2t
(21)
De aanwezigheid van ‘leverage effects’ kan worden getest met de hypothese dat β2 <0. Er wordt
besloten dat er asymmetrie is als β2 significant verschilt van nul.
Het grote voordeel aan het gebruik van EGARCH is dat 2
1t altijd positief zal zijn doordat er gewerkt
wordt met de natuurlijke logaritme van 2
1t . Dit heeft tot gevolg dat de parameterschattingen negatief
mogen zijn (Brooks, 2008).
Het is zo dat in de originele paper van Nelson er verondersteld werd dat de storingstermen een
‘Generalised error’-verdeling volgen. In Eviews, het statistisch programma dat zal worden gebruikt,
wordt er een keuze aan verschillende verdelingen voor de storingstermen voorzien. Voor het gebruik
van EGARCH in het empirisch onderzoek wordt echter een normale verdeling voor de storingstermen
verondersteld. Dit heeft als gevolg dat de extra term 23 wordt afgetrokken van de specificatie
die werd voorgesteld door Nelson.
30
HOOFDSTUK 3
ONDERZOEKSMETHODIEK
3.1 INLEIDING In dit hoofdstuk wordt de methodiek besproken, die zal toegepast worden in het empirisch onderzoek.
In Hoofdstuk 2 deel 2.4 werden de analytische ‘range’ schatters geïdentificeerd uit de literatuur die
zullen worden toegepast in de specificaties van de GARCH-modellen. Deze GARCH-modellen en
variaties werden toegelicht in Hoofdstuk 2 deel 2.5.3.
Hoofdstuk 3 bouwt voort op de literatuurstudie door het combineren van zowel de analytische ‘range’
schatters als de GARCH-modellen in een onderzoek naar modellen die beter in staat zijn om de
volatiliteit te voorspellen dan bestaande methodes. In deel 3.2 wordt de onderzoeksopzet besproken.
Hier wordt het onderzoek opgedeeld in drie delen vermits er in elk deel een andere focus is met
betrekking tot wat er onderzocht wordt. Binnen elk deel zullen de specifieke modelspecificaties
worden weergegeven. Dit zijn de GARCH-modellen met toevoeging van een extra parameter. Verder
wordt er ook per deel één of meerdere algemene hypotheses opgesteld die de verwachting over de
uitkomst van het onderzoek weergeeft. In deel 3.3 wordt een algemeen overzicht gegeven van de
onderzoeksmethodiek van het begin tot het einde. Dit is bedoeld om duidelijkheid te creëren in
verband met het onderzoek. Tevens wordt aangegeven waar de verschillende hoofdstukken en delen
van deze scriptie passen in het onderzoek en de onderzoeksmethodiek. In het laatste deel 3.4 wordt de
methodiek voor het vergelijken van de modellen uitgelegd. Het vergelijken van modellen zal in dit
hoofdstuk op basis van drie indicatoren gebeuren, namelijk de significantie van de coëfficiënten van
de toegevoegde parameters, de statistieken gebaseerd op de voorspellingsfouten voor het vergelijken
van de voorspellende kracht van ieder model en aanvullende regressies van de externe ‘baseline’-
volatiliteit op de voorspelde waarden.
3.2 ONDERZOEKSOPZET De hoofddoelstelling van deze studie is het combineren van zowel de analytische methoden met de
econometrische modellen om zo betere voorspellingen van de volatiliteit te bekomen. In dit hoofdstuk
is het de bedoeling om al een overzicht te geven van welke modellen er zullen worden gebruikt en
welke algemene hypothesen er zullen getest worden. Deze hypothesen geven de verwachtingen in
verband met de uitkomst van het onderzoek weer. Het onderzoek bestaat grofweg uit drie delen:
1. De overdraagbaarheidstudie: Dit deel van het onderzoek focust zich vooral op een
onderzoek dat uitgevoerd werd door Wang & Roberts (2004) en breidt deze studie verder
uit naar meerdere modelcombinaties. Het grote verschil is dat in deze scriptie de ‘log
31
range’ ook zal worden gebruikt naast de reeds gebruikte ‘daily range’ in de vernoemde
paper. Een combinatie van de twee rangeschatters zal ook getest worden.
2. Het hoofdonderzoek: Dit is een onderzoek naar het potentieel van GARCH-modellen,
aangevuld met de zelf geïdentificeerde analytische ‘range’ schatters uit de literatuurstudie
in Hoofdstuk 2 deel 2.4, om betere voorspellingen voor de volatiliteit te leveren. Deze
analytische ‘range’ schatters zijn reeds beproefd in de literatuur maar er is nog geen
toepassing van gebeurd in GARCH-modellen. Dit is wat in deze studie zal onderzocht
worden. In dit deel zal er ook een model geschat worden die de combinatie van alle
modellen gebruikt.
3. Een onderzoek naar volatiliteit in verschillende tijdsperioden binnen de dataset.
Vervolgens wordt er in de hierop volgende subhoofdstukken wat meer in detail ingegaan op de
verschillende delen van het onderzoek. Hierin worden de verschillende hypothesen per deel
besproken. Welke specifieke modellen en “range” schatters er precies zullen gebruikt worden per deel
van het onderzoek wordt ook aangegeven. De bedoeling van dit hoofdstuk is dan ook algemeen aan te
geven wat er zal getest worden.
3.2.1 Overdraagbaarheidstudie
3.2.1.1 Hypothesestelling Het eerste deel van het onderzoek richt zich vooral op een replicatie en uitbreiding van het onderzoek
dat uitgevoerd is door Wang & Roberts (2004). In dit onderzoek door Wang & Roberts test men of
GARCH-modellen aangevuld met “range” schatters in staat zijn om betere voorspellingen van de
volatiliteit te leveren dan de traditionele GARCH-modellen. Dit onderzoek wordt echter uitgevoerd op
sojabonen futures in plaats van op de BEL 20 returns. Wang en Roberts stelden een GARCH-model
voor met de incorporatie van de dagelijkse range van de returns (supra, p.11) in de VE van het model.
Hun bevindingen waren dat dit model betere voorspellingen leverde voor de volatiliteit dan een
standaard GARCH-model.
De volatiliteit op de sojabonen futures markt en deze op van de BEL 20-returns worden beiden
gekenmerkt door volatiliteitsclustering. Volatiliteitsclustering is het fenomeen waarbij periodes met
hoge volatiliteit gevolgd worden door periodes met hoge volatiliteit en omgekeerd periodes met lage
volatiliteit gevolgd worden door periodes met lage volatiliteit (Brooks, 2008). Aangezien dit
kenmerkend is voor financiële data, en deze dynamiek ook wordt gemeten door GARCH-modellen (en
varianten), belooft een replicatie en uitbreiding van deze studie op andere financiële data, in deze
studie de BEL 20 returns, ook gunstige resultaten te leveren. Dit brengt ons tot de volgende
hypothesestelling:
32
Hypothese A: Een GARCH-model (of variant) aangevuld met een
“range” schatters zoals gedefinieerd in Wang & Roberts
(2004) levert betere voorspellingen voor de volatiliteit dan
een GARCH-model (of variant) zonder uitbreiding met
additionele informatie. Deze ‘range’ schatters (in de
formules aangegeven als St) zijn DRt en LRt en werden
gedefinieerd in Hoofdstuk 2 deel 2.4.1.
Uit de hypothesestelling kunnen we duidelijk afleiden dat een eenvoudig GARCH-model als
benchmark-model zal worden gebruikt in dit deel van het onderzoek. Het is van belang om deze
hypothese te verifiëren a priori aan het hoofdonderzoek omdat het zal bepalen welk model er als
benchmark zal worden gebruikt in het hoofdonderzoek. Hypothese A is zodanig gedefinieerd dat
hetgeen we verwachten te vinden als resultaat uit ons onderzoek als nulhypothese geldt. In dit deel van
het onderzoek verwacht men dus dat er betere resultaten zullen volgen door het gebruik van een
GARCH-model met ‘range’ schatters. Het principe van de verwachtingen te definiëren als
nulhypothese wordt toegepast op alle hypothesen die in deze thesis worden opgesteld. De periode
waarin deze modellen zullen geschat worden loopt van 15/07/1992 tot en met 1/01/2004 en de
voorspellingsperiode loopt van 2/01/2004 tot en met 11/10/2010.
3.2.1.2 Modelspecificaties In dit deel worden de specificaties van de modellen (GARCH, GJR-GARCH en EGARCH)
voorgesteld die zullen worden gebruikt in deel 1 van het onderzoek. De output uit Eviews is gebaseerd
op de specificatie van deze modellen. Bijgevolg komen de coëfficiënten van de parameters in de
outputtabellen overeen met de coëfficiënten in de specificaties die hieronder worden geformuleerd. De
ME wordt pas in Hoofdstuk 4 deel 4.4 (infra, p.56) exact gespecificeerd als de data worden besproken.
Deze ME zal dan dezelfde zijn voor alle modellen die geschat zullen worden.
Het doel van deze modelspecificaties is dat ze zullen gebruikt worden om voorspellingen voor de
volatiliteit te maken die dan zullen vergeleken worden met een externe ‘baseline’-volatiliteit. Deze
modellen en hun resultaten voor de volatiliteitvoorspelling zijn eveneens een basis voor vergelijking
voor de modellen die in deel 2 van het onderzoek zullen worden gebruikt (het hoofdonderzoek). De
modellen worden in alle delen van het onderzoek toegepast op de BEL 20-indexreturns. Deze returns
zullen worden gebruikt in de ME van de modellen.
GARCH met ‘range’ schatter
De specificatie voor het GARCH-model in dit deel is gebaseerd op het basismodel van GARCH (zoals
in Brooks (2008)), dat in Hoofdstuk 2 werd besproken, met toevoeging van een ‘range’ schatter. De
formulering is de volgende:
33
t3t32t21t10t μ...RαRαRααR
ttt σνμ tν ~ 0,1N
1t1
21t2
21t10
2t Sγσβμββσ
Hierin is St-1 ofwel de schatter DRt-1 ofwel de schatter LRt-1. Belangrijk is dat er gewerkt wordt met de
lag van de schatters. Voor het model waarin een combinatie van beide schatters wordt gebruikt, zal de
VE ceteris paribus de volgende specificatie hebben:
1t21t12
1t22
1t102t LRγDRγσβμββσ
GJR-GARCH met ‘range’ schatter
De specificatie voor het GJR-GARCH-model is gebaseerd op de specificatie zoals beschreven in
Hoofdstuk 2 en in Brooks (2008) , maar dan met toevoeging van ‘range’ schatters. De formulering van
het model voor dit deel is als volgt:
t3t32t21t10t μ...RαRαRααR
ttt σνμ tν ~ 0,1N
1t12
1t31t 2
1t22
1t102t SγσβIμβμββσ
met 1I 1t als 0μ 1t
0I 1t als 0μ 1t
Hierin is St-1 opnieuw ofwel de schatter DRt-1 ofwel de schatter LRt-1.De specificatie van het de VE zal
de volgende zijn, ceteris paribus:
1t21t12
1t31t 2
1t22
1t102t LRγDRγσβIμβμββσ
EGARCH met ‘range’ schatter
Voor het EGARCH-model is de specificatie opnieuw gebaseerd op wat er in Hoofdstuk 2 en Brooks
(2008) werd beschreven, maar met toevoeging van ‘range’ schatters. De specificatie voor het
EGARCH-model in deel 1 is de volgende:
t3t32t21t10t μ...RαRαRααR
ttt σνμ tν ~ 0,1N
1t12
1t32
1t
1t2
21t
1t10
2t Sγσlnβ
σ
μβ
π
2
σ
μββσln
Hierin is St-1 opnieuw ofwel de schatter DRt-1 ofwel de schatter LRt-1.De specificatie van het de VE zal
de volgende zijn, ceteris paribus:
1t21t12
1t32
1t
1t2
21t
1t10
2t LRγDRγσlnβ
σ
μβ
π
2
σ
μββσln
34
3.2.2 Hoofdonderzoek
3.2.2.1 Hypothesestelling Deel 2 van het onderzoek richt zich op het verkennen van de integratie van de geïdentificeerde
analytische ‘range’ schatters uit de literatuurstudie van Hoofdstuk 2 deel 2.4.2 tot en met deel 2.4.5.
Zoals reeds gezegd werd de basis van dit nieuw soort GARCH-modellen gelegd door Wang & Roberts
(2004). In deze studie wordt er verder onderzoek gedaan naar de toepassingen van analytische
schatters met gunstiger eigenschappen dan de ‘range’ schatter die gebruikt werd in de paper van Wang
& Roberts (2004). De hoofdgedachte achter het verloop van dit onderzoek is de verschillende
analytische schatters, die geïdentificeerd werden in de literatuur te integreren in een GARCH-model
en de belangrijkste varianten van het GARCH-model, namelijk het GJR-GARCH-model en het
EGARCH-model. In Hoofdstuk 2 werden de schatters geïdentificeerd die zullen worden gebruikt in
het onderzoek met als bedoeling ze te rangschikken op basis van efficiëntie en gunstige
eigenschappen. De modellen die in deel 1 van het onderzoek worden gebruikt, vormen een basis voor
vergelijking met de modellen die in dit deel van het onderzoek worden gebruikt. De volgende
algemene hypothesen voor deel 2 kunnen als volgt worden geformuleerd:
Hypothese B.1: Een GARCH-model met integratie van
analytische schatter x (met x = 1, 2, 3,… ) levert betere
voorspellingen dan een standaard GARCH-model met/zonder DRt-1
en/of LRt-1.
Hypothese B.2: Indien er rekening gehouden wordt met een
periode waarin het verhandelen gesloten is in een schatter
dan zou dit betere voorspellingen voor de volatiliteit
moeten leveren.
Hypothese B.1 stelt dat GARCH-modellen met de analytische schatters betere resultaten zal leveren
dan de modellen die in deel 1 werden geschat. Hypothese B.2 stelt dan weer dat als er rekening
gehouden wordt met de periode waarin het verhandelen gesloten is in de analytische schatter, dit
betere resultaten levert op vlak van volatiliteitvoorspelling. Uit Hoofdstuk 2 deel 2.4 is het geweten
dat voor hypothese B.2 er een vergelijking kan worden gemaakt tussen modellen met enerzijds 20 en
21 anderzijds. Er zal ook een vergelijking worden gemaakt tussen modellen met schatter 2
2 en 23 ,
evenals een vergelijking tussen modellen met 24 en 2
6 . In de schatters 21 , 2
3 en 26 werd telkens
35
een extra term voor de periode, waarin verhandeling gesloten is, opgenomen tegenover respectievelijk
de schatters 20 , 2
2 en 24 .
De verschillende modellen zullen op basis van een aantal indicatoren worden vergeleken, deze
indicatoren worden in Hoofdstuk 3 deel 3.4.2 besproken. De belangrijkste en tevens ook de
voornaamste indicator gezien het onderwerp van deze thesis blijft de voorspelling van de volatiliteit.
Dit onderzoek zal in het beste geval als uitkomst een schatter leveren, die zich superieur aan de andere
schatters zal vertonen.
3.2.2.2 Modelspecificaties De modelspecificaties voor het tweede deel van het onderzoek worden hier voorgesteld. Zoals reeds
vermeld, zal de output uit Eviews gebaseerd zijn op de specificatie van deze modellen. Bijgevolg
zullen de coëfficiënten van de parameters in de outputtabellen overeen komen met de coëfficiënten in
de specificaties die hieronder worden geformuleerd. Hier blijft opnieuw de ME dezelfde voor alle
modellen. De ME zal worden bepaald in Hoofdstuk 4 deel 4.4 (infra, p.56).
Het is hier opnieuw het doel om met deze modelspecificaties voorspellingen voor de volatiliteit te
produceren, die zullen vergeleken worden met een externe ‘baseline’-volatiliteit. Deze modellen in dit
deel van het onderzoek worden dan vergelijken met de modellen in deel 1 van het onderzoek op vlak
van volatiliteitvoorspelling. De modellen in dit deel worden eveneens toegepast op de BEL 20-
indexreturns. Deze returns zullen worden gebruikt in de ME.
GARCH met analytische schatter
De basisvorm voor het GARCH-model is opnieuw dezelfde als in deel 1 van het onderzoek met
dezelfde bron. De specificatie voor het GARCH-model met analytische schatter is de volgende:
t3t32t21t10t μ...RαRαRααR
tσνμ tt tν ~ 0,1N
21tx,1
21t2
21t10
2t σγσβμββσ ˆ
Hierin stelt 2
1,ˆ tx de extra parameter (analytische schatter) voor ten opzichte van St-1 die in deel 1 van
het onderzoek. Deze extra parameter is een schatter die geïdentificeerd werd in de Hoofdstuk 2. Het is
opnieuw belangrijk dat er gewerkt wordt met de lag van de schatters. In 2
1,ˆ tx is x dus een getal
tussen nul en zeven afhankelijk van welke schatter er wordt gebruikt.
Bij het schatten van het model met een combinatie van alle schatters, wordt er met de volgende
specificatie voor de VE gewerkt, veronderstellend dat de ME gelijk blijft:
21t7,8
21t6,7
21t5,6
21t4,5
21t3,4
21t2,3
21t1,2
21t0,1
21t2
21t10
2t
σγσγσγσγσγσγσγσγ
σβμββσ
ˆˆˆˆˆˆˆˆ
36
GJR-GARCH met analytische schatter
De basisvorm voor het GJR-GARCH-model is opnieuw dezelfde als in deel 1 van het onderzoek met
dezelfde bron. De specificatie voor het GJR-GARCH-model met analytische schatter is de volgende:
t3t32t21t10t μ...RαRαRααR
ttt σνμ tν ~ 0,1N
21tx,1
21t31t
21t2
21t10
2t σγσβIμβμββσ ˆ
met 1I 1t als 0μ 1t
0I 1t als 0μ 1t
Hierin stelt 2
1,ˆ tx opnieuw de analytische schatter voor met x die een waarde van 1 tot 7 kan
aannemen afhankelijk van welke schatter er wordt gebruikt.
Bij het schatten van het model met een combinatie van alle schatters in GJR-GARCH, wordt er met de
volgende specificatie voor de VE gewerkt, opnieuw veronderstellend dat de ME gelijk blijft:
21t7,8
21t6,7
21t5,6
21t4,5
21t3,4
21t2,3
21t1,2
21t0,1
21t31t
21t2
21t10
2t
σγσγσγσγσγσγσγσγ
σβIμβμββσ
ˆˆˆˆˆˆˆˆ
EGARCH met analytische schatter
De basisvorm voor het EGARCH-model is opnieuw dezelfde als in deel 1 met dezelfde bron. De
specificatie voor het EGARCH-model met analytische schatter is de volgende:
t3t32t21t10t μ...RαRαRααR
ttt σνμ tν ~ 0,1N
21tx,1
21t3
21t
1t2
21t
1t10
2t σγσlnβ
σ
μβ
π
2
σ
μββσln
ˆ
21,ˆ tx is opnieuw de analytische schatter met x die een waarde van 1 tot 7 kan aannemen afhankelijk
van welke schatter er wordt gebruikt. In de EGARCH-specificatie is het belangrijk om op te merken
dat er geen natuurlijke logaritme genomen wordt van de analytische schatter. In het model die de
combinatie gebruikt van alle schatters zal de specificatie van de VE de volgende zijn, met een ME die
gelijk blijft:
21t7,8
21t6,7
21t5,6
21t4,5
21t3,4
21t2,3
21t1,2
21t0,1
21t
1t3
21t
1t2
21t10
2t
σγσγσγσγσγσγσγσγ
π
2
σ
μβ
σ
μβσlnββσln
ˆˆˆˆˆˆˆˆ
37
3.2.3 Volatiliteitsonderzoek in verschillende tijdsperiodes
3.2.3.1 Hypothesestelling
In deel 1 en deel 2 van het onderzoek wordt er algemeen gekeken of er een model is dat het best
presteert op vlak van volatiliteitsvoorspelling. In deel 3 is het de bedoeling om de verschillende
methodes toe te passen op specifieke tijdsperiodes. De motivatie voor dit deel komt voort uit de vraag
of de prestatie van de modellen hetzelfde blijft als men gaat testen op verschillende tijdsperiodes met
andere kenmerken.
Welke tijdsperioden er bestudeerd worden, hangt voornamelijk af van de dataset. Het belangrijkste is
dat we periodes testen die een grote impact hebben gehad op het financiële systeem. De interessantste
periodes om te bestuderen zijn die periodes die gekenmerkt worden door een ‘bull market’ of een
‘bear market’. Een ‘bull market’ is de veelgebruikte Engelstalige term voor een stijgende markt en een
‘bear market’ is een veelgebruikte Engelstalige uitdrukking voor een dalende markt. Stel dat er
bijvoorbeeld een specifiek model er als beste model uitkomt voor een ‘bull’-markt, dan zou het ‘best
practice’ zijn om dit model toe te passen voor voorspellingen in het heden indien de huidige staat van
de markt ook ‘bull’ is. Hetzelfde geldt in het geval van een ‘bear’ markt. Er kan de volgende
hypothese opgesteld worden:
Hypothese C.1: De status van een bepaald periode waarin de
markt zich bevindt, heeft een invloed op welk model het best
presteert. Met status van de markt wordt een “bull” markt of
een “bear” markt bedoeld.
Hypothese C.2: Indien er rekening gehouden wordt met een
periode waarin het verhandelen gesloten is in een schatter,
dan zou dit betere voorspellingen voor de volatiliteit
moeten leveren naargelang de periode waarin de markt zich
bevindt.
Hypothese C.1 onderzoekt of dezelfde technieken die toegepast werden in deel 2 van het onderzoek
dezelfde resultaten leveren als er getest wordt op specifieke periodes. Alternatief geformuleerd wordt
er dus onderzocht of het model dat in deel 2 als beste model uitkwam, ook nog als beste model wordt
gevonden als men gaat testen op een bepaalde tijdsperiode rekening houdend met de speciale staat
waarin de markt zich bevindt. Er wordt ook een hypothese C.2 opgesteld om opnieuw het effect van
een extra term na te gaan zoals in deel 2 van het onderzoek. De modellen met analytische schatter die
tegenover elkaar worden vergeleken, blijven in dit deel dezelfde als in deel 2.
38
Welke periodes en de preciese begin- en einddatum van de verschillende periodes, is afhankelijk van
de data. De data en de identificatie van deze tijdsperiodes in de data zal worden gedaan in Hoofdstuk 4
(infra, p.49), rekening houdend met de sample van de ‘baseline’-volatiliteit. Deze ‘baseline’-
volatiliteit vormt de basis voor het berekenen van de RSME, de MAE en de MAPE en andere
beoordelingsmethoden. Verdere uitleg over deze basisvolatiliteit wordt verschaft in hoofdstuk 4.5.
3.2.3.2 Modelspecificaties
In dit deel van het onderzoek verandert er fundamenteel niets aan de modelspecificaties. Het enige dat
er zal verschillen is de periode waarover er zal geschat worden en de periode waarin de voorspellingen
zullen gemaakt worden. In de output zal altijd eerst de resultaten van de GARCH-modellen met
toevoeging van daily range en log range worden weergegeven zoals in het eerste deel van het
onderzoek. Ook worden de tabellen met de modellen die de zelfgeïdentificeerde ‘range’ schatters
bevatten weergegeven. De specificaties van deze modellen zijn dezelfde als in deel 2 van het
onderzoek.
3.3 OVERZICHT METHODOLOGIE In figuur 5 wordt een overzicht gegeven van de methodologie die zal worden toegepast in het
onderzoek. Het is eveneens een overzicht van hoe de verschillende hoofdstukken en subhoofdstukken
in deze scriptie in het grote geheel van het onderzoek passen.
Er wordt vertrokken van de basisdata, deze data zijn afkomstig van de databank ‘Datastream’. De data
die werd geselecteerd zijn de sluitings-, openings-, minimum- en maximumprijzen van de BEL 20
index. Dit zijn dagelijkse prijzen. Ook werd de BEL 20-volatiliteitindex afgehaald omdat die zal
dienen als ‘baseline’-volatiliteit (BV) (infra, p.58). Op basis van de sluitingsprijzen worden de
logaritmische returns berekend. De ‘range’ schatters worden berekend op basis van de sluitings-,
openings-, minimum- en maximumprijzen. Dit geldt zowel voor de ‘range’ schatters van Wang &
Roberts (2004) als voor de geïdentificeerde analytische ‘range’ schatters uit de literatuur. De returns
zijn dan bijgevolg de input voor de ‘mean equation’ van het GARCH-model (en varianten). De ‘range’
schatters worden toegevoegd aan de ‘variance equation’ van het GARCH-model (en varianten).
Het onderzoek is opgesplitst in drie delen. De subhoofdstukken waarin de hypothesen en de modellen
voor elk deel kunnen worden teruggevonden, worden weergegeven in figuur 5. Ook de
schattingsperiode en de voorspellingsperiode worden weergegeven in het kader met als titel
‘Periodes’. Er kan ook opgemerkt worden dat de ‘range’ schatters die worden omringd door een kader
thuishoren bij het onderzoeksdeel waarvan het woord ‘modellen (#.#.#.#)’ respectievelijk in de kleur
staat van het kader die de schatters omringd. Uit deze modellen worden dan voorspellingen bekomen.
Voor de RMSE, de MAE en de MAPE te bekomen, moet eerst en vooral de voorspellingsfout
berekend worden. Dit is het verschil tussen de BV en de voorspelde waarden. De correlatiecoëfficiënt
39
en de aanvullende regressies hebben als input zowel de voorspellingen als de BV. Op basis van deze
beoordelingsmethoden worden de verschillende modellen dan met elkaar vergeleken om te bepalen
welk model de beste voorspellingen kan produceren.
In het kader linksboven kunnen de subhoofdstukken gevonden worden die de verschillende aspecten
van de returns en de ‘range’ schatters behandelen. Voor de returns wordt er een omschrijving gegeven
wat de BEL 20-index is en worden de eigenschappen van de logaritmische returns van deze index
besproken. Er wordt eveneens een test op stationariteit van de returns gedaan. Er wordt ook een
ARCH-LM-test gedaan om te verzekeren dat de clusteringeigenschap van de volatiliteit kan
gemodelleerd worden door GARCH-modellen (en varianten). Tevens wordt deze test ook gedaan om
aan te tonen dat ARCH-effecten in de returns niet kunnen gevat worden door een eenvoudig AR-
model. De ‘mean equation’ op basis van de returns wordt ook geïdentificeerd. Deze ME blijft dezelfde
voor alle modellen. Voor de ‘range’ schatters worden de formules weergegeven in Hoofdstuk 2 en
worden de eigenschappen besproken in Hoofdstuk 4.
Het kader rechtsonder op figuur 5 behandelt de transformaties van data. Zo is er voor de
voorspellingsoutput van de modellen uit Eviews een transformatie nodig om voorspellingen te
bekomen die kunnen vergeleken worden met de BV16
. en de ruwe output van de modellen uit Eviews
is een dagelijkse variantie. De tweede transformatie is het gebruik van de verschillende formules voor
het berekenen van de RMSE, de MAE en de MAPE op basis van de voorspellingsfout.
16
Meer informatie hierover in Hoofdstuk 5
40
Figuur 5: Overzicht Methodologie (bron: eigen werk)
Periodes:
Modellen:Onderzoek deel 1(3.2.1):• Hypothesen (3.2.1.1)•Modellen (3.2.1.2)
Onderzoek deel 2(3.2.2):• Hypothesen (3.2.2.1)•Modellen (3.2.2.2)
Onderzoek deel 3(3.2.3):• Hypothesen (3.2.3.1)•Modellen (3.2.3.1)
Basisdata (bron: Datastream):• Sluitingsprijzen•Openingsprijzen•Maximumprijzen•Minimumprijzen
DagelijksePrijzen BEL 20-index
BEL 20-volatiliteitsindex (4.5)
Data als input voor de modellen:
1) Returns*2) ‘Range’ schatters
DRt en LRt**E0 → E7***
GARCHGJR-GARCHEGARCH
DRt
LRt
E0
E1
E2
E3
E4
E5
E6
E7
ME
VE
Voorspellingen voor de volatiliteit ( )
BEL 20-volatiliteitsindex ( )
* Omschrijving (4.2)Eigenschappen (4.3):• Stationariteit in de returns (4.3.1)• ARCH-LM test (4.3.2): is een GARCH-model een goed model voor de returns
Identificatie ME (4.4)** Formules (Hoofdstuk 2 literatuurstudie: deel 2.4.1)
Eigenschappen (4.6)*** Formules (Hoofdstuk 2 literatuurstudie: deel 2.4.2, 2.4.3, 2.4.4, 2.4.5)
Eigenschappen (4.7)
Beoordelingsmethoden (3.4):• RMSE•MAE•MAPE• Correlatie & • Regressie:
Voorspellingsfout:
(3.4.2)
tftrv 2
10
2
,ˆ
Transformaties:I. Output: Dagelijkse Variantie (DV)
√(DV) = Dagelijkse Standaard Deviatie (DSD) DSD*√(252)= ‘Annualized’ volatiliteit
II. Formules:• RMSE (3.4.2.2)• MAE (3.4.2.2)• MAPE (3.4.2.2)
Onderzoek deel 3 ‘bull’markt:
• Schattingsperiode15/07/1992-13/03/2003
• Voorspellingsperiode14/03/2003-04/06/2007
Onderzoek deel 3 ‘bear’markt:
• Schattingsperiode15/07/1992-04/06/2007
• Voorspellingsperiode05/06/2007-10/11/2010
Onderzoek deel 1 & 2:
• Schattingsperiode15/07/1992-01/01/2004
• Voorspellingsperiode02/01/2004-09/03/2012
II
I
41
3.4 BEOORDELINGSMETHODEN Nu de essentie van deze studie en wat er precies zal onderzocht worden, duidelijk geworden is, is het
in dit laatste deel van het onderzoeksopzet de bedoeling om beoordelingsmethoden op te stellen.
Beoordelingsmethoden zijn van essentieel belang als men verschillende modellen met elkaar wil
vergelijken. Dit vergelijken aan de hand van bepaalde methodes zal tevens gebruikt worden om
hypothesen te aanvaarden of hypothesen te weerleggen. Aangezien dit onderzoek bestaat uit drie delen
waarin telkens iets anders wordt onderzocht, lijkt het dan ook een goede manier van werken door een
beoordelingsmethode toe te passen die in alle drie de onderdelen van het onderzoek toepasbaar is. Dit
zal tegelijkertijd ook het onderzoek eenduidiger maken doordat alle voorgestelde modellen met
eenzelfde maatstaf zullen worden beoordeeld.
3.4.1 Significantie en infocriteria
Een eerste indicatie om te zien of een geschat model juist gespecifieerd is, kan worden gegeven door
de significantie van de coëfficiënten te controleren. De hypothesen bij het controleren van de
significantie zijn:
H0: De coëfficiënt is niet significant verschillend van nul.
H1: De coëfficiënt is significant verschillend van nul.
De nulhypothese kan verworpen worden op 1%, 5% of 10% niveau van significantie. In de output zal
er op basis van de p-waarde gecontroleerd worden of een coëfficiënt significant is of niet. Een
coëfficiënt is significant op 5% niveau van significantie als de p-waarde van een coëfficiënt kleiner of
gelijk is aan 0,05. Op eenzelfde manier wordt er op 10% en 1% niveau van significantie over de
coëfficiënten geoordeeld. In de bijlagen kan de output van alle delen van het onderzoek gevonden
worden. De significantie van de coëfficiënten wordt in de output aangeduid door sterretjes. 1 ster, 2
sterren en 3 sterren komen overeen met een niveau van significantie van respectievelijk 10%, 5% en
1%.
Een tweede objectieve methode, om verschillende modellen te vergelijken, is het gebruik van
infocriteria. Deze infocriteria komen voort uit het principe van spaarzaamheid. Dit principe houdt in
dat een model goed bij de data aansluit zonder dat er onnodige coëfficiënten worden opgenomen in het
model. Deze onnodige coëfficiënten kunnen misschien wel extra informatie toevoegen aan het model
maar de keerzijde is dat het aantal vrijheidsgraden daalt als gevolg van het toevoegen van meer
variabelen. Er zijn twee belangrijke infocriteria die vaak worden gebruikt en die ook standaard in de
output van het statistisch programma Eviews wordt meegegeven. Deze infocriteria zijn het Akaike
informatie criterium en het Schwartz-Bayesian criterium. Mathematisch gezien, zien deze criteria er
als volgt uit:
42
Akaike informatie criterium (AIC):
kRSSTAIC 2)ln(
Schwartz-Bayesian criterium (SBC):
)ln()ln( TkRSSTSBC
Met 1 qpk het aantal geschatte parameters. Deze formules en bijhorende uitleg, die hierop
volgt, zijn gebaseerd op Hoofdstuk 1 in Everaert (2011). Alternatief kan er gezegd worden dat de
infocriteria een afweging maken tussen de ‘goodness-of-fit’ van een model en het aantal variabelen die
werden gebruikt voor het bekomen van deze ‘goodness-of-fit’ van het model.
Bij het gebruik van deze infocriteria voor het vergelijken van verschillende modellen moeten er 2
dingen worden opgemerkt. Vooreerst moet er gezegd worden dat als er een correcte vergelijking van
de modellen gewenst is, het aantal observaties T gelijk moet zijn in alle modellen. Bij het modelleren
van tijdreeksen kan het zo zijn dat er een bepaald aantal observaties verloren gaan door het gebruik
van lags in de regressievergelijking. Het verlagen van het aantal observaties heeft zijn direct effect op
de grote van de infocriteria, hoewel dit effect kleiner zal zijn bij grote datasets zoals hier gebruikt. Een
tweede belangrijk punt is dat de SBC een strengere fout hanteert voor het verlies van vrijheidsgraden.
Het grootste verschil tussen de twee criteria op vlak van prestatievermogen is dat SBC consistent is,
het levert namelijk asymptotisch gezien het correcte model. AIC daarentegen heeft de neiging tot het
selecteren van een model dat over-geparametriseerd is. Het wordt dus aangeraden om de SBC toe te
passen op grote samples. Gezien onze dataset redelijk veel observaties bevat (infra, p.49) zal er
uitsluitend gebruikt worden gemaakt van de SBC als vergelijkend criterium. In de output van de
modellen, die in de appendix kan gevonden worden, wordt de AIC louter informatief bijgevoegd.
3.4.2 Voorspellingsbeoordeling
3.4.2.1 Voorspellingsmethodologie De hypothesen in Hoofdstuk 3 deel 3.2 zijn zodanig gedefinieerd dat modellen vergeleken worden op
basis van hun vermogen om volatiliteit te voorspellen in de toekomst. Vooraleer er besproken wordt
wat de verschillende methoden zijn om voorspellingen te beoordelen, moeten eerst een paar praktische
zaken in verband met het maken van voorspellingen worden toegelicht. Ten eerste moet er een
onderscheid gemaakt worden tussen 2 soorten voorspellingen met betrekking tot het schatten van de
coëfficiënten van een model, deze uitleg is gebaseerd op Hoofdstuk 1 uit Everaert (2011):
In-sample voorspelling: De coëfficiënten van het model dat men zal gebruiken voor het
voorspellen van toekomstige waarden van de volatiliteit, worden bekomen door de volledige
dataset (of een volledige periode) te gebruiken. Op figuur 6 kan men duidelijk zien dat men
als schattingsperiode [t0;t(x+y)] gaat gebruiken. Het model met bekomen coëfficiënten wordt
dan gebruikt om voorspellingen te maken voor een bepaalde periode die binnen de volledige
43
periode valt, die gebruikt werd om de coëfficiënten van het model te schatten. Vandaar dat
deze vorm van schatten de naam in-sample voorspelling heeft gekregen. In figuur 6 is deze
schattingperiode [tx;t(x+y)].
Figuur 6: In-sample voorspelling (bron: eigen werk)
Out-of-sample voorspelling: In dit type voorspellingen worden de coëfficiënten van het
model, die men zal gebruiken voor het voorspellen van toekomstige waarden van de
volatiliteit, bekomen door een deel van de dataset (of een volledige periode) te gebruiken. Op
figuur 7 kan men duidelijk zien dat men als schattingsperiode [t0;tx] gaat gebruiken. Het model
met bekomen coëfficiënten wordt dan gebruikt om voorspellingen te maken voor een bepaalde
periode die zich buiten de schattingsperiode bevindt. Vandaar dat deze vorm van schatten de
naam ‘out-of-sample voorspelling’ heeft gekregen. In figuur 7 is deze schattingperiode
[tx;t(x+y)].
Figuur 7: Out-of-sample voorspelling (bron: eigen werk)
In de literatuur is er niet echt eensgezindheid over welk type er precies moet gebruikt worden. In
Ashley, Granger, & Schmalensee (1980) wordt er bijvoorbeeld gesteld dat het testen van een model op
voldoende voorspellende kracht, vooral moet gedaan worden door out-of-sample testen. Deze stelling
is ook algemeen aanvaard in de literatuur en wordt beschouwd als een soort van conventionele
wijsheid. Inoue & Kilian (2002) daarentegen, stelden deze conventionele wijsheid in vraag en deden
testen of er wel degelijk een verschil is tussen beide technieken. De auteurs kwamen tot het besluit dat
beide technieken asymptotisch even betrouwbaar zijn onder de nulhypothese van geen
voorspellingskracht. Om toch enigszins de “common practice” in de literatuur te volgen zal er out-of-
sample getest worden in dit onderzoek.
44
Ten tweede moet er nog een onderscheid gemaakt worden op basis van de manier waarop de
voorspelling voor de eerstvolgende periode tot stand komt. Een voorspelling is gebaseerd op
historische waarden van een bepaalde variabele, en naarmate men verder in de toekomst zal
voorspellen, kunnen deze historische waarden ofwel actuele waarden zijn ofwel voorspellingswaarden.
Om dit duidelijker uit te leggen en uiteen te zetten, kan er een onderscheid gemaakt worden tussen 2
verschillende soorten, gebaseerd op Hoofdstuk 1 in Everaert (2011):
Statische voorspelling: De voorspelling voor de volgende periode is gebaseerd op de
historische waarden van een bepaalde variabele, waarbij deze historische waarden de echte
waarden zijn zoals ze in realiteit gekend zijn. Een statische voorspelling is dus een stap-voor-
stap procedure waarbij in iedere stap de dataset wordt geüpdatet door de voorspelde waarde
van de vorige periode te vervangen door de echt geobserveerde waarde. Een nadeel bij deze
methode is dat deze waarden moeten gekend zijn. Dit maakt het dan moeilijk om bijvoorbeeld
direct 5 dagen in de toekomst te gaan voorspellen met vandaag als uitgangspunt. In figuur 8
wordt statische voorspelling geïllustreerd met Xt het uitgangspunt (huidige periode), X(t-y) de
lags van variabele X en F(t+z) de voorspelling voor periode z. Men kan duidelijk zien dat als er
voor periode T+2 moet voorspeld worden, de voorspelling van periode T+1, F(t+1), vervangen
wordt door de actuele waarde X(t+1), die in periode T+1 gekend zal zijn. Men kan dus telkens
alleen een voorspelling maken voor de daaropvolgende periode.
Figuur 8: Statische voorspelling (bron: eigen werk)
Dynamische voorspelling: De voorspelling voor de volgende periode is gebaseerd op de
historische waarden van een bepaalde variabele, waarbij deze historische waarden de
voorspelde waarden zijn zoals door een bepaald model voorspeld. Een dynamische
voorspelling is dus een meervoudige stappenprocedure waarbij in iedere stap (of volgende
periode) de dataset niet wordt geüpdatet omdat er met de voorspelde waarden wordt verder
45
gewerkt. Zo zal de voorspelling voor de volgende periode gebaseerd zijn op zowel voorspelde
waarde als de echte geobserveerde waarden. Als er dynamisch voorspellingen worden gedaan,
zal het niet moeilijk zijn om bijvoorbeeld 5 dagen in de toekomst te gaan voorspellen met
vandaag als uitgangspunt. Dit in tegenstelling tot statische voorspelling. In figuur 9 wordt
dynamische voorspelling geïllustreerd met Xt als uitgangspunt (huidige periode), X(t-y) als de
lags van variabele X en F(t+z) de voorspelling voor periode z. Men kan duidelijk zien dat als er
voor periode T+2 moet voorspeld worden, F(t+1) deel uitmaakt van de waarden waarop
voorspelling F(t+2) gebaseerd is. Dit maakt het dan ook mogelijk om voor een groot aantal
perioden verder in toekomst te gaan voorspellen. Het grootste nadeel aan deze methode van
voorspellen is dat de voorspellingsfout telkens groter en groter wordt naarmate er verder in de
toekomst wordt voorspeld.
Figuur 9: Dynamische voorspelling (bron: eigen werk)
Gezien de gewichtigheid van een groter wordende voorspellingsfout als men dynamisch gaat
voorspellen, is het aangewezen om statisch te gaan voorspellen. Aangezien het in ons onderzoek de
bedoeling is om een methode te vinden die het best kan voorspellen, maakt het niet echt uit welk type
er gebruikt wordt. In deze studie zal er echter met statische voorspelling gewerkt worden.
3.4.2.2 Prestatie-indicatoren voor het beoordelen van voorspellingen
De hiervoor besproken types van voorspellen, zijn echter slechts een manier van werken. In het
vervolg van dit hoofdstuk zal er een overzicht worden gegeven van de methodes die in deze studie
zullen gebruikt worden om ook effectief voorspellingsfouten te gaan meten en om te testen hoe dicht
de voorspellingen bij de BV liggen. Het spreekt voor zich dat het beoordelen van modellen dus ook zal
gebeuren op basis van deze voorspellingsfouten/afwijkingen ten opzichte van de BV. Logischerwijs
zal het beste model datgene zijn dat de laagste voorspellingsfouten/afwijkingen kan voorleggen. De
46
methodes die hieronder besproken worden, zijn de meest gebruikte methodes om
voorspellingfouten/afwijkingen te berekenen en te meten. Alle methodes vergen aparte berekeningen
aangezien voor de variantie deze beoordelingsmethoden niet standaard als output gegeven worden
door Eviews, het statistisch pakket dat zal gebruikt worden in het onderzoek. De methodes voor het
berekenen van de accuraatheid van de voorspellingen die hierna besproken worden, zijn (in volgorde
van voorkomen): de RMSE, de MAE, de MAPE, de correlatie en de R2 van een aanvullende regressie.
De eerste drie methodes zijn gebaseerd op de voorspellingsfout (gebaseerd op Hoofdstuk 1 in Everaert
(2011) maar met andere notatie) :
t,sf, s t BV, st σσfe ˆ,
Hierin is s het aantal periodes ver er in de toekomst wordt voorspeld. Deze formule duidt dus op het
feit dat de voorspellingsfout van s periodes in de toekomst (en t als begintijdstip) ( stfe , ), het verschil
is tussen de echte geobserveerde waarde op tijdstip t+s, namelijk de ‘baseline’-volatiliteit ( stBV , ) en
de voorspelde ‘annualized’ standaardafwijking ( stf ,, ) voor hetzelfde aantal periodes in de toekomst
(s). De voorspellingsfout kan voor elke periode berekend worden. De methodes om een indicatie te
geven van de accuraatheid/prestatie van de voorspellingen, die hierna zullen besproken worden, zijn
gebaseerd op de voorspellingsfouten uit meerdere periodes.
Root Mean Square Error (RMSE)
De eerste methode die zal gebruikt worden is de “root mean squared error”. Deze methode berekent de
gemiddelde voorspellingsfout in een bepaalde sample. We definiëren een voorbeeldsample [T1,T] die
zal gebruikt worden in de theoretische formules van zowel de RMSE, als de andere methodes die
hieronder behandeld worden. De theoretische formule voor de RSME is (Hoofdstuk 1, (Everaert,
2011)):
2x
1s s,T )(fex
1RMSE
1
In deze formule is )1( 1 TTx en is s opnieuw het aantal periodes dat er in de toekomst voorspelt
wordt. In de formule wordt eerst het kwadraat van de voorspellingsfout genomen om dan uiteindelijk
na de sommatie terug het kwadraat te nemen. Dit wordt gedaan zodat negatieve en positieve
voorspellingsfouten elkaar niet zouden uitbalanceren. Er wordt in deze formulering ook meer gewicht
gegeven aan grote fouten door te kwadrateren.
Mean Absolute Error (MAE)
De Mean Absolute Error is een vereenvoudigde versie van de RMSE in die zin dat er niet met
kwadraten gewerkt wordt. In de MAE worden absolute waarde tekens gebruikt om zeker te zijn dat
negatieve en positieve voorspellingsfouten elkaar niet zouden opheffen. Door deze absolute-waarde
47
tekens aan te brengen wordt er gezorgd dat er puur gekeken wordt in termen van de omvang van de
fout en niet naar het teken van de fout. De formule voor MAE is de volgende (Hoofdstuk 1, (Everaert,
2011)):
x
1s ,sT1fe
x
1MAE
Met x gelijk aan de x die gebruikt werd in dit deel voor de RMSE. In tegenstelling tot bij de RMSE,
wordt in deze formulering eenzelfde gewicht gegeven aan grote en kleine fouten door het gebruik van
absolute waarde tekens in plaats van te kwadrateren.
Mean Absolute Percentage Error (MAPE)
De Mean Absolute Percentage Error is de voorspellingsfout als percentage van de echte geobserveerde
waarde uitgedrukt. Opnieuw wordt er gebruik gemaakt van absolute waarde tekens omwille van
equivalente redenen als hierboven. De formule is als volgt (hoofdstuk 1, (Everaert, 2011)):
x
1sT BV,
s,T
1
1fe
x
1MAPE
s
Met x equivalent aan hierboven. Er moet wel opgemerkt worden dat er onbetrouwbare resultaten
kunnen worden verkregen als sTy 1 zich dicht bij nul bevindt of nul benadert.
Correlatie
In het boek van Brooks (2008) op pagina 28 wordt correlatie gedefinieerd als “de graad van lineaire
associatie tussen twee variabelen”. Correlatie daarentegen, wil niet zeggen dat er een oorzakelijk
verband is tussen de twee variabelen. Zo kan er dus niet gezegd worden dat er bij een hoge correlatie
tussen variabele x en variabele y ook een verandering zal worden geobserveerd in variabele y als
gevolg van een verandering in variabele x. Zo wordt in Brooks (2008) gezegd dat er een lineaire
relatie kan worden geobserveerd en dat de veranderingen in beide variabelen gemiddeld gerelateerd
zijn aan elkaar, weergegeven door een correlatiecoëfficiënt. De formule voor correlatie zal hier niet
weergegeven worden. Deze formule is echter afhankelijk van het programma waarmee gewerkt wordt
om de correlatiecoëfficiënt te bekomen.
De correlatiecoëfficiënt kan een waarde aannemen in het interval 1,1 . Bij een positieve
correlatiecoëfficiënt kan er gezegd worden dat er positieve correlatie is, en omgekeerd bij een
negatieve correlatiecoëfficiënt kan er gezegd worden dat er negatieve correlatie is. In deze studie
wordt er verwacht dat er een positieve correlatie gevonden wordt aangezien een negatieve correlatie
zou betekenen dat beide variabelen een negatieve lineaire samenhang hebben. Hoe dichter de
correlatie van een model in deze studie bij één ligt, hoe beter de voorspelde waarden passen bij de
‘baseline’-volatiliteit.
48
R2 van een aanvullende regressie met de bekomen voorspellingen
Deze methode is niet standaard terug te vinden in de bekendste statistische pakketten en behoort ook
niet tot Eviews, het statistisch pakket dat zal worden gebruikt in deze studie. In deze methode zullen
de ‘baseline’-volatiliteit17
geregresseerd worden op de voorspelde waarden. Deze methode is naar het
voorbeeld van Wang & Roberts (2004) . Hierbij zal de ‘baseline’-volatiliteit de afhankelijke variabele
zijn en de voorspelde waarden, die voorspeld worden met de voorgestelde GARCH-specificaties, de
onafhankelijke variabele. De regressie ziet er als volgt uit:
tf21t BV, εσσ ˆ
Met tBV , de ‘baseline’-volatiliteit, f
de voorspelde waarden en t de storingstermen van de
regressie. In een regressie waarbij de voorspelde waarden exact overeenkomen met de ‘baseline’-
volatiliteit, zouden de coëfficiënten de volgende waarden aannemen:
1,0 21
Er kan dus uit de coëfficiënten van deze aanvullende regressie afgeleid worden hoe dicht de
voorspelde waarden in buurt van de ‘baseline’-volatiliteit zitten door te observeren hoe dicht de
coëfficiënten 1 en 2 respectievelijk nul en één benaderen.
De R2 van deze regressie meet het deel van de variabiliteit dat verklaard wordt door het model en is
dus een maatstaf voor de “goodness-of-fit” van het model. Hoe hoger de R2, hoe beter de
voorspellingen aansluiten bij de geobserveerde waarden of met andere woorden hoe meer van de
variabiliteit van de geobserveerde waarde er verklaard wordt door de variabiliteit in de voorspelde
waarden. Deze R2 wordt standaard berekend in de meeste econometrische pakketten.
17
De objectieve volatiliteit die zal gebruikt worden voor de vergelijking van de verschillende modellen.
49
HOOFDSTUK 4
DE DATA
4.1 INLEIDING In dit hoofdstuk wordt de data besproken die in het onderzoek zullen worden gebruikt. In deel 4.2
wordt een omschrijving gegeven van de BEL 20-index. In dit deel worden de prijzen vermeld die
nodig zijn voor het berekenen van de ‘range’ schatters uit Hoofdstuk 2. Er wordt eveneens uitleg
gegeven over de BEL 20-index en hoe die is samengesteld. In deel 4.3 van dit hoofdstuk worden de
eigenschappen van de logaritmische returns van de BEL 20-index besproken. In dit deel wordt er ook
getest op stationariteit van de returns. Er wordt in dit deel eveneens een ARCH-LM-test afgenomen
om aan te tonen dat een GARCH-model in staat is om de ARCH-effecten in de returns te modelleren.
Deel 4.4 bevat de identificatie van de ME. In dit deel wordt dus bepaald welke functionele vorm de
ME in alle modellen en alle delen van het onderzoek zal hebben. In deel 4.5 wordt de ‘baseline’-
volatiliteit besproken en wordt er nog eens herhaald waar deze precies van belang is in het onderzoek.
In deel 4.6 worden de eigenschappen van de ‘range’-schatters van Wang & Roberts (2004) besproken.
Deel 4.7 bespreekt de eigenschappen van de analytische ‘range’ schatters (2
70ˆ ). Ten slotte worden
er in deel 4.8 de tijdsperioden geïdentificeerd die zullen gebruikt worden in deel 3 van het onderzoek.
4.2 OMSCHRIJVING De uitvoering van deze studie vergt een bepaalde dataset waarop de besproken modellen gaan
toegepast worden. De keuze werd gemaakt om data te gaan gebruiken van de BEL 20 index omwille
van zijn algemene gekendheid en significantie in België. Als databank wordt Datastream gebruikt, , dit
is een dataservice die aangeboden wordt door Thomson Reuters. Op deze databank werden volgende
data afgehaald:
Sluitingsprijzen van de BEL 20 index.
Openingsprijzen van de BEL 20 index.
Maximumprijzen van de BEL 20 index.
Minimumprijzen van de BEL 20 index.
Deze prijzen zijn dagelijkse prijzen. De minimum- en maximumprijzen worden geobserveerd over een
tijdspanne van één dag (‘intraday’). De tijdsperiode waarover de dataset zich uitstrekt begint bij de
startdatum 15/07/1992 tot de einddatum 9/03/2012. De totale dataset bevat 5127 observaties. Het
aantal ontbrekende waarden per specifieke prijs wordt weergegeven in tabel 1. De sluitingsprijzen
zullen gebruikt worden als input voor de ME in de GARCH-specificatie. De andere 3 prijzen zijn van
belang voor het opstellen van de ‘range’-schatters die werden gedefinieerd in het vorige hoofdstuk. Er
50
zullen echter nog transformaties moeten worden uitgevoerd om genormaliseerde prijzen te bekomen
die als input worden vereist in sommige schatters.
#NA
Sluitingsprijs 0
Openingsprijs 152
Maximumprijs 185
Minimumprijs 185 Tabel 1: Ontbrekende observaties in basisdataset (bron: Datastream, eigen berekening)
4.2.1 BEL 20 index
De BEL 20 is de belangrijkste index van België en staat genoteerd op de Euronext beurs in Brussel.
Zoals de naam al doet vermoeden, bestaat de index uit maximaal 20 bedrijven met elk hun eigen
gewicht in de index. Tabel 2 geeft de 20 bedrijven weer waaruit de index op dit moment van schrijven
bestaat. Ieder bedrijf en hun respectievelijk gewicht in de index wordt eveneens weergegeven in tabel
2.
% gewicht
AB Inbev 12,67
Ackermans & Van Haaren 2,64
Ageas 5,57
Befimmo-Sicafi 1,23
Bekaert 1,42
Belgacom 6,31
Cofinimmo-Sicafi 2,39
Colruyt 4,06
D'Ieteren 1,51
Delhaize group 6,67
Elia 1,59
GBL 7,65
GDF Suez 11,6
KBC 3,53
Mobistar 1,79
Nyrstar 1,6
Solvay 9,54
Telenet group 3,15
UCB 6,18
Umicore 8,89 Tabel 2: Samenstelling BEL 20 (bron: Euronext website, 11 april 2012)
De marktautoriteiten van Euronext Brussel bepalen de samenstelling op basis van een aantal
objectieve criteria. Het eerste belangrijke criterium is dat de bedrijven een voldoende hoge vrije
marktkapitalisatie moeten bezitten. Deze bedrijven worden dan vervolgens gerangschikt op basis van
hun vrije marktkapitalisatie en worden de 20 grootste geselecteerd. Naast de marktkapitalisatie worden
51
ook nog andere criteria gehanteerd, zoals de liquiditeit het aandeel. De details inzake samenstelling
vallen buiten het bestek van deze studie maar kunnen teruggevonden worden op NYSE Euronext
(2010), waarin ook voorgaande uitleg te vinden is.
Op 18 maart 1991 is de BEL 20-index officieel van start gegaan op Euronext Brussel. De berekening
van de index startte reeds wat vroeger, namelijk vanaf 30 december 1990. Onze volledige dataset
daarentegen begint pas op 15 juli 1992. Dit is het gevolg van de data met betrekking tot maximum- en
minimumprijzen die slechts te verkrijgen zijn vanaf die startdatum.
4.3 EIGENSCHAPPEN RETURNS BEL 20-INDEX
De BEL 20-index behoort tot de klasse van de financiële data. Deze specifieke soort data kenmerken
zich door een aantal eigenschappen die men vaak terugvindt in aandelen of indexen returns. Deze
gemeenschappelijke statistische eigenschappen worden ook wel “stylized facts” genoemd. Zo zijn er
voor financiële tijdreeksen een tiental “stylized facts” maar diegene die vooral van belang zijn in deze
studie zijn volatiliteitsclustering en het bezitten van een leptokurtisch verdeling. Deze eigenschappen
worden in de volgende subparagrafen 4.3.1 en 4.3.2 besproken. In 4.3.3 wordt er getest op
stationariteit van de returns en in deel 4.3.4 wordt een ARCH-LM-test uitgevoerd.
4.3.1 Volatiliteitsclustering
Deze “stylized fact” kan men afleiden uit een grafiek van de returns van een bepaald aandeel of index.
In onze studie zullen dit de returns zijn van de BEL 2018
. Eerder in deze studie werd
volatiliteitsclustering al beschreven als een opeenhoping van kleine of grote returns. In figuur 10
worden de returns van de BEL 20 voor de complete dataset uitgezet. Er kan duidelijk clustering
worden opgemerkt in onze data, wat ook te verwachten was. In de periode van 2007 tot 2009 is er een
duidelijk zichtbare clustering van hoge volatiliteit, dit door de kredietcrisis. Zo kan er voor de periode
1992 tot 1996 gezegd worden dat er een clustering is van lage volatiliteit.
18
De returns zijn berekent op de sluitingsprijzen.
52
Figuur 10: Returns BEL 20 index (bron: Datastream, eigen werk)
Deze eigenschap van financiële data is gunstig om te bezitten aangezien deze de volatiliteit vrij
voorspelbaar maakt en het is juist deze voorspelbaarheid die om eerdergenoemde redenen zo wenselijk
is.
4.3.2 Leptokurtische verdeling
Een tweede belangrijke eigenschap van financiële tijdreeksen is het leptokurtisch zijn van de verdeling
van de returns. Een leptokurtische verdeling heeft als eigenschap dat de data worden gekenmerkt door
een grote piek rond het gemiddelde en dikke staarten aan de uiteinden . Een grotere piek van de
distributie is het gevolg van veel gematigde returns en dikke staarten zijn het gevolg van meer extreme
prijswijzigingen, zowel positief als negatief (zie Hoofdstuk 3, Frömmel (2011)). Dit ziet zich dan
vertaald in een grotere kurtosis ten aanzien van de kurtosis van een normale verdeling. Uit figuur 11
kan er worden afgelezen dat de returns van de BEL 20-index een kurtosis van 9,77 heeft terwijl de
kurtosis van een normale verdeling 3 is. Aan de Jarque-Bera teststatistiek is duidelijk te zien dat de
nulhypothese van een normale verdeling verworpen wordt.
Figuur 11: Descriptieve statistieken returns BEL 20 index (bron: Datastream, eigen
werk)
-10.0
-7.5
-5.0
-2.5
0.0
2.5
5.0
7.5
10.0
1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
RETURN
Tijd
Retu
rns
0
200
400
600
800
1,000
1,200
1,400
-8 -6 -4 -2 0 2 4 6 8
Series: RETURN
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 0.012998
Median 0.011721
Maximum 9.333978
Minimum -8.319283
Std. Dev. 1.191968
Skewness 0.014210
Kurtosis 9.766838
Jarque-Bera 9782.081
Probability 0.000000
Returns
Aan
tal
53
Dit zijn niet de enige eigenschappen die typisch zijn voor financiële data maar wel van belang voor de
keuze welk model er zal gebruikt worden in deze studie. Volatiliteitsclustering en leptokurtische
verdeling van de data geven aan dat er conditionele heteroscedasticiteit aanwezig is. Gezien deze
eigenschap van de data, wordt het gebruik van GARCH-modellen omdat deze modellen in staat zijn
om deze eigenschap te vatten. Om dit ook officieel te testen zullen we een ARCH-LM test uitvoeren
op de data.
4.3.3 Stationariteit van de returns
In Hoofdstuk 2 deel 2.5.1.1 (supra, p.20) werd stationariteit uitgelegd en hoe dit kan getest worden in
een tijdreeks. De tijdreeks die hier zal getest worden is deze van de returns van de BEL 20-index. Een
eerste indicatie kan gegeven worden door de grafiek van de returns te bekijken. In figuur 10 (supra,
p.52) is er geen duidelijke trend zichtbaar en fluctueren de returns rond nul. Dit duidt duidelijk op
stationariteit. Om helemaal correct te zijn wordt er nog eens een eenvoudige DF-test uitgevoerd. Met
behulp van Eviews om een DF test uit te voeren, wordt er een output bekomen die wordt
weergegeven in tabel 3 . Hieruit kan er besloten worden dat de nulhypothese kan verworpen worden
op 1% niveau van significantie. Dit heeft tot gevolg dat er kan besluiten worden dat de returns van de
BEL 20-index stationair zijn.
Null Hypothesis: RETURN has a unit root
Exogenous: None
Lag Length: 0 (Automatic - based on SIC, maxlag=27) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -49.78449 0.0001
Test critical values: 1% level -2.565779
5% level -1.940936
10% level -1.616624 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(RETURN)
Method: Least Squares
Date: 05/14/12 Time: 14:40
Sample: 1/03/2000 11/10/2010
Included observations: 2833 Variable Coefficient Std. Error t-Statistic Prob. RETURN(-1) -0.933560 0.018752 -49.78449 0.0000 R-squared 0.466716 Mean dependent var -0.000402
Adjusted R-squared 0.466716 S.D. dependent var 1.836290
S.E. of regression 1.340974 Akaike info criterion 3.425022
Sum squared resid 5092.533 Schwarz criterion 3.427122
Log likelihood -4850.544 Hannan-Quinn criter. 3.425780
Durbin-Watson stat 1.997979
Tabel 3: Basis DF test (bron: Datastream, eigen berekening)
54
4.3.4 ARCH-LM test
De ARCH-LM test zal uitmaken welk model er in staat is om ARCH-effecten te vatten. De twee
modellen die we zullen testen, is enerzijds een eenvoudig AR(1)-model en anderzijds een
GARCH(1,1)-model. De keuze voor het testen van slechts twee modellen heeft als motivatie dat het
hier niet de bedoeling is om een ideaal model te vinden dat een zo groot mogelijke significantie bezit.
De motivatie is eerder het bewijzen dat GARCH-modellen voldoende geschikt zijn om deze ARCH-
effecten te vatten en aan te geven dat gewone AR-modellen dat niet kunnen.
Deze test heeft de volgende nulhypothese en alternatieve hypothese:
H0: ARCH-effecten worden volledig door het model opgevangen. (ARCH is nog aanwezig)
H1: ARCH-effecten worden niet volledig door het model opgevangen. (ARCH is niet meer
aanwezig.
De teststatistiek voor het testen van deze hypothesen is T*R2 met T het aantal observaties en is chi-
kwadraat verdeeld (Hoofdstuk 9, Everaert (2011)):
2R*T ~ (q)χ 2
De R2 is deze van een autoregressieve regressie van de storingstermen van de returnregressie. Er zal
hier niet verder worden ingegaan op de details van deze methode aangezien dit niet essentieel is. In de
output wordt zowel de teststatistiek als de p-waarde gegeven.
Vooreerst wordt er getest of de data kan beschreven worden door een eenvoudig ARMA model,
namelijk een AR(1)-model. Een AR(1)-model heeft de volgende notatie:
t1t10t εRααR
Met Rt de returns van de huidige periode en εt de storingsterm. De output van de ARCH LM test voor
deze specificatie kan gevonden worden in de bijlage onder appendix C. Er wordt een teststatistiek
gevonden met een waarde van 937,54, wat overeenstemt met een p-waarde van 0,00. De nulhypothese
kan dus verworpen worden op het 5% significantieniveau. Ze wordt zelfs verworpen op 1%. Hieruit
kan worden besloten dat een AR(1)-model niet in staat is om de returns van de BEL 20-index te
modelleren.
Als tweede wordt er een algemeen GARCH(1,1)-model, getest, met als specificatie:
ttt RR 110
ttt met t ~ N(0,1)
2
11
2
110
2
ttt
Dit is exact dezelfde specificatie die in deel 2.5.3.1 als basismodel werd voorgesteld. De middelste
regel is er nog eens aan toegevoegd voor de correctheid van het model. De voorwaarde dat de
55
gestandaardiseerde residuen standaard normaal verdeeld moeten zijn, zal evenwel worden nagegaan.
De Eviews-output geeft ons een teststatistiek met waarde 5,688 en overeenkomstige p-waarde 0,3378.
Uit dit resultaat kan er gezegd worden dat de nulhypothese niet kan verworpen worden en er dus kan
besloten worden dat een GARCH(1,1) model in staat is om de ARCH-effecten te modelleren. Deze
uitkomst valideert het gebruik van GARCH als methode om de volatiliteit te modelleren. Ter
vergelijking worden de gestandaardiseerde residuen van het AR(1)-model en het GARCH(1,1)-model
nog eens zij aan zij vergeleken in figuur 12.
Figuur 12: a) Gestandaardiseerde residuen AR(1)-model, b) Gestandaardiseerde residuen GARCH(1,1)-
model (bron: Datastream, eigen werk)
Aan deze figuren is duidelijk te zien dat de gestandaardiseerde residuen van het AR(1)-model nog
steeds volatiliteitsclustering vertoont terwijl dit in het GARCH(1,1)-model niet zo is.
Belangrijk bij het gebruik van GARCH-modellen is dat de gestandaardiseerde residuen standaard
normaal verdeeld zijn, dit om eerder vernoemde redenen (supra, p 25). De descriptieve statistieken
worden weergegeven in figuur 13. De verdeling is nog altijd licht leptokurtisch wat aangeeft dat
GARCH niet in staat is om de gehele leptokurtositeit van de BEL 20 returns te verklaren. Ook de JB-
teststatistiek verwerpt duidelijk de hypothese van normaliteit met een p-waarde van 0,00. Een
aanpassing zal dus moeten gemaakt worden aan de standaardfouten om robuustheid voor niet-
normaliteit te bekomen. Dit kan door het gebruik van de Bollerslev-Wooldridge variantie-covariantie
matrix zoals reeds werd vermeld in Hoofdstuk 2 deel 2.5.2.
-8
-6
-4
-2
0
2
4
6
8
10
1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
Standardized Residuals
-8
-4
0
4
8
1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
Standardized ResidualsTijdTijd
Ge
stan
daa
rdis
eer
de s
tori
ngst
erm
en
Ge
stan
daa
rdis
eer
de s
tori
ngst
erm
en
(a) (b)
56
Figuur 13: Descriptieve statistieken van de gestandaardiseerde residuen van een GARCH(1,1)-model
(bron: Datastream, eigen werk)
4.4 IDENTIFICATIE MEAN EQUATION
Met de identificatie van de mean equation wordt bedoeld dat er zal nagegaan worden welke
specificatie er het dichtst aanleunt bij de data. In de paper van Wang & Roberts (2004) wordt er
gesteld dat de returns een random walk volgen met als specificatie:
ttR 0
Met Rt gedefinieerd zoals in formule (2). Dit is echter slechts een veronderstelling van de auteurs en
steunt niet op iets concreets dat in de paper vermeld staat.
In deze studie wordt wel aandacht besteed aan de specificatie van de ‘mean equation’ en deze
specificatie zal door rationele en econometrische theorie worden gerechtvaardigd. Hierbij zullen geen
derde variabelen worden betrokken in de ‘mean equation’, zoals dit ook het geval was in de paper van
Wang & Roberts (2004). Het komt er dus op neer dat er zal worden gezocht naar een ARMA-model
dat het dichtst aansluit bij de returns van de BEL 20. Belangrijk in het onderzoek naar een geschikt
ARMA-model is dat er voldoende modellen worden geschat. In tabel 4 wordt een overzicht gegeven
van de Akaike en Schwarz Bayesian informatiecriteria (AIC en SBC, uitgelegd in Hoofdstuk 3 deel
3.4.1) voor de verschillende specificaties.
0
200
400
600
800
1,000
1,200
1,400
-5 -4 -3 -2 -1 0 1 2 3 4 5
Series: STANDARDIZEDRESIDSGARCH
Sample 7/15/1992 3/09/2012
Observations 5126
Mean -0.045395
Median -0.054643
Maximum 4.721482
Minimum -5.461025
Std. Dev. 0.999490
Skewness -0.223303
Kurtosis 4.422361
Jarque-Bera 474.7036
Probability 0.000000
Gestandaardiseerde residuen
Aan
tal
57
AIC SBC
AR(1) 3,183048 3,185602
AR(2) 3,183177 3,187008
AR(3) 3,180597 3,185704
AR(4) 3,180546 3,186930
AR(5) 3,179415 3,187077
MA(1) 3,182927 3,185481
MA(2) 3,183316 3,187146
ARMA(1,1) 3,183318 3,187148
ARMA(2,1) 3,181791 3,186899
ARMA(2,2) 3,179979 3,186364
ARMA(3,1) 3,180021 3,186405
ARMA(3,2) 3,180320 3,187981
ARMA(3,3) 3,180397 3,189335
Tabel 4: AIC en SBC voor verschillende specificaties (BEL 20 returns) (bron: Datastream, eigen
berekeningen)
De optimale specificatie voor de BEL 20 returns is diegene waarvan de infocriteria minimaal zijn ten
opzichte van de andere specificaties. Aangezien er met een sample gewerkt wordt van meer dan
vijfduizend observaties is het aangeraden om enkel rekening te houden met het Schwarz Bayesian
informatiecriterium, dit om eerder genoemde redenen in Hoofdstuk 3 deel 3.4.1. Uit de resultaten kan
worden besloten dat het AR(1), het AR(3) en het MA(1) model de best presterende modellen zijn. De
ARMA modellen met zowel een AR-term en een MA-term zijn over het algemeen minder geschikt
dan modellen met één enkele term. Een beter overzicht wordt gegeven in figuur 14 waarin de beste
modellen worden aangeduid.
Figuur 14: Grafiek AIC en SBC voor verschillende specificaties (BEL 20 returns) (bron: Datastream,
eigen berekeningen)
3,174
3,176
3,178
3,18
3,182
3,184
3,186
3,188
3,19
3,192
Ast
itel
AIC & SBC output
AIC
SBC
Model
Info
rmat
ie
crite
rium
scor
e
58
Spaarzaamheid op vlak van het incorporeren van variabelen in een specificatie is een centraal begrip
in econometrie en volgens dit principe kunnen we besluiten dat er slechts twee modellen bestaan
waaruit er moet gekozen worden. Hoewel het MA(1)-model iets beter presteert zal er in het verder
verloop van deze thesis gewerkt worden met een AR(1)-model. Een ARMA(1,1)-model als
compromis is minder geschikt dan een AR(1)-model. Dagelijkse returns worden vaak gekenmerkt
door een lichte autocorrelatie. Deze autocorrelatie kan uit de serie gehaald worden door het
incorporeren van een autoregressieve lag, dus door een AR(1)-model te schatten. Deze ene lag volstaat
normaal om de autocorrelatie uit de dagelijkse returns te halen zodat we een zuivere volatiliteit kunnen
observeren. De GARCH-varianties die uit dit AR(1)-model verkregen worden zullen verschillen van
deze van een eenvoudige ‘mean equation’-specificatie zoals in Wang & Roberts (2004). Er moet wel
opgemerkt worden dat deze niet zoveel zullen verschillen omdat de effecten op de variantie eerder
klein zullen zijn.
4.5 BASELINE VOLATILITEIT
De voorspellingen die zullen geproduceerd worden door middel van de verschillende GARCH-
modellen moeten op hun accuraatheid gecontroleerd worden. Dit zal gebeuren door de voorspellingen
te vergelijken met een onafhankelijke ‘baseline’ volatiliteit. Deze ‘baseline’ volatiliteit fungeert dus
als het ware als de echte objectieve volatiliteit. In Hoofdstuk 3 deel 3.4.2.2 werd de voorspellingsfout
gedefinieerd als:
t,sf, s t BV, st σσfe ˆ,
Hierin zal stf ,, de voorspelling zijn die verkregen wordt door de GARCH-modellen. De term
stBV , zal dan de ‘baseline’-volatiliteit zijn die als objectieve echte waarde voor de volatiliteit zal
gelden.
Belangrijk is dat deze ‘baseline’-volatiliteit een objectieve volatiliteitmeting is van de BEL 20-index
daarom werd er dus ook geopteerd voor het gebruik van de ‘BEL 20 volatiliteit index’, verder afgekort
als BV. Deze index is beschikbaar op Datastream met als code ‘BELVOLI(PI)’. De basisgedachte
achter deze index is dat deze gebaseerd is op de verwachte veranderingen voor de komende 30 dagen
van de onderliggende index. Hoe turbulenter men verwacht dat de onderliggende prijsindex van de
BEL 20 zal zijn, hoe hoger het niveau van de volatiliteitindex. Deze basisgedachte is terug te vinden
op NYSE Euronext (2012). Deze volatiliteit is dus afgeleid uit de prijzen van de opties op de BEL 20
met een maturiteit van een maand (30 dagen). De volatiliteit die voortkomt uit deze optieprijzen moet
dan nog omgerekend worden op jaarbasis. Dit kan eenvoudig gedaan worden door te
vermenigvuldigen met de vierkantswortel van twaalf (redenering gebaseerd op Cabrera (2011)). Zo
wordt dan ongeveer de volatiliteitsindex van de BEL 20 bekomen. De beschikbare tijdreeks van deze
59
volatiliteitsindex loopt van 3/01/2000 tot 10/11/2010. In figuur 15 worden de beschrijvende
statistieken weergegeven van de BV. De verdeling van de BV lijkt op deze van een F-verdeling
positieve scheefheid.
Figuur 15: Beschrijvende statistieken BEL 20-volatiliteitindex (bron: Datastream, eigen werk)
In figuur 16 wordt de grafiek van de BV weergegeven voor de periode waarin deze index beschikbaar
is. Dit is de grafiek die moet benaderd worden door de voorspellingen. Er worden geen verdere
transformaties gedaan op de BV.
Figuur 16: Grafiek BEL 20-volatiliteitindex. (bron: Datastream, eigen werk)
4.6 EIGENSCHAPPEN ‘RANGE’- SCHATTERS In figuur 17 en 18 worden de beschrijvende statistieken van respectievelijk variabele DRt en variabele
LRt weergegeven. De verdeling van de DR benadert deze van een F-verdeling en is dus positief
scheef. Hierbij kan opgemerkt worden dat de meeste van de observaties zich dus aan de linkerkant van
de verdeling bevinden. De verdeling van DR is alles behalve normaal verdeeld. Dit kan duidelijk
0
100
200
300
400
500
10 20 30 40 50 60 70
Series: BELVOLI
Sample 1/03/2000 11/10/2010
Observations 2833
Mean 20.50181
Median 18.85500
Maximum 69.47000
Minimum 8.564000
Std. Dev. 8.507410
Skewness 1.404943
Kurtosis 6.092535
Jarque-Bera 2060.917
Probability 0.000000
BELVOLI
Aan
tal
0
10
20
30
40
50
60
70
00 01 02 03 04 05 06 07 08 09 10
BELVOLI
Tijd
Vo
lati
lite
it
60
afgeleid worden uit een scheefheid van 2,297 en een kurtosis van 12,377 die ver boven de scheefheid
en kurtosis van een normale verdeling liggen.
Figuur 17: Beschrijvende statistieken DRt (bron: eigen berekeningen)
In Hoofdstuk 2 deel 2.4.1 werd reeds de superioriteit van de log range aangehaald. Als men de
beschrijvende statistieken bekijkt in figuur 18 dan kan er besloten worden dat de standaarddeviatie
heel wat kleiner is dan deze van de dagelijkse range. Ook benadert de verdeling van de LR een
normale verdeling. Dit kan gezien worden aan een scheefheid van 0,287 en een kurtosis van 3,057 die
een scheefheid van 0 en een kurtosis van 3 van een normale verdeling benaderen.
Figuur 18: Beschrijvende statistieken LRt (bron: eigen berekeningen)
Worden de DR-waarden en de LR-waarden uitgezet in een Q-Q plot (figuur 19) dan moet opgemerkt
worden dat de LR nauwer aansluit bij de rode lijn dan de DR. De rode lijn in de grafiek duidt een
normale verdeling van de data aan en er kan dus besloten worden dat de LR het dichtst nadert bij een
normale verdeling. Dit betekent dat de LR gunstige eigenschappen zal bevatten en heeft dus als
gevolg dat LR tot betere voorspellingen kan leiden in GARCH-modellen en varianten.
0
200
400
600
800
1,000
1,200
0 20 40 60 80 100 120 140 160 180 200 220 240 260 280
Series: DRt
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 36.26224
Median 29.80000
Maximum 274.9600
Minimum 2.100000
Std. Dev. 27.75125
Skewness 2.296579
Kurtosis 12.37696
Jarque-Bera 23290.36
Probability 0.000000
DRt
Aan
tal
0
100
200
300
400
500
-3.0 -2.8 -2.6 -2.4 -2.2 -2.0 -1.8 -1.6 -1.4
Series: LRt
Sample 7/15/1992 3/09/2012
Observations 5127
Mean -2.293031
Median -2.309749
Maximum -1.286694
Minimum -3.098407
Std. Dev. 0.261583
Skewness 0.286822
Kurtosis 3.056845
Jarque-Bera 70.98724
Probability 0.000000
LRt
Aan
tal
61
Figuur 19: a) Q-Q plot voor DRt, b) Q-Q plot voor LRt (bron: eigen berekeningen)
4.7 EIGENSCHAPPEN ANALYTISCHE VOLATILITEITSCHATTERS
4.7.1 Descriptieve statistieken van de analytische schatters
In dit deel worden de descriptieve statistieken van de analytische schatters, die in Hoofdstuk 2 werden
geïdentificeerd, besproken. Deze statistieken kunnen in appendix D in de bijlage gevonden worden. In
tabel 5 & 6 wordt een samenvatting gegeven van de belangrijkste kenmerken van alle schatters. Het
valt op uit de statistieken dat zowel het gemiddelde als de standaarddeviatie aan de hoge kant zijn.
Ook de maxima van de verschillende schatters ligt vrij hoog. Dit is het gevolg van het kwadrateren in
de formules van de schatters. Als er zich een extreem hoge prijsverandering voordoet en deze
gekwadrateerd wordt, kan de waarde voor de volatiliteit hoog uitvallen. In een regressie zou dit echter
geen probleem mogen zijn. Deze eigenschap van de schatters zal zich in de regressie laten blijken
doordat de coëfficiënten van de schatters klein zullen zijn. Dit heeft te maken met de schaal waarin de
variabelen in de regressie zijn uitgedrukt. Er kan aan herschaling gedaan worden door bijvoorbeeld te
delen door 1000, dan zal de coëfficiënt met duizend vermenigvuldigd worden. Voor de rest verandert
er niets fundamenteel aan het model. In deze studie wordt er geopteerd om niet aan herschaling te
doen en dus de tijdreeksen van de schatters te behouden zoals ze zijn.
Een tweede belangrijk element dat moet opgemerkt worden, is dat schatter 4, schatter 5 en schatter 6
een negatieve waarde als minimum hebben. Dit is echter onmogelijk aangezien de volatiliteit niet
negatief kan zijn. In het geval van schatter 4, schatter 5 en schatter 6 zijn het aantal negatieve waarden
respectievelijk 7, 6 en 6. Dit aantal observaties maakt deel uit van een dataset met 5127 observaties in
totaal. De Eviews-ouput van tabel 5 wordt in appendix D weergegeven.
-80
-40
0
40
80
120
160
0 40 80 120 160 200 240 280
Quantiles of DRt
Qua
ntile
s of
Nor
mal
-3.6
-3.2
-2.8
-2.4
-2.0
-1.6
-1.2
-3.2 -2.8 -2.4 -2.0 -1.6 -1.2
Quantiles of LRt
Qua
ntile
s of
Nor
mal
(b) (a)
62
Mean Standaard
deviatie Maximum Minimum Normaal
verdeeld? 2
0 984,150 2772,963 72317,970 0,000 NEE
2
1 1212,216 3260,195 84354,240 0,013 NEE
2
2 594,493 1192,382 27268,020 0,000 NEE
2
3 1455,933 2905,831 66929,980 4,135 NEE
2
4 565,574 1097,078 26804,570 -3416,113 NEE
2
5 551,713 1068,936 25744,170 -2875,001 NEE
2
6 1389,110 2683,275 63986,480 -7887,355 NEE
2
7 477,966 278,078 853,093 8,375 NEE
Tabel 5: Samenvatting descriptieve statistieken geïdentificeerde schatters(bron: Datastream, eigen
berekeningen)
Gezien dit slechts een klein aantal observaties zijn in de dataset en deze negatieve waarden bij nader
inzien het gevolg zijn van een samenloop van factoren, waaronder bijvoorbeeld de combinatie van
onveranderde prijzen en van de specifieke formulering van de schatter, wordt er voor geopteerd om
deze observaties weg te laten uit de dataset. De descriptieve statistieken van de schatters na het
weglaten van de negatieve waarden worden weergegeven in tabel 6. Opnieuw geldt hier hetzelfde
verhaal in verband met het grote gemiddelde en de grote standaarddeviatie.
Mean Standaard
deviatie Maximum Minimum Normaal
verdeeld? 2
4 570,207 1095,557 26804,570 1,702 NEE
2
5 554,720 1066,708 25744,170 1,667 NEE
2
6 1396,960 2677,046 63986,480 4,720 NEE
Tabel 6: Samenvatting descriptieve statistieken geïdentificeerde schatters na aanpassing (bron:
Datastream, eigen berekeningen)
Schatters 1 tot 6 hebben gemeenschappelijk dat heel wat van hun waarden geconcentreerd zitten in het
interval 5000,0 (zie figuren in bijlage D) De verdeling van deze schatters lijkt op een F-verdeling
met positieve scheefheid. Let wel op dat er hiermee niet gezegd wordt dat ze ook expliciet een F-
verdeling volgen. Schatter 7 is in dit opzicht anders dan de andere zes schatters. In deze schatter vallen
alle waarden binnen het interval 854,8 . Binnen dit interval zijn de waarden random verspreid. Dit
doet al twijfelen aan het nut van het gebruik van deze schatter in GARCH-modellen.
In de gehele dataset van de schatters zit een bepaald aantal waarden per schatter die niet beschikbaar
zijn. Dit is het gevolg van observaties die niet beschikbaar zijn in de openings-, sluitings-, minimum-
en maximumprijzen waarop deze schatter gebaseerd zijn. Het exacte aantal observaties dat niet
beschikbaar is, wordt per schatter in tabel 7 weergegeven. Aangezien er voor het schatten van
63
GARCH-modellen geen waarden mogen ontbreken, wordt er geopteerd om met lineaire interpolatie
deze ontbrekende waarden weg te werken. Dit lineair interpoleren kan in Eviews worden gedaan.
#NA 2
0 148
2
1 152
2
2 186
2
3 189
2
4 196
2
5 195
2
6 195
2
7 0
Tabel 7: Aantal ontbrekende waarden in de dataset (bron: Datastream, eigen berekeningen)
4.7.2 Correlatie analytische schatters
In Hoofdstuk 3 deel 3.2 werd reeds vermeld dat er een model zal geschat worden dat alle “range”
schatter zal incorporeren. Gezien al deze schatters in één regressievergelijking zullen worden gebruikt,
is het belangrijk dat er gekeken wordt naar de correlatie tussen de verschillende schatters. In tabel 8
wordt er een overzicht gegeven van de covariantie en de correlatie tussen de verschillende schatters.
De bovenste waarde in deze tabel is de covariantie en de onderste waarde is de correlatie. Doordat de
verdeling van schatters 1 tot en met 6 min of meer dezelfde zijn, kan er verwacht worden dat de
correlatie ook redelijk groot zal zijn. Dit kan inderdaad bevestigd worden uit de correlatiecoëfficiënten
in tabel 8. De correlatie is vooral het grootst tussen schatters 4, 5 en 6 evenals tussen schatter 2 en 3
omdat de formules van deze schatters, op enkele details na, niet verschillen. Aangezien de verdeling
van schatter 7 erg verschilt van deze van de rest van de schatters is het dan ook normaal dat de
correlatie niet zo groot is.
Het gevolg van deze bevindingen is dat er zich in het model met alle schatters, de
combinatiemodellen, een probleem van autocorrelatie gaat voordoen. Dit zorgt ervoor dat de
standaardfouten incorrect zullen zijn en dus de p-waarde om te testen op significantie niet meer
accuraat is. Dit is op zich geen probleem omdat het in deze studie de bedoeling is om betere
voorspellingen te bekomen met het model en voor het maken van voorspellingen maakt het niet uit dat
de standaardfouten incorrect zijn.
64
Covariance
Correlation E00 E01 E03 E02 E04 E05 E06 E07
E00 7687824.
1.000000
E01 6456600. 10626798
0.714333 1.000000
E03 4932560. 8287474. 8442208.
0.612269 0.874970 1.000000
E02 1905189. 3325934. 3446617. 1421498.
0.576319 0.855735 0.994928 1.000000
E04 1289050. 2156747. 2908938. 1196179. 1203345.
0.423812 0.603119 0.912665 0.914593 1.000000
E05 1274840. 2140667. 2852945. 1173470. 1172160. 1142401.
0.430175 0.614382 0.918663 0.920852 0.999729 1.000000
E06 3504651. 5576732. 7195638. 2924315. 2925568. 2849920. 7198563.
0.471108 0.637611 0.923036 0.914172 0.994013 0.993803 1.000000
E07 129820.1 165468.1 186207.8 76230.95 69342.04 67676.42 170318.3 77312.30
0.168390 0.182553 0.230486 0.229950 0.227341 0.227721 0.228304 1.000000
Tabel 8: Covariantie/correlatie-tabel analytische schatters (bron: Datastream, eigen berekeningen)
4.8 IDENTIFICATIE TIJDSPERIODEN In het derde deel van het onderzoek wordt er nagegaan of bepaalde modellen beter presteren
naargelang de toestand waarin de markt zich bevindt en of dit tot significant verschillende conclusies
leidt ten opzichte van deel 2 van het onderzoek. Er worden twee soorten statussen waarin de markt
zich bevindt besproken en onderzocht: ‘bull’-markten en ‘bear’-markten. In deze studie wordt er
gewerkt met een out-of-sample voorspelling. In wat volgt zullen de verschillende
tijdsperioden/samples worden geïdentificeerd en besproken. Er zal ook duidelijk aangegeven worden
tussen welke data de schattingssample en de voorspellingssample zich bevinden. Deze data zijn
arbitrair bepaald op basis van historische gebeurtenissen die het begin en het einde van een specifieke
periode markeren .
4.8.1 ‘Bull’-markt
Een ‘bull’-markt is een markt van financiële producten die een stijgende trend in de prijzen
ondervindt. Er wordt vaak een associatie gemaakt met een toenemend vertrouwen onder de
investeerders en een algemene verwachting dat de markt in de toekomst nog zal toenemen.
65
In de BEL 20 dataset zijn de schattings- en voorspellingsperiode voor de ‘bull’-markt als volgt
bepaald:
Schattingsperiode: 15/07/1992-13/03/2003
Voorspellingsperiode: 14/03/2003-04/06/2007
In het begin van deze voorspellingsperiode is de opwaartse trend het gevolg van een economische
heropleving na een periode van een relatief depressieve economie. Deze economie bevond zich in een
staat van depressie als gevolg van de DOT COM-bubble die uiteengebarsten is op het einde van het
jaar 2000. Een officiële benaming voor de ‘bull’-markt van 2003 tot 2007 is er niet maar in deze
thesis zal deze periode de naam kredietbubbel dragen. Het begin van deze periode is arbitrair bepaald
op basis van de tijdsreeks. De datum van de laagste waarde in de returns tussen begin 2003 en begin
2004 werd geselecteerd als startdatum voor de voorspellingsperiode. Het einde van deze periode wordt
dan weer gekenmerkt door de kredietcrisis. Deze einddatum werd begin juni 2007 geplaatst omdat
toen al de tekenen zichtbaar waren dat er crisis aankwam. De financiële markten noteerden in de
maand juni al lager (gedaalde koersen). Het officiële begin van de crisis wordt meestal in juli of
augustus geplaatst doordat in die periode het investeringsfonds van Bear Stearns in hypotheken ten
onder ging19
. Op figuur 20 wordt deze periode grafisch voorgesteld. De voorspellingen die worden
gegenereerd uit de modellen kunnen vergeleken worden met de BV omdat deze al begint in het jaar
2000.
Figuur 20: Voorspellingsperiode: Bull markt (bron: Datastream, eigen werk)
4.8.2 ‘Bear’-markt
Een ‘bear’-markt wordt gekenmerkt door een algemene neerwaartse trend in de prijzen van een
financieel product. Dit soort markten wordt vooral gekenmerkt door een algemeen pessimisme en
angst onder de investeerders. Een exacte definitie van een ‘bear’-markt bestaat er niet, maar er bestaat
19
Sloan (2009)
Tijd
Pri
js B
EL 2
0-i
nd
ex
66
wel een uiteenlopend aantal percepties. Zo definieert de Amerikaanse investeringsfirma ‘The
Vanguard Group’ een bear markt als: ‘een prijsdaling van meer dan 20% over een periode van
minimum twee maanden’20
. Voor deze studie wordt een minder strenge definitie van een ‘bear’-markt
gehanteerd. Hier is het vooral belangrijk dat er een duidelijke neerwaartse trend is.
In de BEL 20 dataset zijn de schattings- en voorspellingsperiode voor de ‘bear’ markt als volgt
bepaald:
Schattingsperiode: 15/07/1992-04/06/2007
Voorspellingsperiode: 05/06/2007-10/11/2010
Het begin van deze voorspellingsperiode werd bepaald door het einde van de voorspellingsperiode van
de ‘bear’ markt. Het einde van de voorspellingsperiode is eigen aan de dataset van de BV die eindigt
op 10 november 2010 zoals beschreven is in Hoofdstuk 4 deel 4.5. In figuur 21 wordt deze
voorspellingsperiode grafisch weergegeven. De grijze zone duidt de voorspellingsperiode aan en de
rode zone duidt de periode aan die waarvan er geen waarden voor de BV konden gevonden worden.
Figuur 21: Voorspellingsperiode: Bear markt (bron: Datastream, eigen werk)
20
Zie The Vanguard Group (2012)
Tijd
Pri
js B
EL 2
0-i
nd
ex
67
HOOFDSTUK 5
RESULTATEN EMPIRISCH ONDERZOEK
5.1 INLEIDING In dit hoofdstuk zullen de resultaten en enkele praktische elementen van het empirisch onderzoek
besproken worden. In Hoofdstuk 2 werden de analytische “range” schatters geïdentificeerd die extra
informatie zouden moeten toevoegen aan de econometrische modellen. In ditzelfde hoofdstuk werd
ook een basis meegegeven voor het interpreteren van en het werken met GARCH-modellen. In
Hoofdstuk 3 werd vooreerst het onderzoeksopzet van deze studie besproken. In dit onderzoeksopzet
werden er drie delen van het onderzoek gedefinieerd. Voor elk deelonderzoek werd dan een hypothese
opgesteld en de specificaties van de modellen meegegeven die zullen gebruikt worden tijdens het
schatten en het voorspellen met deze modellen. Verder werd in Hoofstuk 3 deel 3.4 werden de
beoordelingsmethoden besproken. Op basis van deze beoordelingsmethoden zullen de verschillende
modellen vergeleken worden. Hieruit zal dan blijken welke methoden het best in staat zijn om zo
accuraat mogelijk voorspellingen te maken. Hoofdstuk 4 tenslotte behandelde de data, gaande van de
‘baseline’ volatiliteit zelf tot de eigenschappen van de analytische “range” schatters. Er werden in dit
hoofdstuk ook twee periodes gedefinieerd die zullen worden gebruikt in deel 3 van het onderzoek.
Tevens werd er ook een ARCH-LM-test uitgevoerd om aan te tonen dat de ARCH-effecten kunnen
gevat worden door GARCH-modellen in het algemeen.
Dit hoofdstuk is opgedeeld in twee delen. Ten eerste wordt er in deel 5.2 een aantal praktische zaken
met betrekking tot het schatten met econometrische modellen besproken. In ditzelfde deel wordt ook
vermeld waar de output voor elk model kan gevonden worden in de bijlage en hoe de tabellen moeten
gelezen worden. Deel 5.3 bevat de rapportering en de bespreking van de resultaten.
5.2 PRAKTISCHE ELEMENTEN EN VERDUIDELIJKING VAN DE OUTPUT VAN HET EMPIRISCH ONDERZOEK
Bij het praktisch uitvoeren van de schattingen in Eviews moeten nog een paar extra elementen worden
meegegeven die van belang zijn.
Het eerste element is het al dan niet gebruiken van een Bollerslev-Wooldridge correctie zoals reeds
werd aangehaald in Hoofdstuk 2 deel 2.5. Bij het schatten van de modellen werd er dus gekeken naar
de normaliteit van de gestandaardiseerde storingstermen. Indien deze niet normaal verdeeld waren,
werd een Bollerslev-Wooldridge correctie toegepast op de standaardfouten en de p-waarden om
correct de significantie van de coëfficiënten te testen. Indien deze toch normaal verdeeld waren,
68
werden de initiële standaardfouten en p-waarden van de output gebruikt. Normaliteit van de
gestandaardiseerde storingstermen komt in dit onderzoek echter niet veel voor.
De output van de verschillende modellen zijn te vinden in de appendix voor ieder deel van het
onderzoek:
Appendix E: De output van de overdraagbaarheidstudie (deel 1).
Appendix F: De output van het hoofdonderzoek (deel 2).
Appendix G: De output van het onderzoek over verschillende tijdsperiodes (deel 3).
Er moet opgemerkt worden dat de output die verkregen wordt door Eviews per model niet volledig
wordt weergegeven in de appendices. Wel is het zo dat de belangrijkste elementen voor dit onderzoek
uit de output werden gehaald en in tabellen werd samengevat. Voor deel 1 en deel 2 zijn er ook
grafieken toegevoegd die de voorspelling van de volatiliteit vergelijkt met de ‘baseline’-volatiliteit.
Voor deel 3 werd er geopteerd om deze grafieken niet op te nemen in bijlage om deze wat te beperken
in grootte. De grafieken voor deel 3 zullen op het eerste zicht overeenkomen met de grafieken uit deel
1 en deel 2 al naargelang de tijdsperiode. Voor effectieve verschillen te zien in deel 3 wordt er dan ook
best gekeken naar de uitkomsten van de voorspellingsbeoordelingsmethoden.
De output voor de modellen die de variabelen DRt-1 en LRt-1 gebruiken om te gaan voorspellen kunnen
gevonden worden in de kolommen met de afkortingen DR en LR respectievelijk. Voor de modellen
die geschat werden met de schatters 2ˆx
, moet er in de kolom gekeken worden naar het nummer na
de E in subscript, waarbij dit nummer het nummer van de schatter aangeeft. Zo kunnen bijvoorbeeld
de coëfficiënten van het model dat met schatter 2
0 werd geschat, afgelezen worden uit de kolom met
als hoofding E0. Voor de duidelijkheid wordt in tabel 9 weergegeven welk model in welke kolom kan
gevonden worden in de output:
MODEL OUTPUTKOLOM
[GJR-][E]GARCH- 2
0 → E0
[GJR-][E]GARCH-2
1 → E1
[GJR-][E]GARCH-2
2 → E2
[GJR-][E]GARCH- 2
3 → E3
[GJR-][E]GARCH-2
4 → E4
[GJR-][E]GARCH- 2
5 → E5
[GJR-][E]GARCH- 2
6 → E6
[GJR-][E]GARCH- 2
7 → E7 Tabel 9: Verduidelijking outputkolommen (bron: eigen werk)
69
De coëfficiënten en andere statistieken worden telkens weergegeven op vier cijfers na de komma of
minder. Dit wordt zo gedaan om duidelijk de verschillen te kunnen zien tussen de statistieken van
verschillende modellen omdat de veranderingen in sommige statistieken eerder aan de kleine kant
zullen zijn.
De significantie van de coëfficiënten wordt weergegeven door middel van de sterren rechts van de
coëfficiënt. Het aantal sterren stelt een bepaald niveau van significantie voor volgens de verdeling die
in tabel 10 gegeven is.
Niveau van significantie Aanduiding
1% niveau van significantie ***
5% niveau van significantie **
10% niveau van significantie * Tabel 10: Significantieniveaus (bron: eigen werk)
Verder worden ook de uitkomsten van de verschillende beoordelingsmethoden weergegeven in de
tabellen. In deel 5.3 dat hierop volgt, staan deze uitkomsten weergegeven in grafieken om een
duidelijk overzicht te krijgen van welke methodes het best presteren op de verschillende
beoordelingscriteria. Er moet opgemerkt worden dat lang niet alle modellen in deze grafieken worden
weergegeven maar enkel diegene die resultaten uitkomen die de moeite waard zijn om te vermelden.
Er zal wel aangegeven worden per deel welke modellen ondermaats presteerden en dus niet in de
grafieken worden opgenomen.
In het Hoofdstuk 2 deel 2.5.3 werd gesteld dat de coëfficiënten van GARCH- en GJR-GARCH-
modellen niet negatief mochten zijn om te garanderen dat de variantie positief zou uitvallen. Dit is
omdat de volatiliteit niet negatief kan zijn. Bij EGARCH is dit echter wel toegelaten omdat de
natuurlijke logaritme van de variantie als afhankelijke variabele wordt genomen en daardoor de
volatiliteit dus niet negatief kan uitvallen. Als er naar de output wordt gekeken in de appendix, kan
besloten worden dat aan deze non-negativiteitvoorwaarden voldaan zijn in de GARCH- en de GJR-
GARCH-modellen. De EGARCH-modellen bevatten wel negatieve coëfficiënten maar dit is dus
toegestaan.
Voorspellingen die verkregen worden uit de output van de modellen in Eviews dienen nog een
transformatie te ondergaan zodat ze vergelijkbaar zijn met de BV. De BV is een volatiliteitindex
(VIX) die impliciet berekend is uit optieprijzen. De specifieke berekening van een VIX kan gevonden
worden in het document Chicago Board Options Exchange (2009). De VIX in dit document wordt
berekend op basis van de verwachting voor de volatiliteit van de S&P 500-index voor de komende 30
dagen. Het berekeningsprincipe is voor de BV in deze studie dezelfde als in dit document omdat de
BV in deze studie ook berekend is op basis van de verwachte volatiliteit voor de komende 30 dagen
van de onderliggende index (supra, p.58). Uit dit document kan afgeleid worden dat in de berekening
70
voor de VIX met de standaarddeviatie wordt gewerkt en dat de VIX ‘annualized’ is. Aangezien de
ruwe voorspellingen voor de volatiliteit, die verkregen wordt uit de modellen in Eviews, de dagelijkse
varianties zijn, moeten er nog transformaties op deze voorspellingen worden toegepast. De dagelijkse
voorspelde variantie wordt omgezet naar een ‘annualized’ volatiliteit reeks, die ook moet uitgedrukt
staan in standaarddeviaties zoals de BV. De transformaties die moeten worden uitgevoerd, zijn
gebaseerd op Cabrera (2011) en worden beschreven in de volgende stappen:
1. Uit de output van de GARCH-modellen wordt de dagelijkse variantie verkregen. Deze
variantie wordt omgezet in de dagelijkse standaardafwijking door de vierkantswortel
te nemen van de variantie
2. Deze dagelijkse standaardafwijking moet nu de ‘annualized’ standaardafwijking
worden. Dit wordt gedaan door te vermenigvuldigen met de vierkantswortel van het
aantal dagen dat er verhandelt wordt op een jaar. Hier in deze studie zal men er van
uitgaan dat het aantal dagen dat er verhandeld wordt op een jaar gelijk is aan 252. Dus
moet de dagelijkse standaardafwijking vermenigvuldigd worden met de
vierkantswortel van 252.
5.3 RESULTATEN EN INTERPRETATIE
5.3.1 Overdraagbaarheidsstudie
De resultaten voor dit deel van het onderzoek is terug te vinden in appendix E zoals reeds vermeld.
Hierin valt meteen op dat de meeste van de coëfficiënten in alle modellen significant zijn op enkele
uitzonderingen na. Zo blijkt dat de constante in de VE zowel in het GARCH-DR-LR model als in het
GJR-GARCH-DR-LR model niet significant is. Ook is de variabele DRt-1 niet significant in het
combinatiemodel met GJR-GARCH en EGARCH als basis. Verder is LRt-1 niet significant in het
combinatiemodel met als basis GARCH en GJR-GARCH. Belangrijk om op te merken in dit deel is
dat de coëfficiënt voor variabele LRt-1 significant is op 1% niveau van significantie terwijl de variabele
DRt-1 in dit model niet significant is. Dit zal voornamelijk het gevolg zijn van zowel EGARCH als de
variabele LRt-1 in logaritmen. De infocriteria wijzen naar het EGARCH-LR model als beste model om
de volatiliteit te modelleren. Hiervan zal opnieuw waarschijnlijk de logaritmische vorm aan de basis
liggen. Het ‘leverage’ effect is significant in alle modellen van zowel GJR-GARCH als EGARCH. Dit
duidt op het feit dat een negatieve schok aan de prijzen gemiddeld een grotere volatiliteit met zich
meebrengt dan een positieve schok. De indicatoren voor de returnvoorspellingen duiden alle drie GJR-
GARCH aan als beste model. De Covariantie proportie van de returnvoorspelling wordt dan weer
gemaximaliseerd in het EGARCH-LR model.
In figuur 22 zijn de voornaamste indicatoren voor de variantievoorspelling van dit deel terug te vinden
in grafieken. De RMSE (luik a) is het kleinst voor het EGARCH en het EGARCH-LR model. De
MAE (luik b) en de MAPE (luik c) daarentegen worden het kleinst voor GJR_GARCH en GJR-
71
GARCH-DR-LR. Regressies van de voorspelling op de echte volatiliteit wijzen uit dat opnieuw
EGARCH en EGARCH-LR de beste modellen zijn (deel d & e). De R-kwadraat (luik d) van beide
regressies is het hoogste bij deze modellen. In de regressie met een constante, die een waarde
verschillend van nul kan aannemen, zit 1 het dichtst bij nul en 2 het dichtst bij één voor deze
modellen (luik e & f). Dit wil zeggen dat de beste benadering van de BEL 20-volatiliteitindex de
voorspellingen van het EGARCH of het EGARCH-LR model zijn. Opvallend is wel dat als er aan de
constante een nul voorwaarde wordt opgelegd dat 2 het dichtst bij één nadert maar dat de R
kwadraat wel kleiner uitvalt dan deze van het EGARCH(-LR) model onder deze nul voorwaarde voor
de constante.
Figuur 22: Samenvattende grafieken voorspellingsbeoordeling deel 1 (bron: Datastream, eigen werk)
Uit deze resultaten blijkt dat het EGARCH-model als basismodel beter presteert dan een gewoon
GARCH-model of een GJR-GARCH-model. In het bijzonder kan EGARCH-LR als beste model
worden aangeduid. Dit is op zich al een bewijs dat er weldegelijk betere voorspellingen van de
volatiliteit kunnen gemaakt worden door toevoeging van ‘range’ schatters. Hypothese A is hierbij dus
4,5000
5,0000
5,5000
6,0000
6,5000
7,0000
RMSE
RMSE
3,0000
3,2000
3,4000
3,6000
3,8000
4,0000
4,2000
MAE
MAE
0,1000
0,1200
0,1400
0,1600
0,1800
0,2000
MAPE
MAPE0,6000
0,6500
0,7000
0,7500
0,8000
0,8500
0,9000
0,9500
1,0000
GA
RC
H
GA
RC
H-D
R
GA
RC
H-L
R
GA
RC
H-D
R-L
R
GJR
-GA
RC
H
GJR
-GA
RC
H-D
R
GJR
-GA
RC
H-L
R
GJR
-GA
RC
H-D
R-L
R
EG
AR
CH
EG
AR
CH
-DR
EG
AR
CH
-LR
EG
AR
CH
-DR
-LR
Correlatiecoëfficiënt
R kwadraat c=0
R kwadraat c≠0
0,6
0,7
0,8
0,9
1
1,1
1,2
1
φ2 c=0
φ2 c≠00,0000
1,0000
2,0000
3,0000
4,0000
5,0000
6,0000
7,0000
8,0000
φ1
φ1
(a) (b)
(d)(c)
(e) (f)
72
algemeen aanvaard. Als hypothese A binnen elk basismodel geëvalueerd wordt, dan kan besloten
worden dat bij zowel GARCH als GJR-GARCH de toevoeging van DRt-1 betere voorspellingen levert.
Het omgekeerde is waar bij het basismodel EGARCH. Hier levert de toevoeging van DRt-1 aan de
specificatie geen extra informatie. In figuur 23 wordt de variantievoorspelling van het EGARCH-LR
model uitgezet tegenover de echte volatiliteit, nl. de BEL 20-volatiliteitsindex. In deze grafiek wordt
de echte volatiliteit goed benaderd door de voorspelde waarden. Er zitten echter periodes in met ofwel
een grote onderschatting van de volatiliteit ofwel een grote overschatting van de volatiliteit. Zo is er in
de periode van eind 2008 tot midden 2009 een serieuze onderschatting van de volatiliteit. In periodes
met een piek zoals in midden 2006, midden 2008 of begin 2009 wordt de volatiliteit overschat.
Figuur 23: Grafiek voorspelde volatiliteit met EGARCH-LR (bron: Datastream, eigen werk)
Deze grafiek is ook terug te vinden in de bijlage. In deze bijlage werden de grafieken van de andere
modellen eveneens opgenomen om aan te tonen dat alle modellen een goede benadering zijn van de
‘baseline’ volatiliteit. Uit de grafieken kan ook worden afgeleid dat het EGARCH-LR model minder
aan overschatting van de volatiliteit zal doen dan andere modellen en ook sneller zal terugkeren naar
een kleinere waarde dan andere modellen. Dit is bijvoorbeeld het geval tussen 21/4/2006 en
17/11/200621
.
5.3.2 Hoofdonderzoek
In appendix F kunnen de resultaten van dit deelonderzoek gevonden worden. Voor de GARCH-
modellen zijn alle schatters significant met uitzondering van schatter 7. Hetzelfde geldt voor de GJR-
GARCH-modellen en de EGARCH-modellen. De constante in het model GJR-GARCH is ook niet
significant. Hoewel de coëfficiënten significant zijn, de meeste zelfs op 10% niveau van significantie,
is het zo dat de coëfficiënten heel klein zijn. In de output wordt er tot 4 cijfers na de komma
21
Op de grafiek is dit tussen 4/21/2006 en 11/17/2006 want de maand wordt in de grafiek eerst geplaatst.
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
EGARCH-logrange forecast
73
weergegeven waardoor de coëfficiënten in de tabellen voor de meeste modellen 0,0000 zal zijn. Deze
kleine coëfficiënten zijn het gevolg van de schaal waarin de afhankelijke en de onafhankelijke
variabelen zijn uitgedrukt. Dit werd reeds vermeld in Hoofdstuk 4 en is op zich geen probleem. Het
AIC wordt geminimaliseerd in het model GJR-GARCH-E3 en het SBC wordt geminimaliseerd voor
GJR-GARCH-E1. Als er naar de returnvoorspelling wordt gekeken, kan besloten worden dat er niet
veel verschil is tussen alle modellen omdat het meestal maar gaat om een heel kleine verandering in de
RMSE, MAE en de MAPE. GJR-GARCH-E7 presteert het best qua returnvoorspelling.
In figuur 24 worden de RMSE, de MAE en de MAPE per model weergegeven voor de
variantievoorspelling. Uit deze grafiek en de specifieke cijfers in de tabellen in de appendix kan er
besloten worden dat het EGARCH-E7 model het best is in het minimaliseren van deze
beoordelingsmethoden. Hoewel het EGARCH-E7 model superieur is in het minimaliseren van de
RMSE, biedt het GARCH-E7 model ook een sterke minimalisatie van de MAE aan. Ditzelfde model
is wel beter dan het EGARH-E7 model in het minimaliseren van de MAPE.
Figuur 24: Grafieken RSME, MAE, MAPE deel 2 (bron: Datastream, eigen werk)
Figuur 25 geeft de output weer van de regressies van de BEL 20-volatiliteitindex op de voorspelde
volatiliteit. De correlatiecoëfficiënt is het hoogst voor alle modellen met de schatter E7. Bij de
regressie waarop aan de constante een nul voorwaarde werd opgelegd zijn de resultaten voor de R
4,0000
4,5000
5,0000
5,5000
6,0000
6,5000
RMSE
RMSE
3,4000
3,5000
3,6000
3,7000
3,8000
3,9000
4,0000
4,1000
MAE
MAE
0,1500
0,1550
0,1600
0,1650
0,1700
0,1750
0,1800
0,1850
0,1900
0,1950
MAPE
MAPE
74
kwadraat niet zo duidelijk. Wel kan gezegd worden dat EGARCH-E7 er het best uitkomt. De
coëfficiënt voor 2 is in deze regressie minder duidelijk te onderscheiden van één waardoor er niet
echt een beste model kan worden aangegeven. Het is wel zo dat indien er geen nul voorwaarde aan de
coëfficiënt wordt opgelegd dan ligt 2 van het EGARCH-E7 model het dichtst bij één en levert het
dus de beste prestatie in de volatiliteit voorspellen. De 1 van dit model in diezelfde regressie
benadert de nul het dichtst. Dit brengt ons tot het besluit dat EGARCH-E7 het beste model is in dit
deel van het onderzoek.
Figuur 25: Grafieken regressie- en correlatieoutput deel 2 (bron: Datastream, eigen werk)
Als we de grafiek van de voorspelde waarden voor de volatiliteit van het EGARCH-E7 modellen
bekijken (figuur 26) dan valt er op te merken dat er relatief weinig overschatting is. Het probleem van
de vorige modellen was vooral dat er in perioden met een duidelijke piek in de BEL 20-
volatiliteitindex er een overschatting was van de volatiliteit. Dit kan niet alleen opgemerkt worden in
de grafieken van deel 1 van dit onderzoek maar ook in de grafieken van de modellen in deel 2.
Schatter E7, nochtans niet significant, zorgt ervoor dat er gematigder op een schok in de volatiliteit
gereageerd wordt zodat er geen extreme overschatting plaatsvindt. De mogelijke verklaring voor het
niet-significant zijn van schatter E7 is dat de verdeling meer ‘at random’ is. De verdelingen van de
andere zes schatters zijn zodanig dat de meeste waarden geconcentreerd zijn in de linkerkant van de
verdeling. In deze verdelingen zijn er toch een relatief groot aantal extremen te vinden. Deze extremen
zijn buitenproportionele reacties op een grote prijswijziging. Dit is echter geen fout in de berekening
van de schatters maar is inherent aan de formulering van deze schatters. Deze overreactie op grote
prijswijzigingen kan een verklaring zijn voor een systematisch overschatten van pieken in de
0,6000
0,6500
0,7000
0,7500
0,8000
0,8500
0,9000
0,9500
1,0000
Correlatiecoëfficiënt
R kwadraat c=0
R kwadraat c≠0
0,6000
0,6500
0,7000
0,7500
0,8000
0,8500
0,9000
0,9500
1,0000
1,0500
1,1000
φ2 c=0
φ2 c≠0
1,0000
75
volatiliteit voor de schatter één tot en met zes. Dit overschatten kan ook in de grafieken in appendix F
gevonden worden. In deze appendix zijn de resultaten van de combinatiemodellen ook weergegeven.
Deze modellen slagen er echter niet in om beter te doen dan een groot deel van de modellen met één of
twee extra termen.
Figuur 26: Grafiek voorspelde volatiliteit met EGARCH-E7 (bron: Datastream, eigen werk)
Onderschatting van de volatiliteit in het EGARCH-E7 model blijft echter nog steeds een probleem. Dit
kan in de grafiek duidelijk gezien worden voor een groot deel van de voorspellingsperiode. Een
belangrijke onderschatting in de voorspellingsperiode blijft de periode van begin 2009 tot eind 2009
ongeveer. Deze periode wordt in figuur 26 weergegeven door de doorschijnende groene zone. Dit
probleem van onderschatting is een algemeen probleem dat in alle modellen aanwezig zijn.
Uit de resultaten van dit onderzoek kan ook nog afgeleid worden dat het toevoegen van een term, die
de periode incorporeert waarin trading gesloten, geen betere voorspellingen voor de volatiliteit levert
maar eerder slechter in staat is om voorspellingen te doen. Dit wordt afgeleid uit het feit dat het
toevoegen van schatter E0 betere resultaten levert dan het toevoegen van schatter E1 en dat het
toevoegen van schatter E2 betere resultaten levert dan het toevoegen van E3. Dit geldt voor GARCH en
de twee varianten. Hiermee kan besloten worden dat hypothese B.2 niet opgaat.
Uit deel 1 van het onderzoek is gebleken dat het EGARCH-LR model de beste voorspellingen voor de
volatiliteit levert. Als dit resultaat nu vergeleken wordt met wat er in dit deel als resultaat bekomen
wordt dan kan er besloten worden dat het EGARCH-E7 model en het EGARCH-LR model aan elkaar
gewaagd zijn. Toch presteert het EGARCH-LR model nog iets beter. Door de insignificant zijn van de
schatter E7 zou er eigenlijk kunnen gezegd worden dat het EGARCH-E7 model een gewoon
EGARCH-model benadert. Dit wordt bevestigd door een quasi gelijke R kwadraat voor beide
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
EGARCH-E7 forecast
76
regressies (c=0 en c≠0) en een gelijke correlatiecoëfficiënt. In deel 1 was het EGARCH-model ook
ondergeschikt aan het EGARCH-LR model, ditzelfde blijkt hier ook maar dan voor het EGARCH-E7
model. Algemeen mag er dus besloten worden dat modellen met de ‘range’ schatters niet in staat zijn
om betere voorspellingen van de volatiliteit te leveren. Er kan algemeen gesteld worden dat hypothese
B.1 kan verworpen gezien geen enkel model er in slaagt om betere voorspellingen te leveren voor de
volatiliteit in vergelijking met de modellen in deel 1.
5.3.3 Volatiliteitsonderzoek in verschillende tijdsperiodes
In deel 3 van het onderzoek wordt er onderzocht of de gezamenlijke bevindingen van deel 1 en deel 2
nog gelden naargelang de staat waarin de markt zich bevind. Ten eerste wordt de ‘bull’-markt
behandeld en ten tweede komt de ‘bear’-markt aan bod.
5.3.3.1 ‘bull’-markt Deze periode wordt vooral gekenmerkt door lage volatiliteit in de prijs van de BEL 20-index. In de
prijzen van de BEL 20-index valt wel een geleidelijke sterke stijging op te merken maar dit gaat
gepaard met lage volatiliteit.
Dezelfde bevindingen als in deel 2 op vlak van de significantie van de ‘range’ schatters kunnen
gevonden worden in dit deel. Opnieuw is dus de schatter E7 in het model GARCH-E7 niet significant.
Opmerkelijk is ook dat de ‘daily range’ en de ‘log range’ niet significant zijn in het combinatiemodel
GATRCH-DR-LR. Hetzelfde geld voor de GJR-GARCH-modellen. Bij de EGARCH-modellen is de
variabele LRt-1 in het combinatiemodel nu wel significant. Dit komt waarschijnlijk omdat er met
logaritmen gewerkt wordt in deze variabele waardoor het beter aansluit bij EGARCH.
In figuur 27 wordt de RMSE, de MAE en de MAPE voor de verschillende modellen weergegeven.
EGARCH-E7 presteert het best op vlak van het minimaliseren van de drie indicatoren. Voor de MAE
en de MAPE bieden GARCH-E7, GARCH-DR en GARCH-DR-LR ook concurrentiële
voorspellingkracht. De returnvoorspelling ligt opnieuw in lijn met wat er gevonden werd onder deel 1
en deel 2 van dit onderzoek.
77
Figuur 27: Grafieken RSME, MAE, MAPE deel 3 ‘bull’-markt (bron: Datastream, eigen werk)
In figuur 28 worden opnieuw de belangrijkste statistische indicatoren in verband met de
variantievoorspelling weergegeven. De correlatiecoëfficiënt is opnieuw het hoogst voor het
EGARCH-LR model. Het tweede beste model dat de correlatiecoëfficiënt maximaliseert is het
EGARCH-model. Dezelfde resultaten als voor EGARCH kunnen gevonden worden voor het
EGARCH-E7, dit heeft waarschijnlijk opnieuw te maken met de schatter E7 die niet significant is. In
de regressie met een constante die verschillend mag zijn van nul blijkt dat opnieuw het EGARCH-LR
model de beste voorspellingen levert, waarbij EGARCH-DR-LR concurrentiële voorspellingen levert.
De regressies met een constante waaraan een nul voorwaarde wordt opgelegd, leveren inconsistente
resultaten met de rest van de beoordelingsmethoden. Dit trekt de waarde van dit beoordelingscriterium
in vraag. In figuur 28 zijn de meeste EGARCH-modellen niet opgenomen omdat deze minder dan
gemiddeld presteerden en dus niet het vermelden waard zijn. De resultaten en de grafieken van deze
modellen worden wel in appendix G meegegeven. Op deze grafieken valt vooral een grote
overschatting van de volatiliteit op. Opnieuw is het zo dat de combinatiemodellen er niet in slagen om
betere voorspellingen te leveren.
3,00003,20003,40003,60003,80004,00004,20004,40004,60004,8000
GARC
H-E
0
GARC
H-E
1
GARC
H-E
2
GARC
H-E
3
GARC
H-E
4
GARC
H-E
5
GARC
H-E
6
GARC
H-E
7
GARC
H
GARC
H-D
R
GARC
H-L
R
GARC
H-D
R-LR
GJR-
GARC
H E
0
GJR-
GARC
H E
1
GJR-
GARC
H E
2
GJR-
GARC
H E
3
GJR-
GARC
H E
4
GJR-
GARC
H E
5
GJR-
GARC
H E
6
GJR-
GARC
H E
7
GJR-
GARC
H
GJR-
GARC
H-D
R
GJR-
GARC
H-L
R
GJR-
GARC
H-D
R-…
EGAR
CH E
0
EGAR
CH E
1
EGAR
CH E
2
EGAR
CH E
3
EGAR
CH E
4
EGAR
CH E
5
EGAR
CH E
6
EGAR
CH E
7
EGAR
CH
EGAR
CH-D
R
EGAR
CH-L
R
EGAR
CH-D
R-LR
RMSE
RMSE
2,0000
2,2000
2,4000
2,6000
2,8000
3,0000
3,2000
GARC
H-E
0
GARC
H-E
1
GARC
H-E
2
GARC
H-E
3
GARC
H-E
4
GARC
H-E
5
GARC
H-E
6
GARC
H-E
7
GARC
H
GARC
H-D
R
GARC
H-L
R
GARC
H-D
R-LR
GJR-
GARC
H E
0
GJR-
GARC
H E
1
GJR-
GARC
H E
2
GJR-
GARC
H E
3
GJR-
GARC
H E
4
GJR-
GARC
H E
5
GJR-
GARC
H E
6
GJR-
GARC
H E
7
GJR-
GARC
H
GJR-
GARC
H-D
R
GJR-
GARC
H-L
R
GJR-
GARC
H-D
R-…
EGAR
CH E
0
EGAR
CH E
1
EGAR
CH E
2
EGAR
CH E
3
EGAR
CH E
4
EGAR
CH E
5
EGAR
CH E
6
EGAR
CH E
7
EGAR
CH
EGAR
CH-D
R
EGAR
CH-L
R
EGAR
CH-D
R-LR
MAE
MAE
0,14000,15000,16000,17000,18000,19000,20000,2100
GARC
H-E
0
GARC
H-E
1
GARC
H-E
2
GARC
H-E
3
GARC
H-E
4
GARC
H-E
5
GARC
H-E
6
GARC
H-E
7
GARC
H
GARC
H-D
R
GARC
H-L
R
GARC
H-D
R-LR
GJR-
GARC
H E
0
GJR-
GARC
H E
1
GJR-
GARC
H E
2
GJR-
GARC
H E
3
GJR-
GARC
H E
4
GJR-
GARC
H E
5
GJR-
GARC
H E
6
GJR-
GARC
H E
7
GJR-
GARC
H
GJR-
GARC
H-D
R
GJR-
GARC
H-L
R
GJR-
GARC
H-D
R-…
EGAR
CH E
0
EGAR
CH E
1
EGAR
CH E
2
EGAR
CH E
3
EGAR
CH E
4
EGAR
CH E
5
EGAR
CH E
6
EGAR
CH E
7
EGAR
CH
EGAR
CH-D
R
EGAR
CH-L
R
EGAR
CH-D
R-LR
MAPE
MAPE
78
Figuur 28: Grafieken regressie- en correlatieoutput deel 3 ‘bull’-markt (bron: Datastream, eigen werk)
Figuur 29 is een weergave van de voorspellingen ten opzichte van de ‘baseline’ volatiliteit. In deze
figuur kan gemerkt worden dat de meest pieken goed benaderd worden door het model maar de
onderschatting van de volatiliteit in sommige periodes nog steeds aan de orde is. Overschatting van de
volatiliteit daarentegen is minimaal.
Figuur 29: Grafiek voorspelde volatiliteit met EGARCH-LR (bron: Datastream, eigen werk)
0,50000,55000,60000,65000,70000,75000,80000,85000,90000,95001,0000
GA
RC
H-E
0
GA
RC
H-E
1
GA
RC
H-E
2
GA
RC
H-E
3
GA
RC
H-E
4
GA
RC
H-E
5
GA
RC
H-E
6
GA
RC
H-E
7
GA
RC
H
GA
RC
H-D
R
GA
RC
H-L
R
GA
RC
H-D
R-L
R
GJR
-GA
RC
H E
0
GJR
-GA
RC
H E
1
GJR
-GA
RC
H E
2
GJR
-GA
RC
H E
3
GJR
-GA
RC
H E
4
GJR
-GA
RC
H E
5
GJR
-GA
RC
H E
6
GJR
-GA
RC
H E
7
GJR
-GA
RC
H
GJR
-GA
RC
H-D
R
GJR
-GA
RC
H-L
R
GJR
-GA
RC
H-D
R-L
R
EG
AR
CH
E0
EG
AR
CH
E1
EG
AR
CH
E2
EG
AR
CH
E3
EG
AR
CH
E4
EG
AR
CH
E5
EG
AR
CH
E6
EG
AR
CH
E7
EG
AR
CH
EG
AR
CH
-DR
EG
AR
CH
-LR
EG
AR
CH
-DR
-LR
Correlatiecoëfficiënt
R kwadraat c=0
R kwadraat c≠0
0,6000
0,7000
0,8000
0,9000
1,0000
1,1000
1,2000
GA
RC
H-E
0
GA
RC
H-E
1
GA
RC
H-E
2
GA
RC
H-E
3
GA
RC
H-E
4
GA
RC
H-E
5
GA
RC
H-E
6
GA
RC
H-E
7
GA
RC
H
GA
RC
H-D
R
GA
RC
H-L
R
GA
RC
H-D
R-L
R
GJR
-GA
RC
H E
0
GJR
-GA
RC
H E
1
GJR
-GA
RC
H E
2
GJR
-GA
RC
H E
3
GJR
-GA
RC
H E
4
GJR
-GA
RC
H E
5
GJR
-GA
RC
H E
6
GJR
-GA
RC
H E
7
GJR
-GA
RC
H
GJR
-GA
RC
H-D
R
GJR
-GA
RC
H-L
R
GJR
-GA
RC
H-D
R-L
R
EG
AR
CH
E0
EG
AR
CH
E1
EG
AR
CH
E2
EG
AR
CH
E3
EG
AR
CH
E4
EG
AR
CH
E5
EG
AR
CH
E6
EG
AR
CH
E7
EG
AR
CH
EG
AR
CH
-DR
EG
AR
CH
-LR
EG
AR
CH
-DR
-LR
φ2 c=0
φ2 c≠0
1
79
5.3.3.2 ‘Bear’ market De ‘bear’-markt, die wordt bestudeerd in deze studie, is de kredietcrisis van na 2007. Deze periode
wordt gekenmerkt door een enorme daling in de prijs van de BEL 20-index. De helling van deze
daling is veel steiler dan de helling in de ‘bull’-markt die aan de crisis voorafging. Deze crisisperiode
is ook veel volatieler dan de ‘bull’ periode die hieraan voorafging, dit kan duidelijk opgemerkt worden
uit de grafiek van de BEL 20-volatiliteitsindex in figuur 16.
De significantie van de coëfficiënten van de ‘range’ schatters is dezelfde als deze in een ‘bull’-markt.
Zelfs in een ‘bear’ markt is de schatter E7 niet significant voor alle modellen. In de
combinatiemodellen met variabele DRt-1 en variabele LRt-1 is er alleen significantie van de variabele
LRt-1 in EGARCH. De SBC is het kleinste voor het EGARCH-LR model.
Figuur 30: Grafieken RSME, MAE, MAPE deel 3 'bear' markt (bron: Datastream, eigen werk)
In figuur 30 worden de RMSE, de MAE en de MAPE van de modellen in een ‘bear’ markt
weergegeven. De returnvoorspelling zal hier niet verder besproken worden aangezien deze slechts
marginaal betere resultaten levert. In figuur 31 worden opnieuw de resultaten van de regressies en de
correlatiecoëfficiënt weergegeven. De correlatiecoëfficiënt wijst in de richting van het EGARCH-LR
model. Het EGARCH-LR model wordt ook als beste model aangeduid door de R kwadraat die het
hoogste is voor dit model en een 2 die het dichtst bij 1 ligt. Dit zijn echter de resultaten voor een
regressie waarvoor de constante niet arbitrair op nul gezet is. De resultaten voor de regressies zonder
80
constante leveren opnieuw inconsistente resultaten met hetgeen er door de andere
beoordelingsmethoden wordt gevonden.
Figuur 31: Grafieken regressie- en correlatieoutput deel 3 'bear' markt (bron: Datastream, eigen werk)
De grafiek van het EGARCH-LR model dat het best de volatiliteit schat in een ‘bear’ markt wordt
weergegeven in figuur 32. In deze grafiek valt opnieuw een onderschatting van de volatiliteit op.
Overschatting is dan weer wel voldoende gereduceerd door het EGARCH-LR model.
Voor de ‘bear’-markt is het opnieuw zo dat de EGARCH-modellen met schatters 0 tot en met 6
weggelaten zijn uit de grafieken in figuren 30 en 31. Dit werd zo bepaald omdat deze modellen
ondermaats presteerden in vergelijking met de andere modellen.
Figuur 32: Grafiek voorspelde volatiliteit met EGARCH-LR (bron: Datastream, eigen werk)
0,5000
0,5500
0,6000
0,6500
0,7000
0,7500
0,8000
0,8500
0,9000
0,9500
1,0000G
ARC
H-E
0
GA
RCH
-E1
GA
RCH
-E2
GA
RCH
-E3
GA
RCH
-E4
GA
RCH
-E5
GA
RCH
-E6
GA
RCH
-E7
GA
RCH
GA
RCH
-DR
GA
RCH
-LR
GA
RCH
-DR-
LR
GJR
-GA
RCH
E0
GJR
-GA
RCH
E1
GJR
-GA
RCH
E2
GJR
-GA
RCH
E3
GJR
-GA
RCH
E4
GJR
-GA
RCH
E5
GJR
-GA
RCH
E6
GJR
-GA
RCH
E7
GJR
-GA
RCH
GJR
-GA
RCH
-DR
GJR
-GA
RCH
-LR
GJR
-GA
RCH
-DR-
LR
EGA
RCH
E7
EGA
RCH
EGA
RCH
-DR
EGA
RCH
-LR
EGA
RCH
-DR-
LR
Correlatiecoëfficiënt
R kwadraat (c=0)
R kwadraat (c≠0)
0,5000
0,6000
0,7000
0,8000
0,9000
1,0000
1,1000
1,2000
GA
RCH
-E0
GA
RCH
-E1
GA
RCH
-E2
GA
RCH
-E3
GA
RCH
-E4
GA
RCH
-E5
GA
RCH
-E6
GA
RCH
-E7
GA
RCH
GA
RCH
-DR
GA
RCH
-LR
GA
RCH
-DR-
LR
GJR
-GA
RCH
E0
GJR
-GA
RCH
E1
GJR
-GA
RCH
E2
GJR
-GA
RCH
E3
GJR
-GA
RCH
E4
GJR
-GA
RCH
E5
GJR
-GA
RCH
E6
GJR
-GA
RCH
E7
GJR
-GA
RCH
GJR
-GA
RCH
-DR
GJR
-GA
RCH
-LR
GJR
-GA
RCH
-DR-
LR
EGA
RCH
E7
EGA
RCH
EGA
RCH
-DR
EGA
RCH
-LR
EGA
RCH
-DR-
LR
φ2 (c=0)
φ2 (c≠0)
1
81
5.3.3.3 Besluit
Zowel in de ‘bull’-markt als in de ‘bear’-markt werden resultaten gevonden die in lijn liggen met wat
er in deel 1 en deel 2 van het onderzoek werd gevonden. Uit deel 3 kan er algemeen besloten worden
dat een opsplitsing in periodes naar gelang de status van de markt niets uitmaakt voor de prestaties van
alle modellen. Hiermee is duidelijk geworden dat hypothese C.1, die stelde dat de staat waarin de
markt zich bevindt een invloed heeft op welk model het best presteert, kan verworpen worden door het
feit dat EGARCH-LR nog steeds het beste model is voor de volatiliteit te voorspellen in periodes met
ofwel een lage volatiliteit, ofwel een hoge volatiliteit of periodes met een combinatie van hoge en lage
volatiliteit (zoals in deel 2).
Hypothese C.2, die stelde dat betere voorspellingen konden geleverd worden indien rekening
gehouden wordt met de periode waarin de beurs gesloten is, kan verworpen worden voor alle GJR-
GARCH-modellen en alle EGARCH-modellen in beide types markten, en alle GARCH-modellen in
de ‘bear’-markt. Dit omwille van het feit dat alle beoordelingsmethodes erop wijzen dat het
incorporeren van een term, die rekening houdt met de tijd waarin verhandelen gesloten is, geen
meerwaarde betekent voor het model en zelfs slechter gaat presteren hierdoor. Voor GARCH-
modellen daarentegen, kan hypothese C.2 niet duidelijk verworpen worden in een ‘bull’-markt omdat
de beoordelingsmethoden geen eenduidige resultaten leveren.
82
ALGEMEEN BESLUIT De focus van deze studie is het bekomen van betere voorspellingen van de volatiliteit die dan zouden
moeten leiden tot een betere waardering van financiële producten. Betere voorspellingen van de
volatiliteit in de toekomst heeft tot gevolg dat het risico dat gepaard gaat met een investering in zo een
financieel product beter kan ingeschat worden. Deze correctere inschatting van het risico zou dan
kunnen leiden tot een correctere prijsbepaling.
In de literatuur is er een grote basis aan modellen die trachten efficiënte en effectieve voorspellingen te
maken van de volatiliteit. Grotendeels wordt er in deze studie een opdeling gemaakt tussen traditionele
schatters, analytische schatters en econometrische modellen voor het schatten van de volatiliteit.
Centraal in deze studie staat het integreren van deze analytische schatters in econometrische modellen.
De centrale onderzoeksvraag is dan ook of deze uitgebreide econometrische modellen in staat zijn om
betere voorspellingen voor de volatiliteit te leveren. In de paper van Wang & Roberts (2004) werd
reeds de basis gelegd voor deze uitbreiding van bestaande econometrische modellen. In deze paper
werden twee ‘range’ schatters gedefinieerd: de dagelijkse range en de log range. Waarbij de dagelijkse
range het verschil is tussen de hoogste prijs en de laagste prijs van één dag. De log range is dan de
natuurlijke logaritme van dit verschil. In deze paper werd de dagelijkse range (DR) toegepast in een
GARCH-specificatie en de log range (LR) in een ARMA model. De auteurs van deze paper zijn tot het
besluit gekomen dat deze uitgebreide econometrische modellen weldegelijk tot betere voorspellingen
leiden. Dit deed de vraag rijzen of andere analytische schatters in staat zijn om extra informatie toe te
voegen aan econometrische modellen zoals GARCH en variaties op GARCH.
In deze scriptie werden een achttal analytische schatters en een aantal econometrische modellen
geïdentificeerd uit de literatuur. Deze schatters werden geïdentificeerd op basis van een aantal criteria.
Het eerste criterium is dat elke schatter die geïdentificeerd werd, een grotere efficiëntie had dan de
voorgaande schatter. Een tweede criterium was dat er enkele schatters werden opgenomen die
rekening hielden met de periode binnen één dag (24u) waarin de beurs gesloten is. Dit is van belang
omdat er zich tijdens die periodes onzichtbare prijsfluctuaties voordoen waardoor deze schatter in
principe extra informatie toevoegt ten opzichte van de andere schatters die hier geen rekening mee
houden. De econometrische modellen die werden geïdentificeerd zijn het GARCH-model van
(Bollerslev, 1986), het GJR-GARCH-model van (Glosten, Jagannathan, & Runkle, 1993) en het
EGARCH-model van (Nelson, 1991).
Het onderzoek bestaat uit drie grote delen. Het eerste deel onderzoekt of econometrische modellen met
DR en/of LR beter voorspellingen voor de volatiliteit leveren. Het tweede deel onderzoekt dan of
econometrische modellen met de achttal geïdentificeerde analytische schatters betere resultaten levert.
In deel 1 en deel 2 van het onderzoek wordt er over dezelfde periode voorspeld, namelijk van
2/01/2004 tot en met 10/11/2010. Het derde deel onderzoekt of de bevindingen die in deel 1 en deel 2
werden gevonden, nog steeds gelden voor bepaalde periodes die gekenmerkt worden door de staat
83
waarin de markt zich bevindt. Er werden twee soorten markten onderzocht, een ‘bull’-markt die loopt
van 14/03/2003 tot en met 4/06/2007 en een ‘bear’-markt die loopt van 5/06/2007 tot en met
10/11/2010. Hypothese A stelt in deel 1 van het onderzoek dat een GARCH-model (of variant) met
toevoeging van DR en/of LR betere resultaten levert dan een standaard GARCH-model (of variant). In
deel 2 zijn er twee hypothesen vooropgesteld. Hypothese B.1 stelt dat een GARCH-model met de
geïdentificeerde analytische schatters betere voorspellingen levert dan zonder deze schatters.
Hypothese B.2 stelt dat als een schatter informatie bevat over de periode waarin de beurs gesloten is,
deze schatter in een GARCH-model (of variant) betere voorspellingen zal leveren dan een schatter die
deze informatie niet bevat. In deel 3 van het onderzoek stelt hypothese C.1 dat de prestatie van een
model op vlak van voorspellen, wordt beïnvloed door de staat waarin de markt zich bevindt.
Hypothese C.2 van deel 3 is stelt opnieuw dat dat als een schatter informatie bevat over de periode
waarin de beurs gesloten is, deze schatter in een GARCH-model (of variant) betere voorspellingen zal
leveren dan een schatter die deze informatie niet bevat.
De voorspellingen voor de volatiliteit die verkregen worden uit de verschillende GARCH-modellen
(en varianten) worden vergeleken ten opzichte van een ‘baseline’ volatiliteit, die objectief en extern
berekend is. Deze ‘baseline’ volatiliteit is de BEL 20-volatiliteitsindex en wordt bepaald uit de prijzen
van de opties op de BEL 20. De voorspellingen worden beoordeeld enerzijds door de ‘Root Mean
Square Error (RMSE)’, de ‘Mean Absolute Error (MAE)’ en de ‘Mean Absolute Percentage Error
(MAPE)’ en anderzijds met regressies en correlatiecoëfficiënten. De RMSE, de MAE en de MAPE
zijn gebaseerd op de voorspellingsfout per dag, berekent als het verschil tussen de BEL 20-volatiliteit
en de voorspelling voor deze volatiliteit, bekomen als output van de econometrische modellen. Ook de
correlatiecoëfficiënt tussen de voorspelling en de ‘baseline’ werden berekend. Er werden ook
additionele regressies geschat met als afhankelijke variabele de BEL 20-volatiliteitsindex en als
onafhankelijke variabele de voorspelde volatiliteit. Uit deze regressies kan dan beoordeeld worden hoe
goed de voorspellingen bij de ‘baseline’ aansluiten door de R kwadraat en de coëfficiënten te
evalueren.
Uit een onderzoek naar de eigenschappen van de data die gebruikt worden in deze studie zijn er een
aantal dingen die dienen opgemerkt te worden. Ten eerste wordt geconcludeerd dat een GARCH-
model voldoende geschikt is om de returns van de BEL 20 te modelleren. Ten tweede werd er besloten
dat een AR(1)-model zou worden gebruikt als functionele vorm voor de ‘Mean equation (ME)’. Ten
derde moet opgemerkt worden dat de LR de enige schatter is die een normale verdeling benadert. Ten
vierde moet er vermeld worden dat de analytische schatters een vrij grote standaarddeviatie bezitten.
Ten slotte is het zo dat er een hoge correlatie is tussen de verschillende analytische schatters.
Uit de resultaten van deel 1 van het onderzoek werd besloten dat hypothese A niet algemeen kan
verworpen worden. Uit dit deel 1 van het onderzoek blijkt dat zowel modellen met DR als met LR
betere voorspellingen leveren dan standaard econometrische modellen. Deze resultaten liggen in lijn
met de bevindingen van Wang & Roberts (2004). Het EGARCH-LR model leverde de beste
84
resultaten. Dit komt waarschijnlijk door de logaritmische specificatie van het model en de schatter. De
LR op zich is ook beter in het vatten van de eigenschappen van volatiliteit. Er valt ook op te merken
dat de voorspellingen uit dit EGARCH-LR model grafisch goed de BEL 20-volatiliteitsindex
benaderen. Een onderschatting van de volatiliteit in sommige periodes blijft echter nog een probleem.
In deel 2 van het onderzoek werd EGARCH-E7 als beste model aangeduid door de verschillende
beoordelingsmethoden voor de variantievoorspelling. Hoewel dit de model er als beste uitkwam is het
wel zo dat de coëfficiënt van E7 niet significant is. Dit betekent dat dit model dan gewoon de
voorspellingskracht van een standaard EGARCH-model benadert en dit is ook te zien in de resultaten.
Algemeen kan dus voor deel 2 gezegd worden dat hypothese B.1 kan verworpen aangezien er geen
enkel model er in slaagt om betere voorspellingen voor de volatiliteit te leveren dan de GARCH-
modellen (en varianten) met de ‘range’ schatters. Het is echter wel zo dat het EGARCH-model wel
betere resultaten levert dan de standaard GARCH-modellen met ‘range’-schatters. Ook hypothese B.2
kan verworpen aangezien de resultaten er op wijzen dat er slechtere voorspellingen worden gedaan als
er informatie over de periode waarin de beurs gesloten is, wordt opgenomen. In deel 3 werd besloten
dat de resultaten in lijn liggen met de resultaten/bevindingen van deel 1 en deel 2. Dit betekent dus dat
de staat waarin de markt zich bevindt geen invloed heeft op de voorspellingsprestatie van de
verschillende modellen. Hiermee kan dus besloten worden dat hypothese C.1 verworpen kan worden.
Hypothese C.2 kan ook verworpen worden aangezien deze in alle modellen, behalve de GARCH-
modellen in de ‘bull’-markt, niet opgaat. In de GARCH-modellen in de ‘bull’-markt worden er
gemengde resultaten gevonden.
Algemeen kan er dus besloten worden dat analytische schatters er niet in slagen om betere
voorspellingen voor de volatiliteit van GARCH-modellen en varianten te leveren dan de ‘range’
schatters. Het EGARCH-LR-model slaagt er echter wel in om betere voorspellingen te leveren dan de
GARCH-modellen (en varianten) met DR. Het EGARCH-LR model kan namelijk de overschatting
van de volatiliteit beperken in perioden waarin de volatiliteit een piek ondervindt. Een onderschatting
van de volatiliteit is echter nog steeds een probleem, zelfs in dit model dat de beste voorspelling levert.
Nu kan echter in vraag gesteld worden of dit wel een gunstige eigenschap is die men zeker in zijn
modellen wil vatten. Logisch geredeneerd lijkt het beter dat er minder onderschatting van de
volatiliteit is omdat het risico daarbij correcter wordt ingeschat en niet wordt onderschat.
Overschatting vormt op zich een veel kleiner probleem omdat het veiliger is om een groter risico in te
calculeren in de prijs van een financieel product dan een te klein risico, indien de volatiliteit wordt
onderschat. Aangezien het EGARCH-LR model het beste model van alle modellen is in deze studie
wordt er een aanwijzing gegeven dat logaritmische modellen beter in staat zijn om voorspellingen
voor de volatiliteit te leveren. De gunstige eigenschap dat LR quasi normaal verdeeld is, doet de vraag
rijzen of normaal verdeelde variabelen die de volatiliteit modelleren nog betere voorspellingen in een
GARCH-specificatie kunnen leveren. Een belangrijke beperking is ook dat er maar één marktindex
wordt getest en er dus geen veralgemening naar andere financiële markten/producten kan worden
85
gemaakt. Ten slotte moet er nog meegedeeld worden dat het gebruik van de ‘baseline’-volatiliteit sterk
verschilt in de literatuur. In deze studie werd geopteerd om met een externe volatiliteitindex te werken
(geïmpliceerde volatiliteit) omwille van het objectieve karakter van deze index. Indien er een andere
‘baseline’-volatiliteit wordt gebruikt, kan dit tot andere resultaten leiden. Er kan dus besloten worden
dat het onderzoek grotendeels afhankelijk is van welke volatiliteit er als ‘baseline’ wordt gebruikt.
Verder onderzoek naar GARCH-modellen (en varianten) met toevoeging van analytische schatters
voor de volatiliteit is aangewezen. Ten eerste kunnen bijvoorbeeld andere prijzen dan de
sluitingsprijzen worden gebruikt in de ME van de GARCH-specificatie (of variant). Als basisvariabele
voor de ME kan bijvoorbeeld de openingsprijzen genomen worden of een combinatie van de
verschillende prijzen (sluitings-, openings-, minimum- en maximumprijzen). Ten tweede kan de DR of
LR kan misschien ook een interessant alternatief zijn in om als afhankelijke variabele in de ME op te
nemen vooral door de kleine standaarddeviatie van beide variabelen en de quasi normale verdeling van
de LR. Ten tweede kan er verder onderzocht worden of de logaritmes van analytische schatter betere
voorspellingen zouden leveren in de EGARCH-specificatie. Dit zou mogelijk tot betere voorspellingen
kunnen leiden doordat de LR in het EGARCH-model ook tot superieure voorspellingen van de
volatiliteit leidt. Ten derde kan in het GARCH-model (of variant) een schatter opgenomen worden die
enkel rekening houdt met de periode waarin de beurs gesloten is. Zo kan het effect van deze periode
afzonderlijk op significantie getest worden waardoor wetenschappelijk kan bewezen worden of het een
meerwaarde brengt bij het voorspellen van de volatiliteit. In deze studie is de periode waarin de beurs
gesloten is slechts een deel van bepaalde schatters, en wordt dit effect dus enkel afgeleid door de
relatieve vergelijking schatters met deze periode en schatters zonder deze periode. Ten vierde wordt er
aangeraden om analytische schatters te identificeren die een minder extreem positief scheef is. Met
een positieve scheefheid wordt bedoeld dat een heel groot deel van de observaties in linkerkant van de
verdeling geconcentreerd zitten. Dit wordt aangeraden omdat in deze studie de DR minder positief
scheef is en ook betere voorspellingen levert. Ten vijfde is het misschien interessant om eens een
andere ‘baseline’-volatiliteit te gebruiken en na te gaan of de resultaten nog steeds dezelfde zullen zijn
als in deze studie. Ten slotte kan deze studie ook onderzocht worden op andere financiële producten
evenals op andere markten om te onderzoeken of de resultaten die werden bekomen in deze scriptie
consistent zijn met resultaten van andere financiële producten/markten.
VIII
BIBLIOGRAFIE
Akgiray, V. (1989). Conditional Heteroscedasticity in Time Series of Stock Returns:
Evidence and Forecasts. The Journal of business, Vol. 62, No. 1 , 55-80.
Ashley, R. A., & Patterson, D. M. (2010). A test of the GARCH(1,1) specification for daily
stock returns. Macroeconomic Dynamics. Vol. 14 (Supplement 1).
Ashley, R., Granger, C., & Schmalensee, R. (1980). Advertising and Aggregate Consumption:
An Analysis of causality. Econometrica, 48, 1149-1167.
Bollerslev, T. (1986). A Generalized Autoregressive Conditional Heteroskedasticity. Journal
of Econometrics. Vol. 31. p. 307-327
Brooks, C. (2008). Introductory econometrics for finance (second edition). Cambridge
university press. Cambridge
Cabrera, F. (2011). Calculating Historical Volatility (HV) with Example. URL: <
http://www.lfrankcabrera.com: http://www.lfrankcabrera.com/calc-hist-vol.pdf> (20/05/2012)
Chicago Board Options Exchange. (2009). The Cboe Volatility Index - VIX. URL:
<www.cboe.com: http://www.cboe.com/micro/vix/vixwhite.pdf> (20/05/2012)
Chu, S.-H., & Freund, S. (1996). Volatility Estimation for Stock Index Options: A GARCH
Approach. The Quarterly Review of Economics and Finance, Vol. 36, No. 4, 431-450.
Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of the
Variance of United Kingdom Inflation. Econometrica 50. No.4
Everaert, G. (2011). Financial econometrics. Universiteit Gent, Vakgroep sociale economie,
Gent.
Frömmel, M. (2011). Portfolio and Investments. Gent: BoD GmbH.
Garman, M. B., & Klass, M. J. (1980). On the Estimation of Security Price Volatility from
Historical Data. Journal of Business, 53, 67-78.
Glosten, L. R., Jagannathan, R., & Runkle, D. E. (1993). On the relation between the expected
value and the volatility of the nominal excess return on stocks. The Journal of Finance. Vol.
48. No.5
Hull, J. C. (2008). Options, Futures and other derivatives (seventh edition ed.).
Pearson/Prentice Hall.
Inoue, A., & Kilian, L. (2002). In-sample or out-of-sample tests of predictability: which one
should we use?, ECB Working Paper, No. 195.
Nelson, D. B. (1991). Conditional heteroscedasticity in Asset returns: A new approach.
Econometrica, Vol. 59.
IX
NYSE Euronext. (2012). Productinformatie Indexprofiel.
URL:<http://www.euronext.com/editorial/wide/editorial-2667-NL.html>. (20/05/2012)
Parkinson, M. (1980). The Extreme Value Method for Estimating the Variance of the Rate of
Return. The Journal of Business, Vol. 53, No.1, 61-65.
Rogers, L. C., & Satchell, S. E. (1991). Estimating variance from high, low and closing
prices. The annals of Applied Probability, Vol. 1, No. 4, 504-512.
Sloan, A. (2009, Mei 15). The financial meltdown's unhappy anniversary. CNN Money. URL:
<http://money.cnn.com/2009/05/15/news/economy/bear.stearns.fortune/index.htm>.
(21/05/2012)
The Vanguard Group. (2012). Staying calm during a bear market. URL:
<https://retirementplans.vanguard.com/VGApp/pe/PubVgiNews?ArticleName=Stayingcalmb
earmkt>. (20/05/2012)
Verbeek, M. (2004). A guide to Modern Econometrics (second edition) (Vol. Chapter 6). John
Wiley & Sons.
Wang, Y., & Roberts, M. C. (2004). Forecasting Daily Volatility Using Range-based Data.
Denver, Colorado: Selected Paper prepared for the presentation at the American Agricultural
Economics Association Annual Meeting, August 1-4, 2004.
Yang, D., & Zhang, Q. (2000), Drift independent Volatility Estimation Based on High, Low,
Open, and Close Prices. The Journal of business, Vol. 73, No. 3, 477-492.
Appendix A
BIJLAGEN Appendix A: Berekening ƒ Gegeven:
Tijdsinterval [9:00:15,17:35:15] waarin trading geopend is (BEL 20).
Gevraagd:
Fractie ƒ van de tijdsperiode waarvoor trading gesloten is
Oplossing:
We bereken ƒ voor een tijdsperiode van 1 dag, e.g. 24u
Minuten in 1 dag: 24u*60min = 1440
Seconden in 1 dag: 24u*60min*60sec = 86400
Het gegeven tijdsinterval is 8u en 35 min lang
In seconden: 8*60*60 + 35*60 = 30900
De fractie van de tijdsperiode (24u) waarin trading geopend is:
30900/86400 = 103/288
De fractie van de tijdsperiode (24u) waarin trading gesloten is:
1 – (103/288) = 185/288 of ± 64,2%
Appendix B
Appendix B: Bewijs GARCH(1,1) = ARCH(∞)
Dit bewijs is overgenomen uit Hoofdstuk 9 uit Everaert (2011). Dit bewijs is een bijna letterlijke
overname. Hier wordt bewezen dat een GARCH(1,1) model in principe gelijk is aan een ARCH(∞).
Dit is van belang omdat men hieruit kan besluiten dat de grootste tekortkomingen van een ARCH-
model worden opgevangen door een GARCH-model te gebruiken.
Veronderstel een algemeen GARCH-model:
ttttt xxxR ...3322110
ttt
t ~ 1,0N
2
11
2
110
2
ttt
Voor dit model kan nu de volgende iteratie worden toegepast op de VE:
1
21
1
1
0
2
1
2
3
2
1
2
21
2
110
2
11
2
2
2
1
2
111
2
1101
2
21
2
2101
2
110
2
1
......1
...
11
j
jt
j
tttt
ttt
tttt
met
11
Hieruit kan besloten worden dat een GARCH(1,1) model in se hetzelfde is als een ARCH(∞) model
Appendix C
Appendix C: Output ARCH-LM testen Implementatie eviews:
1. Schat een gewenst model, in deze studie zal dit enerzijds een AR(1)-model zijn en
anderzijds een GARCH-model.
2. In de ‘equation window’: View>Residual tests>ARCH LM test
AR(1)-model:
Heteroskedasticity Test: ARCH
F-statistic 229.2614 Prob. F(5,5115) 0.0000
Obs*R-squared 937.5418 Prob. Chi-Square(5) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/21/12 Time: 20:36
Sample (adjusted): 7/24/1992 3/09/2012
Included observations: 5121 after adjustments Variable Coefficient Std. Error t-Statistic Prob. C 0.489265 0.059721 8.192478 0.0000
RESID^2(-1) 0.160653 0.013776 11.66180 0.0000
RESID^2(-2) 0.113885 0.013923 8.179783 0.0000
RESID^2(-3) 0.138292 0.013879 9.964159 0.0000
RESID^2(-4) 0.069201 0.013929 4.967980 0.0000
RESID^2(-5) 0.171401 0.013781 12.43735 0.0000 R-squared 0.183078 Mean dependent var 1.410707
Adjusted R-squared 0.182279 S.D. dependent var 4.195777
S.E. of regression 3.794154 Akaike info criterion 5.505971
Sum squared resid 73633.51 Schwarz criterion 5.513635
Log likelihood -14092.04 Hannan-Quinn criter. 5.508654
F-statistic 229.2614 Durbin-Watson stat 2.038059
Prob(F-statistic) 0.000000
GARCH(1,1)-model:
Heteroskedasticity Test: ARCH
F-statistic 1.137500 Prob. F(5,5115) 0.3380
Obs*R-squared 5.687849 Prob. Chi-Square(5) 0.3378
Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 03/21/12 Time: 20:39
Sample (adjusted): 7/24/1992 3/09/2012
Included observations: 5121 after adjustments Variable Coefficient Std. Error t-Statistic Prob. C 0.953028 0.039851 23.91488 0.0000
WGT_RESID^2(-1) 0.023457 0.013982 1.677729 0.0935
WGT_RESID^2(-2) 0.010765 0.013945 0.772007 0.4401
Appendix C
WGT_RESID^2(-3) 0.015332 0.013943 1.099622 0.2715
WGT_RESID^2(-4) 0.007954 0.014035 0.566744 0.5709
WGT_RESID^2(-5) -0.010957 0.014032 -0.780835 0.4349 R-squared 0.001111 Mean dependent var 0.999616
Adjusted R-squared 0.000134 S.D. dependent var 1.856468
S.E. of regression 1.856344 Akaike info criterion 4.076266
Sum squared resid 17626.35 Schwarz criterion 4.083929
Log likelihood -10431.28 Hannan-Quinn criter. 4.078948
F-statistic 1.137500 Durbin-Watson stat 2.000001
Prob(F-statistic) 0.337980
Appendix D
Appendix D: Beschrijvende statistieken ‘range’ schatters Analytische volatiliteitschatter 2
0 :
Analytische volatiliteitschatter 2
1 :
Analytische volatiliteitschatter 2
2 :
0
1,000
2,000
3,000
4,000
5,000
0 10000 20000 30000 40000 50000 60000 70000
Series: E00
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 984.1592
Median 184.9600
Maximum 72317.97
Minimum 0.000100
Std. Dev. 2772.963
Skewness 10.38037
Kurtosis 177.3076
Jarque-Bera 6582671.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
0 10000 20000 30000 40000 50000 60000 70000 80000
Series: E01
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 1212.216
Median 303.8372
Maximum 84354.24
Minimum 0.012755
Std. Dev. 3260.195
Skewness 10.19943
Kurtosis 171.1089
Jarque-Bera 6126064.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
0 4000 8000 12000 16000 20000 24000 28000
Series: E02
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 594.4928
Median 261.7639
Maximum 27268.02
Minimum 0.000000
Std. Dev. 1192.382
Skewness 8.458063
Kurtosis 125.2213
Jarque-Bera 3252272.
Probability 0.000000
Appendix D
Analytische volatiliteitschatter 2
3 :
Analytische volatiliteitschatter 2
4 :
Analytische volatiliteitschatter 2
4 na verwijdering van negatieve waarden:
0
1,000
2,000
3,000
4,000
5,000
0 10000 20000 30000 40000 50000 60000
Series: E03
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 1455.934
Median 652.9017
Maximum 66929.98
Minimum 4.135345
Std. Dev. 2905.831
Skewness 8.463349
Kurtosis 125.3048
Jarque-Bera 3256709.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
-4000 0 4000 8000 12000 16000 20000 24000
Series: E04
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 565.5739
Median 261.9361
Maximum 26804.57
Minimum -3416.113
Std. Dev. 1097.078
Skewness 8.341251
Kurtosis 125.4106
Jarque-Bera 3260486.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
0 4000 8000 12000 16000 20000 24000
Series: E04
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 570.2072
Median 262.6379
Maximum 26804.57
Minimum 1.701924
Std. Dev. 1095.557
Skewness 8.385431
Kurtosis 125.9301
Jarque-Bera 3288347.
Probability 0.000000
Appendix D
Analytische volatiliteitschatter 2
5 :
Analytische volatiliteitschatter 2
5 na verwijdering van negatieve waarden:
Analytische volatiliteitschatter 2
6 :
Analytische volatiliteitschatter 2
6 na verwijdering van negatieve waarden:
0
1,000
2,000
3,000
4,000
5,000
0 4000 8000 12000 16000 20000 24000
Series: E05
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 551.7129
Median 255.2903
Maximum 25744.17
Minimum -2875.001
Std. Dev. 1068.936
Skewness 8.321969
Kurtosis 123.5006
Jarque-Bera 3161098.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
0 4000 8000 12000 16000 20000 24000
Series: E05
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 554.7199
Median 255.6189
Maximum 25744.17
Minimum 1.667124
Std. Dev. 1066.708
Skewness 8.378011
Kurtosis 124.4101
Jarque-Bera 3208900.
Probability 0.000000
0
1,000
2,000
3,000
4,000
5,000
-10000 0 10000 20000 30000 40000 50000 60000
Series: E06
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 1389.110
Median 644.8675
Maximum 63986.48
Minimum -7887.355
Std. Dev. 2683.275
Skewness 8.251048
Kurtosis 121.9038
Jarque-Bera 3078431.
Probability 0.000000
Appendix D
Analytische volatiliteitschatter 2
7 :
0
1,000
2,000
3,000
4,000
5,000
0 10000 20000 30000 40000 50000 60000
Series: E06
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 1396.960
Median 646.0125
Maximum 63986.48
Minimum 4.720095
Std. Dev. 2677.046
Skewness 8.314154
Kurtosis 122.9057
Jarque-Bera 3130432.
Probability 0.000000
0
100
200
300
400
500
600
700
800
900
0 100 200 300 400 500 600 700 800
Series: E07
Sample 7/15/1992 3/09/2012
Observations 5127
Mean 477.9656
Median 579.3279
Maximum 853.0931
Minimum 8.374751
Std. Dev. 278.0780
Skewness -0.347716
Kurtosis 1.700657
Jarque-Bera 463.9759
Probability 0.000000
Appendix E
Appendix E: Output overdraagbaarheidstudie
2004 GARCH GARCH-
DR
GARCH-
LR
GARCH-
DR-LR
GJR-
GARCH
GJR-
GARCH-
DR
GJR-
GARCH-
LR
GJR-
GARCH-
DR-LR
EGARCH EGARCH-
DR
EGARCH-
LR
EGARCH-
DR-LR
α0 0,0545 *** 0,0536 *** 0,0516 *** 0,0537 *** 0,0305 * 0,0324 ** 0,0296 * 0,0324 ** 0,0283 * 0,0337 ** 0,0313 * 0,0321 **
α1 0,1278 *** 0,1302 *** 0,1313 *** 0,1301 *** 0,1303 *** 0,1301 *** 0,1321 *** 0,1301 *** 0,1346 *** 0,1372 *** 0,1483 *** 0,1470 ***
β0 0,0133 *** 0,0081 * 0,1602 ** 0,0047
0,0139 *** 0,0095 ** 0,1522 ** 0,0114
-0,1380 *** -0,1651 *** 0,8581 *** 0,6944 **
β1 0,1042 *** 0,0929 *** 0,0967 *** 0,0929 *** 0,0467 *** 0,0357 ** 0,0375 ** 0,0357 ** 0,1740 *** 0,1477 *** 0,0823 ** 0,0834 **
β2 0,8853 *** 0,8718 *** 0,8738 *** 0,8719 *** 0,0926 *** 0,0973 *** 0,0982 *** 0,0974 *** -0,0694 *** -0,0706 *** -0,0738 *** -0,0733 ***
β3 -
-
-
-
0,8943 *** 0,8810 *** 0,8831 *** 0,8809 *** 0,9813 *** 0,9550 *** 0,8913 *** 0,8926 ***
γ1 -
0,0009 ** 0,0562 ** 0,0009 * -
0,0008 ** 0,0530 ** 0,0008
-
0,0013 ** 0,4122 *** 0,0006
γ2 -
-
-
-0,0013
-
-
-
0,0007
-
-
-
0,3497 ***
AIC 2,5916
2,5866
2,5895
2,5872
2,5780
2,5732
2,5758
2,5738
2,5814
2,5751
2,5696
2,5697
SBC 2,6017
2,5986
2,6016
2,6013
2,5900
2,5872
2,5899
2,5899
2,5934
2,5892
2,5837
2,5857
Returnvoorspelling
RMSE 1,3326
1,3329
1,3329
1,3329
1,3323
1,3323
1,3325
1,3323
1,3329
1,3333
1,3349
1,3347
MAE 0,9012
0,9015
0,9016
0,9015
0,9011
0,9011
0,9013
0,9011
0,9016
0,9020
0,9034
0,9032
MAPE 191,0
192,1
191,9
192,1
183,0
183,6
183,8
183,6
184,8
188,5
194,6
194,1
BP 0,0012
0,0012
0,0011
0,0012
0,0004
0,0004
0,0004
0,0004
0,0003
0,0005
0,0004
0,0004
VP 0,7535
0,7491
0,7471
0,7492
0,7495
0,7499
0,7461
0,7498
0,7416
0,7365
0,7161
0,7184
CP 0,2452
0,2498
0,2518
0,2496
0,2502 0,2497 0,2535 0,2498 0,2581 0,2630 0,2835 0,2812
Variantievoorspelling
RMSE 5,4690
5,2625
5,3165
5,2639
5,4044
5,2208
5,2561
5,2200
4,9374
6,4351
4,9154
5,3516
MAE 3,6468
3,4314
3,6384
3,4311
3,7404
3,5300
3,7651
3,5306
3,4959
4,0809
3,7303
3,8336
MAPE 0,1760
0,1601
0,1772
0,1601
0,1842
0,1666
0,1874
0,1667
0,1718
0,1845
0,1923
0,1897 Correlatie
Correlatiecoëfficiënt 0,8683 0,8540 0,8684 0,8539 0,8794 0,8642 0,8791 0,8643 0,8858 0,8215 0,9030 0,8777
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
φ2 1,0003
1,0220
1,0376
1,0215
0,9963
1,0160
1,0323
1,0163
1,0522
0,9567
1,0829
1,0440
R kwadraat 0,9342
0,9395
0,9391
0,9395
0,9358
0,9403
0,9401
0,9403
0,9487
0,9108
0,9524
0,9387 Regressie (c≠0)
φ1 5,8120
4,4517
5,2147
4,4530
5,9966
4,8495
5,4916
4,8495
4,5575
6,8466
4,8295
5,6178
φ2 0,7582
0,8279
0,8104
0,8273
0,7495
0,8077
0,7963
0,8079
0,8505
0,6823
0,8654
0,8001 R kwadraat 0,7539 0,7294 0,7541 0,7291 0,7733 0,7469 0,7728 0,7470 0,7846 0,6749 0,8153 0,7703
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix E
Grafieken GARCH: GARCH(1,1):
GARCH-DAILY RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
Garch(1,1) forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-daily range forecast
Appendix E
GARCH-LOG RANGE:
GARCH-DAILY RANGE-LOG RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-logrange forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-DR-LR forecast
Appendix E
Grafieken GJR-GARCH: GJR-GARCH(1,1):
GJR-GARCH-DAILY RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
BELVOLI
GJR-GARCH(1,1) forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-daily range
forecast
Appendix E
GJR-GARCH-LOG RANGE:
GJR-GARCH-DAILY RANGE-LOG RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-logrange
forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-DR-LR forecast
Appendix E
Grafieken EGARCH: EGARCH(1,1):
EGARCH-DAILY RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
EGARCH(1,1) forecast
0,0
20,0
40,0
60,0
80,0
100,0
120,0
BELVOLI
EGARCH-daily range forecast
Appendix E
EGARCH-LOG RANGE:
EGARCH-DAILY RANGE-LOG RANGE:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
EGARCH-logrange forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
BELVOLI
EGARCH-DR-LR forecast
Appendix F
Appendix F: Output hoofdonderzoek
GARCH-modellen
GARCH E0 E1 E2 E3 E4 E5 E6 E7
α0 0,0508 *** 0,0502 *** 0,0517 *** 0,0515 *** 0,0524 *** 0,0524 *** 0,0522 *** 0,0548 ***
α1 0,1348 *** 0,1371 *** 0,1335 *** 0,1337 *** 0,1319 *** 0,1320 *** 0,1322 *** 0,1277 ***
β0 0,0183 *** 0,0200 *** 0,0183 *** 0,0185 *** 0,0169 *** 0,0170 *** 0,0172 *** 0,0127 ***
β1 0,0797 *** 0,0782 *** 0,0843 *** 0,0841 *** 0,0882 *** 0,0882 *** 0,0880 *** 0,1038 ***
β2 0,8751 *** 0,8682 *** 0,8673 *** 0,8665 *** 0,8694 *** 0,8693 *** 0,8686 *** 0,8837 ***
γ1 0,0000 ** 0,0000 *** 0,0001 *** 0,0000 *** 0,0001 *** 0,0001 *** 0,0000 *** 0,0000
AIC 2,5849
2,5814
2,5816
2,5814
2,5829
2,5829
2,5826
2,5920 SBC 2,5970
2,5934
2,5937
2,5934
2,5949
2,5949
2,5947
2,6041
Returnvoorspelling
RMSE 1,3334
1,3337
1,3332
1,3333
1,3330
1,3330
1,3331
1,3326 MAE 0,9020
0,9023
0,9018
0,9019
0,9017
0,9017
0,9017
0,9012
MAPE 193,7
194,9
193,3
193,4
192,6
192,6
192,7
191,2 BP 0,0011
0,0010
0,0011
0,0011
0,0011
0,0011
0,0011
0,0012
VP 0,7406
0,7363
0,7430
0,7426
0,7459
0,7458
0,7455
0,7536 CP 0,2584 0,2627 0,2559 0,2563 0,2530 0,2531 0,2534 0,2451
Variantievoorspelling
RMSE 5,9557
6,0174
5,5902
5,6334
5,4584
5,4619
5,4975
5,3586 MAE 3,9186
3,9461
3,6839
3,7134
3,6139
3,6136
3,6343
3,4908
MAPE 0,1850
0,1848
0,1724
0,1737
0,1695
0,1695
0,1703
0,1652 Correlatie
Correlatiecoëfficiënt 0,8205 0,8163 0,8362 0,8343 0,8465
0,8463
0,8446
0,8672 Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 0,9690
0,9700
1,0031
0,9999
1,0116
1,0119
1,0091
0,9984
R kwadraat 0,9229
0,9212
0,9313
0,9302
0,9346
0,9345
0,9336
0,9368 Regressie (c≠0)
φ1 5,5240
5,5920
4,9605
5,0418
4,9121
4,9141
4,9779
5,4626 φ2 0,7404
0,7381
0,7905
0,7845
0,8001
0,8002
0,7953
0,7701
R kwadraat 0,6732 0,6663 0,6993 0,6961 0,7166 0,7162 0,7133 0,7521
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix F
Grafieken: GARCH(1,1)-E0:
GARCH(1,1)-E1:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E0 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E1 forecast
Appendix F
GARCH(1,1)-E2:
GARCH(1,1)-E3:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E2 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E3 forecast
Appendix F
GARCH(1,1)-E4:
GARCH(1,1)-E5:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E4 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E5 forecast
Appendix F
GARCH(1,1)-E6:
GARCH(1,1)-E7:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E6 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-E7 forecast
Appendix F
GARCH(1,1)-ECOMBO:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GARCH-ECOMBO
Appendix F
GJR-GARCH-modellen
GJR-GARCH E0 E1 E2 E3 E4 E5 E6 E7
α0 0,0324 ** 0,0334 ** 0,0340 ** 0,0339 ** 0,0338 ** 0,0338 ** 0,0338 ** 0,0306 *
α1 0,1335 *** 0,1337 *** 0,1315 *** 0,1317 *** 0,1309 *** 0,1310 *** 0,1310 *** 0,1303 ***
β0 0,0188 *** 0,0196 *** 0,0182 *** 0,0183 *** 0,0171 *** 0,0171 *** 0,0172 *** 0,0138 ***
β1 0,0231
0,0263 * 0,0337 ** 0,0336 ** 0,0378 *** 0,0377 *** 0,0376 *** 0,0468 ***
β2 0,1002 *** 0,0957 *** 0,0926 *** 0,0925 *** 0,0907 *** 0,0907 *** 0,0907 *** 0,0925 ***
β3 0,8830 *** 0,8783 *** 0,8772 *** 0,8767 *** 0,8794 *** 0,8794 *** 0,8789 *** 0,8939 ***
γ1 0,0000 ** 0,0000 *** 0,0001 ** 0,0000 ** 0,0000 ** 0,0000 ** 0,0000 ** 0,0000 AIC 2,5704
2,5688
2,5703
2,5701
2,5718
2,5718
2,5716
2,5786
SBC 2,5844
2,5829
2,5844
2,5842
2,5859
2,5859
2,5857
2,5927
RMSE 1,3328
1,3328
1,3326
1,3326
1,3325
1,3325
1,3325
1,3323 MAE 0,9015
0,9016
0,9013
0,9013
0,9012
0,9012
0,9012
0,9011
MAPE 185,7
186,2
185,1
185,1
184,6
184,6
184,7
183,0 BP 0,0004
0,0004
0,0005
0,0005
0,0005
0,0005
0,0005
0,0004
VP 0,7436
0,7431
0,7471
0,7469
0,7483
0,7482
0,7480
0,7495 CP 0,2560 0,2564 0,2524 0,2527 0,2513 0,2513 0,2515 0,2501
Variantievoorspelling
RMSE 5,8916
5,9101
5,5349
5,5681
5,4102
5,4154
5,4417
5,3808 MAE 3,9901
3,9718
3,7525
3,7742
3,6930
3,6966
3,7122
3,7059
MAPE 0,1889
0,1865
0,1772
0,1781
0,1755
0,1756
0,1763
0,1817 Correlatie
Correlatiecoëfficiënt 0,8338 0,3880 0,8500 0,8486 0,8594
0,8591
0,8579
0,8791 Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 0,9680
0,9708
0,9995
0,9969
1,0066
1,0068
1,0046
0,9961
R kwadraat 0,9246
0,9240
0,9326
0,9318
0,9356
0,9355
0,9349
0,9363 Regressie (c≠0)
φ1 5,7740
5,8244
5,3500
5,4047
5,3119
5,3169
5,3575
5,9275 φ2 0,7315
0,7316
0,7735
0,7692
0,7814
0,7813
0,7779
0,7519
R kwadraat 0,6952 0,6938 0,7224 0,7201 0,7385 0,7380 0,7360 0,7728
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix F
Grafieken: GJR-GARCH(1,1)-E0:
GJR-GARCH(1,1)-E1:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
BELVOLI
GJR-GARCH-E0 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
BELVOLI
GJR-GARCH-E1 forecast
Appendix F
GJR-GARCH(1,1)-E2:
GJR-GARCH(1,1)-E3:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-E2 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-E3 forecast
Appendix F
GJR-GARCH(1,1)-E4:
GJR-GARCH(1,1)-E5:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-E4 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-E5 forecast
Appendix F
GJR-GARCH(1,1)-E6:
GJR-GARCH(1,1)-E7:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-E6 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
BELVOLI
GJR-GARCH-E7 forecast
Appendix F
GJR-GARCH(1,1)-ECOMBO:
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
GJR-GARCH-ECOMBO
Appendix F
EGARCH-modellen
EGARCH E0 E1 E2 E3 E4 E5 E6 E7
α0 0,0293 * 0,0300 * 0,0305 * 0,0306 * 0,0306 * 0,0306 * 0,0306 * 0,0283 *
α1 0,1397 *** 0,1417 *** 0,1400 *** 0,1401 *** 0,1390 *** 0,1391 *** 0,1392 *** 0,1346 ***
β0 -0,1351 *** -0,1369 *** -0,1429 *** -0,1431 *** -0,1441 *** -0,1441 *** -0,1444 *** -0,1382 ***
β1 0,1488 *** 0,1429 *** 0,1514 *** 0,1510 *** 0,1573 *** 0,1574 *** 0,1570 *** 0,1741 ***
β2 -0,0716 *** -0,0690 *** -0,0684 *** -0,0683 *** -0,0681 *** -0,0681 *** -0,0681 *** -0,0694 ***
β3 0,9668 *** 0,9614 *** 0,9626 *** 0,9621 *** 0,9657 *** 0,9658 *** 0,9653 *** 0,9812 ***
γ1 0,0000 ** 0,0000 *** 0,0000 *** 0,0000 *** 0,0000 *** 0,0000 *** 0,0000 *** 0,0000 AIC 2,5777
2,5747
2,5754
2,5752
2,5766
2,5767
2,5765
2,5820
SBC 2,5918
2,5888
2,5894
2,5893
2,5907
2,5907
2,5906
2,5961
RMSE 1,3336
1,3339
1,3337
1,3337
1,3335
1,3335
1,3335
1,3329 MAE 0,9023
0,9025
0,9023
0,9023
0,9022
0,9022
0,9022
0,9016
MAPE 188,4
189,9
189,2
189,2
188,5
188,5
188,6
184,8 BP 0,0003
0,0004
0,0004
0,0004
0,0004
0,0004
0,0004
0,0003
VP 0,7320
0,7283
0,7311
0,7311
0,7332
0,7331
0,7328
0,7415 CP 0,2677 0,2713 0,2685 0,2685 0,2665 0,2665 0,2668 0,2581
Variantievoorspelling
RMSE 12,2272
21,7555
11,1727
11,1727
7,6292
7,6509
8,3582
4,9299 MAE 5,3069
6,8623
5,1358
5,1358
4,3860
4,3819
4,5327
3,4869
MAPE 0,2201
0,2598
0,2167
0,2167
0,1962
0,1959
0,2000
0,1713 Correlatie
Correlatiecoëfficiënt 0,7416 0,6491 0,7451 0,7451 0,8048
0,8043
0,7927
0,8858 Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 0,7268
0,4917
0,7660
0,7660
0,9078
0,9074
0,8748
1,0516
R kwadraat 0,7814
0,6047
0,8000
0,8000
0,8810
0,8804
0,8640
0,9488 Regressie (c≠0)
φ1 11,6389
14,5097
11,1821
11,1821
8,5623
8,5903
9,2599
4,5414 φ2 0,3939
0,2261
0,4249
0,4249
0,5893
0,5881
0,5455
0,8508
R kwadraat 0,5500 0,4214 0,5551 0,5551 0,6477 0,6469 0,6283 0,7847
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix F
Grafieken: EGARCH(1,1)-E0:
EGARCH(1,1)-E1:
0,0
50,0
100,0
150,0
200,0
250,0
BELVOLI
EGARCH-E0 forecast
0,0
50,0
100,0
150,0
200,0
250,0
300,0
350,0
400,0
BELVOLI
EGARCH-E1 forecast
Appendix F
EGARCH(1,1)-E2:
EGARCH(1,1)-E3:
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
160,0
180,0
200,0
BELVOLI
EGARCH-E2 forecast
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
160,0
180,0
200,0
BELVOLI
EGARCH-E3 forecast
Appendix F
EGARCH(1,1)-E4:
EGARCH(1,1)-E5:
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
BELVOLI
EGARCH-E4 forecast
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
BELVOLI
EGARCH-E5 forecast
Appendix F
EGARCH(1,1)-E6:
EGARCH(1,1)-E7:
0,0
20,0
40,0
60,0
80,0
100,0
120,0
140,0
160,0
BELVOLI
EGARCH-E6 forecast
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
BELVOLI
EGARCH-E7 forecast
Appendix F
EGARCH(1,1)-ECOMBO:
0,0
1000,0
2000,0
3000,0
4000,0
5000,0
6000,0
7000,0
BELVOLI
EGARCH-ECOMBO forecast
Appendix F
Combinatie-modellen
GARCH GJR-GARCH EGARCH
α0 0,04969 *** 0,02965 * 0,02932 NA α1 0,13506 *** 0,13424 *** 0,13969 NA β0 0,02010 *** 0,02092 *** -0,13508 NA β1 0,07651 *** 0,02377
0,14881 NA
β2 0,87595 *** 0,09357 *** -0,07160 NA β3 -
0,88491 *** 0,96682 NA
γ1 -0,00002
-4,37E-06
4,29E-06 NA
γ2 0,00000
3,85E-06
-1,44E-05 NA
γ3 -0,00147
5,26E-04
4,60E-06 NA
γ4 0,00075
-1,40E-04
5,05E-06 NA
γ5 0,00328
1,48E-03
4,41E-06 NA
γ6 -0,00187
-2,03E-03
4,49E-06 NA
γ7 -0,00069
1,59E-04
4,28E-06 NA
γ8 -0,00003 *** -2,78E-05 ** 4,19E-06 NA
AIC 2,58184
2,57020
2,58240
SBC 2,60794
2,59831
2,61051
Returnvoorspelling
RMSE 1,33338
1,33284
1,33362 MAE 0,90200
0,90159
0,90229
MAPE 193,43330
185,13530
188,86240 BP 0,00101
0,00035
0,00036
VP 0,74012
0,74214
0,73177 CP 0,25887
0,25751
0,26787
Variantievoorspelling
RMSE 6,7731
6,2850
235,8321 MAE 4,5831
4,5030
24,2583
MAPE 0,2253
0,2231
1,0047 Correlatie
Correlatiecoëfficiënt 0,7994
0,8303
0,1011 Regressie (c=0)
φ1 0,0000
0,0000
0,0000 φ2 0,9668
0,9763
0,0166
R kwadraat 0,9001
0,9136
0,0344 Regressie (c≠0)
φ1 7,2662 6,7955 19,0654 φ2 0,6714
0,6993
0,0040
R kwadraat 0,6391 0,6894 0,0102
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
Appendix G: Output volatiliteitonderzoek in verschillende tijdsperiodes
Bull markt
GARCH-modellen
GARCH E0 E1 E2 E3 E4 E5 E6 E7 GARCH
GARCH-DR
GARCH-LR GARCH-DR-LR
α0 0,0471 *** 0,0467 *** 0,0483 *** 0,0482 *** 0,0491 *** 0,0490 *** 0,0489 *** 0,0519 *** 0,0509 *** 0,0504 *** 0,0482 *** 0,0505 ***
α1 0,1531 *** 0,1558 *** 0,1511 *** 0,1514 *** 0,1492 *** 0,1493 *** 0,1495 *** 0,1444 *** 0,1446 *** 0,1473 *** 0,1482 *** 0,1473 ***
β0 0,0194 *** 0,0215 *** 0,0187 *** 0,0190 *** 0,0171 *** 0,0171 *** 0,0174 *** 0,0120 *** 0,0131 *** 0,0083 * 0,1568 ** 0,0034 β1 0,0824 *** 0,0803 *** 0,0872 *** 0,0870 *** 0,0912 *** 0,0912 *** 0,0910 *** 0,1056 *** 0,1071 *** 0,0955 *** 0,0990 *** 0,0956 ***
β2 0,8705 *** 0,8624 *** 0,8650 *** 0,8640 *** 0,8685 *** 0,8684 *** 0,8675 *** 0,8823 *** 0,8847 *** 0,8706 *** 0,8740 *** 0,8708 ***
γ1 4,90E-05 ** 4,80E-05 *** 7,25E-05 ** 3,07E-05 ** 5,97E-05 ** 6,16E-05 ** 2,55E-05 ** 1,54E-05
-
0,0009 ** 0,0550 * 0,0009 γ2 -
-
-
-
-
-
-
-
-
-
-
-0,0018
AIC 2,5702
2,5663
2,5673
2,5670
2,5688
2,5688
2,5686
2,5768
2,5770
2,5721
2,5751
2,5728 SBC 2,5830
2,5791
2,5801
2,5798
2,5816
2,5816
2,5814
2,5896
2,5877
2,5849
2,5879
2,5877
Returnvoorspelling
RMSE 0,8492
0,8496
0,8489
0,8490
0,8487
0,8487
0,8487
0,8480
0,8480
0,8484
0,8486
0,8484 MAE 0,6005
0,6008
0,6002
0,6002
0,5999
0,5999
0,5999
0,5992
0,5992
0,5996
0,5998
0,5996
MAPE 200,6
201,9
200,2
200,3
199,6
199,6
199,7
198,6
198,1
199,3
198,5
199,3 BP 0,0026
0,0026
0,0025
0,0025
0,0024
0,0024
0,0024
0,0022
0,0023
0,0023
0,0025
0,0023
VP 0,6879
0,6826
0,6918
0,6912
0,6955
0,6954
0,6949
0,7050
0,7045
0,6992
0,6974
0,6994 CP 0,3096 0,3148 0,3057 0,3063 0,3021 0,3022 0,3027 0,2929 0,2932
0,2985
0,3001
0,2984
Variantievoorspelling
RMSE 4,3215
4,3267
4,0454
4,0629
3,9656
3,9680
3,9813
3,8203
4,0880
3,8403
3,9174
3,8436 MAE 3,0507
3,0101
2,8383
2,8511
2,8006
2,8019
2,8103
2,5705
2,9137
2,6637
2,8812
2,6642
MAPE 0,1906
0,1869
0,1758
0,1766
0,1735
0,1736
0,1741
0,1570
0,1826
0,1643
0,1835
0,1643 Correlatie
Correlatiecoëfficiënt 0,7433 0,7333 0,7744 0,7715 0,7934
0,7928
0,7905
0,8279
0,8307 0,7995 0,8361 0,7988
Regressie (c=0)
φ1 5,8544
5,7757
5,3559
5,3720
5,3269
5,3277
5,3361
5,3921
0,0000
0,0000
0,0000
0,0000 φ2 0,6398
0,6497
0,6933
0,6920
0,7027
0,7025
0,7017
0,6794
1,0164
1,0172
1,0436
1,0163
R kwadraat 0,5525
0,5377
0,5998
0,5952
0,6294
0,6286
0,6248
0,6855
0,9326
0,9406
0,9395
0,9404 Regressie (c≠0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
6,0763
5,0896
5,6558
5,0917 φ2 0,9896
0,9997
1,0233
1,0231
1,0319
1,0318
1,0317
0,9983
0,6544
0,7067
0,6961
0,7060
R kwadraat 0,9245 0,9242 0,9342 0,9337 0,9372 0,9372 0,9367 0,9416 0,6901 0,6391 0,6991 0,6380
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
GJR-GARCH-modellen
GJR-GARCH E0 E1 E2 E3 E4 E5 E6 E7
GJR-GARCH
GJR-GARCH-
DR
GJR-GARCH-LR
GJR-GARCH-DR-LR
α0 0,0277 * 0,0292 * 0,0295 * 0,0295 * 0,0292 * 0,0292 * 0,0292 * 0,0268
0,0258
0,0280 * 0,0250
0,0279 *
α1 0,1516 *** 0,1515 *** 0,1488 *** 0,1490 *** 0,1482 *** 0,1482 *** 0,1483 *** 0,1471 *** 0,1474 *** 0,1472 *** 0,1493 *** 0,1472 ***
β0 0,0211 *** 0,0219 *** 0,0196 *** 0,0198 *** 0,0181 *** 0,0181 *** 0,0183 *** 0,0139 *** 0,0143 *** 0,0103 ** 0,1608 ** 0,0148 β1 0,0194
0,0234
0,0328 ** 0,0325 ** 0,0377 ** 0,0376 ** 0,0374 ** 0,0488 *** 0,0484 *** 0,0349 ** 0,0372 ** 0,0348 **
β2 0,1094 *** 0,1037 *** 0,0991 *** 0,0992 *** 0,0962 *** 0,0963 *** 0,0964 *** 0,0955 *** 0,0962 *** 0,1036 *** 0,1032 *** 0,1037 ***
β3 0,8763 *** 0,8711 *** 0,8727 *** 0,8720 *** 0,8763 *** 0,8762 *** 0,8755 *** 0,8900 *** 0,8920 *** 0,8771 *** 0,8806 *** 0,8769 ***
γ1 4,60E-05 ** 4,01E-05 ** 5,93E-05 ** 2,51E-05 ** 4,76E-05 ** 4,91E-05 ** 2,03E-05 ** 7,26E-06
-
0,0009 ** 0,0560 ** 0,0008 γ2 -
-
-
-
-
-
-
-
-
-
-
0,0017
AIC 2,5545
2,5528
2,5552
2,5550
2,5571
2,5571
2,5569
2,5637
2,5632
2,5580
2,5609
2,5588 SBC 2,5694
2,5677
2,5702
2,5699
2,5721
2,5720
2,5718
2,5786
2,5760
2,5730
2,5758
2,5758
Returnvoorspelling
RMSE 0,8500
0,8499
0,8496
0,8496
0,8495
0,8495
0,8495
0,8496
0,8496
0,8495
0,8499
0,8495 MAE 0,6008
0,6007
0,6004
0,6004
0,6003
0,6003
0,6003
0,6002
0,6003
0,6002
0,6006
0,6002
MAPE 189,5
190,2
188,9
189,0
188,4
188,4
188,4
186,5
186,1
187,2
186,7
187,2 BP 0,0049
0,0047
0,0047
0,0047
0,0048
0,0048
0,0048
0,0051
0,0052
0,0049
0,0053
0,0050
VP 0,6892
0,6895
0,6946
0,6943
0,6959
0,6958
0,6957
0,6977
0,6971
0,6977
0,6934
0,6975 CP 0,3059 0,3057 0,3007 0,3010 0,2993 0,2994 0,2996 0,2972 0,2977
0,2974
0,3013
0,2975
Variantievoorspelling
RMSE 4,3116
4,2507
3,9864
4,0044
3,9057
3,9083
3,9215
3,7637
3,9352
3,7627
3,8332
3,7607 MAE 3,0774
3,0050
2,8710
2,8833
2,8583
2,8589
2,8667
2,7965
3,0144
2,7081
3,0081
2,7097
MAPE 0,1931
0,1866
0,1795
0,1802
0,1798
0,1798
0,1803
0,1765
0,1936
0,1693
0,1969
0,1695 Correlatie
Correlatiecoëfficiënt 0,7255 0,7313 0,7758 0,7729 0,7959
0,7954
0,7931
0,8313
0,8328 0,7956 0,8371 0,7964
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 1,0225
1,0328
1,0546
1,0544
1,0626
1,0624
1,0622
1,0408
1,0517
1,0500
1,0823
1,0509
R kwadraat 0,9259
0,9278
0,9382
0,9376
0,9415
0,9414
0,9410
0,9441
0,9396
0,9448
0,9460
0,9450 Regressie (c≠0)
φ1 5,5359
5,4180
4,9644
4,9846
4,9318
4,9325
4,9436
5,2186
5,6135
4,5219
5,1283
4,5202 φ2 0,6777
0,6920
0,7381
0,7365
0,7474
0,7472
0,7462
0,7186
0,7036
0,7632
0,7532
0,7640
R kwadraat 0,5264 0,5348 0,6019 0,5973 0,6335 0,6326 0,6290 0,6911 0,6936 0,6330 0,7007 0,6342
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
EGARCH-modellen
EGARCH E0 E1 E2 E3 E4 E5 E6 E7 EGARCH
EGARCH-DR
EGARCH-LR
EGARCH-DR-LR
α0 0,0261
0,0268
0,0273
0,0273
0,0271
0,0272
0,0272
0,0258
0,0247
0,0297 * 0,0279
0,0288 *
α1 0,1589 *** 0,1608 *** 0,1585 *** 0,1588 *** 0,1574 *** 0,1574 *** 0,1576 *** 0,1520 *** 0,1526 *** 0,1564 *** 0,1647 *** 0,1638 ***
β0 -0,1386 *** -0,1412 *** -0,1463 *** -0,1466 *** -0,1465 *** -0,1465 *** -0,1470 *** -0,1445 *** -0,1396 *** -0,1700 *** 0,8476 *** 0,6782 **
β1 0,1506 *** 0,1437 *** 0,1535 *** 0,1529 *** 0,1593 *** 0,1594 *** 0,1589 *** 0,1778 *** 0,1770 *** 0,1478 *** 0,0830 ** 0,0848 **
β2 -0,0762 *** -0,0737 *** -0,0725 *** -0,0726 *** -0,0720 *** -0,0720 *** -0,0721 *** -0,0711 *** -0,0719 *** -0,0755 *** -0,0752 *** -0,0755 ***
β3 0,9631 *** 0,9563 *** 0,9592 *** 0,9585 *** 0,9633 *** 0,9633 *** 0,9626 *** 0,9781 *** 0,9805 *** 0,9501 *** 0,8920 *** 0,8926 ***
γ1 1,88E-05 ** 2,14E-05 *** 3,75E-05 *** 1,59E-05 *** 3,17E-05 ** 3,25E-05 ** 1,35E-05 ** 1,25E-05
-
0,0014 ** 0,4071 *** 0,0006 γ2 -
-
-
-
-
-
-
-
-
-
-
0,3428 ***
AIC 2,5617
2,5583
2,5595
2,5593
2,5610
2,5610
2,5608
2,5662
2,5658
2,5590
2,5540
2,5541 SBC 2,5767
2,5733
2,5744
2,5742
2,5759
2,5760
2,5757
2,5812
2,5786
2,5739
2,5689
2,5712
Returnvoorspelling
RMSE 0,8510
0,8512
0,8509
0,8509
0,8508
0,8507
0,8508
0,8502
0,8503
0,8505
0,8516
0,8515 MAE 0,6018
0,6021
0,6017
0,6018
0,6016
0,6016
0,6016
0,6009
0,6010
0,6014
0,6026
0,6024
MAPE 192,8
194,2
193,2
193,4
192,5
192,5
192,7
188,8
188,5
193,3
197,0
196,9 BP 0,0050
0,0049
0,0049
0,0049
0,0049
0,0049
0,0049
0,0052
0,0053
0,0046
0,0047
0,0046
VP 0,6750
0,6715
0,6759
0,6754
0,6780
0,6780
0,6776
0,6881
0,6869
0,6801
0,6642
0,6661 CP 0,3200 0,3236 0,3192 0,3197 0,3171 0,3171 0,3175 0,3067 0,3077
0,3153
0,3311
0,3293
Variantievoorspelling
RMSE 4,1784
4,5469
4,0512
4,0726
3,8535
3,8572
3,8790
3,4312
3,6007
3,9279
3,7166
3,7391 MAE 2,9955
3,1191
2,9422
2,9573
2,8644
2,8661
2,8812
2,5570
2,7529
2,8309
3,0883
3,0232
MAPE 0,1863
0,1898
0,1825
0,1833
0,1802
0,1803
0,1810
0,1638
0,1786
0,1749
0,2063
0,1974 Correlatie
Correlatiecoëfficiënt 0,7665 0,7271 0,7815 0,7777 0,8069
0,8064
0,8030
0,8455
0,8451 0,7702 0,8793 0,8570
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 1,0607
1,0464
1,0860
1,0862
1,1022
1,1021
1,1020
1,0697
1,0878
1,0786
1,1429
1,1365
R kwadraat 0,9324
0,9181
0,9394
0,9388
0,9480
0,9479
0,9472
0,9564
0,9537
0,9426
0,9591
0,9572 Regressie (c≠0)
φ1 5,4273
6,2012
4,9183
4,9312
4,3323
4,3384
4,3580
4,0757
4,4319
4,2651
4,5089
4,2476 φ2 0,7136
0,6543
0,7634
0,7625
0,8141
0,8135
0,8120
0,8086
0,8002
0,7981
0,8388
0,8489
R kwadraat 0,5875 0,5286 0,6108 0,6049 0,6511 0,6503 0,6447 0,7149 0,7141 0,5932 0,7731 0,7344
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
Output combinatie-modellen GARCH GJR-GARCH EGARCH
α0 0,04339 *** 0,02407
0,02693
α1 0,15591 *** 0,15188 *** 0,15816 *** β0 0,02378 *** 0,02690 *** -0,13562 *** β1 0,07776 *** 0,01653
0,14031 ***
β2 0,86456 *** 0,10659 *** -0,07326 *** β3 -0,00002
0,87242 *** 0,95894 ***
γ1 -0,00001
-1,27E-07
-3,07E-06
γ2 0,00170
3,29E-06
2,26E-06
γ3 -0,00060
5,47E-03
6,10E-04
γ4 -0,00220
-2,25E-03
-1,96E-04
γ5 0,00033
-4,20E-03
1,43E-03
γ6 0,00074
-1,32E-03
-2,08E-03 **
γ7 -0,00004 * 2,30E-03
2,10E-04
γ8 -
-4,27E-05 ** -1,30E-05
AIC 2,56872
2,55606
2,56090
SBC 2,59645
2,58593
2,59077
Returnvoorspelling
RMSE 0,8497
0,8503
0,8509 MAE 0,6009
0,6010
0,6017 MAPE 200,2
187,8
192,8
BP 0,0029
0,0054
0,0049 VP 0,6822
0,6882
0,6765 CP 0,3149
0,3063
0,3186
Variantievoorspelling
RMSE 4,9174
5,1336
4,7078 MAE 3,7054
3,9670
3,2956 MAPE 0,2380
0,2590
0,2023
Correlatie
Correlatiecoëfficiënt 0,7357 0,7133 0,7481
Regressie (c=0)
φ1 0,0000
0,0000
0,0000 φ2 1,0585
1,0849
1,0419 R kwadraat 0,9055
0,8988
0,9118
Regressie (c≠0)
φ1 7,0026
7,2442
6,7358 φ2 0,6168
0,6149
0,6237 R kwadraat 0,5413 0,5088 0,5596
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
Bear markt
GARCH-modellen
GARCH E0 E1 E2 E3 E4 E5 E6 E7 GARCH GARCH-DR GARCH-LR
GARCH-DR-LR
α0 0,0687 *** 0,0681 *** 0,0680 *** 0,0678 *** 0,0682 *** 0,0682 *** 0,0681 *** 0,0709 *** 0,0710 *** 0,0697 *** 0,0690 *** 0,0688 ***
α1 0,1040 *** 0,1060 *** 0,1052 *** 0,1054 *** 0,1042 *** 0,1042 *** 0,1044 *** 0,0995 *** 0,0993 *** 0,1022 *** 0,1021 *** 0,1031 ***
β0 0,0175 *** 0,0185 *** 0,0179 *** 0,0181 *** 0,0175 *** 0,0175 *** 0,0177 *** 0,0153 *** 0,0164 *** 0,0104 ** 0,1626 ** 0,0838 β1 0,0928 *** 0,0897 *** 0,0906 *** 0,0906 *** 0,0929 *** 0,0929 *** 0,0929 *** 0,1048 *** 0,1049 *** 0,0979 *** 0,0972 *** 0,0953 ***
β2 0,8734 *** 0,8680 *** 0,8636 *** 0,8629 *** 0,8626 *** 0,8627 *** 0,8618 *** 0,8777 *** 0,8780 *** 0,8684 *** 0,8664 *** 0,8646 ***
γ1 2,11E-05 * 2,51E-05 ** 5,55E-05 *** 2,33E-05 *** 5,47E-05 *** 5,62E-05 *** 2,30E-05 *** 3,76E-06
-
0,0006 ** 0,0558 ** 0,0005 γ2 -
-
-
-
-
-
-
-
-
-
-
0,0277
AIC 2,4736
2,4711
2,4683
2,4682
2,4678
2,4678
2,4677
2,4761
2,4757
2,4722
2,4737
2,4723 SBC 2,4833
2,4807
2,4780
2,4779
2,4775
2,4775
2,4774
2,4857
2,4837
2,4819
2,4834
2,4836
Returnvoorspelling
RMSE 1,7051
1,7053
1,7052
1,7052
1,7051
1,7051
1,7051
1,7047
1,7047
1,7050
1,7049
1,7050 MAE 1,2051
1,2052
1,2051
1,2051
1,2051
1,2051
1,2051
1,2048
1,2048
1,2050
1,2049
1,2050
MAPE 210,7
212,1
211,4
211,5
210,7
210,7
210,8
208,1
208,0
209,7
209,3
210,1 BP 0,0048
0,0047
0,0047
0,0047
0,0047
0,0047
0,0047
0,0050
0,0050
0,0049
0,0048
0,0048
VP 0,7949
0,7911
0,7926
0,7923
0,7945
0,7944
0,7941
0,8032
0,8036
0,7982
0,7985
0,7964 CP 0,2003 0,2042 0,2027 0,2030 0,2008 0,2009 0,2012 0,1918 0,1914
0,1969
0,1967
0,1988
Variantievoorspelling
RMSE 7,5374
7,6509
7,4691
7,5085
7,3874
7,3916
7,4289
7,2707
7,3128
7,2213
7,1427
7,1647 MAE 5,4822
5,5747
5,4617
5,4865
5,3994
5,4046
5,4284
5,2683
5,3216
5,2680
5,2759
5,2483
MAPE 0,2020
0,2050
0,2005
0,2014
0,1981
0,1983
0,1991
0,1956
0,1982
0,1939
0,1960
0,1932 Correlatie
Correlatiecoëfficiënt 0,7726 0,7603 0,7621 0,7601 0,7666
0,7668
0,7648
0,8018
0,8020 0,7866 0,7962 0,7867
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 1,0125
1,0098
1,0271
1,0246
1,0307
1,0311
1,0287
1,0138
1,0144
1,0392
1,0556
1,0544
R kwadraat 0,9229
0,9205
0,9248
0,9239
0,9267
0,9266
0,9257
0,9283
0,9275
0,9305
0,9333
0,9327 Regressie (c≠0)
φ1 10,9371
11,0527
10,5792
10,6632
10,4174
10,4283
10,5085
10,7185
10,8104
10,2454
10,0428
9,9487 φ2 0,6302
0,6234
0,6497
0,6452
0,6579
0,6578
0,6534
0,6414
0,6389
0,6712
0,6897
0,6910
R kwadraat 0,5968 0,5780 0,5808 0,5778 0,5877 0,5879 0,5849 0,6429 0,6432 0,6187 0,6340 0,6190
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
GJR-GARCH-modellen
GJR-GARCH E0 E1 E2 E3 E4 E5 E6 E7
GJR-GARCH
GJR-GARCH-DR
GJR-GARCH-LR
GJR-GARCH-DR-LR
α0 0,0476 *** 0,0484 *** 0,0489 *** 0,0488 *** 0,0489 *** 0,0489 *** 0,0489 *** 0,0477 *** 0,0477 *** 0,0479 *** 0,0472 *** 0,0475 ***
α1 0,1063 *** 0,1064 *** 0,1054 *** 0,1055 *** 0,1049 *** 0,1049 *** 0,1050 *** 0,1032 *** 0,1031 *** 0,1044 *** 0,1041 *** 0,1048 ***
β0 0,0190 *** 0,0194 *** 0,0189 *** 0,0191 *** 0,0185 *** 0,0185 *** 0,0187 *** 0,0171 *** 0,0175 *** 0,0120 *** 0,1649 ** 0,0924 β1 0,0282 ** 0,0283 ** 0,0314 ** 0,0313 ** 0,0340 *** 0,0339 *** 0,0339 ** 0,0417 *** 0,0415 *** 0,0343 *** 0,0308 ** 0,0302 **
β2 0,1083 *** 0,1065 *** 0,1043 *** 0,1044 *** 0,1027 *** 0,1027 *** 0,1028 *** 0,1018 *** 0,1019 *** 0,1062 *** 0,1090 *** 0,1087 ***
β3 0,8800 *** 0,8760 *** 0,8723 *** 0,8718 *** 0,8719 *** 0,8720 *** 0,8714 *** 0,8864 *** 0,8866 *** 0,8766 *** 0,8746 *** 0,8726 ***
γ1 2,08E-05 ** 2,16E-05 ** 4,52E-05 *** 1,89E-05 *** 4,38E-05 *** 4,50E-05 *** 1,84E-05 *** 1,47E-06
-
0,0006 ** 0,0563 ** 0,0005 γ2 -
-
-
-
-
-
-
-
-
-
0,0303
AIC 2,4574
2,4558
2,4543
2,4542
2,4543
2,4543
2,4542
2,4610
2,4605
2,4569
2,4582
2,4568 SBC 2,4687
2,4671
2,4656
2,4655
2,4656
2,4656
2,4655
2,4723
2,4702
2,4682
2,4694
2,4697
Returnvoorspelling
RMSE 1,7042
1,7043
1,7042
1,7042
1,7041
1,7041
1,7041
1,7038
1,7038
1,7040
1,7039
1,7040 MAE 1,2040
1,2041
1,2040
1,2040
1,2040
1,2040
1,2040
1,2037
1,2037
1,2039
1,2038
1,2039
MAPE 203,1
203,5
202,9
202,9
202,4
202,5
202,5
200,5
200,4
201,6
201,0
201,7 BP 0,0034
0,0034
0,0034
0,0034
0,0034
0,0034
0,0034
0,0034
0,0034
0,0034
0,0033
0,0034
VP 0,7915
0,7914
0,7931
0,7930
0,7942
0,7941
0,7940
0,7975
0,7976
0,7952
0,7957
0,7945 CP 0,2052 0,2052 0,2034 0,2036 0,2024 0,2024 0,2026 0,1992 0,1990
0,2014
0,2009
0,2022
Variantievoorspelling
RMSE 7,4934
7,5822
7,4026
7,4322
7,3049
7,3119
7,3392
7,1523
7,1697
7,1265
7,0009
7,0496 MAE 5,6260
5,6854
5,5650
5,5845
5,4846
5,4965
5,5147
5,3474
5,3701
5,3584
5,3345
5,3243
MAPE 0,2105
0,2124
0,2076
0,2083
0,2045
0,2049
0,2055
0,2017
0,2028
0,2002
0,2009
0,1991 Correlatie
Correlatiecoëfficiënt 0,7931 0,7848 0,7877 0,7864 0,7926
0,7926
0,7913
0,8253
0,8254 0,8092 0,8198 0,8101
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 1,0086
1,0056
1,0208
1,0187
1,0243
1,0246
1,0226
1,0123
1,0127
1,0342
1,0536
1,0503
R kwadraat 0,9238
0,9219
0,9259
0,9252
0,9280
0,9279
0,9272
0,9306
0,9303
0,9320
0,9358
0,9346 Regressie (c≠0)
φ1 11,0939
11,1886
10,8000
10,8562
10,6298
10,6448
10,6977
10,7836
10,8199
10,4074
10,1152
10,1032 φ2 0,6253
0,6195
0,6416
0,6383
0,6498
0,6495
0,6464
0,6411
0,6403
0,6652
0,6886
0,6857
R kwadraat 0,6290 0,6160 0,6205 0,6184 0,6282 0,6282 0,6261 0,6810 0,6813 0,6548 0,6721 0,6562
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
EGARCH-modellen
EGARCH E0 E1 E2 E3 E4 E5 E6 E7 EGARCH
EGARCH-DR
EGARCH-LR
EGARCH-DR-LR
α0 0,0488 *** 0,0490 *** 0,0498 *** 0,0498 *** 0,0501 *** 0,0501 *** 0,0501 *** 0,0486 *** 0,0486 *** 0,0511 *** 0,0498 *** 0,0500 ***
α1 0,1097 *** 0,1109 *** 0,1099 *** 0,1100 *** 0,1088 *** 0,1089 *** 0,1090 *** 0,1039 *** 0,1039 *** 0,1082 *** 0,1149 *** 0,1152 ***
β0 -0,1407 *** -0,1421 *** -0,1485 *** -0,1488 *** -0,1506 *** -0,1506 *** -0,1508 *** -0,1426 *** -0,1423 *** -0,1699 *** 0,9571 *** 0,7992 ***
β1 0,1509 *** 0,1453 *** 0,1490 *** 0,1490 *** 0,1546 *** 0,1546 *** 0,1545 *** 0,1749 *** 0,1749 *** 0,1507 *** 0,0680 ** 0,0644 **
β2 -0,0778 *** -0,0762 *** -0,0761 *** -0,0761 *** -0,0759 *** -0,0759 *** -0,0759 *** -0,0755 *** -0,0755 *** -0,0784 *** -0,0921 *** -0,0901 ***
β3 0,9644 *** 0,9599 *** 0,9577 *** 0,9574 *** 0,9597 *** 0,9597 *** 0,9594 *** 0,9776 *** 0,9777 *** 0,9548 *** 0,8770 *** 0,8761 ***
γ1 1,61E-05 *** 1,77E-05 *** 3,98E-05 *** 1,66E-05 *** 3,76E-05 *** 3,85E-05 *** 1,56E-05 *** 5,69E-07
-
0,0012 *** 0,4518 *** 0,0008 γ2 -
-
-
-
-
-
-
-
-
-
-
0,3935 ***
AIC 2,4627
2,4602
2,4590
2,4590
2,4597
2,4597
2,4597
2,4664
2,4659
2,4599
2,4508
2,4501 SBC 2,4740
2,4715
2,4703
2,4703
2,4709
2,4710
2,4710
2,4777
2,4756
2,4712
2,4621
2,4630
Returnvoorspelling
RMSE 1,7047
1,7049
1,7048
1,7048
1,7047
1,7047
1,7047
1,7039
1,7039
1,7046
1,7055
1,7055 MAE 1,2044
1,2046
1,2045
1,2045
1,2044
1,2044
1,2044
1,2038
1,2038
1,2044
1,2050
1,2050
MAPE 206,4
207,5
207,0
207,1
206,3
206,3
206,4
201,5
201,5
206,2
211,2
211,5 BP 0,0034
0,0034
0,0035
0,0035
0,0035
0,0035
0,0035
0,0034
0,0034
0,0036
0,0034
0,0034
VP 0,7852
0,7827
0,7847
0,7845
0,7867
0,7866
0,7864
0,7961
0,7961
0,7878
0,7753
0,7747 CP 0,2114 0,2139 0,2118 0,2121 0,2099 0,2099 0,2101 0,2005 0,2005
0,2087
0,2213
0,2219
Variantievoorspelling
RMSE 14,8815
24,9783
15,0328
16,6678
11,6686
11,7060
12,8618
6,6378
6,6480
8,4902
6,3509
7,2297 MAE 7,9940
10,2722
8,1808
8,5735
7,2399
7,2328
7,5343
5,0276
5,0387
6,1354
4,9415
5,4042
MAPE 0,2695
0,3289
0,2804
0,2897
0,2536
0,2532
0,2605
0,1873
0,1878
0,2211
0,1873
0,1998 Correlatie
Correlatiecoëfficiënt
0,8196 0,7435 0,8432 0,8002
Regressie (c=0)
φ1 0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000 φ2 0,7510
0,5341
0,7507
0,7060
0,8539
0,8533
0,8136
1,0778
1,0784
0,9756
1,0834
1,0325
R kwadraat 0,7854
0,7854
0,7787
0,7530
0,8395
0,8385
0,8181
0,9450
0,9449
0,9026
0,9508
0,9299 Regressie (c≠0)
φ1 17,3832
20,1507
17,6266
18,1999
15,7733
15,8082
16,4930
8,7639
8,7798
12,5513
8,3887
10,5210 φ2 0,3225
0,1945
0,3130
0,2851
0,4014
0,4004
0,3667
0,7509
0,7508
0,5549
0,7702
0,6594
R kwadraat 0,4788 0,3941 0,4418 0,4358 0,4919 0,4923 0,4834 0,6719 0,6717 0,5528 0,7111 0,6403
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie
Appendix G
Output combinatie-modellen
GARCH GJR-GARCH EGARCH
α0 0,06594 *** 0,05013 *** 0,05029 *** α1 0,10420 *** 0,10269 *** 0,10787 *** β0 0,02208 *** 0,02291 *** -0,13514 *** β1 0,09247 *** 0,02811
0,13890 ***
β2 0,85887 *** 0,10224 *** -0,07638 *** β3 -0,00003
0,87347 *** 0,95897 ***
γ1 -0,00007
-1,22E-05
-6,60E-06
γ2 0,00300
-3,91E-05
-9,34E-07
γ3 -0,00109
1,12E-03
5,02E-04
γ4 -0,00265
-3,42E-04
-1,52E-04
γ5 -0,00082
9,46E-04
2,01E-03
γ6 0,00137
-2,23E-03
-2,48E-03 ***
γ7 -0,00002 * 4,46E-04
1,33E-04
γ8 -
-1,90E-05 ** -2,06E-05 *
AIC 2,46855
2,45455
2,45912
SBC 2,48953
2,47714
2,48171
Returnvoorspelling
RMSE 1,7050
1,7039
1,7045 MAE 1,2049
1,2038
1,2043 MAPE 209,7
201,2
205,6
BP 0,0046
0,0035
0,0035 VP 0,7946
0,7983
0,7885 CP 0,2008
0,1982
0,2080
Variantievoorspelling
RMSE 7,6852
7,5046
346,3135 MAE 5,7424
5,7201
43,9843 MAPE 0,2136
0,2155
1,7468
Correlatie
Correlatiecoëfficiënt
Regressie (c=0)
φ1 -
0,0000
0,0000 φ2 -
1,0216
0,0133 R kwadraat -
0,9239
0,0294
Regressie (c≠0)
φ1 -
10,8723
25,4883 φ2 -
0,6383
0,0007 R kwadraat - 0,6017 0,0006
*** 1% niveau van significantie, ** 5% niveau van significantie, * 10% niveau van significantie