53
Examensarbete vid Institutionen för geovetenskaper ISSN 1650-6553 Nr 159 Utveckling och utvärdering av statistiska metoder för att öka träffsäkerheten hos lokala vindprognoser Kristoffer Lager

Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Examensarbete vid Institutionen för geovetenskaperISSN 1650-6553 Nr 159

Utveckling och utvärdering av statistiska metoder för att öka

träffsäkerheten hos lokala vindprognoser

Kristoffer Lager

Page 2: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom
Page 3: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

i

Sammanfattning

Vind används som en energikälla över hela jorden. För att kunna använda den så effektivt

som möjligt krävs det att det finns så bra prognoser och prognosmodeller som möjligt. En av

dessa modeller är Coupled Ocean/Atmosphere Mesoscale Prediction System (COAMPS®)

som används för att beräkna korttidsprognoser. Den modellen används här för att beräkna

vindarna över två områden i Västra Götaland, Bengtsfors och Vänersborg. För de områdena

finns det även vindmätningar från SODAR-stationer.

Den första delen i arbetet är att se hur stor skillnad det är mellan två olika upplösningar,

36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

att beräkna några olika statistiska värden. Resultaten visar att skillnaden mellan de två

upplösningarna är ganska så liten och att den lägre upplösningen ger ett något bättre

resultat.

Den andra och större delen av arbetet består av att använda sig av två olika

regressionsmodeller för att anpassa prognosmodellernas resultat till mätresultatet. Dessa

regressionsmodeller ska sen kunna användas även när det inte finns några mätningar att

jämföra med. Meningen med regressionsmodellerna bygger på att de ska finna ett sätt att

beskriva differensen mellan prognosmodellens resultat och SODAR-mätningarna. Den

differensen dras sedan bort från prognosmodellens resultat så att en anpassning och ett mer

korrekt värde fås. Den första regressionsmodellen beräknar differensen utifrån vilken timme

på dygnet det är, den andra modellen beräknar differensen utifrån vindhastigheten.

Mätningarna som används är tagna från 75 meters höjd över marken. Dessa jämförs sen

med några olika resultat från prognosmodellen, t.ex. olika modellhöjder eller upplösningar,

och även med dessa resultat anpassade med regressionsmodellerna. Jämförelsen sker

genom att beräkna samma statistiska värden som innan, både med och utan

regressionsanpassning, och att se på histogram över differensens fördelning. Det visar sig att

med regressionsanpassningen så blir det en klar förbättring av de statistiska värdena jämfört

med det ursprungliga prognosresultatet. T.ex. så minskar den absoluta medeldifferensen

med ca 0,4-0,7 m/s efter anpassning med regressionsmodellen. Histogrammen visar klart att

en jämnare fördelning av resultaten har uppkommit efter anpassning med

regressionsmodellerna. Från att ha haft sin tyngdpunkt på en differens på ca 1 -2 m/s ligger

nu tyngdpunkten runt 0 m/s och differensen har generellt minskat mellan mätningarna och

prognosmodellens resultat.

Page 4: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

ii

Abstract

Wind is used as an energy source all over the world. To be able to use this effectively,

there is a need for as good forecasts and forecast models as possible. One of these models is

Coupled Ocean/Atmosphere Mesoscale Prediction System (COAMPS®) that is used to

calculate short time forecasts. This model is used here to calculate wind speeds at two

different areas in Västra Götaland, Bengtsfors and Vänersborg. There are also wind

measurements with SODAR stations for these areas.

The first part of this work is to investigate the difference between two model resolutions,

36 and 12 km, for the model results compared with the measurements. The comparison is

done by calculating some different statistical values. The results of these parameters show

that the difference between the two resolutions is fairly small and that the lower resolution

gives a slightly better result.

The second and major part of this work is to use two different regression models to adjust

the result of the forecast models to the result of the measurements. These regression

models will then be possible to use even when there are no measurements to compare with.

The idea of these regression models is to find a way to describe the difference between the

result of the forecast model and the SODAR measurements. This difference is then

subtracted from the result of the forecast model so that you get an adjustment and more

accurate result. The first regression model calculates the difference according to time of the

day, the other model calculates the difference according to the wind speed.

Furthermore, the measurements used are taken from 75 meters height above the ground.

These are then compared to some different results from the forecast model, for example

different model heights and different resolutions, and also the model results adjusted with

the regression models. The comparison is done by calculating the same statistic values as

before, both with and without an adjustment with the regression models, and also to look at

histograms that show the distribution of the difference. It is shown that with the regression

adjustment, there is a clear improvement of the statistical values compared to the original

results of the forecasts. For example the value of the absolute mean difference is reduced

with approximately 0.4-0.7 m/s with an adjustment of the regression model. The histograms

clearly show that a more even distribution occurs after the adjustment with the regression

models. From having a major part of the differences at 1-2 m/s to now having the major part

at around 0 m/s and furthermore there is also generally a lower difference between the

measurements and the results from the forecast model.

Page 5: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

iii

Innehåll

1 Inledning .............................................................................................................................................. 1

2 Datamaterial ........................................................................................................................................ 2

2.1 Mätplatserna och modellpunkterna ............................................................................................ 2

2.2 SODAR-mätningarna ..................................................................................................................... 2

2.3 COAMPS®-modellen ...................................................................................................................... 3

2.4 Rensning av datamaterialet .......................................................................................................... 4

3 Teori ..................................................................................................................................................... 6

3.1 Statistiska metoder ....................................................................................................................... 6

3.1.1 Enkel linjär regression ............................................................................................................ 6

3.1.2 Multipel linjär regression ....................................................................................................... 7

3.1.3 Icke-linjär regression och polynomsamband ......................................................................... 7

3.2 Statistisk jämförelse ..................................................................................................................... 8

4 Metod .................................................................................................................................................. 9

4.1 Jämförelse mellan två horisontella upplösningar ........................................................................ 9

4.2 Regressionsmodeller .................................................................................................................... 9

4.3 Val av regressionsmodell och variabler ...................................................................................... 12

4.3.1 Den första regressionsmodellen .......................................................................................... 12

4.3.2 Den andra regressionsmodellen .......................................................................................... 12

4.4 Val av datamaterial för framtagande av regressionsmodeller ................................................... 13

4.5 Test av modellerna ..................................................................................................................... 14

4.5.1 Perioderna ........................................................................................................................... 14

4.5.2 Hela året .............................................................................................................................. 14

5 Resultat .............................................................................................................................................. 15

5.1 Jämförelse mellan de två modellupplösningarna ...................................................................... 15

5.2 April – maj ................................................................................................................................... 15

5.2.1 Regressionsmodellerna ........................................................................................................ 15

5.2.2 Statistisk jämförelse ............................................................................................................ 16

5.2.3 Jämförelse av regressionsmodell med ett mindre referensmaterial ................................... 21

5.2.5 Standardavvikelsen .............................................................................................................. 21

5.2.6 Jämförelse med juli – augusti .............................................................................................. 22

Page 6: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

iv

5.3 November – december ............................................................................................................... 23

5.3.1 Regressionsmodellerna ........................................................................................................ 23

5.3.2 Statistisk jämförelse ............................................................................................................ 23

5.3.4 Standardavvikelse ................................................................................................................ 25

5.3.5 Jämförelse med januari – februari ....................................................................................... 25

5.4 Hela årets material ..................................................................................................................... 26

6 Diskussion .......................................................................................................................................... 29

7 Slutsatser ........................................................................................................................................... 31

8 Slutord ............................................................................................................................................... 32

9 Referenser ......................................................................................................................................... 32

10 Appendix 1 – Tabeller ...................................................................................................................... 34

11 Appendix 2 – Histogram .................................................................................................................. 37

Page 7: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

1

1 Inledning

Vind är en energikälla som människan använt ända sedan man satte de första seglen på en

flotte. Redan 200 år f.Kr. fanns det enkla ”vindkraftverk” i Kina som användes för att pumpa

vatten (Wind & Hydropower Technologies Program, 2005). Dessa utvecklades sedan till de

mer välkända väderkvarnarna för att senare bli dagens energiproducerande vindkraftverk.

Ju fler vindkraftverk som byggs och som kopplas in på kraftnätet, desto större påverkan på

nätet. Om det blåser mycket en dag ger det en större last på kraftnätet från vindkraftverken

än en dag med låga vindar.

Svenska Kraftnät som är ansvariga för kraftnätet i Sverige vill ha balans på nätet. Alltså att

det produceras lika mycket energi som det konsumeras. Om en vindkraftsproducent, som

har ett balansansvar, rapporterar för stor eller för liten produktion blir de avgiftsskyldiga.

(Klee, 2008)

Därför är det viktigt för vindkraftsproducenter att ha tillförlitliga vindprognoser så att de

kan beräkna hur mycket energi som kommer produceras den närmaste framtiden. Det spann

som framförallt är viktigt är från nutid och ca 36 timmar framåt, s.k. korttidsprognoser.

Ett instrument som kan användas till att ta fram prognoser är datormodellen Coupled

Ocean/Atmosphere Mesoscale Prediction System (COAMPS®), som är utvecklad av den

amerikanska marinen. Den modellen används kommersiellt här i Sverige för att ge

vindprognoser till olika vindkraftsproducenter.

I det här arbetet jämförs vindprognoser från COAMPS® med vindmätningar gjorda på två

SODAR-stationer utplacerade i sydvästra Sverige. Dessa jämförelser används till två olika

delstudier. Första studien handlar om att se om det är någon skillnad när man går från en

lägre till en högre upplösning av modellen. Beräkningarna för den högre upplösningen tar så

mycket längre tid att det är viktigt att veta om förbättringarna i resultatet försvarar denna

tidsökning.

I den andra studien skapas en regressionsmodell som förbättrar det resultat man får från

COAMPS®. Modellen bygger endast på data som finns i prognosen så att den kan användas

på framtida prognoser utan att ha ett behov av kontinuerligt uppdaterade mätningar.

Page 8: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

2

2 Datamaterial

2.1 Mätplatserna och modellpunkterna

I det här arbetet används vindmätningar från två SODAR-stationer som är utplacerade i

Västra Götalands län. Den ena står strax öster om Vänersborg i ett område som heter

Hunneberg och den andra står sydväst om Bengtsfors i närheten av Dingelvik, figur 1.

COAMPS® modellpunkter är utvalda för att hamna så nära SODAR-stationerna som

möjligt. För de punkter när man använder en upplösning på 36 km hamnar modellpunkterna,

i det här fallet, mellan 15-25 km från mätpunkterna. För en upplösning på 12 km kommer

man mycket närmare, 4-5 km.

Figur 1: Placering av SODAR-stationerna, blå stjärnor, samt punkterna för prognosberäkning, svart kryss har upplösning 36 km och rött kryss har upplösning 12 km. Karta från Hans Bergström.

2.2 SODAR-mätningarna

SODAR (Sonic Detection and Ranging) är ett mätinstrument som används för att mäta

vindprofiler och turbulens i den lägre delen av atmosfären. SODAR-stationerna sänder upp

ljudpulser i atmosfären som sprids och även reflekteras tillbaka till stationen. Genom att

analysera ljudstyrkan och dopplerfrekvensen på den reflekterade pulsen kan vindhastighet,

vindriktning och turbulens beräknas (ART, 2008).

SODAR-stationerna samlar in data som 60-minuters medelvärden av vindhastighet och

vindriktning för varje timme. Data som används i detta arbete är insamlade från januari 2007

till december 2007.

Mätningarna består av vindhastighet och vindriktning på olika nivåer i atmosfären från 50

m till 450 m. För det här arbetet kommer mätningarna på 75 m att användas. Den höjden

Page 9: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

3

har valts av två anledningar. Dels för att det är ungefär vid den höjden som många av dagens

vindkraftverk har sitt nav och för att den höjden även finns representerad som en höjdnivå i

prognosdata som man får från COAMPS® så att mätningarna och prognosen kan jämföras

direkt.

2.3 COAMPS®-modellen

COAMPS® är en mesoskalig, icke-hydrostatisk, kompressibel prognosmodell som är

utvecklad vid Naval Research Laboratory (NRL) Marine Meteorology Division (MMD) (Naval

Research Laboratory, 2008). Eftersom modellen klarar av att beräkna mesoskaliga fenomen

som bergsvindar, sjöbris, tropiska orkaner, frontsystem m.m. så har den använts i flera olika

undersökningar. Bl. a. har den använts för att beräkna prognoser och ge support till USA:s

båt under America’s Cup under mars och april 1995 (Hodur, 1997), till att simulera idealiska

tropiska cykloner (Hodur, 1997) samt till att simulera katabatiska flöden över en glaciär

(Söderberg och Parmhed, 2006).

COAMPS® används främst för att ta fram korttidsprognoser för de närmaste 72 timmarna.

Modellen är regional, men kan beräkna prognoser på alla områden på jorden. Den kan ha en

horisontell upplösning från några hundra km ända ner till 100 m. I det här arbetet används

upplösningarna 36 och 12 km för jämförelse.

Horisontellt är beräkningspunkterna uppbyggda enligt Arakawa-Lambs schema C, där

vindarna från nord-sydlig och öst-västlig riktning beräknas i olika punkter i schemat. Övriga

variabler beräknas sedan samlat i separata punkter. Se Chen et al. (2003) för schemats

uppbyggnad.

I vertikalt led har prognosen beräknats i 40 modellnivåer, från 5 m upp till 27650 m.

Upplösningen är uppbyggt med ett σ-koordinatsystem som följer terrängen. Om z = zs

definierar marknivån och z = H definierar atmosfärens höjd i modellen så blir σ:

. (1)

Vid marknivån blir σ = 0 och vid atmosfärens topp blir σ = H, atmosfärens höjd.

För beräkning av turbulensen används en nivå 2,5-modell (Mellor och Yamada, 1982). Den

modellen innehåller både en prognostisk ekvation för den turbulenta rörelseenergin samt en

diagnostisk ekvation som beräknar andramomenten, turbulenta flöden, för värme, fukt och

moment (Chen et al., 2003). COAMPS® innehåller även scheman för parametrisering av

ytflöden (Louis, 1979), fuktighet och moln (Rutledge och Hobbs, 1983) samt långvågig och

kortvågig strålning (Harshvardhan et al., 1987).

Här följer en kort beskrivning över hur en prognoskörning är uppställd. För mer utförlig

beskrivning se Chen et al. (2003), speciellt figur 1 och 2 samt tabell 2.2. Till att börja med är

det en mängd parametrar som väljs och ges ett värde, t.ex. inom vilket område prognosen

ska gälla, upplösning på modellen, mark- och terrängparametrisering, trycknivåer m.m. Ett

specifikt värde som ställs in, i den här processen, är skrovlighetslängden (z0). Det är den höjd

över marken där p.g.a. friktionen (Holton, 2004). motsvarar här medelvärdet av

Page 10: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

4

vinden. z0-värdet bestäms utifrån en databas som beskriver markens utseende, s.k.

markanvändningsdata. För den högre upplösningen används z0 = 0,75 m vid Vänersborg och

z0 = 0,84 m vid Bengtsfors. För november och december har även en prognoskörning gjorts

med z0 = 1,5 respektive 1,68 m, se diskussionsavsnittet. När all nödvändig information om

området ställts in i modellen kan den ta fram en standardatmosfär, ”mean state”, för det

området.

I detta läge använder man indata från analyser för att kunna få ett initialskede på hur

vädersituationen ser ut när prognosen ska beräknas, ”first guess”. Indata som används till

modellen är GFS-analyser (Global Forecast System model) som har hämtats från NCEP

(National Centers of Environmental Prediction). GFS-analyserna består av information om

temperatur, vindar, tryck och fuktighet från marknivå upp till 10 hPa höjd. Data till GFS-

analyserna har sammanställts och analyserats från mätningar från mätstationer, bojar,

flygplan, fartyg, radar m.m (NCEP, 2008). Analyserna hämtas från samma perioder som

SODAR-materialet. Nu ställs också randvillkoren upp för prognosberäkningen.

När de initiala skedena har bestämts kan prognosen beräknas. I det här fallet är det

vindhastighet, vindriktning, potentiell temperatur, atmosfärens fuktighet och lufttryck som

är det resultat man får ut. För att beräkna dessa variabler används prognosekvationer för u,

v, w (vindhastigheterna i x, y och z-riktning), π (exnerfunktionen), θ (potentiell temperatur),

e (turbulenta rörelseenergin), qv (blandningsförhållandet för vattenånga), qc (molndroppar),

qr (regndroppar), qi (iskristaller) samt qs (snöflingor). För en komplett lista med alla

ekvationer se Hodur (1997).

Tidsstegen för prognoserna är för 36 kilometers upplösning 60 sekunder och för 12

kilometers upplösning 20 sekunder. För det här arbetet har värden för varje timme i 30

timmar använts. Initialtimmen för varje dygn är 00 UTC. Under tiden som prognosen

beräknas driver man den med nya GFS-analyser som randdata var sjätte timme.

Nästa prognos börjar vid 00 UTC nästkommande dygn, så det blir en överlappning på sex

timmar mellan varje prognos. Prognoserna har beräknats med vad som kallas för kallstart.

Det innebär att analysdatan som stoppas in i modellen vid 00 UTC måste bearbetas i

modellen för att beräkna turbulens och andra parametrar. Det innebär att man har sex

timmar s.k. ”spin up”-tid som gör att de timmarna inte kan sägas vara fullständig

prognosdata. Därför kasseras dessa första timmar av prognosen, så resultatet från 06 UTC till

05 UTC nästa dygn av prognosen är det som används här. Sen tar nästa dygns prognos vid.

2.4 Rensning av datamaterialet

Främst utförs en visuell rensning. I materialet från SODAR-stationerna rensas uppenbart

felaktiga värden bort, t ex när en vindhastighet går från 3 m/s till 10 m/s nästa timme för att

timmen efter vara tillbaka på 3 m/s. När jämförelse mot prognosmodellens resultat sker så

rensas motsvarande timmes data bort även där.

I materialet från SODAR-mätningarna finns det längre perioder (upp till flera dagar) och

även enstaka timmar som saknas. Där rensas motsvarande tidsperiod bort i

prognosmodellens material.

Page 11: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

5

Även när det är en stor differens som har avvikande utseende mellan modellprognosen

och mätningarna rensas dessa tillfällen bort. Med avvikande utseende menas de perioder

där det uppenbarligen är något fel, antingen att GFS-analysen är felaktig eller att SODAR-

mätningarna är felaktiga. Den här utrensningen blir mer godtycklig och subjektiv, därför

redovisas resultat med både det ursprungliga datamaterialet och det utrensade. För

exempel på hur det kan se ut, se figur 2.

Figur 2: Ett exempel på en datarensning. Figur a är utan bortrensad data, figur b visar hur det ser ut när man plottar det rensade datamaterialet mot tiden (dag på året).

Page 12: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

6

3 Teori

3.1 Statistiska metoder

3.1.1 Enkel linjär regression

Linjär regression är en vanlig metod för att se hur en variabel är beroende av andra

variabler. Man ställer då upp ett samband så att

(2)

där y betecknar vad som kallas en beroende variabel och x1,…, xk betecknar de oberoende

variablerna. a samt b1, …, bk är konstanter som anpassas för att felet i sambandet ska bli så

litet som möjligt.

Enkel linjär regression bygger på att man har ett antal talpar (y1,x1), (y2,x2), …, (yn,xn), där n

är antalet par. Om dessa talpar någorlunda följer en rät linje kan man ställa upp ett linjärt

samband med endast en oberoende variabel

(3)

där står för det anpassade värdet. Man vill nu finna a och b så att felet

(4)

blir så litet som möjligt. Detta är första steget i minsta kvadratmetoden som används för att

minimera felet.

För att finna de a och b som minimerar felet ovan är nästa steg att göra en derivering av S

både med avseende på a och på b och sätta dessa derivator till 0.

(5)

(6)

Nu kan a och b lösas ut så att

(7)

(8)

där och står för medelvärden. (Andersson et al., 2007)

Page 13: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

7

3.1.2 Multipel linjär regression

Om man har flera variabler som påverkar den beroende variabeln man vill beräkna kan

man använda multipel linjär regression. T.ex. att vindhastighet kan bero både på

tryckskillnad och omgivande terräng.

Man ställer då upp ekvation (2) med den mängd oberoende variabler man vill använda och

får sambandet

. (9)

För att beräkna regressionskonstanterna ställer man, som i enkel linjär regression, upp

. (10)

Denna ekvation deriveras, och likställs med noll, med avseende på konstanterna så att

(11)

(12)

.

.

.

(13)

Ur det här ekvationssystemet löser man ut konstanterna som sen används i

regressionsmodellen.

3.1.3 Icke-linjär regression och polynomsamband

Om sambandet mellan den beroende och oberoende variabeln inte är linjärt utan har en

annan form kan ett polynomsamband av en viss grad vara att föredra som

regressionsmodell. Sambandet blir då

(14)

där k nu blir graden på polynomet.

För att beräkna regressionskonstanterna behöver man göra en transformation av den

oberoende variabeln så att man istället får en multipel linjär regression. Transformationen

blir då

(15)

Page 14: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

8

så att sambandet blir

. (16)

Nu löses regressionskonstanterna ut på samma sätt som för multipel linjär regression.

3.2 Statistisk jämförelse

För att jämföra hur väl prognosmodellen stämmer överrens med SODAR-mätningarna

kommer ett antal statistiska värden beräknas. Dessa följer till viss del Svensson (1998).

Korrelationskoefficienten är ett mått på hur det linjära sambandet är mellan de två värden

man jämför. I detta arbete används definitionen

(17)

där R är korrelationskoefficienten, xs är SODAR-värden och xp är prognosvärden. Strecken

ovanför betyder medelvärde över alla värden. Standardavvikelserna definieras som

(18)

(19)

Ett annat statistiskt värde är RMSE (Root Mean Square Error) eller

medelkvadratdifferensen. Eftersom man kvadrerar differensen får en större differens ett

större genomslag. Så om de större differenserna minskas kommer det ske en markant

minskning av RMSE.

(20)

Medeldifferensen

(21)

Absoluta medeldifferensen

(22)

Page 15: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

9

Den absoluta medeldifferensen är ett bättre mått än medeldifferensen, på hur mycket

resultatet har förbättrats, eftersom ett negativt fel är ett lika viktigt fel som ett positivt fel

när man jämför prognos och mätning.

Index of agreement

(23)

Index of agreement kan ha värden mellan 0 och 1. Ju närmre 1 värdet är desto bättre

resultat eller överrensstämmelse mellan de olika datamaterialen. Eller enklare, ju lägre

differens desto högre värden. Enligt Wilmott, som beskrev detta värde, ger IOA ett värde på

överrensstämmelsen mellan observationerna och prognosen som sträcker sig mer generellt

över hela datasetet (Hope et al. 1992).

4 Metod

I det här arbetet görs det en jämförelse över hur bra COAMPS®-modellen stämmer

överrens med SODAR-mätningar, samt försök till att anpassa modellens resultat så att man

får bättre överrensstämmelse. Tanken är att metoderna för anpassningen ska kunna

användas generellt även när man inte har mätningar att jämföra med. Jämförelsen görs

genom att beräkna de statistiska värden som har redovisats i teoridelen och att redovisa

differensens fördelning i histogram.

4.1 Jämförelse mellan två horisontella upplösningar

Den första jämförelsen som genomförs är hur stor skillnad det är på modellens

träffsäkerhet när man har två olika horisontella upplösningar. Som tidigare nämnts jämförs

upplösningarna 36 km (i fortsättningen benämnd tsera1) och 12 km (tsera2) mellan

beräkningspunkterna. Det är viktigt att veta hur stor förbättringen blir eftersom det tar

längre tid att beräkna en prognos med högre upplösning. Att beräkna en prognos med två

gånger högre upplösning tar inte dubbelt så lång tid utan åtta gånger så lång tid (Stefan

Söderberg muntligen). För den här initiala jämförelsen används allt datamaterial utan någon

hänsyn till säsongsvariationer. Detta för att det viktigaste är att se en genomsnittlig skillnad i

resultatet.

4.2 Regressionsmodeller

När det gäller framtagning av regressionsmodeller görs det under två perioder på året.

Detta för att prognosmodellen, och framförallt differensen mellan modellen och SODAR-

mätningarna, ger olika resultat beroende på årstiderna. De perioder som används är april-

maj och november-december.

Page 16: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

10

Figur 3 visar prognosens dygnsutveckling under perioden april och maj. Framförallt ser

man hur differensen mellan modellen och SODAR-mätningen varierar på ett speciellt sätt

under dygnet, figur 3c. Under timmarna strax före midnatt ger prognosen konsekvent för

höga vindar. Regelbundenheten syns också i prognoserna för vindhastigheten som figur 3a

visar. På figur 3b syns SODAR-mätningarna, där finns inte samma regelbundenhet utan där

är vindhastigheten mer jämnt fördelat. En kurva i figurerna motsvarar en dygnsprognos

alternativt SODAR-mätningar under ett dygn. Den tjockare svarta kurvan i figurerna visar

medelvärdet för perioden. Att det finns en dygnsvariation på det sättet som prognosen visar

är inte orimligt med tanke på de skillnader i stabilitet som finns mellan natt och dag vid den

här tiden på året. Men i det här fallet har dessa skillnader fått för stort genomslag i

prognoserna.

Figur 3: Figur a visar hur dygnsprognoserna ser ut under perioden april och maj. Figur b visar SODAR-mätningarna. Figur c visar differensen mellan dessa två. De svarta kurvorna är medelvärdena för perioden. Timme på dygnet visar tiden i LST. Materialet är från Vänersborg på 75 meters höjd. Prognoserna är beräknade med 36 km upplösning.

Om man istället ser på hur prognoserna ser ut för november och december, figur 4, så

finns inte alls samma regelbundenhet över dygnet. Utan snarare så visar sig en väldigt jämn

prognos, utan några större dygnsvariationer alls. Däremot syns hur medelhastigheten ligger

högre för prognoserna jämfört med SODAR-mätningarna. Då det är så olika utseende under

de olika perioderna kommer det behövas olika regressionsmodeller som beror på olika

variabler.

Page 17: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

11

Figur 4: Figur a visar hur dygnsprognoserna ser ut under perioden november och december. Figur b visar SODAR-mätningarna. Figur c visar differensen mellan dessa två. De svarta kurvorna är medelvärdena för perioden. Timme på dygnet visar tiden i LST. Materialet är från Vänersborg på 75 meters höjd. Prognoserna är beräknade med 36 km upplösning.

Eftersom det är differensen som ska minimeras när anpassningen av prognoserna görs är

det också differensen som regressionsmodellerna ska anpassas för. Så att

(24)

där du står för differensen, u står för vindhastigheten och x1 … xk står för de oberoende

variablerna som differensen ska anpassas mot. Variablerna kommer vara olika beroende på

vilken period på året som man vill beräkna regressionsmodellen. När man som här har en

mängd datapunkter beräknas du i varje datapunkt. Det gör att du blir en vektor där varje

värde motsvarar samma timme som för prognosen.

Då kan den anpassade prognosen beräknas med

. (25)

För att kontrollera hur mycket bättre anpassningen blir beräknas samma statistiska värden

som för jämförelsen mellan de två upplösningarna. Dessutom kontrolleras histogram över

differensens storlek i intervall om 1 m/s.

Page 18: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

12

4.3 Val av regressionsmodell och variabler

4.3.1 Den första regressionsmodellen

Eftersom prognoserna i april och maj, och framförallt differensen, har ett så karakteristiskt

utseende väljs den oberoende variabeln i regressionsanalysen till timme på dygnet. Eller

snarare indexet på timmen. Modellresultatet från prognosen ges för varje timme under året

ett indexnummer. 1 januari är dag 1, 2 januari är dag 2, 3 februari är dag 34 o.s.v. Sen ges

varje timme under dagen ett index. Första prognostimmen, 00, har index 0/24 = 0, andra

prognostimmen har index 1/24 = 0,0417, o.s.v. Så kl. 06 UTC den 6 januari får index 6 + 6/24

= 6,25. Eftersom det är dygnets variation som är intressant, inte vilken dag på året det är,

används endast decimalvärdet för varje timindex som oberoende variabel. Utifrån utseendet

på differensens dygnsvariation används en polynomanpassad regressionsmodell av fjärde

graden,

(26)

där x står för timmens index.

Regressionsmodellen bygger på förhållandet mellan SODAR-mätningarna och det aktuella

prognosmaterialet som man vill jämföra med och man får därför olika regressionskonstanter

beroende på vilket material man använder. T.ex. får man olika konstanter när man beräknar

regressionsmodellen för tsera1 eller för tsera2, eftersom man har olika referensmaterial.

4.3.2 Den andra regressionsmodellen

För perioden november och december visades tidigare att en annorlunda sorts

regressionsmodell måste användas. Däremot används samma princip med att

regressionsmodellen syftar till att finna differensen och vad den beror på och att man sen

subtraherar differensen från prognosen, se ekvation 24 och 25.

För den här perioden visar det sig istället att vindhastigheten går att använda som en

variabel för att beräkna hur stort felet är. I figur 5 visas differensens beroende av prognosens

vindhastighet. Här syns det tydligt att ju högre vindhastighet i prognosen desto större blir

felet. Samtidigt ser man att vid låga vindhastigheter är prognosen ofta lägre än mätningarna.

För att komma åt de variationerna så delas alla datapar, prognos och mätning vid samma

tidpunkt, upp i fyra olika intervall beroende på vindhastigheten, 0-3, 3-6, 6-9 och >9 m/s. Det

är prognosens vindhastigheter som bestämmer inom vilket intervall talparen hamnar. Detta

eftersom det framöver endast är den vindhastigheten man kommer ha tillgång till.

För varje intervall anpassas en enkel regressionsmodell, ekvation 3, med en variabel. Det

ger ekvationen

(27)

Page 19: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

13

där u står för prognosens vindhastighet. Konstanterna a och b kommer ha olika värde beroende på i vilket intervall u hamnar. Det blir då fyra stycken regressionsmodeller, med olika konstanter, för varje period som undersöks.

Figur 5:Differensens beroende av prognosens vindhastighet. Den röda linjen visar var differensen är noll. Materialet är från november och december vid Vänersborg och Bengtsfors, tsera1.

4.4 Val av datamaterial för framtagande av regressionsmodeller

Ett antal olika jämförelser mellan prognoserna och SODAR-mätningarna görs i arbetet. Till

att börja med kommer en jämförelse att göras mot prognosen på samma höjdnivå, 75 m,

utan att någon rensning av avvikande prognosvärden har skett. Det beräknas

regressionsmodeller för både tsera1 och tsera2, som sen statistiskt jämförs mot SODAR-

mätningarna.

Som referensmaterial för att få fram regressionskonstanterna sammanfogas hela

materialet både från Vänersborg och från Bengtsfors över hela perioden april och maj. Den

regressionsmodell som man då får fram används mot de fyra olika dataseten var för sig,

alltså Vänersborg i april och maj och Bengtsfors i april och maj. Så varje framtagen

regressionsmodell kommer användas på fyra separata set med prognosmaterial. För

perioden november och december kommer samma princip att användas.

Ett problem med detta är att ingen jämförelse av regressionsmodellen sker med ett helt

”rent” datamaterial, alltså att kontrollmaterialet inte är samma material som

referensmaterialet som modellen har tagits fram med. Anledningen till att denna metod

ändå har valts är för att få ett bredare referensmaterial där resultatet förhoppningsvis kan

användas mer generellt. Det täcker in fler platser över en längre tidsperiod.

Men för att även visa att regressionsmodellsprincipen fungerar redovisas resultat där

regressionsmodellen beräknats endast av material från Vänersborg under maj som används

på materialet från de fyra perioderna, se avsnitt 5.2.3.

Page 20: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

14

Även jämförelse mellan SODAR-materialet på 75 meters höjd och modellprognoser på 55

meters höjd utförs. Här beräknas en regressionsmodell på samma sätt som beskrivet ovan.

Slutligen görs jämförelser med det material som har rensats på det sätt som beskrivs i

avsnittet ”Rensning av datamaterial”. Förhoppningen här är att få fram ett mer ”sant” värde

då mer uppenbara fel har försvunnit. När de är borttagna borde man bättre kunna lita på att

man hittar systematiska fel som sedan kan åtgärdas.

4.5 Test av modellerna

4.5.1 Perioderna

Den regressionsmodell som beräknas för april och maj testas och jämförs mot

datamaterialet från juli och augusti. Det resultatet jämförs också mot det resultat man får

om man använder en regressionsmodell som har juli och augusti som referensmaterial. För

detta test används endast resultatet från det ursprungliga prognosmaterialet på 75 meters

höjd. Att regressionsmodellerna testas mot perioden juli och augusti beror på att

prognoserna även här beter sig på ungefär samma sätt som i figur 3.

Regressionsmodellen för november och december testas mot materialet från januari och

februari samma år på samma sätt.

4.5.2 Hela året

Slutligen görs en jämförelse med allt material som används i arbetet, där de två olika

regressionsmodellerna testas. För modellen som används under sommarhalvåret kommer

de regressionskonstanter användas som har april och maj som referensmaterial. Det

resultatet jämförs också med en regressionsanpassning där konstanterna beräknas utifrån

allt datamaterial.

För modellen som används under vinterhalvåret används konstanterna från november och

december. Där görs samma jämförelse som för den andra modellen. Även här används

prognosmaterialet från 75 m modellnivå, och det för båda upplösningarna.

Page 21: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

15

5 Resultat

5.1 Jämförelse mellan de två modellupplösningarna

Här görs en statistisk jämförelse mellan de två upplösningarna 12 och 36 km utifrån de

statistiska värden som beskrivs i teoridelen. Datamaterialet som används kommer från

januari, februari, april, maj, juli, augusti, november och december, så det täcker in större

delen av året och årstiderna. Resultatet ses i tabell 1.

Tabell 1: Resultatet för de olika statistiska värdena. Tsera1 är 36 km upplösning, tsera2 är 12 km upplösning.

R RMSE MD AMD IOA

Tsera1 Tsera2 Tsera1 Tsera2 Tsera1 Tsera2 Tsera1 Tsera2 Tsera1 Tsera2

Vänersborg 0,70 0,73 1,88 2,22 0,89 1,42 1,49 1,80 0,80 0,77

Bengtsfors 0,69 0,68 1,98 2,51 1,08 1,71 1,60 2,05 0,78 0,72

Som man kan se i tabellen så visar det sig tydligt att prognosen med 36 km upplösning ger

bättre resultat. Framförallt för mätningarna vid Bengtsfors. Detta syns även när man jämför

standardavvikelsen för prognoserna och SODAR-mätningarna som man kan se i tabell 2.

Tabell 2: Standardavvikelsen för SODAR-mätningarna och prognoserna i två olika upplösningar.

Standardavvikelse

SODAR Tsera1 Tsera2

Vänersborg 2,08 2,19 2,44

Bengtsfors 2,07 2,12 2,41

5.2 April – maj

5.2.1 Regressionsmodellerna

Enligt ekvation 26 beräknas fem regressionskonstanter till regressionsmodellen. För de

olika upplösningarna och för olika modellnivåer blir det olika konstanter. I tabell 3 redovisas

de olika konstanterna för Vänersborg, något avrundade.

Tabell 3: De olika regressionskonstanterna för regressionsmodellerna. Vänstra kolumnen visar vilken upplösning och vilken modellhöjd.

a b1 b2 b3 b4

Tsera1 75m 1,30 14,88 -107,82 183,87 -90,71

Tsera2 75m 1,99 15,42 -112,39 190,86 -93,83

Tsera1 55m 0,59 12,01 -85,87 146,62 -72,5

Tsera2 55m 1,15 11,96 -85,22 146,00 -72,55

Page 22: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

16

5.2.2 Statistisk jämförelse

Tabellerna som följer visar de olika statistiska värdena mellan SODAR-materialet och

modellprognosen. Vänsterspalten, ”före”, visar värdet för den ursprungliga prognosen och

högerspalten, ”efter”, visar värdet efter att en anpassning har gjorts med hjälp av

regressionsmodellen. De första två tabellerna visar resultatet för de regressionsanpassningar

som har skett för en jämförelse mellan samma höjdnivå, där både materialet från SODAR-

mätningarna och från prognosmodellen är från 75 meters höjd.

Man kan tydligt se en förbättring i de statistiska resultaten efter att man anpassat

prognoserna med hjälp av regressionsmodellen. Att medelvärdet av MD är så lågt är klart

väntat eftersom det är just det en regressionsmodell åstadkommer. Men framförallt så har

RMSE och AMD minskat markant vilket innebär att de större differenserna har blivit färre.

Innan anpassningen hade prognoserna för tsera2 klart sämre värden för RMSE, MD och

AMD, medan R-värdet var något bättre, jämfört med tsera1, tabell 4 och 5. Men det är också

här de största förbättringarna i resultatet kan ses. Efter anpassningen är alltså de båda

upplösningarna ungefär likvärdiga.

Tabell 4: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 75 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,66 0,80 2,02 1,42 0,85 0,24 1,66 1,10 0,79 0,88

Bengtsfors maj 0,63 0,71 1,83 1,47 0,71 0,10 1,46 1,6 0,77 0,84

Vänersborg april 0.59 0,71 1,97 1,45 0,69 0,09 1,61 1,14 0,74 0,84

Vänersborg maj 0,68 0,79 1,55 1,29 0,22 - 0,40 1,25 1,01 0,82 0,88

Medelvärde 0,64 0,75 1,84 1,41 0,62 0,01 1,50 1,10 0,78 0,86

Tabell 5: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,63 0,75 2,53 1,63 1,47 0,30 2,02 1,26 0,73 0,86

Bengtsfors maj 0,66 0,73 2,18 1,53 1,26 0,09 1,74 1,21 0,74 0,85

Vänersborg april 0,62 0,73 2,32 1,58 1,25 0,08 1,87 1,22 0,71 0,84

Vänersborg maj 0,71 0,81 1,73 1,35 0,75 -0,43 1,40 1,06 0,81 0,88

Medelvärde 0,66 0,76 2,19 1,52 1,18 0,01 1,76 1,19 0,75 0,86

Page 23: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

17

Den förbättring som ses i resultaten för RMSE, MD och AMD går även att se om man

ställer upp histogram som visar fördelningen av differensen mellan modellprognosens

resultat och SODAR-mätningarna. Figur 6 visar hur fördelningen har förändrats för tsera1.

Precis som i tabell 4 kan man se att innan regressionsmodellen använts fanns det en klar

övervikt på positiv differens, att prognoserna oftast gav ett för högt värde på

vindhastigheten. Efter att ha använt regressionsmodellen på samma dataset har

fördelningen blivit mer jämnt fördelad och en större andel av datapunkterna har hamnat

inom intervallet -1<x<1 vilket leder till att RMSE och AMD får lägre värden. Det syns tydligast

i figur 6a som visar april månads felvärden vid Bengtsfors.

Figur 7 visar samma sak som figur 6 men för tsera2. Här har andra regressionskonstanter

anpassade för det datamaterialet beräknats och använts. Precis som för de statistiska

värdena, tabell 5, så kan man i histogrammen se att förbättringen blir ännu större här än för

den lägre upplösningen. Om man t.ex. ser på figur 7b så har fördelningen haft sitt maximum

på en differens på 2 m/s, men efter regressionsanpassningen har fördelningen sitt maximum

vid 0 m/s.

Figur 6: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 36 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg.

Page 24: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

18

Figur 7: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 12 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg.

Som både det statistiska resultatet och histogrammen visar ligger vindhastigheten för

prognosen generellt sett för högt. Därför görs även en jämförelse med en lägre modellnivå,

55 m, där vindhastigheten bör vara lägre. Detta för att se om man får bättre

överrensstämmelse med SODAR-mätningarna, tabell 6 och 7.

Om man jämför det statistiska resultatet för de två höjdnivåerna innan

regressionsanpassningen får man också bättre resultat för den lägre modellnivån. Det får

man även efter regressionsanpassningen, men nu är skillnaden mot nivåerna mycket mindre,

tabell 4 till 7. Speciellt syns detta för tsera2 där det är ganska likartade resultat mellan de

olika modellnivåerna.

Tabell 6: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 55 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,71 0,81 1,67 1,36 0,30 0,20 1,36 1,05 0,83 0,88

Bengtsfors maj 0,66 0,72 1,57 1,42 0,24 0,13 1,26 1,12 0,81 0,84

Vänersborg april 0,63 0,72 1,64 1,35 0,16 0,05 1,30 1,05 0,79 0,85

Vänersborg maj 0,72 0,80 1,39 1,23 -0,26 -0,37 1,09 0,96 0,84 0,88

Medelvärde 0,68 0,76 1,57 1,34 0,11 0,00 1,25 1,04 0,82 0,86

Page 25: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

19

Tabell 7: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,68 0,78 1,95 1,47 0,82 0,24 1,56 1,13 0,80 0,87

Bengtsfors maj 0,68 0,74 1,74 1,44 0,70 0,12 1,37 1,13 0.80 0,85

Vänersborg april 0,66 0,74 1,78 1,40 0,62 0,04 1,42 1,07 0,77 0,86

Vänersborg maj 0,75 0,81 1,38 1,24 0,19 -0,39 1,08 0,97 0,86 0,89

Medelvärde 0,69 0,77 1,71 1,39 0,58 0,00 1,36 1,08 0,82 0,87

Figurerna 8 och 9 visar hur fördelningen har förändrats för modellnivån 55 m med eller

utan regressionsanpassning. Jämfört med prognosen från 75 meters nivå så visar det sig här

att fördelningen av differenserna, innan en regressionsanpassning har gjorts, inte har lika

stor övervikt på positiva differenser. Prognosen ger alltså klart bättre värden för den lägre

modellnivån. När anpassningen med regressionsmodellen görs så är fördelningen mellan de

två modellnivåerna mer likartade, precis som det statistiska resultatet visar.

Regressionsmodellen påverkar resultatet mer för den högre nivån än för den lägre.

Figur 8: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 36 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg. Här på 55 m höjd i modellen.

Page 26: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

20

Figur 9: Histogram över fördelningen av differensen mellan SODAR-mätningarna och

prognosmodellen. Upplösning 12 km. Bilderna till vänster visar april och maj för Bengtsfors och

bilderna till höger Vänersborg. Här på 55 m höjd i modellen.

Enligt metodavsnittet så har även en jämförelse gjorts mellan SODAR-mätningarna och det

rensade prognosmaterialet. Här redovisas resultatet för båda höjdnivåerna, 55 m och 75 m,

med upplösning 12 km. Jämförelse av resultaten i tabell 8 och 9 med resultaten i tabell 5 och

7 visar att endast en mycket marginell förbättring har skett i förhållande till samma nivå utan

datarensning.

Fortfarande är det så att prognoserna ger för höga vindhastigheter men att den lägre

prognosnivån ger ett bättre resultat.

Tabell 8: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m, rensade värden.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,63 0,75 2,53 1,64 1,47 0,33 2,02 1,27 0,73 0,86

Bengtsfors maj 0,66 0,73 2,18 1,53 1,26 0,13 1,74 1,21 0,74 0,85

Vänersborg april 0,62 0,73 2,17 1,50 1,07 -0,06 1,74 1,16 0,73 0,85

Vänersborg maj 0,74 0,81 1,69 1,34 0,74 -0,40 1,36 1,05 0,82 0,88

Medelvärde 0,66 0,76 2,14 1,50 1,14 0,00 1,72 1,17 0,76 0,86

Page 27: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

21

Tabell 9: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m, rensade värden.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,68 0,78 1,95 1,48 0,82 0,27 1,56 1,14 0,80 0,87

Bengtsfors maj 0,68 0,74 1,74 1,45 0,70 0,15 1,37 1,13 0,80 0,85

Vänersborg april 0,67 0,76 1,65 1,31 0,46 -0,08 1,32 1,02 0,80 0,87

Vänersborg maj 0,76 0,81 1,34 1,23 0,20 -0,35 1,05 0,96 0,87 0,89

Medelvärde 0,70 0,77 1,67 1,37 0,55 0,00 1,33 1,07 0,82 0,87

5.2.3 Jämförelse av regressionsmodell med ett mindre referensmaterial

I de tabellerna 3 – 9 har allt SODAR-material använts som referensmaterial för att beräkna

regressionsmodellen. I tabell 10 är det endast SODAR-materialet från Vänersborg under maj

som används som referensmaterial. De regressionskonstanter som är beräknade för det

materialet används på prognoserna för Vänersborg, april, och Bengtsfors, april och maj.

Tabellen visar helt klart att även dessa prognoser har blivit förbättrade efter en

regressionsanpassning. Det bästa resultatet fås ju naturligtvis på det material som använts

som referens, det är markerat med fet stil.

Att det har skett en sådan tydlig förbättring av de statistiska värdena på materialet som inte har använts som referensmaterial visar på att principen med en regressionsmodell som bygger på dygnsvariationer är väl fungerande för denna period.

Tabell 10: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 75 m. Här är endast Vänersborg maj referensmaterial för regressionsmodellen, det är markerat med fet stil.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Bengtsfors april 0,66 0,79 2,02 1,56 0,85 0,64 1,66 1,24 0,79 0,86

Bengtsfors maj 0,63 0,71 1,83 1,54 0,71 0,49 1,46 1,22 0,77 0,83

Vänersborg april 0.59 0,70 1,97 1,55 0,69 0,48 1,61 1,19 0,74 0,82

Vänersborg maj 0,68 0,79 1,55 1,22 0,22 0,00 1,25 0,95 0,82 0,88

5.2.5 Standardavvikelsen

Att fördelningen av felet minskar är positivt. Men hur blir fördelningen av vindhastigheterna efter anpassningen med regressionsmodellen? Det kan man se på vilket värde standardavvikelsen har. Ju mer lika värden på standardavvikelserna SODAR-mätningarna och prognoserna har desto mer likartad är spridningen från medelvärdet från

Page 28: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

22

perioden. Däremot säger inte standardavvikelsen vilket medelvärdet är, så man kan inte se hur väl prognosen och SODAR-mätningen ligger i det avseendet.

I tabell 11 redovisas standardavvikelserna för det ursprungliga materialet vid 75 m modellhöjd för de båda upplösningarna vid Vänersborg.

Tabell 11: Standardavvikelsen för SODAR-mätningarna och prognoserna före och efter regressionsanpassning. Materialet som använts är från Vänersborg och med båda upplösningarna.

Vän.april tsera1 Vän.maj tsera1 Vän.april tsera2 Vän.maj tsera2

Std för SODAR 1,84 1,87 1,84 1,87 Std för prognos 2,17 1,98 2,46 2,19 Std för prognos efter regression

1,97 1,92 2,29 2,14

Här syns att det finns en större standardavvikelse för prognoserna än för SODAR-

mätningarna, men att det efter anpassning med regressionsmodellen har det blivit något

mer likartade värden, speciellt för april.

5.2.6 Jämförelse med juli – augusti

I tabell 12 och 13 visas hur regressionsmodellerna har förbättrat prognoserna för juli och

augusti. Kolumn 1 visar resultatet för den ursprungliga prognosen utan

regressionsanpassning. Kolumn 2a visar resultatet när man anpassat prognosen med en

regressionsmodell som är framtagen med juli och augusti som referensmaterial. Kolumn 2b

visar resultatet när man anpassat med en regressionsmodell som har samma

regressionskonstanter som för april – maj, de konstanter som finns i tabell 1. Inte så oväntat

visar det sig att resultatet i 2a är bättre än resultatet för 2b, men det är en nästan obetydlig

skillnad och ibland så är t.o.m. 2b bättre. Detta visar att själva principen med att det finns en

dygnsvariation som behöver anpassas stämmer bra för sommarhalvåret.

Tabell 12: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har juli - augusti som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för april – maj. Tsera1 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Bengtsfors

april

0.69 0.75 0.74 1.81 1.36 1.39 1.04 0.43 0.42 1.47 1.05 1.08 0.78 0.85 0.84

Bengtsfors maj 0.61 0.71 0.71 1.67 1.30 1.30 0.54 -0.09 -0.09 1.38 1.05 1.04 0.75 0.83 0.83

Vänersborg

april

0.73 0.75 0.73 1.59 1.30 1.36 0.75 0.13 0.12 1.68 1.00 1.05 0.82 0.86 0.82

Vänersborg maj 0.65 0.76 0.76 1.56 1.32 1.31 0.13 -0.49 -0.49 1.29 1.04 1.01 0.80 0.85 0.80

Medelvärde 0,67 0,74 0,74 1,66 1,32 1,34 0,62 -0,01 -0,01 1,46 1,04 1,05 0,79 0,85 0,82

Page 29: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

23

Tabell 13: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har juli - augusti som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för april – maj. Tsera2 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Bengtsfors

april

0,69 0,71 0,70 2,20 1,59 1,65 1,42 0,31 0,26 1,82 1,23 1,24 0,73 0,83 0,82

Bengtsfors maj 0,60 0,67 0,67 2,00 1,49 1,50 1,03 -0,10 -0,15 1,67 1,22 1,23 0,70 0,80 0,80

Vänersborg

april

0,73 0,73 0,70 2,05 1,51 1,60 1,35 0,22 0,17 1,68 1,15 1,21 0,77 0,85 0,83

Vänersborg

maj

0,72 0,80 0,81 1,61 1,28 1,29 0,64 -0,49 -0,54 1,34 1,04 1,04 0,81 0,87 0,87

Medelvärde 0,69 0,73 0,72 1,97 1,47 1,51 1,11 -0,02 -0,07 1,63 1,16 1,18 0,75 0,84 0,83

5.3 November – december

5.3.1 Regressionsmodellerna

För den här perioden används en enkel linjär regressionsmodell, uppdelad utifrån

vindhastigheten (se metodavsnittet). Det gör att det blir regressionsmodeller med olika

regressionskonstanter beroende på hur mycket det blåser. I tabell 14 visas konstanterna för

prognosmaterialet på 75 m modellnivå.

Tabell 14: Regressionskonstanterna för de olika upplösningarna. Siffrorna visar för vilket vindintervall konstanterna gäller

0-3 m/s 3-6 m/s 6-9 m/s >9 m/s

a b a b a b A b

Tsera 1 -1,31 0,65 -0,24 0,32 2,69 -0,12 -5,46 0,75

Tsera 2 -1,28 0,70 -0,38 0,43 1,14 0,19 -3,43 0,60

5.3.2 Statistisk jämförelse

I den här resultatavdelningen kommer endast medelvärden för Vänersborg och Bengtsfors

tillsammans att redovisas. För att se all data hänvisas till Appendix 1 - tabeller.

Tabellerna 15 och 16 visar medelvärden för resultatet för modellnivå och SODAR-nivå 75

m. Som referensmaterial har november och december använts. Precis som för april och maj

visar sig den allra bästa förbättringen för den högre upplösningen. T.ex. så har den absoluta

medeldifferensen sänkts med drygt 1 m/s.

Precis som för den andra perioden ligger prognosernas vindhastigheter oftast generellt för

högt. Därför görs en jämförelse med en lägre modellnivå, samma som för april-maj, 55 m.

Här ser man att innan regressionsanpassningen så har prognosen på den här nivån bättre

värden än för prognosen på 75 meters höjd. Däremot så är värdena efter

regressionsanpassningen endast marginellt bättre än nivå 75 m, tabell 17 och 18.

Page 30: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

24

Histogrammen för de här resultaten finns i Appendix 2 – Histogram, figur 12 till 15. För

perioden november och december visar de samma utseende som histogrammen för den

andra perioden. Man kan se att det blir en mer jämn fördelning av differenserna efter

regressionsanpassningen. Även här visar sig de bästa resultaten för tsera2. Ju större fel det

är ifrån början, desto större förbättring blir resultatet med regressionsanpassningen.

Tabell 15: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 75 m.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,74 0,76 2,01 1,37 1,30 0,00 1,61 1,07 0,79 0,85

Tabell 16: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,76 0,77 2,52 1,34 1,94 0,00 2,10 1,05 0,74 0,86

Tabell 17: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 55 m.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,76 0,78 1,55 1,32 0,66 0,00 1,23 1,03 0,85 0,86

Tabell 18: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,77 0,79 1,87 1,30 1,21 0,00 1,50 1,01 0,81 0,87

Jämfört med april och maj har det varit en större del av materialet som har fått rensas

bort, då det var fler områden där det verkade vara problem med antingen SODAR-

mätningarna eller GFS-analysen. På grund av den kraftigare rensningen borde den ju ha en

större påverkan jämfört med den andra perioden, och det visar även resultaten, tabell 19

Page 31: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

25

och 20. Dels får man bättre resultat för materialet innan anpassning med

regressionsmodellen när man jämför resultaten med eller utan rensning, och samma sak för

resultaten efter anpassningen. Men när det gäller resultatet efter regressionsanpassningen

är det ändå en ganska marginell förbättring, det handlar om några hundradelars m/s jämfört

med det ursprungliga materialet, både för modellnivå 75 m och för modellnivå 55 m.

Tabell 19: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m, rensade värden.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,81 0,83 1,68 1,22 1,04 -0,01 1,36 0,95 0,85 0,89

Tabell 20: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m, rensade värden.

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Medelvärde 0,79 0,80 2,31 1,27 1,76 -0,01 1,93 0,99 0,77 0,88

5.3.4 Standardavvikelse

Tabell 21 visar standardavvikelserna från de olika upplösningarna och månaderna vid

Vänersborg. Till skillnad från april och maj så har den anpassade prognosen större avvikelse

mot SODAR-värdet jämfört med den ursprungliga prognosen. Här har alltså vindfördelningen

tryckts ihop för mycket. Att det blir trycks ihop beror på regressionsmodellens uppbyggnad.

Fördelen är alltså att differensens fördelning och magnitud har minskat, men det på

bekostnad av vindfördelningen.

Tabell 21: Standardavvikelserna vid Vänersborg. 75 m nivå

Vän.nov tsera1 Vän.dec tsera1 Vän.nov tsera2 Vän.dec tsera2

Std för SODAR 1,86 2,49 1,86 2,49 Std för prognos 1,96 2,45 2,25 2,66 Std för prognos efter regression

1,48 1,79 1,52 1,78

5.3.5 Jämförelse med januari – februari

I tabell 22 och 23 visas resultatet av jämförelsen för januari och februari med en

regressionsmodell som bygger på materialet från samma period, 2a, och med en

regressionsmodell med samma regressionskonstanter som för november och december, 2b,

hämtade ur tabell 14. Precis som för april och maj är det här en marginell skillnad mellan

resultaten. Samtidigt blir det inte riktigt lika bra resultat som för november och december.

Page 32: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

26

Men det beror mest på att prognoserna i för januari och februari från början gav sämre

värden än prognoserna för andra perioder. Framförallt har Bengtsfors dålig

överrensstämmelse mellan prognosen och SODAR-materialet. Förmodligen beror det mer på

SODAR-stationen än prognosen i det här fallet.

För att se alla resultatvärden se tabell 33 och 34 i appendix 1.

Tabell 22: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har januari - februari som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för november – december. Tsera1 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Medelvärde 0,64 0,65 0,65 2,45 1,70 1,71 1,72 0,14 0,20 2,03 1,35 1,36 0,70 0,75 0,75

Tabell 23: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har januari - februari som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för november – december. Tsera2 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Medelvärde 0,65 0,66 0,66 3,02 1,70 1,73 2,40 0,07 0,24 2,57 1,35 1,38 0,66 0,76 0,77

5.4 Hela årets material

Den slutliga jämförelsen är att se hur väl de två olika regressionsmodellerna kan användas

under hela året, tabell 24 och 25. Tabellen är uppbyggd som tidigare med 1, 2a och 2b. Men

här visar raderna allt1 resultatet när man använt regressionsmodellen för april och maj, och

allt2 visar resultatet för regressionsmodellen för november och december. Skillnaden i

resultatet när det gäller de här värdena är inte så stora, man kan se i kolumnerna 2b för

RMSE och AMD att regressionsmodellen som bygger på vindhastigheterna, allt2, ger ett lite

bättre resultat. Både om man använder hela materialet för att beräkna

regressionskonstanterna eller om man använder konstanterna från november och

december. Däremot är det en ganska kraftig skillnad när det gäller standardavvikelserna som

kan ses i tabell 26. Tabellen visar standaravvikelserna för materialet från Vänersborg, både

för de olika upplösningarna och för de två olika regressionsmodellerna. Här ser man hur

regressionsmodellen för november och december ”trycker ihop” resultatet kraftigt.

Vindfördelningen minskar gentemot de uppmätta vindarna. Differensen blir mindre, men

det på bekostnad av att man förlorar de mer extrema vindarna.

För att ytterligare visa hur resultatet blir före och efter anpassning med

regressionsmodellerna visas två figurer där vindhastigheterna för SODAR-mätningarna visas i

förhållande till vindhastigheterna för prognoserna. Figur 10 visar resultatet för

Page 33: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

27

regressionsmodellen som bygger på materialet från april och maj och figur 11 visar

resultatet för november och december. De svarta linjerna motsvarar en 1:1-linje mellan de

två vindhastigheterna. Precis som resultaten tidigare har visat så ser man i figurerna 10a och

11a att prognosen oftast ger ett för högt värde jämfört med mätningarna. Efter

anpassningarna så är det en jämnare fördelning runt strecken.

Samtidigt kan man se i figur 11b det som även standardavvikelserna för samma period

visar, att resultatet blir hoptryckt och att både de högsta och lägsta vindhastigheterna har

försvunnit.

Tabell 24: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har hela året som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för april – maj (rad allt1) eller november – december (rad allt2). Tsera1 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Bengtsfors

allt1

0,68 0,71 0,70 1,92 1,54 1,64 1,00 0,14 0,38 1,57 1,22 1,28 0,78 0,84 0,83

Bengtsfors

allt2

0,68 0,71 0,70 1,92 1,43 1,44 1,00 0,13 -0,21 1,57 1,13 1,14 0,78 0,81 0,81

Vänersborg

allt1

0,69 0,71 0,70 1,78 1,54 1,61 0,73 -0,13 0,11 1,42 1,21 1,25 0,80 0,84 0,83

Vänersborg

allt2

0,69 0,69 0,70 1,78 1,50 1,50 0,73 -0,41 -0,47 1,42 1,19 1,19 0,80 0,76 0,80

Tabell 25: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har hela året som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för april – maj (rad allt1) eller november – december (rad allt2). Tsera2 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Bengtsfors

allt1

0,68 0,70 0,69 2,43 1,72 1,82 1,61 0,18 0,44 1,99 1,36 1,43 0,72 0,83 0,81

Bengtsfors

allt2

0,68 0,69 0,69 2,43 1,46 1,47 1,61 0,17 -0,18 1,99 1,16 1,16 0,72 0,80 0,81

Vänersborg

allt1

0,71 0,73 0,71 2,10 1,61 1,70 1,26 -0,17 0,08 1,69 1,27 1,33 0,77 0,85 0,83

Vänersborg

allt2

0,71 0,72 0,72 2,10 1,38 1,47 1,26 -0,16 -0,51 1,69 1,10 1,16 0,77 0,82 0,81

Page 34: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

28

Tabell 26: Standardavvikelse för de olika regressionsmodellerna. Allt1 visar resultatet för modellen som baseras på april – maj och allt2 visar resultatet för modellen som baseras på november – december.

Vän.allt1 tsera1 Vän.allt2 tsera1 Vän.allt1 tsera2 Vän.allt2 tsera2

Std för SODAR 1,98 1,98 1,98 1,98 Std för prognos 2,12 2,12 2,35 2,35 Std för prognos efter regression

2,13 1,47 2,39 1,51

Figur 10: Figur a visar det ursprungliga materialet, figur b visar materialet efter anpassning med regressionsmodell som bygger på materialet från april och maj. Materialet kommer från Bengtsfors och Vänersborg över hela året, upplösning 36 km.

Figur 11: Figur a visar det ursprungliga materialet, figur b visar materialet efter anpassning med regressionsmodell som bygger på materialet från november och december. Materialet kommer från Bengtsfors och Vänersborg över hela året, upplösning 36 km. Obs, notera att det är olika värden på axlarna.

Page 35: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

29

6 Diskussion

Att resultaten, när man jämför de två olika upplösningarna, visar sig vara bättre för den

lägre upplösningen är förvånande. Rimligen borde en högre upplösning, där

beräkningspunkten ligger närmare mätpunkten, ge ett markant bättre resultat. Ibland verkar

det som att kurvan för prognosen med den högre upplösningen bättre följer samma

variationer i vindhastigheten som kurvan för SODAR-mätningarna, men att det finns en

skillnad i magnituden. Alltså att det finns en bias med för höga vindar, men att

vindförändringarna stämmer bättre överrens med tsera2 än med tsera1. Detta kan dock inte

ses statistiskt när försök görs att subtrahera en medelbias över hela materialet och sen göra

en regressionsanpassning efter det. Någon förbättring av resultatet kan inte ses. Inte heller

när man tar hänsyn till en procentuell bias som bygger på vindhastigheten.

Både 36 och 12 km är ju en ganska grov upplösning när man jämför med en specifik

mätpunkt, prognosen missar lätt den lokala påverkan som finns runt mätplatsen. Att det då

inte stämmer helt överrens är inte så underligt. En upplösning på mellan 1 och 5 km skulle

förmodligen ge ett mycket bättre resultat, men när man beräknar en prognos över ett större

område tar det för lång tid att göra prognosberäkningar med den upplösningen. I det här

fallet är det dock tveksamt om en högre upplösning skulle kunna åtgärda problemet med att

prognosen ger för höga hastigheter.

Resultaten visar att vindprognoserna generellt ger för höga vindhastigheter jämfört med

SODAR-mätningarna. Att det är så kan ha lite olika förklaringar. En anledning kan vara att

markparametriseringen i modellen inte riktigt stämmer helt överrens med hur det ser ut i

verkligheten. För november och december gjordes ett försök att fördubbla z0-värdet när

prognoserna beräknades. Från z0 = 0,8 m, vilket motsvarar skogsbeklädd mark, till z0 = 1,6 m.

Resultatet blev att differensen mellan prognosen och mätningarna blev något mindre. Det

blev samma resultat som om man skulle subtrahera några tiondelars m/s från prognosen

med det ursprungliga z0-värdet. Att fortsätta höja det värdet skulle kanske ge ännu lite

bättre resultat, men det skulle inte kunna vara försvarbart ur en fysikalisk synvinkel då det

skulle bli ett z0-värde som inte skulle stämma överrens med markens utseende.

De variabler som används för att beräkna regressionsmodellerna är inte de enda som

undersökts. En faktor som ofta är viktig att ta hänsyn till är vindriktningen. Men vid

undersökning av vindriktningen går det inte att se att den ska ha någon påverkan på

resultatet. Differensen är jämt fördelad över alla väderstreck, men man kan hitta lite större

differenser i sektorn från sydväst. Det beror dock mer på att det är en så stor del av

materialet där vinden kommer från den sektorn, precis som det brukar i västra Sverige.

Den dygnsvariation som kan ses i prognoserna för sommarhalvåret, figur 3, beror

förmodligen på hur prognosmodellen beräknar stabiliteten och förstärker de variationer

stabiliteten har under ett dygn. Det bästa sättet att ta hänsyn till detta visade sig ändå vara

att använda dygnets timme som den oberoende variabeln i regressionsmodellen.

Page 36: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

30

Regressionsmodellen för april och maj visar sig fungera bra, men det finns några saker att

ta i beaktande. Det främsta är att den här modellen inte tar hänsyn till att man inte kan ha

negativa vindar. Detta gör att vid låga vindhastigheter i prognosen så händer det att efter

anpassningen med regressionsmodellen så förekommer det vindar som är lägre än noll. Rent

praktiskt sett är detta ett mindre problem eftersom ett vindkraftverk inte är i produktion vid

för låga vindar, s.k. cut-in wind speed (Eisenhut et al. 2007). Hur låga vindar det är beror på

turbinen, men oftast någonstans runt 4 m/s. Så därför går det att säga att när det blir

negativa vindar blåser det för lite för att det ska vara någon mening att ha ett vindkraftverk i

produktion. Den ursprungliga prognosen ger ju då ändå bara vindar på ca 0-2 m/s.

En annan sak att ta hänsyn till är att den här modellen inte är kopplad till vindhastigheten,

utan endast beror på tiden på dygnet. Det är möjligt att man skulle kunna göra en ytterligare

regressionsanpassning liknande den som beskrivs i avsnitt ”Den andra regressionsmodellen”

efter att man anpassat för dygnsvariationerna.

Även regressionsmodellen för november och december ger bra resultat rent statistiskt.

Men det finns ett antal faktorer som gör att den här varianten bör användas mer försiktigt.

En faktor är det som visas i avsnittet med standardavvikelserna, att modellen minskar

spridningen på vindarna.

Eftersom vindarna är uppdelade i olika intervall uppkommer ett annat problem. Inte alltid,

men för vissa perioder när denna regressionsmodell har använts, får man vindintervall där

man inte har några vindar alls enligt den anpassade prognosen. Detta fenomen uppkommer i

skarven mellan två intervall. T.ex. kan det hända att det, p.g.a. regressionsmodellen, inte

finns några vindar i prognosen mellan 8 och 8.5 m/s. Då har modellen för intervallet 6 – 9

m/s egenskapen att den sänker de högsta vindarna till 8 m/s och regressionsmodellen för

vindar över 9 m/s inte sänker de lägsta vindarna i intervallet lägre än till 8.5 m/s. Det blir helt

enkelt ett glapp mellan de olika intervallen. Detta ses i figur 11.

Det finns ett antal olika osäkerhetsfaktorer i beräkningarna som har utförts. Materialet

från SODAR-stationerna är rådata och är därför inte analyserat innan. Det skulle kunna vara

så att det har kommit med perioder där stationerna har gett felaktiga uppgifter.

Någon hänsyn till SODAR-stationens felprocent i mätningarna har inte tagits, utan

materialet har här nästan räknats som ”sanningen”. Det mest intressanta har ju varit att se

om det går att finna sätt att förbättra prognosens resultat, inte se hur bra SODAR-

stationerna är.

En tredje sak som kan påverka resultatet är att SODAR-mätningarna är 60-minuters

medelvärden medan prognosen ger det värde som den har beräknat ska vara vid just den

tidpunkten.

Page 37: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

31

7 Slutsatser

Resultaten för jämförelsen mellan de två upplösningarna visar på en väldigt liten skillnad,

där t.o.m. den lägre upplösningen ger ett bättre resultat för det mesta. Därför finns det

ingenting som i det här fallet kan motivera att man använder sig av den högre upplösningen

för att beräkna prognoserna. Den längre tid det tar att beräkna prognosen med den

upplösningen blir alldeles för stor i förhållande till resultatet.

När det gäller regressionsmodellerna visar båda varianterna på ett klart förbättrat resultat

rent statistiskt. Både när de används under de perioder på året som de är anpassade för,

men även när de används över hela året. Men utifrån resultaten, speciellt det som

standardavvikelserna ger (tabell 26), visar det sig att den regressionsmodell som fungerar

bäst är den som bygger på prognosens dygnsvariationer, den som togs fram utifrån

materialet för april och maj. Det motiveras också av det som nämns i sista stycket i

diskussionsavsnittet.

Att rensa bort avvikande prognosvärden, se avsnitt 2.4, för att hitta de rent systematiska

felen visar sig ha en väldigt liten effekt. Framförallt för att det som rensades bort var en så

liten mängd material i förhållande till det sammanlagda materialet. Att använda

regressionskonstanterna som är framtagna med eller utan rensat referensmaterial borde

därför inte ha någon betydelse. Däremot så kan man tänka på att rensningen har skett på ett

relativt godtyckligt sett och därför kanske inte är så tillförlitlig.

Resultaten från de jämförelser när man använder sig av en lägre modellnivå, 55 m höjd,

visade sig vara det som gav allra bäst resultat. Här är resultatet klart bättre jämfört med den

högre modellnivån, 75 m, innan regressionsanpassningen görs, se t.ex. tabell 4 och 6.

Sammantaget visar det sig att utifrån de här resultaten och undersökningarna att det

bästa sättet för att få fram en tillfredsställande prognos för det området som undersökts är:

Använd upplösningen 36 km istället för 12 km, kortare beräkningstid

Använd en något lägre modellhöjd, 20 – 30 meter lägre, mot den reella höjd där

prognosen ska gälla. Detta gäller i de lägre skikten, 50 – 100 m.

Anpassa prognosresultatet med en regressionsmodell. Under sommarhalvåret en

som bygger på dygnets variationer, under vinterhalvåret en som bygger på

vindhastigheten.

Page 38: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

32

8 Slutord

Först och främst vill jag rikta ett stort tack till min handledare Stefan Söderberg,

WeatherTech Scandinavia, för all den tid han har lagt ner, alla timmars modellkörningar han

har ordnat och hans uppmuntrande ord. Det har varit ovärderligt.

Jag vill också tacka Leif Enger och Luft i Väst, Luftvårdsförbundet för Västra Sverige, för

tillgång till SODAR-mätningarna, Hans Bergström, LUVA, för kommentarer och kartan, Joacim

Danielsson, god vän och statistiker/analytiker, som hjälpte mig med nya uppslag när det

gällde regressionsmodeller . Även ett tack till alla ni som hjälpt till och stöttat på andra sätt.

Till sist vill jag tacka min älskade Sara som alltid har stöttat och trott på mig.

9 Referenser

Andersson, G., Jorner, U., Ågren, A. Regressions- och tidsserieanalys. Studentlitteratur, 2007.

ISBN 978-91-44-02987-0

ART (Atmospheric Research & Technology, LCC) http://www.sodar.com/about_sodar.htm

(Senast uppdaterad 2008-05-24, hämtad 2008-05-24)

Chen, S., Cummings, J., Doyle, J., Hodur, R., Holt, T., Liou, C.S., Liu, M., Ridout, J., Schmidt, J., Thompson,W.,Mirin, A., Sugiyama, G. (2003) COAMPS™, Version 3 Model Description,

General Theory and Equations. http://www.nrlmry.navy.mil/coamps-web/web/docs

(Hämtad 2008-05-18)

Eisenhut, C., Krug, F., Schram, C., Klöckl, B. (2007) Wind-Turbine Model for System

Simulation Near Cut-In Wind Speed. IEEE Transaction on Energy Conversion, Vol. 22, Nr 2, S.

414 – 420.

Harshvardhan, Davies, R., Randall, D., Corsetti, T. (1987) A fast radiation parameterization for atmospheric circulation models. Journal of Geophysical Research, Vol 92, S. 1009–1015. Hodur, R. M. (1997) The Naval Research Laboratory’s Coupled Ocean/Atmosphere Mesoscale Prediction System (COAMPS). Monthly Weather Review, Vol. 125, S. 1414 – 1430.

Holton, J. R. An introduction to dynamic meteorology. London, Elsevier Academic Press,

2004. ISBN 0-12-354015

Hope, A. S., Evans, S. M. (1992) Estimating reference evaporation in the central valley of

California using the Linacre model. Water resources bulletin, Vol. 28, Nr 4, S. 695 – 702.

Klee, I., Svenska Kraftnät, http://www.svk.se/web/Page.aspx?id=5594#ReadMore (Senast

uppdaterad 2008-02-18, hämtad 2008-05-12)

Page 39: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

33

Louis, J. F. (1979) A parametric model of vertical eddy fluxes in theatmosphere. Boundary Layer Meteorology, Vol. 17, S. 187–202. NCEP (National Center for Environmental Prediction),

http://www.nco.ncep.noaa.gov/pmb/products/gfs/ (Senast uppdaterad 2008-04-02, hämtad

2008-04-14)

Naval Research Laboratory, http://www.nrlmry.navy.mil/COAMPS-web/web/view (Senast

uppdaterad 2008-05-12, hämtad 2008-04-01)

Mellor, G., Yamada, T. (1974) A hierarchy of turbulence closure models for planetary

boundary layers. Journal of Atmospheric Science, Vol. 31, S. 1791–1806.

Rutledge, S. A., Hobbs, P. V. (1983) The mesoscale and microscale structure of organization

of clouds and precipitation in midlatitude cyclones. VIII: A model for the ‘‘seeder-feeder’’

process in warm-frontal rainbands. Journal of Atmosferic Science,Vol. 40, S. 1185 – 1206.

Svensson, G. (1998) Model simulations of the air quality in Athens, Greece, during the

MEDCAPHOT-TRACE campaign. Atmospheric Environment, Vol. 32, Nr 12, S. 2239 – 2268.

Söderberg, S., Parmhed, O. (2006) Numerical modelling of katabatic flow over a melting

outflow glacier. Boundary-Layer Meteorology, Vol. 120, S. 509 – 534

Wind & Hydropower Technologies Program, Energy Efficiency and Renewable Energy (EERE),

http://www1.eere.energy.gov/windandhydro/wind_history.html (Senast uppdaterad 2005-

12-09, hämtad 2008-03-28)

Page 40: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

34

10 Appendix 1 – Tabeller

Tabell 27: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 75 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,75 0,76 1,99 1,21 1,45 0,04 1,67 0,94 0,76 0,86

Ben.dec 0.74 0,77 2,14 1,44 1,32 0,12 1,70 1,10 0,80 0,86

Vän.nov 0,65 0,64 2,04 1,46 1,28 -0,12 1,64 1,15 0,73 0,79

Vän.dec 0,82 0,85 1,85 1,36 1,13 -0,4 1,43 1,08 0,86 0,89

Medelvärde 0,74 0,76 2,01 1,37 1,30 0,00 1,61 1,07 0,79 0,85

Tabell 28: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,73 0,74 2,69 1,26 2,20 0,09 2,30 0,97 0,67 0,85

Ben.dec 0,76 0,79 2,75 1,40 2,16 0,24 2,30 1,10 0,73 0,87

Vän.nov

0,70 0,70 2,38 1,37 1,74 -0,23 1,95 1,06 0,71 0,82

Vän.dec 0,83 0,86 2,26 1,33 1,67 -0,10 1,84 1,06 0,83 0,90

Medelvärde 0,76 0,77 2,52 1,34 1,94 0,00 2,10 1,05 0,74 0,86

Tabell 29: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera1, 55 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,77 0,79 1,44 1,15 0,77 0,02 1,18 0,89 0,84 0,87

Ben.dec 0,75 0,78 1,71 1,41 0,71 0,12 1,33 1,08 0,84 0,87

Vän.nov 0,68 0,67 1,58 1,41 0,61 -0,12 1,25 1,11 0,80 0,80

Vän.dec 0,83 0,86 1,48 1,31 0,53 -0,02 1,14 1,03 0,90 0,90

Medelvärde 0,76 0,78 1,55 1,32 0,66 0,00 1,23 1,03 0,85 0,86

Page 41: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

35

Tabell 30: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,76 0,77 1,90 1,19 1,37 0,06 1,59 0,93 0,78 0,87

Ben.dec 0,76 0,80 2,12 1,37 1,44 0,26 1,70 1,06 0,80 0,88

Vän.nov 0,72 0,71 1,75 1,35 1,00 -0,25 1,38 1,04 0,79 0,83

Vän.dec 0,84 0,87 1,72 1,28 1,01 -0,07 1,33 1,01 0,88 0,91

Medelvärde 0,77 0,79 1,87 1,30 1,21 0,00 1,50 1,01 0,81 0,87

Tabell 31: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 55 m, rensat material

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,77 0,79 1,86 1,18 1,33 0,17 1,56 0,93 0,79 0,88

Ben.dec 0,81 0,84 1,90 1,28 1,26 0,26 1,53 1,01 0,84 0,90

Vän.nov 0,75 0,76 1,59 1,27 0,85 -0,25 1,26 0,97 0,83 0,85

Vän.dec 0,89 0,91 1,37 1,13 0,70 -0,20 1,09 0,90 0,92 0,93

Medelvärde 0,81 0,83 1,68 1,22 1,04 -0,01 1,36 0,95 0,85 0,89

Tabell 32: Jämförelse av de statistiska värdena. Före visar prognos utan anpassad regression, efter visar prognos med anpassad regression. Tsera2, 75 m, rensat material

R RMSE MD AMD IOA

Före Efter Före Efter Före Efter Före Efter Före Efter

Ben.nov 0,74 0,76 2,63 1,26 2,15 0,21 2,26 0,98 0,69 0,86

Ben.dec 0,81 0,83 2,48 1,29 1,95 0,23 2,10 1,03 0,78 0,90

Vän.nov 0,73 0,73 2,20 1,31 1,57 -0,23 1,81 1,00 0,74 0,84

Vän.dec 0,87 0,87 1,91 1,20 1,36 -0,23 1,56 0,96 0,87 0,92

Medelvärde 0,79 0,80 2,31 1,27 1,76 -0,01 1,93 0,99 0,77 0,88

Page 42: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

36

Tabell 33: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har januari - februari som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för november – december. Tsera1 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Ben.jan 0,62 0,63 0,63 2,53 1,77 1,75 1,76 0,30 0,13 2,08 1,38 1,35 0,69 0,75 0,76

Ben.feb 0,48 0,49 0,49 3,08 1,81 1,91 2,45 0,90 1,06 2,62 1,48 1,57 0,54 0,65 0,64

Vän.jan 0,71 0,73 0,72 2,50 1,70 1,72 1,77 -0,06 0,04 2,07 1,36 1,40 0,75 0,83 0,81

Vän.feb 0,75 0,76 0,75 1,68 1,51 1,46 0,90 -0,59 -0,43 1,35 1,16 1,12 0,82 0,78 0,80

Medelvärde 0,64 0,65 0,65 2,45 1,70 1,71 1,72 0,14 0,20 2,03 1,35 1,36 0,70 0,75 0,75

Tabell 34: Jämförelse av de statistiska värdena. Kolumn 1 visar resultatet utan regression, kolumn 2a visar resultatet efter anpassning med regression som har januari - februari som referensmaterial, kolumn 2b visar resultatet after anpassning med regressionen för november – december. Tsera2 på 75 m höjd.

R RMSE MD AMD IOA

1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b 1 2a 2b

Ben.jan 0,61 0,62 0,61 3,26 1,77 1,81 2,62 0,04 0,27 2,77 1,35 1,38 0,62 0,75 0,76

Ben.feb 0,49 0,51 0,52 3,82 1,86 2,01 3,23 1,04 1,21 3,34 1,55 1,65 0,49 0,66 0,66

Vän.jan 0,75 0,75 0,75 2,94 1,61 1,62 2,35 -0,20 -0,05 2,51 1,28 1,31 0,73 0,85 0,85

Vän.feb 0,75 0,75 0,74 2,06 1,54 1,48 1,41 -0,61 -0,48 1,66 1,22 1,16 0,78 0,77 0.80

Medelvärde 0,65 0,66 0,66 3,02 1,70 1,73 2,40 0,07 0,24 2,57 1,35 1,38 0,66 0,76 0,77

Page 43: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

37

11 Appendix 2 – Histogram

Figur 12: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 36 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg. Här på 75 m höjd i modellen.

Figur 10: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 12 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg. Här på 75 m höjd i modellen.

Page 44: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

38

Figur 11: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 36 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg. Här på 55 m höjd i modellen.

Figur 12: Histogram över fördelningen av differensen mellan SODAR-mätningarna och prognosmodellen. Upplösning 12 km. Bilderna till vänster visar april och maj för Bengtsfors och bilderna till höger Vänersborg. Här på 55 m höjd i modellen.

Page 45: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Tidigare utgivna publikationer i serien ISSN 1650-6553

Nr 1 Geomorphological mapping and hazard assessment of alpine areas inVorarlberg, Austria, Marcus Gustavsson

Nr 2 Verification of the Turbulence Index used at SMHI, Stefan Bergman

Nr 3 Forecasting the next day’s maximum and minimum temperature in Vancouver,Canada by using artificial neural network models, Magnus Nilsson

Nr 4 The tectonic history of the Skyttorp-Vattholma fault zone, south-central Sweden,Anna Victoria Engström

Nr 5 Investigation on Surface energy fluxes and their relationship to synoptic weatherpatterns on Storglaciären, northern Sweden, Yvonne Kramer

Nr 6 Förekomst och utlakning av bly från Tudors industriområde i Nol, Anna Bohlin

Nr 7 Partial Melting in Granulite Gneisses from Hornslandet, SE Central Sweden,Sofia Carlsson

Nr 8 Högupplösande processering av seismiska data insamlade nära Gardermoensflygplats, Marie Larsson

Nr 9 Sedimentundersökning i Lillsjön och Vikern Gyttorp, Jan Sävås

Nr 10 Integrering av MIFO och Grundvattenmodeller, Marit Brandt

Nr 11 GIS-baserad förstudie till MKB för behandling av förorenade jordmassor iStockholms respektive Södermanlands län, Borka Medjed-Hedlund

Nr 12 Groundwater Chemistry in the Area East of the Dead Sea, Jordan, Alice Nassar

Nr 13 Bly i morän och vatten i delar av Småland, naturligt eller antropogent?,Karin Luthbom

Nr 14 Metanflöde mellan väldränerad, subarktisk tundra och atmosfären -betydelsen avmarkens vattenhalt och kemiska egenskaper, Gunilla Nordenmark

Nr 15 Effects of isothermal versus fluctuating temperature regimes on CO2 efflux fromsub-arctic soils, Pär Eriksson

Nr 16 En dagvattenmodell för beräkning av avrinning och transport av kväve och fosfor iFlatendiket i södra Stockholm, Sara-Sofia Hellström

Nr 17 Långsiktiga effekter av odlingsinriktning på förändringar i markens humusförråd - en fallstudie, Helena Näslund

Nr 18 Dynutveckling längs kusten utanför Halmstad, under senare hälften av 1900-talet.Ingrid Engvall

Page 46: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 19 Humidity Structures in the Marine Atmospheric Boundary Layer, Andreas Svensson

Nr 20 The Influence of Waves on the Heat Exchange over Sea, Erik Sahlée

Nr 21 Åska längs Sveriges kuster, Ulrika Andersson

Nr 22 En enkel modell för beräkning av tjäldjup, Johan Hansson

Nr 23 Modelling the Wind Climate in Mountain Valleys Using the MIUU MesoscaleModel, Nikolaus Juuso

Nr 24 Evaluation of a New Lateral Boundary Condition in the MIUU Meso-Scale Model,Anna Jansson

Nr 25 Statistisk studie av sambandet mellan geostrofisk vind och temperatur i södraSverige, Jonas Höglund

Nr 26 A comparison of the temperature climate at two urban sites in Uppsala,Paulina Larsson

Nr 27 Optiska djupet för atmosfäriska aerosolpartiklar över södra Sverige, Jonas Lilja

Nr 28 The wind field in coastal areas, Niklas Sondell

Nr 29 A Receiver Function Analysis of the Swedish Crust, David Mawdsley

Nr 30 Tjäldjupsberäkningar med temperatursummor, Malin Knutsson

Nr 31 Processing and Interpretation of Line 4 Seismic Reflection Data from SiljanRing Area, Daniela Justiniano Romero

Nr 32 Turning Ray Tomography along deep Reflection Seismic Line 4 from the SiljanRing Area, Anmar C. Dávila Chacón

Nr 33 Comparison of two small catchments in the Nopex research area by water balanceand modelling approaches, Ulrike Kummer

Nr 34 High resolution data processing of EnviroMT data, Tobias Donner

Nr 35 Paleoclimatic conditions during late Triassic to early Jurassic, northern North Sea:evidence from clay mineralogy, Victoria Adestål

Nr 36 Controlled Source Magnetotellurics - The transition from near-field to far-fieldHermann Walch

Nr 37 Soil respiration in sub-arctic soils – controlling factors and influence of globalchange, Evelina Selander

Nr 38 Miljöeffekter av Triorganiska tennföreningar från antifoulingfärg – med avseendepå sedimentologi, ekotoxikologi och hydrogeologi, Sara Berglund

Page 47: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 39 Depth distribution of methanotroph activity at a mountain birch forest-tundra ecotone,northern Sweden, Erik Melander

Nr 40 Methyl tert-Butyl Ether Contamination in Groundwater, Linda Ahlström

Nr 41 Geokemisk undersökning av vattnet i Västerhavet Med avseende på metallhalter och129I, Anette Bergström

Nr 42 Fracture filling minerals and the extent of associated alteration into adjacent granitichost rock, Erik Ogenhall

Nr 43 Bi-Se minerals from the Falun Copper mine, Helena Karlsson

Nr 44 Structures and Metamorphism in the Heidal-Glittertindarea, ScandinavianCaledonides, Erik Malmqvist

Nr 45 Structure and isotope-age studies in Faddey Bay region of central Taymyr,northern Siberia, Robert Eriksson

Nr 46 Stabilitetsindex – en stabil prognosmetod för åska?, Johan Sohlberg

Nr 47 Stadsklimateffekter i Uppsala, Andreas Karelid

Nr 48 Snow or rain? - A matter of wet-bulb temperature, Arvid Olsen

Nr 49 Beräkning av turbulenta flöden enligt inertial dissipationsmetoden med mätdata frånen specialkonstruerad lättviktsanemometer samt jämförelse med turbulentautbytesmetoden, Charlotta Nilsson

Nr 50 Inverkan av det interna gränsskiktets höjd på turbulensstrukturen i ytskiktet,Ulrika Hansson

Nr 51 Evaluation of the Inertial Dissipation Method over Land, Björn Carlsson

Nr 52 Lower Ordovician Acritarchs from Jilin Province, Northeast China, Sebastian Willman

Nr 53 Methods for Estimating the Wind Climate Using the MIUU-model, Magnus Lindholm

Nr 54 Mineralogical Evolution of Kaolinite Coated Blast Furnace Pellets, Kristine Zarins

Nr 55 Crooked line first arrival refraction tomography near the Archean-Proterozoic inNorthern Sweden, Valentina Villoria

Nr 56 Processing and AVO Analyses of Marine Reflection Seismic Data from Vestfjorden,Norway, Octavio García Moreno

Nr 57 Pre-stack migration of seismic data from the IBERSEIS seismic profile to image theupper crust, Carlos Eduardo Jiménez Valencia

Nr 58 Spatial and Temporal Distribution of Diagenetic Alterations in the Grés de la Créche Formation (Upper Jurassic, N France), Stefan Eklund

Page 48: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 59 Tektoniskt kontrollerade mineraliseringar i Oldenfönstret, Jämtlands län,Gunnar Rauséus

Nr 60 Neoproterozoic Radiation of Acritarchs and Environmental Perturbations around theAcraman Impact in Southern Australia, Mikael Axelsson

Nr 61 Chlorite weathering kinetics as a function of pH and grain size,Magdalena Lerczak and Karol Bajer

Nr 62 H2S Production and Sulphur Isotope Fractionation in Column Experiments with Sulphate - Reducing Bacteria, Stephan Wagner

Nr 63 Magnetotelluric Measurements in the Swedish Caledonides, Maria Jansdotter Carlsäter

Nr 64 Identification of Potential Miombo Woodlands by Remote Sensing Analysis,Ann Thorén

Nr 65 Modeling Phosphorus Transport and Retention in River Networks, Jörgen Rosberg

Nr 66 The Importance of Gravity for Integrated Geophysical Studies of Aquifers,Johan Jönberger

Nr 67 Studying the effect of climate change on the design of water supply reservoir,Gitte Berglöv

Nr 68 Source identification of nitrate in a Tertiary aquifer, western Spain: a stable-isotope ap-proach, Anna Kjellin

Nr 69 Kartläggning av bly vid Hagelgruvan, Gyttorp, Ida Florberger

Nr 70 Morphometry and environmental controls of solifluction landforms in the Abisko area, northernSweden, Hanna Ridefelt

Nr 71 Trilobite biostratigraphy of the Tremadoc Bjørkåsholmen Formation on Öland, Sweden, ÅsaFrisk

Nr 72 Skyddsområden för grundvattentäkter - granskning av hur de upprättats, Jill Fernqvist

Nr 73 Ultramafic diatremes in middle Sweden, Johan Sjöberg

Nr 74 The effect of tannery waste on soil and groundwater in Erode district, Tamil Nadu, IndiaA Minor Field Study, Janette Jönsson

Nr 75 Impact of copper- and zinc contamination in groundwater and soil, Coimbatore urbanareas, Tamil Nadu, South India A Minor Field Study, Sofia Gröhn

Nr 76 Klassificering av Low Level Jets och analys av den termiska vinden över Östergarnsholm ,Lisa Frost

Nr 77 En ny metod för att beräkna impuls- och värmeflöden vid stabila förhållanden, Anna Belking

Page 49: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 78 Low-level jets - observationer från Näsudden på Gotland, Petra Johansson

Nr 79 Sprite observations over France in relation to their parent thunderstorm system,Lars Knutsson

Nr 80 Influence of fog on stratification and turbulent fluxes over the ocean, Linda Lennartsson

Nr 81 Statistisk undersökning av prognosmetod för stratus efter snöfall, Elisabeth Grunditz

Nr 82 An investigation of the surface fluxes and other parameters in the regional climatemodel RCA1during ice conditions, Camilla Tisell

Nr 83 An investigation of the accuracy and long term trends of ERA-40 over theBaltic Sea, Gabriella Nilsson

Nr 84 Sensitivity of conceptual hydrological models to precipitation data errors – a regionalstudy, Liselotte Tunemar

Nr 85 Spatial and temporal distribution of diagenetic modifications in Upper Paleocene deep-water marine, turbiditic sandstones of the Faeroe/Shetland basin of the North Sea,Marcos Axelsson

Nr 86 Crooked line first arrival refraction tomography in the Skellefte ore field, NorthernSweden, Enrique Pedraza

Nr 87 Tektoniken som skulptör - en strukturgeologisk tolkning av Stockholmsområdet ochdess skärgård, Peter Dahlin

Nr 88 Predicting the fate of fertilisers and pesticides applied to a golf course in centralSweden, using a GIS Tool, Cecilia Reinestam

Nr 89 Formation of Potassium Slag in Blast Furnace Pellets, Elin Eliasson

Nr 90 - Syns den globala uppvärmningen i den svenska snöstatistiken?Mattias Larsson

Nr 91 Acid neutralization reactions in mine tailings from Kristineberg, Michal Petlicki och Ewa Teklinska

Nr 92 Ravinbildning i Naris ekologiska reservat, Costa Rica, Axel Lauridsen Vang

Nr 93 Temporal variations in surface velocity and elevation of Nordenskiöldbreen,Svalbard, Ann-Marie Berggren

Nr 94 Beskrivning av naturgeografin i tre av Uppsala läns naturreservat, Emelie Nilsson

Nr 95 Water resources and water management in Mauritius, Per Berg

Nr 96 Past and future of Nordenskiöldbreen, Svalbard, Peter Kuipers Munneke

Nr 97 Micropaleontology of the Upper Bajocian Ostrea acuminata marls of Champfromier(Ain, France) and paleoenvironmental implications, Petrus Lindh

Page 50: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 98 Calymenid trilobites (Arthropoda) from the Silurian of Gotland, Lena Söderkvist

Nr 99 Development and validation of a new mass-consistent model using terrain-influencedcoordinates, Linus Magnusson

Nr 100 The Formation of Stratus in Rain, Wiebke Frey

Nr 101 Estimation of gusty winds in RCA, Maria Nordström

Nr 102 Vädermärken och andra påståenden om vädret - sant eller falskt?, Erica Thiderström

Nr 103 A comparison between Sharp Boundary inversion and Reduced Basis OCCAM inversion for a 2-D RMT+CSTMT survey at Skediga, Sweden, Adriana Berbesi

Nr 104 Space and time evolution of crustal stress in the South Iceland Seismic Zone usingmicroearthquake focal mechanics, Mimmi Arvidsson

Nr 105 Carbon dioxide in the atmosphere: A study of mean levels and air-sea fluxes over theBaltic Sea, Cristoffer Wittskog

Nr 106 Polarized Raman Spectroscopy on Minerals, María Ángeles Benito Saz

Nr 107 Faunal changes across the Ordovician – Silurian boundary beds, OsmundsbergetQuarry, Siljan District, Dalarna, Cecilia Larsson

Nr 108 Shrews (Soricidae: Mammalia) from the Pliocene of Hambach, NW Germany,Sandra Pettersson

Nr 109 Waveform Tomography in Small Scale Near Surface Investigations,Joseph Doetsch

Nr 110 Vegetation Classification and Mapping of Glacial Erosional and Depositional FeaturesNortheastern part of Isla Santa Inés, 530S and 720W, Chile, Jenny Ampiala

Nr 111 Recent berm ridge development inside a mesotidal estuaryThe Guadalquivir River mouth case, Ulrika Åberg

Nr 112 Metodutveckling för extrahering av jod ur fasta material, Staffan Petré

Nr 113 Släntstabilitet längs Ångermanälvens dalgång, Mia Eriksson

Nr 114 Validation of remote sensing snow cover analysis, Anna Geidne

Nr 115 The Silver Mineralogy of the Garpenberg Volcanogenic Sulphide Deposit, Bergslagen, Central Sweden, Camilla Berggren

Nr 116 Satellite interferometry (InSAR) as a tool for detection of strain along End-Glacial faults in Sweden, Anders Högrelius

Nr 117 Landscape Evolution in the Po-Delta, Italy, Frida Andersson

Page 51: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 118 Metamorphism in the Hornslandet Area, South - East Central Sweden,Karl-Johan Mattsson

Nr 119 Contaminated Land database - GIS as a tool for Contaminated LandInvestigations, Robert Elfving

Nr 120 Geofysik vid miljöteknisk markundersökning, Andreas Leander

Nr 121 Precipitation of Metal Ions in a Reactive Barrier with the Help of Sulphate - ReducingBacteria, Andreas Karlhager

Nr 122 Sensitivity Analysis of the Mesoscale Air Pollution Model TAPM, David Hirdman

Nr 123 Effects of Upwelling Events on the Atmosphere, Susanna Hagelin

Nr 124 The Accuracy of the Wind Stress over Ocean of the Rossby Centre AtmosphericModel (RCA), Alexandra Ohlsson

Nr 125 Statistical Characteristics of Convective Storms in Darwin, Northern Australia, Andreas Vallgren

Nr 126 An Extrapolation Technique of Cloud Characteristics Using Tropical Cloud Regimes, Salomon Eliasson

Nr 127 Downscaling of Wind Fields Using NCEP-NCAR-Reanalysis Data and the MesoscaleMIUU-Model, Mattias Larsson

Nr 128 Utveckling och Utvärdering av en Stokastisk Vädergenerator för Simulering avKorrelerade Temperatur- och Nederbördsserier, för Tillämpningar på den NordiskaElmarknaden, Johanna Svensson

Nr 129 Reprocessing of Reflection Seismic Data from the Skåne Area, Southern Sweden, Pedro Alfonzo Roque

Nr 130 Validation of the dynamical core of the Portable University Model of the Atmosphere(PUMA), Johan Liakka

Nr 131 Links between ENSO and particulate matter pollution for the city of Christchurch,Anna Derneryd

Nr 132 Testing of a new geomorphologic legend in the Vattholma area, Uppland, Sweden, Niels Nygaard

Nr 133 Återställandet av en utdikad våtmark, förstudie Skävresjön, Lena Eriksson, Mattias Karlsson

Nr 134 A laboratory study on the diffusion rates of stable isotopes of water inunventilated firn, Vasileios Gkinis

Nr 135 Reprocessing of Reflection Seismic Data from the Skåne Area, Southern SwedenWedissa Abdelrahman

Page 52: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 136 On the geothermal gradient and heat production in the inner corePeter Schmidt

Nr 137 Coupling of the Weather Research and Forecasting model (WRF) with the CommunityMultiscale Air Quality model (CMAQ), and analysing the forecasted ozone and nitro-gen dioxide concentrations , Sara Johansson

Nr 138 Sikt i snöfall - En studie av siktförhållanden under perioder med snöfall,Jesper Blomster

Nr 139 Mineralogy of the hypozonal Svartliden gold deposit, northern Sweden, with emphasison the composition and paragenetic relations of electrum, Daniel Eklund

Nr 140 Kinematic analysis of ductile and brittle/ductile shear zones in Simpevarp andLaxemar subarea, Emil Lundberg

Nr 141 Wind Climate Estimates-Validation of Modelled Wind Climate and Normal YearCorrection, Martin Högström

Nr 142 An Analysis of the Local Weather Around Longyearbyen and an InstrumentalComparison, Charlotta Petersson

Nr 143 Flux Attenuation due to Sensor Displacement over Sea, Erik Nilsson

Nr 144 Undersökning av luftkvaliteten vid småskalig biobränsleförbränning i två kommuner med modellsystemet VEDAIR, Stefan Andersson

Nr 145 CO2-Variation over the Baltic Sea, Gustav Åström

Nr 146 Hur mörkt blir det? Lena Nilsson

Nr 147 Master thesis in interpretation of controlled-source radiomagnetotelluric data fromHallandsåsen, Martin Hjärten

Nr 148 A Structural and Ore Geological study of the Palaeoproterozoic Stratabound Sala Zn-Pb-Ag deposit, Bergslagen, Sweden, Nils Jansson

Nr 149 Numerical exploration of radiative-dynamic interactions in cirrus, Stina Sjöström

Nr 150 Modellering av flöden och syrgasförhållanden i Dannemorasjön och dess tillrinnings-område, Seija Stenius

Nr 151 Characteristics of convective cloud cluster formation over Thailand through satelliteimage analysis, Christian Rosander

Nr 152 Krossberg som ballast för betong - En studie av standardiserade kvalitetstestmetoderför CE-märkning av betongballast, Kristina Wikström

Nr 153 Snöns påverkarn på renarnas vinterbete - en del av projektet isis, Sofie Fredriksson

Page 53: Utveckling och utvärdering av statistiska metoder för att ...132167/FULLTEXT01.pdf · 36 km och 12 km, för modellresultaten jämfört med mätningarna. Jämförelsen görs genom

Nr 154 A Sensitivity Analysis of Groundwater Suitability Mapping of the Three-Basin Area inMaputo, Mozambique, Björn Holgersson

Nr 155 Using cloud resolving model simulations of tropical deep convection to studyturbulence in anvil cirrus, Lina Broman Beijar

Nr 156 Validation of the WAM model over the Baltic Sea, Caroline Berg

Nr 157 A Simple Method for Calculations of Wake Effects in Wind Farms with Influence ofAtmospheric Stability, Anna Lewinschal

Nr 158 The Behaviour of the Latent Heat Exchange Coefficient in the Stable MarineBoundary Layer, Kristina Lindgren