View
39
Download
0
Category
Preview:
DESCRIPTION
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Kriging wartości kodowanych ( I ndicator K riging). Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Lokalizacja stanowisk pomiarowych opadów atmosferycznych na profilu. - PowerPoint PPT Presentation
Citation preview
GEOSTATYSTYKAWykłady dla III roku Geografiispecjalność – geoinformacja
Kriging wartości kodowanych
(Indicator Kriging)
Alfred StachInstytut Paleogeografii i Geoekologii
Wydział Nauk Geograficznych i Geologicznych UAM
Lokalizacja stanowisk pomiarowych opadów atmosferycznych na profilu
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Easting
200000
300000
400000
Wsp
ółr
zęd
na
- Y
(m
) -
No
rth
ing
Kam
ienn
a G
óra
Wał
brzy
ch
Str
zelin
Dąb
rów
ka Ł
ubia
ńska
Kob
ylno
Sie
rakó
w
Mał
usy
Wie
lkie
Kon
iecp
olK
onie
czno
Pis
krzy
n
Maksymalne sumy dobowe opadów zarejestrowane w maju 1980 roku na posterunkach usytuowanych na profilu
300000 400000 500000 600000 700000
W spółrzędna - X (m ) - Easting
0
10
20
30
40
50
60
Su
ma
do
bo
wa
op
adó
w -
(m
m)
- D
aily
pre
cip
itat
ion
to
tals
5.5 4.2
8.210.3
17.3
11.2
52.5
24.2
19.6
11.0
Kam
ien
na
Gó
ra
Wał
brz
ych
Str
zelin
Dąb
rów
ka Ł
ub
iań
ska
Ko
byl
no
Sie
rakó
w
Mał
usy
Wie
lkie
Ko
nie
cpo
l
Ko
nie
czn
o
Pis
krzy
n
u 1 u 2 u 3
Skumulowany rozkład prawdopodobieństwa maksymalnych dobowych sum opadów zarejestrowanych w posterunkach opadowych na terenie Polski w maju 1980 rokuNa wykresie zaznaczono wysokości sum dobowych o prawdopodobieństwie przewyższenia 0,2, 0,4, 0,6, 0,8, 0,9 i 0,95 (percentyle 20, 40, …., 95%)
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily p recip ita tion
0
0.2
0.4
0.6
0.8
1
Per
cent
yl -
Pe
rce
ntyl
e
7,9
11,
8
15,
3
22,
2
29,
43
6,3
0.90.95
Wartości progowe maksymalnych sum dobowych opadów w maju 1980 roku o prawdopodobieństwie 0,2, 0,4, 0,6, 0,8, 0,9 i 0,95 (percentyle 20, 40, 60, 80, 90 i 95%) naniesione na dane profilowe
300000 400000 500000 600000 700000
Współrzędna X układu GUGIK 92 (m)
0
10
20
30
40
50
60
Mak
sym
aln
a su
ma
do
bo
wa
op
adó
w w
maj
u 1
980
(mm
)
5.5 4.2
8.210.3
17.3
11.2
52.5
24.2
19.6
11.0 20% = 7,9m m
40% = 11,8m m
60% = 15,3m m
80% = 22,2m m
90% = 29,4m m
95% = 36,3m m
Maksymalne sumy dobowe opadów zarejestrowane w maju 1980 roku na analizowanym profilu przekodowane na wektory danych binarnych w zależności od przekroczenia wartości progowych wyznaczonych z globalnej krzywej skumulowanego rozkładu prawdopodobieństwa (precentyle 20, 40, 60, 80, 90 i 95%)
300000 400000 500000 600000 700000
W spółrzędna X układu GUGIK 92 (m)
0
10
20
30
40
50
60
Mak
sym
aln
a su
ma
do
bo
wa
op
adó
ww
maj
u 1
980
(mm
)
Semiwariogramy empirycznei ich modele dla wartości kodowanych (percentyle 20, 40, 60, 80, 90 i 95%) maksymalnych sum dobowych opadów na terenie Polski w maju 1980 roku
0
0.04
0.08
0.12
0.16
0.2
0
0.04
0.08
0.12
0.16
0.2
Sem
iwa
rian
cja
- (h
) -
Sem
ivar
ian
ce
0 20000 40000 60000 80000 100000
Odstęp - h (m ) - Lag
0
0.02
0.04
0.06
0.08
0 20000 40000 60000 80000 100000
p . 2 0% p . 40 %
p . 6 0% p . 80 %
p . 9 0% p . 95 %
Estymowany metodą IK profil prawdopodobieństwa maksymalnych opadów dobowych w maju 1980. Pionowymi liniami przerywanymi zaznaczono lokalizację punktów pomiarowych
300000 400000 500000 600000 700000
W spółrzędna - X (m ) - Easting
0
0.2
0.4
0.6
0.8
1
Pra
wd
op
od
ob
ień
stw
o w
aru
nko
we
Co
nd
itio
nal
Pro
bab
ility
z k = 7 ,9 m m
z k = 11,8 m m
z k = 15,3 m m
z k = 22,2 m m
z k = 29,4 m m
z k = 36,3 m m
u 1 u 2 u 3
Wartość oczekiwana (E-mean) maksymalnego opadu dobowego na analizowanym profilu w maju 1980 wyliczona z ccdf estymowanych metodą IK. Zacieniowany pas oznacza zakres odchylenia standardowego estymacji (Conditional Variance). Zaznaczono lokalizację punktów pomiarowych i wysokości rzeczywiście zmierzonych maksymalnych opadów dobowych
300000 400000 500000 600000 700000
W spółrzędna - X (m ) - Easting
5.5 4.2
8.210.3
17.3
11.2
52.5
24.2
19.6
11.0
0
20
40
60
80
Su
ma
do
bo
wa
op
adó
w -
(m
m)
- D
aily
pre
cip
itat
ion
to
tals
u 1 u 2 u 3
Maksymalny opad dobowy na analizowanym profilu w maju 1980 o prawdopodobieństwie wystąpienia 0,9 (A) oraz prawdopodobieństwo wystąpienia opadu dobowego większego lub równego 25 mm (B). Zaznaczono lokalizację punktów pomiarowych i wysokości rzeczywiście zmierzonych maksymalnych opadów dobowych
300000 400000 500000 600000 700000
W spółrzędna - X (m ) - Easting
5.5 4.2
8.210.3
17.3
11.2
52.5
24.2
19.6
11.0
0
20
40
60
80
Su
ma
do
bo
wa
op
adó
w -
(m
m)
- D
aily
pre
cip
itat
ion
to
tals
0
0.2
0.4
0.6
0 .8
1
Praw
do
po
do
bień
stwo
- Pro
ba
bility
A
B
C
u 1 u 2 u 3
Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1P
raw
dopo
dob
ień
stw
o -
Pro
babi
lity
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1
Pra
wd
opod
obie
ństw
o -
Pro
babi
lity
V -8 0
u 1
u 2
u 3
0,9
10,
3
29,
4
40,
6
55,
1
Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)
Błędy relacji porządkowych• Podstawową wadą krigingu wartości kodowanych (IK)
jest występowanie błędów relacji porządkowych. W dowolnej lokalizacji u, każde estymowane posteriori prawdopodobieństwo [F(u;zk(n))]* musi należeć do przedziału [0,1], a seria K takich szacunków musi być niemalejącą funkcją wielkości wartości progowej zk:
; 0,1kF z n
u
; ;k k k kF z n F z n z z
u u
Błędy relacji porządkowych I• Występowanie błędów relacji porządkowych pierwszego rodzaju
wynika z samej natury algorytmu krigingu, który jest liniową, nie wypukłą, kombinacją danych pomiarowych.
• Pociąga to za sobą możliwość obliczenia ujemnych wag dla poszczególnych danych pomiarowych znajdujących się w zasięgu sąsiedztwa szukania.
• Sytuacja taka ma miejsce jeśli zachodzi zjawisko ekranowania, tj. zlokalizowany bliżej punktu estymacji u0 punkt danych u2 częściowo „niweluje” wpływ leżącego dalej na tym samym kierunku punktu u1.
• Ta cecha algorytmu ma zarówno zalety, jak i wady. Z jednej strony umożliwia uzyskanie estymacji, które wykraczają poza zakres danych pomiarowych, z drugiej mogą być to czasami wyniki nierealistyczne, takie jak ujemne stężenia, czy proporcje większe od 1.
• Błędy tego rodzaju występują częściej, i ich rozmiary są większe, w zwykłym krigingu (OK) niż w prostym krigingu (SK), oraz w wielozmiennym kokrigingu niż w krigingu. Jest to efektem występujących w owych algorytmach (OK, SCK, OCK) ograniczeń wielkości wag (wymuszających ich sumowanie do 1 lub do 0)
Ekranowanie danych w krigingu0 40 80 120 160
Odstęp - Lag
0
40
80
120
(h) = 10 + 90 Sph (100)
0 100 200
0
100
200
1
2
3
4
50
1 2 3 4 5
-0,2
0
0,2
0,4
0,6
0 ,1 5 0
0 ,3 9 3
0 ,1 8 30 ,2 1 9
0 ,0 5 6
0 100 200Odległość - Distance
0
100
200
1
2
3
4
50
1 2 3 4 5Punkt danych - Data point
-0,2
0
0,2
0,4
0,6
-0,066
0,496
0,307
0,207
0,057
A
B
C
Ilustracja sytuacji występowania ujemnych wag w algorytmie zwykłego krigingu (OK).A – wykres i wzór sferycznego modelu semiwariogramu użytego w obliczeniach: wariancja nuggetowa (C0) = 10, wariancja progowa (C1) = 90, zasięg (a) = 100 jednostek.B – układ przestrzenny estymowanej lokalizacji (0) i punktów danych (1-5) oraz wartości wyliczonych dla tej konfiguracji wag OK. Sytuacja bez ekranowania.C – układ przestrzenny estymowanej lokalizacji (0) i punktów danych (1-5) oraz wartości wyliczonych dla tej konfiguracji wag OK. Sytuacja z ekranowaniem punktu 1 przez punkt 2. Cieniowany okrąg (B i C) wskazuje na zasięg autokorelacji.
Błędy relacji porządkowych II• Występowanie błędów drugiego rodzaju wynika dodatkowo z
faktu, że każde z K prawdopodobieństw jest estymowane osobno, oraz że często w konkretnych klasach z (przedziałach wartości analizowanej cechy) w lokalnym sąsiedztwie brak jest danych pomiarowych. Jakie ma to konsekwencje zaprezentowano w poniższym przykładzie.
• Zakładamy że w klasie (z7, z8] nie ma danych pomiarowych. Obie estymacje IK dla wartości progowych z7 i z8 oparte są zatem na tym samym zbiorze danych kodowanych ponieważ:
• Różnice między tymi dwoma estymacjami IK są wówczas jedynie efektem liniowej kombinacji różnic pomiędzy wagami IK dla obu wartości progowych z7 i z8:
7 8; ; 1,....,i z i z n u u u
7 8 8 7
8 8 71
; , ; ;
; ; ;
IK IK IK
nIK IK
z z F z n F z n
i z z z
u
u u u
u u u
Błędy relacji porządkowych II• Wartość ujemna różnicy pociąga za sobą
naruszenie relacji porządkowej. W sytuacji kiedy oba modele semiwariogramów I(h, z7) i I(h, z8) są identyczne, także oba zbiory wag IK będą takie same, ponieważ dla obu wartości progowych w obliczeniach zostaną wykorzystane te same lokalizacje danych pomiarowych:
• Różnica wynosi wówczas zero, stąd nie ma naruszenia relacji porządkowej. W przeciwnym wypadku, istotnej różnicy dwóch kolejnych modeli semiwariogramów wartości kodowanych, w tym przypadku między progami z7 i z8, powstają dwa odmienne zbiory wag IK pociągając za sobą ryzyko wystąpienia błędów relacji porządkowych.
7 8; ,IK z z u
7 8; ; 1,....,IK IKz z n u u u
Sposoby eliminacji błędów relacji porządkowych• Błędy relacji porządkowych są w estymacjach IK stosunkowo częste, ale ich
rozmiar jest zazwyczaj niewielki – około 0,01. Aby ograniczyć ich ilość i rozmiar stosuje się dwie strategie:
• Błędy drugiego rodzaju w zasadzie są łatwe do wyeliminowania jeśli dla wszystkich wartości progowych użyje się tego samego modelu struktury przestrzennej – semiwariogramu.
• To dość radykalne podejście jest często stosowane pod nazwą median Indicator Kriging (mIK). Nazwa sugeruje, i rzeczywiście tak bywa najczęściej, że w algorytmie tym stosuje się model struktury przestrzennej danych kodowanych w stosunku do wartości mediany (50 percentyla). Nie jest jednakże jakaś ścisła reguła.
• Zalety mIK związane są nie tylko z eliminacją większości naruszeń relacji porządkowych. Jest to przede wszystkim metoda mniej pracochłonna – modelowanie jednego semiwariogramu zamiast kilku, czy kilkunastu, ale przede wszystkim znacznie szybsza w obliczeniach. Dla każdej lokalizacji (węzła siatki interpolacyjnej) obliczany jest bowiem tylko jeden układ równań krigingu.
• Popularność mIK wynika również z faktu, że mimo tak znacznego uproszczenia procedury, uzyskiwane wyniki są zazwyczaj tylko nieznacznie gorsze od uzyskanych za pomocą „pełnego” krigingu wartości kodowanych.
Sposoby eliminacji błędów relacji porządkowych• W sytuacji kiedy nie można zastosować metody mIK zaleca się takie
modelowanie struktury przestrzennej dla kolejnych wartości progowych, aby unikać gwałtownych zmian parametrów modeli. Można to osiągnąć na przykład poprzez użycie dla wszystkich wartości progowych różnych kombinacji liniowych tych samych elementarnych struktur.
• Parametry modeli semiwariogramów danych kodowanych (wariancja progowa, zasięg, kierunek i proporcja anizotropii) powinny zmieniać się stopniowo od jednej wartości progowej do następnej. Nie jest to zazwyczaj żadne istotne ograniczenie, ponieważ w „naturze” zmiany struktury przestrzennej dla różnych klas wielkości analizowanego parametru zazwyczaj zachodzą w sposób stopniowy – płynny.
• Zupełnie inne podejście do problemu redukcji błędów relacji porządkowych zakłada nie „sztywne” ustalenie jednej serii wartości progowych zk, ale ich dynamiczną modyfikację osobno dla każdego sąsiedztwa szukania w zależności od zakresu wartości tam występujących. Unika się w ten sposób, często w tradycyjnym IK występującej sytuacji, że w pewnych klasach wielkości nie ma danych pomiarowych. Potrzebne odpowiednie modele semiwariogramów dla zmiennych wartości progowych są interpolowane z podanych wcześniej przez „operatora”.
Usuwanie błędów relacji porządkowych
• Wymienione procedury redukują, ale całkowicie nie eliminują problemu naruszeń relacji porządkowych. Dlatego też konieczna jest dodatkowa, finalna operacja korekty uzyskanych za pomocą algorytmu IK wartości ccdf.
• Najczęściej stosuje się prostą procedurę uśredniana korekt wartości rosnących i malejących:
zm in z1 z2 z3 z 4 z 5 z6 z 7 z8 zm a x
wartość progowa - cutoff value
0
0,2
0,4
0,6
0,8
1
a
b
c
d
Błędy relacji porządkowych uzyskanych z obliczeń IK wartości ccdf i ich korekta.
Objaśnienia:a – „niezależne” wartości ccdf wyliczone algorytmem IK,b – korekta wartości rosnących (upward correction),c – korekta wartości malejących (downward correction),d – wynikowe ccdf uzyskane z uśrednienia obu wartości skorygowanych.
Przykład korekty relacji porządkowych
A
B
Summary of order relations (number and magnitude): Threshold 1 Number = 0 Average = .0000 Maximum = -1.0000 Threshold 2 Number = 281 Average = .0121 Maximum = .0953 Threshold 3 Number = 281 Average = .0121 Maximum = .0953 Threshold 4 Number = 47 Average = .0076 Maximum = .0344 Threshold 5 Number = 249 Average = .0037 Maximum = .0063 Threshold 6 Number = 261 Average = .0040 Maximum = .0170
Total of 41.35% with an average magnitude of .0082
Summary of order relations (number and magnitude): Threshold 1 Number = 5860 Average = .0442 Maximum = .3458 Threshold 2 Number = 18149 Average = .0175 Maximum = .2356 Threshold 3 Number = 34932 Average = .0120 Maximum = .3458 Threshold 4 Number = 57824 Average = .0106 Maximum = .2984 Threshold 5 Number = 77022 Average = .0088 Maximum = .1765 Threshold 6 Number = 89273 Average = .0077 Maximum = .1760 Threshold 7 Number = 111368 Average = .0087 Maximum = .1645 Threshold 8 Number = 108059 Average = .0061 Maximum = .1576 Threshold 9 Number = 103512 Average = .0042 Maximum = .1443 Threshold10 Number = 106492 Average = .0049 Maximum = .1941 Threshold11 Number = 130464 Average = .0037 Maximum = .1443 Threshold12 Number = 138715 Average = .0056 Maximum = .3330 Threshold13 Number = 144629 Average = .0028 Maximum = .3330
Total of 22.17% with an average magnitude of .0064
Przykłady raportów dotyczące ilości i rozmiarów korekt relacji porządkowych warunkowych kumulacyjnych funkcji rozkładu maksymalnych sum dobowych opadów:A – jednowymiarowy przykład (profil) z maja 1980, B – maksymalne sumy dobowe opadów w roku 1974 na całym obszarze Polski.
Przykład korekty relacji porządkowych
20 24 28 32Ilość korekt relacji porządkowych - (%)Number of order relations corrections
0
0,004
0,008
0,012
0,016
1 2 3 4 5 6 7 8 9 10 11 12 13
Numer kolejny wartości progowejTreshold sequence number
0
50000
100000
150000
200000
1 2 3 4 5 6 7 8 9 10 11 12 13
Numer kolejny wartości progowejTreshold sequence number
0
0,01
0,02
0,03
1 2 3 4 5 6 7 8 9 10 11 12 13
Numer kolejny wartości progowejTreshold sequence number
0
0,1
0,2
0,3
A B
C D
Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1P
raw
dopo
dob
ień
stw
o -
Pro
babi
lity
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1
Pra
wd
opod
obie
ństw
o -
Pro
babi
lity
V -8 0
u 1
u 2
u 3
0,9
10,
3
29,
4
40,
6
55,
1
Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)
Interpolacja i ekstrapolacja wynikowej ccdf• Działanie algorytmu IK można porównać do
korekty, czy też modyfikacji, na podstawie informacji lokalnych, globalnego dyskretnego cdf.
• Otrzymujemy w efekcie punktową, dyskretną, warunkową funkcję rozkładu prawdopodobieństwa (ccdf).
• Aby móc ją w pełni wykorzystać do różnorodnych zastosowań, musimy w ostatnim etapie obliczeń dokonać operacji odwrotnej do tej która rozpoczynała całą procedurę – z dyskretnej, nieciągłej ccdf uzyskać z powrotem rozkład ciągły.
• Praktycznie rzecz biorąc pociąga to za sobą konieczność ustalenia sposobu za pomocą którego można oszacować dowolną wartość ccdf, a nie tylko dla K wybranych progów.
Interpolacja i ekstrapolacja wynikowej ccdf
Problem ten zazwyczaj „rozbija się” na dwa cząstkowe: (1) interpolację ccdf w obrębie klas wyznaczonych przez kolejne wartości progowe, (2) ekstrapolację poza progami skrajnymi, tj. minimalnym i maksymalnym
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0,2
0,4
0,6
0,8
1
A
1 10 100M aksym alny opad dobow y w m iesiącu (m m )
M onth ly m axim um daily precip ita tion
0
0,2
0,4
0,6
0,8
1
a
b
c
dB
Budowa ciągłego ccdf dla lokalizacji u1 z jednowymiarowego przykładu obliczeń krigingu wartości kodowanych. Objaśnienia: A – ciągły cdf dla całego zbioru danych (a) i dyskretny ccdf uzyskany z obliczeń IK dla lokalizacji u1,
B – to samo co w A plus: d – ekstrapolacja potęgowa dolnego ogona rozkładu ( = 4,0), c – interpolacja liniowa pomiędzy granicami klas i, b – ekstrapolacja hiperboliczna górnego ogona rozkładu ( = 2,5).
Interpolacja i ekstrapolacja wynikowej ccdf• Do interpolacji ccdf pomiędzy wartościami progowymi (zk-1,
zk) wykorzystywany jest zazwyczaj model liniowy. Używając tego modelu zakładamy istnienie w klasach rozkładu równomiernego
• Do ekstrapolacji dolnego ogona rozkładu używany jest najczęściej model potęgowy
• Do ekstrapolacji górnego ogona używany jest model potęgowy lub hiperboliczny
zm ienna - Z - variab le
0.0
1.0
fun
kcja
sku
mul
owan
ego
rozk
ładu
cum
ulat
ive
dis
trib
utio
n fu
nct
ion
(cdf
)
z k -1 z k
F * (z k -1)
F * (z k)
= 0 ,1
0 ,51 ,0
2 ,05 ,0
zm ienna - Z - variab le
0.0
1.0
z k
F * (z k)
= 5 ,0
1 ,01 ,5
2 ,5
a b
Potęgowa (a) i hiperboliczna (b) interpolacja / ekstrapolacja skumulowanego rozkładu zmiennej
Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1P
raw
dopo
dob
ień
stw
o -
Pro
babi
lity
1 10 100M aksym alny opad dobow y w m ies iącu (m m )
M onth ly m axim um daily precip ita tion
0
0.2
0.4
0.6
0.8
1
Pra
wd
opod
obie
ństw
o -
Pro
babi
lity
V -8 0
u 1
u 2
u 3
0,9
10,
3
29,
4
40,
6
55,
1
Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)
Zestawienie wad i zalet IKWADY:• utrata części informacji ze względu dyskredytyzację ciągłej
dystrybuanty empirycznej,• pracochłonność – konieczność czasochłonnego budowania modelu
semiwariancji dla każdej wartości progowej; często występujące trudności w określeniu modeli dla wartości bardzo niskich i bardzo wysokich zmuszają do subiektywnych decyzji, a te rodzą wątpliwości co do optymalności uzyskanych estymacji,
• wykraczanie estymowanych prawdopodobieństw poza dopuszczalny zakres (0, 1), oraz błędy w ich relacjach porządkowych,
• arbitralnie przyjmowana metoda interpolacji/ekstrapolacji uzyskanej warunkowej dystrybuanty.
ZALETY:• potwierdzona w dziesiątkach zastosowań i testów metodycznych
skuteczność, • brak trudnych do weryfikacji założeń dotyczących rozkładu
statystycznego populacji (metoda nieparametryczna),• żadna z alternatywnych metod nie jest wyraźnie lepsza,• alternatywne metody są bardziej skomplikowane = bardziej „podatne”
na błędy metodyczne,• łatwa możliwość uwzględnienia danych uzupełniających („twardych” i
„miękkich”).• powszechna dostępność oprogramowania
Analizowane dane
Fragment doliny lodowcaEbba na Spitsbergenie Zachodnimok. 7843’N i 1644’E
Analizowane dane
Dolina Ebby –analizowany obszar:
Analizowane dane
Zdjęcie satelitarneAster – Terraz 13 lipca 2002 roku
Światło widzialnei bliska podczerwień.Rozdzielczość – 15 m
Analizowane dane
Fragment mapygeomorfologicznejotoczenia fiordu Petuniabukta(Karczewski 1990).
Analizowane dane:
Zdjęcie z 13.VII. 2002 r.
Zdjęcie z 5.VIII. 2002 r.Oryginał i klasyfikacja
Fragment mapygeomorfologicznej
536800 537000 537200 537400 537600 537800 538000 538200 538400 538600
X [m ]
8737600
8737800
8738000
8738200
8738400
8738600
8738800
8739000
Y [
m]
obszar 1500 1950 m = 2,925 km2
(100 130 pikseli = 13000 danych)kanał 3n – bliska podczerwień
250 podstawowych losowych próbek100 dodatkowych losowych próbek
Interpolacja danych jakościowych– semiwariogramy kategorii
Obraz rzeczywisty
43
21
0 70 140 210 280 350 420 490 560 6300
0.006
0.012
0.018
0.024
0.03
0.036
0.042
0.048
0.054
|h| - metry
(|h
|)
Region (klasa) 1
0 50 100 150 200 250 300 350 400 4500
0.02
0.04
0.06
0.08
0.1
0.12
0.14
|h| - metry
(|h
|)
Region (klasa) 2
0 90 180 270 360 450 540 630 720 810 9000
0.03
0.06
0.09
0.12
0.15
0.18
0.21
|h| - metry(|
h|)
Region (klasa) 3
0 90 180 270 360 450 540 630 720 810 9000
0.03
0.06
0.09
0.12
0.15
0.18
0.21
0.24
|h| - metry
(|h
|)
Region (klasa) 4
Interpolacja danych jakościowych– kriging kategorii (IK)
0.5
0.6
0.7
0.8
0.9
1
1.1
0.5
0.6
0.7
0.8
0.9
1
1.1
0.5
0.6
0.7
0.8
0.9
1
1.1
0.5
0.6
0.7
0.8
0.9
1
1.1
Interpolacja IK
Prawdo-podobieństwoprzynależnoścido regionu(klasy)
klasy R %R Est %Est Es t_OK. %Est OK. %Est=R
1 815 6.3 778 6.0 675 86.8 82.82 2067 15.9 2053 15.8 1560 76.0 75.53 4163 32.0 3335 25.7 2726 81.7 65.54 5955 45.8 6347 48.8 5470 86.2 91.9Suma 13000 100 12513 96.3 10431 80.2
Statystyki klasyfikacji przestrzennej
Obraz rzeczywisty
43
21
SCHEMAT OPRÓBOWANIA STOKU.
POBÓR RDZENI GLEBOWYCH.
-16 0 16 32 48 64
-96
-80
-64
-48
-32
-16
0
16
32
48
A 2A 3A 4A 5
B 1B 2B 3B 4B 5
C 1C 2C 3C 4C 5C 6
D 1D 2D 3D 4D 5D 6D 7
E 1E 2E 3E 4E 5E 6E 7
F 1F 2F 3F 4F 5F 6F 7F 8
G 1G 2G 3G 4G 5G 6G 7G 8
H 1H 2H 3H 4H 5H 6H 7H 8
I 1I 2I 3I 4I 5I 6I 7
K 1K 2K 3K 4K 5K 6K 7
L 1L 2L 3L 4L 5L 6L 7
M 1M 2M 3M 4M 5M 6M 7
N 1N 2N 3N 4N 5N 6N 7
O 2O 3O 4O 5O 6O 7
P 2P 3P 4P 5P 6P 7
R 3R 4R 5R 6R 7
S 3S 4S 5S 6S 7
0
1
2
3
4
5
6
7
8
9
10
11
POBÓR RDZENIGLEBOWYCHI OPISBARWY GLEB
0 20 40 60 80
Odleg łość [m ]
0
0.1
0.2
0.3
Se
miw
ari
an
cja
klasa 1
klasa 2
klasa 3
0
0.1
0.2
0.3
klasa 2
klasa 4
0 20 40 60 80
Odleg łość [m ]
0
0.1
0.2
0.3
klasa 4
klasa 5
3 k la sy 4 k la sy
5 k la s
K o d b arwy
Od
leg
łość
wią
z.
0
50
100
150
200
250
300
350
28 25 24 22 27 26 21 23 20 19 18 17 15 14 16 13 12 11 9 10 8 7 5 6 4 2 3 1
Empiryczne semiwariogramy wskaźnikowe (indicator semivariogram)dla poszczególnych klas barw poziomu akumulacyjno-próchnicznego na stoku
A
Prawdopodobieństwo przynależności do klas barwpoziomu akumulacyjno-próchnicznego na stoku A
-16 0 16 32 48 64
-96
-80
-64
-48
-32
-16
0
16
32
48
0.5 0.6 0.7 0.8 0.9 10.5 0.6 0.7 0.8 0.9 1
-16 0 16 32 48 64
0.5 0.6 0.7 0.8 0.9 1
-16 0 16 32 48 64
-100
-80
-60
-40
-20
0
20
40
60
0.5 0.6 0.7 0.8 0.9 1
3 klasy 4 klasy 5 klas
Recommended