Upload
phamkhuong
View
224
Download
4
Embed Size (px)
Citation preview
DZD DPZ 9 – Klasifikace
Doc. Dr. Ing. Jiří Horák - Ing. Tomáš Peňáz, Ph.D.
Institut geoinformatiky
VŠB-TU Ostrava
© Dobrovolný
Klasifikace obrazu
• proces extrahování tématické informace z
kontinuálních dat
Informační třídy
• využitelná informace získaná zpracováním
obrazových dat
• kategorie druhu zemského povrchu
• většinou nejsou přímo čitelná v obrazových datech
(multispektrální obrazový záznam)
• získávají se nepřímo - prostřednictvím
radiometrických vlastností pixelů/objektů
© Dobrovolný
Klasifikátory prostorového
chování
• princip klasifikace objektu nebo jevu na základě
vztahu k okolním pixelům
• příznaky klasifikátorů prostorového chování
– textura
– vzájemná vzdálenost (proximity)
– velikost
– tvar
– opakovatelnost
– kontext
Klasifikátory časového chování
• princip klasifikace objektu nebo jevu na základě
jeho časových změn
• významné při identifikaci rostlinných druhů
(zemědělství a lesnictví) - prostorové a spektrální
vlastnosti jsou nestálé
• využití obrazových záznamů z různých časových
řezů
Klasifikátory spektrálního
chování
• spektrální klasifikace
• princip klasifikace objektu nebo jevu na základě
jeho spektrálního chování
• využití dat
– jednopásmových
– multispektrálních
Spektrální klasifikace
(spectral classification)
• definice vzdálenosti v příznakovém prostoru
• výběr rozhodovacího pravidla
• výběr prahové hodnoty (viz rozhodovací
pravidla)
Klasifikace s využitím
jednopásmových dat
• v případě dostatečné separability spektrálních tříd v jednom
pásmu
• použitelné techniky:
– prahování
– hustotní řezy
• viz radiometrické zvýraznění
Klasifikace s využitím
multispektrálních dat
• spektrální odezva (spectral response)
Landsat TM
Klasifikace s využitím
multispektrálních dat
• multispektrální prostor
Spektrální příznak
(spectral signature) • specifická kombinace emitovaného, odraženého nebo
pohlceného EMG záření různých vlnových délek, která
umožňuje jednoznačně určit objekt.
• charakteristika naměřená nebo vypočtená v určitých
intervalech EMG spektra, potřebná pro identifikaci objektu
nebo jevu
Spektrální příznak
(spectral signature) • shluk pixelů (pixels cluster)
Příznakový prostor
• definován všemi pásmy, v nichž lze naměřit nebo
vypočíst určitou charakteristiku
Spektrální variabilita
Rozšíření příznakového
prostoru • významná etapa klasifikace
• příprava dat
• výběr a výpočet nejvhodnějších pásem pro klasifikaci
• odstranění korelace mezi jednotlivými pásmy (viz analýza a transformace hlavních komponent)
Spektrální třídy
• nebezpečí záměny s informačními třídami !!!
• části obrazu homogenní z hlediska spektrálního chování
• klasifikace - hledání všech tříd spektrálních odpovídajících
určité třídě informační
Spektrální třídy
• Obr.
Klasifikace
• Bodová (Per-pixel)
• Objektová
• řízená (Supervised Classification)
• neřízená (Unsupervised Classification)
• hybridní
Bodová klasifikace
• Využívá klasifikátory spektrálního a časového
chování
• lze využít i klasifikátory prostorového chování –
přepočet charakteristiky do 1 pixelu (ohniskové
funkce)
• Při procesu klasifikace nevyužívají vlastnosti a
příznaky okolních pixelů, pouze hodnoty (i
transformované) 1 pixelu
Bodové klasifikátory spektrálního chování
• Nejvíce využívané
• nutnost výchozích předpokladů a zjednodušení:
– konstantní citlivost senzoru pro všechna pásma
– každý pixel odpovídá přesně definované ploše na zemském povrchu
– každý pixel představuje homogenní plochu z hlediska spektrálního chování
– normální rozdělení naměřených dat v každém pásmu
– příslušnost pixelu k jedné třídě
Objektová klasifikace
• Viz OBIA
• Segmentace obrazu
• Zjištění charakteristických hodnot objektů
(segmentů) z hlediska spektrálního, časového či
prostorového chování
• klasifikace
Princip řízené a neřízené klasifikace
Řízená klasifikace
• Tréninkové stádium
• Klasifikační stádium
– Klasifikátor minim. vzdálenosti od průměru
– Rovnoběžnostěnový (parallelpiped) klasifikátor
– Maximální pravděpodobnosti (maximum
likelihood)
– K nejbližších bodů
Řízená klasifikace (postup)
• definování trénovacích ploch
• výpočet statistických charakteristik (spektrálních
příznaků) pro trénovací plochy, editace
• výběr vhodných pásem pro klasifikaci
• volba vhodného klasifikátoru pro zařazení všech
pixelů obrazu do jednotlivých tříd
• provedení zatřídění všech pixelů do stanovených
tříd
• úprava, hodnocení a prezentace výsledků
klasifikace
Tréninková etapa
• vymezení trénovacích ploch pro každou třídu
• Reprezentativní plochy – dostatečně velké,
homogenní, z více míst (než z 1 plochy), umístění,
schopnost identifikovat a ověřit v terénu.
Minimální počet px (nejméně n+1, kde n je počet
kanálů, ale doporučení je 10n až 100n)
• Vytvoření trénovací množiny
• nutnost znalosti území z terénního průzkumu nebo
jiných zdrojů dat
Trénovací etapa
• požadavek kompletnosti a reprezentativnosti
• kompletnost - určení charakteru všech hledaných
tříd
• reprezentativnost - plochy typické pro danou
třídu
Výběr trénovacích ploch
• „manuální“
• „automatizovaný“
• Problém smíšených pixelů (Mixed pixels)
„Manuální“ výběr trénovacích
ploch
• úloha zpracovatele
• určení homogenních skupin pixelů (podobné DN v jednotlivých pásmech)
• vyloučení smíšené spektrální informace - okrajové pixely mezi plochami
„Automatizovaný“ výběr
trénovacích ploch
• úloha zpracovatele vs. úloha zpracovatelského
programu
• určení úvodního „zárodečného“ pixelu (Seed
Pixel Method) - zpracovatel
• automatizovaný výběr okolních pixelů s
podobným spektrálním projevem - program
Počet pixelů v trénovací množině
• minimální teoretický - umožňuje správně generovat statistické spektrální příznaky
• Nejmenší teoretický počet pixelů = N + 1
kde N = počet klasifikovaných spektrálních pásem
• doporučený 10N až 100N
• co nejlepší statistické vymezení každé třídy ve vícerozměrném prostoru
• Doporučen výběr více ploch pro jednu třídu
© Dobrovolný
Faktory úspěšnosti trénovací etapy
• dostatečný počet pixelů v každé trénovací ploše
• vhodná velikost trénovacích ploch
• vhodná poloha trénovacích ploch
• umístění trénovacích ploch
• rozmístění trénovacích ploch pro každou třídu
• míra homogenity trénovacích ploch z hlediska
jejich spektrálního chování
Statistické charakteristiky tříd
• pro pixely část(i) obrazu v trénovacích plochách (tzv. masky)
• pro několik pásem multispektrálního obrazu
• vyjádření charakteristik pomocí
– průměrového vektoru
– směrodatné odchylky
– kovariační matice
• předpoklad normálního rozdělení
Statistické charakteristiky tříd umožňují posoudit
• schopnost trénovacích ploch reprezentovat třídy
• míru separability tříd na základě spektrálního
chování
Hodnocení a přizpůsobení
vhodnosti trénovacích ploch
• požadavek normálního rozdělení DN pixelů trénovací plochy
• práce s histogramem DN pixelů trénovací plochy
– bimodální rozdělení DN trénovací plochy - rozdělení pixelů do dvou tříd
– definování nových, maximálních a minimálních DN pixelů
• zvýšení míry separability transformacemi multispektrálního obrazu
Statistické hodnocení vhodnosti navržených tříd
• Je třeba posoudit u jednotlivých tříd a vzájemně:
– Histogram
– Graf koincidence,
– Rozptylogram
• jsou homogenní?
• neobsahují anomální hodnoty?
• jsou separovatelné mezi sebou?
Hodnocení trénovací etapy
• Evaluating Signatures
• metody hodnocení:
– alarm
– kontingenční matice
– maskování příznakového prostoru do rastrového obrazu
– příznakové objekty
– histogramy
– separabilita podle příznaků
– statistické zhodnocení
© Dobrovolný
© Dobrovolný
© Dobrovolný
Hodnocení trénovací etapy
příznakové objekty
• angl. signature separability
• signalizace
Hodnocení trénovací etapy signalizace
• angl. alarm
• signalizace jedné nebo více vybraných informačních
tříd v obrazu podle trénovací(ch) množin(y)
• vytvoření přibližné představy zpracovatele o
distribuci v prostoru
Ukázka signalizace
Hodnocení trénovací etapy separabilita příznaků
• angl. signature separability
• výpočet některé ze statistických vzdáleností
– euklidovské spektrální vzdálenosti mezi průměrovými
vektory
– Jeffries-Matusitova vzdálenost
– Divergence
– Transformovaná divergence
Hodnocení trénovací etapy
Transformovaná divergence
• angl. Transformed divergence
• teorie:
– ERDAS Field Guide
– učebnice statistiky
• porovnání statistické vzdálenosti mezi trénovacími
množinami
Rozhodnutí o výběru pásem
• Hodnocení divergencí mezi pásmy
• Výběr vhodných pásem pro klasifikaci
Klasifikační etapa
• Volba klasifikátoru
• Provedení klasifikace
Rozhodovací pravidla (předpoklad pro použití)
• obrazové elementy představující určitou třídu se
budou shlukovat v určité části vícerozměrného
obrazového prostoru
• vytváření shluků
• tendence pixelů jedné třídy vytvořit shluk s
určitou variabilitou
Shluky obrazových elementů
• centroidy (středy) shluků
• poloha centroidu dána průměrnou hodnotou pixelů
v použitých pásmech
• průměrná hodnota pásem v klasifikaci pro daný
shluk - průměrový vektor
Rozhodovací pravidla (princip použití)
• určují příslušnost nezařazených pixelů k určitému
shluku resp. třídě
• některým pixelům příslušnost ke shluku resp. třídě
nenalezena - třída nezařazených pixelů
Rozhodovací pravidla (základní rozdělení)
• parametrická
• neparametrická
Parametrická rozhodovací
pravidla
• známé statistické charakteristiky (průměrový
vektor, variance, kovariance)
• posuzování statistické vzdálenosti v příznakovém
prostoru
Neparametrická rozhodovací
pravidla
• (ne)linární funkce nebo matematické/geometrické
dělení příznakového prostoru
• posuzování Euklidovské vzdálenosti v
příznakovém prostoru
Rozhodovací pravidla (přehled)
• klasifikátor minimální vzdálenosti od středů shluků
(minimum distance)
• klasifikátor „K“ nejbližších sousedů
• klasifikátor pravoúhelníků (parallelepipeds)
• klasifikátor maximální pravděpodobnosti (maximum
likelihood)
• klasifikátor Bayesovský (Bayesian classifier)
• klasifikátor minimální Mahalanobisovy vzdálenosti
(minimal Mahalanobis distance)
• a další ...
Klasifikátor minimální vzdálenosti (od středů shluků)
• minimum distance to means classification
• neparametrické pravidlo
• příslušnost pixelu k třídě určena na základě jeho vzdálenosti od jednotlivých centroidů shluků
• výhody
– rychlý výpočet
• nevýhody
– malá citlivost na stupeň rozptylu
© Dobrovolný
Klasifikátor „K“ nejbližších sousedů
• K-nearest neighbour classification
• neparametrické pravidlo
• modifikace klasifikátoru minimální vzdálenosti od středů shluků
• příslušnost pixelu k třídě určena na základě
– jeho vzdálenosti od jednotlivých centroidů shluků
– početního zastoupení pixelů určité třídy v okolí zpracovávaného pixelu
• možnost definování určité mezní vzdálenosti
© Dobrovolný
Klasifikátor pravoúhelníků,
(hyper)kvádrů
• parallelepiped (box) classification
• neparametrické pravidlo
• pravoúhelníky resp. (hyper)kvádry vymezeny:
– maximálními a minimálními hodnotami
– násobky směrodatné odchylky
• příslušnost pixelu k třídě určena svou polohou vůči pravoúhelníkům resp. (hyper)kvádrům
• výhody
– nejrychlejší výpočet
• nevýhody
– špatné zařazování pixelů s hodnotami ve vzdálených rozích boxů
© Dobrovolný
Modifikovaný klasifikátor pravoúhelníků,
(hyper)kvádrů
• definování oblasti v rozptylogramu (ohraničení vektorovou grafikou)
• např. ERDAS Imagine
• výhody
– rychlý výpočet
– částečné zpřesnění
Normalizovaný klasifikátor minimální
vzdálenosti
• modifikace klasifikátoru minimální vzdálenosti
• normalizace vzdálenosti - násobky směrodatné odchylky
• znázornění izoliniemi
• parametrické pravidlo
• příslušnost pixelu k třídě určena:
– na základě vzdálenosti od centroidů shluků
– s ohledem na stupeň rozptylu shluků
• výhody
– rychlý výpočet
– vylepšená citlivost na stupeň rozptylu
Klasifikátor maximální pravděpodobnosti
• maximum likelihood classification
• parametrické pravidlo
• předpoklad normálního rozdělení
• sestavení funkce normálního rozdělení na základě průměrového vektoru a kovarianční matice
• Výpočet pravděpodobnosti příslušnosti ke každé třídě
• Nejvyšší hodnota -> klasifikovaná třída
• výhody
– nejlepší výsledky při použití kvalitních trénovacích dat
• nevýhody
– nejpomalejší výpočet
© Dobrovolný
© Dobrovolný
Bayesovský klasifikátor
• A priorní pravděpodobnost výskytu tříd. Stanovení s ohledem na
váhu různých hledisek (např. plošné zastoupení, nebo jiná
apriorní znalost - např. třída písek se vyskytuje méně
pravděpodobně než městská zástavba).
• Pravděpodobnost zařazení do třídy z pravděpodobnostní
klasifikace
• => výsledná pravděpodobnost zařazení do třídy, klasifikace
• parametrické pravidlo
• výhody
– bere v úvahu variabilitu tříd (kovariační matice)
– dobré výsledky při klasifikaci sporných pixelů (použití v kombinaci s jinými klasifikátory)
• nevýhody
– nejpomalejší výpočet
Výsledek
• zařazení jednotlivých px podle klasifikačního schématu a
vytvoření tématické mapy
Neřízená klasifikace
• Základní postup:
1. Shluková analýza
2. Přiřazení významu shlukům (určování informační
hodnoty uměle vytvořených kategorií)
3. reklasifikace (spojení tříd)
© Dobrovolný
Neřízená klasifikace shluky
© Dobrovolný
Postup při neřízené klasifikaci
• definování přibližného počtu výsledných shluků
• generování počáteční polohy centroidu pro každý shluk
• postupné přiřazení všech pixelů k nejbližšímu shluku
• výpočet nové polohy centroidu pro každý shluk s nově
přiřazenými pixely
• opakování předchozích dvou kroků do stadia, kdy se přestane
výrazně měnit poloha shluků v obrazovém prostoru nebo počet
pixelů ve shluku
• přiřazení konkrétního významu stabilním shlukům
• vytváření informačních tříd spojováním tříd spektrálních (či
jiných)
Volitelné parametry
• počáteční poloha centroidů
– po diagonále příznakového prostoru
– pomocí zakládacího souboru (seed file)
• definování přibližného počtu výsledných shluků
• minimální vzdálenost dvou shluků
• poloha centroidu shluku – porovnání mezi dvěma iteracemi
• celkový počet iterací
Shluková analýza spektrální vzdálenost
n
i
ii edD1
2)(
• D = spektrální vzdálenost
• n = počet pásem
• i = dílčí pásmo
• di = hodnota pixelu d v pásmu i
• ei = hodnota pixelu e v pásmu i
ve dvojrozměrném obrazovém prostoru (n = 2)
222
jjii ededD
Algoritmy shlukové analýzy
• „K-Means“
• ISODATA (Iterative Self-Organizing Data
Analysis Technique)
• algoritmus Narendra a Goldberg (PCI)
• AMOEBA
• RGB Clustering (ERDAS Imagine)
© Dobrovolný
© Dobrovolný
© Dobrovolný
© Dobrovolný
ISODATA algoritmus
ISODATA algoritmus • zadává se:
– počet shluků
– počet iterací
• … a další podmíněné parametry:
– kriterium heterogenity - rozdělení heterogenního shluku na dva shluky
– kriterium vzdálenosti - spojení shluků s blízkými centroidy
– kriterium počtu min. pixelů - odstranění shluků s podlimitním počtem připojením k okolním shlukům
Algoritmus Narendra a Goldberg
• neparametrická metoda
• stanovení hranic mezi shluky podle histogramů
zpracovávaných pásem
• výpočet není iterační – neumožňuje zadat požadovaný
počet výsledných shluků
Algoritmus AMOEBA
• parametrická metoda
• amoeba = měňavka
• parametrem proměnlivost umístění pixelů v dané spektrální
třídě
• ovlivní se stanovením hodnoty rozptylu nebo směrodatné
odchylky
RGB Clustering
• jednoduchá klasifikační a kompresní technika pro 3 pásma, 8-bitová
• výpočetně rychlá metoda
• vykreslení pixelů do 3-rozměrného rozptylogramu
• histogramy podél os rozptylogramu rozděleny na intervaly – vymezení shluků ohraničených kvádry
Hybridní klasifikace
• Např. výsledky ze shlukové analýzy se použijí pro
tréninkové stádium řízené klasifikace
• Nebo naopak data z tréninkových ploch použita pro vstup
do neřízené klasifikace (např. identifikace lineárních
objektů)
Klasifikace pomocí neuronových sítí
• umělá inteligence (expertní systémy, neuronové)
• neurony vs. umělé neurony
• schéma neuronové sítě
vstupní vrstva
skrytá vrstva
výstupní vrstva
Neuronové sítě
• neuron – uzel sítě
• výstup z uzlu (výstupní signál):
– definován funkcí F(x)
– generován při nadprahové hodnotě
i
i
ixwxF xi – hodnota i-tého vstupu
wi – váha i-tého vstupu
Neuronové sítě
• klasifikační proces:
– řízený
– neřízený
– kombinovaný
• algoritmy implementovány např. v produktech:
– TOPOL RS
– MUTISPEC
– ERDAS Imagine
Neuronové sítě
• představují dílčí zlepšení výsledků klasifikace
• možnost kombinace různých typů dat:
– data z optické části spektra
– data radarová
– morfometrická data získaná z DMR
– …
• možnost přiřazení váhy vstupujícím datům
• nepracují s matematickým modelem
– nepožadují normalitu rozdělení dat
– nepožadují kvalitní a rozsáhlý trénovací proces
• konečným výstupem – informační třída
Klasifikace neuronovou sítí
• Algoritmus se zpětným postupem (řízená klas.)
• 2 vrstvy (Kohonenova a Grossbergova), které jsou
trénovány odděleně. Kohonenova - neřízená klasifikace na
vstupu, Grossbergova – řízená klasifikace na výstupu
• Alg. s obráceným postupem – síť tvořena vstupními uzly =
pixely. Následuje rozdělení do shluků, postupná agregace
až na tolik uzlů, kolik jich má požadovaný výstup.
Rozšíření per-pixel klasifikace
• Využití informací z okolí – po transformaci nová hodnota
v pixelu. = předzpracování obrazu
• Následně některá z klasifikačních metod
• Využití klasifikátorů prostorového chování – např.
texturální, prostorově kontextové
• snaha o využití dalších vlastností povrchů:
– textura
– příčinné vztahy
– kontext
– …
• rozpoznávání prostorových příznaků (spatial pattern recognition)
• zařazování do tříd s ohledem na souvislosti s okolím
• okolí se nezkoumá pomocí okna, nýbrž v celém rozsahu obrazu
• využití mapové algebry a operací analytických technik v prostředí GIS
Kontextuální klasifikátory
Kontextuální klasifikátory
• kontext a struktura
– vlastnosti používané při vizuální interpretaci
– charakterizovány topologickými charakteristikami:
• Vzdáleností - hledaný objekt se může nacházet jen v jisté vzdálenosti
od jiného objektu
• směrem příp. orientací - hledaný objekt se může nacházet jen v
určitém směru od jiného objektu
• Konektivitou - 2 objekty mohou / nemusí být spojeny jiným objektem
• dotykem (sousedství) - 2 objekty se mohou/nemusí dotýkat
• Vnořením – 1 objekt se musí /nesmí vyskytovat uvnitř jiného
Tvrdé vs. měkké metody
klasifikace obrazu
„Tvrdé“ klasifikátory
• tradiční metody klasifikace
• tvrdé (hard) klasifikátory
• každá klasifikační jednotka (pixel, segment) patří
právě do jedné třídy
• neřeší problém smíšených pixelů
„Měkké“ klasifikátory • alternativní a komplementární metody klasifikace
• každá klasifikační jednotka (pixel, segment) přísluší k
více než jedné třídě
• řeší problém smíšených pixelů
• stupeň příslušnosti (membership degree) pixelu ke
každé třídě ‹0;1›
• vztah k pravděpodobnosti a k důkazům
• možnost kombinace s vektorovými daty GIS –
získání dalších informací a důkazů
• ve finále možnost použití tvrdých klasifikátorů
Hodnocení klasifikace v jejím průběhu
• vylepšení klasifikace
– kombinace měkkých a tvrdých klasifikátorů
– měkké klasifikátory vypovídají o klasifikační nejistotě
– problémové případy – vysoká nejistota
• vysoká nejistota klasifikace když:
– se pixely jeví jako směs tříd – důvody:
• špatná tréninková data – data nemohou být oddělena
• smíšený projev na mikroskopické úrovni
– pixely náleží k neznámým třídám (neznámý spektrální
příznak)
• vytvořit novou třídu – získat tréninková data
Tvrdé vs. měkké klasifikátory
• výstupem klasifikace – obraz(y) příslušnosti k třídě
(class membership images)
– jedna (tematická) mapa – tvrdé klasifikátory
– více (tematických) map – měkké klasifikátory
Měkké klasifikátory
• odlišné metriky vyjádření příslušnosti (membership)
• Idrisi Selva (Taiga) – nabízí měkké klasifikátory,
založené na:
Bayesově teorii (BAYCLASS)
Dempster-Shaferově teorii (BELCLASS)
Mahalanobisově vzdálenosti
teorii fuzzy množin
modelu lineárního míchání
„Měkké“ klasifikátory
• výsledek klasifikace - obraz(y) příslušnosti k třídě
• v Idrisi uloženy do zásobníku - raster image group file
(.rgf)
• hodnoty obrazu příslušnosti lze získat pomocí dotazů
– numerických
– grafických
„Měkké“ klasifikátory
• obraz klasifikační nejistoty (Classification Uncertainty
image)
– vyjadřuje, do jaké míry je příslušnost daného pixelu k třídám
lepší/horší než příslušnost ostatních pixelů
– kde
max = maximum z množiny hodnot příslušnosti k třídám pro daný pixel
sum = součet množiny hodnot příslušnosti k třídám pro daný pixel
n = uvažovaný počet tříd
n
n
sum
CU1
1
max
1
Příklady klasifikační nejistoty
• příklad ohodnocení 3 tříd – následující snímek
• platí:
- hodnoty příslušnosti ‹0;1›,
- sum hodnot příslušnosti ≠ 1 AND sum hodnot
příslušnosti ‹0;1),
• význam klasifikační nejistoty:
- sběr nových důkazů (dat), je-li nejistota vysoká
- získání nových informací
Příklady klasifikační nejistoty CU
)0,00,00,1(
)05,005,09,0(
)0,01,09,0(
)1,03,06,0(
)0,03,06,0(
)3,03,03,0(
)1,01,01,0(
)1,00,00,0(
)0,00,00,0(
00,0
15,0
15,0
60,0
55,0
00,1
00,1
90,0
00,1
CU
CU
CU
CU
CU
CU
CU
CU
CU
BAYCLASS
• podobný klasifikátoru maximální pravděpodobnosti
(Maximum Likelihood Classifier )
• vyjadřují následnou pravděpodobnost (posterior
probability) s níž pixel přísluší ke každé třídě podle
Bayesovy pravděpodobnostní teorie
• vyjadřuje vztah mezi pravděpodobností a poměrem
šancí
• předpokládaná pravděpodobnost vychází z existujících
znalostí (např. existující tematické mapy)
BAYCLASS
• kde
p(h/e) = pravděpodobnost pravdivosti hypotézy dané důkazem
(posterior probability)
p(e/h) = pravděpodobnost zjištění, že důkaz daný hypotézou je
pravdivý
p(h) = pravděpodobnost, že je hypotéza pravdivá bez ohledu na
důkazy (prior probability)
i
ii hphep
hphepehp
).(
)().(
BAYCLASS
• p(e/h) - odvozena z kovariační matice tréninkových dat
• p(h/e) = (posterior probability)
– pravděpodobnost pravdivosti hypotézy dané důkazem
– považována za důkaz příslušnosti k třídě
• předpoklad – uvažované třídy jsou jediné možné třídy
• označuje pixely jako třídy i na základě slabých důkazů,
není-li podpora pro přiřazení k jiné třídě
• sub-pixelová klasifikace - výstupem oddělené obrazy
• BAYCLASS v Idrisi
– dobře zjišťuje základní složky smíšených pixelů
– nedobře zjišťuje správné proporce každé z tříd v mixelech
BELCLASS
• podobný klasifikátoru maximální pravděpodobnosti
• Dempster-Shaferova teorie (DST)
• DST rozvíjí a doplňuje BPT
– BPT – předpokládá, že neexistuje nevědomost – nedostatek!!!
– DST - připouští možnost neúplnosti stávajících informací
• nedostatek důkazů neznamená důkaz proti této hypotéze
BELCLASS • pojmy z DST – viz skripta Zpracování dat v GIS
BELCLASS • pojmy z DST
– interval důvěry (belief interval) <Bel(A); Pl(A)>
– Nejistota
• míra nejistoty hypotézy
• nedůvěra není doplňkem domnění!!!
BELCLASS
• DST
– vyjadřuje stupeň podpory pro všechny hypotézy, které ne mají
průnik s danou hypotézou (viz příklady)
– umožňuje snadno spojovat důkazy
– spojované důkazy
• musí být nezávislé
• nesmí být redundantní
BELCLASS
• Příklad pro BPT
• uvažujme 4 třídy
– důkazy podporují třídu 1 s mírou 0,3 a všechny ostatní s mírou 0
– výsledkem BPT by bylo označení pixelu v třídě 1 s výslednou
pravděpodobností 1,0
BELCLASS
• Příklad 1 pro DST
• uvažujme 4 třídy
– důkazy podporují
• třídu 1 s mírou důvěry 0,3
• ostatní třídy (2, 3, 4) s mírou důvěry 0
– DST by označila pixel v třídě 1
• mírou důvěry = 0,3
• mírou uvěřitelnosti = 1
• v intervalu důvěry 0,7
– DST by označila pixel pro ostatní třídy (2, 3, 4)
• mírou důvěry = 0
• při míře uvěřitelnosti = 0,7
BELCLASS
• Příklad 2 pro DST
• uvažujme 4 třídy
– důkazy podporují
• třídu 1 s mírou důvěry 0,3
• třídu 2 s mírou důvěry 0,6 (nový důkaz!!!)
• ostatní třídy (3, 4) s mírou důvěry 0
– DST by označila pixel v třídě 1
• mírou důvěry = 0,3
• mírou uvěřitelnosti = 0,4
• v intervalu důvěry 0,1
• očekávaným efektem při použití nových důkazů je
menší míra nejistoty
BELCLASS
• výstupy z klasifikačního algoritmu BELLCLASS
• pro každou z tříd je generován obraz:
– obraz důvěry (image of belief)
– obraz věrohodnosti (image of plausibility)
– obraz klasifikační nejistoty (classification uncertainty
image)
• hlavní důvod použití klasifikačního algoritmu
BELLCLASS
– kontrola kvality tréninkových dat (nechybí některá třída?)
– hodnocení provedeno v průběhu klasifikace
• při existenci domněnky výskytu neznámých tříd
– použití třídy „ostatní“
Porovnání BAYCLASS a BELCLASS
• použití klasifikačního algoritmu BAYCLASS
– důvěřuje síle tréninkových množin
– nepřipouští neznalost některých tréninkových množin
• použití klasifikačního algoritmu BELLCLASS
– je rezervovaný vůči významu tréninkových množin
– připouští neznalost některých tréninkových množin
Postklasifikační úpravy
1. Problémy ve velikosti vytvořených prostorových
útvarů
2. Problémy ve správnosti klasifikace
• Ad 1)
– A) roztříštěnost výsledných ploch
– Řešení např. Sieve filtrace
– B) Pepř a sůl - izolované pixely s odlišnou hodnotou
– Řešení např. nízkofrekvenční filtr – ale s logickým
operátorem, kvantilový apod. – modus, medián,..
Problémy postklasifikační filtrace
• klasifikovaný obraz obsahuje kvalitativní charakteristiky
• nebezpečí vzniku nové „informační třídy“
• modální filtr – vypočtená hodnota pixelu obsahuje hodnotu nejčastěji obsaženou pro danou polohu filtru (módus)
• možnost užití:
– odlišných vah
– vyloučení některých tříd
– vícenásobné filtrace
– kritéria minimální plochy
– zachování hranic mezi třídami
Vlastnosti postklasifikačních chyb
v obrazu
• chybně klasifikované pixely:
– souvisí především s určitými třídami
– se vyskytují především ve skupinách (málokdy
izolovaně)
– mají ve výsledném obrazu určité prostorové uspořádání
– váží se na typické části klasifikovaných ploch
Detekce klasifikačních chyb
• rozlehlá vodní plocha na vrcholech a svazích pohoří
– využití DMR
– chyba !! – pixely klasifikovány nesprávně
– jedná se o ledovec?
• lužní les ve značné vzdálenosti od vodních toků
– využití obalové zóny (buffer)
Odhad přesnosti klasifikace
• Testovací plochy
• Kontingenční tabulka
• Kappa index
© Dobrovolný
© Dobrovolný
Kappa index
© Dobrovolný