DZD DPZ 9 Klasifikace - homel.vsb.czhomel.vsb.cz/~hor10/Vyuka/DZDPZ/DZDDPZ9b.pdf · Algoritmus AMOEBA • parametrická metoda • amoeba = měňavka • parametrem proměnlivost

DZD DPZ 9 – Klasifikace

Doc. Dr. Ing. Jiří Horák - Ing. Tomáš Peňáz, Ph.D.

Institut geoinformatiky

VŠB-TU Ostrava

© Dobrovolný

Klasifikace obrazu

• proces extrahování tématické informace z

kontinuálních dat

Informační třídy

• využitelná informace získaná zpracováním

obrazových dat

• kategorie druhu zemského povrchu

• většinou nejsou přímo čitelná v obrazových datech

(multispektrální obrazový záznam)

• získávají se nepřímo - prostřednictvím

radiometrických vlastností pixelů/objektů

© Dobrovolný

Klasifikátory prostorového

chování

• princip klasifikace objektu nebo jevu na základě

vztahu k okolním pixelům

• příznaky klasifikátorů prostorového chování

– textura

– vzájemná vzdálenost (proximity)

– velikost

– tvar

– opakovatelnost

– kontext

Klasifikátory časového chování


jeho časových změn

• významné při identifikaci rostlinných druhů

(zemědělství a lesnictví) - prostorové a spektrální

vlastnosti jsou nestálé

• využití obrazových záznamů z různých časových

řezů

Klasifikátory spektrálního

chování

• spektrální klasifikace


jeho spektrálního chování

• využití dat

– jednopásmových

– multispektrálních

Spektrální klasifikace

(spectral classification)

• definice vzdálenosti v příznakovém prostoru

• výběr rozhodovacího pravidla

• výběr prahové hodnoty (viz rozhodovací

pravidla)

Klasifikace s využitím

jednopásmových dat

• v případě dostatečné separability spektrálních tříd v jednom

pásmu

• použitelné techniky:

– prahování

– hustotní řezy

• viz radiometrické zvýraznění


multispektrálních dat

• spektrální odezva (spectral response)

Landsat TM


multispektrálních dat

• multispektrální prostor

Spektrální příznak

(spectral signature) • specifická kombinace emitovaného, odraženého nebo

pohlceného EMG záření různých vlnových délek, která

umožňuje jednoznačně určit objekt.

• charakteristika naměřená nebo vypočtená v určitých

intervalech EMG spektra, potřebná pro identifikaci objektu

nebo jevu

Spektrální příznak

(spectral signature) • shluk pixelů (pixels cluster)

Příznakový prostor

• definován všemi pásmy, v nichž lze naměřit nebo

vypočíst určitou charakteristiku

Spektrální variabilita

Rozšíření příznakového

prostoru • významná etapa klasifikace

• příprava dat

• výběr a výpočet nejvhodnějších pásem pro klasifikaci

• odstranění korelace mezi jednotlivými pásmy (viz analýza a transformace hlavních komponent)

Spektrální třídy

• nebezpečí záměny s informačními třídami !!!

• části obrazu homogenní z hlediska spektrálního chování

• klasifikace - hledání všech tříd spektrálních odpovídajících

určité třídě informační

Spektrální třídy

• Obr.

Klasifikace

• Bodová (Per-pixel)

• Objektová

• řízená (Supervised Classification)

• neřízená (Unsupervised Classification)

• hybridní

Bodová klasifikace

• Využívá klasifikátory spektrálního a časového

chování

• lze využít i klasifikátory prostorového chování –

přepočet charakteristiky do 1 pixelu (ohniskové

funkce)

• Při procesu klasifikace nevyužívají vlastnosti a

příznaky okolních pixelů, pouze hodnoty (i

transformované) 1 pixelu

Bodové klasifikátory spektrálního chování

• Nejvíce využívané

• nutnost výchozích předpokladů a zjednodušení:

– konstantní citlivost senzoru pro všechna pásma

– každý pixel odpovídá přesně definované ploše na zemském povrchu

– každý pixel představuje homogenní plochu z hlediska spektrálního chování

– normální rozdělení naměřených dat v každém pásmu

– příslušnost pixelu k jedné třídě

Objektová klasifikace

• Viz OBIA

• Segmentace obrazu

• Zjištění charakteristických hodnot objektů

(segmentů) z hlediska spektrálního, časového či

prostorového chování

• klasifikace

Princip řízené a neřízené klasifikace

Řízená klasifikace

• Tréninkové stádium

• Klasifikační stádium

– Klasifikátor minim. vzdálenosti od průměru

– Rovnoběžnostěnový (parallelpiped) klasifikátor

– Maximální pravděpodobnosti (maximum

likelihood)

– K nejbližších bodů

Řízená klasifikace (postup)

• definování trénovacích ploch

• výpočet statistických charakteristik (spektrálních

příznaků) pro trénovací plochy, editace

• výběr vhodných pásem pro klasifikaci

• volba vhodného klasifikátoru pro zařazení všech

pixelů obrazu do jednotlivých tříd

• provedení zatřídění všech pixelů do stanovených

tříd

• úprava, hodnocení a prezentace výsledků

klasifikace

Tréninková etapa

• vymezení trénovacích ploch pro každou třídu

• Reprezentativní plochy – dostatečně velké,

homogenní, z více míst (než z 1 plochy), umístění,

schopnost identifikovat a ověřit v terénu.

Minimální počet px (nejméně n+1, kde n je počet

kanálů, ale doporučení je 10n až 100n)

• Vytvoření trénovací množiny

• nutnost znalosti území z terénního průzkumu nebo

jiných zdrojů dat

Trénovací etapa

• požadavek kompletnosti a reprezentativnosti

• kompletnost - určení charakteru všech hledaných

tříd

• reprezentativnost - plochy typické pro danou

třídu

Výběr trénovacích ploch

• „manuální“

• „automatizovaný“

• Problém smíšených pixelů (Mixed pixels)

„Manuální“ výběr trénovacích

ploch

• úloha zpracovatele

• určení homogenních skupin pixelů (podobné DN v jednotlivých pásmech)

• vyloučení smíšené spektrální informace - okrajové pixely mezi plochami

„Automatizovaný“ výběr

trénovacích ploch

• úloha zpracovatele vs. úloha zpracovatelského

programu

• určení úvodního „zárodečného“ pixelu (Seed

Pixel Method) - zpracovatel

• automatizovaný výběr okolních pixelů s

podobným spektrálním projevem - program

Počet pixelů v trénovací množině

• minimální teoretický - umožňuje správně generovat statistické spektrální příznaky

• Nejmenší teoretický počet pixelů = N + 1

kde N = počet klasifikovaných spektrálních pásem

• doporučený 10N až 100N

• co nejlepší statistické vymezení každé třídy ve vícerozměrném prostoru

• Doporučen výběr více ploch pro jednu třídu

© Dobrovolný

Faktory úspěšnosti trénovací etapy

• dostatečný počet pixelů v každé trénovací ploše

• vhodná velikost trénovacích ploch

• vhodná poloha trénovacích ploch

• umístění trénovacích ploch

• rozmístění trénovacích ploch pro každou třídu

• míra homogenity trénovacích ploch z hlediska

jejich spektrálního chování

Statistické charakteristiky tříd

• pro pixely část(i) obrazu v trénovacích plochách (tzv. masky)

• pro několik pásem multispektrálního obrazu

• vyjádření charakteristik pomocí

– průměrového vektoru

– směrodatné odchylky

– kovariační matice

• předpoklad normálního rozdělení

Statistické charakteristiky tříd umožňují posoudit

• schopnost trénovacích ploch reprezentovat třídy

• míru separability tříd na základě spektrálního

chování

Hodnocení a přizpůsobení

vhodnosti trénovacích ploch

• požadavek normálního rozdělení DN pixelů trénovací plochy

• práce s histogramem DN pixelů trénovací plochy

– bimodální rozdělení DN trénovací plochy - rozdělení pixelů do dvou tříd

– definování nových, maximálních a minimálních DN pixelů

• zvýšení míry separability transformacemi multispektrálního obrazu

Statistické hodnocení vhodnosti navržených tříd

• Je třeba posoudit u jednotlivých tříd a vzájemně:

– Histogram

– Graf koincidence,

– Rozptylogram

• jsou homogenní?

• neobsahují anomální hodnoty?

• jsou separovatelné mezi sebou?

Hodnocení trénovací etapy

• Evaluating Signatures

• metody hodnocení:

– alarm

– kontingenční matice

– maskování příznakového prostoru do rastrového obrazu

– příznakové objekty

– histogramy

– separabilita podle příznaků

– statistické zhodnocení

© Dobrovolný

© Dobrovolný

© Dobrovolný


příznakové objekty

• angl. signature separability

• signalizace

Hodnocení trénovací etapy signalizace

• angl. alarm

• signalizace jedné nebo více vybraných informačních

tříd v obrazu podle trénovací(ch) množin(y)

• vytvoření přibližné představy zpracovatele o

distribuci v prostoru

Ukázka signalizace

Hodnocení trénovací etapy separabilita příznaků

• angl. signature separability

• výpočet některé ze statistických vzdáleností

– euklidovské spektrální vzdálenosti mezi průměrovými

vektory

– Jeffries-Matusitova vzdálenost

– Divergence

– Transformovaná divergence


Transformovaná divergence

• angl. Transformed divergence

• teorie:

– ERDAS Field Guide

– učebnice statistiky

• porovnání statistické vzdálenosti mezi trénovacími

množinami

Rozhodnutí o výběru pásem

• Hodnocení divergencí mezi pásmy

• Výběr vhodných pásem pro klasifikaci

Klasifikační etapa

• Volba klasifikátoru

• Provedení klasifikace

Rozhodovací pravidla (předpoklad pro použití)

• obrazové elementy představující určitou třídu se

budou shlukovat v určité části vícerozměrného

obrazového prostoru

• vytváření shluků

• tendence pixelů jedné třídy vytvořit shluk s

určitou variabilitou

Shluky obrazových elementů

• centroidy (středy) shluků

• poloha centroidu dána průměrnou hodnotou pixelů

v použitých pásmech

• průměrná hodnota pásem v klasifikaci pro daný

shluk - průměrový vektor

Rozhodovací pravidla (princip použití)

• určují příslušnost nezařazených pixelů k určitému

shluku resp. třídě

• některým pixelům příslušnost ke shluku resp. třídě

nenalezena - třída nezařazených pixelů

Rozhodovací pravidla (základní rozdělení)

• parametrická

• neparametrická

Parametrická rozhodovací

pravidla

• známé statistické charakteristiky (průměrový

vektor, variance, kovariance)

• posuzování statistické vzdálenosti v příznakovém

prostoru

Neparametrická rozhodovací

pravidla

• (ne)linární funkce nebo matematické/geometrické

dělení příznakového prostoru

• posuzování Euklidovské vzdálenosti v

příznakovém prostoru

Rozhodovací pravidla (přehled)

• klasifikátor minimální vzdálenosti od středů shluků

(minimum distance)

• klasifikátor „K“ nejbližších sousedů

• klasifikátor pravoúhelníků (parallelepipeds)

• klasifikátor maximální pravděpodobnosti (maximum

likelihood)

• klasifikátor Bayesovský (Bayesian classifier)

• klasifikátor minimální Mahalanobisovy vzdálenosti

(minimal Mahalanobis distance)

• a další ...

Klasifikátor minimální vzdálenosti (od středů shluků)

• minimum distance to means classification

• neparametrické pravidlo

• příslušnost pixelu k třídě určena na základě jeho vzdálenosti od jednotlivých centroidů shluků

• výhody

– rychlý výpočet

• nevýhody

– malá citlivost na stupeň rozptylu

© Dobrovolný

Klasifikátor „K“ nejbližších sousedů

• K-nearest neighbour classification


• modifikace klasifikátoru minimální vzdálenosti od středů shluků

• příslušnost pixelu k třídě určena na základě

– jeho vzdálenosti od jednotlivých centroidů shluků

– početního zastoupení pixelů určité třídy v okolí zpracovávaného pixelu

• možnost definování určité mezní vzdálenosti

© Dobrovolný

Klasifikátor pravoúhelníků,

(hyper)kvádrů

• parallelepiped (box) classification


• pravoúhelníky resp. (hyper)kvádry vymezeny:

– maximálními a minimálními hodnotami

– násobky směrodatné odchylky

• příslušnost pixelu k třídě určena svou polohou vůči pravoúhelníkům resp. (hyper)kvádrům

• výhody

– nejrychlejší výpočet

• nevýhody

– špatné zařazování pixelů s hodnotami ve vzdálených rozích boxů

© Dobrovolný

Modifikovaný klasifikátor pravoúhelníků,

(hyper)kvádrů

• definování oblasti v rozptylogramu (ohraničení vektorovou grafikou)

• např. ERDAS Imagine

• výhody


– částečné zpřesnění

Normalizovaný klasifikátor minimální

vzdálenosti

• modifikace klasifikátoru minimální vzdálenosti

• normalizace vzdálenosti - násobky směrodatné odchylky

• znázornění izoliniemi

• parametrické pravidlo

• příslušnost pixelu k třídě určena:

– na základě vzdálenosti od centroidů shluků

– s ohledem na stupeň rozptylu shluků

• výhody


– vylepšená citlivost na stupeň rozptylu

Klasifikátor maximální pravděpodobnosti

• maximum likelihood classification


• předpoklad normálního rozdělení

• sestavení funkce normálního rozdělení na základě průměrového vektoru a kovarianční matice

• Výpočet pravděpodobnosti příslušnosti ke každé třídě

• Nejvyšší hodnota -> klasifikovaná třída

• výhody

– nejlepší výsledky při použití kvalitních trénovacích dat

• nevýhody

– nejpomalejší výpočet

© Dobrovolný

© Dobrovolný

Bayesovský klasifikátor

• A priorní pravděpodobnost výskytu tříd. Stanovení s ohledem na

váhu různých hledisek (např. plošné zastoupení, nebo jiná

apriorní znalost - např. třída písek se vyskytuje méně

pravděpodobně než městská zástavba).

• Pravděpodobnost zařazení do třídy z pravděpodobnostní

klasifikace

• => výsledná pravděpodobnost zařazení do třídy, klasifikace


• výhody

– bere v úvahu variabilitu tříd (kovariační matice)

– dobré výsledky při klasifikaci sporných pixelů (použití v kombinaci s jinými klasifikátory)

• nevýhody

– nejpomalejší výpočet

Výsledek

• zařazení jednotlivých px podle klasifikačního schématu a

vytvoření tématické mapy

Neřízená klasifikace

• Základní postup:

1. Shluková analýza

2. Přiřazení významu shlukům (určování informační

hodnoty uměle vytvořených kategorií)

3. reklasifikace (spojení tříd)

© Dobrovolný

Neřízená klasifikace shluky

© Dobrovolný

Postup při neřízené klasifikaci

• definování přibližného počtu výsledných shluků

• generování počáteční polohy centroidu pro každý shluk

• postupné přiřazení všech pixelů k nejbližšímu shluku

• výpočet nové polohy centroidu pro každý shluk s nově

přiřazenými pixely

• opakování předchozích dvou kroků do stadia, kdy se přestane

výrazně měnit poloha shluků v obrazovém prostoru nebo počet

pixelů ve shluku

• přiřazení konkrétního významu stabilním shlukům

• vytváření informačních tříd spojováním tříd spektrálních (či

jiných)

Volitelné parametry

• počáteční poloha centroidů

– po diagonále příznakového prostoru

– pomocí zakládacího souboru (seed file)

• definování přibližného počtu výsledných shluků

• minimální vzdálenost dvou shluků

• poloha centroidu shluku – porovnání mezi dvěma iteracemi

• celkový počet iterací

Shluková analýza spektrální vzdálenost

n

i

ii edD1

2)(

• D = spektrální vzdálenost

• n = počet pásem

• i = dílčí pásmo

• di = hodnota pixelu d v pásmu i

• ei = hodnota pixelu e v pásmu i

ve dvojrozměrném obrazovém prostoru (n = 2)

222

jjii ededD

Algoritmy shlukové analýzy

• „K-Means“

• ISODATA (Iterative Self-Organizing Data

Analysis Technique)

• algoritmus Narendra a Goldberg (PCI)

• AMOEBA

• RGB Clustering (ERDAS Imagine)

© Dobrovolný

© Dobrovolný

© Dobrovolný

© Dobrovolný

ISODATA algoritmus

ISODATA algoritmus • zadává se:

– počet shluků

– počet iterací

• … a další podmíněné parametry:

– kriterium heterogenity - rozdělení heterogenního shluku na dva shluky

– kriterium vzdálenosti - spojení shluků s blízkými centroidy

– kriterium počtu min. pixelů - odstranění shluků s podlimitním počtem připojením k okolním shlukům

Algoritmus Narendra a Goldberg

• neparametrická metoda

• stanovení hranic mezi shluky podle histogramů

zpracovávaných pásem

• výpočet není iterační – neumožňuje zadat požadovaný

počet výsledných shluků

Algoritmus AMOEBA

• parametrická metoda

• amoeba = měňavka

• parametrem proměnlivost umístění pixelů v dané spektrální

třídě

• ovlivní se stanovením hodnoty rozptylu nebo směrodatné

odchylky

RGB Clustering

• jednoduchá klasifikační a kompresní technika pro 3 pásma, 8-bitová

• výpočetně rychlá metoda

• vykreslení pixelů do 3-rozměrného rozptylogramu

• histogramy podél os rozptylogramu rozděleny na intervaly – vymezení shluků ohraničených kvádry

Hybridní klasifikace

• Např. výsledky ze shlukové analýzy se použijí pro

tréninkové stádium řízené klasifikace

• Nebo naopak data z tréninkových ploch použita pro vstup

do neřízené klasifikace (např. identifikace lineárních

objektů)

Klasifikace pomocí neuronových sítí

• umělá inteligence (expertní systémy, neuronové)

• neurony vs. umělé neurony

• schéma neuronové sítě

vstupní vrstva

skrytá vrstva

výstupní vrstva

Neuronové sítě

• neuron – uzel sítě

• výstup z uzlu (výstupní signál):

– definován funkcí F(x)

– generován při nadprahové hodnotě

i

i

ixwxF xi – hodnota i-tého vstupu

wi – váha i-tého vstupu

Neuronové sítě

• klasifikační proces:

– řízený

– neřízený

– kombinovaný

• algoritmy implementovány např. v produktech:

– TOPOL RS

– MUTISPEC

– ERDAS Imagine

Neuronové sítě

• představují dílčí zlepšení výsledků klasifikace

• možnost kombinace různých typů dat:

– data z optické části spektra

– data radarová

– morfometrická data získaná z DMR

– …

• možnost přiřazení váhy vstupujícím datům

• nepracují s matematickým modelem

– nepožadují normalitu rozdělení dat

– nepožadují kvalitní a rozsáhlý trénovací proces

• konečným výstupem – informační třída

Klasifikace neuronovou sítí

• Algoritmus se zpětným postupem (řízená klas.)

• 2 vrstvy (Kohonenova a Grossbergova), které jsou

trénovány odděleně. Kohonenova - neřízená klasifikace na

vstupu, Grossbergova – řízená klasifikace na výstupu

• Alg. s obráceným postupem – síť tvořena vstupními uzly =

pixely. Následuje rozdělení do shluků, postupná agregace

až na tolik uzlů, kolik jich má požadovaný výstup.

Rozšíření per-pixel klasifikace

• Využití informací z okolí – po transformaci nová hodnota

v pixelu. = předzpracování obrazu

• Následně některá z klasifikačních metod

• Využití klasifikátorů prostorového chování – např.

texturální, prostorově kontextové

• snaha o využití dalších vlastností povrchů:

– textura

– příčinné vztahy

– kontext

– …

• rozpoznávání prostorových příznaků (spatial pattern recognition)

• zařazování do tříd s ohledem na souvislosti s okolím

• okolí se nezkoumá pomocí okna, nýbrž v celém rozsahu obrazu

• využití mapové algebry a operací analytických technik v prostředí GIS

Kontextuální klasifikátory

Kontextuální klasifikátory

• kontext a struktura

– vlastnosti používané při vizuální interpretaci

– charakterizovány topologickými charakteristikami:

• Vzdáleností - hledaný objekt se může nacházet jen v jisté vzdálenosti

od jiného objektu

• směrem příp. orientací - hledaný objekt se může nacházet jen v

určitém směru od jiného objektu

• Konektivitou - 2 objekty mohou / nemusí být spojeny jiným objektem

• dotykem (sousedství) - 2 objekty se mohou/nemusí dotýkat

• Vnořením – 1 objekt se musí /nesmí vyskytovat uvnitř jiného

Tvrdé vs. měkké metody

klasifikace obrazu

„Tvrdé“ klasifikátory

• tradiční metody klasifikace

• tvrdé (hard) klasifikátory

• každá klasifikační jednotka (pixel, segment) patří

právě do jedné třídy

• neřeší problém smíšených pixelů

„Měkké“ klasifikátory • alternativní a komplementární metody klasifikace

• každá klasifikační jednotka (pixel, segment) přísluší k

více než jedné třídě

• řeší problém smíšených pixelů

• stupeň příslušnosti (membership degree) pixelu ke

každé třídě ‹0;1›

• vztah k pravděpodobnosti a k důkazům

• možnost kombinace s vektorovými daty GIS –

získání dalších informací a důkazů

• ve finále možnost použití tvrdých klasifikátorů

Hodnocení klasifikace v jejím průběhu

• vylepšení klasifikace

– kombinace měkkých a tvrdých klasifikátorů

– měkké klasifikátory vypovídají o klasifikační nejistotě

– problémové případy – vysoká nejistota

• vysoká nejistota klasifikace když:

– se pixely jeví jako směs tříd – důvody:

• špatná tréninková data – data nemohou být oddělena

• smíšený projev na mikroskopické úrovni

– pixely náleží k neznámým třídám (neznámý spektrální

příznak)

• vytvořit novou třídu – získat tréninková data

Tvrdé vs. měkké klasifikátory

• výstupem klasifikace – obraz(y) příslušnosti k třídě

(class membership images)

– jedna (tematická) mapa – tvrdé klasifikátory

– více (tematických) map – měkké klasifikátory

Měkké klasifikátory

• odlišné metriky vyjádření příslušnosti (membership)

• Idrisi Selva (Taiga) – nabízí měkké klasifikátory,

založené na:

Bayesově teorii (BAYCLASS)

Dempster-Shaferově teorii (BELCLASS)

Mahalanobisově vzdálenosti

teorii fuzzy množin

modelu lineárního míchání

„Měkké“ klasifikátory

• výsledek klasifikace - obraz(y) příslušnosti k třídě

• v Idrisi uloženy do zásobníku - raster image group file

(.rgf)

• hodnoty obrazu příslušnosti lze získat pomocí dotazů

– numerických

– grafických

„Měkké“ klasifikátory

• obraz klasifikační nejistoty (Classification Uncertainty

image)

– vyjadřuje, do jaké míry je příslušnost daného pixelu k třídám

lepší/horší než příslušnost ostatních pixelů

– kde

max = maximum z množiny hodnot příslušnosti k třídám pro daný pixel

sum = součet množiny hodnot příslušnosti k třídám pro daný pixel

n = uvažovaný počet tříd

n

n

sum

CU1

1

max

1

Příklady klasifikační nejistoty

• příklad ohodnocení 3 tříd – následující snímek

• platí:

- hodnoty příslušnosti ‹0;1›,

- sum hodnot příslušnosti ≠ 1 AND sum hodnot

příslušnosti ‹0;1),

• význam klasifikační nejistoty:

- sběr nových důkazů (dat), je-li nejistota vysoká

- získání nových informací

Příklady klasifikační nejistoty CU

)0,00,00,1(

)05,005,09,0(

)0,01,09,0(

)1,03,06,0(

)0,03,06,0(

)3,03,03,0(

)1,01,01,0(

)1,00,00,0(

)0,00,00,0(

00,0

15,0

15,0

60,0

55,0

00,1

00,1

90,0

00,1

CU

CU

CU

CU

CU

CU

CU

CU

CU

BAYCLASS

• podobný klasifikátoru maximální pravděpodobnosti

(Maximum Likelihood Classifier )

• vyjadřují následnou pravděpodobnost (posterior

probability) s níž pixel přísluší ke každé třídě podle

Bayesovy pravděpodobnostní teorie

• vyjadřuje vztah mezi pravděpodobností a poměrem

šancí

• předpokládaná pravděpodobnost vychází z existujících

znalostí (např. existující tematické mapy)

BAYCLASS

• kde

p(h‌‌‌/e) = pravděpodobnost pravdivosti hypotézy dané důkazem

(posterior probability)

p(e‌‌‌/h) = pravděpodobnost zjištění, že důkaz daný hypotézou je

pravdivý

p(h) = pravděpodobnost, že je hypotéza pravdivá bez ohledu na

důkazy (prior probability)

i

ii hphep

hphepehp

).(

)().(

BAYCLASS

• p(e‌‌‌/h) - odvozena z kovariační matice tréninkových dat

• p(h‌‌‌/e) = (posterior probability)

– pravděpodobnost pravdivosti hypotézy dané důkazem

– považována za důkaz příslušnosti k třídě

• předpoklad – uvažované třídy jsou jediné možné třídy

• označuje pixely jako třídy i na základě slabých důkazů,

není-li podpora pro přiřazení k jiné třídě

• sub-pixelová klasifikace - výstupem oddělené obrazy

• BAYCLASS v Idrisi

– dobře zjišťuje základní složky smíšených pixelů

– nedobře zjišťuje správné proporce každé z tříd v mixelech

BELCLASS

• podobný klasifikátoru maximální pravděpodobnosti

• Dempster-Shaferova teorie (DST)

• DST rozvíjí a doplňuje BPT

– BPT – předpokládá, že neexistuje nevědomost – nedostatek!!!

– DST - připouští možnost neúplnosti stávajících informací

• nedostatek důkazů neznamená důkaz proti této hypotéze

BELCLASS • pojmy z DST – viz skripta Zpracování dat v GIS

BELCLASS • pojmy z DST

– interval důvěry (belief interval) <Bel(A); Pl(A)>

– Nejistota

• míra nejistoty hypotézy

• nedůvěra není doplňkem domnění!!!

BELCLASS

• DST

– vyjadřuje stupeň podpory pro všechny hypotézy, které ne mají

průnik s danou hypotézou (viz příklady)

– umožňuje snadno spojovat důkazy

– spojované důkazy

• musí být nezávislé

• nesmí být redundantní

BELCLASS

• Příklad pro BPT

• uvažujme 4 třídy

– důkazy podporují třídu 1 s mírou 0,3 a všechny ostatní s mírou 0

– výsledkem BPT by bylo označení pixelu v třídě 1 s výslednou

pravděpodobností 1,0

BELCLASS

• Příklad 1 pro DST


– důkazy podporují

• třídu 1 s mírou důvěry 0,3

• ostatní třídy (2, 3, 4) s mírou důvěry 0

– DST by označila pixel v třídě 1

• mírou důvěry = 0,3

• mírou uvěřitelnosti = 1

• v intervalu důvěry 0,7

– DST by označila pixel pro ostatní třídy (2, 3, 4)

• mírou důvěry = 0

• při míře uvěřitelnosti = 0,7

BELCLASS

• Příklad 2 pro DST


– důkazy podporují

• třídu 1 s mírou důvěry 0,3

• třídu 2 s mírou důvěry 0,6 (nový důkaz!!!)

• ostatní třídy (3, 4) s mírou důvěry 0

– DST by označila pixel v třídě 1

• mírou důvěry = 0,3

• mírou uvěřitelnosti = 0,4

• v intervalu důvěry 0,1

• očekávaným efektem při použití nových důkazů je

menší míra nejistoty

BELCLASS

• výstupy z klasifikačního algoritmu BELLCLASS

• pro každou z tříd je generován obraz:

– obraz důvěry (image of belief)

– obraz věrohodnosti (image of plausibility)

– obraz klasifikační nejistoty (classification uncertainty

image)

• hlavní důvod použití klasifikačního algoritmu

BELLCLASS

– kontrola kvality tréninkových dat (nechybí některá třída?)

– hodnocení provedeno v průběhu klasifikace

• při existenci domněnky výskytu neznámých tříd

– použití třídy „ostatní“

Porovnání BAYCLASS a BELCLASS

• použití klasifikačního algoritmu BAYCLASS

– důvěřuje síle tréninkových množin

– nepřipouští neznalost některých tréninkových množin

• použití klasifikačního algoritmu BELLCLASS

– je rezervovaný vůči významu tréninkových množin

– připouští neznalost některých tréninkových množin

Postklasifikační úpravy

1. Problémy ve velikosti vytvořených prostorových

útvarů

2. Problémy ve správnosti klasifikace

• Ad 1)

– A) roztříštěnost výsledných ploch

– Řešení např. Sieve filtrace

– B) Pepř a sůl - izolované pixely s odlišnou hodnotou

– Řešení např. nízkofrekvenční filtr – ale s logickým

operátorem, kvantilový apod. – modus, medián,..

Problémy postklasifikační filtrace

• klasifikovaný obraz obsahuje kvalitativní charakteristiky

• nebezpečí vzniku nové „informační třídy“

• modální filtr – vypočtená hodnota pixelu obsahuje hodnotu nejčastěji obsaženou pro danou polohu filtru (módus)

• možnost užití:

– odlišných vah

– vyloučení některých tříd

– vícenásobné filtrace

– kritéria minimální plochy

– zachování hranic mezi třídami

Vlastnosti postklasifikačních chyb

v obrazu

• chybně klasifikované pixely:

– souvisí především s určitými třídami

– se vyskytují především ve skupinách (málokdy

izolovaně)

– mají ve výsledném obrazu určité prostorové uspořádání

– váží se na typické části klasifikovaných ploch

Detekce klasifikačních chyb

• rozlehlá vodní plocha na vrcholech a svazích pohoří

– využití DMR

– chyba !! – pixely klasifikovány nesprávně

– jedná se o ledovec?

• lužní les ve značné vzdálenosti od vodních toků

– využití obalové zóny (buffer)

Odhad přesnosti klasifikace

• Testovací plochy

• Kontingenční tabulka

• Kappa index

© Dobrovolný

© Dobrovolný

Kappa index

© Dobrovolný

Documents

DZD DPZ 9 Klasifikace - homel.vsb.czhomel.vsb.cz/~hor10/Vyuka/DZDPZ/DZDDPZ9b.pdf · Algoritmus AMOEBA • parametrická metoda • amoeba = měňavka • parametrem proměnlivost