Upload
phungkhanh
View
225
Download
0
Embed Size (px)
Citation preview
EDCIA SKRPT
AUTOMATIZOVAN FOTOGRAMETRICK METDY
V PROCESE DIGITALIZCIE KULTRNEHO DEDISTVA
Marin Mari
S L O V E N S K T E C H N I C K U N I V E R Z I T A V B R A T I S L A V E2 0 1 9
Marin Mari
AUTOMATIZOVANFOTOGRAMETRICK METDY
V PROCESE DIGITALIZCIEKULTRNEHO DEDISTVA
Vetky prva vyhraden. Nijak as textu nesmie by pouit na alie renie akoukovek formou bez predchdzajceho shlasu autorov alebo vydavatestva.
Ing. Marin Mari, PhD.
Recenzenti: prof. Dr. Ing. Karel Pavelka prof. Ing. Pavel Barto, PhD.
Schvlila Edin rada Stavebnej fakulty STU v Bratislave. ISBN 978-80-227-4895-7
3
OBSAH
PREDSLOV ............................................................................................................................... 5
1 DIGITALIZCIA KULTRNEHO DEDISTVA ........................................................... 7
1.1 Platn legislatva pri ochrane pamiatkovho fondu SR ............................................... 7
1.2 Koncepty dokumentcie kultrneho dedistva ............................................................ 8
1.3 Merask metdy dokumentcie historickch objektov .............................................. 9
1.4 Vstupy meraskej dokumentcie ............................................................................. 13
2 FOTOGRAMETRICK METDY VYUITEN PRI DIGITALIZCII
KULTRNEHO DEDISTVA ........................................................................................ 14
2.1 Konvenn fotogrametrick metdy .......................................................................... 15
2.1.1 Jednosnmkov fotogrametria ........................................................................... 15
2.1.2Stereofotogrametria .......................................................................................... 16
2.1.3Panoramatick fotogrametria ............................................................................ 18
2.1.4Viacsnmkov konvergentn fotogrametria ...................................................... 19
2.2 Automatizovan neselektvne fotogrametrick metdy ............................................. 21
2.2.1Automatizovan rekontrukcia povrchu s prirodzenou textrou ...................... 21
2.2.2Skenovanie pomocou truktrovanho svetla .................................................. 24
3 AUTOMATIZOVAN REKONTRUKCIA SCNY A OBJEKTOV ZO SNMOK ... 26
3.1 Rekontrukcia scny .................................................................................................. 27
3.1.1 Interest opertory .............................................................................................. 28
3.1.2Detektory vznamnch bodov .......................................................................... 29
3.1.3RANSAC .......................................................................................................... 35
3.1.4SFM .................................................................................................................. 38
3.2 Podrobn rekontrukcia snmanho povrchu ............................................................. 48
3.2.1Loklne stereo-algoritmy .................................................................................. 50
3.2.2Globlne stereo-algoritmy ................................................................................ 51
3.2.3Multi-view stereo .............................................................................................. 53
4
3.2.4Zoznam aktulnych stereo- a MVS-algoritmov ............................................... 58
4 PRAKTICK APLIKCIE SFM V OBLASTI KULTRNEHO DEDISTVA ........... 64
4.1 Miniatrne objekty ..................................................................................................... 64
4.1.1Hlinen ndoba ................................................................................................. 65
4.1.2Kamenn peatidlo ........................................................................................... 67
4.2 Archeolgick nlezisk ............................................................................................ 67
4.2.1Sondy ................................................................................................................ 68
4.2.2Hroby, kostry .................................................................................................... 70
4.3 Fasdy historickch budov ......................................................................................... 72
4.4 Geodetick dokumentcia historickej budovy ........................................................... 73
4.5 Vyuitie RPAS pre dokumentciu hradov a pamiatok vekch rozmerov ................ 76
5 TESTOVANIE SYSTMU AGISOFT PHOTOSCAN ................................................... 78
5.1 Zkladnicov pomer .................................................................................................. 79
5.2 Uhol osi zberu voi snmkovanej ploche ................................................................. 82
5.3 Spracovanie ostrch hrn ........................................................................................... 84
5.3.1Prpad s rovnakou ohniskovou vzdialenosou a premenlivm GSD ................ 88
5.3.2Prpad s premenlivou ohniskovou vzdialenosou rovnak GSD ................... 92
5.4 Zhrnutie poznatkov z jednotlivch testov .................................................................. 93
6 NVRH ZBERU DAJOV PRE RZNE TYPY OBJEKTOV ...................................... 96
6.1 Ploch objekty ............................................................................................................ 97
6.1.1Dlh lniov objekty ......................................................................................... 99
6.2 Objekty uzatvoren zvonka ...................................................................................... 101
6.3 Objekty uzatvoren zvntra ..................................................................................... 103
7 ZOZNAM POUITEJ LITERATRY .......................................................................... 106
5
PREDSLOV
Nasledujci uebn text by mal sli najm tudentom bakalrskeho a ininierskeho
stupa tdia odboru Geodzia a kartografia, pretoe svojim obsahom sa zko dotka
problematiky preberanej v rmci predmetov Fotogrametria 1, Fotogrametria 2 a Aplikovan
blzka fotogrametria. Zrove je uren aj tudentom, ktor v rmci svojich bakalrskych
a diplomovch prc potrebuj zska prehad o aktulnom stave automatizovanej tvorby 3D
modelov na bze fotogrametrickho spracovania digitlnych snmok. Nosnou tmou je sce
digitalizcia kultrneho dedistva, avak uveden technolgie a algoritmy nachdzaj
uplatnenie v nespoetnom mnostve inch odvetv hospodrstva, ktor vyaduj priestorov
rekontrukciu povrchu objektov.
Text obsahuje nielen teoretick zklady automatickej orientcie snmok a generovania
podrobnch mraien bodov, ale s v om uveden aj konkrtne praktick prklady
vyuitenosti digitlnej fotogrametrie pri dokumentcii rznorodch objektov kultrneho
dedistva. S touto diverzitou svis aj potreba akceptovania zkladnch podmienok
a obmedzen, ktor m kad merask metda, fotogrametriu nevynmajc, a tak je
samostatn as venovan aj testovaniu limitov sasnch fotogrametrickch technolgi
a vobe optimlnych postupov pri fotogrametrickom meran a spracovan.
Autor akuje lektorom prof. Dr. Ing. Karlovi Pavelkovi a prof. Ing. Pavlovi Bartoovi,
PhD., za trpezlivos s prpravou textov a za upozornenia na chyby a nedostatky a doc. Ing.
Marekovi Fratiovi, PhD., za odborn rady a pripomienky.
Uebn text vznikol vaka podpore grantovho projektu agentry KEGA MVV SR
. 037STU-4/2016 Modernizcia a rozvoj technologickch zrunost vo vube geodzie a
fotogrametrie.
V Bratislave, oktber 2018 Ing. Marin Mari, PhD.
7
1 DIGITALIZCIA KULTRNEHO DEDISTVA
Vzhadom na irok uplatnenie digitlnej fotogrametrie pri digitalizcii kultrneho
dedistva, je na vod vhodn uvies aj ir pohad na problematiku kultrneho dedistva ako
takho. Pod pojmom kultrne dedistvo sa toti rozumej rznorod objekty, ktor svisia
napr. s kninicami, mzeami, archvmi, galriami, pamiatkami alebo audiovziami.
Dokumentcia tchto objektov v digitlnej podobe so sebou prina vea nespornch vhod
oproti doteraz zauvanm dokumentanm postupom. Tm sa mysl nielen na zjednoduenie
a zefektvnenie bibliografickch innost, kde bol rozsah a obsah bibliografickho textu
limitovan, ale aj na oblasti, v ktorch je potrebn zaznamena vzhad a tvar
dokumentovanch objektov v podobe obrazovch dt a 3D modelov. Cieom digitalizcie
v rmci informatizcie v poznatkovej spolonosti sa teda stva jednak uchovvanie, ale aj
sprstupovanie a najm vyuvanie digitlneho obsahu v rznych oblastiach ekonomiku,
vedu, inovcie, vzdelanie a kultru nevynmajc (KATUK, 2008).
1.1 Platn legislatva pri ochrane pamiatkovho fondu SR
Ochrana a obnova kultrneho dedistva je z hadiska slovenskej legislatvy rieen
Zkonom o ochrane pamiatkovho fondu . 49/2002 Z. z., ktor je vykonvan Vyhlkou
. 253/2010 Z. z. v znen neskorch predpisov.
Ochrana pamiatkovho fondu je v tomto zmysle shrnom innost a opatren
zameranch na identifikciu, vskum, evidenciu, zachovanie, obnovu, retaurovanie,
regenerciu, vyuvanie a prezentciu kultrnych pamiatok a pamiatkovch zem.
Medzi orgny ttnej sprvy na ochranu pamiatkovho fondu patria:
a) Ministerstvo kultry Slovenskej republiky,
b) Pamiatkov rad Slovenskej republiky,
c) krajsk pamiatkov rady.
Pri ochrane kultrnej pamiatky sa kladie draz na predchdzanie jej ohrozeniu,
pokodeniu, znieniu alebo odcudzeniu, na trval udranie jej dobrho stavu, vrtane jej
prostredia a na tak spsob vyuvania a prezentcie, ktor zodpoved jej pamiatkovej
hodnote a technickmu stavu.
8
Pod pojmom obnova kultrnej pamiatky sa mysl sbor pecializovanch odbornch
innost, ktormi sa vykonva drba, konzervovanie, oprava, adaptcia a rekontrukcia
kultrnej pamiatky alebo jej asti. Pre tieto innosti je vak vdy potrebn vyhotovi
pecifick formu dokumentcie. Vskumn dokumentcia pritom me by vyhotoven pre
umelecko-historick, architektonicko-historick, urbanisticko-historick a archeologick
vskum. Sasou umelecko-historickho a architektonicko-historickho vskumu je pri
nehnutenostiach aj ich podrobn zameranie (Vyhlka 253/2010 Z. z. 8 ods. 1 psmeno c).
Na tandardizciu vyhotovenia dokumentcie archeologickho vskumu bola
vypracovan aj Metodick pomocn intrukcia pre vypracovanie a posudzovanie
dokumentcie z archeologickch vskumov, platn od 1. aprla 2011.
Ete v r. 1966 boli na zabezpeenie odbornosti, kvality a hospodrnosti meraskej
dokumentcie strednou sprvou geodzie a kartografie vydan Smernice pre zameriavanie
pamiatkovch objektov a chrnench ast prrody. V smerniciach boli podrobne rozveden
geodetick metdy a v krtkosti naznaen aj monos vyuitia fotogrametrie (GL a kol.,
1967).
V nadvznosti na sasn technolgie, ktor prinaj mnostvo vhod z pohadu
efektvnosti a podrobnosti merania, vak iadna zvzn smernica neexistuje.
1.2 Koncepty dokumentcie kultrneho dedistva
Dleitm faktom, na ktor netreba zabda je, e dokumentcia je komplikovan
proces a zaha irok spektrum aktivt obsahujcich meranie, testovanie a monitorovanie a
zskavanie textovch a inch informci. Geometria objektu nie je jedinm parametrom, ktor
je potrebn zaznamena. Je potrebn bra ohad na vetky pecifikcie, ktor robia objekt
jedinenm a s zmyslupln, teda aj na vetky jeho potencilne hodnoty architektonick,
umeleck, historick, vedeck a socilne (www.photogrammetry.ethz.ch, 2011).
Smerodajn koncepty dokumentcie kultrneho dedistva mono napr. poda
(www.photogrammetry.ethz.ch, 2011) bliie pecifikova takto:
Objektivita objektivita je garanciou pevnch zkladov, na ktorch mono zhodnoti
monosti dokumentcie. Pouitie akhokovek pecifickho sboru dajov nutne ovplyvuje
kad rozhodovac proces spsob, akm je meranie vykonan, podstatne ovplyvuje alie
innosti.
9
Hodnota voba registrtora (archivra) je kritick. To, o sa dnes me povaova
za nezaujmav, me by zajtra extrmne hodnotn. Dleitos dkladnho zaznamenania je
zdrazovan benou stratou nepatrnch detailov, ktor sa mu strati pri novch
konzervanch prcach, vedc ku strate celistvosti alebo historickej evidencie.
Uebn proces meranie je uebn proces a je potrebn urit as kontaktu medzi
opertorom a objektom. Hlbie poznanie objektu umouje precznejie rozhodnutia.
Kontinuita na dokumentciu by sa nemalo nahliada ako na innos, ktor sa
vykonva iba v uritom obmedzenom ase. Preto by zkladnou poiadavkou malo by, aby
vsledky dokumentcie boli dostupn pre budce vyuitie.
truktra dokumentcia by sa nemala zastavi na povrchu. Je potrebn integrcia
s inmi dokumentanmi technikami.
Dokumentan srie informcie zskan dokumentciou mu ma vek rozsah a
rznorodos, preto je nutn organizova dostupn informcie, pre ktor je metrick meranie
prirodzenou podporou. Mu by pripraven srie tematickch kresieb (geometria,
materil,...). pecifick sria vytvoren jednm pecialistom me vies k hlbiemu pohadu
pre inch pecialistov pracujcich na inch srich.
Nadbytonos kad as informcie je spojen s uritou neistotou. Dokumentan
daje by mali by doplnen informciou o kvalite dajov. Kontroln procedry ponkaj
spsob prstupu ku kvalite.
Z uvedenho je zrejm, e dokumentcia kultrneho dedistva nie je jednoduch
zleitos a vyaduje si asto spoluprcu odbornkov z rznych discipln. Metda digitlnej
fotogrametrie v tomto prpade ponka svoje sluby v rznych rovniach a vo vetkch
monch kombincich komplexnosti objektov, vedeckch procedr, poiadaviek na kvalitu,
vyuitenosti finlnych produktov a samozrejme asovch a finannch obmedzen.
1.3 Merask metdy dokumentcie historickch objektov
Vyuitie geodzie a fotogrametrie a ich metd pri dokumentcii historickch objektov
sa poas dlhch rokov ich pouvania ukzalo ako vemi npomocn pri snahe o o
najpresnejie zaznamenanie ich tvaru a polohy. i u je poiadavkou tvorba vektorovho
plnu, 3D modelu alebo fotoplnu, nachdza geodzia a metdy s ou svisiace svoje
uplatnenie pri dokumentcii viny pamiatok, od miniatrnych soiek, cez obrazy
10
v galrich a nstenn relify a po vekorozmern stavby v podobe hradov a zmkov. Nie
kad metda je vak vhodn na meranie kadho objektu, a teda vber vhodnej metdy
podlieha pecifickm vlastnostiam predmetu merania, pri ktorom sa mu prejavi siln aj
slab strnky jednotlivch metd.
Existuj rzne technologick alternatvy pre merask metdy, pomocou ktorch
mono vykona merania historickch objektov. Medzi ne meme radi tieto:
Jednoduch merask metdy ide o o najpouvanej spsob merania. V tomto
systme s body meran priamymi vzjomnmi vzdialenosami (napr. meraskm psmom),
tto metda je vemi efektvne vyuvan pokia je oblas prstupn, nie prli vek
a zrove je prehadn vvoj prrunch elektronickch diakomerov s automatickou
kontrolou meran cel tento proces vrazne zjednoduil.
Dotykov metdy s zaloen na registrcii sradnc hrotu sondy dotkajceho sa
bodu, ktor treba odmera. Ide predovetkm o tzv. sradnicov meracie stroje, ktor
nachdzaj vyuitie pri mench objektoch, napr. archeologickch artefaktoch.
Tachymetria metda vyuvajca meranie priestorovch sradnc bodu (priestorov
polrna metda) pomocou prstrojov na to urench univerzlnych meracch stanc a pod.
Najastejie sa pri meran historickch objektov pouva bezhranolov meranie, kde s
meran daje zskavan bez dotyku s objektom.
Blzka fotogrametria je metda umoujca vykonva merania na snmkach,
potaovo asistovan analytick fotogrametria spsobila revolun zmeny v tomto odvetv.
Digitlne snmky, i u zo CCD kamier alebo z naskenovanch fotografi, umouj
vytvorenie digitlneho modelu objektu, o je proces vrazne efektvnej, ne tradin
analgov fotogrametria.
Skenery pre blzke vzdialenosti skenovanie je metda zskavania bodov z objektu
automaticky bez priameho kontaktu s nm, s monosou vytvorenia jeho trojrozmernho
modelu v potai. Existuje vea rznych druhov skenerov, najznmejie s laserov skenery
a fotogrametrick (tzv. triangulan) skenery na bze truktrovanho svetla.
Globlne navigan satelitn systmy (GNSS) umouj zskanie decimetrovej a
milimetrovej presnosti v polohe meranch bodov v zvislosti od pouitej metdy merania
a vybavenia. Vemi uiton sa ukzalo ich vyuitie pri meran historickch objektov
11
rozloench na rozahlch oblastiach, resp. na meranie kontrolnch (vlcovacch) bodov pre
spracovanie fotogrametrickch leteckch alebo satelitnch snmok.
Leteck a bezpilotn fotogrametria je uznvan metda merania tandardne pre
oblasti s vou rozlohou. Je vyuvan najm pri topografickom mapovan v rznych
mierkach.
Diakov prieskum (Remote Sensing) je vemi uiton metda merania pomocou
satelitov, pokrvajc rozahl oblasti. Snmkovacie a vpotov techniky sa tu prekrvaj
s digitlnou fotogrametriou.
Mikrogravimetria geofyziklna metda zaoberajca sa anomliami v tiaovom poli
na zemskom povrchu, vyuvan najm na prieskum podzemnch dutn akhokovek pvodu.
Pozemn prienikov radar (GPR) geofyziklna metda vyuvajca radarov pulzy
na zobrazenie oblast pod povrchom na zklade odrazench signlov elektromagnetickho
iarenia v mikrovlnnom psme rdiovho spektra.
Metda geoelektrickho odporu umouje rozliova horninov tvary na zklade
rozdielneho mernho odporu, permitivity alebo elektrochemickej aktivity.
Rdionuklidov metdy (gamma iarenie) vyuvaj premeny jadier atmov,
jadrov iarenie a psobenie jadrovho iarenia na hmotu, op vyuiten aj pri
geologickch aplikcich a archeolgii.
Na Obr. 1.1 s vybran metdy merania zoraden poda mierky finlneho dokumentu,
ktor je sasne funkciou vekosti objektu a dosiahnutenej rovne detailov.
12
Obr. 1.1. Vber vhodnch meraskch metd v zvislosti od vekosti objektu
a komplexnosti (BHLER, 2005)
Komplexnos merania me by vyjadren mnostvom zaznamenanch bodov od
jednho bodu opisujceho geografick polohu artefaktu, cez tiscky bodov typick pre CAD-
kresby budov alebo topografickch situci, a po miliny bodov na opsanie celkovho
povrchu sochy alebo digitlneho modelu ternu.
Okrem vekosti objektu a komplexnosti vplvaj na vber vhodnej metdy merania aj
in faktory. Sem patria: poadovan presnos a rozlenie, prstupnos objektu a monos
idelneho rozloenia observanch stanc, dostupnos prstrojov a prsun energie, monos
dotkn sa objektu a povolenie poui zvolen metdu.
Vzhadom na rzne obmedzenia, i siln alebo slab strnky jednotlivch metd, je
vhodn metdy aj navzjom kombinova, a tak poui napr. terestrick laserov skenovanie
na skenovanie interiru pamiatky, fotogrametriu na meranie jej vonkajch fasd, priestorov
polrnu metdu na zvenie presnosti a sdrnosti jednotlivch meranch celkov pomocou
vlcovacch bodov a GNSS meranie na transformciu vslednho modelu do referennho
sradnicovho systmu.
Kee tto prca sa zaober predovetkm fotogrametrickmi metdami vyuitenmi
pri dokumentcii historickch objektov, podrobne sa bude v alch kapitolch venova prve
technolgim zaloenm na spracovan obrazu.
13
1.4 Vstupy meraskej dokumentcie
V sasnosti v SR neexistuje nijak metodick nvod, ktor by sa venoval vhradne
meraskej dokumentcii objektov kultrneho dedistva. Mono vychdza iba zo vzorov
vypracovanch v minulosti pecializovanmi intitciami, prpadne uebnch textov napr.
Fakulty architektry STU v Bratislave. Pri vzoroch ide napr. o zamerania architektonickch
detailov, ktor v 80. rokoch dvadsiateho storoia spracovval Projektov stav kultry
Bratislava (dvere, kovania, mree, brny, okenn vplne at.) alebo zamerania katieov
vykonan n. p. Geodzia Bratislava.
Naproti tomu, v susednej eskej republike m dokumentcia objektov kultrneho
dedistva pevn zklady a mono sa tak oprie aj o aktulne publikcie, ako napr. (BEZDK
& FROUZ, 2014), (VESEL, 2014) alebo (BEZDK a kol., 2011).
Vstupy zva predstavuj vkresy v rozlinch mierkach v zvislosti od typu
a vekosti objektu digitlne 3D modely sa zatia ako vstup bene nepouvaj, slia skr
len ako medziprodukt na dosiahnutie inch vsledkov (2D vkresov dokumentcia,
ortofotomozaiky) a aj ke sa v oblasti dokumentcie slovenskch pamiatok povauj za
perspektvne, cieovou skupinou je skr len laick verejnos.
V zsade to pre geodetov znamen, e k pamiatkovmu objektu nemono pristupova
iba ako k predmetu, ktor je potrebn zamera s uritm rozlenm a presnosou, ale je
potrebn kls draz aj na jeho funkn kontrukciu. Konzultcia s odbornkmi na dan
objekt merania je v tomto prpade skutone na mieste.
14
2 FOTOGRAMETRICK METDY VYUITEN PRI DIGITALIZCII KULTRNEHO DEDISTVA
Fotogrametria je u tradin metda pri snahe o rekontrukciu historickch objektov
a umeleckch diel. Prv architektonick aplikcie merania fasd pochdzaj u z roku 1860
od architekta Meydenbauera, ktor sa na zklade vlastnej neprjemnej sksenosti rozhodol, e
dokumentova fasdy katedrl je bezpenejie meranm na snmkach a nie priamo na objekte.
S postupnm zdokonaovanm technolgi sa pri tejto metde dosahuje stle vyia presnos,
narast kvalita a rchlos spracovania vsledkov.
V sasnosti je vstupom zvyajne 2D alebo 3D vektorov formt, priestorov
sradnice meranch bodov a ortofotopln, ktorho hodnota je o to vyia, pretoe poskytuje
cenn informcie uschovan v textre povrchu (farba, drobn trhliny, pokodenia,...).
Na dokumentciu historickch objektov sa vyuva najm blzka pozemn
fotogrametria, ie snmkovanie zo vzdialenost v rozmedz desiatok centimetrov a 300 m od
objektu. Vaka menm vzdialenostiam a vysokej rozliovacej schopnosti sasnch
digitlnych kamier mono dosiahnu vysok presnos pri tvorbe 3D modelov. Zkladom
pouitia akejkovek fotogrametrickej metdy je vak vdy nutnos kalibrcie fotografickho
systmu, priom pod pojmom kalibrcia sa rozumie urenie prvkov vntornej orientcie
kamery, medzi ktor patria: ohniskov vzdialenos, sradnice hlavnho bodu a prvky
radilnej a decentranej distorzie, prpadne alie prdavn parametre.
Existuje irok rozptie fotogrametrickch metd, pomocou ktorch mono urova
rovinn alebo priestorov sradnice bodov objektov. Ich presnos je zvisl od mierkovho
sla snmky, od pouitej kamery, zvolenej metdy ako takej, spsobu kalibrcie kamery,
presnosti referennch bodov a samozrejme od spsobu spracovania dajov.
Jednotliv fotogrametrick metdy mono deli poda rznych aspektov, napr. poda
polohy kamery voi objektu, poda predmetovej vzdialenosti, poda potu kamier alebo
poda metodiky spracovania snmok. Vzhadom na to, e cieom tohto textu je oboznmi
itatea najm s automatizovanmi fotogrametrickmi metdami, ktor vo vekej miere
vyuvaj prirodzen textru snmanho povrchu, s ostatn metdy uveden iba
v nasledujcom strunom prehade a nosnej tme bude venovan samostatn kapitola.
15
2.1 Konvenn fotogrametrick metdy
Kee majoritn as fotogrametrie svis so spracovanm obrazu a nielen s jeho
zaznamenanm, za najzkladnejie delenie fotogrametrickch metd mono povaova
delenie poda pouitch matematickch modelov spracovania. Akkovek in delenie, napr.
poda polohy kamery (leteck, pozemn,...) alebo predmetovej vzdialenosti (druicov,
leteck, bezpilotn, blzka, vemi blzka alebo makrofotogrametria) je z tohto pohadu
bezpredmetn a svis skr len s podrobnosou, presnosou a aplikanmi oblasami
vstupov.
2.1.1 Jednosnmkov fotogrametria
Za najjednoduchiu z fotogrametrickch metd mono povaova jednosnmkov
fotogrametriu, inak nazvan aj projektvnu. Vyuva matematick model projektvnej
transformcie medzi dvoma rovinami odvoden z projektvnej geometrie alebo centrlnej
projekcie roviny:
,1
,1
21
210
21
210
ycxcybxbbY
ycxcyaxaaX
(2.1)
kde x, y s obrazov sradnice, a0 - c2 s koeficienty projektvnej transformcie a X, Y
s referenn sradnice bodov rovinnho objektu. Referenn presnos mX,Y je v prpade
digitlnej snmky zvisl od mierkovho sla snmky Ms, vekosti obrazovho elementu P na
snmai, presnosti merania obrazovho elementu mpix a stoenia snmky voi pozorovanej
rovine. V praxi je vdy snaha o dodranie o najmench sklonov snmky, vaka omu
mono docieli kontantn presnos po celej ploche snmky. Mono ju vyjadri
prostrednctvom jednoduchho vzahu (FRATIA, 2008):
pixSYX mPMmm (2.2)
Kee projektvna transformcia plat exaktne iba pre projektvny vzah dvoch rovn, je
potrebn vdy zvi aj vplyv nerovinnosti objektu. Vetky odchlky objektu od roviny toti
spsobuj radilny posun na snmke, ktor potom ovplyvuje polohu bodov v referennom
systme (Obr. 2.1).
16
Obr. 2.1. Vplyv nerovinnosti objektu (LUHMANN, 2006)
Radilnu odchlku r mono poda Obr. 2.1 vyjadri tmto vzahom (LUHMANN,
2006):
crhr
, (2.3)
kde c predstavuje kontantu kamery (ohniskov vzdialenos), r je radilna vzdialenos
meranho bodu od stredu snmky v snmkovej rovine a h odahlos meranho bodu P od referennej roviny v smere osi zberu.
Jednosnmkov fotogrametria teda nachdza uplatnenie predovetkm pri tvorbe
fotoplnov rovinnch objektov, ako s napr. fasdy budov. V praxi sa mono stretn
s rznymi upravenmi pomckami na vyuitie jednosnmkovej fotogrametrie, napr. s rznymi
variantmi monopodickch statvov a visutch ramien, pomocou ktorch je mon dosta
zavesen kameru do dostatonej vky (4 a 5 m) nad snmkovan sondu archeologickho
nleziska, aby sa radilny posun prejavil v akceptovatenej miere.
2.1.2 Stereofotogrametria
Pomocou stereofotogrametrie u mono vyhodnoti body na snmkovanom objekte
nielen rovinne, ale priestorovo. S ohadom na vzjomn orientciu snmok stereodvojice
mu nasta tri rzne prpady:
17
normlny prpad (Obr. 2.2)
stoen prpad,
a mierne konvergentn, resp. divergentn snmky.
Najastejie sa v praxi vyuva normlny prpad, pre svoju jednoduchos analytickho
spracovania. Stereofotogrametria umouje mera priestorov sradnice priamo
v referennom systme a kee sasnm trendom vo vvoji automatizovanch
fotogrametrickch systmov je prve minimalizcia zsahov vyhodnocovatea do procesov
tvorby priestorovch modelov, s vytvran napr. digitlne modely plne automatizovane
prostrednctvom pecilnych digitlnych pracovnch stanc (fotogrametrickch softvrov)
(FRATIA, 2008).
Obr. 2.2. Normlny prpad stereofotogrametrie Presnos stereofotogrametrie pre normlny prpad mono vyjadri poda vzahov:
PMm sZX 7,0, , (2.4)
byPMm sY 5,0 , (2.5)
kde y je predmetov vzdialenos, b je dka snmkovacej zkladnice, P je vekos
obrazovho elementu a Ms je mierkov slo snmky.
18
2.1.3 Panoramatick fotogrametria
V pecilnych aplikcich nachdzaj vyuitie tzv. panoramatick kamery. Pomocou
nich je mon napr. zameranie uzavretch vntornch priestorov alebo nmest. Princp
panoramatickch kamier spova v 360 rotcii linerneho CCD senzora a alom spracovan
obrazovch dajov prostrednctvom priestorovho pretnania a transformci medzi
objektovm sradnicovm systmom, kartezinskym a valcovm s. s. kamery a pixelovm
s. s. CCD senzora (Obr. 3.3 a 3.4) (LUHMANN, 2006).
Obr. 2.3. Znzornenie sr. systmov (LUHMANN, 2006)
Obr. 2.4. Znzornenie sr. systmov (LUHMANN, 2006)
Tvorba panoramatickch snmok je v sasnosti mon pravdae aj s pouitm benej
digitlnej kamery so znmymi prvkami vntornej orientcie a pecilneho softvru, ktor
doke zo srie snmok s dostatonm prekrytom vytvori ponoramatick obraz (Obr. 2.4).
Na internete je dostupn nespoetn mnostvo programov, ktor s bu priamo uren na
tvorbu panoramatickch fotografi, alebo ponkaj tto monos ako doplnkov funkciu.
19
Obr. 2.5. Panoramatick snmka interiru kostola Sv. Petra v Salzburgu
(wikimedia.org, 2009)
2.1.4 Viacsnmkov konvergentn fotogrametria
V sasnosti najpouvanejou fotogrametrickou metdou je konvergentn snmkovanie
so veobecnou orientciou osi zberu. Ide o viacsnmkov metdu (Obr. 2.6), ktor vyaduje
pre analytick spracovanie pecilny fotogrametrick softvr. Najvou vhodou
konvergentnho snmkovania, v porovnan napr. so stereofotogrametriou, je prve spomnan
veobecn poloha os zberov kamier (pravdae vdy v snahe o dodranie dostatonho
prekrytu snmok a aby objekt na snmkach zaberal o najviu plochu) a tak pomocou tejto
metdy mono mera objekty ubovonch tvarov a rozmerov.
Obr. 2.6. Konvergentn snmkovanie (LUHMANN, 2006)
Vyuvan je matematick model perspektvnej transformcie, ktorm je vyjadren
podmienka kolinernosti:
,
,
033023013
0320220120
033023013
0310210110
ZZmYYmXXmZZmYYmXXmcyy
ZZmYYmXXmZZmYYmXXmcxx
(2.6)
20
kde x, y s snmkov sradnice, X, Y, Z, s referenn sradnice, x0, y0 s sradnice
hlavnho snmkovho bodu, m11-m33 s prvky ortogonlnej rotanej matice a X0, Y0, Z0 s
sradnice projeknho centra.
Konvergentn snmkovanie je ako metda zrove aj najpresnejia, pretoe tu
vzhadom na v poet snmok dochdza k preureniu urovanch sradnc bodov.
Z hadiska prcnosti je vak nronejia ne napr. stereofotogrametria, avak tento nedostatok
je rieiten prve vaka vyuitiu vhod digitlnej fotogrametrie a monosti iastonej alebo
plnej automatizcie spracovania na digitlnej pracovnej stanici. Pod tmito vhodami s
myslen napr. automatick meranie umelch terov, automatick identifikcia kdovch
terov, automatick vyhadanie identickch bodov na rznych snmkach alebo automatick
tvorba TIN modelu (FRATIA, 2008).
Ako u bolo povedan, presnos konvergentnho snmkovania sa zvyuje
s narastajcim potom snmok, predovetkm z rznych stanovsk. Vsledn polohov
presnos mono teda vyjadri poda tohto vzahu (FRATIA, 2008):
,pvomMm pxsp (2.7)
kde pxm je presnos merania obrazovch sradnc, o je faktor kvality prieseku a zvis
od uhla prieseku urujcich lov a ich potu na danom bode, v je deforman faktor a uruje
skrtenie a stoenie objektu ako vonej siete a p je faktor potu a rozloenia vlcovacch
bodov.
Pokia bude do vahy bran aj skutonos, e z jednho stanoviska bolo vyhotovench
viac snmok, bude pre presnos mp plati poda (HANZL & SUKUP, 2001) priblin vzah:
,k
qmMm pxsp
(2.8)
kde q je konfiguran faktor, ktor vyjadruje tuhos siete a pohybuje sa v hodnotch
medzi 0,4 a 0,7 a k je poet snmok vyhotovench z jednho stanoviska.
Pri dodran optimlnych podmienok snmkovania vak mono poui na vpoet
aprirnej presnosti zjednoduen vzah:
,.... pxpxsp mPfhmPMm (2.9)
21
kde Ms je mierkov slo snmky, P vekos pixelu na CCD senzore, h vzdialenos
snmkovania, f ohniskov vzdialenos a pxm presnos urenia obrazovch sradnc.
Pri manulnom meran obrazovch sradnc sa presnos merania pohybuje od 1 do 3
pixelov v zvislosti od kvality signalizcie, pri automatickom meran je presnos merania 0,1
a 0,3 pixela.
2.2 Automatizovan neselektvne fotogrametrick metdy
Doteraz spomnan fotogrametrick metdy merania mono oznai pojmom
selektvne, kee vber meranch bodov zvis od interpretcie vyhodnocovatea v snahe
o o najhodnovernejie vystihnutie tvaru objektu prostrednctvom lomovch bodov,
charakteristickch hrn a plch. S lenitosou objektu vak prirodzene narast prcnos
takhoto spsobu spracovania a vyui v tomto prpade monosti iastonej alebo plnej
automatizcie zberu dajov sa pri digitlnej fotogrametrii ponka ako vhodn rieenie.
Vzhadom na vsledn produkt takhoto spracovania mrano bodov mono tieto metdy
popsa aj ako skenovanie obrazom, ie vytvorenie skenov (podrobnch mraien bodov)
na zklade spracovania obrazu. Aj tto technolgia vak pozn rzne prstupy, a tak meme
zska mrano bodov objektu bu isto na zklade spracovania jeho snmok, analzou
prirodzenej povrchovej textry, alebo vyui napr. tzv. truktrovan svetlo a triangulciu
medzi projektorom a kamerou, ktor snma objekt.
2.2.1 Automatizovan rekontrukcia povrchu s prirodzenou textrou
Technolgia automatizovanej rekontrukcie povrchu zo snmok umouje neselektvny
zber dajov s vysokm rozlenm, a to zva na princpe obrazovej korelcie medzi dvoma
a viacermi paralelnmi snmkami objektu. Vsledkom je potom priestorov mrano bodov
opisujce tvar povrchu objektu.
Cieom obrazovej korelcie je njs polohu urovanho bodu na jednej aj druhej
snmke stereoskopickej dvojice za predpokladu podobnosti obrazov. Pokia by vekos
hadanho obrazovho elementu bola 1 pixel, vsledkom by bolo enormn mnostvo alch
1-pixelovch elementov, pretoe digitlne snmky sa zvyajne skladaj z milinov pixelov,
medzi ktormi sa urite njde vea elementov s rovnakmi alebo podobnmi vlastnosami
(v zvislosti od korelanho koeficientu). Teria korelcie obrazu teda vychdza z
predpokladu, e kad z pixelov digitlneho obrazu m svoje pecifick okolie, ktor je do
22
uritej miery jedinen. m vie okolie sa vezme do vahy, tm via bude jeho
jedinenos a o to jednoznanejie bude urenie polohy elementu. Ak je vak objekt prli
lenit, prli vek vyhadvacia matica me produkova chybn vsledky alebo nenjde
dostaton poet bodov kvli nzkej korelcii. Nastavenia vpotu korelcie obrazu teda treba
prispsobi druhu objektu, ktorho model sa takmto spsobom sname zska a aj rovni
konvergencie v rmci stereoskopickej dvojice snmok.
Pre dosiahnutie hodnovernch a dostatone presnch vsledkov korelcie, pri
spracovan napr. v softvri PhotoModeler Scanner, je potrebn dodra niekoko zkladnch
podmienok pri snmkovan:
snmky objektu musia by vyhotoven s dostatonm prekrytom,
osi zberov kamier musia by pribline paraleln, prpadne mierne
konvergentn,
pomer medzi snmkovacou zkladnicou b a vzdialenosou od objektu h by sa
mal pohybova v rozmedz b/h = 0,1 a 0,5 (idelne 0,25 ako je na Obr.2.7)
povrch objektu mus obsahova nepravideln zreten textru,
obe snmky by mali by vyhotoven za rovnakch svetelnch podmienok, poda
monosti bez pouitia blesku, aby nedolo k zmene textry alebo odleskom.
Obr. 2.7. Pomer medzi zkladnicou a objektovou vzdialenosou pri obrazovom
skenovan
Princpy tzv. potaovho videnia (computer vision) vak v sasnosti umouj
automatizova nielen tvorbu mrana bodov z orientovanej dvojice snmok, ale spracova aj
krok predchdzajci vykonanie vonkajej orientcie snmok a kalibrcie kamery. V tomto
prpade je potrebn, aby cel sria susednch snmok spala vyie uveden parametre, aby
b/h = 0,25
b
h
23
softvr dokzal medzi snmkami njs dostaton mnostvo tzv. features (charakteristickch
bodov).
V zvislosti od typu objektu je potom odporan zabezpei aj vhodn polohu
a orientciu kamier. Zjednoduene mono rozdeli zkladn typy objektov do tchto troch
skupn:
rovinn (fasdy,...),
uzatvoren (interir,...),
izolovan objekty (sochy,...).
Polohy a orientcie kamier pre jednotliv prpady s znzornen na Obr. 2.8 a 2.10.
Obr. 2.8. Snmkovanie fasdy (vavo nesprvne, vpravo sprvne) (www.agisoft.com,
2018)
Obr. 2.9. Snmkovanie interiru (vavo nesprvne, vpravo sprvne) (www.agisoft.com,
2018)
Obr. 2.10. Snmkovanie izolovanho objektu (vavo nesprvne, vpravo sprvne)
(www.agisoft.com, 2018)
24
Nakoko prve oblas potaovho videnia m vo fotogrametrii subn budcnos
a v sasnosti vemi irok vyuitie, bude tto problematika rozobrat podrobnejie
v samostatnej kapitole . 3: Automatizovan rekontrukcia scny a objektov zo snmok.
2.2.2 Skenovanie pomocou truktrovanho svetla
Kombincia fotogrametrie a projektovania tzv. truktrovanho svetla na objekt je jedna
z alch monost ako zska trojrozmern model meranho objektu na zklade obrazovch
dt. Vzorka, ktor je premietan na povrch, sa meria a tm je definovan model povrchu,
priom meme rozli dva hlavn prstupy (LUHMANN, 2006):
Aktvna projekcia vzorky geometria projektovanej vzorky je znma a pouva sa vo
vpote. Tto znma geometria zaha vntorn a vonkajiu orientciu projektora
a informciu o vzorke, napr. rozostup a vlnov dku projektovanch prkov. Minimlne
jedna orientovan kamera sa pouva na registrciu signlu odrazenho od povrchu objektu.
Tvar povrchu me by rekontruovan fzovm alebo paralaxovm meranm.
Pasvna projekcia vzorky je poadovan znalos kalibrcie a orientcie projektora
alebo geometrie povrchu. Vzorka jednoducho poskytuje viditen truktru definujcu
povrch. Rekontrukcia objektu je vykonvan fotogrametricky porovnvanm snmok
z minimlne dvoch kamier, ktor zaznamenvaj reflektovan povrch.
Obr. 2.11. Metda merania so truktrovanm svetlom (LUHMANN, 2006)
25
Tieto dva prstupy mu by kombinovan. Naprklad rchla aktvna projekn metda
me by aplikovan na hrub meranie povrchu, ktor je potom zjemnen pouitm viacerch
kamier a pasvneho osvetlenia. Tak isto mu by tieto prstupy kombinovan s benmi
bodovo zaloenmi fotogrametrickmi meracmi metdami (LUHMANN, 2006).
Pouitie truktrovanho svetla poskytuje absoltnu metdu merania prkovej
projekcie. Projektor generuje m kdovanch prkov sekvenne, take kolmo na smer
prkov xp me by identifikovanch celkom 2m rznych projeknch smerov
prostrednctvom m-digitlnych kdovch vrazov. Zskanch m snmok je binarizovanch
a s uloen ako bitov daje 0 alebo 1 m-bit-hlbokej pamte. Preto kad siv hodnota na
pozcii (x, y) dva pecifick smer projekcie xp z Op (LUHMANN, 2006).
Prstroje vyuvajce technolgiu truktrovanho svetla alebo projekcie laserovej
vzorky sa nazvaj triangulan skenery a s vemi asto vyuvan v strojrenskom
priemysle, pri reverznom ininierstve, ale aj pri digitalizcii archeologickch artefaktov.
Ponuka skenerov zaloench na spracovan obrazu je v sasnosti na trhu vemi irok.
Spolonou vlastnosou tchto zariaden je, e sa pouvaj na skenovanie prevane mench
objektov, avak vaka pecializovanmu prsluenstvu mono menie skeny z krtkych
vzdialenost spja do vch celkov. Pritom sa pri skenovan bene pouva pracovn
vzdialenos od objektu v rozmedz pribline 0,3 a 1 m s ohadom na pouit optick sstavu
kamery. Presnos generovanho 3D modelu pritom me dosahova rove 0,1 a 0,01 mm
a je teda vhodn ich v kultrnom dedistve vyuva najm na digitalizciu drobnch
archeologickch nlezov.
Obr. 2.12. Triangulan skenery COMET LD (vavo) (www.steinbichler.com)
a GOM ATOS (vpravo) (www.gom.com)
26
3 AUTOMATIZOVAN REKONTRUKCIA SCNY A OBJEKTOV ZO SNMOK
Sasn metdy spracovania obrazu do podoby 3D modelov u svisia viac
s programovanm, ne so samotnou fotogrametriou. Zrove si treba uvedomi, e drviv
vina bene pouvanch termnov v tejto oblasti vychdza z anglickho jazyka a ich silen
preklad do sloveniny me by diskutabiln, viaczmyseln, a teda aj kontraproduktvny.
Z tohto dvodu bud nzvy niektorch algoritmov ponechan len v pvodnej anglickej forme,
prpadne s priblinm slovenskm vznamom.
Softvry vyuvajce tzv. potaov videnie na tvorbu 3D modelov maj v sasnosti
vemi irok uplatnenie v oblastiach od leteckho mapovania, tvorby DMP (digitlneho
modelu povrchu) a ortofotoplnov, cez automatizovan tvorbu textrovanch 3D modelov
ubovonch objektov (na ich rekontrukciu, dokumentciu alebo prezentciu), a po vysoko
presn neselektvne merania deformci. Nespornou vhodou tohto spsobu spracovania s
pomerne nzke finann nklady na vybavenie (softvr + hardvr).
Ponuka softvrov umoujcich plne automatizovan spracovanie snmok do podoby
3D modelov je na trhu vemi pestr, od vone poskytovanch webovch aplikci (ARC3D
Webservice, Regard3D, v minulosti aj Microsoft Photosynth, Autodesk 123D Catch alebo
Hyper3D), cez samostatn programy distribuovan pod GPL (general public license) ako je
VisualSFM, open source rieenia ako napr. Meshroom, a po komern softvry typu Agisoft
PhotoScan, PhotoModeler Scanner, Autodesk ReCap Photo, Bentley Context Capture, Reality
Capture, 3DF Zephyr a pod. Okrem softvru u sta vlastni iba kvalitn digitlnu kameru
(najastejie digitlnu zrkadlovku) a dostatone vkonn pota. Napokon sa mono dosta k
nkladom, ktor asto predstavuj iba zlomok ceny laserovch alebo triangulanch
skenerov. Pritom asov nronos spracovania zvis predovetkm od vkonnosti potaa
(najm od procesora a pamte RAM).
Celkov problm automatizovanho spracovania snmok do podoby 3D modelov
mono rozdeli na dve zkladn asti, ktor bud podrobnejie rozobrat v nasledujcich
podkapitolch:
1. rekontrukciu scny ie vpoet vzjomnej orientcie snmok, kalibrciu
kamery a tvorbu zjednoduenho mrana tzv. spojovacch bodov (tie points),
ktor pribline opisuj tvar objektu,
27
2. a podrobn rekontrukciu snmanho povrchu teda vpoet hustho mrana
bodov pokrvajceho objekt, ktor mono z hadiska podrobnosti porovna
napr. s laserovm skenovanm.
3.1 Rekontrukcia scny
Automatizcia orientcie snmok svis hlavne s termnom tzv. provania snmok
(image matching), poas ktorho sa identifikuj a jednoznane pruj identick prvky objektu
(body, vzorky, rohy,...) na dvoch alebo viacerch snmkach. V zahraninej literatre sa
procedry sliace na identifikciu prirodzench korepondenci medzi snmkami oznauj
ako feature-based matching procedures.
Analza korepondujcich bodov/prvkov je jedna z najkomplikovanejch loh
potaovho videnia a je vemi zvisl od truktry snmanho objektu. Hadanie
korepondenci me by pritom komplikovan rznymi problmami, ako napr.:
z dvodu zkrytu nemusia ma body na jednej snmke svoj korepondujci
obraz na inej snmke,
pri nejednoznanch povrchovch truktrach alebo priehadnch povrchoch
me vznikn viacero kandidtov na obraz jednho bodu z referennej snmky,
v oblastiach so slabou textrou sa me sta rieenie nestabiln alebo citliv
napr. voi umu v obraze.
Rekontrukcia scny je potom realizovan v procese znmom ako SfM (Structure from
Motion), v ktorom je zo snmok sptne rekontruovan hrub truktra scny na zklade
pohybu kamery voi vyhodnocovanmu objektu. Na extrakciu vznamnch prvkov s
vyuvan tzv. interest (zujmov) opertory, hranov opertory alebo tzv. detektory, ktor
priamo pridvaj pecifick opisn informciu k vznamnmu prvku, aby ho bolo mon
identifikova aj na inch snmkach. A kee tieto merania asto obsahuj hrub chyby, resp.
odahl merania, je potrebn do rekontrukcie scny z takchto dt zakomponova aj
filtrovacie a vyhladzovacie algoritmy ako je napr. RANSAC (random sample consensus).
V alch podkapitolch bud teda najskr vysvetlen jednotliv iastkov lohy (detekcia
vznamnch prvkov, RANSAC), ktor s potrebn na rekontrukciu scny a a zver bude
venovan samotnmu procesu SfM.
28
3.1.1 Interest opertory
Interest opertory s algoritmy pouvan na extrakciu vznamnch obrazovch bodov,
ktor s potencilne vhodnmi kandidtmi na provanie snmok. Vhodnmi kandidtmi sa
myslia body, ktor maj svoje charakteristick okolie (vzorky textry v odtieoch sivej farby)
a je pravdepodobn, e bud podobne vyzera aj na susednch snmkach. Interest opertory
uruj pre kad pixel jeden alebo viac parametrov (tzv. interest hodnt), ktor mu by
neskr pouit na hadanie zhd (v procese znmom ako feature matching).
Jednm z prvch takchto opertorov bol tzv. Moravcov opertor.
Moravcov opertor bol predstaven Hansom Moravcom v roku 1977 (MORAVEC,
1977). Pota stredn kvadratick sumy gradientov v tyroch hlavnch smeroch okna
s vekosou k x l. Pokia hodnota prekro urit hranicu, ide o vznamn bod.
Implementcia Moravcovho opertora je pomerne jednoduch a nie je nron na as
vpotu. Nie je vak invariantn voi rotcii a jeho presnos sa pohybuje okolo 1 pixela.
Plessy bodov detektor inak nazvan aj Harrisov detektor hrn, bol predstaven
v roku 1988 Harrisom a Stephensom (HARRIS & STEPHENS, 1988). Harrisov detektor
vychdza z Moravcovho opertora, ktor vylepili tm, e diskrtne posuny a rotciu vyrieili
pomocou autokorelanej funkcie, m zvili aj presnos lokalizcie.
Autokorelan matica A je pritom potan sumarizciou derivci obrazovej funkcie
f v oblasti okolo jednho bodu.
Sila bodu V je z matice A vyrieen na zklade rovnice:
det k trace . (3.1)
Aby bolo mon oddeli hrany od vznamnch bodov (kee na jednej hrane je
teoreticky nekonene vea vznamnch bodov v jednej lnii), vol sa k = 0,04. Tmto
spsobom s pre body zskan hodnoty pozitvne a pre hrany negatvne. Vsledkom
loklneho nemaximlneho potlaenia hrn je napokon poloha vznamnho bodu.
Frstnerov opertor Frstnerov opertor (FRSTNER & GLCH, 1977) uruje
vznamn body aj v rmci autokorelanej matice A, priom je vyuvan fakt, e matica A-1
zodpoved kovariannej matici, a teda udva ako presne me by uren pozcia
vznamnho bodu (vek gradienty v A ved k malm variancim, resp. kovariancim v A-1
29
a tm k presnejiemu ureniu). Osi a seky os zodpovedajcich elps strednch chb
koreponduj s vlastnmi vektormi a hodnotami 1, 2 matice A-1. O dobr vznamn bod
ide, ak je elipsa chb o najmenia a zrove o najokrhlejia. Naproti tomu disponuje elipsa
chb pozd vraznej hrany vemi malou a vemi vekou polosou (1 mal, 2 vek), bod by
bol teda kolmo na hranu uren sprvne, no pozd hrany nesprvne. Na zklade tchto
vlastnost mono posdi vhodnos vznamnho bodu:
vznamn body disponuj malmi, okrhlymi elipsami,
rovn hrany mono detegova cez dlh polosi elps strednch chb,
vek elipsy s charakteristick pre netruktrovan, homognne plochy
(tzv. ploch textra).
Frstner zrove opsal aj vpoet vznamnho bodu so subpixelovou presnosou.
Napriek tomu, e obrazov informcia sa nachdza iba v podobe rastra pixelov, me by
vyhodnoten interpolovan verzia opertora pre kontinuum pozci a prostrednctvom toho
lokalizovan bod na hrane alebo v aisku so subpixelovou presnosou (LUHMANN a kol.,
2013).
SUSAN opertor
SUSAN (smallest univalue segment assimilating nucleus) opertor porovnva intenzity
pixelov v kruhovom okne s hodnotou sivosti centrlneho pixela oznaovanho ako nucleus
(jadro). Vznamn bod je njden, ke poet podobnch hodnt ede v okne dosiahne urit
prahov hodnotu (LUHMANN a kol., 2013).
FAST opertor
Podobne ako SUSAN opertor, aj FAST (features from accelerated segment test)
opertor analyzuje intenzity pixelov v kruhovom okne. Vznamn bod je uvaovan, ak je
urit poet susediacich pixelov s podobnou hodnotou sivosti njden v kruhu okolo
centrlneho pixela. Dvod tejto pravy algoritmu je jednoduch analza zaloen na kruhu
je vrazne invariantn voi zmenm v mierke a rotcii (LUHMANN a kol., 2013).
3.1.2 Detektory vznamnch bodov
Detektory vznamnch bodov (feature detectors) kombinuj detekciu kovch bodov
(interest points, key points) s extrakciou tzv. deskriptorov. Deskriptory s kompaktn
30
a zreten reprezentcie oblasti okolo kovho bodu. Deskriptor sli ako vektor vlastnost
(feature vector) pre kad jeden kov bod a me by priamo pouit na analzu
korepondenci. Vo veobecnosti me by akkovek detektor kovch bodov pouit
s ktormkovek deskriptorom (LUHMANN a kol., 2013).
3.1.2.1 SIFT
SIFT (Scale-Invariant Feature Transform) je algoritmus, ktor deteguje a popisuje
vlastnosti loklnej obrazovej funkcie. Publikoval ho v roku 1999 David G. Lowe (LOWE,
1999). SIFT je schopn rozpoznva vznamn body v obraze (tzv. feature), je iastone
invariantn voi rotcii aj voi zmene mierky a umu.
Algoritmus najskr deteguje extrmy obrazovej funkcie, na zklade rozdielov medzi
obrazmi, ktor vznikn konvolciou originlnej obrazovej funkcie a Gaussovskho filtra pre
mierku k.
Obr. 3.1. Originlna snmka (vavo), prv Gaussovsk rozostrenie (v strede), druh
Gaussovsk rozostrenie (vpravo) (MACH, 2012)
Odtanm obrazov po aplikcii Gaussovskho filtra je vytvoren rozdielov obraz
(Obr. 3.2), v ktorom s hadan loklne extrmy.
Obr. 3.2. Rozdielov obraz medzi rznymi rovami Gaussovskho rozostrenia
a vyznaenie extrmov (MACH, 2012)
31
ierne oblasti znamenaj nulov rozdiel ide o hrany a vek homognne oblasti, ktor
nie s z hadiska jednoznanej identifikcie bodu zaujmav. Biele oblasti znamenaj vek
rozdiel ide o oblasti veda hrn a stredy malch kruhov. Zjednoduene mono princp vidie
na veobecnej jednorozmernej funkcii na Obr. 3.3.
Obr. 3.3. Pvodn funkcia (vavo), aplikcia Gaussovskho rozostrenia prv- (v strede)
a druhkrt (vpravo) (MACH, 2012)
Rozdiel dvoch obrzkov s rznou rovou Gaussovskho filtra je zrove aproximciou
druhej derivcie obrzku Laplacinu (zjednoduen prklad op na Obr. 3.4).
Obr. 3.4. Rozdiel funkci po Gaussovskom rozostren (vavo) a druh derivcia
pvodnej funkcie z obr. (vpravo) (MACH, 2012)
Ako u bolo spomenut, tento proces je vykonan na rznych rovniach mierky, je teda
zostaven tzv. scale space (mierkov priestor). Obrazy s vdy postupne zmenen na
polovicu a ku kadmu zmenenmu obrazu prislcha sada Gaussovsky rozostrench obrazov
(Obr. 3.5).
Obr. 3.5. Scale space (MACH, 2012)
32
Obr. 3.6. Rozdiely susednch obrazov (MACH, 2012)
Potom s vybran loklne extrmy, teda pixely s hodnotou vou alebo menou ne
susedn pixely (v rmci matice 3 x 3). Porovnanie sa vak vykon s rovnakm okolm aj na
tom istom mieste v susednch obrazoch v rmci scale space.
Takto s vybran tzv. kandidti, z ktorch s vylen nestabiln body a body na
hranch. Pre kad loklny extrm je vyat jeho 3 x 3 okolie a je povaovan za funkciu
R2R (Obr. 3.7 vavo). Hodnotami je potom preloen trojrozmern kvadratick funkcia
(Obr. 3.7 vpravo).
Obr. 3.7. Funkcia loklneho extrmu s okolm 3 x 3 (vavo) a nm preloen
kvadratick funkcia (vpravo) (MACH, 2012)
Minimum (maximum) tejto kvadratickej funkcie je sasne poloha vznamnho bodu
so subpixelovou presnosou. Filtrcia nestabilnch bodov (napr. slab kontrast) a bodov na
hranch sa vykon na zklade tvaru funkcie (Obr. 3.8).
33
Obr. 3.8. Kvadratick funkcia pri nestabilnom bode (vavo) a bode pozd hrany
(vpravo) (MACH, 2012)
Na to, aby bolo alej mono sprova vznamn body medzi jednotlivmi snmkami je
vak najskr potrebn kad vznamn bod opsa tzv. deskriptorom, na jeho identifikciu na
alch snmkach bez ohadu na prpadn rotciu. Vznamnm bodom je teda priraden
orientcia a vekos L vychdzajc z prvej derivcie obrazovej funkcie v mieste
vznamnho bodu (dx, dy) na rozostrenom obrzku:
L d d , (3.2)
arctan . (3.3)
Obr. 3.9. Orientcia a vekos vznamnch bodov (MACH, 2012)
Vpoet deskriptoru vznamnho bodu je potom vykonan opsanm jeho okolia
o vekosti L relatvne vzhadom k rotcii , m je dosiahnut invariantnos voi rotcii
obrazu. Pri deskriptoroch ide o 128-rozmern vektor vypotan na zklade gradientov v
okol vznamnho bodu (deskriptor je vlastne histogramom tchto gradientov).
34
Kee kad vznamn bod je opsan svojim charakteristickm vektorom, mono
vyhada na alch snmkach vznamn bod s o najpodobnejm vektorom.
Obr. 3.10. Sprovan vznamn body medzi snmkami (MACH, 2012)
3.1.2.2 ASIFT
Zatia o SIFT je invariantn voi zmene polohy, rotcie a mierky, afinne invariantn
SIFT je schopn obsiahnu aj perspektvne skreslenie, ktor me by loklne aproximovan
afinnou transformciou. SIFT na eliminciu efektov rotcie a translcie pouva normalizciu
a s vplyvom mierky sa vysporiada vzorkovanm mierkovho priestoru a uloenm viacerch
interpretci jednej loklnej zujmovej oblasti. ASIFT aplikuje podobn prstup
k perspektvnym skresleniam, avak vzorkovanm priestoru afinnej transformcie. No zatia
o mierkov priestor m len jeden rozmer, afinn transformcia m 6 parametrov. Tto
komplikcia je vyrieen zapotanm posunu, rotcie a mierky zo SIFTu medzi 4 parametre
affinnch skreslen, vaka omu sta dopota u len 2 parametre. Tie s uvaovan ako
uhly kamery (v zmysle vonkajej orientcie ide o uhly a ) umiestnenej na sfre, priom os
zberu kamery cieli do stredu tejto sfry. Vzorkovanm tohto priestoru dostvame alch n
afinne skreslench patchov a SIFT deskriptory s potan pre kad jeden z nich. ASIFT je
teda vpotovo nronej ne pvodn SIFT (LUHMANN a kol., 2013).
3.1.2.3 SURF
SURF (Speed-Up Robust Features) pouva na detekciu zujmovch bodov maximum
determinatu Hessovej matice (tzv. Hessin). Okolie zujmovho bodu je charakterizovan
deskriptorom s pouitm histogramu odpoved tzv. Haarovho waveletu. Invariantnos voi
mierke je dosiahnut podobne ako pri SIFT vytvorenm mierkovho priestoru, ktor je
potan implicitne zmenou vekosti filtrov (LUHMANN a kol., 2013).
35
3.1.3 RANSAC
Algoritmus RANSAC (random sample consensus) umouje vyhladi dta
s vznamnm podielom hrubch chb, a tak je asto vyuvan prve v oblasti potaovho
videnia. RANSAC je iteratvnou metdou pre odhad parametrov matematickho modelu zo
sady meranch dt, ktor obsahuj hrub chyby (STRUTZ, 2016). Ide o nedeterministick
algoritmus v tom zmysle, e produkuje primeran vsledky iba s uritou pravdepodobnosou,
priom tto pravdepodobnos rastie s potom povolench iterci. Prvkrt bol tento
algoritmus publikovan v roku 1981 Martinom A. Fischlerom a Robertom C. Bollesom na
SRI (Stanford Research Institue) International (FISCHLER & BOLLES, 1981).
Zkladn predpoklad je, e dta pozostvaj z bodov, ktor mono vyjadri uritm
modelom a bodov, ktor tomuto modelu nevyhovuj. Dta teda mu disponova umom.
Odahl merania mu by pritom dsledkom bu extrmnych hodnt v ume, chybnch
meran alebo nesprvnej hypotzy o interpretcii dt.
Jednoduchm prkladom aplikcie RANSAC je preloenie dvojrozmernej priamky
sborom bodov. Za predpokladu, e tento sbor obsahuje body pribline vyhovujce priamke
aj odahl body, pouitie jednoduchej MN (metdy najmench tvorcov) by vyprodukovalo
priamku, ktor sa s vyhovujcimi bodmi dostatone neprekrva z dvodu optimlneho
prispsobenia na vetky body v sbore, vrtane odahlch bodov. RANSAC naopak
vyprodukuje model, ktor berie do vahy iba body vyhovujce priamke, s podmienkou, e
pravdepodobnos vberu iba vyhovujcich bodov je dostatone vysok.
Obr. 3.11. Sbor meran s vekm potom hrubch chb (vavo) a priamka
prispsoben vyhovujcim bodom pomocou RANSAC (vpravo) (en.wikipedia.org, 2013)
36
Vstupom do RANSAC-algoritmu je sbor meranch dt, parametrizovan model, ktor
me vyjadrova observcie a niekoko konfidennch parametrov. RANSAC iteratvne
vyber nhodn podmnoiny z pvodnch dt, tie s povaovan za hypoteticky vyhovujce
a potom testovan:
1. Model je prispsoben na hypoteticky vyhovujce body, vetky von
parametre modelu s vypotan z tchto meran.
2. Vetky ostatn body s potom testovan voi prvotnmu modelu a pokia sa
nejak bod dostatone primyk k modelu, je tie povaovan za hypoteticky
vyhovujci.
3. Odhadovan model je povaovan za dobr, ak dostatone vek poet bodov
bol klasifikovan ako vyhovujcich.
4. Model je prepotan zo vetkch hypoteticky vyhovujcich bodov, kee bol
odhadnut iba na zklade vstupnej podmnoiny bodov.
5. Nakoniec je model zhodnoten prostrednctvom odhadu chyby vyhovujcich
bodov relatvne vzhadom k modelu.
Tto procedra je opakovan pevne stanovenm potom, priom zakadm
vyprodukuje bu model, ktor je vylen kvli malmu potu vyhovujcich bodov alebo
spresnen model s prslunou relatvnou chybou. Napokon je ponechan model, ktorho
relatvna chyba je niia ne naposledy uloenho modelu. Algoritmus me by doplnen
o preruenie vpotu pokia je njden dostatone presn model, teda model s dostatone
malou relatvnou chybou.
RANSAC pritom obsahuje trojicu nepecifikovanch parametrov:
toleranciu chb, ktor sa pouva na urenie, i je bod kompatibiln
s navrhnutm modelom,
stanovenie potu podmnon pouitch na vpoet,
a poet kompatibilnch bodov na njdenie sprvneho modelu urit prahov
hodnotu.
3.1.3.1 LDP (location determination problem)
Zkladnm problmom pri analze obrazu je njdenie korepondenci medzi prvkami
dvoch reprezentci danej scny (napr. pri stereofotogrametrii). Jednou variciou tohto
problmu je njdenie priestorovej polohy, v ktorej bola snmka vyhotoven rozpoznanm sady
37
znaiek alebo kontrolnch bodov zobrazench na snmke (urenie prvkov vonkajej
orientcie). Rieenie je bene hadan cez MN pri zapojen udskho opertora, ktor
vykonva prepojenie medzi znakami na snmke a trojrozmernou databzou korepondujcich
kontrolnch bodov. Pri plne automatizovanom systme, kde s jednotliv korepondencie
zaloen na rozhodnut kompetentnho detektora vznamnch bodov, vak MN nie je
schopn poradi si s hrubmi chybami. V tomto prpade RANSAC reprezentuje zmenu
paradigmy v odhade modelu a dochdza k opanmu postupu ako pri MN zaa s malou
vzorkou a pridva (FISCHLER & BOLLES, 1981).
RANSAC algoritmus akceptuje tieto vstupn dta:
1. Zoznam L s potom m 6-tc, priom kad 6-tica disponuje 3D sradnicami
kontrolnho bodu, jeho prslunmi 2D snmkovmi sradnicami a volitenou
hodnotou, ktor udva oakvan chybu uenia polohy bodu na snmke
(v pixeloch).
2. Ohniskov vzdialenos a snmkov sradnice hlavnho bodu.
3. Pravdepodobnost (1-w), e 6-tica obsahuje hrub chybu.
4. Tzv. konfidenn slo G pouit na nastavenie vntornej prahovej hodnoty na
akceptovanie iastkovch vsledkov, ktor prispievaj k rieeniu. G = 1 spsob
vemi konzervatvne chovanie sa algoritmu, zatia o G = 0 ozna takmer
vetko za sprvne rieenie.
RANSAC/LD (location determination) produkuje vo vstupe informcie:
1. 3D sradnice projeknho centra a odhad prslunej chyby.
2. Priestorov orientciu obrazovej roviny.
Algoritmus pri vpote postupuje takto:
1. Zo zoznamu L s vybran tri 6-tice metdou quasirandom, ktor zabezpe
primeran priestorov rozloenie pre zodpovedajce kontroln body. Tento
poiaton vber je nazvan S1.
2. Projekn centrum (nazvan CP1) zodpovedajce vberu S1 je uren uzavretou
formou. Za viacnsobn rieenie mono povaova tak, ak bolo zskanch
niekoko projeknch centier z rznych vberov v nasledujcich krokov.
3. Chyba odvodenej polohy CP1 je odhadnut naruenm danch snmkovch
sradnc troch vybranch kontrolnch bodov (bu poda mnostva stanovenho
38
v 6-ticiach, alebo pvodnou hodnotou jednho pixela) a prepotanm efektu,
ktor by to malo na polohu CP1.
4. Na urenie chyby odhadu CP1 s uren elipsy chb (ich rozmer je stanoven
poda dodanho konfidennho sla) v obrazovej rovine pre kad z
kontrolnch bodov pecifikovanch v zozname L. Pokia sa asociovan
obrazov sradnice nachdzaj v prslunej elipse chb, 6-tica je pripojen ku
konsenzovej sade S1/CP1.
5. Ak vekos S1/CP1 sa rovn alebo presahuje urit prahov hodnotu t,
konsenzov sada S1/CP1 je posunut k procesu MN pre zveren urenie
polohy CP a orientcie obrazovej roviny. V opanom prpade s predchdzajce
kroky opakovan s novm nhodnm vberom S2, S3,...
6. Ak poet iterci predchdzajcich krokov prekro 1 /1 , najvia konsezov sada ak bola njden je pouit na
vpoet finlneho rieenia (alebo djde k zlyhaniu vpotu, ak tto najvia
konsezov sada obsahuje menej ne 6 lenov).
3.1.4 SFM
Vyie spomenut algoritmy ako SIFT alebo RANSAC nachdzaj uplatnenie
v technolgii znmej v oblasti potaovho videnia pod skratkou SfM (Structure from
Motion). Vo veobecnosti ide o proces, pri ktorom sa had trojrozmern truktra objektu
analyzovanm loklnych pohybovch signlov naprie asom. V rmci potaovho videnia
ide najm o situciu, ke je pozorovan scna stabiln a pohybuje sa iba kamera okolo
objektu. Analzou zmien medzi jednotlivmi snmkami, hadanm vznamnch bodov a ich
provanm sa mono postupne dopracova k trojrozmernej rekontrukcii celej scny.
Algoritmy ako napr. SIFT a RANSAC mu by do spracovania zapojen ako iastkov
lohy, kee vstupom do SfM s 2D merania obsahujce um a hrub chyby. Dvojrozmern
poloha vznamnch bodov na snmke zvis od ich priestorovch sradnc, relatvneho 3D
pohybu medzi kamerou a scnou a prvkov vntornej orientcie kamery.
Geometrick teria SfM umouje pota sasne projekn matice aj 3D body s
pouitm iba korepondujcich bodov v jednotlivch pohadoch. Formlne, ak mme danch
n projektovanch bodov u , , i 1m , j 1n na m snmkach, lohou je njs jednak projekn matice P1...Pm a zrove konzistentn truktru X1...Xn.
39
o sa tka vyhadvania korepondenci medzi vznamnmi prvkami (features)
existuj dva zkladn prstupy, a to bu u spomnan feature-based prstup (SIFT +
RANSAC) alebo pixel-based prstup (registrcia na zklade tzv. patchov s Lucas-Kanade
algoritmom), ktor je vhodnej pre video sekvencie (CIPOLLA, 2008).
3.1.4.1 Dierkov kamera
Najbenej model kamery je tzv. dierkov (pinhole) projekcia a je pod pojmom camera
obscura znma od ias nskeho filozofa Mo Di (470-391 p.n.l.) a grckeho polyhistora
Aristotela (384 a 322 p. n. l.). Tento model je vhodnou aproximciou pre vinu relnych
kamier, avak me by spresnen doplnenm napr. radilnej distorzie. Z dierkovej projekcie
vyplva, e vzah medzi 3D bodom a jeho 2D obrazovm bodom m tri komponenty opsan
niie:
1. Prv komponent je zhodnostn transformcia vyjadrujca vzah medzi bodmi
v referennom sradnicovom systme a bodmi v sradnicovom systme kamery.
2. Druh komponent je transformcia z 3D do 2D, vyjadrujca vzah medzi 3D bodmi
(v kamerovom sr. systme) a 2D bodmi v obrazovej rovine kamery. Pouitm podobnosti
trojuholnkov mono odvodi vzahy:
x f , (3.4)
y f , (3.5)
kde f je ohniskov vzdialenos. Namiesto zmeny hodnoty f svisiacej so zmenou
mierky, me by poloen f = 1 a zapota chbajci mierkov faktor do kalibranej matice
kamery.
3. Posledn komponent je 2D do 2D transformcia vyjadrujca vzah medzi bodmi v
obrazovej rovine kamery a pixelovmi sradnicami.
40
Obr. 3.12. Dierkov projekcia priestorovho bodu do obrazovej roviny kamery
(CIPOLLA, 2008)
3.1.4.2 Kalibrcia kamery
Ako u bolo spomenut v kapitole 3, pod pojmom kalibrcia sa rozumie urenie prvkov
vntornej orientcie kamery. Mono ich uri na zklade rozlinch koncepci kalibrcie
(KRAUS, 1997):
kalibrcia znmym priestorovm zvzkom lov,
kalibrcia na testovacom poli so znmymi priestorovmi sradnicami,
kalibrcia na testovacom poli pomocou znmych geometrickch tvarov,
kalibrcia na testovacom poli s neznmymi sradnicami.
Uveden 4 koncepcie kalibrcie kamery sa vyuvaj pri kalibranch metdach, ku
ktorm patr laboratrna, sben a samokalibrcia. Okrem tchto metd je potrebn
spomen ete metdu priamej linernej transformcie, ktor neprina tak presn vsledky
ako ostatn spomenut a pouva sa pri urovan priestorovej polohy bodov, priom prvky
vntornej orientcie kamery sa rieia sasne s neznmymi sradnicami urovanch bodov.
Vo vine softvrov vyuvajcich princpy SfM je v sasnosti pouvan metda
samokalibrcie, pri ktorej s na kalibrciu kamery pouvan priamo snmky objektu a do
vpotu prvkov vntornej orientcie vstupuj vznamn body objektu.
K prvkom vntornej orientcie je vak najjednoduchie dopracova sa snmkovanm
scny, ktorej parametre s znme (kontrolovanej scny). Napr. mono umiestni kameru tak,
aby snmala kalibran objekt (Obr. 3.13 vavo) a automaticky extrahova obrazov
sradnice (v pixeloch) znmych 3D bodov (Obr. 3.13 vpravo).
41
Obr. 3.13. Snmka kalibranho objektu (vavo), z ktorho mu by extrahovan
obrazov sradnice znmych 3D bodov (vpravo) (CIPOLLA, 2008)
Optick sstava objektvu nie je nikdy dokonal a idelna dierkov projekcia je tak
vdy ovplyvnen rznymi formami distorzie, skresleniami objektvu. Najbenejou formou
takhoto skreslenia je radilna distorzia, pri ktorej s body premietnut o urit odchlku
radilne okolo stredu distorzie.
Nech ~ 1 predstavuje obrazov bod s polohou ~ 1 v pixeloch. Za predpokladu, e poloha stredu distorzie je toton s polohou hlavnho bodu, radilna
distorzia me by opraven pouitm nasledujcich vzahov (TSAI, 1987):
, (3.6)
, (3.7)
kde je opraven poloha bodu pre a . L(r) je distorzn
funkcia a me by aproximovan napr. ako . Koeficienty radilnej
distorzie, k1 a k2, ktorch me by pravdae viac v zvislosti od pouitho distorznho
modelu, s povaovan za sas prvkov vntornej orientcie kamery a mono ich uri
prve poas kalibrcie. Najastejie pouvan je tzv. Brownov distorzn model, ktor riei
nielen radilnu, ale aj tangencilnu (decentran) distorziu.
3.1.4.3 Esencilna matica
Ak na jednej snmke existuje priemet 3D bodu, potom jeho priemet na druhej snmke
mus zodpoveda prislchajcej epipolrnej priamke.
42
Obr. 3.14. Epipolrna geometria pre dve kamery (CIPOLLA, 2008)
Ako vidie z Obr. 3.14, vetky epipolrne priamky na snmke maj spolon jeden bod
priemet druhho projeknho centra ( ), ktor sa nazva epipl.
Epipolrna podmienka me by algebraicky formulovan pouitm esencilnej matice
E, vyjadrujcej vzah medzi prislchajcimi bodmi v dvoch obrazoch (FAUGERAS, 1993).
Epipolrna podmienka je pre obrazov body a vyjadren:
0. (3.8)
3 x 3 esencilna matica E pritom zvis iba od rotanej matice R a trojrozmernho
vektora T a kee mierka je ubovon, obsahuje 5 parametrov.
3.1.4.4 Fundamentlna matica
Fundamentlna matica F je matica 3 x 3 s hodnotou 2 a 9 parametrami. Me by
odhadnut linerne pomocou 8 alebo viac bodov (FAUGERAS, 1993). Znan pozornos
bola venovan presnmu odhadu fundamentlnej matice zo zaumench obrazovch dt
(HARTLEY, 1997) a robustne za prtomnosti odahlch bodov (TORR, 1998, ZHANG,
1995).
Fundamentlna matica kompaktnm spsobom definuje geometriu korepondenci
medzi dvojicou snmok, kdovanie prvkov vntornej orientcie a relatvne prvky vonkajej
orientcie dvoch kamier. Matica F identifikciou bodu na jednej snmke umouje
identifikciu zodpovedajcej epipolrnej priamky na druhej snmke, priom epipl napr.
pravej snmky mono zska poloenm pravej strany rovnej nule a epipl avej snmky
poloenm avej strany rovnej nule.
43
Jednou z poiadaviek je dodranie primeranej translcie projeknch centier, nakoko
v prpade prekrytu centier nie je mon zobrazi na snmkach epipolrnu priamku. Okrem
toho musia by snmkov sradnice normalizovan ete pred rieenm linernych rovnc.
Algoritmus vyuva dekompozciu singulrnych hodnt, preto je dleit snmkov sradnice
normalizova, inak by bol vpoet numericky nestabiln.
V prpade, e sbor korepondenci obsahuje aj odahl merania, mohlo by by rieenie
MN znane znehodnoten, preto je vhodn poui algoritmus RANSAC, ktor sa s tmto
problmom doke vysporiada.
3.1.4.5 Projekn matice
Ako bolo ukzan vyie, fundamentlna matica zvis od relatvnej polohy a orientcie
dvoch pohadov na jednu scnu a me by odhadnut pomocou bodovch korepondenci.
Ak s znme kalibran matice kamery, mono zskan fundamentlnu maticu tranformova
na esencilnu maticu a dekomponova tto maticu zodpovedajcu translcii a ortonormlnu
maticu prislchajcu rotcii medzi kamerami. Numerick rieenie vychdza z dekompozcie
singulrnych hodnt esencilnej matice.
Najbliia esencilna matica (v zmysle minimalizovania Frobeniovej normy medzi
dvoma maticami) so sprvnymi vlastnosami me by zskan, ke s dve najvie
singulrne hodnoty poloen rovn ich priemeru a najmenia sa rovn nule. Projekn matice
vychdzaj priamo zo zskanch translci a rotci zarovnanm referennho sradnicovho
systmu s prvou kamerou. Zo tyroch monch rieen je to sprvne vybran na zklade
predpokladu, e rekontruovan body leia pred kamerami.
3.1.4.6 Triangulcia
Ak poznme projekn matice, 3D body mono vypota z ich obrazovch sradnc na
dvoch alebo viacerch snmkach. Tento proces sa nazva triangulcia (HARTLEY, 1994). V
idelnom prpade by mali 3D body lea v prieseku urujcich lov, no z dvodu
prtomnho umu sa le vo veobecnosti nepretnaj. Z tohto dvodu je potrebn 3D body
njs takm spsobom, aby bola minimalizovan chyba urenia ich polohy.
Rekontrukn algoritmus minimalizuje sumu tvorcov oprv medzi meranmi
a predpokladanmi polohami 3D bodov vo vetkch pohadoch, v ktorch s viditen. Za
predpokladu, e um v meranch obrazovch sradniciach m Gaussovsk rozdelenie,
vsledkom tohto prstupu je najvhodnejie rieenie pre X.
44
Obr. 3.15. Ilustrcia triangulcie (CIPOLLA, 2008)
V (HARTLEY, 1994) je oopsan neiteratvne rieenie pre dva pohady (dve kamery).
Pre viac ne dva pohady mono minimalizciu vyriei iteratvne prostrednctvom
nelinernej optimalizcie. Tento prstup vak vyaduje dostatone dobr inicializciu, inak
me zlyha njdenm loklneho minima.
3.1.4.7 SFM z viacerch snmok
Esencilna a fundamentlna matica v sebe zahaj geometrick obmedzenia pre
dvojicu pohadov. Kee v praxi sa iba zriadkakedy stretvame s iba dvojicou snmok, je
potrebn vyriei structure a motion problm (problm truktry a pohybu) pre ben poet
snmok. Zverenm krokom sa potom stva zvzkov vyrovnanie urujcich lov, ktor sa
pouva iteratvne na zjemnenie parametrov structure a motion minimalizciou prslunej
funkcie.
Kadopdne, vyrovnanie zvzku lov je kriticky zvisl od vhodnej inicializcie v
opanom prpade me algoritmus zlyha konvergovanm k loklnemu minimu rieenia.
Parametre SfM pritom mono riei dvoma algoritmami, a to sekvennm a faktorzianm.
Sekvenn metdy
Sekvenn algoritmy sa povauj za najpopulrnejie. Pracuj na princpe zaraovania
postupnch pohadov jednho po druhom (Obr. 3.16). S kadm registrovanm pohadom je
iaston rekontrukcia rozren o vpoet vetkch 3D bodov, ktor s viditen na dvoch
alebo viacerch snmkach pomocou triangulcie. Vhodn inicializcia je zvyajne zskan
dekomponovanm fundamentlnej matice vzahujcej sa k prvm dvom snmkam sekvencie
(CIPOLLA, 2008).
45
Obr. 3.16. Ilustrcia sekvennej registrcie (CIPOLLA, 2008)
Existuje niekoko stratgi pre registrciu postupnch pohadov:
Epipolrne podmienky jedna z monost je vyui epipolrnu geometriu medzi
dvojicou snmok, ktor kad snmku v sekvencii vzahuje k jej predchodcovi.
Napr. ak s znme prvky vntornej orientcie kamery, mu by pouit esencilne
matice. Esencilne matice s odhadnut linerne pouitm 8 alebo viacerch
korepondenci a dekomponovan pre zskanie relatvnej orientcie kamery a smer
kamerovej translcie. Miera translcie me by opraven pouitm snmky
v novom pohade jedinm znmym 3D bodom, teda bodom, ktor u bol
rekontruovan v predchdzajcich pohadoch.
Pretnanm inou monosou je uri pozciu kadho alieho pohadu za
pouitia u rekontruovanch 3D bodov. 6 alebo viac 3D voi 2D korepondenci
dovouje linerne rieenie dvanstich prvkov projeknej matice.
Spjanie iastonch rekontrukci alou alternatvou je spoji iaston
rekontrukcie na zklade korepondujcich 3D bodov. Typicky s zskan 2 a 3
pohadov rekontrukcie pouitm susednch snmkovch prov alebo tripletov,
ktor s potom zlen na zklade zodpovedajcich si 3D bodov.
Tieto sekvenn registran schmy vak maj niekoko dleitch obmedzen.
V kontexte interaktvnych modelovacch systmov je vek nevhoda, e v kadom pohade
mus by definovan vek mnostvo korepondujcich bodov. Pre nekalibrovan
rekontrukciu komern fotogrametrick softvry zvyajne vyaduj minimlne 7
korepondenci pre kad pohad (aj viac pre vyiu presnos). Kee korepondujce body
musia by viditen zvyajne v troch alebo viacerch pohadoch, znamen to potrebu
46
vznamnho prekrytu medzi snmkami. Pre dlh sekvencie snmok (napr. pozd ulice) me
by tto poiadavka problematick. alou komplikciou me by, e tu existuj rzne
druhy degeneratvnych structure a motion konfigurci, pre ktor tandardn algoritmy
zlyhaj. Napr. rotcia kamery s absenciou translcie, rovinn scny, 3D bod leiaci na lnii
spjajcej optick centr kamier, v ktorch je viditen. V praxi nemus by ahk vyhn sa
uvedenm obmedzeniam, obzvl ak s snmky vyhotovovan bez pozornho plnovania.
Faktorizan metdy
Opakom sekvennch metd s hromadn (batch) metdy, ktor funguj na princpe
vpotu polohy kamery a geometrie scny za pouitia vetkch snmok naraz. Jedna z vhod
je, e rekontrukn chyby s distribuovan zmysluplne cez vetky merania, teda sa mono
vyhn hrubm chybm z uzavretia sekvencie.
Medzi batch SfM algoritmy patria aj faktorizan metdy (TOMASI & KANADE,
1992). Rchle a robustn linerne metdy zaloen na SVD (Singular-Value Decomposition)
faktorizcii meran obrazovch bodov boli vyvinut pre rzne druhy zjednoduench
linernych (afinnch) kamerovch modelov - ia iadna z tchto metd nie je vo
veobecnosti aplikovaten na scny v skutonom svete, nakoko relne objektvy kamier s
prli irokouhl a nemu by aproximovan ako linerne.
Tak i tak, jedno z hlavnch obmedzen vetkch tchto algoritmov je existencia
degeneratvnych konfigurci structure a motion, pre ktor vpoet zlyh. al fakt je, e si
neporadia s chbajcim dtami kad 3D bod mus by viditen v kadom pohade.
3.1.4.8 Zvzkov vyrovnanie urujcich lov
Zvzkov vyrovnanie je posledn krok pred tvorbou mraien bodov metdami
obrazovej korelcie. Jeho loha je sasn vyrovnanie vetkch parametrov, teda pozci aj
rotci kamier a sradnc bodov. Z obrazovch features , s na zklade SfM zskan
vstupn odhady projeknch matc Pi a 3D bodov Xj. Zvyajne je potrebn zjemni tieto
odhady pouitm iteratvnej nelinernej optimalizcie na minimalizciu prslunej funkcie
(BROWN, 1976). Zvzkov vyrovnanie pracuje na princpe minimalizcie funkcie
vztiahnutej k venej sume tvorcov reprojeknch chb. Bene je pouvan Gaussova-
Newtonova itercia pre rapdnu konvergenciu.
47
Cieom zvzkovho vyrovnania je uri optimlny odhad sboru parametrov , ak je
dan sbor zaumench pozorovan. Vina parametrov zvzku neme by pozorovanch
priamo, ako napr. projekn matice a 3D sradnice bodov. Miesto toho dovouj vytvori
predikcie kvantt, ktor by pozorovan mu, napr. meran pixelov sradnice obrazovch
bodov.
Nech sbor predikci je z() sbor korepondujcich pozorovan . Potom rezidulna
predikovan chyba z je:
. (3.9)
Vo veobecnosti me by vektor pozorovan rozdelen do sboru tatisticky
nezvislch meran s asociovanmi predikciami . Zvzkov vyrovnanie pokrauje minimalizciou prslunej funkcie. Na maximlne pravdepodobn
odhad parametrov, by mala funkcia odra pravdepodobnos rezidu . Za predpokladu Gaussovskho rozloenia umu meran, prslun funkcia je sumou tvorcov chb:
, (3.10)
, (3.11)
kde je predikovan chyba features a Wi je symetrick pozitvne konen vhov matica zvolen kvli aproximcii inverznej kovariancie umu meran svisiaceho s meraniami
.
Kee vzahy medzi snmkovmi a priestorovmi sradnicami nie s linerne, je
potrebn ich najskr linearizova rozvojom do Taylorovho rdu so zanedbanm lenov
vych rdov. Nasledujci vpoet prebieha iteratvne, napr. pomocou numerickej
Newtonovej metdy iterovanm tzv. Newtonovho kroku , kde je v kadej itercii hadan
posun parametra , ktor minimalizuje f().
Nakoko Newtonova metda me zlyha v konvergencii k minimlnemu rieeniu
(me konvergova napr. do sedlovho bodu, miesto do minima) je potrebn prida vhodn
kontrolu krokov. Kad krok mus vykazova klesajci smer a pod.
48
3.2 Podrobn rekontrukcia snmanho povrchu
Akonhle je zrekontruovan zkladn scna, vetky snmky s vzjomne zorientovan
a kamery skalibrovan, najastej al krok bva vpoet hustho mrana bodov, ktor
pokrva povrch snmanho objektu. Podrobn rekontrukcia priestorovch objektov zo
snmok, najm zo stereoprov, je dleitou poiadavkou v mnohch aplikcich. Vemi asto
sa tu pritom potkame s rznymi komplikciami, ako je napr. zahladzovanie ostrch hrn,
nerovnomern osvetlenie alebo neelan odrazy na lesklch povrchoch, ktor spsobuj, e
korepondujce pixely maj rozlin intenzitu. Navye sa kladie vek draz na rchlos
vpotov, kee s asto vyadovan bu tzv. aplikcie v relnom ase, alebo je potrebn
spracova vek mnostvo snmok s vysokm rozlenm.
Existuje irok kla stereo-algoritmov, ktor umouj podrobn rekontrukciu
snmanho povrchu. Loklne metdy zaloen na obrazovej korelcii mu ma vemi
efektvne implementcie, ktor vyaduj vpoty v relnom ase (HIRSCHMLLER a kol.,
2002), avak tieto metdy predpokladaj kontantn rozdiely v rmci korelanho okna, o je
na ostrch hranch nesprvne a dochdza tak k rozmazaniu okrajov objektu. Pixelwise
matching (provanie na bze pixelov) sa s tmto problmom nepotka, no potrebuje odlin
podmienky na zabezpeenie jednoznanho provania (napr. tzv. piecewise smoothness
vyhladenie po astiach) (HIRSCHMLLER, 2005). Techniky dynamickho programovania
(Dynamic Programming) si mu tieto podmienky efektvne vynti, no iba v rmci
individulnych vyhadvacch lni (tzv. scanlines) (BIRCHFIELD & TOMASI, 1998), o
vedie k znehodnoteniu vsledkov formou neelanch pruhov. Naproti tomu globlne techniky
ako Graph Cuts (BOYKOV a kol., 2001) a Belief Propagation (SUN a kol., 2003) s schopn
vynti si provacie podmienky v dvoch smeroch. Oba prstupy s vak nron na pam
potaa a technika Graph Cuts je navye trochu pomal.
Vina metd svisiacich s hadanm korepondenci medzi stereosnmkami pota
tzv. rozdielov funkciu (disparity function) d(x, y) voi referennej snmke, ktorou je bu
jedna z dvojice snmok, alebo tzv. kyklopsk zber umiestnen niekde medzi tmito
snmkami (SCHARSTEIN & SZELISKI, 2002). Rozdielov funkcia v oblasti potaovho
videnia priamo svis s konceptom tzv. rozdielovho priestoru (disparity space (x, y, d)).
Z fotogrametrickho hadiska sa tmito rozdielmi mysl horizontlna paralaxa, teda
horizontlny rozdiel v polohe objektov pozorovanch avm a pravm okom (rozdiel x-ovch
snmkovch sradnc). Z predchdzajcich pojmov potom priamo vychdza tzv. obraz
49
rozdielovho priestoru (DSI disparity space image), ktor me by ubovonm obrazom
alebo funkciou definovanou nad spojitm alebo diskretizovanm variantom rozdielovho
priestoru (x, y, d). Inak povedan, DSI predstavuje istotu alebo pravdepodobnos (resp. tzv.
nklady cost) njdenia konkrtnej zhody.
S pojmom disparity sa mono stretn ete pri termne disparity map (rozdielov
mapa), ktor si netreba plies s termnom depth map (hbkov mapa). Vizulne sa sce mu
javi podobne, avak hbkov mapa u reprezentuje urit variant DMP v odtieoch sivej
farby z pohadu konkrtnej snmky vzdialenos pixelu od kamery je reprezentovan
rovou intenzity. Na druhej strane disparity map je vlastne len in oznaenie pre DSI. Medzi
funkciou rozdielov (disparity) a funkciou hbky (depth) plat inverzn vzah (ULN, 2014).
Vo veobecnosti mono odsledova, e vina stereo-algoritmov vykonva tieto kroky
(SCHARSTEIN & SZELISKI, 2002):
1. Vpoet nkladov provania najastejie SD (squared differences), SSD (sum-
of-squared-differences), AD (absolute intensity differences), MSE (mean-
squared error), MAD (mean absolute difference) a in.
2. Agregcia nkladov provania sumarizcia alebo priemerovanie skrz dvoj-
alebo trojrozmern podporn oblas (support region).
3. Vpoet rozdielov (paralx), resp. optimalizcia loklne metdy, globlna
optimalizcia, dynamick programovanie, prp. kooperatvne algoritmy.
4. Zjemnenie rozdielov (paralx) subpixelov odhadovanie paralx, detegovanie
zkrytovch oblast cez krov kontrolu, vyistenie nesprvne priradench
zhd aplikciou medinovho filtra a pod.
Postupnos uvedench krokov nemus by striktne kompletn a zvis od jednotlivch
algoritmov. Niektor algoritmy mu ma jednotliv kroky zlen, napr. loklne algoritmy
kombinuj prv dva kroky a pouvaj nklady provania zaloen na normalizovanej
krovej korelcii (BOLLES a kol., 1993).
Vpoet nkladov provania zvyajne vychdza z rozdielov intenzity, o me by
necitliv voi vzorkovaniu (BIRCHFIELD & TOMASI, 1998). Provanie na zklade
intenzity je vemi citliv voi rozdielom v zzname a osvetlen, odrazoch a pod. Z tohto
dvodu vznikla v oblasti potaovho videnia technika tzv. vzjomnch informci (Mutual
Information), aby bolo mono prova snmky s komplexnmi vzahmi korepondujcich
50
intenzt, prpadne snmky z rozlinch senzorov (VIOLA & WELLS, 1997). Vzjomn
informcie u boli pouit na stereo matching s princpmi obrazovej korelcie alebo
v technike Graph Cuts, priom bolo dokzan, e je robustn voi mnohm komplexnm
zmenm intenzity a dokonca aj voi odrazom (KIM a kol., 2003).
3.2.1 Loklne stereo-algoritmy
Loklne stereo-algoritmy s tatistickmi metdami zvyajne zaloenmi na obrazovej
korelcii. Pri podrobnej rekontrukcii objektov sa aplikuj tzv. area-based metdy, ktor na
njdenie vhodnch zhd medzi snmkami pouvaj okolie vybranho pixelu, resp. hodnoty
intenzity tchto pixelov vo vybranom okne (window). Poas provania takchto okien sa
najastejie vyuvaj techniky tzv. normalizovanej krovej korelcie (NCC normalized
cross-correlation), sumy absoltnych rozdielov (SAD sum of absolute differences) alebo
sumy kvadratickch rozdielov (SSD sum of squared differences).
Vsledky tzv. area-based (na vybranej oblasti zaloench) stereo-algoritmov s
vrazne ovplyvovan tvarom a vekosou vyhadvacieho okna. Na dosiahnutie vysokho
vpotovho vkonu sa najastejie pouvaj okn pravouhlho tvaru. Vekos okna uruje
poet pixelov pouitch na vpoet korelcie. Na dosiahnutie spoahlivch vsledkov mus
by okno dostatone vek, aby obsiahlo potrebn zmeny intenzity, no zrove mus by
dostatone mal, aby zahalo len pixely s rovnakou hodnotou horizontlnej paralaxy
(disparity value). Avak zatia o prli vek vyhadvacie okno rozmazva okraje a detaily
objektov, prli mal okno vedie k nespoahlivm vsledkom v oblastiach s nevraznou
povrchovou textrou. Z uvedenho vyplva, e pri lenitch objektoch nemus by jedna
vekos okna postaujca a vznik tak potreba rznych tvarov a vekost okien naprie
rznymi pixelmi v tej istej snmke.
(KANADE & OKUTOMI, 1994) navrhli adaptvnu metdu zaloen na vyhadvacch
oknch, ktor zana s prvotnm odhadom rozdielovej mapy, ktor potom iteratvne
aktualizuje pre kad bod vberom vekosti a tvaru okna, a km rieenie neprestane
konvergova. Na vber okna s najmenou neistotou pouva zmenu intenzity a paralaxy,
metda je vak citliv na prvotn odhad rozdielovej mapy.
In metdy zahaj bu premenliv vekos okna (BOYKOV a kol., 1998) alebo
prstup s viacermi vyhadvacmi oknami (FUSIELLO a kol., 1994). (HIRSCHMELLER
a kol., 2002) tie pouili techniku viacerch vyhadvacch okien s rznou vekosou, no
51
algoritmus navye doplnili o pecilny filter na opravu korepondenci po okrajoch objektu.
(VEKSLER, 2003) navrhol algoritmus s vpotom korelanch koeficientov pre viacero
rzne vekch okien v pozcii jednho vybranho pixela, priom vsledn akceptovan
vekos okna je uren na zklade najmenej chyby njdenia zhody.
al prstup ku loklnym stereo-algoritmom zaujali (YOON & KWEON, 2006), ke
potaj tzv. podporn vhy (support weights) pre kad pixel v podpornom okne na zklade
rozdielnosti ich farieb a vzdialenosti od centrlneho pixela. Tieto vhy reguluj vplyv pixela
v procese provania.
3.2.2 Globlne stereo-algoritmy
Korelan metdy a in area-based metdy hadaj zhodu medzi tvorcovmi
oblasami dvoch stereosnmok. Tto oblas alebo okno vak psob ako fotografick low-
pass filter a rozmazva diskontinuity v hbke (v smere osi zberu). Vsledkom je DSI-obraz
s rozmazanmi hranami objektov. m vie je porovnvacie okno, tm via je rove
rozostrenia a naopak. V tomto prpade by teda bolo idelne hada zhody iba na rovni
jednotlivch pixelov a nie celch oblast. Intenzitu samostatnch pixelov vak nemono
povaova za dostaton informciu pre zmyslupln provanie a tak je nutn doplni alie
podmienky na zabezpenie konzistencie vsledkov.
3.2.2.1 Global matching
Situciu provania avej snmky Il k pravej snmke Ir mono vyjadri ako energetick
funkciu, ktor je potrebn minimalizova:
pNq
qpp
p ddPdpCDE 1),()( (3.12)
Nkladov funkcia C vyjadruje nklady potrebn na njdenie zhody pixela p z avej
snmky s paralaxou (disparity) dp, ie sprovanie tohto pixela s korepondujcim pixelom na
pravej snmke vo vzdialenosti dp pozd epipolrnej priamky. V prvej asti funkcie s
sumarizovan tieto nklady pre vetky pixely p pravej snmky. Kee s porovnvan
individulne pixely, na vpoet nkladov s pouit len hodnoty intenzity. Jednoduchie
prstupy na vpoet nkladov pouvaj absoltne rozdiely intenzt, avak lepie vsledky
mono dosiahnu za pouitia techniky vzjomnch informci (Mutual Information). V druhej
asti energetickej funkcie sa voi paralaxm (disparities) vynucuje tzv. loklne vyhladenie
52
(local smoothness). Podmienka P pritom penalizuje paralaxy vetkch pixelov q z okolia Np
pixela p, ktor s vie ne 1 pixel. Podmienka penalizcie me vies k odmietnutiu
njdenia zhody napriek tomu, e hodnoty intenzity Il(p) a Ir(q) s si vemi podobn, ale ich
paralaxa je vemi odlin voi susednm pixelom. V takchto prpadoch me by
preferovan njdenie zhody, ak s si hodnoty intenzity menej podobn, no paralaxa shlas
(LUHMANN a kol., 2013).
Paralaxy dp pre vetky pixely p s zvyajne uloen do obrazu D s rovnakmi rozmermi
ako m snmka Il. Na vyrieenie provacieho problmu musia by uren vetky paralaxy dp
pri dodran minimlnej E(D). Penalizan podmienka vyhladenia P prepja paralaxu
v pozcii pixela p k paralaxe v susednej pozcii q, ktor je potom prepojen k alm susedom
at. Tento proces efektvne prepoj vetky pixely v obraze navzjom z tohto dvodu sa
o tomto prstupe hovor ako o tzv. globlnom provan (global matching).
3.2.2.2 Semi-global matching
Vpotov nronos metdy global matching rastie exponencilne s vekosou
vstupnch dt, a tak sa tento prstup stva nevyuitenm v mnohch aplikcich.
Metda SGM je v tomto smere vrazne rchlejia ne klasick globlne provanie,
pretoe kompromituje globlne optimum rieenia, aby dosiahlo vpotov efektivitu. Miesto
toho, aby poas minimalizcie E(D) uvaovalo vetky pixely sasne, do vahy je branch
len osem linernych ciest naprie snmkou. Cesty ved radilne symetricky od okrajov
snmky a stretvaj sa v pixeli p. Potom s sumarizovan individulne nklady pre kad
cestu a je vybran paralaxa dp s najnimi nkladmi. Vaka uvedenmu postupu me
vpotov nronos narasta u len linerne s potom pixelo