Upload
kalei
View
61
Download
0
Embed Size (px)
DESCRIPTION
Detekcija lica Gaborovim filtrom. Sveučilište u Zagrebu - FER Napredne metode digitalne obradbe signala Tomislav Androš Ivica Dvoršćak Saša Kovačec 25.siječnja, 2008. Motivacija. Gaborov filtar je najbolja aproksimacija prostornog receptivnog polja stanice u vizualnom dijelu moždane kore - PowerPoint PPT Presentation
Citation preview
Detekcija lica Gaborovim Detekcija lica Gaborovim filtromfiltrom
Sveučilište u Zagrebu - FERNapredne metode digitalne obradbe
signala
Tomislav AndrošIvica DvoršćakSaša Kovačec
25.siječnja, 2008
MotivacijaMotivacija
Gaborov filtar je najbolja aproksimacija Gaborov filtar je najbolja aproksimacija prostornog receptivnog polja stanice u prostornog receptivnog polja stanice u vizualnom dijelu moždane korevizualnom dijelu moždane kore
dobro oponaša vizualni sustav nekih dobro oponaša vizualni sustav nekih sisavacasisavaca
jednostavan je za implementacijujednostavan je za implementaciju koristi se za mnogobrojne probleme kao koristi se za mnogobrojne probleme kao
što su segmentacija tekstura, analiza što su segmentacija tekstura, analiza dokumenata, detekcija rubova, kodiranje dokumenata, detekcija rubova, kodiranje slike...slike...
Gaborov filtarGaborov filtar
kompleksna sinusoida karakteristične kompleksna sinusoida karakteristične frekvencije i orijentacije modulirana frekvencije i orijentacije modulirana Gaussovom ovojnicomGaussovom ovojnicom
H(x,y) = s(x,y)*g(x,y)H(x,y) = s(x,y)*g(x,y)
s(x,y) = s(x,y) =
g(x,y) = g(x,y) =
0 02 ( )j u x v ye
2 2
2 2
1( )21
2X Y
x y
e
Gaborov filtarGaborov filtar frekvencijski odziv filtra:frekvencijski odziv filtra:
filtar možemo zamisliti kao Gaussovu filtar možemo zamisliti kao Gaussovu funkciju posmaknutu u frekvenciji na funkciju posmaknutu u frekvenciji na poziciju od ishodišta i na poziciju od ishodišta i na orijentaciji orijentaciji
filtar sa orijentacijom filtar sa orijentacijom ΘΘ ima snažan odziv ima snažan odziv na regiji koja ima varijaciju na istoj na regiji koja ima varijaciju na istoj orijentacijiorijentaciji
2 22 2 20 02
( , ) 2X Yu u v v
X YH u v e
0 0( , )u v
0 0arc ( / )tg u v
Gaborov filtarGaborov filtar
Prolaskom slike kroz Gaborov filtar Prolaskom slike kroz Gaborov filtar definiran s definiran s
dobivamo sve komponente dobivamo sve komponente slike koje imaju energiju slike koje imaju energiju koncentriranu na koncentriranu na
0 0( , , , )X Yu v 0 0( , )u v
Baza ulaznih uzorakaBaza ulaznih uzoraka koriste se lica i ne-lica, a zbog većeg koriste se lica i ne-lica, a zbog većeg
broja uzoraka novi uzorci se dobivaju broja uzoraka novi uzorci se dobivaju zrcaljenjem i posmicanjem originalne zrcaljenjem i posmicanjem originalne slikeslike
slike su veličine 27*18, a iz njih se dobiva slike su veličine 27*18, a iz njih se dobiva vektor dimenzije 2160 koji je dobiven vektor dimenzije 2160 koji je dobiven konvolucijom Gaborovog filtra i slikekonvolucijom Gaborovog filtra i slike
dimenzija značajki dobivenih dimenzija značajki dobivenih konvolucijom je 3x veća od navedene, ali konvolucijom je 3x veća od navedene, ali je smanjena zbog povećanja brzine učenjaje smanjena zbog povećanja brzine učenja
UčenjeUčenje učenje se izvodi neuronskom mrežomučenje se izvodi neuronskom mrežom neuronska mreža je dvoslojna – ima 2160 neuronska mreža je dvoslojna – ima 2160
ulaza, 100 skrivenih neurona te jedan ulaza, 100 skrivenih neurona te jedan izlazni neuron; sve transfer funkcije izlazni neuron; sve transfer funkcije neurona su tansigneurona su tansig
mreža se uči backpropagation mreža se uči backpropagation algoritmom koji koristi konjugirano algoritmom koji koristi konjugirano gradijentni algoritam učenja - brži od gradijentni algoritam učenja - brži od metode najbržeg spustametode najbržeg spusta
parametri zaustavljanja su 400 iteracija parametri zaustavljanja su 400 iteracija ili MSE manja od ili MSE manja od
310
Testiranje – 1. fazaTestiranje – 1. faza
testiranje se izvodi na slikama testiranje se izvodi na slikama proizvoljne veličineproizvoljne veličine
na početku testiranja se ulazna slika na početku testiranja se ulazna slika konvoluira sa predlošcima koji su licakonvoluira sa predlošcima koji su lica
na slici dobivamo korelacijske regije na slici dobivamo korelacijske regije koje su nam potencijalna licakoje su nam potencijalna lica
one nam pomažu da smanjimo broj one nam pomažu da smanjimo broj potencijalnih uzoraka i ubrzamo potencijalnih uzoraka i ubrzamo izračun izračun
Testiranje – 2. fazaTestiranje – 2. faza
stvaraju se vektori uzoraka iz stvaraju se vektori uzoraka iz korelacijskih regija i stavljaju se na mrežukorelacijskih regija i stavljaju se na mrežu
definiran je prag za odziv koji mreža mora definiran je prag za odziv koji mreža mora dostići da bi regija bila klasificirana kao dostići da bi regija bila klasificirana kao licelice
stvara se mali krug oko centralnog stvara se mali krug oko centralnog piksela za čiji smo pravokutnik utvrdili da piksela za čiji smo pravokutnik utvrdili da je liceje lice
krug nam služi za treću fazu koja krug nam služi za treću fazu koja morfološki određuje regiju lica morfološki određuje regiju lica
Testiranje – 3. fazaTestiranje – 3. faza gleda se matrica odziva mreže te se filtrira gleda se matrica odziva mreže te se filtrira
s pragom da se dobije binarna slikas pragom da se dobije binarna slika radi se dilatacija slike koristeći strukturni radi se dilatacija slike koristeći strukturni
element krug – lice je kružnog oblikaelement krug – lice je kružnog oblika nakon toga se radi connected-component nakon toga se radi connected-component
labeling – identificiraju se pojedini objektilabeling – identificiraju se pojedini objekti traže se centroidi pojedinih objekatatraže se centroidi pojedinih objekata oko centroida se izrađuje zeleni oko centroida se izrađuje zeleni
pravokutnik(lice) koji se “zalijepi” na sliku pravokutnik(lice) koji se “zalijepi” na sliku
ProblemiProblemi
algoritam realiziran u Matlabu je sporalgoritam realiziran u Matlabu je spor povećanjem brzine opada detection ratepovećanjem brzine opada detection rate empirijski se određuje prag koji empirijski se određuje prag koji
minimizira false detection rateminimizira false detection rate za veću brzinu treba smanjiti vrijednost za veću brzinu treba smanjiti vrijednost
pragapraga korištena je mala baza lica, za veću bazu korištena je mala baza lica, za veću bazu
je bolji detection rateje bolji detection rate
ProblemiProblemi
problem je sekvencijalna obrada problem je sekvencijalna obrada regija testirane slikeregija testirane slike
kritičan je odabir načina na koji se kritičan je odabir načina na koji se dolazi do regija koja su potencijalna dolazi do regija koja su potencijalna licalica
RezultatiRezultati
RezultatiRezultati
RezultatiRezultati
HVALA NA PAŽNJI!!HVALA NA PAŽNJI!!