Izvestaj za vezbe iz DOS-a br 4

FAKULTET TEHNIČKIH NAUKA GRAFIČKO INŽENJERSTVO I DIZAJN

Digitalna obrada slike izveštaj sa 4.vežbe

Student:

AnaHalas

GI 51/2011

Zadatak nam je kako se izdvajanje obojenih elemenata vrši u RGB prostoru boja, što je mnogo komplikovano jer sad radimo sa tri kanala umesto sa jednim. Sada RGB prostor smeštamo u kocku, čije jedno teme će biti koordinatni početak odnosno 0 ili crna boja. Njemu suprotno teme, koje se nalazi na kraju glavne dijagonale kocke ima vrednost 255 odnosno bela boja. To znač i da se na glavnoj dijagonali ove kocke nalazi 256 nijansi sive. Levo, desno i gore od 0 nalaze se R, G i B komponente, a izmeĎu svih ovih vrednosti nalaze se razne nijanse ovih osnovnih boja. Pošto siva nije boja mi ćemo, onda sve što nije sivo poseduje neku boju. Mi ćemo ispitati koje su to vrednosti, napraviti odgovarajuću masku i izdvojiti obojene elemente. Prvo ćemo napraviti monohromatsku sliku usrednjavanjem i to pomoću Utilities / Convert / Color to Gray / Average.

Elementi Monohromatski elementi Na ovaj način od trokanalne slike dobili smo monohromatsku jednokanalnu sliku u kojoj

svaki piksel ima vrednost srednje vrednosti piksela trokanalne slike na istom tom mestu. Da bi ovakvu dobijenu sliku mogli da koristimo nad originalnom slikom moramo je pretvoriti u trokanalnu i to pomoću opcije Utilities / Create / Assemble Bands. Onda ćemo sliku oduzeti od originalne pomoću opcije Utilities / Arit/Logic / Substract.

Trokanalna slika elementata Elementi nakon oduzimanja Primećujemo negativine vrednosti do kojih je došlo zbog oduzimanja uprosečene vrednosti

piksela slike u boji od originalne vrednosti tog piksela na svakom kanalu. Ako je u nekoj boji dominantan samo jedan kanal, druga dva kanala imaju veoma male vrednosti te se usled oduzimanja iste uprosečene vrednosti (koja je zbog velike vrednosti najzastupljenjijeg kanala veća od stvarne vrednosti piksela u tom kanalu) na nekim kanalima može pojaviti negativan broj - tako dobijamo negativne vrednosti piksela. Pošto nam ne odgovara da imamo negativne vrednosti piksela izračunaćemo njihovu apsolutnu vrednost i to pomoću opcije Enhancement / Histograms / Linear Modifi cations.

Pikseli u polaznoj slici imali su vrednosti izmeĎu -144 i 120. Deo opsega od 0 do 120 bi se

usled izračunavanja apsolutne vrednosti preslikao u iste te vrednosti pa je s toga

nepotrebno raditi tu transformaciju. MeĎutim, vrednosti od -144 do 0 bi se preslikale u

njihove pozitivne vrednosti od 144 od 0. Zato ćemo transformaciju raditi samo na ovom

delu opsega sa koefi cijentom pravca -1 i selektovaćemo pociju Keep out of range data. Parametri za ovaj korak su nam sledeći: Start = -144 End = 0 Initial value = 144 Slope = -1

Elementi nakon linearne modifikacije Da bi ovako dobijenu sliku mogli da koristimo kao masku moramo je binarizovati.

Prvo ćemo je opet pretvoriti u monohromatsku pa na njoj raditi binarizaciju poreĎenjem sa pragom T=20. I to pomoću opcije Utilities / Convert / Binari Threshold.

Modifikovani monohromatski elementi Binarna slika elemenata Dobili smo sliku koja ima bela polja na onim mestima koji imaju vrednosti veću od

20. Tako smo definisali udaljenost od glavne dijagonale i sve boje koje imaju vrednost piksela veću od 20 će se smatrati bojama, a objekti obojeni njima će biti izdvojeni. Kada masku pretvorimo u trokanalunu i pomnožimo je sa originalnom slikom dobićemo izdvojene samo one elemente koji imaju neku boju.

Elementi nakon množenja sa maskom Pomoću opcije Analzsis / Features možemo da dobijemo odreĎene informacije o

objektima u slici. Kada aktiviramo ovu opciju odaberemo one informacije koje želimo da dobijemo o nekom objektu. Zatim kiliknemo na taj objekat i komandom Apply omogućimo zapisivanje svih tih informacija o selektovanom objektu u prethodno generisani fajl (Feature File Name). Ako to uradimo za svaki objekat po na osob kao rezultat dobićemo jedan txt fajl koji sadži sve tražene informacije. CVIPtools feature fi le for image with 3 band 1. Image name 2. Object’s row coordinate 3. Object’s column coordinate 4. Area 5. Centroid (row, column) 6. Orientation (Axis of least second moment) 7. Perimeter *** END OF HEADER; CLASS (optional) SHOWN AT THE END OF DATA *** elementi.bmp 102 55 5115 109 56 24 373 elementi.bmp 254 65 3573 245 87 -61 465

elementi.bmp 375 75 4779 399 134 51 404

elementi.bmp 131 244 273230 240 324 8 2236

elementi.bmp 131 244 273230 240 324 8 2236

elementi.bmp 131 244 273230 240 324 8 2236

elementi.bmp 326 269 3348 336 275 1 504

elementi.bmp 58 407 4685 62 391 -86 437

elementi.bmp 190 400 3549 193 408 34 470

elementi.bmp 359 410 4864 345 398 23 358

elementi.bmp 197 558 4039 195 564 41 455

elementi.bmp 352 528 273230 240 324 8 2236

Dobijene informacije poreĎane su po sledećem redosledu: ime slike; kolona na

koju smo kliknuli; red na koji smo kliknuli; površina; težište; orjentacija; obim. Možemo

zaključiti o kom objektu je reč bez toga da znamo redosled kliktanja mišem. Prvi element

je žuti element u gornjem levom uglu slike. To vidimo na osnovu informacije o koloni i

redu slike. Na osnovu informacija o obimu i površini elemenata možemo zaključiti da li

se radi o objektima koji imaju kuglu na svojim krajevima ili o onima koji je nemaju. Kompresija podrazumeva odbacivanje onih podataka o slici koji su nepotrebni za

njen opis. Ona se deli na kompresiju sa (lossy) i bez (lossless) gubitaka. Mi radimo kompresiju sa gubicima. Za definisanje jednog bajta koristi se 8 bitova što nam omogućava rad sa 256 nijansi jedne boje. Ovi bitovi nemaju istu težinu i istu važnost u obradi slike, tako da je najteži osmi bit, a najmanji po težini je prvi. To možemo dokazati ukoliko originalnu sliku podelimo na njene bitske ravni. Svaka bitska ravan izdvaja samo one bite koji imaju istu težinu. Tako prva radavn ima ili vrednosti 1, a osma ravan vrednost 128 što automatski objašnjava da osma ravan poseduje više podataka o slici.

Opcijom Compression / Lossy / Bit-Plane Lenght Coding možemo izdvojiti svaku bitsku ravan ove slike posebno. Da bismo videli šta koja ravan sadrži moramo je binarizovati sa pragom koji se dobija kao težina bita u reprezentaciji pririodnog broja minus jedan: T=2 broj ravni -1

Na slikama su predstavljene bitske ravni od prve do osme i Binary Treshold.

Posmatranjem možemo zaključ iti da osma ravan ima mnogo više pondataka o

slici nego prva, zbog njene težine 128. Zbog toga je ona najznačajnija i uvek treba da se

čuva. Prva, druga i treća ravan imaju najmanje značajnih podataka o slici pa ukoliko njih

odstranimo nećemo imati velike gubitke u kvalitetu prikaza slike, ali ćemo postići

kompresiju. Vidimo da se prve konture naziru tek na četvrtoj ravni te ako nju odbacimo

izgubićemo neke informacije o ivicama i bitnim detaljima u slici. Na sledećim slikama je

pokazano šta se dešava ukoliko odbacimo neku ravan koja nam je od značaja. Nakon odbacivanja prve 4 bitske ravni Nakon odbacivanja prve 3 bitske ravni

Ako odbacimo prve četiri ravni vidimo da se pojavljuju lažne konture na slici. Znači da četvrta ravan poseduje neke informacije o finim prelazima koje smo odbacili. Ako odbacimo samo prve tri ravni vidimo da je slika skoro ista kao i originalna. Neke razlike se mogu primetiti, ali one su neznatne. Znači da se odbacivanjem neće mnogo gubiti na kvalitetu slike. Zaključujemo da se odbacivanjem bitskih ravni najmanje težine postiže kompresija jer je kraći kod kojim se zapisuje slika.

Sledeće vrste kompresije su DCT i FFT transformacije. Slika se prvo deli na blokove u koje se upisuju vrednosti koeficijenata dobijeni odgovarajuć im transformacijama, pa dobijene vrednosti se kvantizuju. Veliki broj tih koeficijenata su male vrednosti pa se mogu eliminisati bez velikih gubitaka. Sledeći korak u kompresiji je formiranje maske u odgovarajućem obliku koja se popunjava jedinicama i nulama. Zatim se vrši množenje blokova sa vrednostima maske, pritom se prenose samo one vrednosti koeficijenata koje se množe sa brojem jedan u masci.

Faktor kompresije predstavlja količnik ukupnog broja koeficijenata i broja koeficijenata koje prenosimo u novu sliku. A ušteda koji ćemo na ovaj način postići je količnik broja koeficijenata koje odbacujemo i ukupnog broja koeficijenata. Odabirom komande Compression / Lossy / Zonal možemo izvršiti kompresiju sa faktorom 32 i veličinom bloka 8x8.

Faktor kompresije je bio jako velik rezultat i nije najbolji, ali se vidi da je DCT

(Diskretna kosinusna transformacija) mnogo bolja od FFT. Na obe slike se javlja blok

efekat upravo zbog tog deljenja slike na blokove. Problem u FFT transformaciji nastaje

na mestima prelaza sa jednog bloka na drugi. Ova funkcija pravi veću grašku pri

eliminaciji koeficijenata na ovim mestima. Kod DCT blok efekat postoji, ali je on manji

zato što je perioda DCT transformacije ve ć a i ne pravi toliku grašku na prelazima

izmeĎu dva bloka. Znači da je DCT bolja od FFT i prikazaćemo slike kompresovane sa

faktorima kompresije 16, 8 i 4.

FFT kompresija DCT kompresija

DCT Faktor 4 DCT Faktor 8 DCT Faktor 16

Vidimo da je blok efekat manji ukoliko je faktor kompresije manji zato što na taj

način odbacujemo manji broj koeficijenata i zadržavamo više podataka o ivicama u slici.

Ako uradimo razliku kompresovanih slika i originalne dobićemo sve one podatke o slici

koje smo kompresijom izgubili. Ona nam tako Ďe pokazuje grešku u slici usled

kompresije. Slike će biti prikazane istim redosledom faktora.

Vidimo da smo najviše podataka izgubili pri kompresiji sa faktorom 16, a najmanje pri kompresiji sa faktorom 4 zato što smo smanjenjem faktora kompresije sačuvali veći broj koefi cijenata. Postignuta kompresija se smanjuje smanjenjem faktora kompresije, ali je kvalitet slike bolji, a greška pri kompresiji sve manja. Vidi se da su najveći gubici nastali na mestima gde su prelazi sa jednog bloka na drugi blok odnosno ivice u slici. Zaključujemo da očuvanjem većeg broja koeficijenata u slici nakon odgovarajuće transformacije č uvamo i detalje originalne slike, ali postižemo manju kompresiju. Od namene krajnje slike će zavisiti u kojoj meri je možemo kompresovati.

Documents

Izvestaj za vezbe iz DOS-a br 4