14
Tractament i publicació d’imatge i vídeo Jaume Reig Carrascosa Primera Prova d’Avaluació Continuada (PAC 1) Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia

Tractament i publicació d'imatge i vídeo - PAC1

Embed Size (px)

DESCRIPTION

PAC1 de l'asssignatura Tractament i publicació d'imatge i vídeo del grau multimèdia de la UOC.

Citation preview

Page 1: Tractament i publicació d'imatge i vídeo - PAC1

Tractament i publicació d’imatge i vídeo

Jaume Reig Carrascosa

Primera Prova d’Avaluació Continuada (PAC 1)

Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de Multimèdia

Page 2: Tractament i publicació d'imatge i vídeo - PAC1

1. Heu estudiat i treballat els diferents tipus de transformades: puntuals, lineals, no lineals , i espacials. Explica la diferència principal de treball sobre la imatge de cadascuna d’elles i indi-ca que tipus de transformació s’utilitza en els següents:

a. Al realitzar un clipping en la imatge.

b. Eliminar soroll uniforme gaussià.

c. Realitzar un zoom de la imatge.

d. Acolorir una imatge en nivell de grisos.

e. Enfocar una la imatge.

f. Realçar els detalls d’una imatge.

g. Eliminar objectes foscs de grandària petita no desitjats de la imatge.

a. Al realitzar un clipping en la imatge.

Transformació puntual. És la reducció de la imatge a unes poques tonalitats o normalment a 2

(blanc i negre). En el cas de la reducció a 2 tonalitats (blanc i negre) és la binarització (en Photoshop

Umbral). En el cas de més colors (Posterizar en photoshop)

b. Eliminar soroll uniforme gaussià.

S’utilitza una transformació espacial lineal. Amb una màscara laplaciana de suavització (filtre de mitjana).

Aquestes màscares es dissenyen amb la condició que la suma dels seus coeficients sigui 1. Aquesta

màscara el que fa és mitjanar els píxels de la finestra de treball amb els seus veïns, fent que els píxels

extrems es tornin més grisos i per tan estem difuminant els contorns i també difuminant el soroll

de fons uniforme.

c. Realitzar un zoom de la imatge.

És una transformació espacial geomètrica (una interpolació). El que estem fer és separar els píxels

de tal forma que enmig d’aquesta separació que hem creat afegim nous píxels d’informació de color.

Aquests píxels que afegim poden ser calculats de diverses maneres entre les quals: interpolació line-al, interpolació bilineal i interpolació bicúbica.

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

2 3

Page 3: Tractament i publicació d'imatge i vídeo - PAC1

d. Acolorir una imatge en nivell de grisos.

És una transformació puntual. Es tracta d’associar cada nivell de gris a un color mitjançant una

paleta de color d’on agafarà el color. (l’operació resultant s’anomena pseudocolor). Pot ser considerat

també com una variant del color indexat, ja que agafa cada nivell de gris i el substitueix per un de

la paleta de color i per tant la imatge resultant acolorida pesa el mateix que la imatge en escala de

grisos.

e. Enfocar una la imatge.

És una transformació espacial lineal. Hem d’utilitzar màscares de realçament de contorns o de

detecció de contorns (laplacianes) per tractar de definir els contorns dels objectes que estan difumi-

nats. La utilització d’una o l’altre serà depenent de com desenfocada estigui la imatge.

f. Realçar els detalls d’una imatge.

És una transformació espacial lineal. Hem d’utilitzar màscares de realçament de contorns (lapla-cianes).

g. Eliminar objectes foscs de grandària petita no desitjats de la imatge.

És una transformació espacial no lineal. Hem d’utilitzar una erosió o també un tancament, encara

que millor la darrera el tancament.

2

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

3

Page 4: Tractament i publicació d'imatge i vídeo - PAC1

2. Com puc saber si una imatge que he pres amb una càmera digital està correctament

exposada, amb la il·luminació correcta, i a quins són els millors ajustaments que es poden

aplicar sobre la imatge?

3. Raona a través del següent histograma si pertany a una imatge contrastada o no:

Una imatge ben exposada en general observant en l’histograma hauria de tindre una distribució

uniforme i el més extensa possible per tots els nivells (això és cert per la majoria d’imatges, però es

poden donar casos especials com per exemple el cas d’una fotografia amb paisatge totalment nevat,

on lògicament els nivells blancs seran els predominants en la imatge i els foscos inexistents).

Un bon ajustament per il·luminació d’una imatge és per exemple llegir els valors màxims i mínims

de nivells en l’histograma i aplicar a partir d’aquests punts una corba de transformació lineal per

parts.

La imatge no està ben contrastada. Aquesta imatge té molts nivells foscos i els nivells més clars

son pràcticament inexistents. Perquè estigués ben contrastada la imatge hauria de tindre una pre-

sència de nivells clars equiparables als foscos i els tons mitjos més baixos que els foscos i els clars.

En l’histograma es pot preveure que la imatge en general és molt fosca.

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

4 5

Page 5: Tractament i publicació d'imatge i vídeo - PAC1

4. Explica que signifiquen els paràmetres que apareixen sota histograma anterior. Quina

probabilitat hi ha de trobar un píxel del mateix nivell de gris al seleccionat?

Promedio: El valor mitjà en nivells del 0 al 256 entre tots els píxels de la imatge.

Desv. est (Desviació estàndard o típica): És la mitja aritmètica de les diferencies de la mitjana de

tots els píxels. És un indicatiu si la imatge està poc o molt contrastada. Normalment està entre 40

i 90 en imatges normals.

Mediana: Mostra el valor mitjà en el rang de nivells de la imatge.

Pixeles: El nombre total de píxels de la imatge

Nivel: El nivell sobre el qual està situat el punter.

Cantidad: Mostra el nombre total de píxels corresponents al nivell on tenim situat el punter.

Percentil: El percentatge de píxels que hi ha del total del nivell d’intensitat on està situat el cursor.

Nivel de caché: El nivell de caché utilitzat per a crear l’histograma.

La probabilitat hi ha de trobar un píxel del mateix nivell de gris al seleccionat és el Percentil. O

sigui el nivell 52 apareix 543 vegades d’un total de 65536: 543*100/65536= 0,83%

4

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

5

Page 6: Tractament i publicació d'imatge i vídeo - PAC1

5. Quina diferència hi ha entre una transformació de contrast i l’ecualització de la imatge?

6. En què consisteix la indexació del color? Indica tipus, les seves característiques de

funcionament i per a què es pot usar (posa 3 exemples concrets).

La diferència és que en una corba de contrast descomprimim tota la gama tonal de tal forma que

distribuïm els tons clars, foscos i mitjos expandint tota la gama tonal.

En l’equalització agafem el valor més clar i més fosc com a referència i distribuïm uniformement

els tons mitjos.

Usualment les imatges en color estan quantificades a 8 bits per canal de color. En el cas d’imatges

RGB serien 24 bits per píxel (16,7 milions de colors). El color indexat funciona diferent ja que aquest

no emmagatzema directament cada píxel d’informació de color, sinó que els agafa d’una paleta de

colors que està limitada a 256 colors, pel que cada píxel de color es pot guardar en tan sols 8 bits.

Quan convertim una imatge de color a color indexat reduïm la informació de color de cada píxel i

hem de triar la paleta de colors que farem servir i el mètode d’assignació de colors.

Per assignar colors poden fer servir el mètode uniforme, que tria el valor mitjà en un espai dividit

en fraccions iguals o el adaptatiu que tria el valor més freqüent també entre un espai dividit en

fraccions iguals. En els dos casos la paleta de colors que fem servir és depenent de la imatge origi-

nal. També hi ha la possibilitat de treballar amb paletes fixes de colors no depennets de la imatge

original.

Utilitats

• La primera utilitat concreta per transformar una imatge de color a indexat és per la reducció de

pes de la imatge resultant al reduir la informació de color de cada píxel.

• Una altra utilitat per exemple és utilitzar el format GIF (que és color indexat), ja que aquest ac-

cepta transparències alfa cosa que és molt útil per la web on podem integrar imatges amb el fons de

color html.

• La tercera utilitat pot ser per a destacar zones determinades d’una imatge, com podria ser el cas

d’imatges mèdiques canviant-ne el color original de la imatge original.

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

6 7

Page 7: Tractament i publicació d'imatge i vídeo - PAC1

7. Què és una màscara de suavitzat? Què és el paràmetre d’escala que es necessita per a

determinar una màscara o filtre d’aquest tipus en el Photoshop?

8. Indica que variacions s’estan produint a l’aplicar sobre una imatge les diferents

transformades lineals, raonar la diferència entre elles:

La màscara de suavitzat és una transformació espacial lineal. Aquestes màscares suavitzen i difu-

minen les zones on hi ha contrastos forts (zones on els píxels propers entre si tenen valors molt dife-

rents, fent aquesta màscara que s’igualin aquests píxels). Per fer-ho amb una màscara de suavització,

hem de pensar com si la màscara fos una quadrícula que agafa els valors de cada porció d’aquesta

quadrícula i en fa la mitjana substituïnt el valor central d’aquesta quadrícula per la mitjana calcula-

da.

Les màscares de suavització es dissenyen tenint en compte que la suma dels seus coeficients sigui

igual a 1. En Photoshop el valor “escala” són els denominadors o total de fraccions en què s’ha frac-

cionat el numerador.

En la primera corba estem enfosquin la imatge en general. Estem expandint els tons mitjos de la

imatge fent que passin a ser més foscos.

En la segona imatge estem contrastant aquesta retallant els nivells d’entrada. O sigui, si per exem-

ple establim un punt d’entrada per les llums a 9 i de sortida a 0, vol dir que tots els píxels per sota de

9 passen a ser 0. I per les ombres el mateix procediment. Aquest tipus de corba “recta” té l’inconve-

nient que provoca o pot provocar àreas molt saturades les quals podem visualitzar el l’histograma on

s’agrupen els píxels en els extrems.

En la tercera imatge també és una corba de contrast però en aquest cas l’efecte és més suavitzat. A

diferència de l’anterior es podem evitar més fàcilment les zones saturades i “cremades”.

6

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

7

Page 8: Tractament i publicació d'imatge i vídeo - PAC1

9. Fer una taula resum sobre el funcionament, usos aconsellats i desaconsellats, avantatges i

desavantatges dels sistemes de: dilatació, erosió, obertura, tancament.

Dilatació Erosió Obertura Tancament

Funcionament És una operació mor-

fològica que retorna el

valor màxim de nivell

de gris de la finestra de

treball (element estruc-

turant), de tal manera

que si hi ha un píxel amb

nivell 255 retorna 255

fent que es redueixin

les zones negres. Amb

photoshop és: filtro ->

máximo

És una operació morfo-

lògica que retorna el va-

lor mínim de nivell de

gris de la finestra de tre-

ball (element estructu-

rant), de tal manera que

si hi ha un píxel amb ni-

vell 0 retorna 0 fent que

es redueixin les zones

negres. Amb photoshop

és: filtro -> mínimo

És una erosió seguida

d’una dilatació.

És una dilatació seguida

d’una erosió.

Usos aconsellats - Unir objectes propers

- Fer contorns més grui-

xuts d’objectes tancats.

- Destacar o fer més

grans objectes petits

aillats (per imatges bina-

ries)

- Separar objectes pro-

pers.

- Fer contorns més

prims dels objectes tan-

cats.

Eliminar o reduir ob-

jectes petits aillats. (per

imatges binaries)

- Aillar objectes en imat-

ges sobre fons negre o

fosc.

- Èmfasi general de con-

torns.

- Eliminar soroll de fons

impulsional (blanc).

- Aillar objectes en imat-

ges sobre fons blanc o

clar.

- Èmfasi general de con-

torns.

- Eliminar soroll de fons

impulsional (negre).

Usos desaconsellats Per imatges acolorides

i imatges monocromà-

tiques.

Per imatges acolorides

i imatges monocromà-

tiques.

Eliminar soroll de fons

gaussià.

Eliminar soroll de fons

gaussià.

Avantatges Amb un sol pas podem

aplicar la transformació

i veure els resultats.

Amb un sol pas podem

aplicar la transformació

i veure els resultats.

Elimina o minimitza els

efectes indesitjats de

l’erosió.

Elimina o minimitza els

efectes indesitjats de la

dilatació.

Inconvenients Poden sortir efectes in-

desitjats en les imatges

tals com: aclariment ge-

neral, aprimament d’ob-

jectes i desaparició.

Poden sortir efectes in-

desitjats en les imatges

tals com: enfosquiment

general, engruiximent

d’objectes i unió.

Hem de fer 2 passos per

aplicar la transforma-

ció.

Hem de fer 2 passos per

aplicar la transforma-

ció.

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

8 9

Page 9: Tractament i publicació d'imatge i vídeo - PAC1

10. Explica que procés s’ha realitzat per a obtenir la imatge A i B, si la següent imatge és

l’original, de partida:

Per la figura A fem servir una obertura. O sigui una erosió (Photoshop: Filtro -> Otro -> Mínimo)

seguida d’una dilatació (Photoshop: Filtro -> Otro -> Máximo)

Per la figura B fem servir un tancament. O sigui una dilatació seguida d’una erosió.

8

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

9

Page 10: Tractament i publicació d'imatge i vídeo - PAC1

11. Explica les diferents formes d’obtenció de contorns estudiades. Punts forts i febles de cada

sistema.

Es pot fer de 3 maneres: màscares laplacianes, màscares de gradient i operacions morfológiques

(per erosió o dilatació restant les imatges originals per la erosionada o dilatada)

Màscares laplacianes (detectores de contorns): La màscra es dissenya de tal manera que la suma

dels seus coheficients valgui 0, per tant quan en la finestra de treball troba valors en nivells similars

pràcticament no canvia res en la sortida i només canvia substancialment quan detecta nivells dife-

rents (contorns).

Màscares de gradient: Aquest és un altre tipus de màscares detectores de contorns. Funcionen

amb la mateixa lógica que les anteriors de que la suma de coheficients valgui 0, però aquestes són

detectores de contorns selectius, o sigui de detecten contorns horitzontals, verticals i diagonals per

separat.

Operacions morfológiques (erosió, dilatació): Aquestes també son detectores de contorns. La lógi-

ca de funcionament per les imatges erosionades és: la erosió redueix les parts blanques d’una imat-

ge, per tant si restem la imatge original per l’erosionada n’obtenim els contorns. El mateix passa per

la dilatació però amb les parts negres.

AvAntAtgEs InConvEnIEnts dE CAdAsCUnA

Màscares laplacianes

Avantatges: serveix per tot tipus d’imatges. Monocromàtiques, color, binaries.

Desavantatges: Produeix soroll de fons

Màscares de gradient

Avantatges: Pot detectar contorns selectivament en horitzontal, vertical i diagonal. Produeix poc

soroll de fons.

Desavantatges: És poc efectiu en la detecció de contorns globals i la detecció no és tan fina com

en les màscares laplacianes.

OperaciOns MOrfOlògiques

Avantatges: En imatges monocromàtiques i binaries la detecció de contorns és més fina que en les

laplacianes i les de gradient. No produeix soroll de fons.

Desavantatges: Produeix un enfosquiment o aclariment general de la imatge. El fons ens queda de

color negre.

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

10 11

Page 11: Tractament i publicació d'imatge i vídeo - PAC1

12. Com eliminaries el soroll de tipus salt&pepper d’una imatge? Raona la resposta.

Per reduir el soroll de tipus salt&pepper (soroll impusional), la millor manera és utilitzar el filtre

de mediana.

La mediana és l’ordenació d’una mostra de nombres enters, llavors el nombre que queda el mig és

la mediana. Per tant en una imatge els nivells extrems (que són els que provoquen el soroll impusio-

nal de valors extrems distribuïts de forma no homogènia), sempre estaran al principi o al final de la

seqüència ordenada, fent que aquestos desapareixin i produint poc canvis en els valors mitjos.

Amb photoshop per aplicar el filtre de mediana: Filtro -> Ruido ->Mediana

10

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

11

Page 12: Tractament i publicació d'imatge i vídeo - PAC1

13. Què és la resolució de la imatge i com és el seu sistema de mesura ? si la resolució d’una

imatge escanejada en una A3 és de 500ppp, quin és la grandària de la imatge en píxels?

Bàsicament és una mesura per saber quan definida està una imatge. Com més alt sigui el nombre

més definició tindrà la imatge. Si per exemple tenim una imatge a 72 ppp, vol dir que cada polzada

té 72 píxels. La formula de càlcul de la mida física d’una imatge és:

Mida (pOlzades) = Mida (píxels)/ resOlució (píxels/pOlzada)

Per tant per calcular la resolució serà:

resOlució (píxels/pOlzada) = Mida (píxels) * Mida (pOlzada)

mida (píxels) -> mida per pantalla

mida (polzades) -> mida física

CàlCUl ImAtgE A3 dE 500PPP

Un A3 es: 297 x 420 mm i en polzades - > 11,69 x 16,53 polzades

Per tant:

Mida (píxels) = resOlució * Mida (pOlzades)

mida amplada = 11,69 * 500 = 5845 píxels

mida llargada = 16,53 * 500 = 8265 píxels

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

12 13

Page 13: Tractament i publicació d'imatge i vídeo - PAC1

14. dels tipus d’interpolació estudiats indica que tipus s’ha usat per a cadascuna de les

següents imatges si hem quatriplicat la seva grandària, raona la resposta:

Costa bastant d’identificar ja que els canvis són mínims però la imatge primera està lleugerament

més enfocada en els contorns que la segona. Per tant jo diria que la primera ha estat interpolada

amb interpolació bicúbica i la segona interpolació bilineal. En tot cas cap de les dues per interpolació

per veí més proper ja que no hi ha efecte “píxelat”.

Nota: per veure les diferències he creat un nou document de photoshop amb les dues imatges una a cada

capa i amagant i mostrant capa per veure les diferències.

12

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

13

Page 14: Tractament i publicació d'imatge i vídeo - PAC1

BiBliOgrafia extra utilitzada

Paulo Porta. Destripando el histograma [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en <http://www.quesabesde.com/camdig/articulos.asp?articulo=117>.

Paulo Porta. Técnicas de filtrado [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en <http://www.quesabesde.com/camdig/articulos.asp?articulo=137>.

Adobe Photoshop. Acerca de los histogramas [en línia]. [data de consulta: 12 de novembre del 2011]. Disponible en <http://help.adobe.com/es_ES/Photoshop/11.0/WSfd1234e1c4b69f30ea-53e41001031ab64-768ca.html>.

Colaboradores de Wikipedia. Ruido en la fotografía digital [en línea]. Wikipedia, La enciclopedia li-bre, 2011 [fecha de consulta: 14 de noviembre del 2011]. Disponible en <http://es.wikipedia.org/w/index.php?title=Ruido_en_la_fotograf%C3%ADa_digital&oldid=44238140>.

Jaume Reig Carrascosa

Novembre de 2011

UOC. Estudis d’Informàtica, Multimèdia i Telecomunicació. Grau de MultimèdiaTractament i publicació d’imatge i vídeo. 1er semestre 2011-2012. PAC1. Jaume Reig Carrascosa

14