Luce e percezione visiva - DiUniTovincenzo/TecDigSuoImm12/Slide/1617_02... · 2017-05-08 · 229...

Preview:

Citation preview

Luce e percezione visiva

Un’immagine digitale

x

y

X

Y

• Dimensioni finite (X,Y)• No profondità inerente• Numero finito di pixel• Rappresentazione numerica

dell’energia luminosa

f(x,y) = intensità luminosa in (x,y)

L’informazione grafica

grafica acaratteri

graficavettoriale

grafica raster

Da Analogico a Digitale4

Categorie

• Immagini reali: acquisite da una scena reale mediante telecamera, scanner, …

• Immagini artificiali o di sintesi: generate all’interno del calcolatore

• Immagini scientifiche: dati di qualche natura ricondotti a immagine

Esempi

Il fenomeno luminoso

Fisica della lucee

grandezze fotometriche

Teoria ondulatoria: Forza elettromotrice e campo magnetico

• Da f.e.m. a c.m.– f.e.m. crea corrente elettrica in un circuito– Cariche in movimento creano c.m. intorno al circuito

• Da c.m. a f.e.m.– C.m. in movimento crea f.e.m. in un circuito elettrico– f.e.m. causa corrente elettrica nel circuito

Onde elettromagnetiche

Scambio di energia tra campo elettrico e campo magnetico: equazioni di Maxwell• I due campi si auto-sostengono• Si propagano nello spazio alla velocità della luce

I parametri

• Velocità di propagazione, c = 300 x 106 m/sec

• periodo T (s); frequenza f = 1/T (Hz), tasso c.e./c.m.

• lunghezza d’onda l = cT = c/f (in nm)

Frequenza e lunghezza d’ondaLo spettro elettromagnetico

l = c / n

l lunghezza d’ondac velocità della lucen frequenza

[Wikipedia]

Lo spettro della luce visibile

Lunghezze d’onda del visibile da 380 nm (10-9 m) a 760 nmFino a circa 1 mm le percepiamo come calore

Le grandezze fotometriche

Confrontare più sorgenti di lucePsicofisiologia

Integrato da http://www.arm.ac.uk/~csj/essays/lmagill/glossary.htm

Le grandezze fotometriche

• Grandezze definite per sorgenti luminose e superfici illuminate

• Il “metro” deve tener conto degli effetti percepiti da un osservatore umano

• Due grandezze: intensità luminosa e luminanza

Grandezze radiometriche di base

Si parte da:

• Energia radiante Q (in joule)

• Flusso radiante o potenza F (in watt o joule/sec)

• Intensità radiante: flusso per angolo solido (watt / steradiante)

Angolo solido unitario

Un angolo solido si misura in steradianti

steradiante: angolo solido sotteso da raggio unitario e area unitaria.

Una sfera ha un angolo solido di 4π steradianti

sorgente puntiforme

Dalla radiometria alla fotometria

Limitazione a una banda di lunghezze d’onda Dl

centrate intorno a una lunghezza d’onda l

Le quantità specifiche vengono denotate con Q(l)

La sensazione luminosa

• La sensazione luminosa dipende da– energia emessa dalla sorgente– forma e dimensioni della sorgente– il colore della luce

• Efficienza luminosa relativa y(l)

Flusso luminoso

• Potenza luce visibile che una sorgente emette in tutte le direzioni

• Flusso luminoso F(l) y(l)• F totale dipende da ò380

780 F(l) y(l) dl

• Si misura in lumen• Due lampade della stessa potenza producono

differenti flussi luminosi

Intensità luminosa I (sorgente puntiforme)

I: flusso di energia luminosa emesso in una direzione (per angolo solido unitario)

Si misura in lumen/steradianti

Unità è anche detta candela

r

sorgente puntiforme

Illuminamento di una superficie: LUX

• Flusso (lumen) per unità di superficie: E = F / S

• Descrive ciò che succede quando la luce finisce su una superficie

• Si misura in lux: illuminamento prodotto su una superficie di un m2 sulla quale incide uniformemente il flusso di un lumen

Luminanza

AW

piano normale

direzione

L: flusso emesso da sorgente estesa per unità di area e per unità di angolo solido (misura in watt / (steradianti m2))

Flusso di luce da un’area unitaria

Un oggetto flebile vicino e un oggetto luminoso lontano possono avere lo stesso illuminamento, ma differenti luminanze.

La gamma di intensità luminosa

• Una gamma enorme

• Luce più intensa che si può guardare senza offesa fisica o dolore è miliardi di volte più intensa della luce più debole

Decibel

• # dB = 10 log (I / I0)

• I0: intensità luminosa di riferimento (10-6

candele)

• Esempi– 1 dB = 10 log (10-5,9/10-6) = 10 [-5,9 – (-6)] = 10 x 0,1– 60 dB = 10 log (100/10-6) = 10 [0 – (-6)] = 10 x 6

… un’intensità un milione di volte maggiore di I0

Intensità e decibel

I dB I dB 0.000001 0 1000000 120 0.00001 10 100000 110

0.032 45 31.6 75 0.16 52 6.3 68 0.25 54 4.0 66 0.50 57 2.0 63 0.79 59 1.6 62

1 60 1.3 61

I0 = 10-6 candele

Comuni intensità luminoseCorrelati psicologici (dB) Intensità (dB) 160 140 Soglia del dolore 120 Sole 100 Carta bianca in luce media 80 Schermo televisivo 60 40 Luce minima per la visione di colore 20 Soglia di visibilità per l’occhio adattato all’oscurità

0

La percezione visiva

Psicofisiologia della visioneLa ricostruzione della scena in 3-D

La visione

“ ... Il cuore vero della percezione visiva è l’inferenza derivata dalla struttura di un’immagine sulla struttura del mondo reale esterno. La teoria della visione è esattamente la teoria di come è possibile fare ciò ... ”

David Marr

Aspetti coinvolti

fisicaradiometria

anatomiafisiologiafotometria

neurologianeuro-

psicologia

psicologiadella

conoscenza

informazione fisica

Percezionevisiva

informazione percepita

Obiettivi della visione

• Ricca comprensione di ciò che è nel mondo• Localizzazione degli oggetti• Come gli oggetti cambiano nel tempo

• Conseguenze per un sistema:– Capacità di riconoscere e manipolare gli oggetti– Capacità di interagire fisicamente con l’ambiente

Input

[Johnson-Laird - Computer and the Mind]

225 221 216 219 219 214 207 218 219 220 207 155 136 135 130 131 125213 206 213 223 208 217 223 221 223 216 195 156 141 130 128 138 123206 217 210 216 224 223 228 230 234 216 207 157 136 132 137 130 128211 213 221 223 220 222 237 216 219 220 176 149 137 132 125 136 121216 210 231 227 224 228 231 210 195 227 181 141 131 133 131 124 122223 229 218 230 228 214 213 209 198 224 161 140 133 127 133 122 133220 219 224 220 219 215 215 206 206 221 159 143 133 131 129 127 127221 215 211 214 220 218 221 212 218 204 148 141 131 130 128 129 118214 211 211 218 214 220 226 216 223 209 143 141 141 124 121 132 125211 208 223 213 216 226 231 230 241 199 153 141 136 125 131 125 136200 224 219 215 217 224 232 241 240 211 150 139 128 132 129 124 132204 206 208 205 233 241 241 252 242 192 151 141 133 130 127 129 129200 205 201 216 232 248 255 246 231 210 149 141 132 126 134 128 139191 194 209 238 245 255 249 235 238 197 146 139 130 132 129 132 123189 199 200 227 239 237 235 236 247 192 145 142 124 133 125 138 128198 196 209 211 210 215 236 240 232 177 142 137 135 124 129 132 128198 203 205 208 211 224 226 240 210 160 139 132 129 130 122 124 131216 209 214 220 210 231 245 219 169 143 148 129 128 136 124 128 123211 210 217 218 214 227 244 221 162 140 139 129 133 131 122 126 128215 210 216 216 209 220 248 200 156 139 131 129 139 128 123 130 128219 220 211 208 205 209 240 217 154 141 127 130 124 142 134 128 129229 224 212 214 220 229 234 208 151 145 128 128 142 122 126 132 124252 224 222 224 233 244 228 213 143 141 135 128 131 129 128 124 131255 235 230 249 253 240 228 193 147 139 132 128 136 125 125 128 119250 245 238 245 246 235 235 190 139 136 134 135 126 130 126 137 132240 238 233 232 235 255 246 168 156 141 129 127 136 134 135 130 126241 242 225 219 225 255 255 183 139 141 126 139 128 137 128 128 130234 218 221 217 211 252 242 166 144 139 132 130 128 129 127 121 132231 221 219 214 218 225 238 171 145 141 124 134 131 134 131 126 131228 212 214 214 213 208 209 159 134 136 139 134 126 127 127 124 122219 213 215 215 205 215 222 161 135 141 128 129 131 128 125 128 127

Output

Mano (dx)

Cubo di un qualchemateriale(cristallo?)

Pollice La mano sos(tiene)il cubo

Superficiperpendicolaritra loro

Superficienascosta

Rappresentazione della scena 3D: Posizione sistema VS posizione oggetti della scena, Posizione relativa degli oggettiColori, forme, composizione, cinematica della scenaIdentificazione di oggetti noti e meno noti

Principio di indeterminazione

Limiti della percezione visiva: realtà fenomenica e percezioni non veridiche

Triangolo di KanizsaOggetto fenomenico e

oggetto fisico

Quadrato di MachAllineamento con gli assi cardinali

Illusioni visive

Illusione di Hering

Oggetti di interesse: dipendono dalla natura dei meccanismisensoriali e elaborazioni del sistema visivo

Indeterminazione

• Causata dal dispositivo di cattura

• Da immagine retinica e rappresentazione in codice neurale non certo cosa l’abbia determinata

• Trasformazione ricostruttiva: il sistema visivo cerca di recuperare proprietà non veicolate dalla luce

Indeterminazione di tipo fotometrico

• Confusione tra componenti separate nel mondo fisico (illuminazione + proprietà delle superfici)

La stessa luminanza risultante L può essere frutto di diversi prodotti I x r.

Indeterminazione di tipo geometrico

• Eliminazione dell’informazione di profondità (da 3D a 2D)

Visione bidimensionale

Visione prospettica

Visione lineare

Indeterminazione radiale: propagazione rettilinea della lucee asse dello sguardo

Raggruppamento di tipo percettivoGestalt

Legge della vicinanza: si accorpano elementi vicini

Raggruppamento di tipo percettivoGestalt

Legge della somiglianza: si accorpano elementi simili in forma, grandezza e colore

Raggruppamento di tipo percettivoGestalt

Legge della continuità di direzione: accorpamento definito dalla distribuzione lungo un cammino

Raggruppamento di tipo percettivoGestalt

Legge della chiusura: tendenza a chiudere i contorni di una figura (figura chiusa favorita rispetto a figura aperta)

Raggruppamento di tipo percettivoGestalt

Legge della buona forma o pregnanza: quando figure diverse si uniscono, ciascuna conserva la propria forma

Raggruppamento di tipo percettivoGestalt

Legge dell’esperienza passata: segmentazione influenzata da esperienze passate; favorita la costruzione di forme familiari

La fisiologia della visione

[Wikipedia – Sistema visivo]

Schema del sistema visivo

LGN V1

V2V3

V4

V5Retina

NucleoGenicolatoLaterale

CortecciaStriata

AreeCorticalisuperiori

OrientamentoBordiColore

Movimento

Forme dinamiche

ColoreForme colorate

Il passaggio da 2D a 3Dmatrice di pixel

schema primario

schema a 2D e ½

scena 3D

I fase

II fase

III fase

Prima fase

CampionamentoLocalizzazione dei contorni

Schema primario

matrice di pixel

schema primario

I fase

L’occhioSistema ottico + Sistema sensoriale

Fovea

Nervoottico

Coroide

ScleraMuscoli circolari emuscoli radiali

Cristallino

Retina

Macchia cieca

Iride

Cornea

Luce

Sclera

Fovea

Coroide

Retina

Diametro complessivo 20 mm

Sistema ottico: il cristallino

60/70 % acqua

Assorbe circa 8% radiazionenella luce visibile, soprattutto l minori

Il sistema ottico: la camera oscura

Campo visivo

• Laterale 208°

• Verticale 120°Aspect ratio = 1.73

Il sistema sensoriale: la retina

• il piano dell’immagine

• coperto di materiale fotosensibile– alogenuro d’argento (pellicole) – circuiti di silicio (telecamera CCD) – rodopsina e varianti (retina)

Il sistema sensoriale: i numeri

• immagine suddivisa in pixel

• CCD: alcuni Megapixel, griglia rettangolare – Sony A7R II Type: Mirrorless | Sensor size: full

frame, 42.4Mp | Monitor: 3-inch tilting, 1,229k dots | Continuous shooting: 5 fps | Movies: 4K | User level: Expert

• retina: da 75 a 150M bastoncelli, 6 o 7 M coni, mosaico esagonale

Griglia rettangolare CCD

http://emdma.com/technology-explained-how-does-a-digital-camera-work/

Mosaico esagonale della retina

http://www.kybervision.com/Blog/files/AppleRetinaDisplay.html

Chromatic Mosaic of the Human Retina: False color image showing the arrangement of the 'red', 'green' and 'blue' cones in the human retina at a location 1 deg nasal from the central fovea. The scale bar represents 5 arcmin of visual angle. Each cone can be assmall as 28 arcsec. Adapted from Roorda Lab.

Elementi fotosensibili: bastoncelli e coni

Tre tipi di coni

Bastoncello

• luce notturna• responsabile della visione acromatica• segnalano anche un singolo fotoneVISIONE SCOTOPICA

• luce diurna• responsabili della visione a colori

• registrano intensità su una gamma di 8 ordini di grandezza

• soglia elevataVISIONE FOTOPICA

La retina

1.2 Mdi fibre nervose

Strati retinici

spessa menodi 0,5 mm

recettori

livello sinaptico esterno

livello sinaptico interno

Le connessioni principali

CR

B

G

A

H

B B B

G G G

A A

H H

CR

Luce

Assoni

Integrazione spaziale eelaborazione parallela

Distribuzione dei recettori

Coni ammassati nella e vicino alla fovea (max acuità visiva)

Bastoncelli assenti nella fovea; concentrati nella periferia

Fovea

• Rientranza circolare (d 1,5 mm)

• Circa 337000 coni

http://scienzaonline.forumativo.com/t243-cosa-occorre-sapere-sui-nostri-occhi

Ipotesi del tristimolo

• Qualsiasi colore reale come somma pesata delle risposte dei tre pigmenti allo stimolo di colore

Tre tipi di conibastoncello

segmento esterno: parte fotosensibile segmento interno:produzionesostanzafotosensibile

nucleocellulare

terminazioni sinaptiche

450nm

picco di rispostadei coni

550nm580nm

La trasduzione

• i bastoncelli rimpiazzano i dischi continuamente• i coni rimpiazzano il pigmento dei dischi

Sensibilità dei fotorecettori

• Il pigmento liberato dipende proporzionalmente dalla luce assorbita

• Si riduce quindi la sensibilità alla luce

• Adattamento: variando la luce nell’ambiente, nuovo equilibrio sulla quantità di pigmento

Efficienza luminosa dei fotorecettori

http://www.physics.utoronto.ca/~jharlow/cones.html

Conclusione campionamento: la matrice a livelli di grigio

• interazione fisica tra luce focalizzata sulla retina e pigmento visivo delle cellule retiniche

• risposta sia delle cellule retiniche sia di unacamera = matrice 2D dei valori di intensità

Immagine a livelli di grigio

Matrice di pixel

225 221 216 219 219 214 207 218 219 220 207 155 136 135 130 131 125213 206 213 223 208 217 223 221 223 216 195 156 141 130 128 138 123206 217 210 216 224 223 228 230 234 216 207 157 136 132 137 130 128211 213 221 223 220 222 237 216 219 220 176 149 137 132 125 136 121216 210 231 227 224 228 231 210 195 227 181 141 131 133 131 124 122223 229 218 230 228 214 213 209 198 224 161 140 133 127 133 122 133220 219 224 220 219 215 215 206 206 221 159 143 133 131 129 127 127221 215 211 214 220 218 221 212 218 204 148 141 131 130 128 129 118214 211 211 218 214 220 226 216 223 209 143 141 141 124 121 132 125211 208 223 213 216 226 231 230 241 199 153 141 136 125 131 125 136200 224 219 215 217 224 232 241 240 211 150 139 128 132 129 124 132204 206 208 205 233 241 241 252 242 192 151 141 133 130 127 129 129200 205 201 216 232 248 255 246 231 210 149 141 132 126 134 128 139191 194 209 238 245 255 249 235 238 197 146 139 130 132 129 132 123189 199 200 227 239 237 235 236 247 192 145 142 124 133 125 138 128198 196 209 211 210 215 236 240 232 177 142 137 135 124 129 132 128198 203 205 208 211 224 226 240 210 160 139 132 129 130 122 124 131216 209 214 220 210 231 245 219 169 143 148 129 128 136 124 128 123211 210 217 218 214 227 244 221 162 140 139 129 133 131 122 126 128215 210 216 216 209 220 248 200 156 139 131 129 139 128 123 130 128219 220 211 208 205 209 240 217 154 141 127 130 124 142 134 128 129229 224 212 214 220 229 234 208 151 145 128 128 142 122 126 132 124252 224 222 224 233 244 228 213 143 141 135 128 131 129 128 124 131255 235 230 249 253 240 228 193 147 139 132 128 136 125 125 128 119250 245 238 245 246 235 235 190 139 136 134 135 126 130 126 137 132240 238 233 232 235 255 246 168 156 141 129 127 136 134 135 130 126241 242 225 219 225 255 255 183 139 141 126 139 128 137 128 128 130234 218 221 217 211 252 242 166 144 139 132 130 128 129 127 121 132231 221 219 214 218 225 238 171 145 141 124 134 131 134 131 126 131228 212 214 214 213 208 209 159 134 136 139 134 126 127 127 124 122219 213 215 215 205 215 222 161 135 141 128 129 131 128 125 128 127

Primo livello

CampionamentoLocalizzazione dei contorni

Schema primario

Risposta alle variazioni di intensitàSensibilità al contrasto

• Non è lineare

• Si aumenta DI fino a una differenza percepibile• DI / I (frazione di Weber) è quasi sempre

costante (circa 2%)• DI, dipendente da I, è detta soglia di contrasto

Situazione sperimentale

Il background

• Frazione di Weber e gamma di valori in cui è costante dipendono da luminosità del bg

• L’inviluppo delle varie risposte corrisponde alla situazione precedente

Il contrasto simultaneo

La sensibilità dipende dal contesto

Il contrasto simultaneo

Propagazione e omogeneizzazione degli effetti di contrasto (filling-in) entro zone delimitate da bordi netti

Contrasto simultaneo a colori

Contrasto cromatico di Itten

Assimilazione dei colori

Frequenza spaziale

Reticoli orizzontali

Reticoli (Teorema di Fourier)

Fase

Ampiezza

Reticolo (frequenza 1)

0,1 1,01,10 1 1

011

Misura della frequenza spaziale

Numero di sinusoidi che cadono in un grado di campo visivoCicli/grado

Grado di campo visivo: angolo che sottende uno schermo di 1 cm di lato alla distanza D = 57 cm (allontanandosi, frequenza aumenta)

I contorni: variazioni di intensità

• regioni con diverse intensità luminose– chiazze brillanti e opache (direzione della luce)– l’intensità tende a cambiare in prossimità degli spigoli– potenza dei disegni senza sfumature

• localizzare i contorni– passaggi tra regioni di diversa intensità– problema del “rumore”

Come si localizzano i contorni

• Si filtra l’immagine in modo da …– attenuare le piccole differenze– esaltare le differenze significative

• Filtraggio mediante più scale di valori– rappresentazione struttura grossolana dei contorni– mantenimento dettagli sulle superfici

La gaussiana

• tiene conto di una più ampia gamma di valori vicini• attribuisce un peso in funzione della distanza

Il sombrero messicano

http://williamcalvin.com/bk4/bk4ch6.htm, http://mattoneal.com/

Filtri convolutivi

• Ogni “vetro”, maschera, contiene dei pesi • Pesi = coefficienti dei valori dei pixel nell’intorno• Prodotti peso-valore sommati

Smoothing

Sharpening

Estrazione di contorni

Contorni

Il filtraggio della matrice

• dimensione ottimale del sombrero messicano – sombrero largo: variazioni graduali su area vasta– sombrero stretto: molte piccole variazioni in dettaglio

• esseri umani sensibili a un’ampia gamma di variazioni: sombrero flessibile?

Immagine a livellidi grigio (320x320)

(a) filtro piccolo9 pixel

(b) filtro grande18 pixel

Confronto tra i filtri

Strati retinici

Il funzionamento della retina

http://williamcalvin.com/bk4/bk4ch6.htm

Conferma percezione: effetto Mach

La risposta del sistema visivo

Bande di Mach

Variazione di intensità

Risposta del sistema visivo

La spiegazione

• Vantaggio evolutivo dalla localizzazione dei contorni degli oggetti

• Contorni individuati anche in condizioni minime di variazione tra un oggetto e il contorno

• Il sistema enfatizza la variazione per identificare i contorni

Sensibilità funzione della frequenza

Minore alle frequenzealte e basse

Maggiore alle frequenzeintermedie

Lunghezze e parallelismi

Griglia di Hermann

- ++ --

- + --

Linee radianti

Completamento figure

Primo livello

CampionamentoLocalizzazione dei contorni

Schema primario

Lo schema primario:barre, spigoli, macchie = regioni

Schema primario

• organizzazione completa dell’immagine

• guardare fuori fuoco con gli occhi socchiusi

• si costruisce raggruppando elementi simili in modo da formare – linee– macchie più grandi – gruppi strutturati

Più organizzazioni potenziali

http://doraballa-ommo.blogspot.com/2009/11/francois-morellet-1971.html

Il passaggio da 2D a 3Dmatrice di pixel

schema primario

schema a 2D e ½

scena 3D

I fase

II fase

III fase

Secondo livello:La rappresentazione intermedia

Da 2D a 2D e 1/2

schema primario

schema a 2D e ½

II fase

Esempio

Mano (dx)

Cubo di un qualchemateriale(cristallo?)

Pollice La mano sos(tiene)il cubo

Superficiperpendicolaritra loro

Superficienascosta

Illusioni 3D

Il cubo di Necker

Illusioni 3D

Prospettiva e percezione dimensioni

Estrazione dell’informazione oltre 2-D

• segmentazione della scena in oggetti distinti

• posizione e orientamento di ogni oggetto in relazione all’osservatore

• forma di ogni oggetto

1. Segmentazione

• Regioni corrispondono a entità nella scena semanticamente significative

• Assemblare gli elementi di un singolo oggetto per riconoscimento o presa

2. Posa/orientamento dell’oggetto rispetto all’osservatore

• Utile per manipolazione e navigazione

• Caso di un piano (descritto da slant e tilt)– Slant quantifica la pendenza della superficie relativa

alla linea di vista (angolo tra la normale e la linea)– Tilt: direzione della proiezione della normale nel

piano fronte-parallelo

2. Slant e tilt

[Zhong et al., Vision Research 46, 2006]

stesso slant, diverso tilt

stesso tilt, diverso slant

3. Forma

• Invariante rispetto a distanza e orientamento di un oggetto

• Forma di un oggetto e forma di una superficie rispetto al movimento

• Fondamentale per la presa di un oggetto e per il riconoscimento

Indizi per passare da 2D a 2D e 1/2

• colore• profondità (stereopsi binoculare)• tessitura• movimento• ombre• contorni

Il colore

Un fenomeno fisico e psicologico

La luce bianca e i colori

• Il prisma di Newton: lo spettro• 7 bande distinte nello spettro• Ogni banda su specifiche lunghezze d’onda

La teoria ingenua newtoniana

• Def. colore in base alle proprietà della luce

• Oggetto illuminato assorbe/riflette componenti

• Non tiene conto della fisiologia della visione

• E colori che non esistono nella decomposizione della luce bianca (marrone, porpora)?

Percezione del colore

• Influenza del fattore fisico – Natura fisica della luce – Interazione luce/materiali (es.: indici riflessione)

• Influenza del fattore psicologico – sistema visivo (es.: l tra 380 e 780 nm)

La percezione acromatica

• Luce bianca: luce emessa da sorgente che contiene tutte le l nella stessa quantità

• Riflessione degli oggetti – oggetti bianchi: riflessione acromatica > 80% – oggetti neri: riflessione acromatica < 3%– oggetti a livelli di grigio: riflessione intermedia

L’intensità luminosa

• E’ l’unico attributo della luce acromatica – valori compresi tra nero e bianco – valori intermedi per i livelli di grigio

• Risulta da aggregazione di più l

• Dà origine alla sensazione di luminosità (o brightness)

Efficienza luminosa

• Sensibilità dell’occhio alle varie lunghezze d’onda

• Occhio più sensibile a l di 550 nm (luce giallo-verde)

La percezione cromatica

• Avviene quando la luce percepita contiene lunghezze d’onda in quantità diversa

• Luce monocromatica: caso speciale - energia di una singola lunghezza d’onda del visibile

La sensazione di colore

• Differenti distribuzioni spettrali producono differenti sensazioni di colore (in generale)

• Colore: attributo che permette di distinguere tra più composizioni spettrali

• Stimolo di colore = energia radiante + composizione spettrale

Segnale al sistema visivo

• Due contributi: – distribuzione delle l della sorgente di luce– caratteristiche fisiche dell’oggetto

• Esempi:

+ =

+ =

Modello semplice del colore

c(l) = s(l) e(l)

Spettri di illuminazione

Cielo blu Lampada a tungsteno

Spettri di riflettanza

Obiettivo teorie di colore

• Come si specifica un colore • Come si fa a riprodurlo

• Identità di colori• Quanto sono differenti due colori • Come appare (viene percepito) un colore

Intuitivamente

• Molti colori si possono ottenere mescolando pochi colori di base

• Si sommano luci, sintesi additiva• Si sommano pigmenti, sintesi sottrattiva

Coloricomplementari

Rappresentazione del colore

• La luce emessa da un pixel è specificata dalla distribuzione spettrale di potenza S(l)

• La retina contiene tre tipi di fotorecettori (coni)

• I coni sono sensibili ad aree diverse dello spettro (in sovrapposizione)

Fotorecettori

Fovea Periferia

[Frank Dellaert]

La teoria del tristimolo

• coni sensibili a l metà spettro (circa verde)• coni sensibili a l corte (circa blu)• coni sensibili a l lunghe (circa rosso)

Percezione del colore

• Esseri umani come animali tricromatici

• Tre tipi di coni come filtri passa-banda non netti

• Funzionamento– Arriva la luce sulla retina con un certo spettro – Coni reagiscono in modo selettivo: risultati puri o

intermedi

La colorimetria

• Un’analisi oggettiva della descrizione dei colori

• Si basa su esperimenti psicometrici

Esperimenti di Wright e Guild(1928-1931)

Ampiezza del campo di vista pari a 2o

Sfondo omogeneo

Test Hp

Base perstandardindustrialicolore

Esperimenti di color matching

Image courtesy Bill Freeman

Risultati

• Da tre sorgenti di luce monocromatica (primari) si può riprodurre lo stimolo di riferimento

• Proporzione dei tre primari non varia con la potenza della sorgente

• Ciascun primario non deve poter essere espresso come combinazione degli altri due

La misura Y

• y(l): efficienza di luminosità relativa• Definizione completa dei colori:

– un valore di luminanza Y + – due valori di crominanza, che specificano il colore

Modello vettoriale additivo

• Una distribuzione di energia spettrale assoluta (un colore) viene rappresentata come un punto (vettore) nello spazio LMH

L

M

H C1

L1

M1

H1 (L1, M1, H1)

Conseguenze

• Colore percepito solo come risposta coni

• Una mescola di due colori segue le leggi della somma di vettori– C = C1 + C2– C1 è specificato dal vettore (L1, M1, H1)– C2 è specificato dal vettore (L2, M2, H2)– C è specificato dal vettore (L1+L2, M1+M2, H1+H2)

Limitazioni dei sistemi (LMH)

• Non si ammettono quantità negative dei primari

• Problemi con alcuni colori in input

• Trasposizione: si aggiunge il primario all’input– C + 3M = 2L + H– C = 2L - 3M + H– (2, -3, 1)

Gli attributi degli artisti

• tinta: addizione di pigmento puro e pigmento bianco (diminuisce la saturazione)

• ombra: addizione di pigmento puro e pigmento nero (diminuisce la luminosità)

• grigio: addizione contemporanea di pigmento bianco e pigmento nero al pigmento puro

biancocolori “puri”

nero

grigi

tinte

ombre toni

Spazio di colore

• Variabili rappresentate su assi cartesiani (descrivono spazi geometrici)

• Due gruppi– Spazi relativi (device dependent)– Spazi assoluti (device independent)

I colori primari CIE

• Sono il risultato di calcoli teorici: tre distribuzioni spettrali di energia– non colori visibili– non esistenti in natura– non utilizzati in sistemi di visualizzazione

• Standard internazionale

• Primario Y definito su sensibilità umana

X, Y, Z

Uso dei primari CIE

• Ogni colore è rappresentato da una tripla (X, Y, Z)

• Quantità normalizzatex = X / X+Y+Z ; y = Y / X+Y+Z ; z = Z / X+Y+Z

– dipendenti da lunghezza d’onda dominante e saturazione– indipendenti dalla quantità di energia luminosa – x + y + z = 1

• In pratica, si definiscono x e y (z derivato), e Y

Il diagramma di cromaticità CIE

Tipiche gamme di colori

Spazi relativi

RGBCMYHS*

YUV, YIQ, YCbCr

Modelli additivi

• I colori si creano aggiungendo colori al nero fino al bianco

• Per gli ambienti a emissione propria (monitor)

Spazio RGB

• Modello di tipo additivo: somma di ogni colore

• Base di tre colori: Red, Green, Blue

Spazio geometrico RGB

origine del sistema

livelli di grigio

Ogni punto individuato da terna (r, g, b)

(1,0,0)rosso

(1,1,0)giallo

(0,1,0)verde

(0,1,1)ciano

(1,1,1)bianco

(0,0,1)blu

(1,0,1)magenta

(0,0,0)nero G

B

R

Spazio dei colori nelle immagini digitali

• Non valori continui per le tre componenti, ma discreti

• Esempio: un byte per componente (3 x 8 bit = 24 bit)

• Modalità TrueColor

Esempi di sottospazio(piani del cubo)

Rosso costante (=128) Blu costante (= 128)

Colori RGB sicuri e colori browser sicuri

63=216

RGB: riassumendo

Modelli sottrattivi

• Colori primari sottratti al bianco per ottenere tutti i colori fino al nero

• Gli ambienti sottrattivi sono quelli riflettenti di natura (un’immagine a colori su carta)

Lo spazio CMY

• Modello duale del modello RGB – componenti sottrattive rispetto alla luce bianca– stampa (colore di base bianco - foglio di carta)

• Ciano, magenta, giallo complementari di rosso, verde e blu

Colori duali:ciano - rossomagenta - verdegiallo - blu

Spazio geometrico CMY

Origine del sistema:bianco VS. nero (RGB)

Nero = ciano + magenta + giallo

(1,0,0)ciano

(1,1,0)blu

(0,1,0)magenta

(0,1,1)rosso

(1,1,1)nero

(0,0,1)giallo

(1,0,1)verde

(0,0,0)bianco M

Y

C

La stampa

• Colore di sfondo = foglio di carta (es. bianco)

• Inchiostri sottraggono componenti alla luce riflessa (C sottrae R, M sottrae G, Y sottrae B)

• Colore riflesso (es. G = W-R-B = W+C+Y) – totale (es. bianco W=R+G+B) – meno assorbimenti (es. C+Y assorbe R e B)

Riassumendo CMY

Relazioni CMY - RGB

• Un vettore indica un certo colore• Conversioni di sistema:

– vettore unitario rappresenta il bianco in RGB– vettore unitario rappresenta nero in CMY

CM

Y

RG

B

RGB

CMY

111

= -

RGB

CMY

111

= -

RGB

CMY

255255255

= -

CMY

RGB

255255255

= -

Problemi da RGB a CMY

• Differenza tra colori rappresentabili su monitor e stampante (ma anche tra monitor differenti)

• Differenza sulle caratteristiche del supporto della stampa (carta diversa per assorbimento, tessitura, ruvidezza, …)

Problemi di RGB e CMY

• Come si sfuma un colore per passare a un altro? • Come si visualizza all’interno del cubo una curva?

– la curva rappresenta una certa gamma di colori– esempio: bianco, celeste, azzurro, blu, blu intenso, nero

• Come si mettono in relazione i sistemi con le proprietà psicofisiche?

Il Modello HSI

• Modello intuitivo/percettivo dei colori

• Hue (colore, tinta, tonalità)

• Saturation (saturazione): quantità di grigio contenuta in un colore

• Intensità: luce emessa

Relazione concettuale tra RGB e HSI

Intensità luminosa

Saturazione

Tonalità e saturazione in HSI

Tinta, tonalità (hue)

• parametro discriminatore (dimensione) che permette di distinguere il “colore” del colore

• scala di percezione (parte da e ritorna al rosso)

Saturazione (saturation)

• distanza di un colore dalla percezione acromatica con medesima luminosità

• misura del grado di diluizione del colore con il bianco (% colore puro + luce bianca)

Esempi:– colore puro (rosso) saturato al 100%– aggiungendo bianco e nero, la saturazione decresce – luce acromatica saturata allo 0%

Intensità

• scala di percezione della somiglianza del colore ad uno di una serie di colori acromatici, livelli di grigio (da molto scuro a molto chiaro)

• luminosità (attributo dell’oggetto riflettente) VS brillantezza (attributo dell’illuminazione in cui viene visto l’oggetto)

Il sistema HSI

blu

ciano

verde giallo

rossomagenta

nero0

1

V

H

Sbianco

HSI: piano colore triangolare

HSI: piano colore circolare

Spazi YUV, YIQ, YCbCr

• Standard nella trasmissione televisiva a colori per compatibilità con ricevitori B/N

• Separano luminanza (Y) e crominanza (U e V, I e Q, Cb e Cr)

• YUV per PAL, YIQ per NTSC, YCbCr digitale

Lo spazio YUV

• Componente Y (0,59xG + 0,3xR + 0,11xB)– colore primario che segue la curva di risposta

dell’occhio alla luminosità– nei sistemi B/N tale componente si visualizza come

segnale di luminanza

• Componenti U=B-Y (dal blu al giallo), V=R-Y (dal magenta al ciano)

Conversione tra YIQ e RGB

• Spazio YIQ (NTSC) non cartesiano

• Gli assi formano un poliedro convesso

• Matrice di conversione:

RGB

YIQ

0.30 0.59 0.110.60 -0.28 -0.320.21 -0.52 0.31

= -

Capacità del sistema visivo umano

• Distingue approssimativamente 350 colori• Differenze distinguibili sulla TINTA

– l dominante distante circa 1 nm– Agli estremi dello spettro circa 10 nm– Circa 128 tinte

• Differenze distinguibili sulla SATURAZIONE – Capacità di distinzione più limitate

Utilità dei colori nella visione

• Distinzione degli oggetti di interesse dallo sfondo– Es.: Frutta matura in contrasto con le foglie

• Proprietà degli oggetti– Es.: Colori diversi dal verde indicano la frutta matura

• Identificazione degli oggetti – Es.: Trovare la frutta matura in mezzo alle foglie

La profondità

Stereopsi binoculare

La profondità

• Alcuni indizi di profondità richiedono un solo occhio (visione monoculare)

• Dipinti, fotografie, televisione• Due occhi sulla stessa immagine

• Tecnica della prospettiva

Immaginesinistra

Immagine destra

Oggettopercepito

La stereopsi (visione stereoscopica)

Il punto di fissazionesempre al centro di ciascuna retina

Immagine del punto lontanoImmagine del punto di fissazione

Immagine del punto vicino

Punto vicino

P0

PPunto lontano

La disparità binoculare

Punto di fissazione

Dati numerici

• negli esseri umani, b=6 cm

• Per Z=100cm– Minimo dq rilevabile 0o,0014– dq = 2.42 x 10-5 rad– dZ è circa 0.4 mm

• Per Z=30 cm– si arriva a un dZ di circa 0.036 mm

P0

P

Z

b

d Z

q/2 q/2

PL PR

q

b /2 b /2

IZ

dqdq/2

Problema della corrispondenza

Come si fa a mettere in corrispondenza le proiezioni che nelle due immagini visive corrispondono a uno stesso punto della scena?

NB: le stesse posizioni sulle due retine (o immagini della camera) non corrispondono allo stesso punto sulla scena

Due ipotesi

• top-down: problema circolo vizioso– struttura degli oggetti predice disparità retiniche – si identificano gli oggetti nella scena e si fanno

corrispondere le medesime parti

• bottom up: problema intensità differenti – valori intensità per predire le strutture a livello più alto– si fanno corrispondere valori di intensità delle due

matrici

Prove empiriche

• bottom-up: il sistema funziona senza conoscenze di alto livello

• top-down: il sistema funziona quando i dati sono degradati

Stereogrammi con figuregeometriche (‘800)

Stereogrammi a punti casuali di Julesz (anni ‘60)

Autostereogrammi (1979)(geometrico)

Autostereogramma (zoologico)

Implicazioni di Julesz

• La stereopsi può funzionare bottom-up– non si percepisce il contenuto senza la stereopsi– le conoscenze di alto livello non aiutano la stereopsi

• Frisby, Clatworthy: dire alle persone cosa si dovrebbe vedere non facilita la percezione

La proiezione stereoscopica

Immagini stereoscopiche

Conclusioni sulla profondità

Unici elementi certi della visione stereoscopica

• utilizza elementi di basso livello dello schema primario

• è guidata da vincoli innati propri del mondo fisico

La tessitura (texture)

La tessitura

• proprietà delle superfici associate con le qualità tattili che essi suggeriscono

• pattern ripetuto spazialmente su una superficie, periodici reali, o in senso statistico

• gradiente di tessitura creato dalla presenza di oggetti o segni più o meno della stessa forma o dimensione a intervalli regolari su una superficie

Esempio: pattern periodici

• pattern di aperture (finestre e balconi) su un edificio

• macchie sulla pelle di un leopardo

• fili d’erba su un prato

• gente allo stadio

Tessitura e superfici

• Quando i pattern sono regolari è possibile scoprire l’orientamento e la forma delle superfici da una singola immagine

• Come?– Elementi fondamentali della tessitura sono i tasselli– Dimensione, forma e spaziatura sono “uniformi”

nella scena 3-D– Invece dimensione, forma e spaziatura variano

nell’immagine (una volta proiettati)

Esempi

Variazione dei tasselli

O

nY

Zs

X

Gradienti di tessitura

Tessitura

Il movimento

Movimento e forma: dimostrazione di Ullman

Stereopsi e movimento

(a) un cubo di Rubik rotante

(b) 1/2 secondopiù tardi

La prospettiva e i contorni

Indizi dati dalle distorsioni della formadovute alla proiezione

Disegni senza sfumature e con ombre

4 tipi di giunzione:L, T, Y, ­

Oggetti impossibiliLinea tra A e B.- nei pressi di A:

sx: superficie occlusadx: superficie (orizzontale)

- nei pressi di B:sx: superficie (verticale)dx: superficie (orizzontale)

Linea tra C e D.nei pressi di C:

sx: superficie occlusadx: superficie (orizzontale)

nei pressi di B:sx: superficie (orizzontale)

dx: superficie (verticale)

A

B

C

D

Altri oggetti impossibili

Lo schema a 2-D e 1/2

Dove arriva la percezione pura

Sketch a2-D e 1/2

puntaspilli: ciascuno spillo rappresenta profondità e orientamento di una regione

Conclusioni sulla percezione pura

• Lo schema a 2-D e 1/2 non è sufficiente a far muovere un robot nel mondo

• Rappresentazione di una scena:– deve rendere possibile l’identificazione degli oggetti– deve essere indipendente dal punto di vista

particolare

Il passaggio da 2D a 3Dmatrice di pixel

schema primario

schema a 2D e ½

scena 3D

I fase

II fase

III fase

Terzo livello

La struttura 3D indipendente dal punto di vista dell’osservatore

schema a 2D e ½

scena 3D

III fase

Processi tipici di alto livello

• Riconoscimento di oggetti e volti• Percezione di scene e effetti contestuali• Effetti delle intenzioni e delle conoscenze sugli

oggetti sulla percezione• Strutture mentali in grado di integrare viste

successive di oggetti e scene

Input al terzo livello

• rappresentazione simbolica della profondità e dell’orientamento delle superfici nel campo visivo

• rappresentazione che cambia quando il sistema si muove

• rappresentazione più utile e stabile se rende esplicite sia la forma 3D intrinseca degli oggetti che le relazioni spaziali tra di essi

Output del terzo livello

• rende esplicita la forma di tutto ciò che si trova nella scena (aree piene e spazi vuoti)

• gli elementi riconosciuti devono essere raggiungibili e manipolabili specificando le posizioni in 3 coordinate

Catalogo di Marre Nishihara

In realtà si usano i conigeneralizzati: geoni

Esistono forme che nonsi possono rappresentarecome coni generalizzati

Es.: giornali spiegazzatiorigami

Organizzazione gerarchica degli oggetti complessi

Conclusioni su approcci top-down

• caratteristica fondamentale: uso di informazioni di alto livello

• assunzione sperimentale: un processo in presenza di dati degradati è guidato da conoscenze di alto livello

Pura illusione

Conclusioni generali sulla visione

• Problema della visione: quali oggetti hanno provocato le configurazioni luminose sulla retina?

• Elaborazione bottom-up (basso livello)– dall’evoluzione, è incapsulata nel sistema nervoso– livello non influenzato dal controllo conscio

• Elaborazione top-down (alto livello)– acquisita dall’individuo, esplicita, accessibile– consapevolezza (e non) dell’uso di tale conoscenza

(inferenza)

Recommended