Preview:
Citation preview
- 1. Visin Artificial RICARDO SNCHEZ CASTILLO
- 2. Qu es la visin artificial? Cuatro trminos son usados
frecuentemente: Procesamiento de imgenes Anlisis de imgenes Grficos
por computadora Visin por computadora (Visin artificial) 2
- 3. Adquisicin de imgenes 3 Representacin digital de lo
observado 123 43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34
23 123 43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34 23 123
43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34 23
- 4. Procesamiento de Imgenes Reduccin de ruido, suavizado,
contraste, cambio de apariencia, etc.. 4
- 5. Anlisis de Imgenes Obtener medidas cuantitativas a partir de
una imagen. 5
- 6. Grficos por computadora Crear imgenes a partir de modelos de
objetos Modelado Iluminacin Textura Animacin Proyeccin 6
- 7. Visin artificial Invertir el proceso de formacin de una
imagen para obtener informacin acerca del mundo observado. Algunos
problemas son: Deteccin de caractersticas Deteccin y reconocimiento
de objetos Obtener un modelo 3D a partir de imgenes Seguimiento y
anlisis de movimiento Reconocimiento de eventos 7
- 8. Porqu es tan difcil? Un problema similar a la Ingeniera
Inversa. Cada pxel de una imagen es una funcin de: Reflectividad
del objeto observado. La forma del objeto. Condiciones de
iluminacin. El ngulo desde donde se observa. La visin biolgica
invierte esa funcin muy fcil aparentemente. 8
- 9. El problema No hay suficiente informacin en la imagen que
nos permita reconstruir el ambiente observado. A partir de 3 o 4
nmeros enteros (RGB) Cmo obtener la posicin en 3D, la forma,
reflectividad, color, textura? 9
- 10. Reconocimiento de objetos 10
- 11. Tracking 11
- 12. Tracking 12
- 13. Deteccin de caractersticas Aplicar una funcin a un conjunto
de pxeles Elegir aquellos que tengan el valor ms alto Describirlos
de alguna forma Tenemos menor cantidad de datos, pero ms estables y
con ms informacin. Caractersticas: Sin variacin nicas 13
- 14. Variacin 14
- 15. nicas 15
- 16. Bordes 16 Deteccin de bordes por mtodo de Canny
- 17. Esquinas 17 Harris Corner Detector
- 18. SIFT (Scale Invariant Feature Transform) Rpido y eficiente,
puede incluso ejecutarse en tiempo real. Soporta cambios en la
perspectiva de hasta 60 grados. Cambios significativos en la
iluminacin. 18
- 19. SIFT Features 19
- 20. Correspondencia estreo Encontrar la correspondencia entre
pxeles o caractersticas en 2 o ms imgenes y convertir sus
posiciones 2D en profundidades 3D 20
- 21. Correspondencia Se utiliza triangulacin para recuperar la
profundidad 21 Requiere: Conocer la geometra del ambiente y la
cmara Realizar la correspondencia entre cada punto
- 22. Porqu es difcil? Ambigedad al realizar la correspondencia
entre puntos y variacin en la apariencia de las caractersticas.
Necesitamos hacer asunciones acercar del ambiente. 22 1 2 1 2 3 4 4
3
- 23. Plano epipolar Geometra Epipolar 23 Lnea Epipolar Lnea
Epipolar
- 24. Rectificacin 24 La geometra epipolar y rectificacin reducen
el problema de correspondencia a una sola dimensin.
- 25. Disparidad y profundidad Disparidad es la diferencia entre
dos puntos correspondientes en cada imagen. 25 = ( )
- 26. Disparidad y profundidad 26 Z X f f I P(X,Y,Z) = = = = = =
=
- 27. Procedimiento bsico Existen muchos algoritmos, pero la
mayora sigue el siguiente proceso: Calibrar cmaras Rectificar
imgenes Correspondencia Estimar profundidad Rectificacin y
profundidad se consideran resueltos. Calibracin tiene algunas
investigaciones. Correspondencia es el principal problema 27
- 28. Correspondencia estreo Dos mtodos principalmente: Sparse
algorithms PMF algorithm Dense algorithms Zhang and Shan algorithm
(A Progressive Scheme) 28
- 29. Sparse algorithms Obtener las caractersticas de una imagen
(bordes, esquinas, SURF, etc.) y realizar la correspondencia en
base a una funcin. Cmo asegurarse de que un par de caractersticas
efectivamente corresponden una a la otra? 29
- 30. Gradiente de disparidad Dos caractersticas no deberan de
ser aceptadas si la gradiente de disparidad es mayor que cierto
valor Estudios demuestran que este lmite es 1.0 en los humanos* 30
*Burt and Julesz, A Disparity Gradient Limit for Binocular Fusion,
Perception, 1980. Ai Bi A B Ar Br S(A,B) , = , = , ,
- 31. Algoritmo PMF Obtener las caractersticas de cada imagen 31
Ai Bi 1 3 2
- 32. Algoritmo PMF Calcular la correspondencia y relacionar cada
caracterstica con cierto valor de certeza. 32 Ai Bi 1 3 2 Izquierda
Derecha Certeza A 1 12 A 2 5 B 3 10
- 33. Algoritmo PMF Fortalecer cada pareja basado en la gradiente
de disparidad. 33 Ai Bi 1 3 2 Izquierda Derecha Certeza A 1 12 A 2
5 B 3 10 S=4 (, ) = , M N , = 10 4 =2.5 =14.5 =13
- 34. Dense algorithms Calcular la disparidad para cada pxel. Al
final obtenemos una imagen llamada Disparity Space Image(DSI) el
cual es una funcin de (x, y, d) Algunos lo calculan como P(d|x,y)
34
- 35. A Progressive Scheme-Zhang and Shan Los pxeles en la imagen
izquierda se pueden etiquetar como: Matched, Unknown, NoMatch.
Todos comienzan como Unknown. Calcular las caractersticas de cada
imagen y relacionarlas. Algunos pxeles sern etiquetados como
Matched. 35
- 36. A Progressive Scheme-Zhang and Shan Para cada pxel
izquierdo etiquetado como Unknown: Obtener la lista de pxeles
candidatos de la imagen derecha, es decir, aquellos que satisfacen
la lnea epipolar y la gradiente de disparidad basado en los
Matched. 36
- 37. A Progressive Scheme-Zhang and Shan Calcular el coeficiente
de correlacin con cada pxel candidato. 37 Si solo hay un pico:
Relacionar ambos pxeles y etiquetarlo como Matched. Si hay ms de un
pico: No hay suficiente informacin an, as que se deja Unknown. Si
no hay picos: No se puede relacionar la caracterstica y se etiqueta
como NoMatch.
- 38. Aplicaciones 38
- 39. Ms de dos imgenes 39
- 40. Recursos Coleccin de libros sobre CV:
http://homepages.inf.ed.ac.uk/rbf/CVonline/books.htm Empresas que
utilizan CV: http://www.cs.ubc.ca/~lowe/vision.html Recursos de
todo tipo: http://homepages.inf.ed.ac.uk/rbf/CVonline/ Explicacin
interactiva sobre la geometra epipolar:
http://www.ai.sri.com/~luong/research/Meta3DViewer/EpipolarGeo
.html Contiene imgenes rectificadas con sus imgenes de disparidad
reales para probar tus algoritmos:
http://vision.middlebury.edu/stereo/ 40
- 41. Dudas, comentarios ricardo.8990@gmail.com Twitter:
@ricardo_8990 Diapositivas:
http://www.slideshare.net/RicardoSnchezCastill/ Muchas Gracias!
41