41
Visión Artificial RICARDO SÁNCHEZ CASTILLO

Vision artificial

Embed Size (px)

Citation preview

  1. 1. Visin Artificial RICARDO SNCHEZ CASTILLO
  2. 2. Qu es la visin artificial? Cuatro trminos son usados frecuentemente: Procesamiento de imgenes Anlisis de imgenes Grficos por computadora Visin por computadora (Visin artificial) 2
  3. 3. Adquisicin de imgenes 3 Representacin digital de lo observado 123 43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34 23 123 43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34 23 123 43 76 93 245 43 64 75 34 56 76 34 23 65 34 23 76 34 23
  4. 4. Procesamiento de Imgenes Reduccin de ruido, suavizado, contraste, cambio de apariencia, etc.. 4
  5. 5. Anlisis de Imgenes Obtener medidas cuantitativas a partir de una imagen. 5
  6. 6. Grficos por computadora Crear imgenes a partir de modelos de objetos Modelado Iluminacin Textura Animacin Proyeccin 6
  7. 7. Visin artificial Invertir el proceso de formacin de una imagen para obtener informacin acerca del mundo observado. Algunos problemas son: Deteccin de caractersticas Deteccin y reconocimiento de objetos Obtener un modelo 3D a partir de imgenes Seguimiento y anlisis de movimiento Reconocimiento de eventos 7
  8. 8. Porqu es tan difcil? Un problema similar a la Ingeniera Inversa. Cada pxel de una imagen es una funcin de: Reflectividad del objeto observado. La forma del objeto. Condiciones de iluminacin. El ngulo desde donde se observa. La visin biolgica invierte esa funcin muy fcil aparentemente. 8
  9. 9. El problema No hay suficiente informacin en la imagen que nos permita reconstruir el ambiente observado. A partir de 3 o 4 nmeros enteros (RGB) Cmo obtener la posicin en 3D, la forma, reflectividad, color, textura? 9
  10. 10. Reconocimiento de objetos 10
  11. 11. Tracking 11
  12. 12. Tracking 12
  13. 13. Deteccin de caractersticas Aplicar una funcin a un conjunto de pxeles Elegir aquellos que tengan el valor ms alto Describirlos de alguna forma Tenemos menor cantidad de datos, pero ms estables y con ms informacin. Caractersticas: Sin variacin nicas 13
  14. 14. Variacin 14
  15. 15. nicas 15
  16. 16. Bordes 16 Deteccin de bordes por mtodo de Canny
  17. 17. Esquinas 17 Harris Corner Detector
  18. 18. SIFT (Scale Invariant Feature Transform) Rpido y eficiente, puede incluso ejecutarse en tiempo real. Soporta cambios en la perspectiva de hasta 60 grados. Cambios significativos en la iluminacin. 18
  19. 19. SIFT Features 19
  20. 20. Correspondencia estreo Encontrar la correspondencia entre pxeles o caractersticas en 2 o ms imgenes y convertir sus posiciones 2D en profundidades 3D 20
  21. 21. Correspondencia Se utiliza triangulacin para recuperar la profundidad 21 Requiere: Conocer la geometra del ambiente y la cmara Realizar la correspondencia entre cada punto
  22. 22. Porqu es difcil? Ambigedad al realizar la correspondencia entre puntos y variacin en la apariencia de las caractersticas. Necesitamos hacer asunciones acercar del ambiente. 22 1 2 1 2 3 4 4 3
  23. 23. Plano epipolar Geometra Epipolar 23 Lnea Epipolar Lnea Epipolar
  24. 24. Rectificacin 24 La geometra epipolar y rectificacin reducen el problema de correspondencia a una sola dimensin.
  25. 25. Disparidad y profundidad Disparidad es la diferencia entre dos puntos correspondientes en cada imagen. 25 = ( )
  26. 26. Disparidad y profundidad 26 Z X f f I P(X,Y,Z) = = = = = = =
  27. 27. Procedimiento bsico Existen muchos algoritmos, pero la mayora sigue el siguiente proceso: Calibrar cmaras Rectificar imgenes Correspondencia Estimar profundidad Rectificacin y profundidad se consideran resueltos. Calibracin tiene algunas investigaciones. Correspondencia es el principal problema 27
  28. 28. Correspondencia estreo Dos mtodos principalmente: Sparse algorithms PMF algorithm Dense algorithms Zhang and Shan algorithm (A Progressive Scheme) 28
  29. 29. Sparse algorithms Obtener las caractersticas de una imagen (bordes, esquinas, SURF, etc.) y realizar la correspondencia en base a una funcin. Cmo asegurarse de que un par de caractersticas efectivamente corresponden una a la otra? 29
  30. 30. Gradiente de disparidad Dos caractersticas no deberan de ser aceptadas si la gradiente de disparidad es mayor que cierto valor Estudios demuestran que este lmite es 1.0 en los humanos* 30 *Burt and Julesz, A Disparity Gradient Limit for Binocular Fusion, Perception, 1980. Ai Bi A B Ar Br S(A,B) , = , = , ,
  31. 31. Algoritmo PMF Obtener las caractersticas de cada imagen 31 Ai Bi 1 3 2
  32. 32. Algoritmo PMF Calcular la correspondencia y relacionar cada caracterstica con cierto valor de certeza. 32 Ai Bi 1 3 2 Izquierda Derecha Certeza A 1 12 A 2 5 B 3 10
  33. 33. Algoritmo PMF Fortalecer cada pareja basado en la gradiente de disparidad. 33 Ai Bi 1 3 2 Izquierda Derecha Certeza A 1 12 A 2 5 B 3 10 S=4 (, ) = , M N , = 10 4 =2.5 =14.5 =13
  34. 34. Dense algorithms Calcular la disparidad para cada pxel. Al final obtenemos una imagen llamada Disparity Space Image(DSI) el cual es una funcin de (x, y, d) Algunos lo calculan como P(d|x,y) 34
  35. 35. A Progressive Scheme-Zhang and Shan Los pxeles en la imagen izquierda se pueden etiquetar como: Matched, Unknown, NoMatch. Todos comienzan como Unknown. Calcular las caractersticas de cada imagen y relacionarlas. Algunos pxeles sern etiquetados como Matched. 35
  36. 36. A Progressive Scheme-Zhang and Shan Para cada pxel izquierdo etiquetado como Unknown: Obtener la lista de pxeles candidatos de la imagen derecha, es decir, aquellos que satisfacen la lnea epipolar y la gradiente de disparidad basado en los Matched. 36
  37. 37. A Progressive Scheme-Zhang and Shan Calcular el coeficiente de correlacin con cada pxel candidato. 37 Si solo hay un pico: Relacionar ambos pxeles y etiquetarlo como Matched. Si hay ms de un pico: No hay suficiente informacin an, as que se deja Unknown. Si no hay picos: No se puede relacionar la caracterstica y se etiqueta como NoMatch.
  38. 38. Aplicaciones 38
  39. 39. Ms de dos imgenes 39
  40. 40. Recursos Coleccin de libros sobre CV: http://homepages.inf.ed.ac.uk/rbf/CVonline/books.htm Empresas que utilizan CV: http://www.cs.ubc.ca/~lowe/vision.html Recursos de todo tipo: http://homepages.inf.ed.ac.uk/rbf/CVonline/ Explicacin interactiva sobre la geometra epipolar: http://www.ai.sri.com/~luong/research/Meta3DViewer/EpipolarGeo .html Contiene imgenes rectificadas con sus imgenes de disparidad reales para probar tus algoritmos: http://vision.middlebury.edu/stereo/ 40
  41. 41. Dudas, comentarios [email protected] Twitter: @ricardo_8990 Diapositivas: http://www.slideshare.net/RicardoSnchezCastill/ Muchas Gracias! 41