26
“ANÁLISIS, DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA DE BÚSQUEDA DE AUDIO MEDIANTE LA INTEGRACIÓN DE RECONOCIMIENTO AUTOMÁTICO DE VOZ Y BÚSQUEDA POR INDEXACIÓN.” Vicente Ordóñez R.

Sistema de Recuperacion de Audio

Embed Size (px)

Citation preview

Page 1: Sistema de Recuperacion de Audio

“ANÁLISIS, DISEÑO E IMPLEMENTACIÓN DE UN SISTEMA

DE BÚSQUEDA DE AUDIO MEDIANTE LA INTEGRACIÓN DE

RECONOCIMIENTO AUTOMÁTICO DE VOZ Y BÚSQUEDA POR

INDEXACIÓN.”

Vicente Ordóñez R.

Page 2: Sistema de Recuperacion de Audio

EL PROBLEMA

Page 3: Sistema de Recuperacion de Audio

3

EL PROBLEMA

Búsqueda de documentos de audio (multimedios que incluyan audio), cuando estos documentos no poseen información de descripción (metadatos).

Page 4: Sistema de Recuperacion de Audio

4

MOTIVACIÓN

Investigar acerca de herramientas para hacer reconocimiento automático del habla y los protocolos utilizados para acceder a estas tecnologías.

Conocer la relación entre eficacia de las tecnologías de reconocimiento de voz subyacentes y la efectividad del sistema como un todo.

Page 5: Sistema de Recuperacion de Audio

5

OBJETIVOS

Investigar el estado del arte de las tecnologías de reconocimiento automático de voz.

Analizar y diseñar una arquitectura que permita extraer transcripciones de grandes cantidades de archivos digitales de audio para luego almacenarlas de tal forma que posteriormente se puedan efectuar búsquedas de manera eficiente.

 Implementar un prototipo de la arquitectura propuesta utilizando un motor de reconocimiento de voz disponible en el mercado.

Page 6: Sistema de Recuperacion de Audio

6

OBJETIVOS

Diseñar e implementar un modelo de aplicación que permita la integración de los componentes de esta arquitectura con un sistema ya existente.

Implementar un buscador de archivos de audio accesible como una aplicación Web y que utilice la arquitectura propuesta. 

Page 7: Sistema de Recuperacion de Audio

ANÁLISIS Y DISEÑO

Page 8: Sistema de Recuperacion de Audio

8

CASOS DE USO DEL SISTEMA

Page 9: Sistema de Recuperacion de Audio

9

FLUJO DE PROCESOS DEL SISTEMA

Page 10: Sistema de Recuperacion de Audio

10

MODELO DEL SISTEMA

Page 11: Sistema de Recuperacion de Audio

11

CAPAS DE ABSTRACCIÓN DEL SISTEMA

Page 12: Sistema de Recuperacion de Audio

IMPLEMENTACIÓN

Page 13: Sistema de Recuperacion de Audio

13

COMPONENTES IMPLEMENTADOS

Page 14: Sistema de Recuperacion de Audio

14

ACCESO A SERVICIOS DE RECONOCIMIENTO DE VOZ

Page 15: Sistema de Recuperacion de Audio

CLIENTE WEB

15

Page 16: Sistema de Recuperacion de Audio

DEMO

Page 17: Sistema de Recuperacion de Audio

PRUEBAS

Page 18: Sistema de Recuperacion de Audio

18

RENDIMIENTO DE INDEXACIÓN

Page 19: Sistema de Recuperacion de Audio

19

RENDIMIENTO DE BÚSQUEDA

Prueba 1 Prueba 2 Prueba 3

Cantidad de documentos total en el índice

10000 100000 250000

Tamaño resultante del índice

12.4 MB 125 MB 300 MB

Tiempo promedio para cada consulta

4.17ms 16.78 ms 35.84 ms

Desviación estándar de los tiempos de consulta

17.3 ms 13.29 ms 15.49 ms

Máximo tiempo registrado

174 ms 130 ms 155 ms

Mínimo tiempo registrado

1 ms 11 ms 26 ms

Page 20: Sistema de Recuperacion de Audio

20

PRECISIÓN DEL MOTOR DE RECONOCIMIENTO DE VOZ

Transcripción Palabrasreconocidascorrectamente

Total de palabras reconocidas

Precisión

Transcripción1 123 385 32%

Transcripción2 53 171 31%

Transcripción3 136 230 60%

Total 312 786 40%

Page 21: Sistema de Recuperacion de Audio

21

RETENTIVA DEL MOTOR DE RECONOCIMIENTO DE VOZ

Transcripción Palabrasreconocidascorrectamente

Total de palabras en el audio

Retentiva

Transcripción1 123 277 44%

Transcripción2 53 134 39%

Transcripción3 136 302 45%

Total 312 713 44%

Page 22: Sistema de Recuperacion de Audio

22

PRUEBAS CON USUARIOS

0102030405060708090

100

Computer Technology

Scientific Research

Presidential Race

Usuario 1

Usuario 2

Usuario 3

Usuario 4

Usuario 5

Page 23: Sistema de Recuperacion de Audio

23

PRECISIÓN DEL BUSCADOR

Transcripción Cantidad deDocumentosRelevantes

Total de Resultados Considerados

Precisión

Computer technology

8 10 80%

Scientific Research

9,8 10 98%

Presidential Race 6,8 10 68%

Total 24,6 30 82%

Page 24: Sistema de Recuperacion de Audio

24

CONCLUSIONES

Los resultados de búsqueda resultan relevantes utilizando solamente información obtenida con reconocimiento de voz.

Precisión del sistema de búsqueda es mayor a la precisión del sistema de reconocimiento de voz subyacente.

Page 25: Sistema de Recuperacion de Audio

25

PERSPECTIVAS

Los sistemas de reconocimiento del habla se continuarán integrando con los sistemas operativos modernos.

Surgirá la necesidad de llegar finalmente a un consenso entre fabricantes y seguir estándares.

Page 26: Sistema de Recuperacion de Audio

PREGUNTAS