Instrumento Audiovisual Inteligente
Intelligent Grafikton
Agenda• Introducción
• Objetivos
• Planteamiento del Problema
• Pianographique
• Aprendizaje por reforzamiento
• Algoritmos utilizados
• Conceptos Musicales
• Metodología
• Desarrollo– Espiral 1– Espiral 2– Espiral 3
• Resultados
• Conclusiones
• Recomendaciones
• Dudas y Preguntas
Introducción
• Masificación del uso de las computadoras
+Crecimiento
de la IA =
• La inteligencia Artificial
Robótica, sistemas expertos,
procesamiento de lenguaje y video juegos
• ¿Inteligencia Artificial y Música ?
Sistemas autónomos de Composición musical
Intelligent Grafikton
Objetivos
• Objetivo General
Diseñar e implementar un sistema inteligente y visualmente agradable que utilice el teclado y el mouse como dispositivos de entrada para proveer gráficos y sonidos de diversos instrumentos musicales y samples cortos de piezas según las preferencias del usuario.
Objetivos
• Objetivos Específicos
– Identificar y utilizar algoritmos que permitan la continua generación de usuario según sus preferencias.
– Identificar el algoritmo de aprendizaje que mejor se comporte ante las preferencias del usuario.
– Identificar y utilizar herramientas para la grabación de sonidos en formato de alta calidad.
– Grabar y clasificar sonidos según conceptos de teoría musical para la implementación del sistema.
– Identificar técnicas de síntesis de sonido que permitan la grabación digital del mismo.
– Identificar y utilizar herramientas y librerías para el desarrollo multimedia que permitan la implementación del sistema.
Planteamiento del Problema
• IA: robótica, sistemas de navegación autónoma y video juegos
• Pianographique: arte (música) e informática.
• IA y Música: sistemas algorítmicos para la composición musical como la Suite Illiac.
• Un estilo de Pianographique de conducta no determinística basada en las preferencias del usuario para generar nuevas formas musicales, compositores: usuario y maquina
• Esquematización del problema planteado
Pianographique• Autor: Jean Luque Lamarque, artista programador de
origen francés.
• Provee sonidos y gráficos de manera determinística haciendo uso del teclado y el mouse
Aprendizaje por reforzamiento
• Utilizado en casos donde es difícil determinar lo que debe hacer un programa para solucionar un problema: conjunto de entrenamiento.
• Interactúa un agente con su ambiente:
• Agente: el ente que realizará acciones y aprenderá una tarea determinada.
• Ambiente: conforma los estados donde puede encontrarse el agente en un tiempo t.
• Función de reforzamiento: retroalimentación con recompensas o castigos.
• Función Valor: “Cuán bien” es estar en un estado, o “cuán bien” es realizar una acción en un estado.
• Si un agente no es informado de sus recompensas y llega a un estado catastrófico ¿Cuál de todas la acciones que realizó lo llevo a este estado final?
– Programación dinámica:
• Si realizar una acción en un estado causa inmediatamente resultados inadecuados, la misma debe evitarse.
• Si toda acción en un estado causa resultados inadecuados, entonces debe evitarse dicho estado
• Iteración de valores
Algoritmos utilizados
1,max ttut xVuxrxV
: Factor que reduce la importancia de reforzamientos futuros para la actualización.
- Valor de estar en un estado x. Notación V(x)
- Matriz de Valores del algoritmo Iteración de Valores
Estar en el estado x1 vale
0,2
Encontrarse en el estado x2 vale 0,12. ¡ Estaba mejor en el estado x1 !
• Aprendizaje Q
Valor Q: Valor de realizar una acción u, encontrándose en un estado x. Notación: Q(x,u).
11,max,,
1
ttuttttuxQuxruxQ
t
- Matriz de Valores del algoritmo Iteración de Valores
Cuán bien es realizar la acción u7 en el estado x1
Cuán bien es realizar la acción u7 en el estado X2. ¡ Castigado !