17
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima 1 ONTOLOGÍA PARA LA BÚSQUEDA DE MÚSICA Introducción En los últimos años el intercambio de música en formato electrónico se vio beneficiado por los avances tecnológicos en redes, proceso de señales y compresión de audio. Estos avances, brindan a los usuarios finales de estas tecnologías el acceso a vastos catálogos de música, esto hace necesario tener disponible metadatos que describan el contenido musical de los catálogos. Los metadatos son usados como capa de conocimiento para servicios de envío de música electrónica. Cada ítem del catálogo puede estar definido por un conjunto de descriptores, que toman su valor de una ontología predefinida. Algunos ejemplos de descriptores pueden ser el nombre del título, el nombre del autor, el género musical, principales instrumentos, etc. Este estudio está enfocado hacia la clasificación de canciones en diversos géneros como: Cumbia, Pop, Romántica, Salsa, Vallenato, etc. Existen varias maneras de abordar el problema de la clasificación de música. Este estudio se centra en la realización de tal proceso mediante la identificación y extracción de características relevantes que pueden ser usadas como entradas para la creación de una Ontología. Objetivos Obtener un mecanismo sencillo y flexible para la utilización de ontologías que sea de ayuda concreta para tareas de clasificación de la música por tipo de género, año, etc. Analizar y entender las herramientas que se usaran para este proyecto. Representar el conocimiento sobre música en un mapa conceptual. Crear una ontología sobre un sistema de búsqueda de música. Herramientas Para La Construcción De La Ontología Para la construcción de la ontología utilizare CMapTools COE, ya que permite la exportación directa a la ontología formato OWL, para mostrar el conocimiento, se lo han representado gráficamente con la Herramienta Protege 4.0.2, se ha utilizado el siguiente conocimiento y para realizar el análisis del conocimiento y realizar las respectivas consultas twinkle-2.0-bin. Preguntas a Responder por Parte de La Ontología Las preguntas básicas que resolverá la ontología son las siguientes: Géneros de música que hay Nombre de la clase a la que pertenece el dominio nombreDisq Nombre de la clase a la que pertenece el dominio ubicación Listar todos los atributos que pertenecen a la clase disquera Listar todos los atributos que pertenecen a la clase Canción Listar las subclases de la clase Álbum Listar el nombre de los cantautores que forman parte del grupo de intérpretes. Listar los tipos de géneros musicales que hay. Listar los títulos o nombres de las canciones. Otras…

Proyecto sbc

  • Upload
    diana

  • View
    419

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

1

ONTOLOGÍA PARA LA BÚSQUEDA DE MÚSICA Introducción

En los últimos años el intercambio de música en formato electrónico se vio beneficiado por los avances tecnológicos en redes, proceso de señales y compresión de audio. Estos avances, brindan a los usuarios finales de estas tecnologías el acceso a vastos catálogos de música, esto hace necesario tener disponible metadatos que describan el contenido musical de los catálogos.

Los metadatos son usados como capa de conocimiento para servicios de envío de música electrónica. Cada ítem del catálogo puede estar definido por un conjunto de descriptores, que toman su valor de una ontología predefinida. Algunos ejemplos de descriptores pueden ser el nombre del título, el nombre del autor, el género musical, principales instrumentos, etc.

Este estudio está enfocado hacia la clasificación de canciones en diversos géneros como: Cumbia, Pop, Romántica, Salsa, Vallenato, etc. Existen varias maneras de abordar el problema de la clasificación de música. Este estudio se centra en la realización de tal proceso mediante la identificación y extracción de características relevantes que pueden ser usadas como entradas para la creación de una Ontología. Objetivos

Obtener un mecanismo sencillo y flexible para la utilización de ontologías que sea de ayuda concreta para tareas de clasificación de la música por tipo de género, año, etc.

Analizar y entender las herramientas que se usaran para este proyecto.

Representar el conocimiento sobre música en un mapa conceptual.

Crear una ontología sobre un sistema de búsqueda de música. Herramientas Para La Construcción De La Ontología Para la construcción de la ontología utilizare CMapTools COE, ya que permite la exportación directa a la ontología formato OWL, para mostrar el conocimiento, se lo han representado gráficamente con la Herramienta Protege 4.0.2, se ha utilizado el siguiente conocimiento y para realizar el análisis del conocimiento y realizar las respectivas consultas twinkle-2.0-bin. Preguntas a Responder por Parte de La Ontología Las preguntas básicas que resolverá la ontología son las siguientes: Géneros de música que hay Nombre de la clase a la que pertenece el dominio nombreDisq Nombre de la clase a la que pertenece el dominio ubicación Listar todos los atributos que pertenecen a la clase disquera Listar todos los atributos que pertenecen a la clase Canción Listar las subclases de la clase Álbum Listar el nombre de los cantautores que forman parte del grupo de intérpretes. Listar los tipos de géneros musicales que hay. Listar los títulos o nombres de las canciones. Otras…

Page 2: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

2

CONCEPTUALIZACIÓN DEL CONOCIMIENTO TAREA 1: Glosario de términos

NOMBRE SINÓNIMOS DESCRIPCIÓN TIPO

Música canción Combinación de sonidos de la voz humana o de instrumentos o ambos a la vez

concepto

Salsa - es un género y cultura musical muy movida concepto Pop - Abarca un conjunto de géneros y estilos que no se identifican

con naciones o etnias específicas concepto

Clásica - Música culta compuesta en el período clásico, de mediados del siglo XVIII hasta principios del XIX

concepto

Compositor Musicólogo Contenedor destinado a categorías en este caso cantantes concepto Álbum - Colección de pistas de audio relacionadas concepto Genero estilo categoría que reúne composiciones musicales que comparten

distintos concepto

Canción - Composición musical para la voz humana concepto País Nación País que es originario el cantante o la música concepto Año periodo Año del lanzamiento de un álbum música concepto Artista Músicos Personas quien elabora una obra de arte; en este caso música concepto Solista cantante Persona que interpreta música concepto Grupo Conjunto Conjunto musical formado por personas concepto Compositor - concepto Cumbia - Original de la región Caribe de Colombia y representa uno de

los ritmos folclóricos clásicos concepto

Rock - Estilos musicales derivados del rock and roll de los años cincuenta

concepto

Compositor - Persona o personas que realizan una composición musical concepto Disquera Casa disquera Lugar físico de grabación de las canciones que conformaran

un álbum musical. concepto

Ubicación lugar Sitio o sitos en donde se encuentra la casa disquera o sucursales

concepto

Numero pistas Numero canciones

Cantidad o numero de canciones que formaran un Álbum musical

concepto

lanzamiento - Fecha de lanzamiento de un Álbum musical concepto Titulo - Nombre que se le da a una determinada canción concepto Formato - Tipo en la que es gravada una canción concepto Duración tiempo Tiempo en minutos que dura una canción concepto Descripción Resumen Breve descripción de cada uno de los géneros musicales concepto Nombre Álbum - Nombre que se le da a un determinado Álbum que está por

salir a la venta. concepto

Page 3: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

3

TAREA 2: Construcción taxonomías de conceptos

Page 4: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

4

TAREA 3: Diagrama de relaciones Binarias

Page 5: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

5

TAREA 4: Diccionario de conceptos

Nombre del Concepto Atributo de la Clase Atributo Instancias

Relaciones

Género Musical descripción pertenece are

Álbum NombreAlbum, Nro_pistas contiene are

Canción titulo, duración, formato Es_cantada are

Interprete Nombre, tipoArtista Canta, lanza

Is a

Años fLanzamiento are

Idioma descripLenguaje are

Disquera NombreDisq, Ubicación produce are

dance - - is_a

Cumbia - - is_a

Salsa - - is_a

Rock - - is_a

Pop - - is_a

Regueton - - is_a

2002 - - is_a 2009 - - is_a

2008 - - is_a

2007 - - is_a

2006 - - is_a

2005 - - is_a

Inglés - - is_a Español - - is_a AyM - - is_a Sony Music - - is_a

Machete Music - - is_a

Universal Music - - is_a

InterdiscopoRecords - - is_a

JL producciones - - is_a

Latinum Music - - is_a

Star Records - - is_a

Warner Music - - is_a

La melodía de la Calle - - is_a El Patron la victoria - - is_a

iDon - - is_a

Perdoname - - is_a

Te amo - - is_a

PCD - - is_a

Shock Value - - is_a

Remixed - - is_a

Loose - - is_a

Reyes de la Cumbia - - is_a

El Doctorado - - is_a

Page 6: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

6

El Amor - - is_a

Diva virtual - - is_a

Luna - - is_a

Dejame Entrar - - is_a

Buttons - - is_a

The Way I are - - is_a

Release - - is_a

Searching - - is_a

Corazon partido - - is_a

Tony Dize - - is_a Tito El Banbino - - is_a

Don Omar - - is_a

Edy Lover - - is_a

Makano - - is_a

Pussycat Dolls - - is_a

Timbaland - - is_a

Tommy Aka - - is_a

Nissim - - is_a

Nelly Furtado - - is_a

TAREA 5: Describir en detalle las relaciones binarias Nombre de la

Relación Concepto

origen Cardinalidad

Máxima Concepto destino

Propiedad Matemática

Relación Inversa

canta interprete n canción simétrica esCantada

contiene álbum n canción Simétrica, transitiva pertenece A

pertenece canción n genero Simétrica, transitiva es Parte

produce disquera n álbum simétrica sonGrabados

interprete lanza n álbum simétrica esLanzado

Descripción de las clases disjuntas

Concepto origen Relación Concepto destino

Disquera disjuntos GéneroMusical

GéneroMusical disjuntos Interprete

GéneroMusical disjuntos Idioma

Idioma disjuntos Año

Interprete disjuntos Año

Interprete disjuntos GéneroMusical

Disquera disjuntos Idioma

Año disjuntos GéneroMusical

Page 7: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

7

TAREA 6: Describir en detalle los atributos de instancias

Nombre del Atributo de la instancia

Concepto Tipo de Valor

Rango de Valores

Cardinalidad

Numero de pistas de un Álbum Álbum String - (8,15)

Titulo de la canción Canción String 1 (1,1)

Nombre del Álbum Álbum String 1 (1,1)

Nombre del Artista Interprete String 1 (1,1)

Nombre de la disquera Disquera String 1 (1,1)

Año de lanzamiento de álbum Año String 1 (1,1)

TAREA 7: Descripción de los atributos de clase

Nombre del Atributo Concepto origen Tipo valor Unidad Medición Cardinalidad

Nombre Jean Carlos Canela string -- (1,1)

Autor o grupo JeanCarlos string -- (1,1)

Estilo Pop string -- (1,1)

Nombre_álbum JeanCarlos string -- (1,1)

Nro_pistas 15 numérico números (1,1)

País Miami string -- (1,1)

Titulo Quedate string -- (1,1)

Duración 4 numérico minutos (1,1)

Formato Mp3 string (1,1)

Año 2009 numérico años (1,1)

Lenguaje Español string -- (1,1)

TAREA 8: Definición de las constantes

Nombre Tipo de valor Valor Unidad de medición

Número máximo de pistas de un álbum string 8 canciones

Número máximo de duración de una pista string 5 minutos

TAREA 9: Definición de los axiomas formales.

Nombre del Axioma Interpretación

Descripción A necesita de B

Conceptos Canción B

Atributos enviados Interprete A

Relaciones binarias canta

Nombre del Axioma Contenido del Álbum

Descripción Y es parte de X

Page 8: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

8

Conceptos Canción Y

Atributos enviados Álbum X

Relaciones binarias contiene

Nombre del Axioma Géneros Descripción C puede pertenecer a varios D

Conceptos Genero D

Atributos enviados Canción C

Relaciones binarias pertenece

Nombre del Axioma Lanzamiento

Descripción Z produce varios W

Conceptos Álbum W

Atributos enviados Disquera Z

Relaciones binarias Produce

TAREA 10: Definición de las reglas.

Nombre de la regla Reglas para álbum grabados en varios idiomas

Descripción Álbum compuesto por pistas en español, inglés, etc.

Concepto género

Atributos enviados Idioma

Relaciones binarias are

Nombre de la regla Reglas para el tipo de formato en las canciones

Descripción Tipos de formato que tienen las canciones.

Concepto Canción , formato

Atributos enviados Álbum

Relaciones binarias are

TAREA 11: Definición de las instancias.

Nombre de la instancia Concepto Atributo

Salsa Género musical descripción

Pop Género musical descripción

Regueton Género musical descripción

Cumbia Género musical descripción

dance Género musical descripción

AyM Disquera nombreDisq

Sony Music Disquera nombreDisq

Machete Music Disquera nombreDisq

Universal Music Disquera nombreDisq

InterdiscopoRecords Disquera nombreDisq

JL producciones Disquera nombreDisq

Latinum Music Disquera nombreDisq

Star Records Disquera nombreDisq

Page 9: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

9

Warner Music Disquera nombreDisq

La melodía de la Calle Álbum NombreAlbum

El Patron la victoria Álbum NombreAlbum

iDon Álbum NombreAlbum

Perdoname Álbum NombreAlbum

Te amo Álbum NombreAlbum

PCD Álbum NombreAlbum

Shock Value Álbum NombreAlbum

Remixed Álbum NombreAlbum

Loose Álbum NombreAlbum

Reyes de la Cumbia Álbum NombreAlbum

El Doctorado Canción titulo

El Amor Canción titulo

Diva virtual Canción titulo

Luna Canción titulo

Dejame Entrar Canción titulo

Buttons Canción titulo

The Way I are Canción titulo

Release Canción titulo

Searching Canción titulo

Corazon partido Canción titulo

Tony Dize Interprete Nombre

Tito El Banbino Interprete Nombre

Don Omar Interprete Nombre

Edy Lover Interprete Nombre

Makano Interprete Nombre

Pussycat Dolls Interprete Nombre

Timbaland Interprete Nombre

Tommy Aka Interprete Nombre

Nissim Interprete Nombre

Nelly Furtado Interprete Nombre

2009 Año lanzamiento

2008 Año lanzamiento

2007 Año lanzamiento

2006 Año lanzamiento

Inglés Idioma descriplenguaje

Español idioma descriplenguaje

Page 10: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

10

Representación del conocimiento con Protege

La ilustración del uso y las ventajas de la utilización de los mapas conceptuales para mostrar el conocimiento, se lo han representado gráficamente con la Herramienta Protege 4.0.1, el conocimiento obtenido es el siguiente:

Razonador Una vez que se ha construido la ontología se procede a validar la misma, para lo cual utilicé el razonador Pellet. Donde Pellet es un razonador basado en Java y de código open-source. Puede ser usado en conjunción con las dos bibliotecas de Jena y OWL API, proporcionando una interfaz DIG. Puede descargar los pluging que proporciona funcionalidades para ver la validación de especies, la coherencia de verificación de las ontologías, clasificar la taxonomía, implicaciones de verificación y contestar un subconjunto de consultas RDQL. También puede utilizar la demo en línea que proporciona la mayor parte de estas funcionalidades.

CONSULTAS SPARQL UTILIZANDO LA HERRAMIENTA TWINKLE

Para iniciar con la explotación de nuestra ontología se debe definir con anterioridad los prefijos

para simplificar las consultas.

PREFIX URI:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> PREFIX owl:<http://www.w3.org/2002/07/owl#> PREFIX xsd:<http://www.w3.org/2001/XMLSchema#> PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX daml:<http://www.daml.org/2001/03/daml+oil#>

Page 11: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

11

Como primer punto partimos de una consulta simple, la cual presenta el sujeto, objeto y

predicado.

Nombre de la clase a la que pertenece el dominio nombreDisq

PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:nombreDisq rdfs: ?Clase }

Listar las subclases de Álbum con su descripción PREFIX URI:<http://www.w3.org/2000/01/rdf-schema#subClassOf> PREFIX rdfs:<http://localhost/default#Album> select?Albums ?descripcion where{ ?Albums URI: rdfs: }

Page 12: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

12

Nombre de la clase a la que pertenece el dominio descripLenguaje PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:descripLenguaje rdfs: ?Clase }

Nombre de la clase a la que pertenece el dominio ubicación PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:ubicacion rdfs: ?Clase }

Listar todos los atributos que pertenecen a la clase disquera PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ ?Atributos rdfs: URI:disquera }

Listar todos los atributos que pertenecen a la clase Canción PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ ?Atributos rdfs: URI:Cancion }

Page 13: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

13

Listar las subclases de la clase Álbum PREFIX URI:<http://www.w3.org/2000/01/rdf-schema#subClassOf> PREFIX rdfs:<http://localhost/default#Album> select* where{ ?SubClasesDeAlbum URI: rdfs: }

Listar el nombre de los cantautores que forman parte del grupo de intérpretes. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Interprete> select* where{ ?NombreArtista URI: rdfs: }

Listar los tipos de géneros musicales que hay. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#GeneroMusical> select* where{ ?TiposDeGeneros URI: rdfs: }

Page 14: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

14

Listar los títulos o nombres de las canciones. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Cancion> select* where{ ?TituloDeLasCanciones URI: rdfs: }

Listar los años de lanzamiento de un Álbum. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Año> select* where{ ?Añolanamiento URI: rdfs: }

Listar los Álbum con sus canciones. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?ListadoDeAlbums ?Canciones where { ?ListadoDeAlbums rdfs: URI:Album . ?Canciones rdfs: URI:Cancion . }

Page 15: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

15

Listar las canciones con su género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Canciones ?GeneroMusical where { ?Canciones rdfs: URI:Cancion . ?GeneroMusical rdfs: URI:GeneroMusical . }

Listar Álbum con sus Canciones y género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Album ?Canciones ?GeneroMusical where {?Album rdfs: URI:Album . ?Canciones rdfs: URI:Cancion . ?GeneroMusical rdfs: URI:GeneroMusical . }

Listar Álbum con sus Canciones y género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Canciones ?GeneroMusical where { ?Canciones rdfs: URI:Cancion .

?GeneroMusical rdfs: URI:GeneroMusical . }

Cuáles son las subclases de la Clase Álbum. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> CONSTRUCT {?s rdfs:name uri: } WHERE {?s rdfs:subClassOf uri:Album }

Page 16: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

16

Cuáles son los tipos de intérprete que hay. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> SELECT ?Interprete ?subclase WHERE

{uri:solista rdfs:subClassOf ?Interprete OPTIONAL

{?subclase rdfs:subClassOf uri:Interprete } }

Cuáles son los principales elementos de un álbum. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> SELECT ?clase ?subclase WHERE{uri:Año rdfs:subClassOf ?clase OPTIONAL{?subclase rdfs:subClassOf uri:Album}} }

Cuáles son los elementos que no se relacionan con Género Musical. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#GeneroMusical> select*

Page 17: Proyecto sbc

Sistemas Basados en el Conocimiento Diana Lucía Poma Lima

17

where{ ?GeneroMusical_Disjuntas URI: rdfs: }

Cuáles son los elementos que no se relacionan con las Casa disqueras. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#disquera> select* where{ ?Disjuntas URI: rdfs: }

Cuáles son los elementos que no se relacionan con las Casa disqueras. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#Interprete> select* where{ ?Disjuntas URI: rdfs: }

Cuáles son los elementos que no se relacionan con las Casa

PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#> select* where{{ ?Año_Lanamiento URI: rdfs:Año }UNION{ ?Albums URI: rdfs:Album }}