View
119
Download
3
Category
Preview:
Citation preview
Defesa de Proposta de
Dissertação Nailson Boaz Costa Leite
29/05/2014 Nailson Boaz Costa Leite (UFCG) 1
Banca examinadora: Leandro Balby Marinho (orientador)
Carlos Eduardo Batista (orientador)
Nazareno Andrade
Claudio Campelo
PPGCC/UFCG
Campina Grande – Maio, 2014
Explorando a Diversidade em Sistemas de
Recomendação baseados em Linked Open Data
Nailson Boaz Costa Leite
29/05/2014 Nailson Boaz Costa Leite (UFCG) 2
PPGCC/UFCG
Campina Grande – Maio, 2014
Sumário • Introdução
• Motivação
• Problema Abordado
• Proposta de Solução
• Objetivos
• Relevância
• Cronograma
• Referências
29/05/2014 Nailson Boaz Costa Leite (UFCG) 3
Introdução
Linked Data
• Difundir boas práticas para publicar e interligar
dados estruturados (RDF);
• Padronizar tecnologias e mecanismos que
facilitam o processamento, o compartilhamento,
a escalabilidade e o reuso de dados
29/05/2014 Nailson Boaz Costa Leite (UFCG) 4
Introdução
4 princípios do Linked Data:
• Use URIs para identificar os objetos
• Use URIs HTTP para acessar o objeto
• Cada objeto possui sua descrição
• As propriedades dos objetos podem ser referenciadas
por URIs.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 5
Exemplo RDF/XML
<rdf:RDF>
<rdf:Description rdf:about="http://dbpedia.org/resource/The_Lord_of_the_Rings">
<rdfs:label xml:lang="ja">指輪物語</rdfs:label>
<rdfs:label xml:lang="en">The Lord of the Rings</rdfs:label>
...
<dcterms:subject rdf:resource="http://.../Category:Sequel_novels" />
<dcterms:subject rdf:resource="http://...Category:High_fantasy_novels" /
...
<owl:sameAs rdf:resource="http://rdf.freebase.com/ns/m.07bz5" />
<dbpprop:author rdf:resource="http://dbpedia.org/resource/J._R._R._Tolkien" />
<dbpprop:books rdf:resource="http://.../The_Return_of_the_King" />
<dbpprop:books rdf:resource="http://.../The_Two_Towers" />
<dbpprop:books rdf:resource="http://.../The_Fellowship_of_the_Ring" />
...
</rdf:Description>
</rdf:RDF>
29/05/2014 Nailson Boaz Costa Leite (UFCG) 6
Introdução
29/05/2014 Nailson Boaz Costa Leite (UFCG) 7
(Noia, T. 2012)
Introdução
Linked Open Data
(LOD)
29/05/2014 Nailson Boaz Costa Leite (UFCG) 8
Introdução
Linked Open Data Cloud
29/05/2014 Nailson Boaz Costa Leite (UFCG) 9
(Cyganiak, A., 2011)
Introdução
Sistemas de Recomendação baseados
em LOD
Diversos trabalhos científicos tem utilizado a
estrutura e o conteúdo disponível nas bases de
dados de LOD para realizar recomendações.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 10
Introdução
As bases de dados de LOD oferecem aos SR:
• Descrições para diversos tipos de domínios;
• Taxonomia entre os objetos;
• Cruzamento entre várias bases de dados LOD;
• Facilidade na coleta dos dados;
• Facilita a exploração dos objetos e suas relações;
• Adiciona semântica aos dados.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 11
Motivação
“O real valor de uma recomendação está em
sugerir objetos que os usuários não descobririam
por si mesmos” (Herlocker, 2004)
• Recomendações óbvias
• Recomendações redundantes
• Recomendações populares
29/05/2014 Nailson Boaz Costa Leite (UFCG) 12
Motivação
29/05/2014 Nailson Boaz Costa Leite (UFCG) 13
(Sandoval, S., 2012)
Motivação
Novas dimensões para avaliação de SR:
• Novidade
• Diversidade
• Seredipidade
29/05/2014 Nailson Boaz Costa Leite (UFCG) 14
Motivação
Diversidade em SR:
A diversidade de uma lista de itens
recomendados refere-se ao quão diferente
cada item é dos demais, de acordo com uma
ou mais propriedades.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 15
Diversidade e acurácia
29/05/2014 Nailson Boaz Costa Leite (UFCG) 16
(Ziegler, 2005)
Problema de Negócio
Os usuários estão recebendo muitas
recomendações óbvias e redundantes em
relação ao que já foi visto anteriormente.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 17
Problema Técnico
Gerar listas ranqueadas de recomendações
que apresentem diversidade e relevância
entre os seus itens.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 18
Proposta de Solução
Utilizar as informações semânticas, as
propriedades e a taxonomia das bases de
dados LOD para solucionar o trade-off entre
diversidade e acurácia.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 19
Proposta de Solução
• Topic Diversification (Ziegler, 2005)
Algoritmo “guloso” de re-rankeamento que
computa a similaridade entre os itens através de
sua taxonomia e controla o fator diversidade com
uma variável ΘF.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 20
Proposta de Solução
29/05/2014 Nailson Boaz Costa Leite (UFCG) 21
(Ziegler, 2005)
Proposta de Solução
• Topic Diversification
29/05/2014 Nailson Boaz Costa Leite (UFCG) 22
(Sandoval, S., 2012)
Proposta de Solução
Podemos utilizar as complexas taxonomias entre
as propriedades dos objetos para reordenar as
listas de recomendações através do topic
diversification e tentar inferir o valor de ΘF.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 23
Objetivos Gerais
Desenvolvimento e avaliação de um SR que utiliza
as bases de dados de LOD para realizar
recomendações diversas e acuradas.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 24
Objetivos Específicos
1. Analisar o conjunto de dados semânticos de LOD em
contextos de recomendação (livros, filmes, músicas).
2. Desenvolver um modelo de SR que utilize métodos que
exploram o conteúdo extraído das bases de LOD
3. Realizar um estudo comparativo entre a diversidade e
acurácia dos modelos propostos
29/05/2014 Nailson Boaz Costa Leite (UFCG) 25
Relevância
(Ziegler, 2005) - Intra-List, Topic diversification
(Vargas, S., 2011) - Diversity and Novelty metrics
(Noia, T., 2012) - LOD to suport content based RS
(Ostuni, V., 2013) – Top-N recommendation leveraging
LOD
29/05/2014 Nailson Boaz Costa Leite (UFCG) 26
Relevância
ESWC 2014 Challenge:
Task 3: Diversity
A tarefa 3 do ESWC foi o desenvolvimento de um SR
baseado em conteúdo que leve em consideração a
acurácia (F-measure) e a diversidade (intra-list) das
recomendações utilizando o conteúdo disponível nas
bases de dados de LOD. .
29/05/2014 Nailson Boaz Costa Leite (UFCG) 27
Metodologia
• Revisão Sistemática
o Algoritmos e Métricas de Diversidade
• Estudo das Bases de LOD
• Desenvolvimento de SR baseado em LOD
• Escrita de Artigos
29/05/2014 Nailson Boaz Costa Leite (UFCG) 28
Cronograma
Meses
Fase 06/14 07/14 08/14 09/14 10/14 11/14 12/14 01/15 02/15 03/15 04/15
1 X X X
2 X X X
3 X
4 X X X
5 X X
6 X X X X X X X
29/05/2014 Nailson Boaz Costa Leite (UFCG) 29
Obrigado
29/05/2014 Nailson Boaz Costa Leite (UFCG) 30
Referências
(Noia, T. 2012) Tommaso Di Noia, Roberto Mirizzi, Vito Claudio Ostuni, and Davide Romito. Exploiting the web of data in model-based recommender systems.In Proceedings of the sixth ACM conference on Recommender systems, pages 253–256. ACM, 2012.
(Sandoval, S., 2012) Novelty and Diversity Enhancement and Evaluation in Recommender Systems.
(Ziegler, 2005) Cai-Nicolas Ziegler, Sean M McNee, Joseph A Konstan, and Georg Lausen. Improving recommendation lists through topic diversification. In Proceedings of the 14th international conference on World Wide Web, pages 22–32. ACM, 2005.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 31
Referências
(Vargas, S., 2011) Saúl Vargas and Pablo Castells. Rank and
relevance in novelty and diversity metrics for recommender
systems. In Proceedings of the fifth ACM conference on
Recommender systems, pages 109–116. ACM, 2011.
(Cyganiak, A., 2011) Anja Jentzsch Richard Cyganiak. Linking
open data cloud diagram, 2011.
29/05/2014 Nailson Boaz Costa Leite (UFCG) 32
Defesa da Proposta de
Dissertação de Mestrado
Nailson Boaz Costa Leite
29/05/2014 Nailson Boaz Costa Leite (UFCG) 33
Banca examinadora: Leandro Balby Marinho (orientador)
Carlos Eduardo Batista (orientador)
Nazareno Andrade
Claudio Campelo
Recommended