Upload
christiano-avila
View
514
Download
4
Embed Size (px)
DESCRIPTION
Apresentação Webmedia
Citation preview
1
Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo Christiano Avila
Stanley LohFrederico Fonseca
2
Sumário
Introdução SisRecAC Experimentos Resultados Considerações Finais / Conclusões Apoio
3
Introdução
Segundo Spink et al.[19]: 52% das consultas submetidas aos mecanismos de
buscas são reformuladas 32,5% das consultas modificadas sofreram alterações nos
termos submetidos, mas não no número total de termos 41,6% incluíram termos novos 25,9% eram relativas a consultas modificadas pela exclusão de
termos.
Pesquisa da iProspect concluiu que 82% dos usuários de mecanismos de busca refazem consultas não bem sucedidas acrescentando mais palavras.
4
Introdução
Silverstein et al. [17], Lau & Horvitz [10], Spink et al. [19], Teevan et al. [20] constatam que usuários utilizam entre 2 e 3 termos em média
Entretanto, Kraft et al. [8], concluíram que o número ideal de palavras a serem submetidas para busca nos mecanismos deve ficar entre 5 e 9.
5
Introdução Belkin et al. [2] e o Estado Anômalo de Conhecimento
(ASK - Anomalous State of Knowledge). Problema para especificar precisamente os termos Os mecanismos de busca tradicionais exigem que o
usuário tenha algum conhecimento Contradição pedir ao usuário para formular o que
precisa se é isto justamente o que falta. “Método” de tentativa e erro que toma tempo e pode
gerar frustração com o mecanismo de busca.
6
Introdução
Motivação dificuldade para determinar as palavras-chave. Aplicações na área de apoio ao ensino
7
SisRecAC
Sistema de recomendação de artigos científicos (SisRecAC)
Baseado no paradigma de “query by example” É um sistema de metabusca
8
Paradigma 1 Query by exemplo Paradigma 2
Descrição O usuário deve saber informar corretamente as palavras-chave
O usuário informa um exemplo do que precisa
O sistema constrói um perfil dos usuários (filtragem colaborativa, baseado em conteúdo)
Exemplos Google, Yahoo, outros
SisRecAC Movielens, Grupolens, diversos sistemas de e-commerce
Problemas ASK Ter o documento de exemplo
Partida a frio (Cold start), pouca possibilidade de surpresa (serendipity)
SisRecAC
9
SisRecAC1) Faz upload de um Documento (.pdf, .txt)
2) Escolhe um método
usuário
3) Extrai palavras-chave do Documento
5)Links para Artigos científicos
4) Submete Palavras-chave
6) Recebe as recomendações
7) Faz a avaliação
10
SisRecAC
11
Tags
Upload
12
Upload
Recomendação 1
Recomendação 2
Recomendação 3
13
SisRecAC
Métodos Identificar ou extrair de características do
documento Submeter consulta ao mecanismo de busca. Comparar diferentes métodos de extração de
palavras-chave de textos. Utilizar título e “tags” informadas pelos
usuários.
14
SisRecAC
Expressões Método 1 – uma expressão Método 2 – 2 expressões Método 3 - 3 expressões
15
SisRecAC
Palavras com maior freqüência Método 4 - 4 palavras de maior freqüência no
documento. Métodos 5, 6, 7, 8 e 9 – idem, porém 5, 6, 7, 8 e
9 palavras.
16
SisRecAC
Outros métodos Método 10 - título do documento Método 11 – tags
17
Experimentos
Seleção do Método Escolhido em função da quantidade de
avaliações realizadas
18
Experimentos
Os usuários do SisRecAc são convidados a avaliar as recomendações do sistema.
Podem informar se consideram a recomendação: Totalmente relevante Parcialmente relevante Irrelevante
19
Upload
Recomendação 1
Recomendação 2
Recomendação 3
Avaliação
20
Resultados
Gráfico
Expressões Termos simples Título Tags
21
Conclusões Este projeto confirma Kraft et al. [8] que descobriu que o número ideal de
termos em uma consulta deve estar entre 5 e 9 Demonstra que sistemas de recomendação baseados no paradigma de
“query by example” são uma alternativa viável pois o uso de exemplos minimiza o esforço do usuário para selecionar palavras-chave para representar sua intenção de busca.
O sistema apresentado nesse artigo mostra que técnicas automáticas podem alcançar boa precisão quando recomenda documentos baseados em um exemplo.
O algoritmo que extrai as palavras-chave dos documentos é relativamente simples e com baixo custo computacional se comparado a outros algoritmos com fins semelhantes.
O sistema apresenta um excelente potencial de utilização na área acadêmica, onde manuais, artigos, apostilas e conteúdos programáticos poderiam ser utilizados como texto base para recomendação.
22
Trabalhos futuros
Descoberta de conhecimento em “folksonomias” Uso de tags com expansão baseada em folksonomias Ampliar os recursos do SisRecAc (agentes, convites, uso de perfil, …) Integração com o Sistema de Apoio da UCPEL (conteúdos programáticos,
uploads de professores, …)
23
Apoio
Este trabalho é parcialmente apoiado pela FAPERGS (Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul).
24
Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo
Christiano Avila – chris AT direto2.ucpel.tche.brStanley Loh - loh AT ucpel.tche.br
Frederico Fonseca - frederico12345 AT gmail.com
25
26
27
28
Experimentos
Total de usuários:32 Total de documentos:179 Total de avaliações:929