View
110
Download
1
Category
Preview:
Citation preview
Conceitos Gerais relacionados a Recuperação de Informação
Eveline Alonso VelosoPUC-MINAS
Referências
BAEZA-YATES, Ricardo e RIBEIRO-NETO, Berthier. Modern Information Retrieval. 1ª edição, New York: ACM Press, 1999, capítulo 1.
O que é Recuperação de Informação? Coleta, armazenamento,
organização, representação e fácil acesso a itens de informação; relevantes à necessidade de
informação do usuário.
O Processo de Recuperação de Informação
necessidade de informação
documentos recuperados e ranqueados
* Figura adaptada de BAEZA-YATES & RIBEIRO-NETO
consulta
Coleta
Operações sobre a consulta
Busca
Ordenação
ColeçãoIndexação
Índice
Operações sobre o texto
documento
off-line
on-line
Recuperação de Dados x Recuperação de Informação
Recuperação de Dados: recuperação de itens de informação que
possuem os termos da consulta e atendem todas as suas restrições;
um item de informação recuperado precisa satisfazer perfeitamente a consulta formulada;
não necessariamente a necessidade de informação do usuário.
Um único item de informação recuperado incorretamente;
indica falha do processo de recuperação de dados.
Dados estruturados. Possibilidades limitadas de consultas. Sistema de recuperação de dados:
Banco de dados.
Recuperação de Dados x Recuperação de Informação
Recuperação de Informação: recuperação de itens de informação relacionados a um
determinado assunto; que não necessariamente satisfazem a consulta
especificada. Recuperação de itens de informação possivelmente
relevantes para a necessidade de informação do usuário;
mínimo de itens de informação não relevantes. Recuperação de alguns itens de informação não
relevantes é aceitável. Itens de informação recuperados são ranqueados. Dados não estruturados. Exemplos:
artigos científicos; publicações de grande circulação; Web.
Formas de Acesso à Informação
* Figura adaptada de BAEZA-YATES & RIBEIRO-NETO
Busca
NavegaçãoColeção
Busca Usuário necessita traduzir sua
necessidade de informação em uma consulta; na linguagem disponibilizada pelo
SRI. Em geral, especifica um conjunto
de palavras-chave; que indicam a semântica de sua
necessidade de informação.
Busca
Navegação Usuário utiliza uma interface interativa;
para navegar pela coleção de documentos; a procura de documentos relacionados a seu
interesse específico. Necessidade de informação do usuário:
ampla ou indefinida.
Objetivos principais não são claramente definidos no início do processo de recuperação de informação; e podem mudar durante a interação do
usuário com o sistema.
Navegação
Navegação
Navegação
Navegação
Navegação
Navegação
Navegação
Navegação
Filtragem Utilização de agentes de software;
que buscam automática e permanentemente informação possivelmente relevante para o usuário.
Consulta especificada pelo usuário permanece praticamente estática; enquanto novos itens de informação
são adicionados ao sistema. Filtragem de informação
possivelmente relevante; para a posterior inspeção do usuário.
Filtragem Necessidade de elaborar um perfil
do usuário; com a indicação das preferências
desse usuário. Esse perfil é comparado com os
novos itens de informação inseridos no sistema; com o objetivo de determinar aqueles
que são potencialmente de interesse desse usuário em particular.
Filtragem
Recommended