View
103
Download
0
Category
Preview:
Citation preview
Sistemas de RecomendaçãoMineração da Web
Equipe
Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira
Roteiro
Motivação Coleta de informações Estratégias Técnicas
Filtragem de Informação Arquitetura Exemplos Referências
Motivação
Diversidade de opções
O usuário deseja customização
Segmentação de mercado
Fidelização
Motivação
Processo de indicação já bastante conhecido na relação social entre seres humanos
Re-edição do tempo onde os vendedores conheciam os clientes
E-commerce
Empresas lucram com isso!!
Coleta de Informações
Objetivo: Conhecer o usuárioÉ necessário capturar e armazenar seus
dados pessoais e comportamentais
Há duas formas habituais de identificação:
no Servidor e no Cliente
Coleta de Informações
Identificação no ServidorÁrea de cadastro de informações pessoaisO usuário loga no sistema Identificação com precisão
Identificação no ClienteUtilização de cookiesAssume-se que o computador é utilizado
por uma única pessoaMais simples, porém menos confiável
Coleta de Informações
Coleta de Informações Explícita
Coleta de Informações Implícita
A partir de dados da navegação, inferem-se suas preferências
Estratégias de Recomendações
Empresas precisam lucrar! Boas estratégias garantem fidelidade de
clientes As estratégias são várias e de
complexidade variada: Lista de recomendações Avaliação dos usuários Suas recomendações “Interessados por X se interessam por Y” Associação por conteúdo
Estratégia 1: Lista de Recomendação
Sem análises profundas Tipos populares ordenados
Estratégia 2: Avaliação dos usuários
Bastante utilizada
Útil para os potenciais consumidores
Não exige nenhum mecanismo de inteligência na implementação
Estratégia 2: Avaliação dos usuários
Estratégia 2: Avaliação dos usuários
Estratégia 3: Suas recomendações
Sugestões feitas especificamente para o usuário
implícitas ou explícitas
Estratégia 3: Suas recomendações
Estratégia 4: “Interessados em X se interessam por Y”
Associações entre itens avaliados por usuários
comprados, lidos, ...
Bastante comum em sites e-commerce
Estratégia mais complexa que as outras
Estratégia 4: “Interessados em X se interessam por Y”
Estratégia 5: Associação por conteúdo
Baseado no conteúdo de determinado item
É necessário encontrar associações ex: Os livros A e B são freqüentemente
vendidos juntos
Diferentes técnicas podem ser usadas para esse tipo de estratégia
Estratégia 5: Associação por conteúdo
Recuperação de Informação (RI) X Filtragem de Informação (FI)
RI Envolve armazenamento, índices e tecnologia para
recuperação de documentos textuais Mantém uma base com caracterísitica mais
estática no armazenamento de informações. Início da interação provocada pelo usuário (query) Baseia-se na percepção de uma necessidade de
momento FI
Mantém perfil dos interesses do usuário Maior tempo de duração no casamento de
interesses Início da interação provocada pelo sistema Não se refere ao momento, mas sim a preferências
Técnicas – Filtragem de Informações
Nome utilizado para descrever uma variedade de processos que envolvem a entrega de informação para as pessoas que realmente necessitam delas.
Quase todo sistema de recomendação vê a filtragem de informações ou seleção de um produto como um problema de classificação.
F(usuário, produto) | {gosta, não gosta}
Filtragem baseada em conteúdo
Baseada na análise de conteúdo dos itens e no perfil do usuário
Descrição de interesses do usuário é obtida através de informações fornecidas por ele mesmo ou através de ações como seleção e aquisição de itens
Ferramentas utilizam TF-IDF Modelo Vetorial Índices de Busca booleana Filtragem probabilística Interfaces de consulta com linguagem natural
Filtragem baseada em conteúdo
Como utilizar:Solicita ao usuário uma análise de itens
indicando se cada um destes é de interesse ou não
Após a avaliação feita pelo usuário o sistema busca itens que “casam” em
conteúdo com o que foi classificado como de interesse
e desconsidera os que “casam” com o que foi classificado como de não interesse
Filtragem baseada em conteúdo
Problemas:Conteúdo de dados pouco estruturado é
difícil de ser analisado vídeo, som
Entendimento do conteúdo do texto prejudicado pelo uso de sinônimos
Super-especialização só serão recomendados itens já avaliados, não
explorando novas categorias de itensFalta de surpresa na recomendação
produtos que não se relacionam com o perfil do usuário jamais serão recomendados
Filtragem baseada em conteúdo
Exemplos filmes do mesmo gênero que o assistidooutros CD’s dos artistas já adquiridosprodutos complementares aos adquiridos
“DVD player” hometheater
Filtragem Colaborativa
Desenvolvida para atender pontos que estavam em aberto na filtragem baseada em conteúdo
Diferencia-se da filtragem baseada em conteúdo exatamente por não exigir a compreensão ou reconhecimento do conteúdo dos itens
Baseado na troca de experiências entre as pessoas que possuem interesses comuns
Filtragem Colaborativa
Como utilizar: Itens filtrados baseados nas avaliações feitas
pelos usuáriosUsuários dos sistemas colaborativos devem
pontuar cada item experimentado, indicando o quanto este item casa com sua necessidade de informação
Filtragem Colaborativa
Problemas:1º avaliador: novo item no BD nunca é
recomendado até que um usuário o avaliePontuações esparsas: número de usuários
pequeno em relação ao volume de informações no sistema
Similaridade: um usuário exótico terá dificuldades para
encontrar outros usuários com gostos similares, sendo assim suas recomendações podem se tornar pobres
Filtragem Colaborativa
Detalhando o funcionamentoCalcular o peso de cada usuário em
relação à similaridade ao usuário ativo métrica de similaridade
Selecionar um subconjunto de usuários com maiores similaridades (vizinhos) para considerar na predição.
Normalizar as avaliações e computar as predições ponderando as avaliações dos vizinhos com seus pesos.
Filtragem Colaborativa - Exemplo
Se quisermos recomendar um produto ao usuário Mauro, procuraremos outros usuários com hábitos de consumos semelhantes
Filtragem Híbrida
Procura combinar os pontos fortes da filtragem colaborativa e da baseada em conteúdo e ao mesmo tempo eliminar as fraquezas de cada uma
Vantagens da Filtragem Híbrida
Utilizando recomendações colaborativas, experiências de outros usuários são levadas em consideração;
Utilizando recomendações baseadas em conteúdo, é possível lidar com itens não vistos por outros usuários;
É possível recomendar bons itens a um usuário mesmo que não haja usuários semelhantes a ele.
Arquitetura
Um Sistema de Recomendação deve funcionar como um servidor capaz de recuperar, para determinado
usuário, suas preferências explícitas, implícitas, conteúdo e ofertas relacionadas a itens nos quais já mostrou interesse
Deve ficar em comunicação com o sistema que irá apresentar as recomendações para o usuárioEx.: Servidor Web
Tipos de Arquitetura
Basicamente existem dois tipo de arquitetura possíveisBaseado em técnicas de filtragem de
informaçãoBaseado em Mineração de Dados
Baseado em Técnicas de Filtragem de Dados
Sistema de Apresentação
Módulo Central
Banco de Estratégias
Consulta dados pessoais Consulta dados Transacionais
Baseado em Mineração de Dados
Módulo de Mineração
Infere padrõesDemográficos e Transacionais
Armazena padrões
Exemplo de Arquitetura
Sistema RecommenderSistema de RecomendaçãoPermite que clientes e visitantes do
website de uma empresa possam receber, no momento exato, recomendações de produtos e serviços adequados aos seus interesses
Recomendações obtidas através de indicações explícitas de preferência ou através da técnica de filtragem colaborativa
Exemplo de Arquitetura
Exemplo de Arquitetura
Recommender Server Utilizado para dar acesso aos
SessionsControllers e às rotinas de recomendações
Exemplo de Arquitetura
Session Controller Ao entrar no site, uma
sessão é iniciada para o usuário, onde várias informações são armazenadas sobre sua interação
É carregado com todas as informações coletadas no passado sobre o usuário (itens adquiridos, áreas de preferência do site, etc.)
Exemplo de Arquitetura
StrategyList Guarda vários modelos de recomendação, cada um
orientado a um tipo de recomendação específica Baseado em listas armazenadas pelo sistema
(mais vendidos, lista de presentes, etc) Baseado em preferências explícitas ou implícitas
Difetentes estratégias podem ser criadas e utilizadas em paralelo em um mesmo website
Exemplo de Arquitetura
InterestList Mantém as preferências explícitas e
implícitas do usuário Coleta implícita: Na medida em
que o usuário navega, seleciona e adquiri itens, suas preferências são armazenadas na InterestList
Coleta Explícita: O usuário indica espontaneamente suas preferências e estas são armazenadas em outra InterestList
Mais tarde, todas essas preferências podem ser utilizadas
Exemplo de Arquitetura
FindingList Complementam as informações que se tem sobre os
usuários Utilizado para armazenar características demográficas
sobre eles (faixa etária, sexo, ocupação, ...) ou hábitos de consumo (itens adquiridos ou colocados no carrinho de compras)
É através desta “lista de achados” que se pode encontrar recomendações precisas para o usuário
Implementando Recomendação a partir dos itens comprados
pelo usuário:
Implementando
Recomendação de novidades:
Sistemas de recomendação - exemplos
Referral Web
GroupLens
Referências
Wikipedia Reategui,Eliseo B. e Cazella, Sílvio C. Sistemas
de Recomendação Dot.dot.dot
Recommended