View
106
Download
1
Category
Preview:
Citation preview
1 Geber Ramalho
Raciocínio Baseado em Casos (CBR)
Críticas aos sistemas baseados em regras
Conceitos fundamentais
Funcionamento: ciclo dos RE’s
Aplicações
Balanço
Plano de aula
2 Geber Ramalho
Sistemas baseados em regras: críticas
aquisição de conhecimento muito difícil • regras nem sempre são intuitivas
desenvolvimento é muito longo
não aprende
não é robusto
tratamento de incerteza complicado
manutenção e refinamento são delicados
é lento
dificuldades com problemas “under constraint”• muitas soluções para o mesmo problema
3 Geber Ramalho
Soluções atuais
Aquisição• sistemas especialistas de 2a geração• abandono da hipótese da transferência de conhecimento• aquisição baseada em modelos• utilização de aprendizagem automática simbólica
Robustez• tratamento de incerteza
Tempo de desenvolvimento• Ferramentas (shells)
Aprendizado (on-line)• EBL, chunking, ... (sem sucesso)
4 Geber Ramalho
Soluções atuais: Conclusões
As soluções propostas ainda são insatisfatórias
Porque, então, não mudar paradigma?
5 Geber Ramalho
Compreensão de histórias (Sistema IPP)
IRA guerrilas ambushed a military patrol in west Belfast yesterday killing one british soldier and badly wounding another Army quarters
a suspected IRA gunman killed a 50-year old unarmed security guard in east Belfast early today the police said
A gunman shot and killed a part-time policeman at a soccer match Saturday and escaped through the crowd...
situação-explicaçãoou
problema solução
Nova explicação/solução
Nova situação/problema
6 Geber Ramalho
“Experiência vivida”
Classificação: “Os problemas de ouvido deste paciente são casos típicos de otite média”
Soluções compiladas: “Os sintomas de coração do paciente X podem ser explicados da mesma maneira que aquele paciente Y”
Avaliando medidas: Minha casa é como aquela que foi vendida mais em baixo nesta rua por R$25.000,00 mas ela tem uma vista melhor”
Concepção (design): para projetar este hospital, vou me basear naquele que já fiz com um número de leitos parecido, embora tenha de adaptá-lo pois este é de esquina
Avaliando opções: se nós atacássemos as instalações dos mísseis cubanos/russos, seria como no caso de Pearl Harbor
7 Geber Ramalho
Sistemas Especialistas convencionais:
(alguns) Sistemas Especialistas de segunda geração:
Experiência
Experiência: o que o especialista tem de mais valioso
RegrasEngenheiro de conhecimento
Experiência RegrasAlgoritmo deaprendizagem
8 Geber Ramalho
Experiência: o que o especialista tem de mais valioso
Case-based reasoning system
• Um método de resolução de problemas onde novos
problemas são resolvidos adaptando-se soluções de
antigos problemas similares
• Raciocínio analógico intra-domínio
• aprendizado incremental on-line
• suaviza necessidade de aquisição de conhecimento
Experiência Experiência
9 Geber Ramalho
Raciocínio baseado em casos
Historicamente: • Wittgenstein (conceituação em extensão)• Edel Tulving (memória episódica)• Gentner (analogia), ....• Roger Schank (scripts) • Janet Kolodner (memória dinâmica)
Um caso• é um episódio vivido• contém a descrição de : problema + solução• exemplos: um paciente, um projeto arquitetônico, uma
situação, uma causa jurídica, uma melodia, etc.
10 Geber Ramalho
Find Me: http://infolab.cs.uchicago.edu/entree
11 Geber Ramalho
Exemplo: Valor de Venda de Casas
novocaso(alvo)
casorecupe-
rado(fonte)
problema
baseReutilizar
Recuperar
Reter
Revisar
novocaso
(alvo)
soluçãosugerida
soluçãofinal
casosolução
casotestado
ecorrigido
casoaprendido
Indexar
Funcionamento do CBR: ciclo dos 4 RE´s
13 Geber Ramalho
Desenvolvimento de um sistema CBR
Qual a natureza e conteúdo dos casos?
Como representá-los?
Como indexá-los de maneira a poder encontrá-los adequadamente e rapidamente mais tarde?
Qual são os critérios para a escolha do melhor caso e como recuperá-lo?
Como estruturar (organizar) os casos da base?
Como adaptar o caso recuperado?
14 Geber Ramalho
Natureza e conteúdo dos casos
Pergunta chave• O que é um caso no domínio abordado?
Conteúdo• Mínima: descrição do problema e da solução• Extensões: avaliação da solução (falhas, sucesso, etc.) ,
contexto (justificação, links com outros casos, etc.),
Outros• Tamanho e composição (casos compostos)
Quantidade de casos• distribuir bem no espaço de problema n-dimensional (n atributos)
15 Geber Ramalho
Representação dos casos
Várias linguagens• de vetores de características• Atributo-valor (frames, redes semânticas, objetos, ...) • lógica de primeira ordem
Depende da natureza do que se quer representar• Velho problema da expressividade x eficiência• ex.
– situaçãoDeMediação(c1, disputa) protagonistas (c1, criança11, criança20, criança32) objetoDisputado (c1, chocolate) ...
• ex. – objeto: disputa;– atributos: protagonistas, objetoDisputado
16 Geber Ramalho
Indexação
Objetivo: dar ao sistema conhecimento sobre como estocar e comparar (match) casos
Vocabulário de indexação• índice = atributo, característica, predicado, ... • Pode ser feita manual ou automaticamente
– Checklist, difference-based, inductive learning, ...
Conselhos• concreto x abstrato• levar em conta a utilização que se quer fazer (propósito)• ex. para um mecânico e para um cliente de locadora, a
descrição de um automóvel é bem diferente
17 Geber Ramalho
Indexação (cont.)
Interpretação de situação• os índices realmente relevantes para um problema/situação
em particular• ex. em uma disputa entre crianças a profissão não conta,
enquanto na disputa entre adultos, ela conta
preçoanomodelomarcaopcionaiskilometragemmotorcor....
18 Geber Ramalho
A recuperação é baseada na similaridade entre caso alvo e casos fontes
• Dois tipos de cálculo de similaridade: explícito ou indireto
Medida explícita (mais usado!)• independente da estratégia de recuperação ou da
organização da memória• k vizinhos mais próximos (knn)
Medida indireta• dependente da estratégia de recuperação e/ou da
organização da memória• memória dinâmica (hierárquica)
Critério para escolha dos casos
19 Geber Ramalho
wi - peso da característica iaxi e ayi - valores da característica f nos casos C e Ssimi - função primitiva para a característica i
n
i i
yixii
n
i i
w
avaloravalorsimwYXSimil
1
1))(),((
),(
k vizinhos mais próximos (knn)
Observações• similaridade global [0-1], sem ordem de testes• mais fácil introduzir conhecimento do domínio: pesos• os pesos podem ser definidos manualmente ou por
métodos automáticos
20 Geber Ramalho
ano = 1997modelo= Gol marca = VWcor = vermelhoPreço = 1000
Carro 1
ano = 1996modelo= Golf marca = VWcor = azulPreço = 1500
Carro 2
ano = 1995modelo= Tempramarca = Fiatcor = azulPreço = 1300
Carro 3
Exemplo
Pesos• ano = 2, modelo = 3, marca = 2, cor = 1, preco =1
Funções primitivas• ano: (diferença 2) => 1; (2 < dif 4) => 0,5; (dif > 4) => 0• modelo: igual => 1; diferente => 0• marca: igual => 1; diferente => 0• cor: igual => 1; parecida => 0,5; diferente => 0• preço: (dif 250) => 1; (250 < dif < 1000) => 0,5); (dif > 1000) => 0
21 Geber Ramalho
Organização da memória
Memória plana• Implementação: lista simples (1 nível de indexação)• Métodos de recuperação
– Busca serial (custa caro)– Busca paralela
• Medida de similaridade– explícita (knn)
Memória hierárquica• Implementação:
– características compartilhadas– redes de discriminação
• Métodos de recuperação & Medida de similaridade– implícita (basta percorrer!)
Características compartilhadas
situaçãoDeMediação = disputa
Tipo: disputa física(Korea)
Tipo: disputa política(Panama)
Protagonistas: paísestipoDeObjetoDisputado: terras
Protagonistas: criançastipoDeObjetoDisputado: comida
Desejo: objeto inteiro(Laranja1)
Desejo: diferentes partes do objeto(Laranja2)
objDisputado: laranjarelaçãoFamiliar: irmãsidades: adolescentes
objDisputado: Candy(Candy)
23 Geber Ramalho
Organização da memória
Trade-offs: • eficiência x completude
– eficiência na inserção x eficiência na consulta– ordem fixa dos testes pode levar a a recuperação do caso que não é
o mais similar
• “plausibilidade” x facilidade de introduzir conhecimento
Organizações alternativas de memória• template trees, z-trees, ...
24 Geber Ramalho
Similaridade e recuperação
O casamento é parcial !!!! =>Mais robustez
Etapas da recuperação• Matching: encontrar os N casos mais similares ao caso alvo • Ranking: Escolher o melhor caso MC em relação o alvo
Questão: a similaridade basta?• nas tarefas de design (projeto), não basta!• É preciso: adaptation-based retrieval
25 Geber Ramalho
Reutilização Objetivo: compensar as diferenças entre o problema-alvo
e problema-fonte escolhido
Adaptação: 3 tipos • Cópia: usada normalmente em classificação• Adap. Estrutural: a partir da própria solução recuperada• Adap. Derivacional: a partir da maneira com que a solução
recuperada foi gerada
Para as duas últimas as operações são:• ajuste de parâmetros, abstração e especialização,
substituição,...
Problema: • depende do domínio,coordenação do conjunto de
operadores de transformação
26 Geber Ramalho
Exemplo de reutilização I
JULIA precisa criar uma refeição italiana (e que não contenha carne) composta de entrada, massas, refeição principal e sobremesa;
Baseando-se em casos anteriores, JULIA escolhe lasanha como prato principal. Porém:
• a refeição original inclui um prato de massas. Para simplificar, JULIA elimina o prato de massas;
• lasanha inclui carne. Devido à restrição do problema, uma lasanha vegetariana é proposta;
27 Geber Ramalho
Exemplo de reutilização: reinstanciação
Determine os papéis dos envolvidos no caso retido;
Faça a correspondência dos papéis no problema proposto;
Reinstancie os atributos e relações do caso retido de acordo com as respectivas correspondências;
Ex.: MEDIATOR• resolução de conflitos: como dividir uma laranja entre duas
crianças interessadas?• caso anterior: método utilizado por pescadores;• reinstanciação: identificação dos papéis de cada entidade
envolvida (pescador criança, peixe laranja, objetivo divisão)
28 Geber Ramalho
Outros Métodos
Ajuste de parâmetros• ex.: cálculo de novo valor de um imóvel;
Substituição baseado em casos• encontrar outro caso que sugira uma alternativa;• por que não utilizar logo este caso?
29 Geber Ramalho
Revisão e retenção
Revisão1) Avaliar a solução (automáticamente ou não)2) Consertar o caso
Retenção1) Extração da informação a reter2) indexação3) inserção do caso na base
30 Geber Ramalho
Aplicações: estado da arte
Todas as classes de problemas dos SE´s• diagnóstico, planejamento, scheduling, interpretação, cozinha,
design, seleção, ensino,....
Existem ferramentas (shells)• ReMind, CAsePOint,CASUEL, ART*, ReCall, CBR-Express,...
Exemplos• Machine Tool Fault Diagnosis• Computer Network Diagnosis• Credit Analysis• Geological Deposit Prediction• Battle Planning
Mais aplicações...
• Bank Telex Classification• Natural Language Understanding • Network Management• Legal Reasoning• Claims Settlement• Medical Diagnosis• Weather Prediction• Fraud Detection• Industrial Planning and Scheduling• Residential Domain • Aircraft Maintenance Domain• Helpdesk Systems for PC Network Diagnostics
32 Geber Ramalho
Algumas aplicações na WEB
FindMe agents• sugere filmes e carros em locadoras• raciocino através de exemplos• busca não hierárquica
Buttler agents• sugere hotéis, restaurantes, oficinas, ...
Correspondent agents• usa técnicas de recuperação de casos para encontrar textos:
FAQ-finder
Analog Devices• help desk: o sistema responde às dúvidas mais simples,
restringindo a necessidade em contatar seus engenheiros
33 Geber Ramalho
Problemas
Aquisição & descrição dos casos • nem sempre é trivial além de demandar conhecimento do
domínio!
O controle da medida de similaridade é fraco pois o matching é parcial
• o acúmulo de semelhanças “irrelevantes” faz com que certos casos sejam escolhidos em detrimento dos outros
• como ter certeza que as propriedades A e B serão determinantes na recuperação de um caso que contém 20 atributos?
A explicação • pode ser prejudicada quando a recuperação é baseada em
uma medida de similaridade numérica
34 Geber Ramalho
Balanço e conclusões
Apesar das limitações, é bem mais fácil e rápido desenvolver e manter um sistema CBR. E ele é mais robusto!
• CLAVIER na Lockheed (fornos) - de 60% para 10%, taxa de erro
• General dynamics (barcos) - 5 homens-ano x 2 homens-ano.• CANASTA da DEC: 8 vezes mais rápido
35 Geber Ramalho
Quando usar CBR?
Existe uma grande volume de dados históricos
Os especialistas falam sobre seus domínio dando exemplos
A experiência vale tanto quanto o conhecimento dos livros texto
Os problemas não são completamente formalizáveis• fraca compreensão do problema, dificuldade de verbalização
Existem conhecimento para adaptação de casos• adequado para tarefas de projeto (design)
Existem muitas exceções às regras
É preciso aprender “on-line”
36 Geber Ramalho
Referências básicas
Aamodt, A; Plaza, E. (1994). “Case-Based Reasoning: Foundational Issues, Methodological Variantions, and System Approaches”. Em AI Communications, Vol. 7, nr. 1;
Kolodner, J. (1993) Case Based Reasoning. Morgan Kaufmann.
Web• AI-CBR Home Page: http://www.ai-cbr.org/theindex.html• CBR archive: http://www.ai-cbr.org/cases.html• CBR in the Web:
http://wwwagr.informatik.uni-kl.de/~lsa/CBR/CBR-Homepage.html• CBR Bibliography:
http://www.surveying.salford.ac.uk/AI-CBR/biblio/search.html
Recommended