Upload
alexandre-duarte
View
140
Download
1
Embed Size (px)
Citation preview
Metodologia da Pesquisa Cien1fica Aula 06: Causalidade e Abdução Professor: Alexandre Duarte Web: h5p://alexandre.ci.ufpb.br/ensino/mpc
CAUSALIDADE
“The paradigma,c asser,on in causal rela,onships is that manipula,on of a cause will result in the manipula,on of an effect... Causa>on implies that by varying one factor, I can make another vary.” -‐ Cook & Campbell (1979).
Por que nos preocupamos com causalidade?
• Explicação – Uma associação nos permite prever mas não explicar um fenômeno
– A iden>ficação dos mecanismos de causalidade nos permite produzir explicações mais sa>sfatórias
• Controle – Entender a causalidade nos permite prever os efeitos de determinadas ações sem que elas precisem ser executadas
– Isso possibilita uma exploração mais eficiente do espaço amostral
Development of Western science is based on two great achievements: the inven>on of the formal logical system (in Euclidean geometry) by the Greek philosophers, and the discovery of the possibility to find out causal rela>onships by systema>c experiment (during the Renaissance). Albert Einstein (1953)
Não seria trivial iden>ficar causalidade em sistema projetos por nós ?
• Tarefa/Ambiente: Nós não projetamos vários dos aspectos responsáveis pelo comportamento
• Complexidade: Nós nem sempre entendemos as causas para determinados comportamentos
• Spandrels: Limitações do projeto muitas vezes criam funcionalidades acidentais, muitas das quais podem parecer ser (ou efe>vamente ser) causais.
“As computer scien>sts, we design our systems, and we leave out extraneous components. Isn’t everything causal?”
Spandrels em Ciência da Computação
• Várias das caracterís>cas de um sistema são.. – Inteiramente acidentais (“Tínhamos que escolher uma ou outra”)
– Resultado de limitações de projeto (“O compilador do Z354 não conseguia lidar com os dados então >vemos que fazer ...”)
– Selecionadas de acordo com a crença contemporânea (“Foi então que concluímos que roteamento dinâmica não era, de fato, pra>cável”)
• ... e muitas outras decisões de projeto são influenciadas por tais caracterís>cas ...
• ... fazendo com que elas acabem parecendo ser essenciais ao longo do tempo.
Condições para inferência causal
• Correlação
• Direção
• Eliminação de potencias causas comuns
A B
A B
C
Por que correlação pode ser cruel?
• Variação da causa potencial (Quantas alterna>vas foram examinadas?)
• Força do efeito (O que um “quase” significa?) • Tamanho da amostra (Dois algoritmos ou vinte?)
• Independência (Todos os algoritmos são derivados de uma fonte em comum?)
Por que correlação não é suficiente?
• Correlação com a causa esperada (“Fumar causa câncer”)
• Correlação com o inverso da causa esperada (“Câncer leva as pessoas a fumarem”)
• Correlação com uma causa oculta (“Um gene leva as pessoas a fumarem e a terem câncer”)
A B
A B
A B
C
Eliminando causas comuns • Controle: mantenha potencias causas comuns constantes de forma que elas não possam afetar o resultado (Bacon, 1620)
• Randomização: Varia de forma aleatória os níveis de potenciais causas comuns de forma que elas não possam afetar sistema>camente o resultado (Fisher, 1925)
• Modelagem: Meça, modele e remova matema>camente o os efeitos de potenciais causas comuns (Rubin 1974; Spirtes, Glymour & Scheines 1993; Pearl 2000)
Eliminando causas comuns: Controle
• Selecione explicitamente os níveis (valores) para todas as outras potenciais causas de forma que apenas as causas inves>gadas possam exercer efeito no resultado
• Exemplo – Todos os par>cipantes do nosso estudo eram alunos do 1º semestre
– No começo de cada execução a base de conhecimento estava vazia
– Cada protocolo foi executado em cada uma das K redes geradas aleatoriamente
• O que pode dar errado? – Causas desconhecidas – Falha no controle – Confounding
Eliminando causas comuns: Randomização
• Tenta>va de garan>r que o efeito de outras potenciais causas é desprezível – Atribui valores a variáveis independentes sem qualquer razão
– Permite eliminar causas desconhecidas • Exemplos: – Distribuímos aleatoriamente os dados entre o grupo de treino e de teste
– As requisições foram tratadas tanto pelo protocolo an>go quanto pelo novo de acordo com um gerador de números pseudoaleatórios
• O que pode dar errado? – Distribuição não-‐aleatória – Confounding
Eliminando causas comuns: Modelagem
• Ajustar explicitamente o valor do efeito para descartar os efeitos de outras potenciais causas
• Exemplo – Nós incluímos todas as potenciais causas conhecidas além de x em nosso modelo de regressão linear e os efeitos de x con>nuam a ser esta>s>camente significa>vos
• O que pode dar errado? – Fatores causais desconhecidos – Erros no modelo – Bias na escolha dos parâmetros do modelo
ABDUÇÃO
“...a method of reasoning in which one chooses the hypothesis that would, if true, best explain the relevant evidence. Abduc>ve reasoning starts from a set of accepted facts and infers their most likely, or best, explana>ons.”
Formas de raciocínio cienxfico
• Dedu>vo – Dedução lógica
• Indu>vo – Inferência indu>va
• Abdu>vo – Inferência abdu>va
Raciocínio Dedu>vo
• Uma dedução é uma espécie de argumento no qual a forma lógica válida garante a verdade da conclusão dada a veracidade das premissas – Premissa 1: Todos os homens são mortais. – Premissa 2: Sócrates é um homem. – Conclusão: Sócrates é mortal.
Raciocínio Indu>vo • Infere uma conclusão a par>r de múl>plas observações de fatos
• Observações – O ferro conduz eletricidade – O ferro é metal – O ouro conduz eletricidade – O ouro é metal – O cobre conduz eletricidade – O cobre é metal
• Inferência indu>va – Os metais conduzem eletricidade.
Raciocínio Abdu>vo
• A abdução é a inferência a favor da melhor explicação. – A hipótese de A ser verdadeira explica B. – Nenhuma outra hipótese pode explicar B tão bem quanto A.
– Logo A é provavelmente verdadeira
Raciocínio abdu>vo na ciência
• A abdução seleciona, entre as hipóteses consideradas, aquela que melhor explica as evidências
• O raciocínio abdu>vo é fortemente relacionado ao método estaxs>co da máxima verossimilhança
• Existe várias ameaças óbvias à sua validade – Número insuficiente de hipóteses – Quan>dade insuficiente de evidências
• Ambos são aspectos chave na prá>ca cienxfica
Teorias que julgamos serem verdadeiras
Teorias que são efe>vamente verdadeiras
Teorias que achamos que foram testadas corretamente
Teorias que já foram cogitadas
Desafios da abdução • Definir um conjunto de hipóteses com grande probabilidade de conter a hipótese “verdadeira” – Abordagem: criar o maior conjunto possível
• Descobrir que há hipóteses válidos fora do seu conjunto de hipóteses – Abordagem: Avaliar constantemente seu conjunto de hipóteses o expandido sempre que os dados se tornem inexplicáveis dada qualquer uma das hipóteses consideradas até o momento
• Criar um bom conjunto e evidências para explicar – Abordagem: Busque fontes diversas e independente de evidências com as quais você possa avaliar suas hipóteses