Upload
carlanoronha7812
View
28
Download
1
Embed Size (px)
Citation preview
ROTEIRO ESTATÍSTICO
Planeamento de Experiências e Investigação
CONTEÚDOS• Introdução
• O planeamento de experiências
• A Análise de Variância
• Testes de comparação múltipla e contrastes
• Modelos lineares generalizados
• Análise de regressão
• Multicolinearidade
• Aplicabilidade do R nos MLG
• Conclusão e futuros trabalhos
• Bibliografia
IntroduçãoO que se espera com a realização de uma experiência?
• determinar as principais causas de variação de uma resposta medida,
• encontrar as condições que dão origem a uma resposta máxima ou mínima,
• comparar as respostas obtidas em diferentes configurações de variáveis controláveis,
• obter um modelo matemático, a fim de prever as futuras respostas.
Objetivos
• Incursão sobre as técnicas estatísticas focadas na UC
• Produção de um roteiro de fácil leitura
• Conceitos mais relevantes em cada uma das técnicas
Planeamento de Experiências• Teve origem com os trabalhos de Fisher no inicio do séc.
XX
• Fisher introduziu 3 conceitos : randomização, aleatorização e Blocking (agrupamento)
• O planeamento foi abraçado por outros estatísticos : Box, Cox, Wilson, Cochran, Bose, Yates,etc.
Princípios básicos do Planeamento de Experiências:
• Utilizar o nosso conhecimento não estatístico do problema
• Manter o planeamento o mais simples possível
• Reconhecer a diferença entre significância prática e estatística
• As experiências normalmente são interativas/sequenciais
Passos a percorrer pelo investigador• Antes do planeamento propriamente dito, devemos identificar
e definir o problema (o que pretendemos estudar), escolher os factores e níveis e seleccionar a variável-resposta;
• Escolher qual o plano experimental que mais se adequa ao nosso problema;
• Levar então a cabo a nossa experiência nas melhores condições;
• Analisar estatisticamente os resultados, i.e, recolher os dados e trabalhá-los com as técnicas apropriadas;
• Elaborar as conclusões ou recomendações possíveis;
A Análise de Variância• Desenvolvida por Fisher
• O objetivo é a comparação de mais do que duas médias
• Não deve ser usado o teste t-student para este efeito para minimizar os erros que se acumulam
• Existem vários modelos quanto ao nº de fatores:
- Anova 1 fator - Anova 2 fatores - Anova 3 fatores ou mais
• Quanto à forma como os grupos são constituidos :
- Anova de efeitos fixos
- Anova de efeitos aleatórios
• Um estudo de Análise de Variância pode ser executado à mão e também através de software apropriado
• O porquê da Anova? Permite-nos determinar se as diferenças entre médias são apenas amostrais ou populacionais (se são estatisticamente diferentes)
O modelo:
Em que – valores observados em cada grupo - média geral – parâmetro para o tratamento – termos residuais (diferença entre o valor observado e o modelo ajustado – erro/resíduo) - refere-se ao grupo – refere-se à observação dentro do grupo
Pressupostos da AnovaPara se poder conduzir um estudo de análise de variância, é necessário que os seguintes pressupostos se verifiquem:
• Os grupos de observações devem ser independentes entre si
• Cada grupo de observações deve seguir uma distribuição Normal
• Deve existir homogeneidade de variâncias
O modelo de efeitos fixosHipóteses a testar
H0 : µ1= µ2= …= µk = µ H1 : µi≠ µj para pelo menos um par (i,j)
RepresentaçãoYio →soma total das observações do i-ésimo tratamentoYi●→média das observações do i-ésimo tratamentoy●●→média global das observações
Yio=
Yi● = , i=1,2,…,k
Yoo=
y●● = , n=
A variabilidade total pode ser expressa como uma partição: = +
Teste de comparação múltipla• Utilizados quando ocorre a rejeição da hipótese nula na Anova
• Procura identificar quais os tratamentos que diferem mais uns dos outros
• Os primeiros trabalhos foram desenvolvidos por Tuckey e Scheffè na década de 1950
• A sua aplicabilidade depende por exemplo das dimensões das amostras
• Têm potências e rigor diferentes
Os mais utilizados
• Student Neuman Keuls (SNK)• Tukey Honestly Significant Difference (HSD ou Tukey)• Fisher Protected Least Significant Difference (LSD)• Duncan Multiple Range Test (Duncan)• Teste de Ryan• Teste de Peritz• Teste de Scheffé• Teste de Dunnett• Correcção de Bonferroni sequencial• Teste T3 de Dunnet (rank based)• outros
Modelos lineares generalizados• Constituem uma alternativa quando os dados não respeitam os
pressupostos da normalidade e da homocedasticidade• São constituídos por 3 componentes :
- aleatória- sistemática- função de ligação
• As funções de ligação canónica definem se os MLG são modelos discretos ou contínuos
Modelos discretos : • Regressão logistica• Poisson• Dose resposta
Modelos continuos• Normal• Gama• Normal inversa
Análise de Regressão• Tenta relacionar a relação existente entre um conjunto de variáveis
preditoras e uma variável resposta
• Tem por objetivos:• Predição
• Seleção de variáveis
• Estimação de parâmetros
• Inferência
A importância da Multicolinearidade• A existência de multicolinearidade entre as variáveis compromete
os resultados do estudo
• A multicolinearidade pode ser detetada através:
- por um valor elevado de - sinais dos coeficientes do modelo diferentes do esperado- identificação de correlação entre as variáveis- observação do comportamento dos coeficientes perante
retirada/colocação de variáveis
A multicolinearidade pode ser minimizada :
• Se retirarmos a(s) variável(ies) correlacionada(s)• Se aumentarmos a amostra
Testes para estudar a multicolinearidade:
• Teste de Ferrar & Glauber• Teste VIF• Teste Tolerance
Aplicabilidade do R nos MLG• Levámos a cabo um pequeno estudo no qual se pretendia
determinar se a altura das árvores era fator determinante para a existência de ninhos de uma espécie de aves
• Criámos um MLG para esse efeito, apenas com o fator altura
• Concluimos que quanto menor era a altura da árvore menor era a probabilidade de encontrar um ninho da espécie Fregata magnificens
Conclusões e trabalhos futuros• Muito ficou por dizer mas muitas coisas importantes foram ditas
• Percorremos várias técnicas estatísticas salientando os seus aspetos mais relevantes e que esperamos terem despertado a curiosidade para trabalhos futuros
• Concluimos que alguns dos procedimentos se fazem sem recurso a software com relativa facilidade
• Ficámos ansiosos por poder desenvolver estes temas numa próxima oportunidade