ROTEIRO ESTATÍSTICO carla noronha

ROTEIRO ESTATÍSTICO

Planeamento de Experiências e Investigação

CONTEÚDOS• Introdução

• O planeamento de experiências

• A Análise de Variância

• Testes de comparação múltipla e contrastes

• Modelos lineares generalizados

• Análise de regressão

• Multicolinearidade

• Aplicabilidade do R nos MLG

• Conclusão e futuros trabalhos

• Bibliografia

IntroduçãoO que se espera com a realização de uma experiência?

• determinar as principais causas de variação de uma resposta medida,

• encontrar as condições que dão origem a uma resposta máxima ou mínima,

• comparar as respostas obtidas em diferentes configurações de variáveis controláveis,

• obter um modelo matemático, a fim de prever as futuras respostas.

Objetivos

• Incursão sobre as técnicas estatísticas focadas na UC

• Produção de um roteiro de fácil leitura

• Conceitos mais relevantes em cada uma das técnicas

Planeamento de Experiências• Teve origem com os trabalhos de Fisher no inicio do séc.

XX

• Fisher introduziu 3 conceitos : randomização, aleatorização e Blocking (agrupamento)

• O planeamento foi abraçado por outros estatísticos : Box, Cox, Wilson, Cochran, Bose, Yates,etc.

Princípios básicos do Planeamento de Experiências:

• Utilizar o nosso conhecimento não estatístico do problema

• Manter o planeamento o mais simples possível

• Reconhecer a diferença entre significância prática e estatística

• As experiências normalmente são interativas/sequenciais

Passos a percorrer pelo investigador• Antes do planeamento propriamente dito, devemos identificar

e definir o problema (o que pretendemos estudar), escolher os factores e níveis e seleccionar a variável-resposta;

• Escolher qual o plano experimental que mais se adequa ao nosso problema;

• Levar então a cabo a nossa experiência nas melhores condições;

• Analisar estatisticamente os resultados, i.e, recolher os dados e trabalhá-los com as técnicas apropriadas;

• Elaborar as conclusões ou recomendações possíveis;

A Análise de Variância• Desenvolvida por Fisher

• O objetivo é a comparação de mais do que duas médias

• Não deve ser usado o teste t-student para este efeito para minimizar os erros que se acumulam

• Existem vários modelos quanto ao nº de fatores:

- Anova 1 fator - Anova 2 fatores - Anova 3 fatores ou mais

• Quanto à forma como os grupos são constituidos :

- Anova de efeitos fixos

- Anova de efeitos aleatórios

• Um estudo de Análise de Variância pode ser executado à mão e também através de software apropriado

• O porquê da Anova? Permite-nos determinar se as diferenças entre médias são apenas amostrais ou populacionais (se são estatisticamente diferentes)

O modelo:

Em que – valores observados em cada grupo - média geral – parâmetro para o tratamento – termos residuais (diferença entre o valor observado e o modelo ajustado – erro/resíduo) - refere-se ao grupo – refere-se à observação dentro do grupo

Pressupostos da AnovaPara se poder conduzir um estudo de análise de variância, é necessário que os seguintes pressupostos se verifiquem:

• Os grupos de observações devem ser independentes entre si

• Cada grupo de observações deve seguir uma distribuição Normal

• Deve existir homogeneidade de variâncias

O modelo de efeitos fixosHipóteses a testar

H0 : µ1= µ2= …= µk = µ H1 : µi≠ µj para pelo menos um par (i,j)

RepresentaçãoYio →soma total das observações do i-ésimo tratamentoYi●→média das observações do i-ésimo tratamentoy●●→média global das observações

Yio=

Yi● = , i=1,2,…,k

Yoo=

y●● = , n=

A variabilidade total pode ser expressa como uma partição: = +

Teste de comparação múltipla• Utilizados quando ocorre a rejeição da hipótese nula na Anova

• Procura identificar quais os tratamentos que diferem mais uns dos outros

• Os primeiros trabalhos foram desenvolvidos por Tuckey e Scheffè na década de 1950

• A sua aplicabilidade depende por exemplo das dimensões das amostras

• Têm potências e rigor diferentes

Os mais utilizados

• Student Neuman Keuls (SNK)• Tukey Honestly Significant Difference (HSD ou Tukey)• Fisher Protected Least Significant Difference (LSD)• Duncan Multiple Range Test (Duncan)• Teste de Ryan• Teste de Peritz• Teste de Scheffé• Teste de Dunnett• Correcção de Bonferroni sequencial• Teste T3 de Dunnet (rank based)• outros

Modelos lineares generalizados• Constituem uma alternativa quando os dados não respeitam os

pressupostos da normalidade e da homocedasticidade• São constituídos por 3 componentes :

- aleatória- sistemática- função de ligação

• As funções de ligação canónica definem se os MLG são modelos discretos ou contínuos

Modelos discretos : • Regressão logistica• Poisson• Dose resposta

Modelos continuos• Normal• Gama• Normal inversa

Análise de Regressão• Tenta relacionar a relação existente entre um conjunto de variáveis

preditoras e uma variável resposta

• Tem por objetivos:• Predição

• Seleção de variáveis

• Estimação de parâmetros

• Inferência

A importância da Multicolinearidade• A existência de multicolinearidade entre as variáveis compromete

os resultados do estudo

• A multicolinearidade pode ser detetada através:

- por um valor elevado de - sinais dos coeficientes do modelo diferentes do esperado- identificação de correlação entre as variáveis- observação do comportamento dos coeficientes perante

retirada/colocação de variáveis

A multicolinearidade pode ser minimizada :

• Se retirarmos a(s) variável(ies) correlacionada(s)• Se aumentarmos a amostra

Testes para estudar a multicolinearidade:

• Teste de Ferrar & Glauber• Teste VIF• Teste Tolerance

Aplicabilidade do R nos MLG• Levámos a cabo um pequeno estudo no qual se pretendia

determinar se a altura das árvores era fator determinante para a existência de ninhos de uma espécie de aves

• Criámos um MLG para esse efeito, apenas com o fator altura

• Concluimos que quanto menor era a altura da árvore menor era a probabilidade de encontrar um ninho da espécie Fregata magnificens

Conclusões e trabalhos futuros• Muito ficou por dizer mas muitas coisas importantes foram ditas

• Percorremos várias técnicas estatísticas salientando os seus aspetos mais relevantes e que esperamos terem despertado a curiosidade para trabalhos futuros

• Concluimos que alguns dos procedimentos se fazem sem recurso a software com relativa facilidade

• Ficámos ansiosos por poder desenvolver estes temas numa próxima oportunidade

Documents

ROTEIRO ESTATÍSTICO carla noronha