15
INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA 1. O que é Estatística? ENCE: O que modernamente se conhece como Ciências Estatísticas, ou simplesmente Estatística, é um conjunto de técnicas e métodos de pesquisa que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações. (acessado em 10/02/2104) Wikipedia: A estatística é a ciência que se dedica à coleta, organização, análise, interpretação e apresentação de dados. Além disso, lida com todos os aspectos de um conjunto de dados, incluindo o planejamento da coleta, tanto em pesquisas amostrais como experimentais. (traduzido do inglês - acessado em 10/02/2014). Statistics is the study of the collection, organization, analysis, interpretation and presentation of data. It deals with all aspects of data including the planning of data collection in terms of the design of surveys and experiments.” INDG (instituto de desenvolvimento gerencial): É a ciência que lida com a coleta, o processamento e a disposição de dados, atuando como ferramenta fundamental nos processos de solução de problemas. Trata da coleta de dados informativos e da interpretação destes dados, facilitando o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja sendo estudado. (acessado em 2007) IBGE (site infantil): A Estatística é uma ciência que cuida da coleta de dados, que são organizados, estudados e então utilizados para um determinado objetivo. No caso do IBGE, a estatística é importante para informar sobre a realidade do Brasil através de números. (ac. 10/02/2104) IMPORTANTE: o relacionamento da Estatística com as demais ciências é cada vez mais intenso, sendo os métodos estatísticos largamente empregados nas mais diversas áreas do conhecimento. A ESTATÍSTICA é uma ciência multidisciplinar!

INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

  • Upload
    doanbao

  • View
    232

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA

1. O que é Estatística?

ENCE: O que modernamente se conhece como Ciências Estatísticas, ou

simplesmente Estatística, é um conjunto de técnicas e métodos de pesquisa

que entre outros tópicos envolve o planejamento do experimento a ser

realizado, a coleta qualificada dos dados, a inferência, o processamento, a

análise e a disseminação das informações. (acessado em 10/02/2104)

Wikipedia: A estatística é a ciência que se dedica à coleta, organização,

análise, interpretação e apresentação de dados. Além disso, lida com todos

os aspectos de um conjunto de dados, incluindo o planejamento da coleta,

tanto em pesquisas amostrais como experimentais. (traduzido do inglês -

acessado em 10/02/2014).

“Statistics is the study of the collection, organization, analysis, interpretation and

presentation of data. It deals with all aspects of data including the planning of data

collection in terms of the design of surveys and experiments.”

INDG (instituto de desenvolvimento gerencial): É a ciência que lida com

a coleta, o processamento e a disposição de dados, atuando como

ferramenta fundamental nos processos de solução de problemas. Trata da

coleta de dados informativos e da interpretação destes dados, facilitando o

estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja

sendo estudado. (acessado em 2007)

IBGE (site infantil): A Estatística é uma ciência que cuida da coleta de

dados, que são organizados, estudados e então utilizados para um

determinado objetivo. No caso do IBGE, a estatística é importante para

informar sobre a realidade do Brasil através de números. (ac. 10/02/2104)

IMPORTANTE: o relacionamento da Estatística com as demais

ciências é cada vez mais intenso, sendo os métodos estatísticos

largamente empregados nas mais diversas áreas do conhecimento.

A ESTATÍSTICA é uma ciência multidisciplinar!

Page 2: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

2. Por que estudar Estatística?

A todo instante do nosso dia-a-dia nos deparamos com dados.

Por exemplo, para decidir pela compra de um eletrodoméstico, um

aparelho eletrônico ou até mesmo na compra de uma caixa de sabão em pó

temos diferentes opções:

● marca: prós e contra de cada uma.

● preço: é compatível com o que o produto oferece e com o nosso

orçamento?

● melhor custo/benefício.

● garantia, assistência técnica, acabamento, etc...

2.1. A pesquisa Científica

Na Pesquisa Científica, no entanto, os dados são um fator

preponderante para que possamos responder às nossas indagações.

A metodologia científica determina que a observação e análise dos

dados devem ser feitas de maneira criteriosa e objetiva para que os

resultados sejam confiáveis.

A Estatística participa da pesquisa científica em todas as suas etapas:

i) definição do problema e população alvo;

ii) escolha das informações a serem observadas (ou seja as variáveis);

iii) no planejamento e coleta dos dados;

iv) na análise dos dados e conclusões.

Page 3: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

Etapas de uma pesquisa

Atuação predominantemente da Área de Estudo

Atuação predominantemente da Estatística

Atuação de ambas as áreas

A) Definições:

problema, objetivo, população alvo

B) Planejamento da pesquisa: variáveis, plano amostral ou

experimental e técnica de análise

C) Execução da pesquisa: coleta de dados

(observação, mensuração)

D) Análise dos dados: segundo os objetivos traçados e

técnicas apropriadas

E) Resultados com relatório final

F) Conclusões e previsões

Page 4: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

3. Como planejar uma pesquisa

“Toda análise estatística é feita para responder a algum questionamento”.

i) em pesquisas acadêmicas;

ii) de empresas privadas (pesquisas de satisfação, desenvolvimento de

produtos, etc...);

iii) de órgãos governamentais (para definição das políticas públicas);

iv) em pesquisas eleitorais;

Exemplos:

a) Pesquisa realizada para se detectar se o tipo de tinta e o tempo de

secagem influenciam no acabamento de superfícies de peças metálicas. (exemplo fictício).

b) Estudo realizado com crianças em escolas de São Carlos para avaliar se

a exposição à violência doméstica do pai contra a mãe influencia no

rendimento escolar.

(Brancalhone, P.G.; Fogo, J.C.; Williams, L.C.A. (2004) “Crianças Expostas à

Violência Conjugal: Avaliação do Desempenho Acadêmico”, Psicologia: Teoria e

Pesquisa, Vol. 20, no 2, 113-117);

c) Pesquisa eleitoral para se avaliar a intenção de votos para os cargos

majoritários na eleição de outubro/2014.

3.1. O problema

Normalmente surge de um questionamento.

“O tipo de tinta e o tempo de secagem influenciam no acabamento de

superfícies de peças metálicas?”

“O aluno sujeito à violência doméstica tem rendimento escolar inferior

em relação àquele que não está sujeito?”

A definição do problema, no entanto, vai muito além de um simples

questionamento, envolvendo uma ampla revisão literária sobre o tema em

questão.

Uma vez definido o problema a ser abordado, os objetivos da pesquisa

devem ser elaborados de forma bastante clara.

Page 5: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

3.2. Definição dos objetivos

Os objetivos podem ser gerais ou específicos e geralmente são definidos

no início da pesquisa, na fase das definições/planejamento.

Objetivo geral: é o objetivo central e responsável pelo desencadear do

estudo.

Objetivos específicos: são formados por questões secundárias que ajudam

a entender o resultado da pesquisa, corroborando,

ou não, com o objetivo geral.

Exemplo:

Objetivo geral: Verificar se crianças expostas à violência doméstica, do

pai contra a mãe, têm desempenho escolar prejudicado quando comparados

às crianças que não estão expostas a nenhum tipo de violência.

Objetivos específicos:

i) conhecer a renda média familiar de crianças expostas e não expostas à

violência doméstica;

ii) verificar quais as dificuldades apresentadas pelas crianças de cada

grupo;

iii) observar e comparar o tipo de relacionamento (união) dos pais para cada

grupo de crianças.

3.3. Coleta dos dados e os tipos de pesquisa

Em relação à coleta dos dados a pesquisa é classificada em dois

tipos:

a) Estudo Observacional: as informações, ou medidas, de interesse são

coletadas por meio de observação, de tal forma que o pesquisador não

exerça nenhuma interferência nas respostas.

Requer um Planejamento amostral.

Exemplos: pesquisa de intenção de votos; tempo de atendimento nos caixas

de um banco; estudo sobre o comportamento de baleias em relação às crias,

etc...

Page 6: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

O estudo observacional pode ser realizado por meio de uma pesquisa amostral ou censo.

Na pesquisa amostral a informação é obtida a partir de uma amostra

da população, que a representa adequadamente.

No censo a informação é obtida por meio da população completa, ou

seja, com a informação de todos os seus indivíduos/elementos.

Censos não são comuns, pois são muito caros.

b) Estudo Experimental: consiste na coleta de informação por meio de um

experimento, previamente planejado, no qual o pesquisador consegue

controlar alguns fatores que possam interferir na resposta, diminuindo sua

variabilidade final.

Desta forma, o pesquisador pode otimizar os resultados, com uma

quantidade bastante reduzida de amostras.

O experimento normalmente é realizado num laboratório, no qual um

tratamento é aplicado deliberadamente aos indivíduos a fim de observar a

sua resposta

Requer um planejamento experimental.

Exemplos: estudos caso-controle em epidemiologia; pesos de cobaias

submetidos a diferentes dietas; ensaios para se verificar o grau dureza de

diferentes materiais; etc...

4. A Coleta dados Dados

4.1. Conceitos

População: conjunto de indivíduos, ou itens, com pelo menos uma

característica em comum.

Também será denotada por população objetivo, que é sobre a qual

desejamos obter informações e/ou fazer inferências.

Pode, ainda, ser chamada de Universo.

Será denotada por: Nu,,u,u,uU 321

iu unidades elementares, i = 1, 2, . . . , N.

N = no de elementos, ou tamanho, da população.

Page 7: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

Exemplos:

a) Residentes da cidade de São Carlos;

b) Lote de peças produzido numa linha de produção de uma indústria;

c) Eleitores do município de São Paulo, aptos a votar na eleição;

d) Indivíduos do sexo masculino que sofrem de diabetes;

etc, etc, etc ...

Amostra: subconjunto, necessariamente finito, de uma população.

é selecionada de forma que todos os elementos da população tenham

a mesma chance de serem escolhidos.

4.2. Planejamentos Amostrais

4.2.1. Conceitos Iniciais

i) Unidade amostral: indivíduos ou grupos de indivíduo

(conglomerados) de uma população, aptos a participar da pesquisa;

ii) Sistema de referência: lista completa das unidades amostrais;

iii) N = tamanho da população: é dado pelo número de indivíduos da

população amostral;

iv) n = tamanho da amostra: é dado pelo número de indivíduos

selecionados na amostra.

Fatores que interferem na escolha do Plano Amostral:

Tamanho da população N;

Custo;

Heterogeneidade da população;

Page 8: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

Os elementos da amostra devem ser selecionados da população

amostral segundo alguma forma de sorteio.

4.2.2. Planos de Amostragem

Existem diversos tipos de planejamentos amostrais dos quais

destacaremos:

A) Amostra Aleatória Simples (AAS):

Na A.A.S., uma amostra de tamanho n é selecionada ao acaso dentre

os N elementos da população amostral.

É necessário um sistema de referência, com a identificação das

unidades amostrais, para proceder ao sorteio.

B) Amostra Aleatória Estratificada (AAE):

Em muitas situações a população é muito heterogênea, ou seja, a(s)

característica a ser observada varia muito de um indivíduo para outo.

Nestes casos é aconselhável subdividir a população em subpopulações

ou estratos homogêneos.

Na AAE a população é dividida em k estratos sendo que, uma AAS é

aplicada em cada um dos estratos.

Conhecendo o tamanho da amostra n, a decisão na AAE consiste em

determinar (ou alocar) o número de indivíduos a serem selecionados em

cada um dos estratos?

C) Amostra Aleatória por Conglomerados (AAC):

Na amostragem por conglomerados os elementos da população são

agrupados em conglomerados ou clusters (grupos), sendo que uma AAS

é aplicada para a seleção aleatória de k grupos (que, neste caso, serão as

unidades amostrais).

Uma vez selecionados os conglomerados, todos os seus elementos

serão observados.

Page 9: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

Diferentemente da AAE, na AAC a divisão deve ser feita de forma que

os conglomerados tenham as mesmas características da população.

O procedimento descrito acima é uma AAC em um estágio, quando se

realiza uma única seleção de conglomerados.

Quadro comparativo entre os três métodos de amostragem:

AAE Mais precisa do que a AAS, porém mais cara.

• considera a heterogeneidade da população

AAS

Planejamento ideal.

• pode ser muito cara

• não considera a heterogeneidade da população

AAC Menos precisa do que a AAS e AAE, porém mais barata.

• resolve o problema do custo

Figura ilustrativa exemplicando a AAS, AAE e AAC.

Page 10: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

4.3. Planejamentos Experimentais

Experimento, normalmente em laboratório, no qual um tratamento é

aplicado deliberadamente aos indivíduos a fim de observar a sua resposta.

Exemplos:

a) ensaios para se verificar a dureza de materiais;

b) estudos caso-controle em epidemiologia;

c) pesos de cobaias submetidas à diferentes dietas;

“Requer um Planejamento Experimental.”

4.3.1. Conceitos Iniciais

Experimento: é o conjunto de procedimentos ou ações realizados

para a observação ou mensuração de uma informação, as quais serão

utilizadas como evidência para se confrontar uma hipótese de interesse.

Deve obedecer a critérios, ou normas pré-estabelecidas, inerentes a

cada caso.

Observações:

a) No estudo experimental, a população é formada por todos os valores

possíveis de serem observados.

b) As populações objetivo e amostral são definidas da mesma forma,

porém, como o experimento é planejado, na maioria dos casos elas são

iguais.

c) No estudo experimental é muito importante determinar o número de

elementos necessários, e a forma de coleta, de maneira a não interferir

nos resultados.

4.3.2. Levantamentos de dados

A) Uma amostra

Selecionar ao acaso n elementos de uma população para participar da

amostra.

Page 11: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

Exemplo: selecionar uma amostra de peças de espuma, segundo uma

específica formulação, para serem colocadas num teste de resistência à

tração.

Normalmente compara-se a amostra com um padrão já conhecido;

Espera-se que a população seja homogênea (tenha pouca variabilidade).

1

2 1

3 2

n

N

População Amostra

B) Duas Amostras

Muitas vezes queremos comparar dois grupos, então, selecionamos

uma amostra de cada um desses grupos.

As amostras podem ser independentes ou dependentes em função da

maneira como são selecionadas.

Além disso, podem ser utilizadas na comparação de duas populações

ou dois tratamentos.

A.1) amostras independentes: nenhum elemento da primeira amostra

interfere nos da segunda.

a) dois tratamentos: tomar n elementos de uma única população e

dividí-los em dois grupos, de preferência de mesmo tamanho, sobre os

quais serão aplicados os tratamentos.

(ou sortear, independentemente, duas amostras da mesma população)

Page 12: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

1

1 2

2

3 n1

n1 + n2 = n

1

2

N

n2

População Amostras

b) duas populações: sortear n1 elementos da primeira população e n2 da

segunda e aplicar o mesmo tratamento em ambas.

1 1

2 2

3

n1

N1 n1 + n2 = n

1 1

2 2

3

n2

N2

Populações Amostras

A comparação entre os dois grupos será feita por meio de testes estatísticos, como por exemplo, t-Student, Wilcoxon ou Mann-Whitney.

Page 13: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

A.2) Amostras pareadas (dependentes): uma amostra é observada em

dois instantes diferentes: (antes/depois), (tempo 1, tempo 2).

1 1 Fazer as diferenças:

2 t 2

di = yi2 – yi1

n n

t1 t2

Amostras

A análise é feita pelas diferenças das respostas nos dois instantes de

observação, com os testes t-Student ou do sinal.

C) k amostras

Quando temos k ≥ 3 grupos para analisar (ou comparar).

Os grupos sorteados podem ser independentes ou dependentes.

a) k grupos independentes: dividir, ao acaso, n elementos em k grupos tal

que n = n1 + n2 + ... + nk.

Aqui também é preferível (ou vantajoso) que os grupos tenham todos o

mesmo tamanho, ou seja, n = kni.

Por exemplo, um fator com cinco níveis (A1, A2, A3, A4, A5)

A1

k = 5 grupos

A2

A3

A4

A5

(análise de variância a um fator e comparações múltiplas)

Page 14: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

b) medidas repetidas (k grupos dependentes): o mesmo grupo, de

tamanho n, é observado em k instantes diferentes.

Para k = 2, tem-se o caso de amostras pareadas.

1 1 1 1

2 2 2 . . . 2

n n n n

t1 t2 t3 tk

c) Análise de variância a dois fatores (two-way): análise para

comparações de mais de dois grupos quando existem dois critérios

(chamados fatores) para a divisão dos grupos.

Considerando, por exemplo, um fator com três níveis (A1, A2, A3) e um

segundo fator com dois níveis (B1, B2), teremos:

A1

B1 A1 B1

B2 A1 B2

A2

B1 A2 B1

6 grupos

B2 A2 B2

A3

B1 A3 B1

B2 A3 B2

(análise de variância a um fator e comparações múltiplas)

Page 15: INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA - ufscar.br · No caso do IBGE, a estatística é importante para informar ... 2.1. A pesquisa Científica Na Pesquisa Científica, no

RESUMO

A) Pesquisa Amostral

Amostragem Aleatória Simples - AAS

Amostragem Aleatória Estratificada - AAE

Amostragem Aleatória por Conglomerados - AAC

Planejamentos Amostrais mais complexos

B) Pesquisa Experimental

1 amostra 1 população

2 amostras

Independentes

2 tratamentos ou perfis

(1 pop)

1 tratamento ou perfil

(2 pop)

Dependentes dados pareados

k amostras

( k ≥ 3 )

Independentes 1 ou mais fatores

Dependentes medidas repetidas