87
ESTATÍSTICA I ESTATÍSTICA I

Estatística I - 2008

  • Upload
    marcelle

  • View
    3.913

  • Download
    25

Embed Size (px)

DESCRIPTION

Material de Apoio - ESAMC

Citation preview

Page 1: Estatística I - 2008

ESTATÍSTICA IESTATÍSTICA I

Page 2: Estatística I - 2008

EstatEstatíística stica II

    

Antonio A. Crespo define Estatística como : Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados quantitativos e qualitativos, e a utilização desses dados para a tomada de decisão.

Definição

Page 3: Estatística I - 2008

AnAnáálise Exploratlise Exploratóória de Dadosria de Dados

Amostra

Conclusões

sobre as

características

da população

Informações

contidas nos

dados

População

(características)

Técnicas de

Amostragem

Análise

Exploratória

Inferência

Estatística

Introdução

Page 4: Estatística I - 2008

AnAnáálise Exploratlise Exploratóória de Dadosria de Dados

    

     Utilidade da Estatística na Gestão A Estatística permite: • Resolver problemas mediante a coleta de dados de boa qualidade• Argumentar utilizando dados• Analisar e interpretar dados• Detectar situações fora de controle e outras fontes de dificuldades que requerem atenção e medidas corretivas• Coletar evidências para fins legais•Determinar ociosidade de recursos e eficiência na utilização dos mesmos•Determinar custos de atividades, de produtos, de unidades organizacionais etc•Melhorar a qualidade de dados, desempenhos, decisões, ações, produtos, processos e serviços

Page 5: Estatística I - 2008

AnAnáálise Exploratlise Exploratóória de Dadosria de Dados

    

  Algumas Dificuldades com a Estatística • Culturais / Rejeição às "matemáticas" / Contato prematuro inadequado

• “Invisibilidade” da Estatística

• Armadilha da atividade

Page 6: Estatística I - 2008

MMéétodo Estattodo Estatíístico stico

    

O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas as causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.

Page 7: Estatística I - 2008

MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO

    

As fases são :

• Coletas de dados : é a obtenção, reunião e registro sistemático de dados, com um objetivo determinado. 

• Direta : quando é obtida diretamente da fonte e pode ser : 

- Contínua : Obtida ininterruptamente- Registro de nascimentos, etc.

- Periódica : em períodos curtos

- Censos

- Ocasional : esporadicamente

- Surto epidêmico

• Indireta : Quando é inferida ( deduzida ) a partir dos elementos

conseguidos pela coleta direta

- Mortalidade infantil

Page 8: Estatística I - 2008

MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO

    

Crítica dos dados : devem ser criticados à procura de

erros grosseiros ou de certos vultos, que possam influir

sensivelmente nos resultados como: 

- Externa : Informante 

- Interna : dados da coleta

Apuração dos dados :é a soma e o processamento dos

dados obtidos e a disposição mediante critérios de

classificação.

Page 9: Estatística I - 2008

MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO

    

Exposição dos dados : devem ser apresentados sob forma de

tabelas ou gráficos tornando mais fácil e

compreensão do objeto de tratamento

estatístico

Análise dos resultados : É o estudo dos resultados com o objetivo

de tirar conclusões sobre o todo

(população), a partir de informações

fornecidas por parte representativa do

todo ( amostra).

Page 10: Estatística I - 2008

PopulaPopulaçção e Amostra ão e Amostra

    

População : é o conjunto de entes portadores de , pelo menos, uma característica comum

Amostra : é um subconjunto finito de uma população

 

Page 11: Estatística I - 2008

POPULAPOPULAÇÇÃO E AMOSTRAÃO E AMOSTRA

    

Devido a quantidade excessivamente grande de elementos que constantemente fazem parte da população, trabalhamos com uma amostra.

O aspecto comum dentre todas as técnicas existentes é a aleatoriedade, isto é, a igual chance que cada elemento da população deve ter de ser escolhido, as principais:

a) Casual Simples - sorteio

b) Sistemática - Os elementos já se encontram ordenados e então, sorteamos um número e sistematicamente os outros ficam determinados

c) Estratificada - Quando a população esta dividida em estratos de acordo com o fato em estudo

Page 12: Estatística I - 2008

VariVariáávelvel

    

Variáveis

Qualitativas

Quantitativas

Nominais

Ordinais

Discretas

Contínuas

Variável - é convencionalmente, o conjunto de resultados possíveis de um fenômeno Tipos de variáveis

Page 13: Estatística I - 2008

VariVariáávelvel

    

Exemplo ( Variáveis em uma ficha cadastral PF )

  Variável Tipo

1 Número de dependentes   Quantitativa, discreta

2 Idade   Quantitativa, contínua

3 Local de nascimento   Qualitativa, nominal

4 Nível educacional   Qualitativa, ordinal

5  

6  

7  

8  

Page 14: Estatística I - 2008

VariVariáávelvel

    

DISCRETA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos de série e na segunda coluna colocamos os valores das freqüências simples correspondentes.

Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno

 

Page 15: Estatística I - 2008

xi = número de filhos

fi = freqüência absoluta

0 1

1 5

2 6

3 10

total 22

Page 16: Estatística I - 2008

VariVariáávelvel

    

CONTÍNUA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna faixa de valores agrupados em ordem crescente da série e na segunda coluna coloca os valores das freqüências simples correspondentes.

Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande.

Page 17: Estatística I - 2008

xi = número de filhos

fi = freqüência absoluta

2 /------ 4 4

4 /------ 6 12

6 /------ 8 10

8 /------ 10 4

total 30

Page 18: Estatística I - 2008

Conceitos a serem aplicadosConceitos a serem aplicados

    

- Amplitude total de uma seqüência = é a diferença entre o Limite superior e o Limite inferior de uma seqüência.   At = Ls – Li 

- Intervalo de Classe = é qualquer subdivisão da amplitude total de uma série estatística.      2 /------ 4

- Limite de Classe = cada intervalo de classe fica caracterizado por dois números reais. O menor valor chamado de Limite inferior (Li) da classe e o maior valor chamado de Limite superior (Ls) da classe.      2 = Li e 4 = Ls

- Amplitude do intervalo de classe = é a diferença entre o Ls e o Li do intervalo de classe.     A = Ls – Li 4-2 = 2 A = 2

- Freqüência simples ou absoluta de uma classe (fi) = é o número de elementos da seqüência que são maiores ou iguais ao Li desta classe e menores que o Ls desta classe.

Page 19: Estatística I - 2008

DistribuiDistribuiçção de Freqão de Freqüüências ências

    

Freqüência Relativa (fir%) = é a divisão da freqüência simples deste elemento pelo número total de elementos da série:

fir = fi / n onde n ou somatória de fi, é o número total de elementos da série.

Ex: fir = 4 / 30 = 0,1333 ou 13,33%

 

Page 20: Estatística I - 2008

DistribuiDistribuiçção de Freqão de Freqüüências ências

    

Freqüência Acumulada (fiac) = é a soma de fi simples deste elemento com as fi dos elementos que o antecedem.

fiac = fi1 + fi2 + fi3 ...fin

Freqüência acumulada relativa (firac%) = é a divisão da freqüência acumulada deste elemento pelo número total de elementos da série. 

Page 21: Estatística I - 2008

DistribuiDistribuiçção de Freqão de Freqüüências ências

    

xi fi fir% fiac firac%

0 1 3,33 1 3,33

1 5 16,67 6 20,00

2 6 20,00 12 40,00

3 10 33,34 22 73,34

4 4 13,33 26 86,67

5 4 13,33 30 100

Total 30 100    

Page 22: Estatística I - 2008

DistribuiDistribuiçção de Freqão de Freqüüênciasências

    

xi fi fir% fiac firac%

2 /------ 4 4 13,33 4 13,33

4 /------ 6 12 40,00 16 53,33

6 /------ 8 10 33,34 26 86,67

8 /------ 10 4 13,33 30 100

Total 30 100    

         

         

Page 23: Estatística I - 2008

RepresentaRepresentaçção Grão Grááfica - fica - HistogramaHistograma

    

0,34

0,26

0,12

0,16

0,04 0,04

0,02 0,02

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

5,5 13,5 21,5 29,5 37,5 45,5 553,5 61,5

Tributo ( % faturamento )

Pro

po

rção

Page 24: Estatística I - 2008

RepresentaRepresentaçção Grão Grááfica - fica - HistogramaHistograma

    

Histograma Área = 1.00 ( ou 100% ) Área ~ freqüência ( f ou p ) Classes de mesma amplitude : altura ~ freqüência ( f ou p ) Notas : 

Histograma é a representação gráfica adequada para o caso de variáveis contínuas 

Pode ser utilizada para variáveis discretas agrupadas em classes

Page 25: Estatística I - 2008

RepresentaRepresentaçção Grão Grááfica fica PolPolíígono de % acumuladagono de % acumulada

    

0

10

20

30

40

50

60

70

80

90

100

1.5 9.5 17.5 25.5 33.5 41.5 49.5 57.5 65.5

Tributo ( % faturamento )

% a

cum

ula

da

Page 26: Estatística I - 2008

RepresentaRepresentaçção Grão Grááfica fica PolPolíígono de % acumuladagono de % acumulada

    

Mostra a porcentagem de empresas cujo recolhimento de tributos é menor ou igual a um dado valor  Podemos ter também: 

Polígono de freqüências acumuladas 

Polígono de proporções acumuladas

Page 27: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 28: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 29: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 30: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 31: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 32: Estatística I - 2008

Alguns Padrões de HistogramasAlguns Padrões de Histogramas

    

Page 33: Estatística I - 2008

• Tendência Central de um conjunto de

dados é a tendência das medidas destes

dados em se acumular em torno de certos

valores numéricos.

Medidas de Tendência CentralMedidas de Tendência Central

Page 34: Estatística I - 2008

• É a soma das medidas dividida pelo número

de elementos do conjunto de dados.

• Vantagens – reflete cada valor e possui

propriedades matemáticas atraentes.

• Limitações – é influenciada por valores

extremos.

Medidas de Tendência CentralMedidas de Tendência Central

Page 35: Estatística I - 2008

Exemplo :• Calcule a média dos seguintes grupos de dados:

1, 2, 3, 4, 5 e

2, 3, 3, 3, 4

n

xx

n

ii

1

Medidas de Tendência CentralMedidas de Tendência Central

Page 36: Estatística I - 2008

Mediana - Para números aleatórios• É o valor intermediário de um conjunto de medidas

colocadas em ordem crescente (ou decrescente).

Vantagens - muito interessante para grande massa de dados - divide a área do histograma em partes iguais.- menos suscetível a valores extremos.Limitações – difícil de determinar para grande quantidade de

dados.

Medidas de Tendência CentralMedidas de Tendência Central

Page 37: Estatística I - 2008

Média e Mediana

Sua comparação indica a assimetria da distribuição.

MedianaMédia

Medidas de Tendência CentralMedidas de Tendência Central

Page 38: Estatística I - 2008

Moda - Para números aleatórios

• É a medida que ocorre com maior freqüência no conjunto de dados.

– Exemplo: notas de degustadores de vinho:

8, 7, 9, 6, 8, 10, 9, 9, 5, 7.Moda: 9

Medidas de Tendência CentralMedidas de Tendência Central

Page 39: Estatística I - 2008

Moda• Vantagens- indica onde os dados tendem a se concentrar.- útil para dados qualitativos (Ex. notas de jurados).- pode haver mais de uma ou não ter sentido (Ex.

pesquisa de lazer).

• Limitações - não se presta a análise matemática;- pode não ser moda para certos conjuntos de dados.

Medidas de Tendência CentralMedidas de Tendência Central

Page 40: Estatística I - 2008

Exemplo:

• Preferência do produto A (em %) colhida em diversas regiões do Brasil por meio de uma pesquisa de mercado.

56, 63, 64, 65, 66, 69, 71, 57,64, 66, 64, 65, 66, 66, 68 e 72.

N = 16

x = 1042

Média = 65,125Mediana = 65,5

Moda =66

Medidas de Tendência CentralMedidas de Tendência Central

Page 41: Estatística I - 2008

Média Para variáveis discretas• Se os dados estão apresentados na forma de uma variável

discreta, utilizamos a média ponderada, considerando as freqüências (fi) como sendo as ponderações dos elementos (xi) correspondentes.

xi = número de filhos

fi = freqüência absoluta

fi * xi

0 1 0

1 5 5

2 6 12

3 10 30

total 22 47

Média =

47 / 22 =

2,14 filhos

Medidas de Tendência CentralMedidas de Tendência Central

Page 42: Estatística I - 2008

Mediana para variáveis discretas• Para encontrarmos a mediana, dividimos por dois o total das

freqüências absolutas ( 22 / 2 = 11) e calculamos a Freqüência acumulada (fiac)

• Procuramos qual xi que conta o número (11) na Fi xi = 2

xi = número de filhos

fi = freqüência absoluta

fiac

0 1 1

1 5 6

Mediana = 2 6 12 (11)

3 10 22

total 22

Mediana = 2

filhos

Medidas de Tendência CentralMedidas de Tendência Central

Page 43: Estatística I - 2008

Moda para variáveis discretas• Para encontrarmos a moda, basta verificar o elemento xi de maior

freqüência (fi).

xi = número de filhos

fi = freqüência absoluta

0 1

1 5

2 6

Moda = 3 10

total 22

Moda = 3 filhos

Medidas de Tendência CentralMedidas de Tendência Central

Page 44: Estatística I - 2008

Média para variáveis contínuas

Se os dados estão apresentados na forma de uma variável contínua,utilizaremos a média aritmética ponderada, considerando as freqüências (fi) de cada classe ponderando com o ponto médio destas classe. PM = ((Li + LS) / 2)

Média = Somatória de PM*fi / somatória de fi

178 / 30 = 5,93 filhos

Medidas de Tendência CentralMedidas de Tendência Central

Page 45: Estatística I - 2008

xi = número de filhos

Ponto Médio (PM)

fi = freqüência

absoluta

PM * fi

2 /------ 4 3 4 12

4 /------ 6 5 12 60

6 /------ 8 7 10 70

8 /------ 10 9 4 36

total 30 178

Page 46: Estatística I - 2008

xi = número de filhos

fi = freqüência absoluta

fiac

2 /------ 4 4 4

4 /------ 6 12 16 (15)

6 /------ 8 10 26

8 /------ 10 4 30

total 30

Mediana para variáveis contínuas

• Para encontrarmos a mediana, dividimos por dois o total das freqüências absolutas ( 30 / 2 = 15) e calculamos a Freqüência acumulada (fiac)

•Procuramos qual xi que conta o número (15) na fiac xi = 4 /---6

Este será o intervalo que usaremos como base para resolvermos a fórmula da mediana.

Medidas de Tendência CentralMedidas de Tendência Central

Page 47: Estatística I - 2008

Mediana para variáveis contínuas

• Fórmula da Mediana para variáveis contínuas

hfi

fiacnLimd

ant

.2/

Onde : Li = Limite inferior do intervalo de classe 4n = Total de fi 30fiacant = freqüência acumulada anterior ao intervalo de

classe 4fi = freqüência do intervalo de classe 12h = amplitude da classe = Ls – Li 6 – 4 = 2

Medidas de Tendência CentralMedidas de Tendência Central

Page 48: Estatística I - 2008

Mediana para variáveis contínuas

• Então :2.

12

42/304

md

83,5md

Obs: o valor obtido pela fórmula é um valor aproximado

Medidas de Tendência CentralMedidas de Tendência Central

Page 49: Estatística I - 2008

Moda para variáveis contínuas

• Fórmula da Moda para variáveis contínuas

Onde : Li = Limite inferior do intervalo de classe 4fipost = freqüência absoluta posterior ao intervalo de classe 10fiant = freqüência absoluta anterior ao intervalo de

classe 4h = amplitude da classe = Ls – Li 6 – 4 = 2

hfifi

fiLimo

antpost

post.

Medidas de Tendência CentralMedidas de Tendência Central

Page 50: Estatística I - 2008

Moda para variáveis contínuas

Então:

2.410

104

mo

43,5mo

Medidas de Tendência CentralMedidas de Tendência Central

Page 51: Estatística I - 2008

Exercícios de aplicação

Page 52: Estatística I - 2008

• São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média.

• Desvio Médio• Variância• Desvio-Padrão• Coeficiente de variação

Medidas de DispersãoMedidas de Dispersão

Page 53: Estatística I - 2008

• Desvio Médio = é a média dos desvios dos valores a contar de média. Ignorando-se o sinal de diferença

.fi

Medidas de DispersãoMedidas de Dispersão

Page 54: Estatística I - 2008

• Variância = é a média dos quadrados dos desvios dos valores a contar da média, calculada usando-se n-1 em lugar de n, como fator de ajuste.

1

n

xxiS2

2

.fi

Medidas de DispersãoMedidas de Dispersão

Page 55: Estatística I - 2008

• Desvio-padrão = é simplesmente a raiz quadrada positiva da variância.

2ss

Medidas de DispersãoMedidas de Dispersão

Page 56: Estatística I - 2008

• Coeficiente de variação = trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas.

100.X

SCV

Medidas de DispersãoMedidas de Dispersão

Page 57: Estatística I - 2008

xi = número de filhos

fi xi * fi

xi - x /xi-x/ * fi

(xi-x)2 * fi

0 1 0 -2,14 2,14 4,58

1 5 5 -1,14 5,7 6,50

2 6 12 -0,14 0,84 0,12

3 10 30 0,86 8,6 7,40

total 22 47 17,28 18,6

Média=2,14

DM = 0,79

S2 = 0,89

S = 0,94

CV = 43,93%

Para variáveis contínuas xi = PM

Medidas de DispersãoMedidas de Dispersão

Page 58: Estatística I - 2008

Exercícios de aplicação

Page 59: Estatística I - 2008

    

•Freqüência e probabilidade

•Eventos

•Definição subjetiva de probabilidade

ProbabilidadeProbabilidade

Page 60: Estatística I - 2008

Resultados do lançamento de um dado (n=10 lançamentos)

Resultado do dado

Número de ocorrências do resultado (f)

Freqüência(f/n)

1

2

3

4

5

6

1

0

1

2

3

3

0,1 ou 10%

0

0,1 ou 10%

0,2 ou 20%

0,3 ou 30%

0,3 ou 30%

Freqüência é o percentual de ocorrencia de uma Freqüência é o percentual de ocorrencia de uma determinada observação dentro de uma amostradeterminada observação dentro de uma amostra

Page 61: Estatística I - 2008

Resultados do lançamento de um dado

Resultado do dado

1

2

3

4

5

6

Número de ocorrências do resultado (f)

Freqüência(f/n)

1/6 * n

1/6 * n

1/6 * n

1/6 * n

1/6 * n

1/6 * n

16,7%

16,7%

16,7%

16,7%

16,7%

16,7%

Núm. de ocorrências do resultado (f)

Freq. Rela(f/n)

11

6

7

7

7

12

0,22 ou 22%

0,12 ou 12%

0,14 ou 14%

0,14 ou 14%

0,14 ou 14%

0,24 ou 24%

n = 50 lançamentos n =

Portanto, a probabilidade pode ser encarada como o limite da freqüênciade um determinado evento dentro da população em estudo

A medida que a amostra cresce, a freqüência se A medida que a amostra cresce, a freqüência se estabiliza: temos então a probabilidadeestabiliza: temos então a probabilidade

Page 62: Estatística I - 2008

0,0

0,1

0,2

0,3

0,4

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

n = 10 n = 50 n = infinito

Representação gráfica dos resultados obtidos no lançamento repetido de um dado (n = número de lançamentos)

A freqüência pode ser representada graficamenteA freqüência pode ser representada graficamente

Page 63: Estatística I - 2008

• Freqüência e probabilidade• Eventos

– Representações gráficas– Compostos– Condicionais– Dependentes e independentes

• Definição subjetiva de probabilidade

ProbabilidadeProbabilidade

Page 64: Estatística I - 2008

Diagrama de árvoreDiagrama de árvore Diagrama de VennDiagrama de Venn

Formas de representação gráfica de eventosFormas de representação gráfica de eventos

Page 65: Estatística I - 2008

Representação dos eventos possíveis para o sexo de cada criança de um casal que tenha três filhos

Criança 1 Criança 2 Criança 3

M

F

Resultado final

M

F

M

F

MF

MF

MFMF

M, M, M

M, M, FM, F, MM, F, FF, M, MF, M, FF, F, MF, F, F

A árvore permite a representação exaustiva dos A árvore permite a representação exaustiva dos eventoseventos

Page 66: Estatística I - 2008

Agrupamento de casais segundo o sexo dos filhos

Casais com meninos somente Casais com

meninas somente

Casais com meninos e meninas

O diagrama de Venn é adequado ao agrupamentos dos O diagrama de Venn é adequado ao agrupamentos dos eventos de interesseeventos de interesse

Page 67: Estatística I - 2008

M

F

M

F

MM

M

M

M

F

F

F

F

F

M

F

M

F

MM

M

M

M

F

F

F

F

F

M

F

Agrupamento de casais com quatro filhos e pelo menos duas meninasM, M, M, M

M, M, M, F

M, M, F, MM, M, F, FM, F, M, M

M, F, M, F

M, F, F, M

M, F, F, F

F, M, M, M

F, M, M, F

F, M, F, MF, M, F, FF, F, M, M

F, F, M, F

F, F, F, MF, F, F, F

Agrupamentodos resultadosque apresentemao menosduas meninas.

A combinação dos diagramas de árvore e de A combinação dos diagramas de árvore e de Venn permite representações mais complexasVenn permite representações mais complexas

Page 68: Estatística I - 2008

Probabilidade de ocorrência do número 6 em um lançamento de dado,

condicionado ao resultado anterior ter sido 3.

Probabilidade de ocorrência do número 6 em um lançamento de dado,

condicionado ao resultado anterior ter sido 3.

Exemplo de evento independenteExemplo de evento independente

Resultado 1

3 1

2

3

4

5

6

Resultado 2 Probabilidade

1/6

1/6

1/6

1/6

1/6

1/6

•O resultado conhecido do primeiro lançamento não altera a probabilidade de

ocorrência do número 6 no segundo lançamento

•Mais formalmente, o evento B é independente se: P(B) = P(B | A)

•O resultado conhecido do primeiro lançamento não altera a probabilidade de

ocorrência do número 6 no segundo lançamento

•Mais formalmente, o evento B é independente se: P(B) = P(B | A)

Lançamentojá realizadoe resultadoconhecido!

Dependência e independência são termos que Dependência e independência são termos que obedecem a regras precisasobedecem a regras precisas

Page 69: Estatística I - 2008

Exemplo de evento dependente

•Probabilidade de uma pessoa consumir requeijão e manteiga,dado que ela consome manteiga

Exemplo de evento dependente

•Probabilidade de uma pessoa consumir requeijão e manteiga,dado que ela consome manteiga

200130

Requeijão (R) Manteiga (M)

RM = 50

Não é consumidor: 20

•O resultado conhecido do consumo de manteiga altera a probabilidade de ocorrência do consumo dos dois produtos Mais formalmente, o evento B é dependente se:P(B) P(B | A)

•O resultado conhecido do consumo de manteiga altera a probabilidade de ocorrência do consumo dos dois produtos Mais formalmente, o evento B é dependente se:P(B) P(B | A)

•P(RM) = 50/300 = 1/6

•P(RM | M) = (50/300) / (200/300) = 1/4

Dependência e independência são termos que Dependência e independência são termos que obedecem a regras precisasobedecem a regras precisas

Page 70: Estatística I - 2008

• Um casal com três crianças ter somente meninos

• Um casal com três crianças ter uma ou duas

meninas

• Um consumidor comprar requeijão e manteiga

Exemplos de eventos compostos

Eventos compostos são formados por dois ou mais eventosEventos compostos são formados por dois ou mais eventos

Page 71: Estatística I - 2008

• Uma pesquisa com 300 pessoas, realizada em um supermercado, teve os seguintes resultados:– 130 pessoas consomem requeijão– 200 pessoas consomem manteiga– 50 pessoas consomem os dois

produtos– 20 pessoas não consomem nenhum

dos dois• Sabendo que uma pessoa escolhida ao

acaso é consumidora de manteiga, qual é a probabilidade de que ela também consuma requeijão?

• Uma pesquisa com 300 pessoas, realizada em um supermercado, teve os seguintes resultados:– 130 pessoas consomem requeijão– 200 pessoas consomem manteiga– 50 pessoas consomem os dois

produtos– 20 pessoas não consomem nenhum

dos dois• Sabendo que uma pessoa escolhida ao

acaso é consumidora de manteiga, qual é a probabilidade de que ela também consuma requeijão?

Descrição do casoDescrição do caso

Requei-jão

Sim

Não

Total

Sim

Não

To-tal

ManteigaTabela de respostas

50

150

80

20

130

170

200 100 300

O termo eventos condicionais indica que a ocorrência de um está condicionada à do outro

Page 72: Estatística I - 2008

Antes da escolha do consumidorAntes da escolha do consumidor

200130

Requeijão (R) Manteiga (M)

RM = 50

Não é consumidor: 20

•Probabilidade de a pessoa ser consumidora dois produtos: P(RM) = 50/300 = 1/6 Neste caso, a incerteza é total. Você não sabe nada sobre a pessoa que foi escolhida. Portanto, a probabilidade de que ela consuma os dois produtos é simplesmente a freqüência de ocorrência desse tipo de consumidor na amostra

•Probabilidade de a pessoa ser consumidora dois produtos: P(RM) = 50/300 = 1/6 Neste caso, a incerteza é total. Você não sabe nada sobre a pessoa que foi escolhida. Portanto, a probabilidade de que ela consuma os dois produtos é simplesmente a freqüência de ocorrência desse tipo de consumidor na amostra

Após a escolha do consumidorApós a escolha do consumidor

200

Manteiga (M)

RM = 50

•Probabilidade de a pessoa ser consumidora dois produtos, condicionado a ela consumir manteiga: P(RM | M) = 50/200 = 1/4

•Neste caso, você sabe que pessoa consome manteiga, portanto os outros grupos de consumidores não devem ser considerados no cálculo. Em outras palavras, uma parte da incerteza foi eliminada.

•Probabilidade de a pessoa ser consumidora dois produtos, condicionado a ela consumir manteiga: P(RM | M) = 50/200 = 1/4

•Neste caso, você sabe que pessoa consome manteiga, portanto os outros grupos de consumidores não devem ser considerados no cálculo. Em outras palavras, uma parte da incerteza foi eliminada.

Sinal “condicionado a”

Em casos como esse, uma parte da incerteza já foi eliminada

Page 73: Estatística I - 2008

• Probabilidade de um time ganhar de outro em uma partida de futebol

• Probabilidade de o mercado acionário subir amanhã

• Probabilidade de o lançamento de um novo produto ser um sucesso

Exemplos de eventos cuja probabilidade de ocorrência não pode ser (facilmente) determinada

Evento

Probabilidade não pode ser determinada

Probabilidade não pode ser determinada

Probabilidade pode ser estimada através de pesquisa de mercado, porém:

Estudo pode ser muito caroPesquisa não fornece, nem pode fornecer, 100% de certeza sobre o resultado do lançamento do produto

Comentário

Às vezes, não se pode determinar a probabilidade de um evento, ou pode ser muito demorado e custoso fazê-lo

Page 74: Estatística I - 2008

• Distribuição de probabilidade

• Distribuições descontínuas de probabilidade– Binomial– Poisson

• Distribuições contínuas de probabilidade– Normal

Probabilidade

Page 75: Estatística I - 2008

• Distribuição de probabilidade

– Uma distribuição de probabilidade é uma distribuição de freqüências para os resultados de um espaço amostral (isto é, para os resultados de uma variável aleatória).

Probabilidade

Page 76: Estatística I - 2008

• Distribuições descontínuas de probabilidade– Binomial – Usa-se o termo binomial para designar situações em

que os resultados de uma variável aleatória podem ser agrupados em duas classes ou categorias.

– A utilização da binomial, exige certas hipótese como:• Há n observações ou provas idênticas• Cada prova tem dois resultados possíveis, um chamado “sucesso” e o

outro “fracasso”.• As probabilidades p de sucesso e 1 – p de fracasso permanecem

constantes em todas as provas.• Os resultados das provas são independentes uns dos outros.

Probabilidade

Page 77: Estatística I - 2008

• Distribuições descontínuas de probabilidade– Fórmula da Binomial

)().()( fracassopsucessopx

nxP

x n-x

Onde: n = numero de amostrasx = número de sucessop(s) = percentual de sucessop (f) = percentual de fracasso

Probabilidade

Page 78: Estatística I - 2008

• Binomial – suponha que 8% dos cachorros-quentes vendidos num estádio de beisebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro-quente, determine a probabilidade de que:– Todos queiram mostarda– Apenas um não queira

x n-x

Exemplo

Page 79: Estatística I - 2008

)92,0).(08,0(0

7)(

xP

0 7a- =

0,5578

b-)92,0).(08,0(

1

7)(

xP =

0,3396

1 6

Exemplo

Page 80: Estatística I - 2008

• Distribuição de probabilidade• Distribuições descontínuas de probabilidade

– Poisson – É útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço).

– A utilização da Poisson, exige certas hipótese como:• A probabilidade de uma ocorrência é a mesma em todo o campo

de observação.• A probabilidade de mais de uma ocorrência num único ponto é

aproximadamente zero.• O número de ocorrências em qualquer intervalo é independente do

número de ocorrências em outros intervalos.

Probabilidade

Page 81: Estatística I - 2008

• Distribuição de probabilidade

• Distribuições descontínuas de probabilidade– Formula de Poisson

x

exP

)()(

!

x

Onde: = média

x = número de ocorrências

e = valor tabelado

Probabilidade

Page 82: Estatística I - 2008

Poisson – Uma mesa telefônica recebe chamadas a razão de 4,6 chamadas por minuto. Determine a probabilidade de cada uma das ocorrências abaixo:

1- Exatamente 2 chamadas2 -Nenhuma chamada

• 1

• 2

2

)6,4(0101,0)( xP

!

2

= 0,1063

0

)6,4(0101,0)( xP

!

0

= 0,0101

Exemplo

Page 83: Estatística I - 2008

• Distribuições contínuas de probabilidade– Normal – É a mais importante distribuição de probabilidade, sendo aplicada em

inúmeros fenômenos e utilizada para desenvolvimento teórico da estatística. – As características das curvas normais são:

• A curva normal tem forma de sino• É simétrica em relação a média• Prolonga-se de – infinito a + infinito• Cada distribuição normal fica completamente especificada por sua média e

seu desvio padrão; há uma distribuição normal distinta para cada combinação de média e desvio padrão

• A área total sob a curva normal é considerado 100%• A área sob a curva entre dois pontos é a probabilidade de uma variável

normalmente distribuída tomar um valor entre esses pontos• A área sob a curva entre a média e um ponto arbitrário é função do número de

desvios padrões entre a média e aquele ponto.

Probabilidade

Page 84: Estatística I - 2008

• Distribuições contínuas de probabilidade– Normal Fórmula

s

xxz

)(

)( x

z

amostrapopulação

Onde:

Z= número de desvios padrões a contar da média

X = valor arbitrário

= a média da distribuição normal

= o desvio padrão

Probabilidade

Page 85: Estatística I - 2008

Normal – dado que uma população com média 25 e desvio padrão 2 tem distribuição normal, determine os valores de z para os seguintes valores da população:

a) 23,0 b)25,5

2

)2523( z

0,1z2

)255,25( z

1,0zCorresponde a 0,3413 ou 34,13% da área sobre a curva normal ou a probabilidade, conforme tabela z

Corresponde a 0,0398 ou 3,98% da área sobre a curva normal ou a probabilidade, conforme tabela z

Exemplo

Page 86: Estatística I - 2008

• Regra de Chebyshev:• Ao menos 3/4 estará dentro de 2 s.• Ao menos 8/9 estará dentro de 3 s.• P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k desvios-padrão.

• Distribuição Normal• Aproximadamente 68% das medidas caem dentro de 1 s.• Aproximadamente 95% das medidas caem dentro de 2 s.• Aproximadamente 99,7% das medidas caem dentro de 3 s.

Desvio padrão : interpretação

Page 87: Estatística I - 2008

• Aplicações de todos os conceitos estudados em exercícios práticos........