Aula 11 - Distribuicao Normal

Preview:

DESCRIPTION

estatistica, probabilidade, slides

Citation preview

DistribuiçãoGaussiana

Modelo Probabilístico para

Variáveis Contínuas

Distribuição Normal

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Distribuição N(0,1)

x

f(x)

Distribuição Normal

As distribuições de probabilidade de variáveis aleatórias contínuas são especificadas através da função densidade de probabilidade (f.d.p)

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

Fre

quên

cia

Abs

olut

a

1 2 3 4 5

05

1015

2025

Histograma de densidade

Densidade = frequência relativa / amplitude do intervalo

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

Den

sida

de d

e F

requ

ênci

a

1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

X – peso ao nascer

P(2 ≤ X < 3) = 0,08 + 0,14 = 0,20

P(X < 2) = 0,01 + 0,02 + 0,03 = 0,06

Classe Frequência Absoluta

Frequência Relativa

Amplitude Densidade

0,5|----1,0 1 0,01 0,5 0,021,0|----1,5 2 0,02 0,5 0,041,5|----2,0 3 0,03 0,5 0,062,0|----2,5 8 0,08 0,5 0,162,5|----3.0 14 0,14 0,5 0,283,0|----3,5 23 0,23 0,5 0,463,5|----4,0 22 0,22 0,5 0,444,0|----4,5 18 0,18 0,5 0,364,5|----5,0 5 0,05 0,5 0,105,0|----5,5 4 0,04 0,5 0,08

Total 100 1

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

De

nsid

ade

de

Fre

quê

ncia

1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

f(x)

X – Peso ao nascer

f(x) – função densidade de probabilidade

� Calcular probabilidade como área abaixo da curva

0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

0.5

x

f(x)

P(2 < X < 4) = área abaixo da curva entre 2 e 4

P(X = x) = 0 P(X < x) = P(X ≤ x)

Propriedades da função densidade de probabilidade

� f(x) ≥ 0

� Área abaixo da curva é igual a 1

A Distribuição Gaussiana (ou Normal)

Algumas variáveis contínuas exibem um comportamentomuito particular quando visualizamos a distribuição de frequências de seus valores.

• Concentração de valores em torno de um valor central;

• Simetria em torno do valor central;

• Frequência pequena de valores muito extremos.

Fre

quên

cia

Valores

O Modelo Probabilístico Gaussiano

O matemático alemão Karl Gausspopularizou um modelo proposto para a distribuição de probabilidades de variáveis do tipo descrito anteriormente.

A curva descrita por este modelo éconhecida como Curva de Gauss (ou também como Curva Normal)

Distribuição Normal

0;

xe1

)x(f

2

2

)x(

2

2

22

>∞<<∞−

∞<<∞−=

−−

σµ

σ

µ

πσ

µ – média σ – desvio padrão

X ~ N(µ, σ) - A variável aleatória X tem distribuição Normal com média µ e desvio padrão σ

A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ.

O Modelo Probabilístico Gaussiano

A média µ de uma variável aleatória X que siga o modelo Gaussiano pode assumir qualquer valor na reta real

O Modelo Probabilístico Gaussiano

µ−∞ < < ∞

O desvio-padrão σ de qualquer variável aleatória X sópode assumir valores maiores do que zero

0σ >

µ e σ são os parâmetros do Modelo Gaussiano

Dizemos que X ~ Normal (µ,σ)

Médias diferentes, desvios-padrão iguais

Médias iguais, desvios-padrão diferentes

Médias diferentes, desvios-padrão diferentes

Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )

Cálculo de Probabilidade na Curva Normal

Considere uma variável aleatória X com distribuição

Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)

P( x1 < X < x2 )P( x1 < X < x2 )

Área sob a curva

Normal entre x1 e x2.

Cálculo de Probabilidade na Curva Normal

P( x1 < X < x2 )

curvas Normais diferentes � áreas diferentes

Propriedades da Distribuição Normal

Simetria

a a

P(X < 3000-a ) = P(X > 3000+a )

3000 + a3000 - a

Propriedades da Distribuição Normal

Área fixa entre intervalos simétricos

Exemplo:

Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g.

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

A Distribuição Normal Padrão

Z ~ Normal (µ=0 ; σ=1)

Como existem infinitas combinações dos valores para µ

e σ, seria inviável tabelar as probabilidades de todas as distribuições Normais possíveis.

As probabilidades na curva Normal são calculadas com o auxílio de uma tabela.

Sendo assim, uma única variável Normal possui suasprobabilidades tabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1.

A variável aleatória Normal com

média µ=0 e desvio-padrão σ=1 échamada de

Variável Normal Padrão

Z ~ N(0,1)

P( Z < z )

a variável aleatória Z

tem distribuição de probabilidade

Normal com média=0 ed.p.=1

A Tabela Normal Padrão (Tabela Z)Parte Negativa

P( Z < -0.83 )

-0.83

Coluna: Segundacasa decimal de z

Linha: Parte inteira e primeira casa decimal de z

-2.9

-0.8

0.00187 0.00181 0.00175 0.00169

0.21186 0.20897 0.20611 0.20327

P( Z < 1.5 )

Coluna: Segundacasa decimal de z

Linha: Parte inteira e primeira casa decimal de z

A Tabela Normal Padrão (Tabela Z)Parte Positiva

Exemplo: Seja Z uma v.a. normal padronizada. Calcule:

P( Z < -1.97) = ? P( Z > 1.84) = ?

P( Z < -1.97 ) = 0.0244,

obtida direto da tabela.

P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela

e por simetria.

P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 )= 0.8051 - 0.0244= 0.7807

= -

Cálculo de percentis na curva Normal

Percentil de ordem 2.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ?

0.0250

a=-1.96

Ou seja, quem é a tal que P[Z < a ]=0.0250 ?

a é o percentil 2.5 da curva Normal Padrão

Cálculo de percentis na curva Normal

Percentil de ordem 97.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ?

Ou seja, quem é b tal que P[Z < b ]=0.9750 ?

b é o percentil 97.5 da curva Normal Padrão

0.9750

b=1.96

0.0250b é o simétrico de a em relaçãoà média da curva Normal

Cálculo de percentis na curva Normal

P[Z < b ]=0.9500

b é o percentil 95 da curvaNormal Padrão b=1.645

Percentil de ordem 95

Na tabela Z:

z = 1.65 � área abaixo = 0.9505

z = 1.64 � área abaixo = 0.9495

Calcular a média dos dois valores: b=1.645

Cálculo de percentis na curva Normal

P[-b < Z < b ]=0.9800

P[Z< -b ] =0.0100

-b = ?

Percentil de ordem 1

P[Z < b ]=0.0100

b é o percentil 1 da curva Normal Padrão

Na tabela Z:

z = -2.33 � área abaixo = 0.0099

z = -2.32 � área abaixo = 0.0102

b=2.33-b=2.33

0.0100 0.0100

0.9800

Usar o valor de z queforneça a área mais próxima

do desejada (-2.33)

Como usar a tabela Normal Padrão paracalcular probabilidades em uma curvaNormal qualquer?

Z ~ Normal (µ=0 ; σ=1)

X ~ Normal (µ=10 ; σ=2)

Distribuição de

Distribuição de

Podemos transformar uma variável aleatória

X ~ Normal ( µ , σ ) em uma variável aleatória

Z ~ Normal ( 0, 1) usando a expressão:

XZ

µ

σ

−=

Padronização de uma variável aleatória Normal

X ~ Normal (µ ,σ ) Z ~ Normal (0,1)

1

1

xz

µ

σ

−=

2

2

xz

µ

σ

−=

Calculando probabilidades de X utilizando a tabela Z

[ 9]P X < =9X

Pµ µ

σ σ

− − < =

10 9 10

2 2

XP

− − <

[ 0.5] 0.3085P Z= < − =

[ 13]P X > =10 13 10

[ ]2 2

XP

− −> = [ 1.5]P Z >

[ 1.5] 0.1295P Z= < − =

Exemplo 1: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X < x] =0.45.

então P( Z < (x-40)/6 ) = 0.45.

Mas P( Z < -0.13 ) = 0.45 (da tabela);

Se P[X < x] =0.45.

Logo (x-40)/6 = -0.13

���� x = 40 + (-0.13)6 = 40 - 0.78= 39.22.

Ou seja, 39.22 é o percentil 45 da distribuição de X.

então P( Z < (x-40)/6 ) = 0.14.

Mas P( Z > 1.08) = P( Z < -1.08) = 0.14 (da tabela);

Se P[X < x] = 0.14.

Logo (x-40)/6 = 1.08

���� x = 40 + (1.08)6 = 46.48

Ou seja, 46.48 é o percentil 86 da distribuição de X.

Exemplo 2: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X > x] =0.14.

Cálculo do Percentil de ordem 100αda distribuição Normal

100 (1 )P zα αµ σ−= + ⋅

α

z(1-α)

1-α

onde α é a ordem do percentil (0 < α < 1) e

z(1-α) é o valor na tabela Z que deixa uma área de (1-α) acima dele.

45 (1 0.4500)

(0.5500)

0.45

40 6

40 6

40 0.13 6

P z

z

α

=

= + ×

= + ×

= − ×

86 (1 0.8600)

(0.1400)

0.86

40 6

40 6

40 1.08 6

P z

z

α

=

= + ×

= + ×

= + ×

Conferindo os dois exemplos anteriores, onde µ = 40 e σ = 6 :

Cálculo do Percentil de ordem 100α da distribuição Normal

Exemplo Inicial:

Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal com µ= 3000g e σ = 1000g.

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

[ ]

3000 1500 3000[ 1500]

1000 1000

1.5 0.0068

XP X P

P Z

− − < = <

= < − =

0.68% dos bebês têm peso inferior

a 1500g.

Qual é a porcentagem de bebês que nascem com peso acima de 4000g ?

[ ] [ ]

4000 3000[ 4000]

1000

1.0 1.0 0.1587

P X P Z

P Z P Z

− > = >

= > = < − =

[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <

Qual é a porcentagem de bebês que nascem com peso entre 2500 e 3500g ?

3500 3000 2500 3000

1000 1000P Z P Z

− − = < − <

[ ] [ ] 0.5 0.5P Z P Z= < − < −

0.6915 0.3085 0.3830= − =

38.30% dos bebês

Qual valor de peso dos bebês separa os 10% mais leves?

1720 gramas

10 (1 0.1000)

(0.9000)

0.10

3000 1000

3000 1000

3000 ( 1.28) 1000

3000 1280 1720

P z

z

α

=

= + ×

= + ×

= + − ×

= − =

0.10

P103000

Qual valor de peso dos bebês separa os 10% mais pesados?

4280 gramas

10 (1 0.9000)

(0.1000)

0.90

3000 1000

3000 1000

3000 1.28 1000

3000 1280 4280

P z

z

α

=

= + ×

= + ×

= + ×

= + =

0.10

P903000