23
Distribuição Gaussiana Modelo Probabilístico para Variáveis Contínuas Distribuição Normal -3 -2 -1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 Distribuição N(0,1) x f(x) Distribuição Normal

Aula 11 - Distribuicao Normal

Embed Size (px)

DESCRIPTION

estatistica, probabilidade, slides

Citation preview

Page 1: Aula 11 - Distribuicao Normal

DistribuiçãoGaussiana

Modelo Probabilístico para

Variáveis Contínuas

Distribuição Normal

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Distribuição N(0,1)

x

f(x)

Distribuição Normal

Page 2: Aula 11 - Distribuicao Normal

As distribuições de probabilidade de variáveis aleatórias contínuas são especificadas através da função densidade de probabilidade (f.d.p)

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

Fre

quên

cia

Abs

olut

a

1 2 3 4 5

05

1015

2025

Histograma de densidade

Densidade = frequência relativa / amplitude do intervalo

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

Den

sida

de d

e F

requ

ênci

a

1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

X – peso ao nascer

P(2 ≤ X < 3) = 0,08 + 0,14 = 0,20

P(X < 2) = 0,01 + 0,02 + 0,03 = 0,06

Classe Frequência Absoluta

Frequência Relativa

Amplitude Densidade

0,5|----1,0 1 0,01 0,5 0,021,0|----1,5 2 0,02 0,5 0,041,5|----2,0 3 0,03 0,5 0,062,0|----2,5 8 0,08 0,5 0,162,5|----3.0 14 0,14 0,5 0,283,0|----3,5 23 0,23 0,5 0,463,5|----4,0 22 0,22 0,5 0,444,0|----4,5 18 0,18 0,5 0,364,5|----5,0 5 0,05 0,5 0,105,0|----5,5 4 0,04 0,5 0,08

Total 100 1

Page 3: Aula 11 - Distribuicao Normal

Histograma de peso ao nascer de 100 crianças

Peso ao nascer(Kg)

De

nsid

ade

de

Fre

quê

ncia

1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

f(x)

X – Peso ao nascer

f(x) – função densidade de probabilidade

� Calcular probabilidade como área abaixo da curva

0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

0.5

x

f(x)

P(2 < X < 4) = área abaixo da curva entre 2 e 4

P(X = x) = 0 P(X < x) = P(X ≤ x)

Page 4: Aula 11 - Distribuicao Normal

Propriedades da função densidade de probabilidade

� f(x) ≥ 0

� Área abaixo da curva é igual a 1

A Distribuição Gaussiana (ou Normal)

Algumas variáveis contínuas exibem um comportamentomuito particular quando visualizamos a distribuição de frequências de seus valores.

• Concentração de valores em torno de um valor central;

• Simetria em torno do valor central;

• Frequência pequena de valores muito extremos.

Fre

quên

cia

Valores

Page 5: Aula 11 - Distribuicao Normal

O Modelo Probabilístico Gaussiano

O matemático alemão Karl Gausspopularizou um modelo proposto para a distribuição de probabilidades de variáveis do tipo descrito anteriormente.

A curva descrita por este modelo éconhecida como Curva de Gauss (ou também como Curva Normal)

Distribuição Normal

0;

xe1

)x(f

2

2

)x(

2

2

22

>∞<<∞−

∞<<∞−=

−−

σµ

σ

µ

πσ

µ – média σ – desvio padrão

X ~ N(µ, σ) - A variável aleatória X tem distribuição Normal com média µ e desvio padrão σ

Page 6: Aula 11 - Distribuicao Normal

A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ.

O Modelo Probabilístico Gaussiano

A média µ de uma variável aleatória X que siga o modelo Gaussiano pode assumir qualquer valor na reta real

O Modelo Probabilístico Gaussiano

µ−∞ < < ∞

O desvio-padrão σ de qualquer variável aleatória X sópode assumir valores maiores do que zero

0σ >

µ e σ são os parâmetros do Modelo Gaussiano

Dizemos que X ~ Normal (µ,σ)

Page 7: Aula 11 - Distribuicao Normal

Médias diferentes, desvios-padrão iguais

Médias iguais, desvios-padrão diferentes

Page 8: Aula 11 - Distribuicao Normal

Médias diferentes, desvios-padrão diferentes

Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )

Cálculo de Probabilidade na Curva Normal

Considere uma variável aleatória X com distribuição

Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)

P( x1 < X < x2 )P( x1 < X < x2 )

Área sob a curva

Normal entre x1 e x2.

Page 9: Aula 11 - Distribuicao Normal

Cálculo de Probabilidade na Curva Normal

P( x1 < X < x2 )

curvas Normais diferentes � áreas diferentes

Propriedades da Distribuição Normal

Simetria

a a

P(X < 3000-a ) = P(X > 3000+a )

3000 + a3000 - a

Page 10: Aula 11 - Distribuicao Normal

Propriedades da Distribuição Normal

Área fixa entre intervalos simétricos

Exemplo:

Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g.

Page 11: Aula 11 - Distribuicao Normal

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

A Distribuição Normal Padrão

Z ~ Normal (µ=0 ; σ=1)

Como existem infinitas combinações dos valores para µ

e σ, seria inviável tabelar as probabilidades de todas as distribuições Normais possíveis.

As probabilidades na curva Normal são calculadas com o auxílio de uma tabela.

Sendo assim, uma única variável Normal possui suasprobabilidades tabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1.

Page 12: Aula 11 - Distribuicao Normal

A variável aleatória Normal com

média µ=0 e desvio-padrão σ=1 échamada de

Variável Normal Padrão

Z ~ N(0,1)

P( Z < z )

a variável aleatória Z

tem distribuição de probabilidade

Normal com média=0 ed.p.=1

Page 13: Aula 11 - Distribuicao Normal

A Tabela Normal Padrão (Tabela Z)Parte Negativa

P( Z < -0.83 )

-0.83

Coluna: Segundacasa decimal de z

Linha: Parte inteira e primeira casa decimal de z

-2.9

-0.8

0.00187 0.00181 0.00175 0.00169

0.21186 0.20897 0.20611 0.20327

P( Z < 1.5 )

Coluna: Segundacasa decimal de z

Linha: Parte inteira e primeira casa decimal de z

A Tabela Normal Padrão (Tabela Z)Parte Positiva

Page 14: Aula 11 - Distribuicao Normal

Exemplo: Seja Z uma v.a. normal padronizada. Calcule:

P( Z < -1.97) = ? P( Z > 1.84) = ?

P( Z < -1.97 ) = 0.0244,

obtida direto da tabela.

P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela

e por simetria.

P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 )= 0.8051 - 0.0244= 0.7807

= -

Page 15: Aula 11 - Distribuicao Normal

Cálculo de percentis na curva Normal

Percentil de ordem 2.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ?

0.0250

a=-1.96

Ou seja, quem é a tal que P[Z < a ]=0.0250 ?

a é o percentil 2.5 da curva Normal Padrão

Cálculo de percentis na curva Normal

Percentil de ordem 97.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ?

Ou seja, quem é b tal que P[Z < b ]=0.9750 ?

b é o percentil 97.5 da curva Normal Padrão

0.9750

b=1.96

0.0250b é o simétrico de a em relaçãoà média da curva Normal

Page 16: Aula 11 - Distribuicao Normal

Cálculo de percentis na curva Normal

P[Z < b ]=0.9500

b é o percentil 95 da curvaNormal Padrão b=1.645

Percentil de ordem 95

Na tabela Z:

z = 1.65 � área abaixo = 0.9505

z = 1.64 � área abaixo = 0.9495

Calcular a média dos dois valores: b=1.645

Cálculo de percentis na curva Normal

P[-b < Z < b ]=0.9800

P[Z< -b ] =0.0100

-b = ?

Percentil de ordem 1

P[Z < b ]=0.0100

b é o percentil 1 da curva Normal Padrão

Na tabela Z:

z = -2.33 � área abaixo = 0.0099

z = -2.32 � área abaixo = 0.0102

b=2.33-b=2.33

0.0100 0.0100

0.9800

Usar o valor de z queforneça a área mais próxima

do desejada (-2.33)

Page 17: Aula 11 - Distribuicao Normal

Como usar a tabela Normal Padrão paracalcular probabilidades em uma curvaNormal qualquer?

Z ~ Normal (µ=0 ; σ=1)

X ~ Normal (µ=10 ; σ=2)

Distribuição de

Distribuição de

Podemos transformar uma variável aleatória

X ~ Normal ( µ , σ ) em uma variável aleatória

Z ~ Normal ( 0, 1) usando a expressão:

XZ

µ

σ

−=

Padronização de uma variável aleatória Normal

Page 18: Aula 11 - Distribuicao Normal

X ~ Normal (µ ,σ ) Z ~ Normal (0,1)

1

1

xz

µ

σ

−=

2

2

xz

µ

σ

−=

Calculando probabilidades de X utilizando a tabela Z

[ 9]P X < =9X

Pµ µ

σ σ

− − < =

10 9 10

2 2

XP

− − <

[ 0.5] 0.3085P Z= < − =

[ 13]P X > =10 13 10

[ ]2 2

XP

− −> = [ 1.5]P Z >

[ 1.5] 0.1295P Z= < − =

Page 19: Aula 11 - Distribuicao Normal

Exemplo 1: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X < x] =0.45.

então P( Z < (x-40)/6 ) = 0.45.

Mas P( Z < -0.13 ) = 0.45 (da tabela);

Se P[X < x] =0.45.

Logo (x-40)/6 = -0.13

���� x = 40 + (-0.13)6 = 40 - 0.78= 39.22.

Ou seja, 39.22 é o percentil 45 da distribuição de X.

então P( Z < (x-40)/6 ) = 0.14.

Mas P( Z > 1.08) = P( Z < -1.08) = 0.14 (da tabela);

Se P[X < x] = 0.14.

Logo (x-40)/6 = 1.08

���� x = 40 + (1.08)6 = 46.48

Ou seja, 46.48 é o percentil 86 da distribuição de X.

Exemplo 2: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X > x] =0.14.

Page 20: Aula 11 - Distribuicao Normal

Cálculo do Percentil de ordem 100αda distribuição Normal

100 (1 )P zα αµ σ−= + ⋅

α

z(1-α)

1-α

onde α é a ordem do percentil (0 < α < 1) e

z(1-α) é o valor na tabela Z que deixa uma área de (1-α) acima dele.

45 (1 0.4500)

(0.5500)

0.45

40 6

40 6

40 0.13 6

P z

z

α

=

= + ×

= + ×

= − ×

86 (1 0.8600)

(0.1400)

0.86

40 6

40 6

40 1.08 6

P z

z

α

=

= + ×

= + ×

= + ×

Conferindo os dois exemplos anteriores, onde µ = 40 e σ = 6 :

Cálculo do Percentil de ordem 100α da distribuição Normal

Page 21: Aula 11 - Distribuicao Normal

Exemplo Inicial:

Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal com µ= 3000g e σ = 1000g.

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

[ ]

3000 1500 3000[ 1500]

1000 1000

1.5 0.0068

XP X P

P Z

− − < = <

= < − =

0.68% dos bebês têm peso inferior

a 1500g.

Page 22: Aula 11 - Distribuicao Normal

Qual é a porcentagem de bebês que nascem com peso acima de 4000g ?

[ ] [ ]

4000 3000[ 4000]

1000

1.0 1.0 0.1587

P X P Z

P Z P Z

− > = >

= > = < − =

[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <

Qual é a porcentagem de bebês que nascem com peso entre 2500 e 3500g ?

3500 3000 2500 3000

1000 1000P Z P Z

− − = < − <

[ ] [ ] 0.5 0.5P Z P Z= < − < −

0.6915 0.3085 0.3830= − =

38.30% dos bebês

Page 23: Aula 11 - Distribuicao Normal

Qual valor de peso dos bebês separa os 10% mais leves?

1720 gramas

10 (1 0.1000)

(0.9000)

0.10

3000 1000

3000 1000

3000 ( 1.28) 1000

3000 1280 1720

P z

z

α

=

= + ×

= + ×

= + − ×

= − =

0.10

P103000

Qual valor de peso dos bebês separa os 10% mais pesados?

4280 gramas

10 (1 0.9000)

(0.1000)

0.90

3000 1000

3000 1000

3000 1.28 1000

3000 1280 4280

P z

z

α

=

= + ×

= + ×

= + ×

= + =

0.10

P903000