48
Distribuição Gaussiana Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Introdução à Bioestatística Turma Nutrição Gaussiana Aula 7 : Distribuição Normal (Gaussiana) Introdução à Bioestatística Turma Nutrição

Distribuição Introdução à Bioestatística – Turma Nutrição ...edna/bionutri/NUT-Aula07.pdf · Cálculo de percentis na curva Normal P[Z < b]=0.9500 b é o percentil 95 da

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Distribuição Gaussiana

Universidade Federal de Minas GeraisInstituto de Ciências ExatasDepartamento de Estatística

Introdução à Bioestatística – Turma NutriçãoGaussiana

Aula 7 :

Distribuição Normal (Gaussiana)

Introdução à Bioestatística – Turma Nutrição

Distribuição de frequência dos valores de peso de ao nascer de 100 bebês

Distribuição de frequência dos valores de peso de ao nascer de 500 bebês

Para amostra com tamanho n = 500

Distribuição de frequência dos valores de peso de todos os bebês de toda a população

Distribuição de Probabilidade do peso de recém-nascidos

Distribuição de Frequências do Peso (gramas) de 100 00 recém -nascidos

frequência relativadensidade

tamanho da classe=

Histograma de DensidadeD

ensi

dade

4e-0

46e

-04

8e-0

4

área da barra =densidade x largura da barra

área da barra =probabilidade de Xestar entre os limites da barra

Peso ao nascer

1000 2000 3000 4000 5000

0e+0

02e

-04

P[2500 < X < 3500] = soma das áreas das barras entre 2500 e 3500 g.

estar entre os limites da barra

Histograma de Densidade

Den

sida

de

4e-0

46e

-04

8e-0

4

àrea da barra =probabilidade de Xestar entre os limites da barra

Peso ao nascer

1000 2000 3000 4000 5000

0e+0

02e

-04

estar entre os limites da barra

soma das àreas das barras entre 1000 e 2125P[X < 2125] =

Muitas vezes, as barras do histograma podem ser aproximadas por uma curva mais suave …

mais classes

Essa curva suave é chamada função de densidade de X, ou f(x)

f(x)

Como calcular probabilidades usando f(x) ?

P[a < X < b ]

a b

P[a < X < b ] é a áreaabaixo da curvaf(x) entrea eb

Propriedades de f(x)

1) f(x) ≥ 0

2) A área abaixo de toda a curva f(x) é igual a 1.

P[X=b] = 0 � P[X < b] = P[X ≤ b]

Como X é uma variável aleatória contínua, então

Algumas variáveis contínuas exibem um comportamento muitoparticular quando visualizamos a distribuição de frequênciasde seus valores.

Fre

quên

cia

Modelo Probabilístico Normal (ou Gaussiano)

• Concentração de valores em torno de um valor central;

• Simetria em torno do valor central;

• Frequência pequena de valores muito extremos.

Fre

quên

cia

Valores

O Modelo Probabilístico Gaussiano

O matemático alemão Karl Gausspopularizou um modelo proposto para adistribuição de probabilidades de variáveisdo tipo descrito anteriormente.

A curva descrita por este modelo éA curva descrita por este modelo éconhecida como Curva de Gauss (outambém como Curva Normal )

O Modelo Probabilístico Gaussiano

2121

( ) , 2

x

f x xeµ

σπσ

−−= − ∞ < < ∞

A função de densidade de X só depende de dois valores:

a média µ e o desvio-padrão σ

π e e são constantes conhecidas (π ≈ 3,14159… e e≈ 2.71828…)

A média µ de uma variável aleatória X que siga o modeloGaussiano pode assumir qualquer valor na reta real

O Modelo Probabilístico Gaussiano

µ−∞ < < ∞

O desvio-padrão σ de qualquer variável aleatória X sóO desvio-padrão σ de qualquer variável aleatória X sópode assumir valores maiores do que zero

0σ >

µ e σ são os parâmetros do Modelo Gaussiano

Dizemos que X ~ Normal (µ,σ)

A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ.

O Modelo Probabilístico Gaussiano

O parâmetro µ informa onde está centrada a curva gaussiana

A forma do sino (mais “achatado” ou mais “alongado”) é dada pelo valor do desvio -padrão σ

Para cada combinação de µ e σ, existe uma curva gaussiana diferente

A curva gaussiana tem a forma de um sino e é simétrica em torno da média µ;

Simetria

a a

P(X < 3000-a ) = P(X > 3000+a )

3000 + a3000 - a

Propriedades da Distribuição Normal

Área fixa entre intervalos simétricos

Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )

Cálculo de Probabilidade na Curva Normal

Considere uma variável aleatória X com distribuição

Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)

P( x1 < X < x2 )P( x1 < X < x2 )P( x1 < X < x2 )P( x1 < X < x2 )

Área sob a curva

Normal entre x1 e x2.

Cálculo de Probabilidade na Curva Normal

P( x1 < X < x2 )

curvas Normais diferentes � áreas diferentes

Exemplo :Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g.

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

Se existisse uma tabela da N(3000,1000) com as probabilidades abaixo de muitos valores, tipo:

x P(X < x)1000 0.022750131050 0.025588061100 0.02871656

... o problema estaria resolvido.

…1500 0.0668072

…4000 0.8413447

…6000 0.9986501

A Distribuição Normal Padrão

Como existem infinitas combinações dos valores para µ

e σ, seria inviável tabelar as probabilidades de todas as

As probabilidades na curva Normal são calculadas com oauxílio de uma tabela.

Z ~ Normal (µ=0 ; σ=1)

e σ, seria inviável tabelar as probabilidades de todas asdistribuições Normais possíveis.

Uma única variável Normal possui suas probabilidadestabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1.

Z ~ N(0,1) a variável aleatória Z

tem distribuição de probabilidade

Normal com média=0 ed.p.=1

Variável Normal Padrão

P( Z < z )

d.p.=1

Exemplo : Seja Z uma v.a. normal padronizada. Calcule:

P( Z < -1.97) = ? P( Z > 1.84) = ?

P( Z < -1.97 ) = 0.0244,

obtida direto da tabela.

P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela

e por simetria.

P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 )= 0.8051 - 0.0244= 0.7807

= -

Cálculo de percentis na curva Normal

Percentil de ordem 2.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ?

0.0250

a=-1.96

Ou seja, quem é a tal que P[Z < a ]=0.0250 ?

a é o percentil 2.5 da curva Normal Padrão

Cálculo de percentis na curva Normal

Percentil de ordem 97.5

Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ?

Ou seja, quem é b tal que P[Z < b ]=0.9750 ?

b é o percentil 97.5 da curva Normal Padrão

0.9750

b=1.96

0.0250b é o simétrico de a em relação à média da curva Normal

Cálculo de percentis na curva Normal

P[Z < b ]=0.9500

b é o percentil 95 da curva Normal Padrão b=1.645

Percentil de ordem 95

Normal Padrão

Na tabela Z:

z= 1.65 � área abaixo = 0.9505

z= 1.64 � área abaixo = 0.9495

Escolher o valor mais próximo da probabilidade desejada.

Cálculo de percentis na curva Normal

P[-b < Z < b ]=0.9800

Percentil de ordem 1

P[Z < b ]=0.0100

b é o percentil 1 da curva Normal Padrão

0.9800P[-b < Z < b ]=0.9800

P[Z< -b ] =0.0100

-b = ?

Na tabela Z:

z= -2.33 � área abaixo = 0.0099

z= -2.32 � área abaixo = 0.0102

b=2.33-b=2.33

0.0100 0.0100

Usar o valor de z que forneça a área mais próxima

do desejada (-2.33)

Como usar a tabela Normal Padrão para calcular probabilidades em uma curva Normal qualquer?

Z ~ Normal (0,1) Distribuição de

X ~ Normal (µ=10 ; σ=2) Distribuição de

Podemos transformar uma variável aleatória

X ~ Normal ( µ , σ ) em uma variável aleatória

Z ~ Normal ( 0, 1) usando a expressão:

Padronização de uma variável aleatória Normal

XZ

µσ−=

X ~ Normal (µ ,σ ) Z ~ Normal (0,1)

11

xz

µσ−= 2

2

xz

µσ−=

Calculando probabilidades de X~N( µ=10; σ=2) na tabela Z

[ 9]P X < =10 9 10

2 2

XP

− − < [ 0.5] 0.3085P Z= < − =

[ 13]P X > =10 13 10

[ ]2 2

XP

− −> = [ 1.5]P Z >

[ 1.5] 0.0668P Z= < − =[ 1.5] 0.0668P Z= < − =

Exemplo 1 : Se X tem distribuição Normal com µ = 40 e σ = 6,encontre o valor de x tal que P[X < x] =0.45.

então P( Z < (x-40)/6 ) = 0.45.

Mas P( Z < -0.13 ) = 0.45 (da tabela);

Se P[X < x] =0.45.

Logo (x-40)/6 = -0.13 Logo (x-40)/6 = -0.13

� x = 40 + (-0.13)6 = 40 - 0.78= 39.22.

Ou seja, 39.22 é o percentil 45 da distribuição de X.

então P( Z < (x-40)/6 ) = 0.86.

Mas P( Z < 1.08) = 0.86 (da tabela);

Se P[X < x] = 0.86

x

Exemplo 2 : Se X tem distribuição Normal com µ = 40 e σ = 6,encontre o valor de x tal que P[X > x] =0.14.

Logo (x-40)/6 = 1.08

� x = 40 + (1.08)6 = 46.48

Ou seja, 46.48 é o percentil 86 da distribuição de X.

Exemplo Inicial :

Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal comµ = 3000g e σ = 1000g.

Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?

6.68% dos bebês têm peso inferior

a 1500g.

Qual é a porcentagem de bebês que nascem com peso acima de 4000g ?

[ ] [ ]

4000 3000[ 4000]

1000

1.0 1.0 0.1587

P X P Z

P Z P Z

− > = >

= > = < − =

Qual é a porcentagem debebês que nascem compeso entre 2500 e 3500g ?

38.30% dos bebês

[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <

3500 3000 2500 3000

1000 1000P Z P Z

− − = < − <

[ ] [ ] 0.5 0.5P Z P Z= < − < −

0.6915 0.3085 0.3830= − =

Qual valor de peso dos bebês separa os 10% mais leves?

0.10

x 3000X

Zz

Achar x tal que P(X < x) = 0.10.

Na tabela Z, tem-se P(Z < -1.28) = 0.1003 ≈≈≈≈ 0.10.

z = (x–3000)/1000 = -1.28 ⇒ x = 3000–1.28(1000) = 1720.

Assim, 1720 gramas é o percentil de ordem 10 dos pesos.

Z0z

Qual valor de peso dos bebês separa os 10% mais pesados?

0.10

x3000Z

z

X

Achar x tal que P(X > x) = 0.10 ⇒ P(X < x) = 0.90.

Na tabela Z, tem-se P(Z < 1.28) ≈≈≈≈ 0.90.

z = (x–3000)/1000 = 1.28 ⇒ x = 3000+1.28(1000) = 4280.

Assim, 4280 gramas é o percentil de ordem 90 dos pesos.

Z0 z

Construa uma Faixa de Referência de 90% para o peso dos bebês.

Queremos um intervalo de valores [ x1 ; x2 ] (simétrico em torno da média 3000) tal que 90% dos bebês tenham peso dentro deste inte rvalo .