119
Probabilidade e Estatística Frederico Caeiro 2009/10

ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Probabilidade e Estatística

Frederico Caeiro

2009/10

Page 2: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Observação:

Estas folhas servem de apoio às aulas de Probabilidades e Estatística. Para uma melhor compreen-

são dos assuntos abordados, aconselha-se a leitura de alguns dos livros indicados nas referências

bibliográficas.

Page 3: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Conteúdo

1 Introdução à Teoria da Probabilidade 11.1 Espaço de Resultados e Acontecimentos . . . . . . . . . . . . . . . . . . . . . . 11.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Cálculo Combinatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.4 Probabilidade Condicional e Independência . . . . . . . . . . . . . . . . . . . . . 6

2 Variáveis aleatórias 92.1 Variáveis aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2 Função de distribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.3 Classificação das variáveis aleatórias . . . . . . . . . . . . . . . . . . . . . . . . 112.4 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.5 Outros parâmetros relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.6 Funções de uma variável aleatória . . . . . . . . . . . . . . . . . . . . . . . . . 15

3 Vectores aleatórios 173.1 Par aleatório discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.2 Par aleatório contínuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.3 Momentos de vectores aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4 Principais Distribuições 234.1 Distribuições discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.1.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.1.2 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 244.1.3 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.1.4 Distribuição Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.1.5 Distribuição Hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . 274.1.6 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.2 Distribuições Contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.2.1 Distribuição Uniforme Contínua . . . . . . . . . . . . . . . . . . . . . . . 314.2.2 Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . 324.2.3 Distribuição Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.2.4 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.2.5 Distribuição do Qui Quadrado . . . . . . . . . . . . . . . . . . . . . . . 364.2.6 Distribuição t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . 37

5 Teorema Limite Central 39

i

Page 4: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6 Estimação Pontual 416.1 Alguns conceitos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416.2 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426.3 Método dos Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446.4 Método da máxima verosimilhança . . . . . . . . . . . . . . . . . . . . . . . . . 466.5 Distribuições por Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

6.5.1 Distribuição por amostragem da média amostral, X . . . . . . . . . . . . 476.5.2 Distribuição por amostragem da diferença de médias amostrais, X1 −X2 496.5.3 Distribuição por amostragem da variância amostral, S2 . . . . . . . . . . 496.5.4 Distribuição por amostragem da proporção, P . . . . . . . . . . . . . . . 49

7 Estimação por Intervalo de Confiança 517.1 Intervalo de Confiança para a média da população, µ . . . . . . . . . . . . . . . 52

7.1.1 População Normal com variância conhecida . . . . . . . . . . . . . . . . 527.1.2 População Normal com variância desconhecida . . . . . . . . . . . . . . 557.1.3 População não-Normal com variância conhecida e n > 30 . . . . . . . . . 567.1.4 População não-Normal com variância desconhecida e n > 30 . . . . . . . 56

7.2 Intervalo de Confiança para a variância populacional, σ2, e para o desvio padrãopopulacional, σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

7.3 Intervalo de Confiança para proporção populacional, p . . . . . . . . . . . . . . . 60

8 Teste de Hipóteses 638.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 638.2 Teste de Hipóteses para a média da população . . . . . . . . . . . . . . . . . . . 65

8.2.1 Teste bilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668.2.2 Teste unilateral direito . . . . . . . . . . . . . . . . . . . . . . . . . . . 678.2.3 Teste unilateral esquerdo . . . . . . . . . . . . . . . . . . . . . . . . . . 68

8.3 Teste de Hipóteses para a variância, σ2, de uma população Normal . . . . . . . . 698.4 Teste de Hipóteses para a proporção p de uma população . . . . . . . . . . . . . 708.5 Teste das sequências ascendentes e descendentes . . . . . . . . . . . . . . . . . 718.6 Teste de ajustamento do Qui Quadrado . . . . . . . . . . . . . . . . . . . . . . 72

9 Regressão Linear 779.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779.2 Estimadores dos Mínimos Quadrados de β0 e β1 . . . . . . . . . . . . . . . . . . 789.3 Estimação de σ2 e Qualidade do Ajuste . . . . . . . . . . . . . . . . . . . . . . 799.4 Propriedades dos estimadores dos mínimos quadrados . . . . . . . . . . . . . . . 79

9.4.1 Distribuição por amostragem de σ2 . . . . . . . . . . . . . . . . . . . . . 799.4.2 Distribuição por amostragem de β0 e β1 . . . . . . . . . . . . . . . . . . 80

9.5 Inferência sobre os parâmetros do Modelo de Regressão . . . . . . . . . . . . . . 819.5.1 Intervalo de Confiança e Teste de Hipóteses para β1 . . . . . . . . . . . 819.5.2 Intervalo de Confiança e Teste de Hipóteses para β0 . . . . . . . . . . . 829.5.3 Intervalo de Confiança e Teste de Hipóteses para σ2 . . . . . . . . . . . 83

9.6 Estimação do valor esperado de Y para uma observação x0 da variável controlada 849.7 Previsão do valor da variável resposta Y para um novo valor x0 da variável controlada 84

Page 5: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10 Exercícios 8510.1 Introdução à Teoria da Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . 8510.2 Variáveis aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8910.3 Vectores Aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9310.4 Principais distribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9610.5 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10110.6 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10210.7 Estimação por Intervalo de Confiança . . . . . . . . . . . . . . . . . . . . . . . 10410.8 Teste de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10610.9 Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

11 Tabelas 111

Page 6: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias
Page 7: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 1

Introdução à Teoria da Probabilidade

1.1 Espaço de Resultados e Acontecimentos

Definição 1.1 (Experiência aleatória). Uma experiência aleatória é uma experiência cujo re-sultado é desconhecido (antes da sua realização), apesar de se conhecerem todos os possíveisresultados.

Exemplo 1.2 (Experiência aleatória). Considere os seguintes exemplos:

• E1 : Lançamento de uma moeda e observação da face voltada para cima;

• E2 : Lançamento de um dado e observação da face voltada para cima;

• E3 : Tempo de “vida” de uma lâmpada.

Definição 1.3 (Espaço de resultados ou universo). Chamamos espaço de resultados ou uni-verso, e representamos por Ω, ao conjunto de todos os possíveis resultados de uma experiênciaaleatória.

Observação: Diz-se que o espaço de resultados, Ω, é discreto se tem um número finito ou infinitonumerável de elementos. Se Ω contém um intervalo (finito ou infinito) de números reais, entãoo espaço de resultados é contínuo.

Exemplo 1.4 (Espaço de resultados). Considere novamente as experiências aleatórias do Ex-emplo 1.2. Temos:

• E1 : Ω = Cara,Coroa;

• E2 : Ω = 1, 2, 3, 4, 5, 6;

• E3 : Ω = R+.

1

Page 8: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

2 CAPÍTULO 1. INTRODUÇÃO À TEORIA DA PROBABILIDADE

Exemplo 1.5 (Espaço de resultados). Na experiência aleatória que consiste em lançar um dado,numerado de 1 a 6, e observar a face voltada para cima, Ω = 1, 2, 3, 4, 5, 6. Se forem lançadosdois dados, o espaço de resultados é,

Ω = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), . . . , (6, 5), (6, 6),

ou seja, Ω = (i, j) : i = 1, . . . , 6; j = 1, . . . , 6.

Definição 1.6 (Acontecimento e Acontecimento elementar). Um acontecimento é um sub-conjunto do espaço de resultados, Ω. Cada acontecimento formado por apenas um ponto amostralé designado por acontecimento elementar ou simples.

Observação: Ao conjunto ∅ chamamos acontecimento impossível e a Ω acontecimento certo.

Definição 1.7 (Sub-acontecimento). A é sub-acontecimento de B, e escreve-se A ⊂ B, se esó se a realização de A implica a realização de B.

Observação: Podemos aplicar as operações usuais sobre conjuntos de modo a obter outrosacontecimentos de interesse. As operações mais usuais são:

• A união de dois acontecimentos A e B, e representa-se por A ∪B;

• A intersecção de dois acontecimentos A e B, e representa-se por A ∩B;

• O complementar do acontecimento A e representa-se por A;

• A diferença dos acontecimentos A e B e representa-se por A−B (= A ∩B);

Algumas propriedades importantes:

1. Distributiva: A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C) e A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C);

2. Leis de De Morgan: A ∩B = A ∪B e A ∪B = A ∩B.

Definição 1.8 (Acontecimentos disjuntos ou mutuamente exclusivos). Dois acontecimentosA e B dizem-se disjuntos se não têm elementos em comum, ou seja, se A ∩B = ∅.

Page 9: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

1.2. PROBABILIDADE 3

1.2 Probabilidade

Em muitas experiência aleatórias estamos interessados em medir a possibilidade de ocorrer umdeterminado acontecimento ocorrer. A probabilidade permite-nos quantificar essa possibilidade.

Definição 1.9 (Definição Clássica ou de Laplace de Probabilidade). Se uma experiênciaaleatória tem a si associado um número finito N de resultados, mutuamente exclusivos e igual-mente prováveis, então a probabilidade de qualquer acontecimento A, P (A), é dada por:

P (A) = NA

N= no de resultados favoráveis a A

no de resultados possíveis .

Exemplo 1.10. A probabilidade de sair face ímpar, num lançamento de um dado equilibrado éP (“Sair face ímpar”) = 3

6 = 12 .

Definição 1.11 (Definição Frequencista de Probabilidade). A probabilidade de um aconteci-mento A é dada pelo limite da frequência relativa com que se observou A, isto é,

P (A) = limn→∞

nAn,

onde nA representa o número de observações de A, e n o número de realizações da experiênciaaleatória. Para valores elevados de n, podemos assumir que P (A) ≈ nA

n.

Definição 1.12 (Definição Axiomática de Probabilidade). A Probabilidade é uma função,que a cada acontecimento A faz corresponder um valor real, P (A), e que verifica as seguintescondições ou axiomas:

1. P (A) ≥ 0, qualquer que seja o acontecimento A;

2. P (Ω) = 1;

3. Se A e B são acontecimentos disjuntos, P (A ∪B) = P (A) + P (B).

Esta axiomática não contempla situações com uma infinidade numerável de acontecimentos. Éassim usual substituir o 3o axioma, por:

3. Se A1, A2, . . . são acontecimentos disjuntos dois a dois, então P(⋃∞

i=1Ai)

=∑∞i=1 P (Ai).

Proposição 1.13. Sejam A e B dois acontecimentos. Os seguintes resultados são consequênciaimediata dos axiomas da definição 1.12:

1. P (∅) = 0;

2. Se A ⊆ B então P (A) ≤ P (B);

Page 10: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4 CAPÍTULO 1. INTRODUÇÃO À TEORIA DA PROBABILIDADE

3. P (A) = 1− P (A);

4. P (A) ∈ [0, 1];

5. P (A−B) = P (A ∩B) = P (A)− P (A ∩B);

6. P (A ∪B) = P (A) + P (B)− P (A ∩B).

Demonstração.

1. Como ∅ e Ω são acontecimentos disjuntos e P (∅∪Ω) = P (Ω) = 1, resulta pelo 3o axiomaque P (∅ ∪ Ω) = P (∅) + P (Ω), ou seja, P (∅) = 0.

2. Sejam A e B dois acontecimentos tais que A ⊆ B. Então B = B ∩ (A ∪A) = (B ∩A) ∪(B ∩A) = A∪ (B ∩A). Como A e B ∩A são acontecimentos disjuntos, podemos utilizaro 3o axioma, resultando,

P (B) = P (A ∪ (B ∩A)) = P (A) + P (B ∩A).

Usando o 1oaxioma, podemos garantir que P (B∩A)≥0 e consequentemente P (B)≥P (A).

3. Como A e A são acontecimentos disjuntos, podemos utilizar o 3o axioma. Assim,

1 = P (Ω) = P (A ∪A) = P (A) + P (A),

ou seja, P (A) = 1− P (A).

4. Pelo 1o axioma, para qualquer acontecimento A, P (A) ≥ 0. Logo, basta apenas demonstrarque P (A) ≤ 1. Como A ⊆ Ω, resulta que P (A) ≤ P (Ω) = 1.

5. Como A = (A∩B)∪(A∩B) = (A−B)∪(A∩B), e (A−B) e (A∩B) são acontecimentosdisjuntos, então podemos utilizar o 3o axioma. Assim,

P (A) = P (A−B) + P (A ∩B) ⇔ P (A−B) = P (A)− P (A ∩B).

6. Como A ∪ B = (A − B) ∪ (B − A) ∪ (A ∩ B) e (A − B), (B − A) e (A ∩ B) sãoacontecimentos disjuntos dois a dois, podemos utilizar o resultado do 3o axioma, obtendo:

P (A ∪B) = P (A−B) + P (B −A) + P (A ∩B) =

= P (A)− P (A ∩B) + P (B)− P (A ∩B) + P (A ∩B) =

= P (A) + P (B)− P (A ∩B).

Observação: O último resultado da Proposição 1.13 pode ser generalizado para a união de nacontecimentos (n ≥ 2). Assim, dados os acontecimentos Ai, i = 1, . . . , n,

P (∪ni=1Ai) =n∑i=1

P (Ai)−∑i 6=j

P (Ai ∩Aj)+∑i 6=j 6=k

P (Ai ∩Aj ∩Ak)−. . .+(−1)n−1 P (∩ni=1Ai) ;

Page 11: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

1.3. CÁLCULO COMBINATÓRIO 5

Para n = 3 obtemos o caso particular:

P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B∩C)+P (A∩B∩C).

Definição 1.14 (Acontecimentos incompatíveis). Dois acontecimentos A e B dizem-se in-compatíveis se P (A ∩B) = 0.

1.3 Cálculo Combinatório

O cálculo de uma probabilidade, através da definição clássica, depende da contagem do númerode casos favoráveis e do número de casos possíveis. Em muitas situações este cálculo pode nãoser imediato. O cálculo combinatório é uma ferramenta que nos poderá auxiliar em muitas dessassituações.

Definição 1.15 (Produto Cartesiano). Seja A = a1, . . . , an um conjunto com n elementos eB = b1, . . . , bm um conjunto com m elementos. Designa-se por produto cartesiano o conjuntode pares (ai, bj) em que o primeiro provém de A e o segundo de B e representa-se por A×B. Onúmero de elementos de A×B é dados por #(A×B) = n×m.

Considere agora que temos n elementos distintos, e pretendemos seleccionar k. De quantasmaneiras distintas é possível seleccionar os k elementos? Como existem várias formas distintasde escolher os k elementos, a resposta à questão anterior é dada pela seguinte tabela:

Interessa HáDesignação

Número de maneiras distintas dea ordem? repetição? escolher os k elementos

Sim Não Arranjos nAk = n!(n−k)! , k ≤ n

Sim Sim Arranjos com repetição nA′k = nk

Não Não Combinações nCk =(nk

)= n!

(n−k)!k! , k ≤ nNão Sim Combinações com repetição nC ′k = (n+k−1)!

(n−1)!k!

Observações:

• “!” representa a função factorial (por convenção 0! = 1);

• No caso particular em que interessa a ordem, não há repetição e estamos a seleccionar todosos elementos disponíveis (k = n), é mais usual designarmos Permutações de n elementos,Pn, em vez de nAn. É obvio que nAn = Pn = n!.

Page 12: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6 CAPÍTULO 1. INTRODUÇÃO À TEORIA DA PROBABILIDADE

1.4 Probabilidade Condicional e Independência

Vamos começar por um exemplo que irá introduzir a noção de probabilidade condicional.

Exemplo 1.16. Uma empresa farmacêutica realizou um ensaio clínico para comparar a eficácia deum novo medicamento (medicamento experimental). Escolheram-se ao acaso 200 doentes com adoença que se pretende curar. Metade desses doentes foram tratados com o novo medicamento eos restantes com um medicamento convencional. Ao fim de 5 dias, os resultados são os seguintes:

Melhorou (M) Não melhorou (M) TotalMedicamento Experimental E 69 31 100Medicamento Convencional (E) 58 42 100

Total 127 73 200

1. Qual a probabilidade, de um doente escolhido ao acaso,

(a) tomar o medicamento experimental?Resposta: Usando a regra de Laplace, P (E) = 100

200 = 12 .

(b) tomar o medicamento experimental e melhorar?Resposta: Usando a regra de Laplace, P (E ∩M) = 69

200 .

2. Qual a probabilidade de um doente, que melhorou, ter tomado o medicamento experimental?Resposta: 69

127 .

Observação: A solução da pergunta 2, do exemplo anterior, é igual a P (E∩M)P (M) .

Definição 1.17 (Probabilidade Condicional). Sejam A e B dois acontecimentos. A probabili-dade condicional de A dado B é

P (A|B) = P (A ∩B)P (B) , se P (B) > 0.

Teorema 1.18 (Teorema da Probabilidade Composta). Sejam A e B dois acontecimentostais que P (B) > 0. Então, resulta da definição de Probabilidade Condicional,

P (A ∩B) = P (A |B )P (B) .

Observação: Nalguns casos, a probabilidade condicional P (A|B) pode ser igual a P (A), ou seja,o conhecimento da ocorrência de B não afecta a probabilidade de A ocorrer.

Definição 1.19 (Acontecimentos Independentes). Dois acontecimentos A e B dizem-se inde-pendentes se e só se,

P (A ∩B) = P (A)P (B) .

Page 13: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

1.4. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA 7

Definição 1.20 (Partição do espaço de resultados). Dizemos que E1, . . . , En é uma partiçãodo espaço de resultados Ω quando

Ei ∩ Ej = ∅ (i 6= j) e ∪ni=1 Ei = Ω.

Teorema 1.21 (Teorema da Probabilidade Total). Seja E1, . . . , En uma partição do espaçode resultados Ω, com P (Ei) > 0, ∀i. Dado um qualquer acontecimento A, tem-se,

P (A) = P (A |E1 )P (E1) + . . .+ P (A |En )P (En) .

Teorema 1.22 (Teorema de Bayes). Seja E1, . . . , En uma partição do espaço de resultadosΩ, com P (Ei) > 0, ∀i. Dado um qualquer acontecimento A, com P (A) > 0, tem-se

P (Ei |A) = P (A |Ei )P (Ei)n∑i=1

P (A |Ei )P (Ei).

Demonstração. Aplicando a definição 1.17, de Probabilidade Condicional, depois o Teorema 1.18da Probabilidade Composta e o Teorema 1.21 da Probabilidade Total,

P (Ei |A) = P (Ei ∩A)P (A) = P (A |Ei )P (Ei)

n∑i=1

P (A |Ei )P (Ei).

Exemplo 1.23 (Teste de P.E. D - 2007/08). Diga, justificando, se a seguinte afirmação é ver-dadeira ou falsa:Três máquinas A, B e C produzem botões, respectivamente, 15%, 25% e 60% da produção total.As percentagens de botões defeituosos fabricados por estas máquinas são respectivamente 5%, 7%e 4%. Se ao acaso, da produção total de botões, for encontrado um defeituoso, a probabilidadede ele ter sido produzido pela máquina B é de cerca de 36%.

Resolução:Sejam A, B, C e D os seguintes acontecimentos:A - O Botão é produzido pela máquina A;B - O Botão é produzido pela máquina B;C - O Botão é produzido pela máquina C;D - O Botão tem defeito;

De acordo com o enunciado, temos as seguintes probabilidades: P (A) = 0.15, P (B) = 0.25,P (C) = 0.6, P (D|A) = 0.05, P (D|B) = 0.07 e P (D|C) = 0.04.

Page 14: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8 CAPÍTULO 1. INTRODUÇÃO À TEORIA DA PROBABILIDADE

Pretende-se determinar P (B|D). Usando o Teorema de Bayes, obtemos:

P (B|D) = P (D|B)P (B)P (D|A)P (A) + P (D|B)P (B) + P (D|C)P (C) = 175

490 ' 36%.

Logo a afirmação está correcta, isto é, a probabilidade de um botão defeituoso ter sido produzidopela máquina B é de cerca de 36%.

Page 15: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 2

Variáveis aleatórias

2.1 Variáveis aleatórias

Definição 2.1 (Variável aleatória). Uma variável aleatória (v.a.), X : Ω→ R, é uma função reale finita, tal que a imagem inversa de ]−∞;x] é um acontecimento, isto é, Ax = X−1(−∞;x] =ω ∈ Ω : X (ω) ≤ x com x ∈ R é um acontecimento.

Observação: É fácil de verificar que se X é uma variável aleatória e g : R → R uma função,então Y = g(X) é também uma variável aleatória.

Exemplo 2.2 (Variável aleatória). Considere a experiência aleatória que consiste no lançamentode 2 moedas equilibradas, e registo da face voltada para cima. O espaço de resultados é

Ω = (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co).

Podemos, por exemplo, atribuir a cada um dos acontecimentos elementares de Ω, os seguintevalores:

ω (Ca,Ca) (Ca,Co) (Co,Ca) (Co,Co)X(ω) 2 1 1 0

Repare que

Ax = X−1](∞;x]) =

∅, x < 0

(Co,Co) 0 ≤ x < 1(Co,Co), (Ca,Co), (Co,Ca) 1 ≤ x < 2

Ω x ≥ 2

Como todas as imagens inversas, X−1(]−∞;x]), são acontecimentos de Ω, então de acordo coma definição 2.1, X é uma variável aleatória.

Observação: Relativamente ao Exemplo 2.2, X é a aplicação que atribui a cada acontecimentode Ω o número de caras.

9

Page 16: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10 CAPÍTULO 2. VARIÁVEIS ALEATÓRIAS

2.2 Função de distribuição

Definição 2.3 (Função de distribuição). A função de distribuição da v.a. X é:

FX(x) = P (X ≤ x) = P (ω : X(ω) ≤ x), ∀x ∈ R.

Exemplo 2.4. Considere novamente o Exemplo 2.2. A função de distribuição desta v.a. é:

FX(x) = P (X ≤ x) =

0, x < 014 , 0 ≤ x < 134 , 1 ≤ x < 21, x ≥ 2

Observação: Como FX(x) = P (X ≤ x), conclui-se que a função de distribuição existe sem-pre. Quando não existir mais do que uma v.a., pode-se representar a função de distribuiçãosimplesmente por F .

Propriedades da função de distribuição:

1. limx→−∞

F (x) = 0 e limx→+∞

F (x) = 1;

2. F é contínua à direita, isto é, limx→a+

F (x) = F (a);

3. F é não decrescente, isto é, se x < y, então F (x) ≤ F (y).

Teorema 2.5. Qualquer função F é uma função de distribuição se e só se verificar as trêspropriedades anteriores.

Proposição 2.6. Seja X uma v.a. com função de distribuição F . Tem-se:

P (X = x) = P (X ≤ x)− P (X < x) = F (x)− F (x−), ∀x ∈ R,

onde F (x−) = limt→x−

F (t).

Definição 2.7 (Variáveis aleatórias identicamente distribuídas). Duas variáveis aleatóriasX e Y dizem-se identicamente distribuídas, se têm a mesma função de distribuição, isto é, seFX(x) = FY (x), ∀x ∈ R.

Page 17: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

2.3. CLASSIFICAÇÃO DAS VARIÁVEIS ALEATÓRIAS 11

2.3 Classificação das variáveis aleatórias

A função de distribuição não é necessariamente contínua em todos os valores x ∈ R. Podemospor isso classificar as variáveis aleatórias em função da continuidade da respectiva função dedistribuição. Considere o conjunto de pontos de descontinuidade da função de distribuição F ,

D = a ∈ R : P (X = a) > 0 . (2.1)

Definição 2.8 (Variável aleatória discreta). Uma v.a. X diz-se do tipo discreto ou simples-mente discreta se o conjunto D é quanto muito numerável, e se P (X ∈ D) = 1.

Definição 2.9 (Função de probabilidade). Seja X uma v.a. discreta. Chama-se função deprobabilidade (f.p.), ou função massa de probabilidade, de X à função definida pelo conjunto dosvalores deD e pelas respectivas probabilidades, isto é, por (xi, pi) onde xi ∈ D e pi = P (X = xi).Uma representação usual para a função de probabilidade da v.a. X, é:

X =

x1 x2 . . . xi . . .P (X = x1) P (X = x2) . . . P (X = xi) . . .

Propriedades da função de probabilidade:

1. P (X = xi) = f(xi) = pi ≥ 0;

2.∑∞i=1 pi = 1.

Observação: Para qualquer subconjunto real I, P (X ∈ I) =∑xi∈I∩D P (X = xi).

Exemplo 2.10. Considere novamente o Exemplo 2.2. O conjunto de pontos de descontinuidadeda função de distribuição é D = 0, 1, 2. Como P (X ∈ D) = 1, conclui-se que X é uma v.a.discreta com função de probabilidade,

X

0 1 214

12

14

Definição 2.11 (Variável aleatória contínua). Uma v.a. X diz-se do tipo contínuo ou simples-mente contínua se D = ∅ e se existe uma função não negativa, f , tal que para I ⊆ R,

P (X ∈ I) =∫If(x)dx.

À função f chamamos função densidade probabilidade ou função densidade.

Page 18: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

12 CAPÍTULO 2. VARIÁVEIS ALEATÓRIAS

Propriedades da função densidade probabilidade:

1. f (x) ≥ 0, ∀x ∈ R;

2.∫+∞−∞ f (x) dx = 1.

Observação: Como∫I f(x)dx é um integral de uma função não negativa e é sempre convergente,

então a P (X ∈ I), corresponde ao valor da área entre o eixo das abcissas e o gráfico da funçãof no intervalo I considerado. Consequentemente P (X = x) = 0, ∀x ∈ R e

P (x1≤X≤x2) = P (x1<X≤x2) = P (x1≤ X<x2) = P (x1<X<x2), ∀ x1 ≤ x2.

Observação: Por definição, F ′(x) = f(x), nos pontos onde existe derivada. Se não existirderivada, f(x) = 0.

2.4 Momentos

Qualquer variável aleatória possui algumas características numéricas importantes. As mais conhe-cidas são o valor médio e a variância. Nesta secção vamos estudar outras características maisgerais: os Momentos.

Definição 2.12 (Valor médio). O valor médio, valor esperado ou simplesmente média da v.a.X é dado por,

µ = E(X) =

∞∑i=1

xiP (X = xi) se X é uma v.a. discreta;+∞∫−∞

xf(x)dx se X é uma v.a. contínua;

desde que a série/integral seja absolutamente convergente.

Definição 2.13 (Valor médio de uma função de uma variável aleatória). Seja X uma v.a. eg uma função real de variável real contínua com quanto muito um conjunto numerável de pontosde descontinuidade. Então o valor médio de Y = g(X) é dado por:

E(g(X)) =

∞∑i=1

g(xi)P (X = xi) se X é uma v.a. discreta;+∞∫−∞

g(x)f(x)dx se X é uma v.a. contínua;

desde que a série/integral seja absolutamente convergente.

Exemplo 2.14. Considere a variável aleatória introduzida no Exemplo 2.2. Os valores médios deX e g(X) = X2, são respectivamente:

E(X) = 0× 14 + 1× 1

2 + 2× 14 = 1,

E(g(X)) = E(X2) = 02 × 14 + 12 × 1

2 + 22 × 14 = 3

2 .

Page 19: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

2.4. MOMENTOS 13

Propriedades do valor esperado:

1. Se a é uma constante, E(a) = a;

2. Se a e b são constantes, E(aX + b) = aE(X) + b.

3. Se existirem E(g1(X)) e E(g2(X)), então

E(g1(X) + g2(X)) = E(g1(X)) + E(g2(X)).

Definição 2.15 (Momentos de ordem k). SejaX uma variável aleatória. Definem-se momentosde ordem k em torno da origem por:

mk = E(Xk),

e os momentos centrais de ordem k de X por:

µk = E((X − µ)k),

desde que os valores esperados existam.

Definição 2.16 (Variância e desvio padrão). A variância da v.a. X, σ2 ou V (X), é o momentocentral de ordem dois, isto é,

σ2 = V (X) = E((X − µ)2),

desde que exista o valor esperado de (X − µ)2. À sua raiz quadrada positiva, σ =√V (X),

chamamos desvio padrão da v.a. X.

Proposição 2.17. Se X é uma v.a., para a qual existe variância, V (X)=E(X2)−E2 (X).

Propriedades da Variância:

1. Se a é uma constante, V (a) = 0;

2. Se a e b são constantes, V (aX + b) = a2V (X).

Exemplo 2.18. Considere a variável aleatória introduzida no Exemplo 2.2. A variância de X é:

V (X) = E((X − 1)2) = (0− 1)2 × 14 + (1− 1)2 × 1

2 + (2− 1)2 × 14 = 1

2 .

Nota: A variância também podia ser calculada através do resultado da Proposição 2.17.

Page 20: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

14 CAPÍTULO 2. VARIÁVEIS ALEATÓRIAS

Teorema 2.19 (Desigualdade de Chebychev). Se X é uma v.a. para a qual existe variânciaσ2 e c > 0 é uma constante real positiva, então

P (|X − µ| ≥ cσ) ≤ 1c2 ⇔ P (|X − µ| < cσ) ≥ 1− 1

c2 .

Exemplo 2.20 (Desigualdade de Chebychev). Para c = 2, podemos dizer que a probabilidadeda v.a. X assumir valores no intervalo ]µ− 2σ, µ+ 2σ[ é superior a 1− 1/4 = 0.75.

Observação: A generalidade da Desigualdade de Chebychev impede-a de ser muito precisa.

2.5 Outros parâmetros relevantes

Definição 2.21 (Coeficiente de variação). Seja X uma v.a. com suporte não negativo. OCoeficiente de variação de X é,

CV = σ

µ× 100%.

Definição 2.22 (Coeficiente de Simetria). O Coeficiente de simetria, de uma v.a. X, é definidopor

β1 = µ3σ3 .

Definição 2.23 (Coeficiente de achatamento ou Kurtosis). Define-se o coeficiente de achata-mento ou kurtosis como

β2 = µ4σ4 − 3.

Definição 2.24 (Quantil). O quantil de ordem p, χp, da v.a. X é a solução da equação:

F (χp) = p, 0 < p < 1.

Se X é uma v.a. discreta, a equação F (χp) = p pode não ter solução exacta. Neste casoconsidera-se χp = minx : F (x) ≥ p.

Definição 2.25 (Mediana). Trata-se do quantil de ordem p = 1/2. Costuma-se representar amediana, da v.a. X, por med(X).

Definição 2.26 (Moda). A Moda, representada por mo, é o valor que maximiza a função deprobabilidade ou a função densidade probabilidade, desde que seja único.

Page 21: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

2.6. FUNÇÕES DE UMA VARIÁVEL ALEATÓRIA 15

2.6 Funções de uma variável aleatória

Existem muitas formas de criar novas variáveis aleatórias, a partir de outras já conhecidas. Muitasdestas variáveis aparecem de forma natural com a resolução de problemas. Assim, sejam X e Yvariáveis aleatórias tais que Y é função de X (Y = g(X)). Interessa-nos saber como conhecer adistribuição de Y . Para isso basta conhecer a sua função de distribuição, FY . Independentementede X ser uma v.a. discreta ou contínua, podemos sempre obter a sua função de distribuição doseguinte modo:

FY (y) = P (Y ≤ y) = P (g(X) ≤ y) = P (Ay),

onde Ay = x ∈ Dx : g(x) ≤ y. Geralmente consegue-se calcular P (Ay), a partir da função dedistribuição de X, FX .

Exemplo 2.27. Considere a v.a. X com função de distribuição,

FX(x) =

0, x ≤ 0

5x4 − 4x3, 0 < x < 11, x ≥ 1

Estamos interessados em conhecer a distribuição das v.a.’s Y = 2X − 1 e W = X2. Comecemospor determinar a f.d. da v.a. Y :

FY (y) = P (Y ≤ y) = P (2X − 1 ≤ y) = P (X ≤ y+12 ) = FX(y+1

2 ) =

=

0, y+1

2 ≤ 05(y+1

2)4 − 4

(y+12)3, 0 < y+1

2 < 11, y+1

2 ≥ 1

=

0, y ≤ −1

5(y+1

2)4 − 4

(y+12)3, −1 < y < 1

1, y ≥ 1

Determinemos agora a função de distribuição de W . É obvio que se w < 0, FW (w) = 0. Sew ≥ 0,

FW (w) = P (W ≤ w) = P (−√w ≤ X ≤

√w) = FX(

√w)− FX(−

√w) = FX(

√w) =

=

5√w

4 − 4√w

3, 0 ≤

√w < 1

1,√w ≥ 1

=

5w2 − 4w3/2, 0 ≤ w < 11, w ≥ 1

A procedimento, acima indicado, é válido quer X seja uma v.a. contínua ou uma v.a. discreta.Contudo no caso de X ser uma v.a. discreta, Y = g(X) é também uma v.a. discreta. Nestasituação podemos também conhecer de distribuição de Y a partir da sua função de probabilidade.

Page 22: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

16 CAPÍTULO 2. VARIÁVEIS ALEATÓRIAS

Assim, seja Dx o suporte de X, isto é, o conjunto dos valores de X com probabilidade positiva.Então,

P (Y = y) = P (g(X) = y) = P (X ∈ Ay),

onde Ay = x ∈ Dx : g(x) = y.

Exemplo 2.28. Considere novamente a variável aleatória introduzida no Exemplo 2.2 e a novavariável aleatória Y = (X − 1)2. Sendo X uma v.a. discreta, concluímos que Y é também umav.a. discreta. Como X tem como suporte os valores 0, 1,e 2, o suporte de Y é o conjunto dosvalores 0 e 1. Resulta que

P (Y = 0) = P ((X − 1)2 = 0) = P (X = 1) = 12 ,

P (Y = 1) = P ((X − 1)2 = 1) = P (X − 1 = −1 ∨X − 1 = 1) =

= P (X = 0) + P (X = 2) = 14 + 1

4 .

Então a função de probabilidade de Y é

Y

0 112

12

Page 23: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 3

Vectores aleatórios

Sejam X1, X2, . . . , Xm m variáveis aleatórias. Então X = (X1, X2, . . . , Xm) é um vectoraleatório de dimensão m. Vamos restringir-nos apenas aos pares aleatórios (X,Y ) = (X1, X2),isto é, aos vectores aleatórios com m = 2. Estes podem ser do tipo discreto, contínuo ou misto,conforme X e Y são v.a. de tipo discreto, contínuo ou uma discreta e a outra contínua.

Definição 3.1 (Função de distribuição conjunta). Seja (X,Y ) um par aleatório. A função dede distribuição de (X,Y ) é:

FX,Y (x, y) = P (X ≤ x, Y ≤ y), ∀(x, y) ∈ R2.

3.1 Par aleatório discreto

Definição 3.2 (Par aleatório discreto). Diz-se que (X,Y ) é um par aleatório discreto se e sóse X e Y são variáveis aleatórias discretas.

Definição 3.3 (Função de probabilidade conjunta). Seja (X,Y ) um par aleatório discretotomando valores no conjunto D = (xi, yj) ∈ R2 : P (X = xi, Y = yj) > 0. Chamamos funçãode probabilidade conjunta (f.p.c.) de (X,Y ) à função:

pij = P (X = xi, Y = yj), i = 1, 2, . . . , j = 1, 2, . . .

Propriedades da função de probabilidade conjunta:

1. 0 ≤ pij ≤ 1, ∀(xi, yj) ∈ D;

2.∑i

∑j

pij = 1

Observação: Quando o conjunto D é finito e pequeno é costume representar a f.p.c. numatabela, idêntica à que a seguir se apresenta:

17

Page 24: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

18 CAPÍTULO 3. VECTORES ALEATÓRIOS

X\Y y1 y2 . . . yn

x1 p11 p12 . . . p1n p1•

x2 p21 p22 . . . p2n p2•...

...... . . . ...

...xm pm1 pm2 . . . pmn pm•

p•1 p•2 . . . p•m 1

Definição 3.4 (Função de probabilidade marginal). Define-se função de probabilidade marginalde X e função de probabilidade marginal de Y como:

pi• = P (X = xi) =∞∑j=1

P (X = xi, Y = yj) =∞∑j=1

pij, i = 1, 2, . . .

p•j = P (Y = yj) =∞∑i=1

P (X = xi, Y = yj) =∞∑i=1

pij, j = 1, 2, . . .

Definição 3.5 (Função de probabilidade condicional). Seja (X,Y ) um par aleatório discreto.Define-se probabilidade condicional de X dado Y = yj como,

P (X = xi|Y = yj) = P (X = xi, Y = yj)P (Y = yj)

= pijp•j

, se P (Y = yj) > 0,

e probabilidade condicional de Y dado X = xi como

P (Y = Yj |X = Xi) = P (X = xi, Y = yj)P (X = xi)

= pijpi•

, se P (X = xi) > 0.

Definição 3.6 (Independência entre variáveis aleatórias discretas). As v.a.’s X e Y dizem-seindependentes se, e só se, pij = pi•p•j , ∀i, j.

Exemplo 3.7. Seja (X,Y ) um par aleatório discreto com a seguinte f.p.c.:

X \ Y 0 1 20 1/4 1/8 0 3/81 1/8 1/8 1/8 3/82 0 0 1/4 1/4

3/8 1/4 3/8

(a) Qual a probabilidade de X ser maior que Y ? (Solução: 1/8)

(b) Calcule P (X ≤ 1;Y > 0). (Solução: 3/8)

(c) X e Y são v.a.’s independentes? (Solução: X e Y não são independentes)

(d) Determine a função de probabilidade de X|Y = 2 e calcule E(X|Y = 2).

Page 25: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

3.2. PAR ALEATÓRIO CONTÍNUO 19

3.2 Par aleatório contínuo

Definição 3.8 (Par aleatório contínuo). Um par aleatório (X,Y ) diz-se contínuo se existe umafunção não negativa fX,Y tal que, tal que, para qualquer região I ⊂ R2,

P ((X,Y ) ∈ I) =∫ ∫

IfX,Y (u, v)dudv.

A fX,Y chamamos função densidade probabilidade conjunta ou função densidade conjunta.

Propriedades da função densidade probabilidade conjunta:

1. fX,Y (x, y) ≥ 0, ∀(x, y) ∈ R2;

2.∫+∞−∞

∫+∞−∞ fX,Y (x, y)dxdy = 1.

Definição 3.9 (Função densidade de probabilidade marginal). Define-se a função densidadede probabilidade marginal de X, como:

fX (x) =∫ +∞

−∞f(X,Y ) (x, y) dy, ∀x ∈ R

De modo análogo obtêm-se a função densidade de probabilidade marginal de Y ,

fY (y) =∫ +∞

−∞f(X,Y ) (x, y) dx, ∀y ∈ R

Definição 3.10 (Função densidade condicional). Em todos os pontos (x, y) onde fX,Y écontínua, fY (y) > 0 e é contínua, a função densidade condicional de X, dado Y = y, existe ecalcula-se como:

fX|Y (x|y) = fX,Y (x, y)fY (y) .

De modo análogo, em todos os pontos (x, y) onde fX,Y é contínua, fX(x) > 0 e é contínua, afunção densidade condicional de Y , dado X = x, existe e calcula-se como:

fY |X(y|x) = fX,Y (x, y)fX(x) .

Definição 3.11 (Independência entre variáveis aleatórias contínuas). Seja (X,Y ) um paraleatório contínuo. As variáveis X e Y dizem-se independentes se e só se

fX,Y (x, y) = fX(x)fY (y), ∀ (x, y) ∈ R2

Page 26: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

20 CAPÍTULO 3. VECTORES ALEATÓRIOS

Exemplo 3.12. Os tempos de vida, em centenas de horas, das duas componentes principais deum sistema de controlo são v.a.’s (X,Y ) com função densidade conjunta

fX,Y (x, y) =cx2y 0 < x < 3 , 0 < y < 20 outros valores de (x, y) ∈ R2

(a) Qual o valor de c?

fX,Y (x, y) ≥ 0, ∀ (x, y) ∈ R2 ⇒ c ≥ 0∫ +∞

−∞

∫ +∞

−∞fX,Y (x, y) dxdy = 1 ⇔

∫ 2

0

(∫ 3

0cx2y dx

)dy = 1⇔ c = 1

18

(b) Qual a probabilidade de cada uma das componentes durar mais de 100 horas?

P (X > 1, Y > 1) =∫ 2

1

∫ 3

1

118x

2y dxdy = 1318

(c) Qual a probabilidade da 1a componente durar mais de 100 horas?Como fX (x) =

∫ +∞−∞ f(X,Y ) (x, y) dy =

∫ 20

118x

2y dy = x2

9 , 0 < x < 3, resulta que:

P (X > 1) =∫ 3

1fXdx =

∫ 3

1

x2

9 dx = 2627

(d) Os tempos de vida das componentes são independentes?Como

fY (y) =y/2 0 < y < 20 o. v. de y fX (x) =

x2/9 0 < x < 30 o. v. de x

f (x, y) = 1

18x2y 0 < x < 3, 0 < y < 2

0 o. v. (x, y) = fX (x) fY (y)

Conclui-se que X e Y são v.a.’s independentes.

3.3 Momentos de vectores aleatórios

Definição 3.13 (Valor médio). Seja (X,Y ) um par aleatório e g : R2 → R uma função real.Define-se valor médio ou valor esperado ou média de g(X,Y ) como:

E(g(X,Y ))=

∞∑i=1

∞∑j=1

g(xi, yj)pij se X e Y são v.a.’s discretas;+∞∫−∞

+∞∫−∞

g(x, y)fX,Y (x, y)dxdy se X e Y são v.a.’s contínuas.

Nota: Uma das funções mais utilizadas é g(x, y) = xy, obtendo-se:

E(XY )=

∞∑i=1

∞∑j=1

xiyjpij se X e Y são v.a.’s discretas;+∞∫−∞

+∞∫−∞

xyfX,Y (x, y)dxdy se X e Y são v.a.’s contínuas.

Page 27: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

3.3. MOMENTOS DE VECTORES ALEATÓRIOS 21

Definição 3.14 (Covariância). Sendo µX = E(X) e µY = E(Y ), define-se covariância entreas v.a.’s X e Y por:

Cov (X,Y ) = E [(X − µX) (Y − µY )] .

Proposição 3.15. Caso exista a covariância entre X e Y , esta pode ser calculada através dafórmula:

Cov (X,Y ) = E (XY )− E (X)E (Y ) .

Outras propriedades do valor médio e variância:

1. E(X ± Y ) = E(X)± E(Y );

2. V (X ± Y ) = V (X) + V (Y )± 2Cov(X,Y ).

Proposição 3.16. Se X e Y são independentes, então E(XY ) = E(X)E(Y ), e consequente-mente Cov(X,Y ) = 0.

Propriedades da Covariância: Sejam X, Y , e Z v.a.’s, a, b e c constantesreais. Então:

1. Cov(X,Y ) = Cov(Y,X);

2. Cov(X,X) = V (X);

3. Cov (a+ bX, c+ dY ) = bd Cov (X,Y );

4. Cov (aX + bY, cZ) = ac Cov (X,Z) + bc Cov (Y, Z).

Definição 3.17 (Coeficiente de correlação). Define-se coeficiente de correlação de (X,Y ) por

ρ (X,Y ) = Cov (X,Y )√V (X)V (Y )

.

Propriedades do coeficiente de correlação:

1. −1 ≤ ρ (X,Y ) ≤ 1;

2. Se X e Y são v.a.’s independentes, então ρ (X,Y ) = 0.

Page 28: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

22 CAPÍTULO 3. VECTORES ALEATÓRIOS

Page 29: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 4

Principais Distribuições

4.1 Distribuições discretas

4.1.1 Distribuição Uniforme

Definição 4.1 (Distribuição Uniforme Discreta). Dizemos que a variável aleatóriaX segue umadistribuição Uniforme Discreta de parâmetro n e escrevemos X ∼ Unif(n), ou abreviadamente,X ∼ U(n), se a função de probabilidade de X é dada por:

X

1 2 . . . n1n

1n . . . 1

n

ou P (X = x) = 1n, x = 1, . . . , n.

A respectiva função de distribuição é:

F (x) =

0, x < 1kn , k ≤ x < k + 1, k = 1, . . . , n− 11, x ≥ n

.

Proposição 4.2 (Valor médio e Variância). Considere a v.a. X ∼ Unif(n). Então,

E(X) = n+ 12 e V (X) = n2 − 1

12 .

Demonstração. 1

E(X) =n∑x=1

x1n

= 1n

n∑x=1

x = 1n× n(n+ 1)

2 = n+ 12 .

Para calcular a variância, é mais fácil utilizar o resultado V (X) = E(X2)− E2(X). Assim,

E(X2) =n∑x=1

x2 1n

= 1n

n∑x=1

x2 = 1n× n(n+ 1)(2n+ 1)

6 = (n+ 1)(2n+ 1)6 .

Logo V (X) = (n+1)(2n+1)6 −

(n+1

2

)2= n2−1

12 .

1Utilizam-se aqui os resultados, 1 + 2 + 3 + . . .+ n = n(n+1)2 e 12 + 22 + 32 + . . .+ n2 = n(n+1)(2n+1)

6 , n ∈ N,que se podem confirmar por Indução Matemática.

23

Page 30: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

24 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

4.1.2 Distribuição de Bernoulli

Definição 4.3 (Prova de Bernoulli). Trata-se de um experiência aleatória com apenas doisresultados possíveis (que se costumam designar por “Sucesso” ou “Insucesso”).

Definição 4.4 (Distribuição de Bernoulli). É sempre possível definir uma variável aleatória Xque toma o valor 1 se o resultado da experiência é “Sucesso” e 0 se é “Insucesso”. Denotandop = P (“Sucesso”) > 0, então a função de probabilidade de X é dada por:

X

0 1

1− p pou P (X = x) = px(1− p)1−x, x = 0, 1, 0 < p < 1.

Dizemos que a v.a. X segue uma distribuição de Bernoulli, de parâmetro p, e escrevemosX ∼ Ber(p).

Proposição 4.5. Seja a v.a. X ∼ Ber(p). Então

E(X) = p e V (X) = p(1− p).

4.1.3 Distribuição Binomial

Definição 4.6 (Distribuição Binomial). Considere-se uma sucessão de provas de Bernoulli in-dependentes, onde em cada prova a probabilidade de “sucesso”, p, é constante. A v.a. X=“número de sucessos em n provas de Bernoulli” segue uma distribuição Binomial de parâmetrosn e p, e escrevemos X ∼ Bin(n, p). A função de probabilidade é:

P (X = x) =(n

x

)px(1− p)n−x, x = 0, 1, . . . , n, 0 < p < 1.

0 1 2 3 40.0

0.1

0.2

0.3

0.4

0.5

Bin(n=4 , p=0.25)

x

P(X

=k)

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

Bin(n=4 , p=0.5)

x

P(X

=k)

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

Bin(n=4 , p=0.75)

x

P(X

=k)

Figura 4.1: Gráficos da função de probabilidade de uma v.a. Bin(4, p), para alguns valores de p.

Page 31: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.1. DISTRIBUIÇÕES DISCRETAS 25

Observação: Pela definição anterior, temos que X = I1 + I2 + . . . + In, onde Ii, i = 1, . . . , nsão v.a.’s independentes com distribuição Ber(p).

Proposição 4.7. Seja X uma variável aleatória com distribuição Bin(n, p). Então a nova v.a.Y = n−X tem distribuição Bin(n, 1− p).

Proposição 4.8 (Valor médio e Variância). Considere a v.a. X ∼ Bin(n, p). Então,

E(X) = np e V (X) = np(1− p).

Demonstração. A demonstração torna-se mais simples se usarmos a representação X = I1 +I2 +. . .+ In, introduzida na última observação. Assim,

E(X) = E(I1 + I2 + . . .+ In) = E(I1) + E(I2) + . . .+ E(In) = p+ p+ . . .+ p = np.

Atendendo à independência das variáveis Ii,

V (X) = V (I1 + I2 + . . .+ In) = V (I1) + V (I2) + . . .+ V (In) = np(1− p).

Exemplo 4.9 (Exame de P.E. D - 2007/08). Num concurso de televisão o apresentador propõe aoconcorrente o seguinte jogo: atiram-se ao ar 3 moedas, em simultâneo, e se todos os lançamentosresultarem em caras o apresentador dá 10 e ao concorrente; Se todos os lançamentos resultaremem coroas o apresentador dá igualmente ao concorrente 10 e. Mas se os lançamentos resultaremem 2 caras e 1 coroa ou em 2 coroas e 1 cara, o concorrente tem de dar ao apresentador 5 e.

(a) Represente X a quantidade de dinheiro ganha pelo concorrente. Determine a sua funçãode probabilidade.

(b) Baseado no valor esperado de X, diga se o concorrente deve aceitar jogar este jogo.

Resolução:

(a) Considere a v.a. Y: “número de caras obtidas em 3 lançamentos de uma moeda (equili-brada)”. Então como em cada lançamento o resultado é cara (sucesso) ou coroa (insucesso)e os resultados dos lançamentos são mutuamente independentes, Y ∼ Bin(3, 1/2).Como P (X = −5) = P (Y = 1) + P (Y = 2) = 3/4 e P (X = 10) = P (Y = 0) + P (Y =3) = 1/4, resulta a seguinte função de probabilidade:

X

−5 103/4 1/4

(b) Como E(X) = −5/4 < 0, o concorrente não deve jogar.

Page 32: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

26 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

Proposição 4.10 (Aditividade). Sejam Xi, i = 1, . . . ,m, m v.a.’s independentes tais queXi ∼ Bin(ni, p). Então a sua soma tem também distribuição Binomial, isto é,

Sm =m∑i=1

Xi ∼ Bin(n1 + . . .+ nm, p).

4.1.4 Distribuição Geométrica

Definição 4.11 (Distribuição Geométrica). Considere-se uma sucessão de provas de Bernoulliindependentes, onde em cada prova a probabilidade de “sucesso”, p, é constante. A v.a. X=“número de provas necessárias até ocorrer o primeiro sucesso” segue uma distribuição Geométricade parâmetro p, e escrevemos X ∼ G(p). A função de probabilidade é:

P (X = x) = p(1− p)x−1, x = 1, 2, . . . , 0 < p < 1.

Observação: O nome desta distribuição deve-se ao facto da sucessão das probabilidades ser umaprogressão geométrica de razão 1− p.

0 5 10 15 200.0

0.1

0.2

0.3

0.4

0.5

G(0.25)

x

P(X

=k)

0 5 10 15 200.0

0.1

0.2

0.3

0.4

0.5

G(0.5)

x

P(X

=k)

Figura 4.2: Gráficos da função de probabilidade de uma v.a. G(p), para alguns valores de p.

Proposição 4.12 (Valor médio e Variância). Considere a v.a. X ∼ G(p). Então,

E(X) = 1p

e V (X) = 1− pp2

Demonstração. O cálculo do valor médio e da variância é mais fácil se usarmos alguns dos re-sultados das séries de funções: Assim seja S(r) =

∑∞k=0 r

k uma série geométrica de razão r.Resulta que:

1. S(r) =∞∑k=0

rk = 11−r , |r| < 1;

2. S′(r) =∞∑k=1

krk−1 = 1(1−r)2 , |r| < 1;

Page 33: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.1. DISTRIBUIÇÕES DISCRETAS 27

3. S′′(r) =∞∑k=2

k(k − 1)rk−2 = 2(1−r)3 , |r| < 1.

Assim,

E(X) =∞∑x=1

x p(1− p)x−1 = p S′(1− p) = p 1p2 = 1

p .

Para se conseguir calcular a variância, de um modo mais fácil, usa-se mais uma vez o resultadoV (X) = E(X2)− E2(X). Tem-se,

E(X2) =∞∑x=1

x2 p(1− p)x−1 =∞∑x=1

x(x− 1 + 1) p(1− p)x−1 =

=∞∑x=1

x(x− 1) p(1− p)x−1 +∞∑x=1

x p(1− p)x−1 =

= p(1− p)∞∑x=2

x(x− 1) (1− p)x−2 + E(X) = p(1− p)S′′(1− p) + E(X) =

= p(1− p) 2p3 + 1

p = 2(1−p)+pp2 = 2−p

p2

Então,

V (X) = 2−pp2 − 1

p2 = 1−pp2 .

Proposição 4.13. Temos que F (x) = P (X ≤ x) = 1− (1− p)[x], x ≥ 1, onde [x] representa aparte inteira de x;

Como as provas de Bernoulli são independentes, a contagem do número de provas necessáriasaté ao proximo sucesso pode ser recomeçada em qualquer prova, sem que isso altere a distribuiçãoda variável aleatória.

Proposição 4.14 (Propriedade da falta de memória da distribuição Geométrica). SejaX ∼ G(p). Sendo x e y inteiros positivos,

P (X > x+ y|X > y) = P (X > x).

4.1.5 Distribuição Hipergeométrica

Definição 4.15 (Distribuição Hipergeométrica). Considere-se uma população de N elemen-tos, dos quais M possuem determinada característica e os restantes (N −M) não a possuem(dicotomia). Considere-se a experiência aleatória que consiste em seleccionar ao acaso e semreposição n elementos (amostra). Associada a esta experiência aleatória, defina-se a v.a. X - no

Page 34: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

28 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

de elementos com a característica, entre os seleccionados sem reposição. Esta v.a. X tem umafunção de probabilidade,

P (X = x) =(Mx

)(N−Mn−x

)(Nn

) , max(0,M + n−N) ≤ x ≤ min(M,n),

e diz-se ter distribuição Hipergeométrica de parâmetros (N,M,n) (pode ser escrito abreviada-mente X ∼ H(N,M,n)).

Proposição 4.16 (Valor médio e Variância). Seja a v.a. X ∼ H(N,M,n). Então:

E(X) = nMN e V (X) = n MN2(N−1)(N −M)(N − n).

Exemplo 4.17. Num aquário existem 9 peixes, dos quais 5 estão saudáveis (S) e os restantes 4estão doentes (D). Considere-se a experiência aleatória: extracção ao acaso e sem reposição de3 peixes e registo do seu estado de saúde. Associada a esta experiência, considere-se a v.a. X -número de peixes saudáveis na amostra extraída de 3 peixes. Quantos peixes saudáveis esperamosencontrar em cada extracção?Resposta: Como X ∼ H(9, 5, 3), o número de peixes saudáveis, que esperamos encontrar emcada extracção de 3 peixes, é E(X) = 5/3.

Nota: Em situações em que se conhece totalmente a composição da população e há apenas doisresultados possíveis, a distribuição Binomial caracteriza extracções com reposição. Se não houverreposição, a distribuição adequada é a Hipergeométrica. Quando n é pequeno, relativamenteao valor de N , a probabilidade de sucesso em cada tiragem sem reposição varia muito poucode prova para prova (na distribuição Binomial este valor é constante). Este argumento permite-nos aproximar o(s) valor(es) da(s) probabilidade(s) pela distribuição Hipergeométrica, pelo(s)valor(es) da(s) probabilidade(s) pela distribuição Binomial.

Aproximação da distribuição Hipergeométrica pela distribuição Binomial:

Seja X uma v.a. tal que X ∼ H(N,M,n). Então, caso nN ≤ 0.1, isto é, caso

o tamanho da amostra seja muito pequeno em relação ao tamanho da população,podemos aproximar a distribuição de X pela distribuição Bin(n, p), com p = M

N ,ou seja,

P (X = x) = (Mx )(N−Mn−x )(Nn) ≈

(n

x

)(M/N)x(1−M/N)n−x.

Page 35: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.1. DISTRIBUIÇÕES DISCRETAS 29

4.1.6 Distribuição de Poisson

Definição 4.18 (Processo de Poisson). Suponha que estamos interessados em estudar a variávelaleatória X que conta o número de ocorrências de um acontecimento num dado intervalo detempo2 de duração t (por exemplo, o número de acidentes rodoviários ocorridos num dia ou onúmero de clientes que entram numa loja durante 1 hora). Temos um processo de Poisson deparâmetro λ > 0, quando se verificam as seguintes condições:

1. A probabilidade p de ocorrer exactamente um acontecimento num intervalo de amplitudearbitrariamente pequena d é proporcional à sua duração, isto é, p = λd;

2. A probabilidade de ocorrer mais do que um acontecimento num intervalo de amplitudearbitrariamente pequena é aproximadamente igual a zero;

3. O número de acontecimentos que ocorrem em dois intervalos disjuntos são independentes.

4. O número de ocorrências em dois intervalos com a mesma duração, têm a mesma dis-tribuição.

Para deduzir a função de probabilidade, vamos considerar um intervalo unitário (t = 1),dividido em n sub-intervalos, todos com amplitude d = 1/n, com n suficientementegrande. Nas condições acima indicadas, o número de ocorrências em cada sub-intervaloé bem aproximado por uma v.a. Ber(p), com p = λ/n. Então X tem aproximadamentedistribuição Bin(n, λ/n), isto é,

P (X = x) ≈(n

x

)(λn

)x(1− λn

)n−x, x = 0, 1, . . . , n.

Se n→∞,

P (X = x) = limn→∞

(n

x

)(λn

)x(1− λn

)n−x = e−λλx

x! x = 0, 1, . . . , n.

Definição 4.19 (Distribuição de Poisson). Dizemos que a variável aleatória X segue umadistribuição de Poisson de parâmetro λ, e escrevemos X ∼ P (λ), se a função de probabilidadede X é:

P (X = x) = e−λλx

x! , x = 0, 1, 2, . . . , λ > 0.

Observação: Se num processo de Poisson, os acontecimentos acorrem a uma taxa média λ,por unidade de tempo, então o número de ocorrências num intervalo de amplitude t > 0 temdistribuição de Poisson de parâmetro λt.

2Note que podemos também considerar uma área, um volume, etc.

Page 36: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

30 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

Por exemplo, se durante a hora de almoço (das 12 às 14 horas) a chegada de automóveis a umparque se processa a uma taxa de 180 automóveis por hora e tem distribuição de Poisson, entãoa distribuição do número de automóveis que chegam em 15 minutos é Poisson com parâmetroλt = 180 × 1

4 = 45. A distribuição do número de automóveis que chegam durante a hora doalmoço é Poisson de parâmetro λt = 180× 2 = 360.

0 5 10 15 200.00

0.05

0.10

0.15

0.20

0.25

0.30

P(2)

x

P(X

=k)

0 5 10 15 200.00

0.05

0.10

0.15

0.20

0.25

0.30

P(10)

x

P(X

=k)

Figura 4.3: Função de probabilidade de uma v.a. P (λ), para alguns valores de λ.

Proposição 4.20 (Valor médio e Variância). Seja X uma v.a. com distribuição P (λ). Então,

E(X) = λ e V (X) = λ.

Aproximação da distribuição Binomial pela distribuição de Poisson

Seja X uma v.a. tal que X ∼ Bin(n, p). É possível de verificar que

limn→∞np→λ

(n

x

)px(1− p)(n−x) = e−λ

λx

x! , x = 0, 1, 2, . . .

Então, caso n ≥ 50 e np ≤ 5, pode-se aproximar a distribuição de Binomial peladistribuição de Poisson com λ = np.

Teorema 4.21 (Aditividade). Sejam X1, X2, . . . , Xm variáveis aleatórias independentes comXi ∼ P (λi), i = 1, . . . ,m. Então,

Sm =m∑i=1

Xi ∼ P (λ1 + . . .+ λm).

Page 37: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.2. DISTRIBUIÇÕES CONTÍNUAS 31

4.2 Distribuições Contínuas

4.2.1 Distribuição Uniforme Contínua

Definição 4.22 (Distribuição Uniforme Contínua). Dizemos que a variável aleatória X segueuma distribuição Uniforme (contínua) no intervalo [a, b], −∞ < a < b < +∞, e escrevemosX ∼ Unif(a, b), ou X ∼ U(a, b), se a função densidade probabilidade de X é dada por:

f(x) = 1

b−a , a ≤ x ≤ b0 , c.c.

A respectiva função de distribuição é dada por,

F (x) =

0, x < ax−ab−a , a ≤ x < b

1, x ≥ b

-

6

ba x

f(x)

1b−a

-

6

ba x

F (x)

1

Figura 4.4: Função densidade (esquerda) e função de distribuição (direita) de uma v.a. U(a, b).

Proposição 4.23 (Valor médio e Variância). Seja a v.a. X ∼ U(a, b). Então:

E(X) = a+ b

2 e V (X) = (b− a)2

12 .

Demonstração.

E(X) =∫ +∞

−∞xf(x)dx =

∫ b

a

x

b− adx =

[x2

2(b− a)

]ab

= b2 − a2

2(b− a) = a+ b

2

Como,

E(X2) =∫ +∞

−∞x2f(x)dx =

∫ b

a

x2

b− adx =

[x3

3(b− a)

]ab

= b2 + ab+ a2

3 ,

Page 38: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

32 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

resulta que a variância é

V (X) = E(X2)− E2(X) = b2 + ab+ a2

3 − (a+ b)2

4 = b2 + a2 − 2ab12 = (b− a)2

12 .

O caso particular da distribuição Uniforme com a = 0 e b = 1 é o que apresenta mais interesse,devido ao seguinte teorema:

Teorema 4.24 (Teorema da Transformação Uniformizante). Seja X uma variável aleatóriacontínua, com função de distribuição FX(x). Então a variável aleatória Y = FX(X) tem dis-tribuição U(0, 1).

4.2.2 Distribuição Exponencial

Começamos por introduzir a função Gama, presente em muitos livros de Análise Matemática.

A função Gama corresponde ao integral:

Γ(a) =∫ ∞

0xa−1e−xdx, a > 0 (4.1)

Propriedades da função Gama:

1. Γ(α+ 1) = αΓ(α);

2. Γ(n) = (n− 1)!, n ∈ N

3. Γ(1/2) =√π

4.∫∞0 xα−1e−βxdx = Γ(α)

βα .

Definição 4.25 (Distribuição Exponencial). Uma variável aleatória X diz-se seguir uma dis-tribuição Exponencial de parâmetro λ, e escrevemos X ∼ Exp(λ), se a sua função densidadeprobabilidade for dada por:

f(x) =

0 , x ≤ 0;λ e−λx, x > 0; λ > 0.

A sua função de distribuição é dada por:

F (x) =

0, x ≤ 01− e−λx, x > 0

Page 39: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.2. DISTRIBUIÇÕES CONTÍNUAS 33

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

Função densidade Exponencial

x

λλ=1λλ=2

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

Função de distribuição Exponencial

x

λλ=1λλ=2

Figura 4.5: Função densidade (esquerda) e função de distribuição (direita) de uma v.a. Exp(λ).

Proposição 4.26 (Valor médio e Variância). Considere a v.a. X ∼ Exp(λ). Então,

E(X) = 1λ

e V (X) = 1λ2 .

Demonstração. Vamos utilizar as propriedades da função Gama para calcular o valor médio.Assim,

E(X) =∫ +∞

−∞xf(x)dx =

∫ ∞0

xλ e−λxdx = λ

∫ ∞0

x2−1 e−λxdx = λΓ(2)λ2 = 1

λ.

De modo análogo se calcula E(X2) e se verifica que V (X) = 1λ2 .

Proposição 4.27 (Relação entre a distribuição Exponencial e Poisson). Considere um acon-tecimento que ocorre de acordo com um Processo de Poisson de parâmetro λ, por unidade detempo. Então, o tempo até à primeira ocorrência e o tempo entre duas ocorrências consecutivastem distribuição Exp(λ).

Exemplo 4.28. Admita que o número de avarias de uma fotocopiadora é um processo de Poissoncom taxa λ =5/ano. Calcule a probabilidade do tempo entre avarias consecutivas ser inferior aum mês.Resolução: O tempo X entre avarias consecutivas tem distribuição Exp(5). Assim, a probabili-dade pedida é:

P (X < 1/12) = FX(1/12) = 1− e−λ/12 = 1− e−5/12 = 0.3408.

Teorema 4.29 (Falta de memória da distribuição exponencial). Seja X ∼ Exp(λ). Então:

P (X ≥ x+ y|X ≥ y) = P (X ≥ x).

Page 40: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

34 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

4.2.3 Distribuição Gama

A distribuição Gama é uma generalização da distribuição Exponencial.

Definição 4.30 (Distribuição Gama). Uma variável aleatória X tem distribuição Gama deparâmetros α > 0 e λ > 0, e escrevemos X ∼ G(α, λ), se a sua função densidade probabilidadefor dada por:

f(x) =

0 , x ≤ 0;1

Γ(α)λαxα−1 e−λx, x > 0;

e a sua função de distribuição é dada por:

F (x) =

0, x ≤ 0∫ x0

1Γ(α)λ

αtα−1 e−λtdt, x > 0

Proposição 4.31 (Valor médio e Variância). Considere a v.a. X ∼ G(α, λ). Então,

E(X) = α

λe V (X) = α

λ2 .

Só é possível determinar a função de distribuição se α ∈ N. Considere a v.a. X ∼ G(α, λ),com α ∈ N (neste caso particular a distribuição é também conhecida por distribuição de Erlang).Então a a sua função densidade probabilidade é:

f(x) =

0 , x ≤ 0;1

(α−1)!λαxα−1 e−λx, x > 0;

e a sua função de distribuição é dada por:

F (x) =

0, x ≤ 0

1− e−λxα−1∑i=0

(λx)ii! , x > 0

Proposição 4.32 (Distribuição da soma de Exponenciais i.i.d.). Sejam Xi, i = 1, 2, . . . , nvariáveis aleatórias independentes com distribuição Exp(λ), então,

Sn =n∑i=1

Xi ∼ G(n, λ).

Exemplo 4.33. Admita que o número de avarias de uma fotocopiadora é um processo de Poissoncom taxa λ =5/ano. O tempo Y que decorre até à segunda avaria é uma variável aleatóriaG(2, 5). A probabilidade da segunda avaria ocorrer após 6 meses é

P (Y > 1/2) = 1− P (Y ≤ 1/2) = 1−(1− e−5/2

1∑i=0

(5/2)i

i!)

= e−5/2 × 72 = 0.2873

Page 41: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.2. DISTRIBUIÇÕES CONTÍNUAS 35

4.2.4 Distribuição Normal

Definição 4.34 (Distribuição Normal). Uma variável aleatória X diz-se seguir uma distribuiçãoNormal de parâmetros µ e σ2, e escrevemos X ∼ N(µ, σ2), se a sua função densidade probabili-dade for dada por:

f(x) = 1√2πσ

e−(x−µ)2

2σ2 , x ∈ R, µ ∈ R, σ > 0.

A função de distribuição é dada pelo integral:

F (x) =∫ x

−∞

1√2πσ

e−(t−µ)2

2σ2 dt,

para o qual não existe solução analítica. É assim necessário recorrer a métodos numéricos paraobter os valores desta função.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

Função densidade normal

x

µµ=0, σσ=1µµ=0, σσ=1.5

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Função de distribuição normal

x

µµ=0, σσ=1µµ=0, σσ=1.5

Figura 4.6: Função densidade (esquerda) e função de distribuição (direita) de uma v.a. N(µ, σ).

Observações:

• Esta distribuição é também conhecida pelo nome de Gaussiana ou distribuição de Gauss.

• Quando µ = 0 e σ = 1, a v.a. toma o nome de Normal reduzida. Neste caso é costumerepresentar por φ e Φ , respectivamente, a função densidade e função de distribuição.

• A distribuição Normal é simétrica em torno de µ.

Proposição 4.35 (Valor médio e Variância). Seja a v.a. X ∼ N(µ, σ2). Então

E(X) = µ e V (X) = σ2.

Teorema 4.36. Seja X ∼ N(µ, σ2). Resulta que,

Z = X − µσ

∼ N(0, 1).

Page 42: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

36 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

Teorema 4.37. Se X ∼ N(µ, σ2) e a, b são constantes reais, com a 6= 0, então

Y = aX + b ∼ N(aµ+ b, a2σ2).

Teorema 4.38. Sejam X1, X2, . . . , Xn, n variáveis aleatórias independentes com distribuiçõesXi ∼ N

(µi, σ

2i

), i = 1, 2, . . . , n. Considerando as constantes reais a1, a2, . . . , an, com algum

ai 6= 0, temos que:

Y = a1X1 + . . .+ anXn ∼ N(a1µ1 + . . .+ anµn︸ ︷︷ ︸

=µY

, a21σ

21 + . . .+ a2

nσ2n︸ ︷︷ ︸

=σ2Y

).

Note que:

µY = E(Y ) = E( n∑i=1

aiXi)

=n∑i=1

aiE (Xi) =n∑i=1

aiµi

σ2Y = V (Y ) = V

( n∑i=1

aiXi)

=n∑i=1

a2iV (Xi) =

n∑i=1

a2iσ

2i

4.2.5 Distribuição do Qui Quadrado

Definição 4.39 (Distribuição do Qui Quadrado). Uma variável aleatória X diz-se seguir umadistribuição Qui-quadrado com n graus de liberdade, e escrevemos X ∼ χ2

n, se a sua funçãodensidade probabilidade for dada por:

f(x) =

1

Γ(n/2)2n/2 e−x/2xn/2−1, x > 0

0 , x ≤ 0,

onde Γ representa a função Gama, introduzida em (4.1).

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

Função densidade do Qui Quadrado

x

n=1n=3

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

Função de distribuição do Qui Quadrado

x

n=1n=3

Figura 4.7: Função densidade (esquerda) e função de distribuição (direita) de uma v.a. χ2n.

Page 43: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

4.2. DISTRIBUIÇÕES CONTÍNUAS 37

Proposição 4.40. Considere a v.a. X ∼ χ2n. Então,

E(X) = n, e V (X) = 2n.

Teorema 4.41. Sejam X1, X2, . . . , Xn v.a.’s independentes com distribuição Normal Reduzida.Então,

X2i ∼ χ2

1,

e

Y = X21 +X2

2 + . . .+X2n ∼ χ2

n.

4.2.6 Distribuição t de Student

Definição 4.42 (Distribuição t de Student). Uma v.a. T diz-se ter distribuição t de Studentcom n graus de liberdade, e escreve-se T ∼ tn, se a sua função densidade probabilidade é dadapor:

f(t) =Γ(n+1

2

)Γ(n2)√

(1 + t2

n

)− (n+1)2 , t ∈ R.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

Função densidade

x

n=1n=3

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Função de distribuição

x

n=1n=3

Figura 4.8: Função densidade (esquerda) e função de distribuição (direita) de uma v.a. tn.

Proposição 4.43 (Valor médio e Variância). Seja X ∼ tn. Então,

E(X) = 0, n > 1, e V (X) = n

n− 2 , n > 2.

Teorema 4.44. Sejam X ∼ N(0, 1) e Y ∼ χ2n, com X e Y independentes. Então a variável

aleatória,

T = X√Y/n

,

tem distribuição t de Student com n graus de liberdade.

Page 44: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

38 CAPÍTULO 4. PRINCIPAIS DISTRIBUIÇÕES

Page 45: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 5

Teorema Limite Central

Apresentamos neste capítulo, um dos mais importantes resultados da teoria das probabilidades eda estatística, o Teorema Limite Central. Este teorema dá-nos a distribuição aproximada da somade n variáveis aleatórias independentes e identicamente distribuídas.

Teorema 5.1 (Teorema Limite Central). Seja X1, X2 . . . , uma sucessão de variáveis aleatóriasindependentes e identicamente distribuídas (i.i.d.), com valor médio µ e variância σ2 6= 0, finitos.Considere as variáveis aleatórias Sn e Zn, definidas por Sn =

∑ni=1Xi e,

Zn = Sn − nµ√nσ

. (5.1)

Então a distribuição de Zn converge para uma distribuição Normal reduzida, quando n → +∞,isto é,

Zn = Sn − nµ√nσ

a∼ N(0, 1).

Observação: Se no quociente da equação (5.1), que define Zn, dividirmos tanto o numeradorcomo o denominador por n, obtemos

Zn =√nXn − µ

σ,

onde Xn representa a média Sn/n. O Teorema Limite Central pode assim também ser enunciadoem relação à média das variáveis aleatórias Xi, em vez da soma, Sn.

Observação: O Teorema Limite Central não indica nada sobre a velocidade de convergência deZn para a distribuição N(0, 1). Essa velocidade de convergência depende da distribuição dasv.a.’s Xi. Na prática, este teorema usa-se muitas vezes quando n ≥ 30 (embora este valor nemsempre garanta uma boa aproximação).

Exemplo 5.2. Num estudo sobre vendas num hipermercado, concluiu-se que a procura diária dearroz (em Kg) é uma v.a. com valor médio 40Kg e desvio-padrão 5Kg. Tendo sido encomendado14.500Kg de arroz para venda venda no próximo ano, qual a probabilidade deste stock cobrir aprocura de arroz nesse período? (Considere-se um ano com 364 dias).

39

Page 46: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

40 CAPÍTULO 5. TEOREMA LIMITE CENTRAL

Resolução: Seja Xi = procura de arroz no dia i, i = 1, 2, . . . , 364 e admitamos que estas v.a.’ssão i.i.d.. Sabemos que:

E (Xi) = 40Kg, V (Xi) = 25Kg2, i = 1, 2, . . . , 364.

A procura de arroz durante um ano será S364 =364∑i=1

Xi e queremos calcular P (S364 ≤ 14.500).

Ignoramos qual a distribuição de S364, mas como se trata de uma soma de um grande número dev.a.’s i.i.d. (364 > 30), então pelo T.L.C.,

S364 − 364× 40√364× 5

= S364 − 14.560√364× 5

a∼ N(0, 1).

Assim,

P (S364 ≤ 14.500) = P

(S364 − 14.560√

364× 5≤ 14.500− 14.560√

364× 5

)≈

≈ P (Z ≤ −0.63) = Φ (−0.63) = 1− Φ (0.63) = 1− 0.7357 = 0.2643.

Conclusão: “É recomendável comprar mais arroz!”

Corolário 5.3. Seja X uma v.a. com distribuição Binomial de parâmetros n e p. Se n ≥ 30 e ptal que np > 5 e n(1− p) > 5, então:

Xa∼ N(np, np(1− p)).

Exemplo 5.4. Considere-se a v.a. X ∼ Bin (100, 0.1). Calculemos P (X = 10) Como n =100 ≥ 30, np = 100× 0.1 = 10 > 5 e n(1− p) = 100× 0.9 = 90,

P (X = 10) = P (X ≤ 10)− P (X ≤ 9) ≈ Φ(10−10

3)− Φ

(9−103)

= Φ(0)− Φ(−0.33) =

= 0.5− 0.3707 = 0.1293.

Nota: O valor exacto é P (X = 10) =(100

10)0.1100.990 = 0.1319.

Corolário 5.5. Seja X uma v.a. com distribuição Poisson de parâmetro λ. Se λ > 5, então:

Xa∼ N(λ, λ).

Exemplo 5.6. Considere X ∼ P (230). Calculemos um valor aproximado de P (X = 241).

P (X = 241) = P (X ≤ 241)− P (X ≤ 240) ≈ P(Z ≤ 241−230√

230

)− P

(Z ≤ 240−230√

230

)=

= Φ(0.73)− Φ(0.66) = 0.7673− 0.7454 = 0.0219

Nota: O valor exacto é P (X = 241) = e−230.230241

241! = 0.0198.

Page 47: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 6

Estimação Pontual

6.1 Alguns conceitos importantes

Definição 6.1 (População). Uma população consiste em todas as possíveis observações de umdado fenómeno.

Definição 6.2 (Amostra). Uma amostra é um subconjunto da população.

Observação: Nos métodos estatísticos, que iremos estudar, a amostra recolhida deve ser repre-sentativa da população. Caso isso não aconteça, podemos retirar conclusões erradas. É assimconveniente escolher os elementos da amostra de forma aleatória, ou seja, trabalhar com umaamostra aleatória.

Definição 6.3 (Amostra aleatória). Vamos admitir que cada valor observado xi é a realizaçãoda variável aleatória Xi, com função de distribuição F . O vector (X1, X2, . . . , Xn) constitui umaamostra aleatória se e só se as n variáveis aleatórias são independentes e têm todas a mesmadistribuição. Os valores que se obtêm por concretização da amostra aleatória são representadospor (x1, x2, . . . , xn).

Definição 6.4 (Estatística). Uma estatística é uma qualquer função da amostra aleatória,(X1, X2, . . . , Xn), que não depende de qualquer parâmetro desconhecido.

Observação: Da definição anterior, conclui-se que uma estatística é uma variável aleatória. Logoqualquer estatística tem função de distribuição. A essa função de distribuição dá-se o nome dedistribuição por amostragem da estatística.

Exemplo 6.5 (Estatística). Dada uma amostra aleatória (X1, X2, . . . , Xn), de dimensão n, sãoestatísticas: A média amostral (X), a variância amostral (S2), o mínimo da amostra, o máximoda amostra, a mediana, os quartis ou a própria amostra.

41

Page 48: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

42 CAPÍTULO 6. ESTIMAÇÃO PONTUAL

Definição 6.6 (Estimador pontual e estimativa pontual). Seja (X1, X2, . . . , Xn) uma amostraaleatória de dimensão n duma população com função de distribuição F (x|θ), com parâmetrodesconhecido θ. A estatística Θ = h(X1, X2, . . . , Xn) é um estimador pontual de θ. Depois daamostra ter sido recolhida, o valor particular de θ = h(x1, x2, . . . , xn), é designado estimativapontual de θ.

Tabela 6.1: Alguns dos parâmetros populacionais que interessam estimar e respectivos estimadorespontuais.

Parâmetro Populacional Estimador PontualMédia populacional Média amostral

µ X = 1n

n∑i=1

Xi

Variância populacional Variância amostral

σ2 S2 = 1n−1

n∑i=1

(Xi −X)2

Desvio padrão populacional Desvio padrão amostral

σ S =√

1n−1

n∑i=1

(Xi −X)2

Proporção populacional Proporção amostralp P = X

n

6.2 Propriedades dos estimadores

Um dos principais objectivos da Estatística é a estimação de parâmetros desconhecidos, comopor exemplo a média da população, a partir de uma amostra. Como muitas vezes temos váriosestimadores para o mesmo parâmetro, qual devemos utilizar? É aconselhável a escolha do es-timador que melhor satisfaça um critério de eficiência. Para definir o critério de eficiência queiremos utilizar, precisamos das seguintes definições:

Definição 6.7 (Estimador centrado e assintoticamente centrado). Um estimador pontual,Θ, diz-se centrado para o parâmetro θ se e só se

E(Θ) = θ.

Caso E(Θ) 6= θ, o estimador diz-se enviesado. A diferença b(Θ) = E(Θ) − θ corresponde aovalor do enviesamento ou viés de Θ. Se E(Θ) 6= θ, e limn→∞E(Θ) = θ, diz-se que o estimadoré assintoticamente centrado.

Page 49: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6.2. PROPRIEDADES DOS ESTIMADORES 43

Definição 6.8 (Erro Padrão de um estimador). Dado um estimador pontual Θ, centrado,define-se o seu erro padrão, SEΘ, por

SEΘ =√V (Θ).

Caso o erro padrão envolva parâmetros desconhecidos, que possam ser estimados a partir dosvalores da amostra, a substituição destes valores estimados no erro padrão produz o chamadoerro padrão estimado, denotado por SEΘ.

Definição 6.9 (Eficiência). Sejam Θ1 e Θ2 dois estimador pontuais, centrados para θ. Diz-seque Θ1 é mais eficiente que Θ2, se e só se, SEΘ1

≤ SEΘ2.

Exemplo 6.10 (Cálculo do erro padrão do estimador da média da população - µ). Seja(X1, X2, . . . , Xn) uma amostra aleatória de uma população com valor médio µ e variância σ2.Como,

E(X) = E( 1n

n∑i=1

Xi

)= 1n

n∑i=1

E(Xi) = 1n

n∑i=1

µ = 1nnµ = µ,

concluímos que X é estimador centrado do valor médio da população, µ. Temos ainda,

V (X) = V

(1n

n∑i=1

Xi

)= 1n2V

(n∑i=1

Xi

)= (Xi v.a.

′s independentes)

= 1n2

n∑i=1

V (Xi) = 1n2

n∑i=1

σ2 = 1n2nσ

2 = σ2

n,

ou seja, SEX =√V (X) = σ√

n.

O próximo resultado é importante porque indica-nos o limite inferior da variância de umestimador centrado. Um estimador com variância igual ao valor mínimo é mais eficiente do quequalquer outro estimador centrado.

Definição 6.11 (Limite inferior de Cramér-Rao). Seja (X1, X2, . . . , Xn) uma amostra aleatóriaretirada de uma população com função densidade f(x|θ) (ou função de probabilidade P (X|θ)),satisfazendo as condições de regularidade (f duas vezes diferenciável e com suporte independentede θ). Dado um estimador pontual Θ, centrado para θ,

V (Θ) ≥ 1nI(θ) ,

com I(θ) = −E(∂2 ln f(X|θ)

∂θ2

).

Page 50: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

44 CAPÍTULO 6. ESTIMAÇÃO PONTUAL

Exemplo 6.12 (Limite inferior de Cramér-Rao do modelo Poisson). Seja (X1, X2, . . . , Xn)uma amostra aleatória retirada de uma população com distribuição Poisson de parâmetro λ. Comoln[P (X|λ)] = −λ+X lnλ− ln(X!), resulta que

∂ lnP (X|λ)∂λ

= −1 + X

λ; e ∂2 lnP (X|λ)

∂λ2 = − 1λ2 .

Logo,

I(λ) = −E(∂2 lnP (X|λ)

∂λ2

)= 1λ2 .

Conclui-se assim que, V (λ) ≥ 1nI(λ) = λ

n , para qualquer estimador λ, centrado para λ.

Definição 6.13 (Estimador consistente). Um estimador pontual Θ, centrado para θ, diz-seconsistente se

limn→∞

V (Θ) = 0.

Exemplo 6.14 (Consistência da Média amostral). Seja (X1, X2, . . . , Xn) uma amostra aleatóriade uma população com valor médio µ e variância σ2. Sabemos que X é estimador centrado dovalor médio da população, µ e V (X) = σ2

n . Como ,

limn→∞

V (Θ) = σ2

n= 0,

concluímos que X é consistente para µ.

6.3 Método dos Momentos

Definição 6.15 (Método dos Momentos). Seja (X1, X2, . . . , Xn) uma amostra aleatória, reti-rada de uma população cuja distribuição depende de k parâmetros desconhecidos, θ1, θ2, . . . , θk.O método dos momentos consiste em utilizar os momentos da amostra para estimar os respectivosmomentos da população, e consequentemente os parâmetros desconhecidos. Os estimadores demomentos, θ1, θ2, . . . , θk, são os que resultam da resolução do sistema de k equações a k incóg-nitas,

m1 = M1

m2 = M2

m3 = M3...

mk = Mk

onde

mj = E(Xj) (m1 = E(X))

Mj = 1n

n∑i=1

Xji (M1 = X)

Observação: Caso alguma das k equações não contenha qualquer informação sobre os parâmet-ros, essa equação deve ser substituída pela equação µj = Mj , com j > k.

Page 51: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6.3. MÉTODO DOS MOMENTOS 45

Inconvenientes:

1. Por vezes não existe uma escolha unívoca;

2. Por vezes a solução é inadmissível;

Exemplo 6.16 (Estimador dos momentos do parâmetro λ, do modelo Poisson). Considereuma população com distribuição P (λ). O estimador dos momentos de λ é a solução da equação:

E(X) = X ⇔ λ = X.

O estimador dos momentos de λ é, λ = X.

Exemplo 6.17 (Estimador dos momentos de σ2 do modelo N(0, σ2)). Seja (X1, X2, . . . , Xn)uma amostra aleatória, retirada de uma população com distribuição Normal de valor médio 0(conhecido) e variância σ2 (desconhecida). A solução da primeira equação é:

E(X) = X ⇔ 0 = X.

Contudo, como esta primeira equação não contém o parâmetro que interessa estimar, devemosconsiderar a segunda equação:

E(X2) = M2 ⇔ E(X2) = V (X) + E2(X) = M2 ⇔ σ2 = M2.

O estimador dos momentos de σ2 é, σ2 =n∑i=1

X2in .

Exemplo 6.18 (Estimadores dos momentos dos parâmetro a e b, do modelo Uniforme).Considere uma população com distribuição U(a, b). Os estimadores dos momentos de a e b sãoos que resultam da resolução do sistema de equações:

E(X) = X

m2 = M2⇔

a+b

2 = X(b−a)2

12 +(a+b

2

)2= M2

a = X −√

3(M2 −X2)

b = X +√

3(M2 −X2)

,

ou seja os estimadores dos momentos de a e b são,

a = X −√

3(M2 −X2) e b = X +

√3(M2 −X

2);

Page 52: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

46 CAPÍTULO 6. ESTIMAÇÃO PONTUAL

6.4 Método da máxima verosimilhança

Este método é um pouco mais complicado que o anterior. Contudo, os estimadores obtidos poreste método têm melhores propriedades teóricas. O método é apresentado apenas para populaçõescuja distribuição tem apenas um parâmetro desconhecido.

Seja (X1, X2, . . . , Xn) uma amostra aleatória, isto é, um conjunto de n v.a.’s i.i.d. com funçãodensidade comum f(x|θ) onde θ é um parâmetro desconhecido. A função densidade conjunta daamostra aleatória é

f(x1, x2, . . . , xn|θ) =n∏i=1

f(xi|θ).

Observação: Caso a população tenha distribuição discreta, devemos substituir a função densi-dade pela função de probabilidade.

Definição 6.19 (Função de verosimilhança e log-verosimilhança). Depois da amostra serobservada, os valores x1, x2, . . . , xn são conhecidos e podemos considerar que a função anteriordepende apenas de θ. Esta função é designada função de verosimilhança e costuma representar-sepor:

L(θ) = L(θ|x1, x2, . . . , xn) =n∏i=1

f(xi|θ).

É geralmente mais fácil trabalhar com a função log-verosimilhança, isto é, com o logaritmo dafunção verosimilhança:

l(θ) = lnL(θ) =n∑i=1

ln f(xi|θ).

Exemplo 6.20 (Função log-verosimilhança do modelo de Poisson(λ)). Considere uma popu-lação com distribuição Poisson com parâmetro desconhecido λ. Então, observada a amostra(x1, x2, . . . , xn), e admitindo que xi ∈ N0, i = 1, 2 . . . , n, a função log-verosimilhança é:

l(λ) = lnL(λ) =n∑i=1

ln(e−λ

λxi

xi!)

= −nλ+(

n∑i=1

xi

)lnλ−

n∑i=1

ln(xi!).

Definição 6.21 (Método da máxima verosimilhança:). O estimador de máxima verosimilhançade θ é obtido por maximização da função verosimilhança, ou equivalentemente da função log-verosimilhança, com respeito a θ. O estimador de máxima verosimilhança é denotado por θMLE ,mas para simplificação da notação representa-se apenas por θ. Então:

maxθ

l(θ) = l(θ)

Page 53: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6.5. DISTRIBUIÇÕES POR AMOSTRAGEM 47

Se L(θ), ou equivalentemente l(θ), é regular (duas vezes diferenciável e com suporte inde-pendente de θ) o máximo é obtido por derivação, isto é, é obtido através da resolução de:

∂ l(θ)∂θ

= 0, e ∂2l(θ)∂θ2 < 0.

Exemplo 6.22 (Estimador de máxima verosimilhança do parâmetro do modelo de Poisson).Considere a função log-verosimilhança do exemplo 6.20. Como l(λ) é regular, o estimador demáxima verosimilhança é a solução da equação

∂l(λ)∂λ

= 0 ⇔ −n+ 1λ

n∑i=1

xi = 0 ⇔ λ =n∑i=1

xi/n,

isto é, o estimador de máxima verosimilhança de λ é λ = X.

Propriedades dos estimadores de máxima verosimilhança

1. Os estimadores de máxima verosimilhança são assintoticamente centrados, isto é,limn→∞

E(θ) = θ;

2. Os estimadores de máxima verosimilhança são consistentes;

3. Em condições gerais de regularidade, o estimador de máxima verosimilhança de θtem distribuição assintoticamente normal de valor médio θ e variância 1

nI(θ) ;

4. A propriedade da invariância é válida para qualquer estimador de máxima verosim-ilhança, isto é, se θ é um estimador de máxima verosimilhança de θ e se β = g(θ)é uma função biunívoca de θ, então o estimador de máxima verosimilhança de βé β = g(θ);

6.5 Distribuições por Amostragem

Nesta secção vamos estudar a distribuição por amostragem dos estimadores pontuais da Tabela6.1.

6.5.1 Distribuição por amostragem da média amostral, X

Suponhamos que foi seleccionada uma amostra aleatória de dimensão n, (X1, X2, . . . , Xn), deuma população de média µ e variância σ2. A distribuição por amostragem de X pode ser obtidasob diversas condições:

Page 54: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

48 CAPÍTULO 6. ESTIMAÇÃO PONTUAL

1. Suponhamos a população tem distribuição Normal e que o valor da variância da pop-ulação é conhecido. Consequentemente, tendo em conta as propriedades da distribuiçãonormal, X ∼ N(µ, σ2/n), ou seja,

Z = X − µσ/√n∼ N(0, 1). (6.1)

2. Suponhamos a população tem distribuição Normal e que o valor da variância dapopulação é desconhecido. Vamos aqui usar S2 para estimar σ2. Nestas condições,

Z = X − µσ/√n∼ N(0, 1) e (n− 1)S2

σ2 ∼ χ2n−1.

Como a população tem distribuição Normal, podemos assegurar que Z e S2 são v.a. inde-pendentes (demonstração fora do âmbito desta disciplina). Pelo Teorema 4.44,

T = X − µS/√n

=X−µσ/√n√

(n−1)S2/σ2

(n−1)

∼ tn−1. (6.2)

3. Suponhamos que a população tem distribuição não-Normal e que o valor da variânciada população é conhecida, mas a dimensão da amostra, n, é superior ou igual a 30.Neste caso, a distribuição por amostragem da média amostral pode ser aproximada peladistribuição Normal reduzida, justificado através do Teorema Limite Central:

Z = X − µσ/√n

a∼ N(0, 1). (6.3)

4. Finalmente, consideremos que seleccionámos uma amostra aleatória de uma populaçãocom distribuição não-Normal, com variância da população desconhecida e que temosum tamanho de amostra n superior ou igual a 30. Tal como no caso anterior,

Z = X − µσ/√n

a∼ N(0, 1).

Como σ2 não é conhecido, mas a dimensão da amostra é grande então S ' σ, e podemossubstituir, na expressão anterior, σ por S (desvio padrão), isto é,

Z = X − µS/√n

a∼ N(0, 1). (6.4)

Observação: Os resultados das equações (6.3) e (6.4) são válidos para qualquerpopulação. Contudo, o modelo Normal é excluído porque conhecemos a distribuiçãoexacta da média amostral: equações (6.1) e (6.2).

Page 55: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

6.5. DISTRIBUIÇÕES POR AMOSTRAGEM 49

6.5.2 Distribuição por amostragem da diferença de médias amostrais, X1 −X2

Aqui consideramos apenas um de muitos casos possíveis. Supondo que foram seleccionadas, deforma independente, duas amostras aleatórias de dimensões n1 e n2, respectivamente, de duaspopulações Normais independentes com variâncias conhecidas dadas, respectivamente, por σ2

1 eσ2

2. Sejam X1 e X2 as médias das duas amostras aleatórias. Neste contexto, a distribuição poramostragem de X1 − X2 é ainda Normal, por ser a combinação linear de variáveis aleatóriasnormais independentes:

Z = (X1 −X2)− (µ1 − µ2)√σ2

1n1

+ σ22n2

∼ N(0, 1).

6.5.3 Distribuição por amostragem da variância amostral, S2

Suponhamos que foi seleccionada uma amostra aleatória de dimensão n, (X1, X2, . . . , Xn), deuma população Normal de média µ, desconhecida, e variância σ2. Neste contexto, a dis-tribuição por amostragem de S2 = 1

n−1∑ni=1

(Xi −X

)2é dada por:

X2 = (n− 1)S2

σ2 ∼ χ2n−1.

6.5.4 Distribuição por amostragem da proporção, P

Admita que os elementos de determinada população possuem uma dada característica, com umacerta probabilidade p desconhecida, independentemente uns dos outros. Suponhamos que seselecciona uma amostra aleatória de n elementos desta população. Se X denotar o númerode elementos da amostra aleatória que possuem a referida característica, sabemos que X ∼Bin(n, p). Se o tamanho da amostra for suficientemente grande, o Teorema Limite Centraljustifica que:

Z = X − np√np(1− p)

a∼ N(0, 1).

Como p pode ser estimado pontualmente pela proporção de elementos da amostra possuem areferida característica, P = X

n , a distribuição por amostragem aproximada de P é

Z = P − p√p(1− p)/n

a∼ N(0, 1).

Page 56: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

50 CAPÍTULO 6. ESTIMAÇÃO PONTUAL

Tabela 6.2: Distribuições por amostragem

Estimador População Distribuição

X

Normal de média µσ2 conhecida Z = X−µ

σ/√n∼ N(0, 1)

σ2 desconhecida T = X−µS/√n∼ tn−1

Pop. não-Normal σ2 conhecida Z = X−µσ/√n

a∼ N(0, 1)

de média µ e n≥30 σ2 desconhecida Z = X−µS/√n

a∼ N(0, 1)

X1−X2

2 Populações independentes,Z = (X1−X2)−(µ1−µ2)√

σ21n1

+σ2

2n2

N(µ1, σ21) e N(µ2, σ

22),

com σ21 e σ2

2 conhecidas ∼ N(0, 1)

P Qualquer população e n grande Z= P−p√p(1−p)/n

a∼ N(0, 1)

S2 Normal de média µ desconhecida X2 = (n−1)S2

σ2 ∼ χ2n−1

Page 57: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 7

Estimação por Intervalo de Confiança

A indicação de um único valor como estimativa, de um parâmetro θ, não nos dá informaçãosobre a precisão desse valor. Por isso, em muitas situações, interessa-nos dar uma medida desseerro. Assim, em vez de se indicar a sua estimativa pontual, é preferível indicar que o parâmetro aestimar estará provavelmente no intervalo ]t1, t2[, onde os extremos t1 e t2 dependem do valorda estimativa pontual desse parâmetro.

Definição 7.1 (Intervalo Aleatório). Seja (X1, X2, . . . , Xn) uma amostra aleatória de umapopulação com função de distribuição F . Considere as estatísticas

T1(X1, X2, . . . , Xn) e T2 = (X1, X2, . . . , Xn),

tais que P (T1 < θ < T2) = 1 − α, onde α ∈]0, 1[ não depende de θ. Então ]T1, T2[ é umintervalo aleatório para θ.

Definição 7.2 (Intervalo de Confiança). Seja (x1, x2, . . . , xn) uma realização da amostraaleatória e sejam

t1 = T1(x1, x2, . . . , xn) e t2 = T2(x1, x2, . . . , xn),

os valores das estatísticas T1 e T2 (introduzidas na Definição 7.1). Ao intervalo ]t1, t2[ chamamosintervalo de confiança (1−α)× 100% para θ. O valor (1−α) representa o nível (ou coeficiente)de confiança do intervalo e α o nível de significância. Normalmente são usados níveis de confiançasuperiores a 90%.

Observações:

• Diferentes amostras produzirão eventuais valores distintos θ e consequentemente diferentesextremos t1 e t2.

• Os valores t1 e t2 são denominados limites de confiança inferior e superior, respectivamente.

51

Page 58: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

52 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

• A amplitude de um intervalo de confiança, t2 − t1, é uma importante medida da qualidadeda informação fornecida através da amostra.

Definição 7.3 (Variável Pivot ou Fulcral). Seja (X1, X2, . . . , Xn) uma amostra aleatória, reti-rada de uma população com função de distribuição F de parâmetro θ. A função T (X1, X2, . . . , Xn)é uma variável pivot, ou fulcral, se a sua distribuição for independente de θ.

Observação: As variáveis aleatórias Z, T e X2, apresentadas na Tabela 6.2, são variáveis Pivot.

Definição 7.4 (Método de determinação de um Intervalo de Confiança a partir de umavariável Pivot). Seja (X1, X2, . . . , Xn) uma amostra aleatória, retirada de uma população comfunção de distribuição F , com parâmetro θ, e seja T uma variável Pivot.

• Dado o nível de confiança (1− α), é necessário determinar os valores c1 e c2 tais que

P (c1 < T < c2) = 1− α.

• Caso se verifique,

c1 < T < c2 ⇔ T1(X1, X2, . . . , Xn) < θ < T2(X1, X2, . . . , Xn),

então também se pode garantir que

P (T1(X1, X2, . . . , Xn) < θ < T2(X1, X2, . . . , Xn)) = 1− α.

Logo, o intervalo aleatório para θ é ]T1(X1, X2, . . . , Xn), T2(X1, X2, . . . , Xn)[ = ]T1, T2[.

• Observada a amostra (x1, x2, . . . , xn), o intervalo de confiança para θ é dado por ]t1, t2[,onde t1 = T1(x1, x2, . . . , xn) e t2 = T2(x1, x2, . . . , xn).

7.1 Intervalo de Confiança para a média da população, µ

7.1.1 População Normal com variância conhecida

Suponhamos que seleccionámos uma amostra aleatória (X1, X2, . . . , Xn) de uma população Nor-mal, de variância σ2 conhecida, com a qual pretendemos construir um intervalo de confiança(1− α)× 100% para µ.

• Escolha da estatística pivot:

Z = X − µσ/√n∼ N(0, 1);

Page 59: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

7.1. INTERVALO DE CONFIANÇA PARA A MÉDIA DA POPULAÇÃO, µ 53

• Determinação de c1 e c2: Seja za um valor tal que P (Z > za) = a. Escolhemos c1 =z1−α/2 = −zα/2 e c2 = zα/2, como indicado na Figura 7.1. Esta escolha não é casual.Quando c1 = −c2 obtemos o intervalo de menor amplitude. O valor zα/2 é obtido atravésda resolução da equação:

P(−zα/2 < Z < zα/2

)= 1− α⇔ P (Z < zα/2)− P (Z ≤ −zα/2) = 1− α⇔

Φ(zα/2)− Φ(−zα/2) = 1− α⇔ Φ(zα/2) = 1− α/2⇔ zα/2 = Φ−1 (1− α/2)(7.1)

0

0.0

0.1

0.2

0.3

0.4

1 −− αα

−− zαα 2 zαα 2

Figura 7.1: Intervalo aleatório da variável pivot Z.

• Determinação dos extremos do intervalo aleatório:

− zα/2 <X − µσ/√n< zα/2 ⇔ −zα/2

σ√n< X − µ < zα/2

σ√n

⇔− zα/2σ√n−X < −µ < zα/2

σ√n−X ⇔ X − zα/2

σ√n< µ < X + zα/2

σ√n

Logo,

P(− zα/2 < Z < zα/2

)= P

(X − zα/2

σ√n< µ < X + zα/2

σ√n

)= 1− α.

• Assim, tendo uma amostra concreta (x1, x2, . . . , xn), o intervalo de confiança (1−α)×100para µ é:

IC(1−α)×100%(µ) ≡]x− zα/2

σ√n

; x+ zα/2σ√n

[.

Exemplo 7.5. Considere a população do peso das formigas Solenopsis, medido em décimas degrama, que sabemos ter distribuição Normal com média µ e variância σ2 = 22, X ∼ N(µ, 22).Desta população observámos a amostra de 4 pesos, (8, 13, 9, 8.5), a qual usámos para obter uma

Page 60: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

54 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

estimativa de µ, x = 9.625dg. Queremos agora determinar limites inferior e superior de umintervalo de confiança a 95% para µ.

Resolução: Seja X a média amostral da amostra de dimensão 4, (X1, X2, X3, X4). Como apopulação tem distribuição Normal, e a variância é conhecida, vamos considerar a estatística pivotZ = X−µ

σ/√n, cuja distribuição por amostragem foi obtida no capítulo anterior:

Z = X − µσ/√n

= X − µ2/√

4∼ N(0, 1).

Seja z0.025 um valor tal que P (−z0.025 < Z < z0.025) = 0.95, conforme a Figura 7.2 ilustra. Para

0

0.0

0.1

0.2

0.3

0.4

0.95

−− z0.025 z0.025

Figura 7.2: Intervalo aleatório da variável pivot Z.

determinar o valor de z0.025, é necessário efectuar os seguintes cálculos:

P (−z0.025 < Z < z0.025) = 0.95 ⇔ P (Z < z0.025)− P (Z ≤ −z0.025) = 0.95⇔

Φ(z0.025)− Φ(−z0.025) = 0.95 ⇔ Φ(z0.025) = 0.975 ⇔ z0.025 = Φ−1 (0.975) ≈ 1.96

Assim,

P (−1.96 < Z < 1.96) = 0.95 ⇔ P

(−1.96 < X − µ

2/√

4< 1.96

)= 0.95⇔

P(−1.96× 1 < X − µ < 1.96× 1

)= 0.95⇔

P(−X − 1.96 < −µ < −X + 1.96

)= 0.95⇔

P(X − 1.96 < µ < X + 1.96

)= 0.95

Logo, o intervalo aleatório, para µ, com 95% de confiança é]X − 1.96;X + 1.96

[. Concretizando

este intervalo para a amostra observada, (x1, x2, x3, x4) = (8, 13, 9, 8.5), obtemos o intervalo deconfiança a 95% para µ:

IC95%(µ) = ]x− 1.96 ; x+ 1.96[ = ]9.625− 1.96 ; 9.625 + 1.96[ =]7.665 ; 11.585[.

Page 61: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

7.1. INTERVALO DE CONFIANÇA PARA A MÉDIA DA POPULAÇÃO, µ 55

Observação: Vejamos agora o que sucede aumentando a confiança do intervalo para 99%. ComoZ0.005 ≈ 2.58,

P (−Z0.005 < Z < Z0.005) = 0.99⇔ P(−2.58 < X−µ

2/√

4 < 2.58)

= 0.99⇔

P(X − 2.58× 2/

√4 < µ < X + 2.58× 2/

√4)

= 0.99

Assim, IC99%(µ) = ]x− 2.58;x+ 2.58[=]9.625− 2.58; 9.625 + 2.58 =]7.045; 12.205[.

Concluímos que quando aumentamos o nível de confiança, também aumentamos a sua amplitude!

7.1.2 População Normal com variância desconhecida

Seja (X1, X2, . . . , Xn) uma amostra aleatória de uma população Normal(µ, σ2), de variância σ2

desconhecida, com a qual pretendemos construir um intervalo de confiança (1− α)× 100% paraµ:

• Escolha da estatística pivot:

T = X − µS/√n∼ tn−1.

• Para um nível de confiança de (1−α)×100%, escolhemos de c1 = −tn−1,α/2 e c2 = tn−1,α/2,como indicado na Figura 7.3.

0

0.0

1 −− αα

−− tn−−1::αα 2 tn−−1::αα 2

Figura 7.3: Intervalo aleatório da variável pivot T .

Page 62: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

56 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

• Determinação dos extremos do intervalo aleatório:

− tn−1,α/2 <X − µS/√n< tn−1,α/2 ⇔

⇔ − tn−1,α/2S√n< X − µ < tn−1,α/2

S√n⇔

⇔ − tn−1,α/2S√n−X < −µ < tn−1,α/2

S√n−X ⇔

⇔ X − tn−1,α/2S√n< µ < X + tn−1,α/2

S√n

• Assim, obtemos o seguinte intervalo de confiança (1− α)× 100% para µ:

IC(1−α)×100%(µ) ≡]x− tn−1,α/2

s√n

; x+ tn−1,α/2s√n

[.

7.1.3 População não-Normal com variância conhecida e n > 30

Supondo que seleccionámos uma amostra aleatória de dimensão n > 30, (X1, X2, . . . , Xn), deuma população não-normal com média µ e variância conhecida σ2, e com a qual pretendemosconstruir um intervalo de confiança (1− α)× 100% para µ:

• Escolha da estatística pivot: Z = X−µσ/√n

a∼ N(0, 1).

• Determinação de c1 e c2: De modo análogo, ao efectuado na página 53, escolhemos:

c1 = −zα/2 e c2 = zα/2, com zα/2 = Φ−1(1− α/2).

• Repetido as contas efectuadas na sub-secção 7.1.1, obtemos:

P(− zα/2 < Z < zα/2

)= P

(X − zα/2

σ√n< µ < X + zα/2

σ√n

)= 1− α.

• Assim, observada a amostra (x1, x2, . . . , xn), obtemos o seguinte intervalo de confiança(1− α)× 100% para µ:

IC(1−α)×100%(µ) ≡]x− zα/2

σ√n

; x+ zα/2σ√n

[.

7.1.4 População não-Normal com variância desconhecida e n > 30

Admitindo que seleccionámos uma amostra aleatória de dimensão n > 30, (X1, X2, . . . , Xn), deuma população com distribuição não-normal, com média µ e variância σ2, ambos desconhecidos.Pretendemos um intervalo de confiança (1−α)×100% para µ. Como usamos a estatística pivot:

Z = X − µS/√n

a∼ N(0, 1),

Page 63: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

7.1. INTERVALO DE CONFIANÇA PARA A MÉDIA DA POPULAÇÃO, µ 57

a determinação do intervalo de confiança para µ é feita de forma análoga ao caso anterior (subs-tituindo σ por S).Obtemos assim, o seguinte intervalo de confiança (aproximado) (1− α)× 100% para µ:

IC(1−α)×100%(µ) ≡]x− zα/2

s√n

; x+ zα/2s√n

[.

Exemplo 7.6 (Exame de P.E. D - 2005/06). Queremos estudar há quanto tempo residem nassuas moradas actuais as pessoas de certa cidade na província. Uma amostra aleatória de 41famílias revelou uma média de 35 meses de residência e um desvio padrão de 6.3 meses.

a) Qual a sua melhor estimativa do tempo médio de residência da população desta cidade?

b) Deduza um intervalo de confiança a 98% para o verdadeiro tempo médio de residência.Justifique o seu procedimento.

Resolução:

a) Para estimar a média da população vamos usar o estimador média da amostra, X. Trata-sedo estimador da média que possui duas propriedades importantes: é centrado para µ econsistente. Neste exercício, a estimativa do tempo médio de residência da população éx = 35 meses.

b) Para deduzir o intervalo de confiança, vamos admitir que (X1, X2 . . . , Xn) é uma amostraaleatória com n > 30. Vamos considerar a estatística pivot Z = X−µ

S/√n, cuja distribuição foi

deduzida no capítulo anterior, isto é,

Z = X − µS/√n

a∼ N(0, 1).

0

0.0

0.1

0.2

0.3

0.4

0.98

−− 2.32 2.32

Figura 7.4: Intervalo aleatório da variável pivot Z.

Page 64: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

58 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

Como P (−z0.01 < Z < z0.01) = 0.98, onde z0.01 ≈ 2.32, como indicado na Figura 7.4, e

− z0.01 < Z < z0.01 ⇔ 2.32 < X−µS/√n< 2.32 ⇔ 2.32 S√

n< X − µ < 2.32 S√

n⇔

⇔X − 2.32 S√n< µ < X + 2.32 S√

n,

resulta que

P(X − 2.32 S√

n< µ < X + 2.32 S√

n

)= 0.98.

Logo o intervalo com 98% de confiança para o valor médio da população é

IC98%(µ) ≡]x− 2.32 s√

n; x+ 2.32 s√

n

[.

Como da amostra recolhida resultou x = 35 e s = 6.3, o intervalo com 98% de confiançapara o valor médio da população é

IC98%(µ) ≡]35− 2.32 6.3√

41; 35 + 2.32 6.3√

41

[= ]32.72 , 37.28[.

7.2 Intervalo de Confiança para a variância populacional, σ2, epara o desvio padrão populacional, σ

Nesta secção, vamos deduzir um intervalo de confiança (1 − α) × 100% para a variância dapopulação. Consideramos o caso em que temos uma amostra aleatória (X1, X2, . . . , Xn) de umapopulação com distribuição Normal(µ, σ2), com valor médio µ desconhecido.

• Vamos usar a estatística pivot cuja distribuição por amostragem foi apresentada no capítuloanterior, isto é, a estatística pivot: X2 = (n−1)S2

σ2 ∼ χ2n−1;

• Para um nível de confiança de (1−α)× 100%, escolha de c1 e c2: A escolha dos extremosdo intervalo aleatório, c1 = χ2

n−1,1−α/2 e c2 = χ2n−1,α/2, é feita de acordo com a Figura

7.5.

Para determinar estes valores é necessário efectuar as operações:

P (X2 < c1) = α

2 ⇔ c1 = F−1χ2n−1

(α2),

P (X2 > c2) = α

2 ⇔ P (X2 ≤ c2) = 1− α

2 ⇔ c2 = F−1χ2n−1

(1− α

2

),

onde F−1χ2n−1

(α2)e F−1

χ2n−1

(1− α

2)podem ser obtidos numa tabela de quantis da distribuição

Qui Quadrado.

Page 65: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

7.2. INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL, σ2, E PARA O DESVIOPADRÃO POPULACIONAL, σ 59

0

0.0

1 −− αα

αα 2

αα 2

χχn−−1::1−−αα 22 χχn−−1::αα 2

2

Figura 7.5: Intervalo aleatório da variável pivot X2.

• Determinação dos extremos do intervalo de confiança: Como,

χ2n−1,1−α/2 < X2 < χ2

n−1,α/2 ⇔χ2n−1,1−α/2

(n− 1)S2 <1σ2 <

χ2n−1,α/2

(n− 1)S2 ⇔

(n− 1)S2

χ2n−1,α/2

< σ2 <(n− 1)S2

χ2n−1,1−α/2

,

concluímos que

P(χ2n−1,1−α/2 < X2 < χ2

n−1,α/2

)= P

((n− 1)S2

χ2n−1,α/2

< σ2 <(n− 1)S2

χ2n−1,1−α/2

)= 1− α.

• Assim, observada a amostra (x1, x2, . . . , xn), e calculada a respectiva variância amostral,s2, o intervalo de confiança para σ2 é:

IC(1−α)×100%(σ2) =]

(n− 1)s2

χ2n−1,α/2

; (n− 1)s2

χ2n−1,1−α/2

[.

Observação: Como

P((n− 1)S2

χ2n−1,α/2

< σ2 <(n− 1)S2

χ2n−1,1−α/2

)= P

(√√√√(n− 1)S2

χ2n−1,α/2

< σ <

√√√√ (n− 1)S2

χ2n−1,1−α/2

)= 1− α.

podemos assim apresentar o seguinte intervalo de confiança para σ:

IC(1−α)×100%(σ) ≡

√√√√(n− 1)s2

χ2n−1,α/2

;

√√√√ (n− 1)s2

χ2n−1,1−α/2

.

Page 66: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

60 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

7.3 Intervalo de Confiança para proporção populacional, p

Vamos deduzir nesta secção um intervalo de confiança (1 − α) × 100% para a proporção pop-ulacional p. Consideramos a situação em que estamos interessados em estimar a proporção doselementos que, na população, possuem determinada característica, através da correspondente pro-porção amostral P , referente a uma amostra de dimensão suficientemente grande. Podemos assimusar a seguinte estatística pivot, cuja distribuição por amostragem foi considerada no capítuloanterior:

• Escolha da estatística pivot:

Z = P − p√p(1− p)/n

a∼ N(0, 1);

• Para um nível de confiança de (1 − α) × 100%, escolhemos c1 = −zα/2 e c2 = zα/2 taisque P (−zα/2 < Z < zα/2) = 1 − α. De acordo com os cálculos apresentados na página53, z1−α/2 = Φ−1(1− α/2).

• Determinação dos extremos do intervalo aleatório:

−zα/2 < Z < zα/2 ⇔ −zα/2 <P − p√p(1− p)/n

< zα/2 (7.2)

A resolução das inequações anteriores, em ordem a p, torna-se muito mais simples sesubstituirmos

√p(1− p)/n, pela sua estimativa,

√P (1− P )/n. Se a dimensão da amostra

for elevada esta substituição não deverá afectar muito a precisão do intervalo. Assim,efectuando a substituição,

− zα/2 < P−p√P (1−P )/n

< zα/2 ⇔

− zα/2√P (1− P )/n < P − p < zα/2

√P (1− P )/n ⇔

− zα/2√P (1− P )/n− P < −p < zα/2

√P (1− P )/n− P ⇔

P − zα/2√P (1− P )/n < p < P + zα/2

√P (1− P )/n

Então,

P

(−zα/2 <

P − p√p(1− p)/n

< zα/2

)'

P

(P − zα/2

√P (1− P )/n < p < P + zα/2

√P (1− P )/n

)' 1− α

• Assim, observada a amostra e calculada a respectiva proporção p, obtemos o seguinteintervalo de confiança aproximado:

IC(1−α)×100%(p) =]p− zα/2

√p(1− p)/n ; p+ zα/2

√p(1− p)/n

[.

Page 67: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

7.3. INTERVALO DE CONFIANÇA PARA PROPORÇÃO POPULACIONAL, P 61

Exemplo 7.7. Num inquérito destinado a estimar a proporção p da população que tem TV porcabo, foram inquiridas 200 pessoas, das quais 78 afirmaram ter este serviço. Temos a estimativapontual da proporção da população com TV por cabo p = 0.39. Como n = 200 > 30 ez0.05 = 1.96, o intervalo de 95% de confiança para a proporção p é:]

0.39− 1.96√

0.39(1− 0.39)/200 ; 0.39 + 1.96√

0.39(1− 0.39)/200[

=]0.322 , 0.458[.

Observação: Tal como já foi referido, também é possível resolver as inequações em (7.2) em or-dem a p sem a substituição de

√p(1− p)/n, pela sua estimativa,

√P (1− P )/n. Esta resolução,

embora tenha muito mais cálculos, conduz-nos à inequação:

(1 +

z2α/2n

)p2 −

(2P +

z2α/2n

)p+ P 2 < 0,

Os extremos Inferior e superior do intervalo de confiança são, respectivamente:

P + z2α/2/n− zα/2

√P (1− P )/n+ z2

α/2/(4n2)1 + z2

α/2/n,

P + z2α/2/n+ zα/2

√P (1− P )/n+ z2

α/2/(4n2)1 + z2

α/2/n.

Como ilustração, apresentamos o intervalo de confiança a 95% para a a proporção p, do Exemplo7.7: IC95%(p) =]0.325 , 0.459[.

Page 68: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

62 CAPÍTULO 7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA

Page 69: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 8

Teste de Hipóteses

8.1 Introdução

Vamos começar por introduzir alguns conceitos importantes e alguma notação.

Definição 8.1 (Hipótese Estatística). Uma hipótese estatística é uma conjectura acerca dadistribuição de uma ou mais variáveis aleatórias. Para cada hipótese que se faça, designada porhipótese nula e denotada por H0, há sempre outra hipótese, designada por hipótese alternativae denotada por H1. Se a hipótese estatística H0 especifica completamente a distribuição échamada de hipótese simples. Caso contrário é chamada de hipótese composta.

Uma hipótese estatística pode ser, ou não ser, verdadeira. A verdade ou falsidade nunca podeser confirmada, a menos que observássemos toda a população, o que nalguns casos é impraticável(quando a população é muito grande) ou até mesmo impossível (no caso de populações infinitas,ou quando característica em estudo leva à destruição dos elementos observados).

Exemplo 8.2 (Hipótese Estatística). Seja (X1, X2, . . . , Xn) uma amostra aleatória da popu-lação dos pesos das formigas Solenopsis anteriormente considerada. A hipótese estatística de queo peso médio desta população toma o valor 8dg denota-se por:

H0 : µ = 8 versus H1 : µ 6= 8 (Hipótese simples)

É usual abreviar a palavra “versus” para “vs”:

H0 : µ = 8 vs H1 : µ 6= 8

A hipótese estatística de que o peso médio desta população é menor ou igual a 8dg denota-sepor:

H0 : µ ≤ 8 vs H1 : µ > 8 (Hipótese composta).

63

Page 70: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

64 CAPÍTULO 8. TESTE DE HIPÓTESES

Ao testarmos uma hipótese nula contra uma hipótese alternativa, a nossa atitude deverá seradmitir H0 como verdadeira até que os dados fornecidos pela amostra “testemunhem” fortementecontra ela; nesse caso, H0 deverá ser rejeitada a favor de H1.

Definição 8.3 (Teste de Hipóteses). Um teste de hipóteses é uma regra que nos permitedecidir se devemos, ou não, rejeitar H0. Esta regra é baseada no valor que a estatística de testeW assume. Assim se,

• W (x1, x2, . . . , xn) ∈ R, rejeita-se H0 (e aceita-se H1 como verdadeira);

• W (x1, x2, . . . , xn) /∈ R, não se rejeita H0.

O conjunto R representa a região crítica ou região de rejeição.

Definição 8.4 (Erros de tipo I e de tipo II). Quando realizamos um Teste de Hipótesespodemos cometer um dos seguintes erros:

• A rejeição de H0 quando ela é verdadeira (erro de tipo I);

• A não rejeição de H0 quando esta é falsa (erro de tipo II).

Representamos por α e β, respectivamente, a probabilidade de ocorrer um erro de tipo I ou II,isto é,

• α = P (erro de tipo I) = P (rejeitar H0|H0 é verdadeira);

• β = P (erro de tipo II) = P (não rejeitar H0|H0 é falsa).

Chamamos ainda nível de significância a α e potência do teste a 1−β. Os níveis de significânciamais usuais são α = 0.01, α = 0.05 ou α = 0.1.

Observação: O teste ideal é aquele em que estas as probabilidades α e β têm valor mínimo.Contudo, é impossível minimizá-las simultaneamente. De facto, quando α diminui, β aumenta evice-versa. O procedimento usual consiste em fixar o nível de significância α e escolher a regiãode rejeição que minimiza β, isto é, que maximize a potência do teste.

Exemplo 8.5. Seja (X1, X2, . . . , Xn) uma amostra aleatória da população dos pesos das formigasSolenopsis, isto é, da população X ∼ N(µ, 22). Um teste possível para testar:

H0 : µ ≤ 8 vs H1 : µ > 8,

é rejeitar H0 se X−82/√n> 1.64.

Page 71: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.2. TESTE DE HIPÓTESES PARA A MÉDIA DA POPULAÇÃO 65

Definição 8.6 (Valor-p ou “p-value”). De um modo informal, podemos definir o valor-p ou“p-value” como o mais pequeno nível de significância que leva à rejeição de H0. Assim,

• um valor-p pequeno é desfavorável a H0.

• um valor-p elevado indica que as observações são consistentes com H0.

Nota: Geralmente o software estatístico apenas apresenta o valor-p do teste. Cabe ao utilizadortomar a decisão ao nível de significância α. Quanto menor for o valor-p, menor é a consistênciaentre os dados e H0. Assim, se valor-p < α, devemos rejeitar H0, ao nível de significância α.

Regra de cálculo do valor-p:Seja (x1, x2, . . . , xn) a concretização da amostra aleatória e

wobs = W (x1, x2, . . . , xn),

o valor observado da estatística de teste W . O valor-p corresponde à probabilidade dese observar um valor igual ou mais “extremo” do que o observado, wobs, se a hipótesenula é verdadeira. O cálculo desta probabilidade depende do tipo de região de rejeiçãoda hipótese H0, conforme indicado na seguinte tabela:

Região de rejeição valor-p]−∞,−c [ ∪ ] c,+∞[

ou 2×minP (W < wobs | H0), P (W > wobs | H0)

] 0, b [ ∪ ] c,+∞[

]−∞, c [ou P (W < wobs | H0)

] 0, c [] c,+∞[ P (W > wobs | H0)

8.2 Teste de Hipóteses para a média da população

De modo análogo, ao efectuado no capítulo anterior, a dedução do teste de hipóteses para o valormédio da população será feito admitindo um dos seguintes pressupostos:

1. População Normal e Variância conhecida;

2. População Normal e Variância desconhecida;

3. População não-Normal e Variância conhecida;

4. População não-Normal e Variância desconhecida.

Page 72: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

66 CAPÍTULO 8. TESTE DE HIPÓTESES

8.2.1 Teste bilateral

• Vamos admitir que (X1, X2, . . . , Xn) representa uma amostra aleatória de uma populaçãoNormal com variância conhecida e que pretendemos testar

H0 : µ = µ0 vs H1 : µ 6= µ0 (teste bilateral)

• Já sabemos que X é um estimador centrado de µ. Também já se verificou que√nX−µσ ∼

N(0, 1), embora o valor médio, µ, seja desconhecido. Assim, vamos considerar a seguinteestatística de teste:

Z = X − µ0σ/√n

∼sobH0

N(0, 1).

• Considere o nível de significância α. Estamos interessados em rejeitar H0 quando osvalores observados não estiverem de acordo com esta hipótese, isto é, quando a dife-rença entre X e µ0 for grande. Assim, vamos considerar a região de rejeição Rα =]−∞,−zα/2[∪ ]zα/2,+∞[, indicada na Figura 8.1.

0

0.0

1 −− αα

Rαα Rαα

−− zαα 2 zαα 2

Figura 8.1: Região de rejeição para o teste bilateral para o valor médio.

• A regra de decisão do teste consiste em rejeitar H0 se zobs = x−µ0σ/√n∈ Rα, ou seja, se

|zobs| > zα/2.

Exemplo 8.7. Considere novamente o exemplo da população dos pesos das formigas Solenop-sis, isto é, a população X ∼ N(µ, 22), da qual observámos a amostra aleatória de 4 pesos(8, 13, 9, 8.5). Com base nesta amostra vamos testar, a um nível de significância 5%, a hipótesede que o peso médio populacional µ é igual a 9dg, ou seja vamos testar: H0 : µ = 9 vs H1 : µ 6= 9.

• Como a população é normal com variância conhecida, a estatística de teste é:

Z = X−92/√

4 ∼sobH0

N(0, 1).

Page 73: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.2. TESTE DE HIPÓTESES PARA A MÉDIA DA POPULAÇÃO 67

• Região de rejeição para α = 0.05: Rα =]−∞,−1.96[∪ ]1.96,+∞[.

• Regra de decisão do teste: RejeitarH0 ao nível de significância 5% se zobs = x−92/√

4 ∈ R0.05.

• Decisão: Como zobs = 9.625−92/√

4 = 0.625 /∈ R0.05, não rejeitamos H0 ao nível de significância5%, significando que os dados não vão contra o pressuposto de que o peso médio dasformigas é 9dg..

Exemplo 8.8 (Cálculo do valor-p do teste do Exemplo 8.7). Como Zobs ' 0.63,

valor-p = 2 min(P (Z < 0.63 | H0), P (Z > 0.63 | H0)

)= 2P (Z > 0.63 | H0) =

= 2(1− P (Z ≤ 0.63 | H0)) = 2(1− Φ(0.63)) = 0.5286.

Outros testes de hipóteses bilaterais para o valor médioO teste de hipóteses bilateral, apresentado nesta secção, baseou-se no pressuposto da populaçãoter distribuição Normal e da variância ser conhecida. Noutras condições o teste faz-se de formaanáloga, podendo ser necessário alterar a estatística de teste e respectiva região de rejeição,conforme indicado na seguinte tabela:

População Variância Rejeitar H0 se

Pop. Normal de média µσ2 conhecida

∣∣∣X−µ0σ/√n

∣∣∣ > zα/2

σ2 desconhecida∣∣∣X−µ0S/√n

∣∣∣ > tn−1,α/2

Pop. não-Normal de média µσ2 conhecida

∣∣∣X−µ0σ/√n

∣∣∣ > zα/2

(n ≥ 30) σ2 desconhecida∣∣∣X−µ0S/√n

∣∣∣ > zα/2

8.2.2 Teste unilateral direito

• Vamos admitir que (X1, X2, . . . , Xn) representa uma amostra aleatória de uma populaçãoNormal com variância conhecida e pretendemos testar

H0 : µ ≤ µ0 vs H1 : µ > µ0 (teste unilateral direito)

• De modo análogo, ao apresentado no teste bilateral, vamos considerar a seguinte estatísticade teste:

Z = X − µ0σ/√n

∼sobH0

N(0, 1).

• Vamos considerar a região de rejeição Rα =]zα,+∞[, indicada na Figura 8.2.

• Regra de decisão: Rejeitar H0, ao nível de significância α se zobs ∈ Rα.

Page 74: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

68 CAPÍTULO 8. TESTE DE HIPÓTESES

0

0.0

1 −− αα

αα

Rαα

zαα

Figura 8.2: Região de rejeição para o teste unilateral direito para o valor médio.

Outros testes de hipóteses unilaterais direitos para o valor médioA estatística de teste e a região de rejeição podem mudar ligeiramente, consoante a populaçãotem, ou não, distribuição Normal e a variância é, ou não é, conhecida. A próxima tabela apresenta,de forma resumida, as alterações que se devem fazer no teste de hipóteses anteriormente deduzido:

População Variância Rejeitar H0 se

Pop. Normal de média µσ2 conhecida X−µ0

σ/√n> zα

σ2 desconhecida X−µ0S/√n> tn−1,α

Pop. não-Normal de média µσ2 conhecida X−µ0

σ/√n> zα

(n ≥ 30) σ2 desconhecida X−µ0S/√n> zα

8.2.3 Teste unilateral esquerdo

O procedimento que deduz o teste unilateral esquerdo, para o valor médio,

H0 : µ ≥ µ0 vs H1 : µ < µ0 (teste unilateral esquerdo),

é análogo ao do teste unilateral direito. Por esta razão apenas se apresentamos a seguinte tabelaresumo:

População Variância Rejeitar H0 se

Pop. Normal de média µσ2 conhecida X−µ0

σ/√n< −zα

σ2 desconhecida X−µ0S/√n< −tn−1,α

Pop. não-Normal de média µσ2 conhecida X−µ0

σ/√n< −zα

(n ≥ 30) σ2 desconhecida X−µ0S/√n< −zα

Page 75: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.3. TESTE DE HIPÓTESES PARA A VARIÂNCIA, σ2, DE UMA POPULAÇÃO NORMAL 69

8.3 Teste de Hipóteses para a variância, σ2, de uma populaçãoNormal

Suponha que observamos uma amostra aleatória (X1, X2, . . . , Xn) de uma população X ∼N(µ, σ2), em que µ é desconhecido. Vamos nesta secção considerar apresentar alguns testesde hipóteses, relativos ao valor da variância da população, σ2.

• Testamos uma das três seguintes hipóteses (nula e alternativa):

1. H0 : σ2 = σ20 vs H1 : σ2 6= σ2

0 (teste bilateral);

2. H0 : σ2 ≤ σ20 vs H1 : σ2 > σ2

0 (teste unilateral direito);

3. H0 : σ2 ≥ σ20 vs H1 : σ2 < σ2

0 (teste unilateral esquerdo).

• Vamos escolher a estatística de teste com base no estimador de σ2, S2, variância amostral:

X2 = (n− 1)S2

σ20

∼sobH0

χ2n−1.

• Definamos a região de rejeição do teste: Para um nível de significância α, pré-especificado,as regiões de rejeição dos três tipos de hipóteses são, respectivamente, indicadas nasseguintes figuras:

0

0.0

1 −− αααα 2

αα 2

χχn−−1::1−−αα 22 χχn−−1::αα 2

2

Rαα Rαα

0

0.0

1 −− αα

αα

χχn−−1::αα2

Rαα

0

0.0

1 −− αααα

χχn−−1::1−−αα2

Rαα

Figura 8.3: Esquerda: Região de rejeição para o teste bilateral. Centro: Região de rejeição parao teste unilateral direito. Direita: Região de rejeição para o teste unilateral esquerdo.

Ou seja, a região de rejeição do teste, para um nível de significância α pré-especificado é,respectivamente:

1. Rα = ]0, χ2n−1,1−α/2[ ∪ ]χ2

n−1,α/2,+∞[ (teste bilateral);

2. Rα = ]χ2n−1,α,+∞[ (teste unilateral direito);

3. Rα = ]0, χ2n−1,1−α[ (teste unilateral esquerdo);

• Rejeitamos H0 se X2obs ∈ Rα.

Page 76: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

70 CAPÍTULO 8. TESTE DE HIPÓTESES

8.4 Teste de Hipóteses para a proporção p de uma população

Admita que temos uma amostra aleatória de dimensão n de uma população, em que determinadaproporção desconhecida p dos seus elementos possui certa característica.

• Admita que pretendemos testar uma das seguintes hipóteses (nula e alternativa):

1. H0 : p = p0 vs H1 : p 6= p0 (teste bilateral);

2. H0 : p ≤ p0 vs H1 : p > p0 (teste unilateral direito);

3. H0 : p ≥ p0 vs H1 : p < p0 (teste unilateral esquerdo);

• Estatística de teste:

Z = P − p0√p0(1− p0)/n

a∼sobH0

N(0, 1)

• Definamos a região de rejeição do teste: Para um nível de significância α, pré-especificado,as regiões de rejeição dos três tipos de hipóteses são, respectivamente, indicadas nasseguintes figuras:

0

0.0

1 −− αα

Rαα Rαα

−− zαα 2 zαα 2 0

0.0

1 −− αα

αα

Rαα

zαα 0

0.0

1 −− αα

αα

Rαα

−− zαα

Figura 8.4: Esquerda: Região de rejeição para o teste bilateral. Centro: Região de rejeição parao teste unilateral direito. Direita: Região de rejeição para o teste unilateral esquerdo.

Região de rejeição do teste, para um nível de significância α pré-especificado:

1. Rα = ]−∞,−zα/2[ ∪ ]zα/2,+∞[ (teste bilateral);

2. Rα = ]zα,+∞[ (teste unilateral direito);

3. Rα = ]−∞,−zα[ (teste unilateral esquerdo);

• Regra de decisão do teste: Rejeitar H0 ao nível de significância α se

zobs = pobs − p0√p0(1− p0)/n

∈ Rα.

Page 77: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.5. TESTE DAS SEQUÊNCIAS ASCENDENTES E DESCENDENTES 71

8.5 Teste das sequências ascendentes e descendentes

O teste a seguir apresentado permite-nos testar a hipótese de aleatoriedade, uma condição essen-cial nos diversos métodos estatísticos já estudados. Considere as hipóteses:

H0 : A amostra é aleatória vs. H1 : A amostra não é aleatória

• Seja (X1, X2, . . . , Xn) uma amostra da população X. Vamos substituir pelo símbolo “+”cada observação precedida por uma de valor inferior, e pelo símbolo “-” cada observaçãoque é precedida por outra de valor superior. As observações precedidas por outras de valorigual são desprezadas (e corrige-se a dimensão da amostra, n).

• A estatística de teste é:

Z =V − 2n−1

3√16n−29

90

a∼sobH0

N(0, 1).

com V = número de sequências de sinais “+” e “-”. Na prática considera-se que a dis-tribuição de Z é razoável se n ≥ 25.

• Região de rejeição para o nível de significância α.

Rα = ]−∞,−zα/2[ ∪ ]zα/2,+∞[

Rejeitamos H0, ao nível de significância α, sempre que zobs ∈ Rα.

Nota: O teste também pode ser aplicado em amostras de pequena dimensão (n < 25). Nesse casoutiliza-se a estatística de teste V . Para mais detalhes consulte a bibliografia aconselhada.

Exemplo 8.9 (Exame de P.E. - 2008/09). Considere a seguinte amostra, de dimensão n = 30,do número de clientes atendidos por hora em certo posto de venda:

41 30 28 40 28 26 28 41 30 34 40 36 30 20 4335 36 20 42 43 42 40 32 26 28 41 34 24 42 40

Podemos considerar a amostra aleatória? (considere um nível de significância de 5%)

Resposta: Pretendemos testar

H0 : A amostra é aleatória vs H1 : A amostra não é aleatória

A estatística de teste é

Z =V − 2n−1

3√16n−29

90

∼SobH0

N(0, 1).

Para a amostra indicada, vobs = 17 e zobs = −1.19.A região de rejeição do teste é: R0.05 =] −∞;−1.96[ ∪ ]1.96; +∞[ Como o valor observado daestatística de teste não pertence à região de rejeição, não rejeitamos a hipótese H0 ao nível designificância 5%.

Page 78: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

72 CAPÍTULO 8. TESTE DE HIPÓTESES

8.6 Teste de ajustamento do Qui Quadrado

Em muitas situações a distribuição da população é desconhecida, e podemos estar interessados emtestar se determinada v.a. ou população tem distribuição F , isto é, podemos estar interessadosem testar:

H0 : X ∼ F vs H1 : X F (8.1)

Existem vários testes de hipóteses que nos permitem testar estas hipóteses. Nesta disciplinairemos apenas abordar um dos mais conhecidos: O teste de ajustamento do Qui-Quadrado.Trata-se de um teste que apresenta a vantagem de poder ser aplicado para qualquer distribuição,desde que a amostra recolhida não seja muito pequena. Existem outros testes de hipóteses quepermitem testar as hipóteses em (8.1), como por exemplo:

1. Teste de Kolmogorov-Smirnov (válido para distribuições contínuas);

2. Teste de Shapiro-Wilk (válido para a distribuição Normal).

Teste do Qui Quadrado:

• Os dados observados (a amostra) são divididos em k classes, A1, A2, . . . , Ak. Em cadaclasse Ai consideramos o número de observações que lhe correspondem (a frequência ab-soluta de cada classe), denotando esse número por Oi. Consideramos ainda o número deobservações que esperaríamos observar em cada uma das classes, se a hipótese nula fosseverdadeira, denotando-o por Ei. Este número é determinado por Ei = n×pi, em que pi é aprobabilidade de uma observação pertencer à classe i, caso a hipótese nula seja verdadeira,isto é,

pi = P (X ∈ Ai|H0 verdadeira), i = 1, 2, . . . , k.

• A estatística de teste usada é:

X2 =k∑i=1

(Oi − Ei)2

Ei

a∼sobH0

χ2k−p−1,

onde k é o número de classes e p o número de parâmetros estimados (do modelo consideradona hipótese nula), pelo método da máxima verosimilhança.

• Região de rejeição do teste, para um nível de significância α, pré-especificado:

Rα =]χ2k−p−1,α , +∞[

Rejeitamos H0, ao nível de significância α, sempre que X2obs ∈ Rα.

Page 79: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.6. TESTE DE AJUSTAMENTO DO QUI QUADRADO 73

Observações:

1. Caso exista algum Ei < 5, tipicamente correspondendo às classes dos extremos, essa(s)classe(s) deve(m) ser agrupada(s) até o correspondente novo número esperado Ei (dadopelas somas dos correspondentes antigos E′is) ultrapassar 5. Os correspondentes Oi’s devemnesse caso ser também somados, diminuindo naturalmente o valor do número de classes k.

2. Como∑ki=1Oi =

∑ki=1Ei = n, a estatística de teste X2 é igual a:

X2 =k∑i=1

O2i

Ei− n.

Exemplo 8.10. Geneticistas pensam que, em determinada população, a distribuição de probabil-idade dos grupos sanguíneos é a seguinte:

MM MN NN0.3 0.5 0.2

Uma amostra de 200 indivíduos desta população, classificados de acordo com estes grupos san-guíneos, revelou 64 indivíduos do grupo MM, 96 do grupo MN e os restantes do grupo NN.

(a) Estes dados fornecem evidência estatística para pôr em causa o pressuposto dos geneticistas?

(b) Determine, um valor aproximado, do valor-p do teste.

Resolução:

(a) Usando o teste do Qui Quadrado, pretendemos testar:

H0 : P (MM) = 0.3, P (MN) = 0.5, P (NN) = 0.2 vs

H0 : P (MM) 6= 0.3, ou P (MN) 6= 0.5, ou P (NN) 6= 0.2

Temos 3 classes e os seguintes valores:

A1 = MM O1 = 64 E1 = 60A2 = MN O2 = 96 E2 = 100A3 = NN O3 = 40 E3 = 40

Usando a estatística de teste X2 =∑ki=1

(Oi−Ei)2

Ei

a∼sobH0

χ2k−p−1, obtemos:

X2obs = 642

60 + 962

100 + 402

40 − 200 = 0.427

Considerando α = 0.05, a região de rejeição é R0.05 =]χ22,0.05 , +∞[=]5.99,+∞[. Como

X2obs /∈ R0.05, não rejeitamos H0, ao nível de significância 5%.

(b) Valor-p = P (X2 > 0.427) ' P (X2 > 0.446) = 0.8.

Page 80: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

74 CAPÍTULO 8. TESTE DE HIPÓTESES

Exemplo 8.11 (Teste de ajustamento para o modelo Poisson). Pensa-se que o número dedefeitos encontrados em circuitos eléctricos tem distribuição Poisson. Recolheu-se uma amostraaleatória de n = 60 circuitos e observaram-se os seguintes números de defeitos:

número de defeitos número de circuitos0 321 152 93 4

Resolução: Como λ é desconhecido, terá de ser estimado. Assim, λ = x = 0.75. Pretende-setestar:

H0 : X ∼ P (0.75) vs H0 : X P (0.75)

A tabela anterior já inclui as observações agrupadas em classes. Assim, vamos considerar asclasses: A1 = 0, A2 = 1, A3 = 2, A4 = 3, 4, . . .. Como E4 < 5 é necessário juntar aclasse A4 à classe A3 (ver as seguintes tabelas).

no de defeitos pi Ei0 0.472 28.321 0.354 21.242 0.133 7.98

3 (ou mais) 0.041 2.46

no de defeitos Oi pi Ei0 32 0.472 28.321 15 0.354 21.24

2 (ou mais) 13 0.174 10.44

O valor observado de estatística de teste é:

χ2obs = (32− 28.32)2

28.32 + (15− 21.24)2

21.24 + (13− 10.44)2

10.44 = 2.94

Considerando α = 0.05, a região de rejeição é R0.05 =]χ21,0.05 , +∞[=]3.84,+∞[. Como

χ2obs = 2.94 < χ2

1;0.05 = 3.84,

não rejeitamos a hipótese H0 de que a distribuição da população é P (0.75).

Page 81: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

8.6. TESTE DE AJUSTAMENTO DO QUI QUADRADO 75

Exemplo 8.12 (Teste de ajustamento para o modelo Normal). Os artigos produzidos emdeterminada fábrica são sujeitos a um controle de qualidade, resultando num índice de qualidade,X. De forma a avaliar essa qualidade recolheu-se uma amostra aleatória de 46 artigos da produção,tendo-se medido os valores seguintes do referido índice:

100, 110, 122, 132, 99, 96, 88, 75, 45, 154, 153, 161, 142, 99, 111, 105, 133, 142, 150, 153, 121, 126, 117, 97,

105, 117, 125, 105, 94, 90, 80, 50, 55, 102, 122, 136, 75, 104, 109, 108, 134, 135, 111, 78, 89, 154

Vamos usar estes dados para testar, ao nível de significância 5%,

H0 : X ∼ N(µ, σ2) vs H1 : X N(µ, σ2)

Como não conhecemos os valores populacionais de µ e σ2, vamos estimá-los a partir da amostra.Assim,

µ = x = 146

46∑i=1

xi = 111.0652; σ2 = s2 = 146− 1

( 46∑i=1

x2i − 46× x2

)= 785.3068

Pela regra de Sturges, o número de classes a considerar é dado por: k ≈ 1+ log(n)log(2) = 1+ log(46)

log(2) ≈6.523562

Consideramos k = 7. A amplitude de cada classe é aproximadamente L7 = 161−45

7 ≈ 16.6. Vamosaproximar este valor a 20, ou seja, considerar as classes:

]−∞; 60] ]60; 80] ]80; 100] ]100; 120] ]120; 140] ]140; 160] ]160; +∞[

Devemos contar quantas observações caiem em cada um dos intervalos anteriores, para obteros valores de Oi, e devemos determinar os valores de Ei = n× pi = 46× pi.

i Classe Oi pi Ei1 ]−∞; 60] 3 0.0344 1.58242 ]60; 80] 4 0.0991 4.55863 ]80; 100] 9 0.2148 9.88084 ]100; 120] 12 0.2772 12.75125 ]120; 140] 10 0.223 10.2586 ]140; 160] 7 0.1114 5.12447 ]160; +∞[ 1 0.0401 1.8446

i Classe Oi pi Ei1 ]−∞; 80] 7 0.1335 6.1412 ]80; 100] 9 0.2148 9.88083 ]100; 120] 12 0.2772 12.75124 ]120; 140] 10 0.223 10.2585 ]140; +∞[ 8 0.1515 6.969

Então, como k = 5 classes e foram estimados p = 2 parâmetros (µ e σ2),

X2 =k∑i=1

(Oi − Ei)2

Ei

sob H0

∼ χ2k−p−1 ≡ χ2

5−2−1 ≡ χ22

Page 82: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

76 CAPÍTULO 8. TESTE DE HIPÓTESES

Regra de decisão do teste: Rejeitar H0 ao nível de significância 5% se x2obs ∈ R0.05 ≡]5.99,+∞[.

Como x2obs = 0.4019 não rejeitamos, ao nível de significância de 5% a hipótese nula de que a

distribuição da população é Normal.

Page 83: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 9

Regressão Linear

9.1 Introdução

A regressão é uma técnica estatística que permite estudar a relação entre uma ou mais variáveisresposta (também designadas por variáveis dependentes) e uma ou mais variáveis explicativas(também designadas por variáveis independentes). Ao modelo matemático que relaciona asvariáveis dá-se o nome de equação de regressão.

Estamos apenas interessados no caso em que temos uma variável dependente Y , uma variávelindependente x e a equação de regressão é linear, isto é,

Y = β0 + β1x+ ε, ε ∼ N(0, σ2).

O termo β0+β1x é a componente determinística do modelo e ε é o erro aleatório que se pressupõeter distribuição normal de valor médio nulo e variância σ2. Os parâmetros β0 e β1 terão de serestimados a partir dos dados. A este modelo dá-se o nome de equação de regressão linearsimples. Podemos também usar esta técnica considerando modelos mais complexos como aregressão linear múltipla ou a regressão não linear.

Observações:

1. Y também é uma variável aleatória porque, Y = β0 +β1x+ε e ε ∼ N(0, σ2) é uma variávelaleatória. Como

E(Y |x) = E(β0 + β1 x+ ε|x) = β0 + β1 x+ 0 = β0 + β1 x,

V (Y |x) = V (β0 + β1 x+ ε|x) = V (ε) = σ2,

isto é,

Y |x ∼ N(β0 + β1 x, σ2).

2. O modelo possui o parâmetro adicional, σ2, que também terá de ser estimado.

77

Page 84: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

78 CAPÍTULO 9. REGRESSÃO LINEAR

9.2 Estimadores dos Mínimos Quadrados de β0 e β1

Suponha que se observam um conjunto de n observações da variável independente e da variávelresposta - (x1, Y1), (x2, Y2) . . . , (xn, Yn) - e que se pretendem usar estes valores para estimaros parâmetros de regressão de um modelo de regressão linear simples. Assumimos que os er-ros aleatórios εi, para cada elemento amostral Yi, são independentes seguindo todos a mesmadistribuição N(0, σ2), isto é:

Yi = β0 + β1 xi + εi, com εi ∼ N(0, σ2) independentes.

Assim deveremos encontrar estimadores β0 e β1, dos coeficientes da recta de regressão β0 eβ1, respectivamente, para obtermos a recta estimada,

Y = β0 + β1x.

As estimativas pontuais da recta de regressão para as observações x1, x2, . . . , xn serão Yi =β0 + β1xi, i = 1, 2, . . . , n.

Definição 9.1 (Resíduo). Embora a variável residual ε não seja observável, é possível calcular osdesvios das n observações da amostra.

εi = Yi − Yi = Yi − β0 − β1 xi, i = 1, 2, . . . , n.

A estes desvios damos o nome de resíduos.

De entre diversos métodos que existem para a dedução dos estimadores, vamos aqui abordaro método dos mínimos quadrados. Neste método, os estimadores β0 e β1 devem ser obtidos demodo a minimizar a soma do quadrado dos resíduos,

SQR =n∑i=1

(Yi − Yi)2 =n∑i=1

(Yi − β0 − β1 xi)2.

Esta minimização é conseguida resolvendo, em ordem a β0 e β1, o sistema de equações,

∂ SQ

∂β0= 0

∂ SQ

∂β1= 0

−2∑

(Yi − β0 − β1 xi) = 0

−2∑xi(Yi − β0 − β1 xi) = 0

∑Yi = nβ0 + β1

∑xi

∑xiYi = β0

∑xi + β1

∑x2i

β0 = Y − β1x

β1 =∑

xiYi−nxY∑x2i−nx

2

Page 85: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

9.3. ESTIMAÇÃO DE σ2 E QUALIDADE DO AJUSTE 79

Observação 1: Para simplificar a notação, podemos escrever:

β1 = SxYSxx

β0 = Y − β1x,

com

Sxx =n∑i=1

(xi − x)2 =n∑i=1

x2i − nx2;

SxY =n∑i=1

(Yi − Y )(xi − x) =n∑i=1

Yi(xi − x) =n∑i=1

xiYi − nxY .

Observação 2: A soma dos quadrados dos desvios pode ainda ser escrita da seguinte forma

SQR =n∑i=1

(Yi − Yi)2 = SY Y −S2xY

Sxx= SY Y − β2

1Sxx,

com

SY Y =n∑i=1

(Yi − Y )2 =n∑i=1

Y 2i − nY

2.

9.3 Estimação de σ2 e Qualidade do Ajuste

Definição 9.2 (Estimador de σ2). O estimador de σ2 é:

σ2 = SQRn− 2

Definição 9.3 (Coeficiente de Determinação).

R2 = 1− SQR∑ni=1(Yi − Y )2 = β2

1SxxSY Y

= S2xY

SxxSY Y

Esta medida compara a soma de quadrados dos resíduos (SQR) do modelo de regressão linearsimples com a SQR do modelo de regressão linear simples com β1 = 0. A quantidade R2 variaentre 0 e 1. Na prática, consideramos que o ajustamento é razoável se R2 ≥ 0.8.

9.4 Propriedades dos estimadores dos mínimos quadrados

9.4.1 Distribuição por amostragem de σ2

Proposição 9.4 (Propriedades de σ2). No modelo de regressão linear simples,

(n− 2) σ2

σ2 = SQRσ2 ∼ χ2

n−2.

Page 86: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

80 CAPÍTULO 9. REGRESSÃO LINEAR

9.4.2 Distribuição por amostragem de β0 e β1

Proposição 9.5 (Distribuição por amostragem de β0 e β1). No modelo de regressão linear simples,

β1 ∼ N(β1,

σ2

Sxx

), e β0 ∼ N

(β0,

σ2

nSxx

n∑i=1

x2i

).

Demonstração. Note-se que

β1 = SxYSxx

=∑ni=1(xi − x)Yi

Sxx,

isto é, β1 é uma combinação linear de v.a.’s Yi independentes, com distribuição Normal. Logo β1

também tem distribuição Normal. E ainda necessário conhecer os seus parâmetros. O seu valormédio é

E(β1) =∑ni=1(xi − x)E(Yi)

Sxx=∑ni=1(xi − x)(β0 + β1 xi)

Sxx=

= β0∑ni=1(xi − x) + β1

∑ni=1(xi − x)xi

Sxx= β1Sxx

Sxx= β1

e a variância,

V (β1) = V

(∑ni=1(xi − x)Yi

Sxx

)=

Y ′i s indep.

∑ni=1(xi − x)2V (Yi)

S2xx

=∑ni=1(xi − x)2σ2

S2xx

= SxxS2xx

σ2 = σ2

Sxx.

Relativamente β0, recordemos que β0 = Y − β1x. Como Y e β1 têm distribuição Normal,então β0 também tem distribuição normal. O valor médio é

E(β0) = E(Y )− E(β1)x = β0 + β1x− β1x = β0,

e a variância,

V (β0) = V (Y ) + x2V (β1)− 2x Cov(Y , β1) = σ2

n+ x2 σ

2

Sxx− 0 = σ2

n

(1 + nx2

Sxx

)

= σ2

nSxx

(Sxx − nx2

)= σ2

nSxx

(n∑i=1

x2i

).

Nota: No cálculo de V (β0), usou-se o resultado:

Cov(Y , β1) = Cov(Y , SxYSxx

) = 1Sxx

Cov

1n

n∑i=1

Yi,n∑j=1

(xj − x)Yj

= 1nSxx

n∑i=1

(xi − x)V (Yi) = σ2

nSxx

n∑i=1

(xi − x) = 0

Page 87: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

9.5. INFERÊNCIA SOBRE OS PARÂMETROS DO MODELO DE REGRESSÃO 81

Observação: A partir do resultado anterior conclui-se que β0 e β1 são estimadores centrados deβ0 e β1, respectivamente.

Consequentemente, querendo fazer inferência sobre os parâmetros β0 ou β1, não podemos usara distribuições de β0 e β1, já que elas dependem de σ2 (geralmente é desconhecido). Comoσ2 = SQR

n−2 . teremos de usar os seguintes resultados:

T = β1 − β1√σ2

Sxx

=√Sxx

β1 − β1σ

∼ tn−2,

T = β0 − β0√σ2

nSxx

∑ni=1 x

2i

=√

nSxx∑ni=1 x

2i

β0 − β0σ

∼ tn−2.

9.5 Inferência sobre os parâmetros do Modelo de Regressão

9.5.1 Intervalo de Confiança e Teste de Hipóteses para β1

O parâmetro β1 é o declive da recta de regressão e, como tal mede o grau de crescimento de Yrelativamente a x.

Intervalo de confiança a (1− α)100% para β1

• Vamos utilizar a seguinte variável pivot:

T = β1 − β1√σ2

Sxx

∼ tn−2

• Para um nível de confiança de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c ec2 = c, tal que P (−c < T < c) = 1− α. É fácil de verificar que c = tn−2,α/2.

• Determinação dos extremos do intervalo:

− c < T < c⇔ −tα/2 < T < tα/2 − c√

σ2

Sxx< β1 − β1 < c

√σ2

Sxx⇔

− c√

σ2

Sxx− β1 < −β1 < c

√σ2

Sxx− β1 ⇔

β1 − tn−2,α/2

√σ2

Sxx< β1 < β1 + tn−2,α/2

√σ2

Sxx

• Assim, obtemos o seguinte intervalo de confiança:

IC(1−α)×100%(β1) =]β1 − tn−2;α/2

√σ2

Sxx, β1 + tn−2;α/2

√σ2

Sxx

[.

Page 88: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

82 CAPÍTULO 9. REGRESSÃO LINEAR

Teste de Hipóteses para β1

Podemos também realizar um teste de hipóteses sobre o valor do parâmetro β1. Embora o testetanto possa ser bilateral, como unilateral, a primeira opção é a mais frequente. Por isso apenasapresentamos o teste bilateral, embora este possa ser adaptado para o caso unilateral.

• Hipóteses:

H0 : β1 = a vs H1 : β1 6= a

• Estatística de teste:

T =√Sxx

β1 − aσ

∼SobH0

tn−2

• Região de rejeição do teste:

Rα =]−∞;−tn−2,α/2[ ∪ ]tn−2,α/2; +∞[

• Regra de decisão do teste: Rejeitar H0 ao nível de significância α se

tobs ∈ Rα, ou seja, se |tobs| > tn−2;α/2.

9.5.2 Intervalo de Confiança e Teste de Hipóteses para β0

O parâmetro β0 corresponde ao ponto de intersecção da recta com o eixo das abcissas. A inferênciasobre este parâmetro não tem a mesma importância que tem a inferência sobre o declive β1 darecta de regressão.

Intervalo de Confiança a (1− α)× 100% para β0

De modo análogo, ao que foi feito para β1, mas agora utilizando a variável pivot,

T = β0 − β0√σ2

nSxx

∑ni=1 x

2i

=√

nSxx∑ni=1 x

2i

β0 − β0σ

∼ tn−2,

obtemos o intervalo de confiança (1− α)× 100% para β0:

IC(1−α)×100%(β0) ≡]β0 − tn−2;α/2

√σ2∑n

i=1 x2i

nSxx; β0 + tn−2;α/2

√σ2∑n

i=1 x2i

nSxx

[.

Testes de hipóteses para β0

Os testes de hipóteses sobre o parâmetro β0 podem ser tanto bilaterais como unilaterais, sendo

Page 89: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

9.5. INFERÊNCIA SOBRE OS PARÂMETROS DO MODELO DE REGRESSÃO 83

sempre baseados na distribuição por amostragem anteriormente apresentada para β0. Vamosconsiderar apenas o teste bilateral para β0, ou seja, as hipóteses:

H0 : β0 = a vs H1 : β0 6= a

O teste realiza-se de modo análogo ao apresentado para β1, mudando apenas a estatística deteste que é dada por

T = β0 − a√σ2

nSxx

∑ni=1 x

2i

∼SobH0

tn−2

9.5.3 Intervalo de Confiança e Teste de Hipóteses para σ2

Como σ2 = SQRn−2 é estimador centrado de σ2 e SQR

σ2 ∼ χ2n−2, podemos deduzir um intervalo

de confiança (1 − α) para a variância σ2 e para o desvio padrão σ. Seguindo o procedimentoadoptado, na secção 7.2, obtemos

IC(1−α)×100%(σ2) ≡]

(n− 2)σ2

χ2n−2;α/2

; (n− 2)σ2

χ2n−2;1−α/2

[,

e

IC(1−α)×100%(σ) ≡

√√√√(n− 2)σ2

χ2n−2;α/2

;

√√√√ (n− 2)σ2

χ2n−2;1−α/2

.De modo análogo ao apresentado na secção 8.3, podemos também realizar testes de hipótese

(bilaterais e unilaterais) para σ2 recorrendo à distribuição de σ2.

Exemplo 9.6 (Exame de Probabilidades e Estatística C 2005/06). Pretende-se, se possível, mod-elar através de uma recta de regressão simples o consumo de combustível, Y , de um automóvelem função da sua velocidade de circulação, x. Para tal registaram-se os valores de consumo decombustível para um mesmo percurso de 100Km, percorrido a diferentes velocidades:

xi 50 60 70 80 90 100 110 120yi 5.22 6.25 6.85 8.36 8.09 10.16 11.17 11.57

x = 85, Y = 8.46,∑

x2i = 62000,

∑Y 2i = 610.43,

∑Yixi = 6145.5, SQR = 1.15

(a) Ajuste um modelo de regressão linear simples aos dados. Que pode dizer sobre a qualidadedo ajuste?

(b) Diga por suas palavras como interpreta o valor estimado do declive da recta acima consid-erada. O sinal desta estimativa está de acordo com as suas expectativas? Porquê?

(c) Determine um intervalo de confiança a 95% para o verdadeiro declive da recta de regressão.Comente o resultado face à qualidade do ajuste concluída na alínea (a).

Page 90: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

84 CAPÍTULO 9. REGRESSÃO LINEAR

9.6 Estimação do valor esperado de Y para uma observação x0 davariável controlada

O valor esperado de Y para uma observação x0 da variável controlada é

µY |x0 = E(Y |x0) = β0 + β1x0.

que pode ser estimado por

µY |x0 = β0 + β1x0.

Caso a variância do erro, σ2, não seja conhecida, a distribuição de amostragem de µY |x0 é

T =µY |x0 − µY |x0√σ2(

1n + (x0−x)2

Sxx

) ∼ tn−2,

o que permite deduzir o intervalo de confiança (1− α) para µY |x0 ,

]µY |x0 − tn−2;α/2

√σ2(

1n + (x0−x)2

Sxx

), µY |x0 + tn−2;α/2

√σ2(

1n + (x0−x)2

Sxx

)[.

Nota: Só devemos fazer estimação de µY |x0 para valores x0 que estejam dentro do intervalo dasobservações obtidas para x.

9.7 Previsão do valor da variável resposta Y para um novo valorx0 da variável controlada

Dada um valor x0 da variável controlada x, a variável resposta é

Y0 = Y (x0) = β0 + β1x0 + ε,

onde ε ∼ N(0, σ2). O estimador de Y , para um valor x0, é Y0 = Y (x0) = β0 + β1x0

O erro de predição, εp = Y0− Y0, é uma v.a. Normal de valor médio 0. Como Y0 (observaçãofutura) é independente de Y0, a variância de εp é de dada por

V (εp) = V (Y0 − Y0) = σ2(

1 + 1n

+ (x0 − x)2

Sxx

).

Se σ2 for estimado por σ2, então T = Y0−Y0√σ2(

1+ 1n

+ (x0−x)2Sxx

) ∼ tn−2.

O intervalo de confiança (1− α) para Y0 é,]Y0 − tn−2;α/2

√σ2(1 + 1

n + (x0−x)2

Sxx

); Y0 + tn−2;α/2

√σ2(1 + 1

n + (x0−x)2

Sxx

)[.

Page 91: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 10

Exercícios

10.1 Introdução à Teoria da Probabilidade1.1 Vinte e cinco membros de uma sociedade devem eleger um presidente, um secretário e um tesoureiro.

Supondo que qualquer dos vinte e cinco membros é elegível para qualquer dos cargos, quantas sãoas hipóteses de um resultado final?

1.2 Considere o problema anterior. Suponha que não há diferenciação dos cargos. De quantas maneirasdistintas se podia formar uma comissão, com três elementos escolhidos entre os vinte e cinco ele-mentos?

1.3 Quantas palavras diferentes, com ou sem significado, se podem formar com as letras da palavraROMA?

1.4 Quatro livros de Matemática, seis de Física e dois de Química, todos diferentes, devem ser arrumadosnuma prateleira. Quantas arrumações diferentes são possíveis se:

(a) os livros de cada matéria ficarem todos juntos?(b) apenas os livros de matemática devem ficar juntos?

1.5 Numa sala de cinema, de quantas maneiras diferentes se podem sentar numa fila de 12 lugares, 7amigos?

1.6 De quantas maneiras 10 pessoas podem sentar-se num banco, se houver apenas 4 lugares?

1.7 De quantas formas diferentes se podem sentar 12 pessoas numa mesa redonda?

1.8 Um homem tem 3 camisas e 2 gravatas. De quantas maneiras pode vestir-se (com uma camisa euma gravata)?

1.9 Num conjunto de 10 lâmpadas para árvore de natal, 2 são defeituosas. Quantas amostras de 6lâmpadas podem ser escolhidas, de entre aquelas 10, de modo que:

(a) as 6 lâmpadas escolhidas sejam todas boas?(b) entre a 6 escolhidas haja uma, e uma só defeituosa?

1.10 Dados 12 pontos num plano, não havendo 3 deles sobre a mesma recta,

(a) quantas rectas são determinadas pelos pontos?(b) quantas dessas rectas passam pelo ponto A?(c) quantos triângulos são determinados pelos pontos?(d) Quantos desses triângulos contêm o ponto A como vértice?

85

Page 92: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

86 CAPÍTULO 10. EXERCÍCIOS

(e) Quantos desses triângulos contêm o lado AB?

1.11 De um baralho de 52 cartas são retiradas 10 cartas. Em quantos casos aparecem:

(a) exactamente um ás?(b) pelo menos um ás?(c) exactamente dois ases?(d) pelo menos dois ases?(e) Um ás ou um ouro?

1.12 Determine o valor n que seja solução de:

(a)(n−2

2)

= 6

(b)(n+1

2)−(n−1

2)

=(n2)− 1

(c) 5×(n3)

=(n+2

4)

1.13 Os atletas A, B, e C vão participar numa corrida e todos estão preparados para a ganhar. O sistemade cronometragem é suficientemente preciso de modo que não se admitem empates.

(a) Qual a probabilidade de A terminar a corrida à frente de C?(b) Qual a probabilidade de A ganhar a corrida?

1.14 Por engano misturaram-se quatro pilhas novas com três usadas. Escolhendo, ao acaso e semreposição, duas dessas pilhas, determine a probabilidade de:

(a) Ambas serem novas(b) Nenhuma ser nova(c) Pelo menos uma ser nova

1.15 Num grupo de 20 congressistas, 8 só falam inglês, 5 só falam francês e 7 falam os dois idiomas.Qual a probabilidade de dois congressistas, escolhidos ao acaso, poderem conversar sem auxílio deum intérprete?

1.16 Uma urna contém quatro bolas amarelas, cinco bolas verdes, três bolas brancas e cinco bolas pretas.Extraem-se sucessivamente, ao acaso e sem reposição, quatro bolas. Qual a probabilidade de:

(a) Obter na primeira extracção uma bola amarela, na segunda uma verde, depois uma branca efinalmente uma preta?

(b) Obter o mesmo conjunto de cores independentemente da sua ordem?

1.17 (Teste de P.E. 2006/07) Considere os acontecimentos A e B de um espaço de resultados tais queP (A ∪B) = 0.8, e P (A−B) = 0.3. Qual o valor da P (B)?

1.18 Sejam A, B e C acontecimentos tais que P (A) = P (B) = P (C) = 14 , P (A∩B) = P (B ∩C) = 0

e P (A ∩ C) = 18 . Qual a probabilidade de se verificar pelo menos um dos 3 acontecimentos?

1.19 Sabendo que A e B são acontecimentos tais que P (A) = 23 , P (B) = 1

2 e P (A∩B) = 13 , determine

P (A−B), P (A ∪B), P (A ∪ B), P (A ∩B) e P (A ∪ B).

1.20 De 100 agricultores, 50 produzem vinho, 30 produzem milho e 10 produzem vinho e milho. Escol-hendo um deste agricultores ao acaso qual a probabilidade de:

(a) Ele produza vinho ou milho?(b) Ele não produza vinho nem milho?

Page 93: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.1. INTRODUÇÃO À TEORIA DA PROBABILIDADE 87

1.21 A probabilidade de um homem estar vivo daqui a 25 anos é 35 e a probabilidade da sua mulher ainda

viver na mesma ocasião é de 23 . Determine a probabilidade de daqui a 25 anos:

(a) Ambos estarem vivos.(b) Apenas o homem estar vivo.(c) Apenas a mulher estar viva.(d) Apenas um estar vivo.

1.22 Em determinada gelataria 40% dos clientes escolhem o sabor chocolate, 30% escolhem o sabor limãoe 15% escolhem os dois. Seleccionou-se ao acaso um cliente dessa gelataria.

(a) Se escolheu o sabor limão, qual a probabilidade de ter escolhido também o sabor chocolate?E vice-versa?

(b) Qual a probabilidade de escolher limão ou chocolate?

1.23 Suponha que 10% da população de certo país sofre de problemas cardíacos e que, de entre estes,70% são fumadores. De entre os que não sofrem de problemas cardíacos 45% fumam. Seleccionadaao acaso uma pessoa desta população:

(a) Qual a probabilidade de ser fumadora?(b) Se for fumadora, qual a probabilidade de sofrer de problemas cardíacos?

1.24 Num clube de futebol treinam regularmente 30 jogadores, dos quais 8 são atacantes, 12 são médios eos restantes são defesas. Independentemente dos resultados dos restantes jogadores, cada atacantetem uma probabilidade de 3/4 de marcar golo de penalty, cada médio tem uma probabilidade de1/2 de marcar golo por penalty e cada defesa consegue-o com probabilidade 1/5.

(a) Qual a probabilidade de que um jogador, escolhido ao acaso, marque golo devido a penalty?(b) Dado que, num jogo, um qualquer jogador marcou um golo de penalty, qual a probabilidade

de esse jogador ser médio?

1.25 Sejam A e B acontecimentos independentes. Mostre que A e B são também acontecimentosindependentes.

1.26 Um aluno conhece bem 60% da matéria dada. Num exame com cinco perguntas, sorteadas ao acaso,sobre toda a matéria, qual a probabilidade de vir a responder correctamente a duas perguntas?

1.27 Numa certa rua existem duas caixas Multibanco - A e B. A probabilidade de as máquinas avariaremé, independentemente uma da outra, de 0.05 para a A e 0.01 para a B. Determine a probabilidadede, num dia qualquer:

(a) Ambas as máquinas estarem avariadas.(b) Apenas a máquina A estar avariada.(c) Pelo menos uma das máquinas estar avariada.

1.28 (Teste de P.E. 2006/07) Uma urna tem oito moedas, seis honestas e duas viciadas. O resultado dolançamento de uma moeda viciada é sempre “cara”.

(a) Escolhendo duas das oito moedas disponíveis, ao acaso e sem reposição, qual a probabilidadede seleccionar as duas moedas viciadas.

(b) Escolhendo uma moeda ao acaso, qual a probabilidade de obter três caras em três lançamentossucessivos dessa moeda?

(c) Se em três lançamentos, da mesma moeda, o resultado foi sempre “cara”, qual a probabilidadede ter escolhido a moeda viciada?

Page 94: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

88 CAPÍTULO 10. EXERCÍCIOS

1.29 (Exame de de P.E. D - 2008/09) Um laboratório farmacêutico produz um kit, que identifica rap-idamente o tipo de sangue de uma pessoa, entre os 4 possíveis: A, B, O e AB. O ensaio clínicoefectuado antes da comercialização do kit indica que 2%, 3%, 5% e 10% das pessoas com sanguede tipo A, B, O e AB, respectivamente, são incorrectamente classificadas. Sabendo que 40% dapopulação tem sangue do tipo A, 10% tem sangue de tipo B, 45% tem sangue de tipo O e osrestantes têm sangue de tipo AB, calcule:

(a) A probabilidade de uma pessoa, que usou o kit, ser incorrectamente classificada.(b) A probabilidade de uma pessoa, que usou o kit e foi incorrectamente classificada, ter sangue

de tipo AB.

Page 95: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.2. VARIÁVEIS ALEATÓRIAS 89

10.2 Variáveis aleatórias2.1 A variável aleatória (v.a.) X representa o número de doentes com gripe que procuram, por dia, o

Dr. Remédios. Em 50% dos dias, pelo menos 2 pacientes com gripe procuram o Dr. Remédios. Asua função de probabilidade é dada por:

X

0 1 2 3p 0.2 q 0.3

(a) Determine p e q.(b) Determine a função de distribuição da v.a. X e esboce o seu gráfico. Comente-o.(c) Determine a função de probabilidade das v.a.’s Y = 40X e W = max(X, 1).

2.2 A v.a. X representa o número de pontos que saem no lançamento de um determinado dado. A suafunção de distribuição segue-se:

F (x) =

0, x < 11/6, 1 ≤ x < 21/4, 2 ≤ x < 41/2, 4 ≤ x < 57/12, 5 ≤ x < 6

1, x ≥ 6

(a) Calcule as seguintes probabilidades, usando a função de distribuição:i) A probabilidade de o número de pontos saídos ser no máximo 3.ii) P (1 < X ≤ 2).iii) P (2 ≤ X < 6).iv) A probabilidade de o número de pontos saídos não distar de 2 pontos por mais de 1 ponto.

(b) Determine a função de probabilidade de X e confirme os resultados acima obtidos.(c) Pode afirmar que o dado é equilibrado? Justifique.(d) Sabendo que o número de pontos saído é pelo menos 4, calcule a probabilidade de saírem 6

pontos.

2.3 O Sr. Matias possui um café nas vizinhanças de um estádio de futebol. Da sua experiência, o Sr.Matias sabe que, em dias de futebol, costuma vender ou 50, ou 100, ou 150 ou 200 sandes, comprobabilidades 0.2, 0.4, 0.3 e 0.1, respectivamente.O Sr. Matias costuma fazer 100 sandes e quando estas se esgotam recorre a um fornecedor da terraque lhe garante o envio atempado de mais sandes.

(a) Qual a probabilidade de as sandes preparadas pelo Sr. Matias serem insuficientes para satisfazera procura?

(b) Calcule a probabilidade de vender 200 sandes, num dia em que as sandes por ele feitas nãosatisfazem a procura.

2.4 Seja X uma v.a. com a seguinte função densidade probabilidade:

f(x) =

k + x, −1 ≤ x < 0k − x, 0 ≤ x < 1

0, c.c.

(a) Determine o valor da constante k.(b) Determine a função de distribuição de X e esboce o seu gráfico.(c) Determine P (X > 0).(d) Determine P (X > 0.5|X > 0).

Page 96: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

90 CAPÍTULO 10. EXERCÍCIOS

2.5 Considere funções densidade de probabilidade, representadas nos seguintes gráficos.

(a) Determine o valor das constantes a e b.

-

6

cbb

c

JJJJJJJ

JJJJJJJ

c

cbb1−1 x

a

f(x)

0-

6

0 b−2b

12

f(x)

x

c

bb(b) Qual a relação entre a e b?

-

6

TTTTT

TTTTT

a−a b x

b

f(x)

0

2.6 Seja X uma v.a. com a seguinte função densidade probabilidade:

f(x) =

4x, 0 < x < k0, c.c.

(a) Esboce o gráfico da função densidade e determine o valor da constante k.(b) Determine a função de distribuição da v.a. X.(c) Calcule P (1/4 ≤ X ≤ 1/3), a mediana e o quantil de ordem 0.95.(d) Identifique através da função de distribuição ou da função densidade, a distribuição das v.a.’s

Y = X − 1 e T = X3.

2.7 A quantidade de tempo, em horas, que um computador funciona até avariar é uma v.a. com aseguinte função densidade probabilidade:

f(x) =k e−

x100 , x ≥ 0

0, x < 0

(a) Qual a probabilidade de o computador trabalhar entre 50 e 150 horas antes de avariar?(b) Qual a probabilidade de o computador funcionar menos de 100 horas até avariar? E exacta-

mente 100 horas?(c) Qual a probabilidade de o computador avariar após 200 horas de funcionamento, sabendo que

já funcionou mais de 100 horas?

2.8 (Exame de P.E. 2006/07) Seja X uma variável aleatória com função densidade

f(x) =

c(1 + x), −1 < x ≤ 0;c(1− x

2 ), 0 < x < 2;0, outros valores de x;

(a) Mostre que c = 2/3 e determine a função de distribuição.(b) Calcule P (X ≤ 0|X ≤ 1).

Page 97: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.2. VARIÁVEIS ALEATÓRIAS 91

2.9 Determine o valor médio e a variância da variável aleatória discreta X com função de probabilidade:P (X = 0) = 1

8 P (X = 1) = 38 f(2) = 3

8 P (X = 3) = 18 . Calcule ainda:

E(g(X)), com g(X) = X3, E(

11+X

)e E(X2).

2.10 Seja X uma v.a. tal que P (X = 0) = 14 , P (X = 1) = p

2 , P (X = 2) = 58 −

p2 e P (X = 3) = 1

8 ,com 0 ≤ p ≤ 1

2 . Determine p de forma a que V (X) seja mínima.

2.11 Numa lotaria foram emitidos 10000 bilhetes. Sorteia-se 1 prémio de 25000 unidades monetárias(u.m.) e 10 prémios de 2500 u.m.. Seja X a v.a. que representa o valor do prémio de um bilhetequalquer.

(a) Determine a função de probabilidade de X.(b) Qual a probabilidade de um bilhete não ter qualquer prémio?(c) Qual a probabilidade de um bilhete ter pelo menos 2500 u.m.?(d) Determine o E(X), V (X) e CV (X).

2.12 Uma comissão de alunos está a organizar uma festa da faculdade. Os alunos vão comprar 200 litrosde cerveja. Um fornecedor deste líquido (A) cobra 1 unidade monetária (u.m.) por litro permitindoa devolução da cerveja que sobrar (e que não tem de ser paga) e um outro fornecedor (B) cobra0.5 u.m. por litro, não admitindo devoluções. Os alunos, independentemente de quanto lhes custea cerveja, cobram 1.5 u.m. por litro.Sabendo que, se estiver bom tempo - o que acontecerá com probabilidade 0.8 - os alunos conseguemvender os 200 litros de cerveja, mas se estiver mau tempo só vendem metade, a quem devem comprar?

2.13 Seja X uma v.a. com a seguinte função de distribuição:

F (x) =

0, x < 01− (x+ 1)e−x, x ≥ 0

(a) Determine a função densidade probabilidade de X.(b) Determine E(X) e V (X).

2.14 Determine E(X), E(X − 1), V (X), E(X(X − 1)), E(eX), a mediana e o coeficiente de variaçãoda v.a. X, que tem a seguinte função densidade probabilidade:

f(x) =

x2 , 0 ≤ x ≤ 112 , 1 < x ≤ 2

3−x2 , 2 < x ≤ 30, x < 0 ∨ x > 3

2.15 A v.a. X tem a seguinte função densidade probabilidade:

f(x) =

k sin(x), 0 ≤ x ≤ π0, c.c.

(a) Determine o valor da constante k.(b) Determine E(X) e E(cos(X)).

(c) Sabendo que V (X) = π2

4 − 2, determine E(X2).(d) Determine V (5X − 4).

Page 98: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

92 CAPÍTULO 10. EXERCÍCIOS

2.16 (Teste de P.E. D - 2008/09) Uma empresa de produtos químicos fabrica um composto que vendeem doses unitárias de 1 litro. Suponha que a fracção de álcool numa dose unitária do composto éuma variável aleatória X, com função densidade de probabilidade dada por:

f(x) =

kx3(1− x), 0 ≤ x ≤ 1;0, outros valores de x;

(a) Mostre que k = 20.(b) Determine a função de distribuição.(c) Sabendo que E(X2) = 10/21, calcule V (5X − 1).(d) Sabe-se que o custo de produção de uma dose de composto é sempre 0.8e/l, mas o seu preço

de venda em e/l, V , depende do valor de X que lhe corresponde, sendo definido da seguinteforma:

V =

1.2, 1/3 ≤ X ≤ 2/3;1.0, outros valores de X;

Obtenha a função de probabilidade da variável aleatória, L = V −0.8, o lucro obtido por cadadose daquele composto.

Page 99: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.3. VECTORES ALEATÓRIOS 93

10.3 Vectores Aleatórios3.1 (Teste de P.E. 2006/07) Numa empresa de construção, o número Y de novos trabalhadores por

semana, é uma variável aleatória de valor médio 3815 . O número de acidentes de trabalho que

ocorrem por semana na mesma empresa, X, é também uma variável aleatória. O quadro que sesegue tem a função de probabilidade conjunta de (X,Y ).

X\Y 0 2 a

0 c 2c 3c1 2c 3c 4c

(a) Complete a função de probabilidade conjunta e calcule E(Y (Y − 1)) e P (X + Y ≥ 3).(b) Qual a probabilidade de ocorrer um acidente de trabalho, numa semana onde foram admitidos

dois novos trabalhadores?(c) Determine a covariância entre as variáveis X e Y . Comente o resultado.

3.2 Numa empresa de aluguer de aviões informam-nos de que a procura diária de aviões de passageiros,X, e a procura diária de aviões de transporte rápido de correio, Y , constituem um par aleatório(X,Y ), cuja função de probabilidade conjunta é dada por:

X \ Y 0 1 20 0 0.251 0.05 0.352 0.1 0.1 p+ 0.23 0 0.1 p

0.2 0.5

(a) Qual a probabilidade de, num dia, a procura de aviões de passageiros ser inferior à procura deaviões de transporte rápido de correio?

(b) Determine a função de probabilidade de X|Y = 1 e calcule E(X|Y = 1).(c) Para um dia em que foi pedido um avião de transporte rápido de correio, qual a probabilidade

de terem sido procurados 1 ou 2 aviões de passageiros?(d) Qual a procura diária média de aviões de passageiros?(e) Deduza a função de probabilidade da procura total diária de aviões de aluguer.(f) Determine a procura diária total média de aviões de aluguer.(g) Sabendo que V (X) = 0.8875, determine Cov(X,Y ), V (X − 2Y ) e ρ(X,Y ).

3.3 (Exame de P.E. 2006/07) Seja (X,Y ) um par aleatório, onde X representa o número diário deimóveis vendidos numa agência imobiliária e Y a v.a. definida por:

Y =

0, se a agência imobiliária não fecha durante o horário de almoço;1, se a agência imobiliária fecha durante o horário de almoço;

Sabe-se que:

• X tem distribuição B(2, 0.6) e os valores da v.a. Y ocorrem com a mesma probabilidade.• Os acontecimentos X = 1 e Y = 0 são independentes.• P (X = 2, Y = 1) = 0.12.

(a) Construa a tabela da função de probabilidade conjunta e marginais associada ao par aleatório(X,Y ).

Page 100: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

94 CAPÍTULO 10. EXERCÍCIOS

(b) As variáveis X e Y são independentes? Justifique.(c) Calcule V (Y − 2X).(d) Qual a probabilidade de venderem 2 imóveis, nos dias em que a agência não fecha durante o

período de almoço?

3.4 Numa fábrica produzem-se ratos de computador, que podem sofrer de dois tipos diferentes dedefeitos - digamos A e B. Para cada rato produzido definem-se duas variáveis aleatórias, X e Y ,representando, respectivamente, o número de defeitos do tipo A e do tipo B a si associados:

X =

0, rato sem defeito do tipo A1, rato com defeito do tipo A Y =

0, rato sem defeito do tipo B1, rato com defeito do tipo B

Sabendo que P (Y = 0) = 0.80, P (X = 1|Y = 1) = 0.7 e P (X = 1|Y = 0) = 0.1:

(a) Determine a função de probabilidade conjunta do par aleatório (X,Y ).(b) Justifique se para cada rato o número de defeitos do tipo A é independente do número de

defeitos do tipo B.(c) Calcule a P (X < Y ).(d) Qual a probabilidade de o número total de defeitos num qualquer rato da produção ser inferior

a 2?

3.5 Suponhamos que M1 e M2 são duas máquinas que funcionam independentemente e sejam X e Yvariáveis aleatórias que representam, respectivamente, no diário de avarias de M1 e o no diário deavarias de M2. Sabendo que:

• A máquina M1 nunca avaria mais do que uma vez por dia e, que a máquina M2 avaria, nomáximo, duas vezes por dia;

• A probabilidade de M1 não avariar é de 0.7;• A probabilidade de M2 não avariar é 0.5 e a de avariar duas vezes é 0.3,

Construa a tabela da função de probabilidade conjunta e marginais associada ao par aleatório (X,Y ).

3.6 Sejam X e Y duas v.a.’s tais que V (X) = σ2 e V (Y ) = 2σ2. Considere novas v.a.’s, T = 2X + Ye W = X − Y . Sabendo que V (W ) = σ2, calcule:

(a) O coeficiente de correlação entre X e Y .(b) V (T ).(c) Cov(W,T ).

3.7 Seja (X,Y ) um par aleatório para o qual V (X) = V (Y ) = σ2 e coeficiente de correlação ρ. Sejamas novas v.a.’s U = X + Y e W = X − Y . Mostre que V (W ) = 2σ2(1− ρ) e Cov(U,W ) = 0.

3.8 Seja (X,Y ) um par aleatório com a seguinte função densidade probabilidade conjunta:

f(x, y) =

k(x+ 2y), 0 < x < 1, 0 < y < 10, c.c.

(a) Determine k.(b) Determine as funções densidade marginais de X e Y .(c) As variáveis X e Y são independentes?

Page 101: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.3. VECTORES ALEATÓRIOS 95

(d) Calcule P ( 15 < X < 2

5 ), e P (X < Y ).(e) Calcule P ( 1

5 < X < 25 |Y > 1

2 ).

3.9 Seja (X,Y ) um par aleatório com a seguinte função densidade probabilidade conjunta:

f(x, y) =k, x > 0, y < 0, y > x− 20, restantes valores de (x, y)

(a) Determine k.(b) As variáveis X e Y são independentes?

Page 102: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

96 CAPÍTULO 10. EXERCÍCIOS

10.4 Principais distribuições4.1 Um consumidor queixou-se às autoridades que no supermercado do Sr. Manuel se vendiam latas de

cogumelos com o prazo de validade ultrapassado. No seguimento desta denúncia um inspector dasactividades económicas dirigiu-se ao referido supermercado e seleccionou, ao acaso e sem reposição,6 latas - do total de 50 que o Sr. Manuel ainda tinha para vender.Como na realidade ainda restavam 7 latas com o prazo de validade ultrapassado, qual a probabilidadede o Sr. Manuel ser multado (isto é, de o inspector descobrir pelo menos uma lata com o prazoultrapassado)?

4.2 De forma a proceder a uma classificação geral do estado das praias Portuguesas, uma comissãoEuropeia vai inspeccionar 10 praias, seleccionadas ao acaso de entre as 100 existentes. A comissãoatribui a classificação de Bom se pelo menos 8 das 10 praias inspeccionadas estiverem em bomestado. Sabendo que, da totalidade das 100 praias, 15 não apresentam boas condições, qual aprobabilidade de Portugal:

(a) Obter uma classificação de Suficiente, pelo facto da comissão só ter encontrado 7 praias embom estado?

(b) Obter uma boa classificação?(c) Se a comissão só inspeccionasse 5 praias, qual a probabilidade de não encontrar nenhuma em

mau estado?(d) Nas praias inspeccionadas quantas se esperam que estejam em bom estado?

4.3 O senhor Sousa tem uma empresa que compra e vende selos e outros artigos de coleccionismo. Eleguarda 20 selos dentro de uma bolsa preta, estando ainda cada um deles metido num envelopeopaco. 6 destes selos valem 100 euros cada um e os restantes nada valem. O senhor Sousa, parapromover a venda, cobra 20 euros por cada selo, mas não permitindo que o cliente veja o conteúdodo envelope. Suponha que um cliente compra 5 selos.

(a) Qual a probabilidade dos cinco selos nada valerem?(b) Qual a probabilidade do cliente não perder nem ganhar dinheiro com a compra?

4.4 Num determinado percurso de avião, a probabilidade de uma pessoa qualquer que aí viaje pedir umarefeição vegetariana é de 0.2. Supondo que em determinado dia viajam 10 pessoas no avião, calculea probabilidade de:

(a) Ninguém pedir refeição vegetariana.(b) Todos pedirem refeição vegetariana.(c) Pelo menos uma pedir refeição vegetariana.

4.5 Determinado exame é constituído por 5 questões de escolha múltipla, em que cada questão tem 4opções de resposta possíveis - apenas uma sendo a correcta. Supondo que um aluno que vai fazero exame responde a tudo ao acaso, qual é a probabilidade de ele acertar a mais de metade dasquestões? Qual é o número médio de respostas correctas? E o seu desvio padrão?

4.6 Sabe-se que 5% dos copos produzidos em determinada fábrica apresentam pequenos defeitos.Seleccionando-se da produção da fábrica, ao acaso, 50 copos, qual a probabilidade de:

(a) Nenhum ser defeituoso?(b) Um ser defeituoso?(c) No máximo 1 ser defeituoso?(d) Calcule o número médio de copos defeituosos nesta amostra e o seu desvio padrão.

Page 103: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.4. PRINCIPAIS DISTRIBUIÇÕES 97

4.7 Na sala de aula de uma escola, 2 meninos lançam ao ar moedas equilibradas. O João faz 10lançamentos e o Pedro 15. Qual a probabilidade de, no total dos lançamentos, saírem exactamente12 caras?

4.8 Verifica-se que, relativamente a um determinado dado, quando ele é lançado, a probabilidade de sairum número par é duas vezes superior à probabilidade de sair um número ímpar.

(a) Se X representar a v.a. que conta o número de vezes que sai um número par em 4 lançamentosdeste dado, determine a sua função de probabilidade.

(b) Considere a v.a. Y = “número de lançamentos necessários até obter um número ímpar”.i. Qual o valor médio, coeficiente de variação e moda de Y ?ii. Qual a probabilidade de ser necessário lançar 4 vezes o dado, para obter um número

ímpar?iii. Qual a probabilidade de ser necessário lançar pelo menos 2 vezes o dado, para obter um

número ímpar?

4.9 Numa prisão existem 1500 presos, dos quais 4% cometeram homicídio por envenenamento. Seleccio-nando-se aleatoriamente 8 presos para executarem os trabalhos na cozinha da prisão, qual a proba-bilidade de que 2 deles sejam deste tipo de homicidas?

4.10 Uma lista de clientes de uma empresa é constituída por 1000 endereços de clientes. Destes, 300compraram nos últimos 3 meses, pelo menos um produto da empresa. Com o objectivo de avaliarda aceitação de um novo produto, 25 clientes daquela lista foram escolhidos ao acaso e sondadosacerca do novo produto. Qual a probabilidade de no máximo 2 dos 25 clientes escolhidos, fazeremparte do grupo dos que realizaram alguma compra durante os últimos 3 meses?

4.11 O número de chamadas de emergência que um serviço de ambulâncias recebe por dia é uma v.a. dePoisson. Sabendo que a probabilidade de não haver nenhuma chamada num dia é de 0.15, calcule:

(a) a probabilidade de haver apenas uma chamada num dia.(b) a probabilidade de haver 2 chamadas num dia.(c) a probabilidade de haver no máximo 3 chamadas num dia.(d) a probabilidade de haver pelo menos 4 chamadas num dia.(e) o número médio de chamadas por dia, o seu desvio padrão e coeficiente de variação.

4.12 Suponha que X é uma v.a. com distribuição de Poisson. Se P (X = 2) = 23P (X = 1), calcule

P (X = 0) e P (X = 3).

4.13 Suponha que, o número de pessoas que utilizam uma caixa multibanco é um processo de Poissonde taxa λ = 10/hora. Calcule;

(a) a probabilidade de não ir ninguém à caixa multibanco durante 1 hora.(b) a probabilidade de irem 20 pessoas à referida caixa durante 4 horas.(c) O número médio de visitas à caixa multibanco durante 4 horas e o seu coeficiente de variação.

4.14 Na portagem da ponte 25 de Abril o número de veículos automóveis que passa em cada cabine depagamento da portagem, por minuto, segue uma distribuição de Poisson com valor médio 1 veículo.Supondo que em determinado minuto estão abertas 10 cabines, qual a probabilidade de serem, nototal, atendidos 11 condutores nesse minuto?

4.15 Suponha que num livro de 500 páginas existem 300 erros tipográficos, distribuídos aleatoriamentepor todo o livro. Assumindo que o número de erros segue uma distribuição de Poisson, determine aprobabilidade de uma dada página conter:

(a) 2 erros tipográficos.

Page 104: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

98 CAPÍTULO 10. EXERCÍCIOS

(b) Pelo menos 2 erros tipográficos

4.16 Um grande armazém de venda de material de vidro de laboratório emprega 100 pessoas. Tem-severificado que o número de peças quebradas, por empregado e por mês, segue uma distribuição dePoisson de valor médio 1.5. Cada peça partida representa um prejuízo de 40 cêntimos, pelo que oarmazém só arca com a despesa de um máximo de 3 peças por mês e por empregado. A partir destevalor é no salário do empregado que se desconta a despesa.

(a) Qual a probabilidade de um empregado escolhido ao acaso ter de pagar do seu bolso algumprejuízo num qualquer mês?

(b) Considere agora a variável aleatória que representa o prejuízo do armazém, por mês e porempregado. Determine a sua função de probabilidade, qual é esse prejuízo médio e o seudesvio padrão.

4.17 Em determinada empresa 2% das chamadas telefónicas recebidas são enganos. Qual a probabilidadeaproximada de, em 200 telefonemas, haver pelo menos 2 enganos? Qual o número médio de enganos?

4.18 Numa feira popular a probabilidade de uma pessoa contrair uma intoxicação alimentar é de 0.0005.Determine a probabilidade de, em 300 pessoas, 2 ficarem intoxicadas.

4.19 Determinado jogo consiste em acertar com um dardo num segmento de recta de comprimento 1metro, colocado na posição horizontal. Admitindo que se acerta apenas sobre o segmento de recta(e não fora dele) e que se tem igual probabilidade de acertar em qualquer ponto:

(a) Identifique a função densidade probabilidade da v.a. X que representa a distância, em metros,do ponto onde se acertou ao extremo esquerdo do segmento.

(b) Calcule P (0.4 < X < 0.6).(c) Qual o valor médio do ponto onde se acerta? E o seu coeficiente de variação?(d) Calcule P (0.4 < X < 0.6|X > 0.5).(e) Seja A =]0.4, 0.6[, a região central do segmento de recta compreendida entre os 4cm e os

6cm. Qual a probabilidade de, em 5 lançamentos do dardo, acertar 3 vezes em A?

4.20 Num posto dos correios o tempo (minutos) que a D. Hermínia demora a atender cada um dos seusclientes é uma v.a. exponencial de valor médio 3 minutos. Determine:

(a) A função de distribuição de X.(b) A probabilidade de um cliente demorar mais de 5 minutos a ser atendido.(c) A probabilidade de um cliente demorar mais de 3 minutos a ser atendido.(d) A probabilidade de um cliente demorar mais de 5 minutos a ser atendido, sabendo que já está

a ser atendido há pelo menos 2 minutos. Compare com a probabilidade anterior e comente.(e) O coeficiente de variação do tempo de atendimento.

4.21 Admita que os clientes chegam a uma loja de acordo com um processo de Poisson de média λ =2/minuto. Calcule a probabilidade:

(a) do tempo entre chegadas consecutivas ser superior a um minuto.(b) do tempo entre chegadas consecutivas ser inferior a quatro minutos.(c) do tempo entre chegadas consecutivas estar entre um e dois minutos.(d) do tempo de espera pelo terceiro cliente ser superior a 5 minutos.

4.22 Demonstre o Teorema 4.29.

4.23 Seja X uma v.a. com distribuição N(100, 202). Calcule:

(a) P (X < 125).

Page 105: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.4. PRINCIPAIS DISTRIBUIÇÕES 99

(b) P (X > 115).(c) P (60 < X < 140).

4.24 Seja X uma v.a. normal com média 12 e variância 2. Determine c tal que:

(a) P (X < c) = 0.1.(b) P (X > c) = 0.25.(c) P (12− c < X < 12 + c) = 0.95.

4.25 Admita que o Q.I. das pessoas de determinado país é uma v.a. X com distribuição normal de média90 e desvio padrão 12. Determine:

(a) A percentagem da população com Q.I. entre 85 e 95.(b) A percentagem da população com Q.I. entre 78 e 102.(c) O valor c > 0 tal que a percentagem da população com Q.I. entre 90− c e 90+ c seja de 95%.(d) 10000 pessoas desta população concorreram ao selecto clube SMART, que apenas admite

indivíduos com Q.I. superior a 120. Quantas destas pessoas espera o clube vir a admitir?

4.26 A altura (metros) a que crescem os pinheiros é uma v.a. X normalmente distribuída com desviopadrão igual a 1 metro. Supondo que 90% dos pinheiros atingem uma altura de pelo menos 16metros, qual a altura média dos pinheiros?

4.27 Numa fábrica de embalar arroz este trabalho é executado por uma máquina. A quantidade de arroz(Kg) que entra nos pacotes é uma v.a. X seguindo uma distribuição normal de valor médio µ edesvio padrão σ.

(a) Determine σ sabendo que a quantidade embalada difere da sua média por menos de 100g, em95 % dos casos.

(b) Supondo que µ = 1Kg, determine a probabilidade de, em 10 pacotes de arroz embalados poresta máquina, 2 terem menos de 0.9Kg.

4.28 Considere X uma v.a. Normal de valor médio 2 e variância 9. Seja I um intervalo do tipo [4−a, a].Determine o valor de a de modo a que P (X ∈ I) = 0.90.

4.29 A altura (metros) a que um atleta salta é uma v.a. Normal de média 1.8m e desvio padrão 20cm.Sabendo que 20% das vezes o atleta consegue saltar acima de h, determine h.

4.30 Num jardim zoológico existem um leão e um tigre que consomem, independentemente um do outro,o mesmo tipo de alimentação - carne de 2a. A quantidade de carne (Kg) que cada um deles comepor dia são variáveis aleatórias, representadas por X1 para o leão e X2 para o tigre, respectivamente,normalmente distribuídas com média 4Kg e desvio padrão 0.5Kg. Determine a probabilidade de,num determinado dia:

(a) Ambos os animais comerem menos de 3Kg de carne cada.(b) O leão comer mais do que o tigre.(c) Metade do que o leão come juntamente com 3

4 do que o tigre come, exceder os 4Kg.

4.31 Um restaurante vende comida a peso e constatou que a quantidade de comida vendida (Kg) temdistribuição Normal, dependendo os seus parâmetros de o cliente ser homem ou mulher - caso sejamulher a média é de 0.4 Kg e o desvio padrão 0.1 Kg e caso seja homem a média é de 0.5 Kg eo desvio padrão é de 0.2 Kg. Sabendo que os clientes são 55% mulheres e 45% homens, e que aquantidade de comida consumida é independentes entre clientes:

(a) Determine a probabilidade de um cliente qualquer consumir menos de 0.5 Kg de comida.

Page 106: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

100 CAPÍTULO 10. EXERCÍCIOS

(b) Sabendo que um cliente consumiu mais de 0.6 Kg de comida, qual a probabilidade de serhomem?

(c) Num grupo de 4 mulheres e 6 homens qual a probabilidade de se consumir menos de 5 Kg decomida?

4.32 (Teste de PE 2006/07) Um elevador está preparado para suportar uma carga até 450 kg. Sempreque este valor é ultrapassado o elevador não funciona. Um estudo recente indica que o peso, daspessoas que utilizam esse elevador, é uma variável aleatória com distribuição Normal de valor médio70 kg.

(a) Sabendo que a probabilidade de uma pessoa (que utiliza o elevador) pesar menos de 60 kg é0.0228, determine o desvio padrão desta variável aleatória.

(b) Se entrarem 6 pessoas no elevador, qual a probabilidade de o elevador não funcionar devidoao excesso de peso?

4.33 (Teste de P.E. D 2005/06) Um foguete espacial é constituído por 3 partes distintas, cápsula, corpoe depósitos. Representem as v.a.’s X, Y e W o peso da cápsula, o peso do corpo do foguete e opeso dos depósitos, respectivamente, em toneladas. Sabe-se que X ∼ N(5, 1), Y ∼ N(10, 22) eW ∼ N(7, 22), sendo as três variáveis independentes entre si.

(a) Qual a probabilidade de o peso da cápsula estar compreendido entre 3 e 7 toneladas?(b) Qual o peso h que o corpo do foguete ultrapassa em 2.5% das vezes?(c) Qual a probabilidade de o peso da cápsula mais o peso dos depósitos excederem o peso do

corpo do foguete?

4.34 Admita que X é uma v.a. com distribuição t com 14 graus de liberdade, X ∼ t14. Determine ovalor de c, tal que:

(a) P (X ≤ c) = 0.75;(b) P (X ≤ c) = 0.05;(c) P (|X| > c) = 0.4.

4.35 Suponha que X é uma v.a. com distribuição χ2 com 10 graus de liberdade, X ∼ χ210. Determine

o valor de c, tal que:

(a) P (X ≤ c) = 0.95;(b) P (X ≤ c) = 0.05.

Page 107: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.5. TEOREMA LIMITE CENTRAL 101

10.5 Teorema Limite Central5.1 Numa loja de conveniência cada pessoa gasta, em média, 10e, com um desvio padrão de 3.75e. Qual

a probabilidade de 100 clientes gastarem mais de 1100e, admitindo que os gastos são independentesde pessoa para pessoa?

5.2 O número de sismos no Japão, por mês, é uma v.a. com média 5 sismos e desvio padrão 2 sismos.Admitindo que os sismos são independentes entre si, determine a probabilidade de nos próximos 40anos haver no máximo 2300 sismos.

5.3 Uma empresa vende caixas com biscoitos e, quando lhe é solicitado, envia-as pelo correio. Paraevitar pesar estas caixas, cobra sempre o valor de portes de correio correspondente a admitir quequalquer caixa pesa 2508g.Cada caixa leva 100 biscoitos e o peso da embalagem plástica é desprezável.Se soubermos que o peso de cada biscoito é variável mas que em média pesa 25g com um desviopadrão de 8g, determine a probabilidade do valor pago em portes de correio com o envio de umacaixa ser inferior ao valor que pagaria, caso a caixa fosse pesada.

5.4 Ao adicionar números, um computador arredonda cada número para o inteiro mais próximo. Admitaque os erros cometidos são v.a.’s independentes e identicamente distribuídas (i.i.d.) com valor médioigual a 0 e variância igual a 1/12.Se 1200 números forem adicionados, qual a probabilidade aproximada de que o erro total cometidonão ultrapasse 15.4?

5.5 Envelopes de avião são empacotados em grupos de 100, sendo depois pesados. Supondo que opeso de cada envelope é uma v.a. com valor médio igual a 1 grama e desvio padrão de 0.05 g,independentemente de envelope para envelope, determine:

(a) a probabilidade de que um pacote, com exactamente 100 envelopes, pese mais de 100.5 g.(b) a probabilidade de que a média dos pesos dos 100 envelopes de um pacote, diste do respectivo

valor médio por uma quantidade superior a 0.01g.

5.6 Numa determinada estufa de produção de tulipas vão-se semear 240 bolbos desta flor. Sabe-se queem média cada bolbo produz 4 flores, com um desvio padrão de 2 flores. Qual a probabilidadeaproximada de se conseguir obter uma produção final de mais de 1000 tulipas? Justifique.

5.7 Na população das mulheres cerca de 20% estão grávidas. Supondo que se selecciona ao acaso 250mulheres, qual a probabilidade de que 50 estejam grávidas? E qual a probabilidade de que pelomenos 50 estejam grávidas?

5.8 Um aviário vende ovos em caixas de 1 dúzia, verificando-se que cerca de 1% dos ovos se partem notransporte para os seus locais de comercialização. Num contentor com 80 caixas qual a probabilidadede se encontrarem entre 5 e 15 ovos partidos?

5.9 O número de utentes diários de uma máquina de venda de selos tem uma distribuição de Poissoncom valor médio 20. Determine a probabilidade de num mês de 30 dias:

(a) Usarem a máquina entre 580 e 621 pessoas.(b) Usarem a máquina 580 pessoas.

5.10 Sabe-se que o número de automóveis que entram numa auto-estrada num período de 10 segundosé uma v.a. com distribuição de Poisson de valor médio 3.Qual a probabilidade aproximada de entrarem 20 ou mais automóveis durante 30 segundos?

Page 108: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

102 CAPÍTULO 10. EXERCÍCIOS

10.6 Estimação Pontual6.1 Considere a população formada pelo número de filhos por família (X) num determinado país, em que

X = 0, 1, 2, 3, 4 (não há famílias com mais de 4 filhos). Suponha que se conhece a sua distribuiçãode probabilidade:

X

0 1 2 3 4

0.15 0.25 0.30 0.20 0.10

(a) Quais os valores populacionais de µ e σ2?(b) Desta população recolhe-se uma amostra aleatória constituída por 2 famílias - (X1, X2). Qual

a distribuição de probabilidade de X1 e X2 e os respectivos parâmetros µ e σ2?(c) Suponha que recolheu a seguinte amostra aleatória de 10 famílias:

(1, 3, 0, 0, 2, 3, 0, 2, 4, 1).

Com base nesta amostra estime pontualmente µ e σ2. Estime ainda o erro padrão da estimativade µ. Comente.

6.2 Considere que se seleccionou uma amostra aleatória (X1, X2, . . . , Xn) de uma população com valormédio µ e variância σ2.

(a) Mostre que X =∑ni=1 Xi

né estimador centrado e consistente da média populacional.

(b) Mostre que θ1 = X1 +Xn

2 e θ2 = 2X1 + 3X2 + 5X3

10 também são estimadores centrados deµ. Qual é melhor? São consistentes?

(c) Mostre que (X)2 não é estimador centrado de µ2.

6.3 Suponha que seleccionou uma amostra aleatória (X1, X2, . . . , Xn) de uma população com dis-tribuição U(0, θ), isto é, com função densidade:

f(x) = 1

θ , 0 ≤ x ≤ θ0, c.c.

(a) Mostre que 2X é o estimador dos momentos de θ.(b) Verifique se o estimador da alínea anterior é centrado e consistente.(c) Dada a amostra (1.215, 1.580, 0.726, 2.843, 3.394, 0.612, 2.621, 1.181, 2.930, 0.317), estime

o valor de θ. Nota:∑xi = 17.42.

6.4 (Teste de P.E. - 2006/07) Seja (X1, X2, . . . , Xn) uma amostra aleatória, extraída de uma populaçãocom distribuição Geométrica.

(a) Determine o estimador de p usando o método dos momentos e o método da máxima verosi-milhança.

(b) Determine o estimador de máxima verosimilhança do valor médio de X. Verifique se o esti-mador é consistente para a estimação do valor médio.

6.5 Considere a experiência aleatória que consiste em contar o número de vezes que se lança umdado (eventualmente não equilibrado) até sair um número par. Em 15 realizações da experiên-cia obtiveram-se os seguintes resultados:

1 9 2 2 1 9 2 3 1 1 4 1 7 2 1

(a) Estime a probabilidade de sair um número par (num lançamento do dado).(b) Estime a probabilidade de ser necessário lançar mais de 2 vezes o dado para obter um número

par.

Page 109: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.6. ESTIMAÇÃO PONTUAL 103

6.6 Considere a amostra aleatória (X1, X2, . . . , Xn) de uma população com distribuição Bin(r, p), comr conhecido.

(a) Determine o estimador dos momentos de p.(b) Verifique que a função log-verosimilhança é:

l(p) =n∑i=1

ln(r

xi

)+ ln(p)

n∑i=1

xi + ln(1− p)(nr −n∑i=1

xi), se xi ∈ 0, 1, . . . , r.

(c) Determine o estimador de máxima verosimilhança de p.(d) Verifique se os estimadores obtidos, nas alíneas anteriores, são centrados e consistentes.

6.7 Considere a amostra aleatória (X1, X2, . . . , Xn) de uma população com com função densidade,

f(x) = θ

xθ+1 , x > 1 (θ > 0).

(a) Sabendo que E(X) = θθ−1 , θ > 1, determine o estimador dos momentos de θ.

(b) Verifique que a função log-verosimilhança é dada por:

l(θ) = n ln(θ)− (θ + 1)n∑i=1

ln(xi), se xi > 1, i = 1, . . . , n.

(c) Determine o estimador de máxima verosimilhança de θ.(d) Determine o estimador de máxima verosimilhança de β = 1/θ.

6.8 Sabe-se que a idade de determinada camada do subsolo segue uma distribuição Normal com médiade 0.5 milhões de anos e um desvio padrão de 20000 anos. Seleccionadas ao acaso 10 amostras desubsolo calcule a probabilidade de a média amostral das suas idades ser superior a 490000 anos.

6.9 Considere uma amostra aleatória de dimensão 25, extraída de uma população Normal de média 100e desvio padrão 10.

(a) Qual a probabilidade de a média amostral cair no intervalo de E(X) − 1.96 × SE(X) aE(X) + 1.96× SE(X)?

(b) Quanto deverá ser o tamanho amostral tal que a amplitude do intervalo definido em (a)diminua para 2.

6.10 O tempo de espera em pista para a descolagem de cada avião no aeroporto de Lisboa é uma v.a.com valor médio 4 minutos e desvio padrão 2.5 minutos. Suponha que se selecciona ao acaso 50aviões, para se registarem os seus correspondentes tempos de espera. Calcule a probabilidade de amédia dos tempos de espera exceder os 5 minutos.

6.11 Assuma que o número de ovos que as tartarugas verdes depositam nas praias, em cada desova, é umav.a. de Poisson, com valor médio 15 ovos. Seleccionando ao acaso uma amostra de 100 tartarugasverdes, qual a probabilidade de que a média do número de ovos destas esteja compreendido entre oseu valor médio e ± 3 vezes o seu erro padrão.

6.12 Suponha que o tempo de vida de determinada espécie de burros é uma v.a. com distribuiçãoexponencial, de valor médio 25 anos. Seleccionando ao acaso uma amostra de 40 burros destaespécie, qual a probabilidade de que a média dos seus tempos de vida seja inferior a 20 anos?

6.13 No país das Maravilhas a proporção de loucos é de 0.45. Suponha que se pretende seleccionar umaamostra aleatória de 500 habitantes deste país. Qual a probabilidade de a proporção de loucos quevão calhar na amostra exceder 0.5?

6.14 Numa população Normal de média desconhecida e desvio padrão 5 calcule a probabilidade de avariância de uma amostra aleatória de dimensão 20 dessa população estar compreendida entre 26 e58.

Page 110: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

104 CAPÍTULO 10. EXERCÍCIOS

10.7 Estimação por Intervalo de Confiança7.1 Para avaliar o peso médio das maçãs produzidas por um determinado agricultor analisaram-se 20

maçãs seleccionadas ao acaso da produção. Estas resultaram num peso médio de x = 320g. Assumaque os pesos das maçãs têm distribuição Normal com desvio padrão σ = 20g.

(a) Construa um intervalo de confiança a 90% para a média do peso.(b) Qual deve ser o tamanho da amostra de forma a que a amplitude do correspondente intervalo

de confiança a 90% para a média seja de 1g? E 5g? Comente.

7.2 A quantidade de combustível dispendido num percurso de Lisboa a Faro (em litros) é uma variávelaleatória normal.

(a) Assuma que em 8 viagens Lisboa-Faro seleccionadas ao acaso se verificou um gasto médio decombustível de 36 litros e um desvio padrão de 10 litros. Construa intervalos de confiançapara a média a 90% e a 95% e compare-os.

(b) Assuma agora que foi em 50 viagens Lisboa-Faro, seleccionadas ao acaso, que se verificou umgasto médio de combustível de 36 litros e um desvio padrão de 10 litros. Construa intervalosde confiança para a média a 90% e a 95% e compare com os anteriores. Comente.

7.3 O nível de poluição do ar de determinada cidade (medido em concentração de monóxido de carbonono ar) distribui-se normalmente. Recolheram-se os seguintes valores da referida concentração em10 dias diferentes (em ppm): 0.09, 0.33, 0.01, 0.25, 0.20, 0.05, 0.03, 0.18, 0.13, 0.24. Com basenesta amostra determine um intervalo de confiança a 99% para a concentração média de monóxidode carbono na atmosfera.

7.4 A quantidade de gordura em 100g de carne de determinado tipo de vacas, medido em gramas, temdesvio padrão 8g. Qual deve ser o tamanho de uma amostra aleatória a seleccionar de forma a que aamplitude de um intervalo de confiança a 95% para a gordura média por 100g de carne seja inferiora 2.5g? Refira eventuais pressupostos que teve de fazer.

7.5 Construa um intervalo de confiança a 95% para a temperatura média de uma determinada sala deespera, com base numa amostra de temperaturas recolhidas em 35 dias diferentes que resultaramnos valores x = 22.1oC e s = 3.2oC.

7.6 A tensão (MegaPascal) suportada por uma determinada barra de aço é uma variável aleatória comdesvio padrão igual a 30 MPa. Com base numa amostra aleatória de n tensões observadas, paraas quais se verificou que

∑xi = 10000MPa, construiu-se um intervalo de confiança a 95% para a

tensão média suportada, cujo extremo superior era de 208.3MPa. Determine o extremo inferior doreferido intervalo e diga quanto vale o n, assumindo que n > 30.

7.7 (Exame de P.E. D - 2008/09) A população das estaturas dos alunos da FCT, em metros, segueuma distribuição Normal. Recolheu-se a seguinte amostra aleatória de estaturas de 40 alunos destafaculdade:

1.79 1.80 1.72 1.82 1.57 1.78 1.78 1.66 1.78 1.801.75 1.74 1.60 1.77 1.82 1.82 1.75 1.66 1.84 1.771.78 1.78 1.69 1.78 1.52 1.72 1.84 1.65 1.71 1.791.76 1.70 1.63 1.71 1.70 1.64 1.59 1.63 1.74 1.71

correspondendo a uma média amostral de 1.73 e a um desvio padrão amostral de 0.08.

(a) Indique uma estimativa pontual, com base nesta amostra, para a verdadeira estatura médiapopulacional.

(b) Deduza e calcule um intervalo de confiança a 92% para a estatura média populacional.

7.8 O tempo médio (segundos) de reacção de uma determinada raça de cães a um certo estímulo teminteresse para um determinado treinador. Assim ele resolveu testar 32 cães escolhidos aleatoriamentetendo observado x = 1.2s e

∑(xi − x)2 = 15.5s2.

Page 111: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.7. ESTIMAÇÃO POR INTERVALO DE CONFIANÇA 105

(a) Construa um intervalo de confiança a 95% para o tempo médio de reacção dos cães.(b) Suponha que só se conseguiu obter uma amostra de 15 cães, tendo resultado em x = 1.1s

e∑

(xi − x)2 = 15.9s2. Construa, para este caso, um intervalo de confiança a 95% para otempo médio de reacção dos cães, referindo eventuais pressupostos que tenha tido de fazer.

7.9 Numa fábrica de embalagem de queijo em fatias seleccionaram-se aleatoriamente 100 embalagens,das quais se verificaram que 18 tinham peso inferior ao suposto - sendo por isso inadequadas.Construa um intervalo de confiança a 98%para a verdadeira proporção de pacotes inadequados naprodução total.

7.10 De 200 casos de pessoas com cancro do cólon, aleatoriamente detectadas, 12 morreram após 5 anosda detecção.

(a) Estime pontualmente a probabilidade de uma pessoa que contraia o cancro do cólon morrerapós 5 anos da sua detecção.

(b) Quanto deveria aumentar ao tamanho da sua amostra aleatória de forma a que a largura dointervalo de confiança a 90% para a probabilidade considerada na alínea anterior fosse inferiora 0.01?

7.11 O tempo (horas) que o Pedro dispende em filas de trânsito, por dia, é uma v.a. Normal. Seleccio-nando aleatoriamente 15 dias registaram-se os seguintes valores de espera:

1.5 1.0 1.0 2.0 1.5 1.25 1.0 2.0 1.5 1.25 1.75 0.5 1.0 1.5 1.25

Determine um intervalo de confiança a 99% para a variância do tempo de espera.

7.12 Um profissional de bowling jogou 8 partidas num torneio, tendo obtido as seguintes pontuações:

117.0 220.2 199.5 237.2 249.5 179.8 259.2 248.5

Admitindo a normalidade das pontuações, construa um intervalo de confiança a 95% para a variânciae para o desvio padrão (este último fornece uma medida da consistência da prestação do jogador).

Page 112: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

106 CAPÍTULO 10. EXERCÍCIOS

10.8 Teste de Hipóteses8.1 Uma fábrica de gelados afirma que a procura do gelado de chocolate no verão, por dia e em euros,

é uma v.a. Normalmente distribuída com valor médio e200 e desvio padrão e40. Numa amostraaleatória constituída por 10 dias seleccionados ao acaso do período de verão verificou-se que x = 216.

(a) Teste, ao nível de significância 5%, se de facto o consumo médio de gelado de chocolate noverão é de e200 por dia.

(b) Teste, ao ao nível de significância 5%, se de facto o consumo médio de gelado de chocolateno verão é menor do que e200 por dia.

(c) Qual a potência do teste, da alínea anterior, se µ = 190.(d) Resolva as duas primeiras alíneas usando o valor-p.

8.2 Um produtor de azeite afirma que a acidez média do seu azeite é de 0.9o. De forma a confirmar talfacto recolheu-se uma amostra aleatória da sua produção de azeite, tendo-se medido os seguintesvalores de acidez: 0.9 0.8 0.7 1.1 0.9 0.9 1.0 0.7 1.5 1.1. Admitindo a Normalidadeda acidez do azeite:

(a) Teste, ao nível de significância 1%, se o produtor tem razão.(b) Teste, ao ao nível de significância 1%, se a acidez média é superior a 0.9o.

8.3 Um biólogo pretende demonstrar que o peso médio de uma determinada espécie de coelhos - coelhosanões - é superior a 250g. Para tal seleccionou aleatoriamente 40 coelhos, tendo obtido uma médiados pesos de 255.3g e um desvio padrão de 30g. Teste ao nível de significância 10% se o biólogoestá certo, assumindo a Normalidade dos pesos dos coelhos.

8.4 A Inês recebe, para além do seu salário, vencimento correspondente a 2 horas extra que devia fazertodos os dias. Contudo ela está desconfiada que tem andado a trabalhar, em média, mais do que 2horas extra. Como a empresa onde trabalha regista sempre a hora de entrada e de saída dos seusfuncionários, ela seleccionou aleatoriamente 12 dias de trabalho passados e registou os seguintesvalores relativos ao horário extra: x = 2.3h e s = 0.5h. Admitindo a Normalidade do tempo extrade trabalho, teste a um nível de significância de 5%, se as suas suspeitas se confirmam.

8.5 Uma companhia de seguros tem previsto no seu orçamento um total de 5000e/dia para pagaras indemnizações dos seus segurados. De forma a confirmar se o valor médio das indemnizaçõespagas por dia está bem previsto seleccionaram-se, de anos anteriores, 100 dias, tendo-se verificadox = 5625e e

∑(xi−x)2 = 6187500e2. Teste, ao nível de significância 5%, se a previsão se adequa.

8.6 Numa fábrica de massas embalam-se pacotes de esparguete que deveriam ter peso médio de 500g.O peso dos pacotes é uma v.a. Normal com variância σ2 = 225g2. De forma a confirmar o pesomédio destes pacotes, seleccionaram-se ao acaso 40 embalagens que tinham um peso médio de495g. Teste, ao nível de significância 1%, se o peso médio das embalagens é menor do que as 500gindicadas.

8.7 Seja X uma v.a. com distribuição Normal de valor médio µ e desvio padrão σ. A partir de umaamostra de dimensão 30, retirada da população, obtiveram-se os seguintes resultados:

30∑i=1

xi = 64.030∑i=1

(xi − x)2 = 84.4

(a) Teste, ao nível de significância 1%, as hipóteses H0 : µ = 2 vs H1 : µ > 2.(b) Suponha que está a testar a hipótese H0 : µ = 2 contra a hipótese H1 : µ = 2.5 e que rejeita

a hipótese nula se X30 > 2.3. Calcule as probabilidades dos erros de 1a e 2a espécie do teste,se σ = 1.

8.8 Numa operação stop da brigada de trânsito, de 120 camiões TIR que foram parados, 42 iam comexcesso de peso. Com base nesta amostra aleatória, teste a hipótese de que a proporção deste tipode camiões, que circulam nas nossas estradas em situação ilegal, ultrapassa os 30%. Use um nívelde significância de 10%.

Page 113: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.8. TESTE DE HIPÓTESES 107

8.9 (Exame de P.E. D - 2008/09) A população das estaturas dos alunos da FCT, em metros, segueuma distribuição Normal. Recolheu-se a seguinte amostra aleatória de estaturas de 40 alunos destafaculdade:

1.79 1.80 1.72 1.82 1.57 1.78 1.78 1.66 1.78 1.801.75 1.74 1.60 1.77 1.82 1.82 1.75 1.66 1.84 1.771.78 1.78 1.69 1.78 1.52 1.72 1.84 1.65 1.71 1.791.76 1.70 1.63 1.71 1.70 1.64 1.59 1.63 1.74 1.71

correspondendo a uma média amostral de 1.73 e a um desvio padrão amostral de 0.08. Teste ahipótese de que a verdadeira proporção de alunos com estatura superior ou igual a 1.82m nestapopulação é maior que 0.2. Use um nível de significância de 5%.

8.10 Determinada desordem genética no sangue pode ser prevista com base num teste de sangue muitosimples. De forma a ter uma noção da proporção de pessoas que na população possam vir a teresta desordem, testaram-se 100 pessoas, seleccionadas ao acaso, para as quais 14 testes derampositivo. Efectue um teste de hipóteses, usando um nível de significância 5%, sobre se percentagemde pessoas com tal desordem é inferior a 10%.

8.11 No fabrico de parafusos admite-se, relativamente aos seus comprimentos, uma variabilidade máximade 0.5mm2. Recolheu-se uma amostra aleatória de 20 parafusos que se verificou terem s2 = 0.3.Admitindo a Normalidade do comprimento dos parafusos, teste, ao nível de significância de 5% sea especificação sobre a variabilidade do comprimento dos parafusos está a ser respeitada.

8.12 Com base na amostra aleatória seguinte, teste H0 : σ = 1.3 vs H1 : σ 6= 1.3, a um nível designificância de 1%: 2.0 3.2 5.0 1.8 3.4 2.6

8.13 A resistência de um determinado metal é dito ter uma variabilidade inferior a 0.01 ohm2. Testeesta hipótese, a um nível de significância 10%, usando a seguinte amostra aleatória de resistênciasmedidas para este metal:

0.14, 0.138, 0.143, 0.142, 0.144, 0.137

8.14 Considere novamente a amostra do exercício 8.9. Podemos considerar a amostra aleatória?

8.15 Considere a seguinte tabela de frequências de uma v.a. X:

Valores 0 1 2 3 4Frequência 4 21 10 13 2

(a) É a distribuição Binomial com n = 5 e p = 0.25 um modelo apropriado? Teste esta hipóteseao nível de significância de 5%.

(b) Determine um valor aproximado para o valor-p.

8.16 O gerente de uma loja pretende saber se os tempos entre chegadas de clientes à sua loja se com-porta probabilisticamente segundo uma distribuição exponencial. Para tal, registou os tempos entrechegadas consecutivas de clientes numa manhã. Esses tempos (em minutos) foram:

3.6 6.2 12.7 14.2 38.0 3.8 10.8 6.1 8.310.1 22.1 4.2 4.6 1.4 3.3 8.2 3.5 0.721.2 18.8 7.9 16.8 0.1 3.0 3.1 10.5 4.13.8 7.4 1.6 3.0 5.4 14.0 13.9 9.4

(a) Podemos considerar a amostra aleatória?(b) Teste a conjectura do gerente ao nível de significância 0.1. Nota: Numa distribuição expo-

nencial, o estimador de máxima verosimilhança de λ é dado por λ = 1X.

Page 114: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

108 CAPÍTULO 10. EXERCÍCIOS

8.17 Teste a um nível de significância 5% que a seguinte amostra aleatória provêm de uma distribuiçãoNormal(3, 22):1.14, 3.11, 3.55, 2.81, 6.28, 1.61, 4.36, 0.90, 0.81, −0.18, 2.08, 2.68, 2.12,−0.33, 2.57,3.55, 1.81, 2.56, 5.56, 2.46, 4.20, 1.63, 4.21, 4.85, 4.24, 3.98, 1.40, 3.00, 2.01, 3.31

8.18 Pensa-se que a altura a que os eucaliptos chegam aos 20 anos é uma v.a. Normal de média 2m. Parao confirmar seleccionou-se uma amostra aleatória de 30 eucaliptos, tendo observado as seguintesalturas:0.2, 0.8, 3.6, 1.0, 0.2, 4.3, 3.1, 0.4, 3.3, 3.1, 3.2, 5.3, 1.7, 0.2, 2.8, 0.4, 0.5, 3.0, 1.2, 4.2, 4.8,3.4, 2.1, 2.5, 2.4, 2.1, 0.8, 3.5, 1.7, 1.3Teste, ao nível de significância 1%, a conjectura referida.

8.19 (Teste de P.E. D - 2008/09) Teste a um nível de significância 5% que a seguinte amostra aleatóriaprovém de uma população com função de distribuição F , definida por:

F (x) =

0, x < 02x− x2, 0 ≤ x < 1

1, x ≥ 1

0.10, 0.33, 0.90, 0.43, 0.22, 0.42, 0.46, 0.68, 0.12, 0.51, 0.18, 0.03, 0.48, 0.24, 0.470.11, 0.52, 0.47, 0.32, 0.40, 0.01, 0.34, 0.32, 0.57, 0.51, 0.12, 0.06, 0.40, 0.07, 0.40

Para a realização do teste considere as classes ]0; 0.25], ]0.25; 0.5], ]0.5; 0.75] e ]0.75; 1[.

Page 115: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

10.9. REGRESSÃO LINEAR 109

10.9 Regressão Linear9.1 Determinada empresa está interessada em contabilizar o tempo que o ar condicionado está ligado

no verão, por dia, mediante a temperatura exterior (oC). Assim, seleccionaram-se 14 dias ao acaso,para os quais se mediram as temperaturas (x) e se registarem o número de horas de utilização doar condicionado (Y ):

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14xi 29 28 29 35 26 25 32 31 34 27 33 33 32 28Yi 10.5 9.0 10.4 18.6 5.5 5.2 11.6 10.4 17.8 9.9 13.7 14.2 12.3 8.7

(a) Disponha os dados em gráfico.(b) Estime a recta de regressão linear simples. Refira quais os pressupostos efectuados. Desenhe-a

no gráfico anterior.(c) Comente a qualidade da estimação efectuada, com base no coeficiente de determinação.(d) Teste a hipótese de o verdadeiro declive da recta de regressão ser nulo. Comente o resultado

à luz da alínea anterior.(e) Para uma temperatura exterior de 30oC qual o número de horas que estima que o ar condi-

cionado esteja a trabalhar? E para uma temperatura de 40oC?

9.2 Pretende-se modelar a velocidade do vento Y , medida em Km/h, com a altitude x a que se faza medição (m). Para tal registaram-se, para 9 valores de altitude, os correspondentes valores davelocidade do vento:

i 1 2 3 4 5 6 7 8 9xi 100 250 500 750 1000 1250 1500 1750 2000Yi 4 9 15 16 20 46 54 59 72∑

Y 2i = 14675 Y = 32.78

∑x2i = 12760000 x = 1011.11

∑Yixi = 427900

(a) Ajuste um modelo de regressão linear simples aos dados. O que pode dizer sobre a qualidadedo ajuste?

(b) Determine um intervalo de confiança a 95% para o verdadeiro declive da recta de regressão.(c) Use o resultado da alínea anterior para testar a hipótese de que o verdadeiro declive da recta

de regressão é nulo.

9.3 (Exame de P.E. D - 2005/06) Pretende-se averiguar se existe uma relação directa entre a proximidadecom campos de futebol da residência de casais e a taxa de divórcio. Assim registaram-se, em 5 locaisseleccionados ao acaso, o correspondente número de estádios de futebol num raio de 50Km (x) e arespectiva taxa de divórcio por 1000 habitantes registada nessas localidades (Y ):

No de campos de futebol, xi 0 1 2 5 6Taxa de divórcio (por 1000 habitantes), Yi 2.2 2.5 3.5 4.1 4.8

5∑i=1

xi = 14;5∑i=1

x2i = 66;

5∑i=1

Yi = 17.1;5∑i=1

Y 2i = 63.19;

5∑i=1

Yixi = 58.8; SQR = 0.2585075.

(a) Ajuste uma recta de regressão linear a estes dados. Que pode dizer da qualidade do ajuste?(b) Diga por suas palavras como interpreta o valor de β1 obtido.(c) Teste a hipótese do verdadeiro valor declive da recta de regressão, β1, ser nulo, a um nível de

significância 10%. O resultado está de acordo com a qualidade do ajuste discutida em (a)?(d) Numa localidade com 3 estádios de futebol na sua proximidade (menos de 50Km) quanto

prevê que valha a correspondente taxa de divórcio?

Page 116: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

110 CAPÍTULO 10. EXERCÍCIOS

9.4 (Exame de P.E. - 2006/07) Com o objectivo de estudar a qualidade do ar na região de Lisboa,pretende-se modelar a quantidade Y de Ozono troposférico (O3), com a quantidade x de partículasem suspensão com diâmetro aerodinâmico inferior a 10 µm (PM10). Para tal, registaram-se osseguintes dados:

xi 60.5 78.8 89.8 80.9 74.8 49.9 97.5 92.5 36.5 18.1 29.6 15.9yi 124.2 158 177.1 185.6 179.2 145.7 163.7 188.8 122.2 75.4 94.8 80.3∑xi = 724.8;

∑x2i = 53414.92; SY Y = 18620.05;

∑xiyi = 114890.35; σ2 = 237.44;

(a) Ajuste um modelo de regressão linear simples aos dados. Refira quais os pressupostos domodelo.

(b) Comente a qualidade do modelo.(c) Teste, ao nível de significância de 5%, a hipótese de o declive da recta de regressão ser nulo.(d) Prove que qualquer recta dos mínimos quadrados passa por (x, y).

Page 117: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Capítulo 11

TabelasFunção de distribuição Normal reduzida

Φ(z) = P (Z ≤ z) =∫ z

−∞1√2π exp

(−1

2 t2)dt

z 0 1 2 3 4 5 6 7 8 9.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389

1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .86211.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .88301.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90151.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .91771.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .93191.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .95451.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .97672.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .98172.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .98572.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .98902.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .99162.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .99362.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .99522.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .99642.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .99742.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .99812.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .99863 .9987 .9990 .9993 .9995 .9997 .9998 .9998 .9999 .9999 1.0000

Nota: Para z ≥ 4,Φ(z) ≈ 1.

111

Page 118: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

112 CAPÍTULO 11. TABELAS

Quantis

dadistribuição

tdeStudent

Quantis

dadistribuição

QuiQ

uadrado

α

g.l.

.55.6

.65.7

.75.8

.85.9

.95.975

.99.995

.9995

1.158

.325.510

.7271.00

1.381.96

3.086.31

12.731.8

63.7637

2.142

.289.445

.617.816

1.061.39

1.892.92

4.306.96

9.9231.6

3.137

.277.424

.584.765

.9781.25

1.642.35

3.184.54

5.8412.9

4.134

.271.414

.569.741

.9411.19

1.532.13

2.783.75

4.608.61

5.132

.267.408

.559.727

.9201.16

1.482.02

2.573.36

4.036.87

6.131

.265.404

.553.718

.9061.13

1.441.94

2.453.14

3.715.96

7.130

.263.402

.549.711

.8961.12

1.411.89

2.363.00

3.505.41

8.130

.262.399

.546.706

.8891.11

1.401.86

2.312.90

3.365.04

9.129

.261.398

.543.703

.8831.10

1.381.83

2.262.82

3.254.78

10.129

.260.397

.542.700

.8791.09

1.371.81

2.232.76

3.174.59

11.129

.260.396

.540.697

.8761.09

1.361.80

2.202.72

3.114.44

12.128

.259.395

.539.695

.8731.08

1.361.78

2.182.68

3.054.32

13.128

.259.394

.538.694

.8701.08

1.351.77

2.162.65

3.014.22

14.128

.258.393

.537.692

.8681.08

1.351.76

2.142.62

2.984.14

15.128

.258.393

.536.691

.8661.07

1.341.75

2.132.60

2.954.07

16.128

.258.392

.535.690

.8651.07

1.341.75

2.122.58

2.924.01

17.128

.257.392

.534.689

.8631.07

1.331.74

2.112.57

2.903.97

18.127

.257.392

.534.688

.8621.07

1.331.73

2.102.55

2.883.92

19.127

.257.391

.533.688

.8611.07

1.331.73

2.092.54

2.863.88

20.127

.257.391

.533.687

.8601.06

1.331.72

2.092.53

2.853.85

21.127

.257.391

.532.686

.8591.06

1.321.72

2.082.52

2.833.82

22.127

.256.390

.532.686

.8581.06

1.321.72

2.072.51

2.823.79

23.127

.256.390

.532.685

.8581.06

1.321.71

2.072.50

2.813.77

24.127

.256.390

.531.685

.8571.06

1.321.71

2.062.49

2.803.75

25.127

.256.390

.531.684

.8561.06

1.321.71

2.062.49

2.793.73

26.127

.256.390

.531.684

.8561.06

1.311.71

2.062.48

2.783.71

27.127

.256.389

.531.684

.8551.06

1.311.70

2.052.47

2.773.69

28.127

.256.389

.530.683

.8551.06

1.311.70

2.052.47

2.763.67

29.127

.256.389

.530.683

.8541.06

1.311.70

2.052.46

2.763.66

30.127

.256.389

.530.683

.8541.05

1.311.70

2.042.46

2.753.65

∞.126

.253.385

.524.674

.8421.04

1.281.64

1.962.33

2.583.29

α

g.l.

.005.01

.025.05

.1.2

.3.5

.7.8

.9.95

.975.99

.9951

.000.000

.001.004

.016.064

.148.455

1.071.64

2.713.84

5.026.63

7.882

.010.020

.051.103

.211.446

.7131.39

2.413.22

4.615.99

7.389.21

10.63

.072.115

.216.352

.5841.01

1.422.37

3.664.64

6.257.81

9.3511.3

12.84

.207.297

.484.711

1.061.65

2.193.36

4.885.99

7.789.49

11.113.3

14.95

.412.554

.8311.15

1.612.34

3.004.35

6.067.29

9.2411.1

12.815.1

16.76

.676.872

1.241.64

2.203.07

3.835.35

7.238.56

10.612.6

14.416.8

18.57

.9891.24

1.692.17

2.833.82

4.676.35

8.389.80

12.014.1

16.018.5

20.38

1.341.65

2.182.73

3.494.59

5.537.34

9.5211.0

13.415.5

17.520.1

22.09

1.732.09

2.703.33

4.175.38

6.398.34

10.712.2

14.716.9

19.021.7

23.610

2.162.56

3.253.94

4.876.18

7.279.34

11.813.4

16.018.3

20.523.2

25.211

2.603.05

3.824.57

5.586.99

8.1510.3

12.914.6

17.319.7

21.924.7

26.812

3.073.57

4.405.23

6.307.81

9.0311.3

14.015.8

18.521.0

23.326.2

28.313

3.574.11

5.015.89

7.048.63

9.9312.3

15.117.0

19.822.4

24.727.7

29.814

4.074.66

5.636.57

7.799.47

10.813.3

16.218.2

21.123.7

26.129.1

31.315

4.605.23

6.267.26

8.5510.3

11.714.3

17.319.3

22.325.0

27.530.6

32.816

5.145.81

6.917.96

9.3111.2

12.615.3

18.420.5

23.526.3

28.832.0

34.317

5.706.41

7.568.67

10.112.0

13.516.3

19.521.6

24.827.6

30.233.4

35.718

6.267.01

8.239.39

10.912.9

14.417.3

20.622.8

26.028.9

31.534.8

37.219

6.847.63

8.9110.1

11.713.7

15.418.3

21.723.9

27.230.1

32.936.2

38.620

7.438.26

9.5910.9

12.414.6

16.319.3

22.825.0

28.431.4

34.237.6

40.021

8.038.90

10.311.6

13.215.4

17.220.3

23.926.2

29.632.7

35.538.9

41.422

8.649.54

11.012.3

14.016.3

18.121.3

24.927.3

30.833.9

36.840.3

42.823

9.2610.2

11.713.1

14.817.2

19.022.3

26.028.4

32.035.2

38.141.6

44.224

9.8910.9

12.413.8

15.718.1

19.923.3

27.129.6

33.236.4

39.443.0

45.625

10.511.5

13.114.6

16.518.9

20.924.3

28.230.7

34.437.7

40.644.3

46.926

11.212.2

13.815.4

17.319.8

21.825.3

29.231.8

35.638.9

41.945.6

48.327

11.812.9

14.616.2

18.120.7

22.726.3

30.332.9

36.740.1

43.247.0

49.628

12.513.6

15.316.9

18.921.6

23.627.3

31.434.0

37.941.3

44.548.3

51.029

13.114.3

16.017.7

19.822.5

24.628.3

32.535.1

39.142.6

45.749.6

52.330

13.815.0

16.818.5

20.623.4

25.529.3

33.536.3

40.343.8

47.050.9

53.740

20.722.2

24.426.5

29.132.3

34.939.3

44.247.3

51.855.8

59.363.7

66.850

28.029.7

32.434.8

37.741.4

44.349.3

54.758.2

63.267.5

71.476.2

79.560

35.537.5

40.543.2

46.550.6

53.859.3

65.269.0

74.479.1

83.388.4

92.0

Page 119: ProbabilidadeeEstatística - Unidade Regionalizada de Sinopsinop.unemat.br/site_antigo/prof/foto_p_downloads... · 1.2. PROBABILIDADE 3 1.2 Probabilidade Em muitas experiência aleatórias

Bibliografia sugerida

• Guimarães e Cabral(1997). Estatística. McGraw-Hill.

• Montgomery e Runger (2002). Applied Statistics and Probability for Engineers. Wiley.

• Mood, Graybill e Boes (1974). Introduction to the Theory of Statistics. McGraw-Hill.

• Murteira, B., Ribeiro, C., Silva, J. e Pimenta, C. (2007). Introdução à Estatística, 2a

edição. McGraw-Hill

• Paulino e Branco (2005). Exercícios de Probabilidade e Estatística. Escolar Editora.

• Pestana, D. e Velosa, S. (2002). Introdução à Probabilidade e à Estatística. FundaçãoCalouste Gulbenkian, Lisboa.

• Rohatgi (1976). An Introduction to Probability Theory and Mathematical Statistics. Wiley.

• Sokal e Rohlf (1995). Biometry. Freeman.

• Tiago de Oliveira (1990). Probabilidades e Estatística: Conceitos, Métodos e Aplicações,vol. I, II. McGraw-Hill.

113