Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Universidade Estadual de Campinas
Modulo III - D6
Analise Combinatoria, ProbabilidadeNocoes de Estatıstica
Tema 1 - Elementos da Teoria de Conjuntos
Prof. Laura L. R. Rifo
- Novembro, 2010 -
Sumario
1 Elementos da teoria de conjuntos 1
1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Relacoes entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Colecoes de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Produto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Medida de contagem 5
2.1 Regra da soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Algumas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4 Regra do produto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3 Estruturas de contagem 9
3.1 Permutacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.2 Combinacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3 Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Amostra ordenada com reposicao . . . . . . . . . . . . . . . . . . . . . . 12
Amostra ordenada sem reposicao . . . . . . . . . . . . . . . . . . . . . . 12
Amostra nao ordenada sem reposicao . . . . . . . . . . . . . . . . . . . . 12
Amostra nao ordenada com reposicao . . . . . . . . . . . . . . . . . . . 13
ii Sumario
3.4 Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
A Exercıcios 17
A.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
A.2 Medida de Contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
A.3 Estruturas de contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 20
B Demonstracoes 23
B.1 Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
B.2 Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 24
B.3 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 24
B.4 Amostragem nao-ordenada com reposicao . . . . . . . . . . . . . . . . . 24
B.5 Coeficientes multinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . 25
B.6 Coeficientes multinomiais - Exemplo 1 . . . . . . . . . . . . . . . . . . . 26
Capıtulo 1
Elementos da teoria de conjuntos
1.1 Conjuntos
A teoria de conjuntos e a base para toda a probabilidade e estatıstica, assim como de
outras areas da matematica. Nesta secao, faremos uma pequena revisao do material
necessario para este modulo.
Lembremos que um conjunto e uma colecao de objetos, chamados os elementos do con-
junto. A afirmacao de que s e um elemento do conjunto A e escrita como s ∈ A.
Por definicao, um conjunto fica completamente determinado por seus elementos; em
particular dois conjuntos A e B sao iguais se eles tiverem os mesmos elementos:
A = B se e somente se (s ∈ A ⇐⇒ s ∈ B) .
Se a A e B sao conjuntos, entao A e um subconjunto de B se todo elemento de A for
tambem elemento de B:
A ⊂ B se e somente se (s ∈ A⇒ s ∈ B) .
Figura 1.1: Diagrama de Euler-Venn para dois conjuntos, A ⊂ B.
Podemos representar conjuntos e relacoes entre eles com desenhos esquematicos chama-
dos diagramas de Euler - Venn. O diagrama da Figura 1.1 por exemplo representa a
relacao de subconjunto.
2 Elementos da teoria de conjuntos
Trabalharemos usualmente com conjuntos que serao todos subconjuntos de um conjunto
especıfico Ω, chamado conjunto universo. Definimos tambem o conjunto vazio, denotado
por ∅, como o conjunto sem elementos.
Consideremos um predicado q(s), ou seja, uma afirmacao matematica que ou e ver-
dadeira ou e falsa para cada elemento s ∈ Ω. Entao s ∈ Ω : q(s) e verdadeira define
completamente um subconjunto de Ω: o conjunto de todos os elementos de Ω que satis-
fazem q(s).
1.2 Relacoes entre conjuntos
Lembremos que as operacao basicas em teoria de conjuntos permitem definir novos con-
juntos. Mais precisamente, sejam A e B subconjuntos de um mesmo conjunto universo,
Ω. Entao definimos a uniao entre A e B, como o conjunto que combina os elementos de
A e B,
A ∪B = s ∈ Ω : s ∈ A ou s ∈ B.
A intersecao de A e B e o conjunto dos elementos em comum entre A e B,
A ∩B = s ∈ Ω : s ∈ A e s ∈ B.
A diferenca de conjuntos de B e A e o conjunto dos elementos que estao em B mas nao
em A,
B \A = s ∈ Ω : s ∈ B e s /∈ A.
O complementar de A e o conjunto de elementos que nao estao em A,
AC = s ∈ Ω : s /∈ A.
Dizemos que os conjuntos A e B sao disjuntos se sua intersecao for o conjunto vazio,
A ∩B = ∅.
Uma discussao mais aprofundada de teoria de conjuntos pode ser encontrada no livro
classico de Halmos [4]. O projeto Laboratorio de Probabilidade e Estatıstica da Univer-
sidade do Alabama [12] disponibiliza um applet sobre o diagrama de Euler-Venn para
visualizar as possıveis relacoes entre dois conjuntos (deve ser usado o navegador Mozilla).
Colecoes de conjuntos 3
1.3 Colecoes de conjuntos
Podemos estender as relacoes anteriores para colecoes finitas ou infinitas de conjuntos.
Seja A uma colecao de subconjuntos de Ω. Podemos indexar os subconjuntos em A por
um conjunto de ındices I, escrevendo assim A = Ai ⊂ Ω : i ∈ I.
A uniao da colecao A e o conjunto que combina os elementos dos conjuntos em A,⋃A = s ∈ Ω : s ∈ A para algum A ∈ A,
ou, escrito de outra maneira,⋃i∈I
Ai = s ∈ Ω : s ∈ Ai para algum i ∈ I.
A intersecao da colecao A e o conjunto dos elementos em comum a todos os conjuntos
em A, ⋂A =
⋂i∈I
Ai = s ∈ Ω : s ∈ Ai para todo i ∈ I.
A Figura 1.2 mostra estes novos conjuntos a partir de uma colecao.
Figura 1.2: Diagrama de Euler-Venn para a uniao e a intersecao de uma colecao de
conjuntos.
A colecao A e disjunta dois a dois se a intersecao de quaisquer dois conjuntos da colecao
for vazia,
A ∩B = ∅ para quaisquer A ∈ A e B ∈ A , com A 6= B.
Dizemos que a colecao A forma uma particao de um conjunto B se A for disjunta dois
a dois e⋃A = B.
Dado um conjunto Ω, uma colecao importante e a colecao de todos os subconjuntos de
Ω, chamado o conjunto das partes de Ω, que denotaremos por P(Ω) ou 2Ω.
4 Elementos da teoria de conjuntos
1.4 Produto cartesiano
Consideremos os conjuntos Ω1,Ω2, . . . ,Ωn. Definimos o produto cartesiano como o con-
junto
Ω1 × Ω2 × · · · × Ωn = (s1, s2, . . . , sn) : si ∈ Ωi para todo i ∈ 1, 2, . . . , n.
Se todos os conjuntos forem iguais, Ωi = Ω, denotamos o produto cartesiano como Ωn.
Podemos estender esta definicao para uma sequencia infinita de conjuntos (Ω1,Ω2, . . . )
como
Ω1 × Ω2 × · · · = (s1, s2, . . . ) : si ∈ Ωi para todo i ∈ 1, 2, . . . .
Denotaremos os elementos de um produto cartesiano com a notacao vetorial
(s1, s2, . . . , sn)
ou simplesmente como letras de uma palavra s1s2 . . . sn.
O experimento A matematica dos calendarios, disponıveis no site do projeto Matematica
Multimıdia [10] tratam de conjuntos em geral e de conjuntos numericos, em particular,
podendo ser utilizados como material auxiliar com os alunos.
Maos a obra. Exercıcios A.1.
Capıtulo 2
Medida de contagem
Suponhamos que Ω e um conjunto finito.
Se A ⊂ Ω entao a cardinalidade de A e o numero de elementos de A, e sera denotado por
#(A) ou simplesmente #A. A funcao # e chamada medida de contagem e e fundamental
na teoria de probabilidades discretas.
Em particular, quando trabalhamos com problemas envolvendo amostragens de um con-
junto finito, o conjunto Ω e tipicamente um conjunto grande, o que nos leva a necessidade
de construir formas eficientes de contagem.
Uma das regras basicas da contagem e o axioma de aditividade da medida de contagem,
mais conhecido como regra da soma.
2.1 Regra da soma
Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao
#
(⋃i
Ai
)=∑i
#(Ai).
Uma consequencia imediata desta propriedade e que dados dois conjuntos A e B tais
que A ⊂ B entao #A ≤ #B. Desta forma, # e uma funcao crescente relativa a ordem
parcial dos subconjuntos de Ω e a ordem usual em R.
2.2 Algumas desigualdades
As seguintes desigualdades nos permitem obter limitantes para o numero de elementos
de um conjunto.
6 Medida de contagem
Desigualdade de Boole
Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao
#
(⋃i
Ai
)≤∑i
#(Ai).
Veja a prova B.1.
Em palavras, se n = 2, o total de elementos da uniao de dois conjuntos e menor ou
igual que a soma dos totais de elementos de cada conjunto, ja que se houver intersecao
nao-vazia, contaremos os elementos da intersecao duas vezes.
Desigualdade de Bonferroni
Seja A1, A2, . . . , An uma colecao finita de subconjuntos disjuntos de Ω. Entao
#
(⋂i
Ai
)≥ #Ω−
∑i
(#Ω−#Ai) .
Veja a prova B.2, que e uma consequencia da Desigualdade de Boole e da lei de De
Morgan.
2.3 Formula de inclusao-exclusao
Dados A,B ⊂ Ω,
#(A ∪B) = #A+ #B −#(A ∩B).
Veja a prova B.3.
Esta formula nos da o total exato de elementos de uma uniao, indicando que devemos so-
mar os totais de elementos de cada conjunto e subtrair o total de elementos da intersecao
(que foram contados duas vezes).
Este resultado pode ser estendido para mais de dois elementos, de forma natural. Por
exemplo, para n = 3 conjuntos, temos que
#(A ∪B ∪ C) = #A+ #B −#(A ∩B)−#(A ∩ C)−#(B ∩ C) + #(A ∩B ∩ C),
que pode ser visualizado no diagrama da Figura 2.1.
Regra do produto 7
Figura 2.1: Diagrama de Euler-Venn para 3 conjuntos.
2.4 Regra do produto
A regra do produto em contagem se baseia na formulacao de um procedimento ou algo-
ritmo que permita gerar os objetos que devem ser contados. Suponha que o procedimento
consiste em k passos, a serem realizados sucessivamente, e que cada passo j pode ser
realizado de nj formas diferentes, independentemente das escolhas feitas previamente.
Entao o numero total de formas de realizar o procedimento e igual a n1 n2 . . . nk, que e
tambem o numero total de possıveis objetos.
Podemos visualizar este algoritmo em uma arvore de contagem. Consideremos uma
arvore com k nıveis de galhos, de modo que cada galho do nıvel i − 1 se divida em ni
novos galhos, para i = 1, . . . , k, como mostrado na Figura 2.2.
O total de nodos no extremo da arvore e igual a n1 n2 . . . nk.
Em particular, se em cada passo do algoritmo tivermos o mesmo numero de possibili-
dades, n, entao o procedimento completo pode ser realizado de nk maneiras possıveis.
Exemplo. A placa de um carro consiste em 3 letras e 4 dıgitos. Quantas placas diferentes
podem ser licenciadas?
O fundamental para a correta aplicacao desta regra em um problema de contagem e
fazer uma formulacao clara do algoritmo que gera os diversos possıveis objetos, de modo
que cada objeto seja contado e que seja contado uma unica vez.
Os exercıcios ao fim desta secao sao importantes para perceber diferentes abordagens
desta regra.
O vıdeo Desejos e o software Geometria do Taxi, disponıveis no site do projeto Mate-
matica Multimıdia [10] tratam de algumas regras de contagem, podendo ser utilizados
como material auxiliar com os alunos.
8 Medida de contagem
Figura 2.2: Diagrama de arvore de contagem.
Uma referencia bibliografica classica e o livro de Feller [2], que aborda este topico nos
primeiros capıtulos, com problemas que sao verdadeiros desafios.
Maos a obra. Exercıcios A.2.
Capıtulo 3
Estruturas de contagem
A definicao de um algoritmo para gerar os elementos de um conjunto permite determinar
uma estrutura de contagem. Veremos aqui duas estruturas basicas: permutacoes e
combinacoes.
3.1 Permutacoes
Consideremos um conjunto D = d1, d2, . . . , dn com n elementos. Uma permutacao de
k elementos de D e uma sequencia ordenada de k elementos diferentes de D:
(x1, x2, . . . , xk) ∈ Dk , onde xi ∈ D e xi 6= xj se i 6= j , para todos i, j.
Claramente, k nao pode ser maior que n. Uma permutacao de n elementos de D, ou seja,
uma ordenacao de todos os elementos de D, e chamada simplesmente uma permutacao
de D.
Podemos interpretar uma permutacao de k elementos de D como um resultado de um
mecanismo fısico que extrai k elementos da populacao D sem reposicao.
Com esta interpretacao, observemos que na primeira extracao, temos todos os n elemen-
tos de D como possıveis resultados. Para a segunda extracao, como o primeiro elemento
extraıdo nao e reposto, temos n−1 possıveis resultados. Para a terceira extracao, temos
n − 2 possıveis resultados. Assim por diante, ate a k-esima extracao, em que temos
n− k + 1 possıveis resultados, como mostra a Figura 3.1.
Assim, pela regra do produto, temos que o total de permutacoes de k elementos em n,
que denotaremos n(k), e igual a
n(k) = n(n− 1) . . . (n− k + 1) =n!
(n− k)!,
10 Estruturas de contagem
Figura 3.1: Arvore de contagem para uma permutacao de k elementos em n.
onde n! = n(n− 1) . . . 1 e o fatorial de n.
Usaremos a regra do produto e o mecanismo de extracao como um algoritmo de con-
strucao de permutacoes de k elementos de D para contar o total de possıveis per-
mutacoes.
3.2 Combinacoes
Consideremos um conjunto D = d1, d2, . . . , dn com n elementos. Uma combinacao de
k elementos de D e um subconjunto (nao-ordenado) de k elementos diferentes de D:
x1, x2, . . . , xk , onde xi ∈ D e xi 6= xj se i 6= j , para todos i, j.
Novamente, k nao pode ser maior que n.
Podemos interpretar uma combinacao como o resultado do mecanismo fısico que extrai
uma amostra nao-ordenada de uma populacao D sem reposicao.
Denotemos por C(n, k) o total de combinacoes de k elementos de um grupo de n.
Observemos que cada combinacao permite construir k! ordenacoes diferentes, ou seja,
k! permutacoes de comprimento k.
Amostras 11
Figura 3.2: Uma combinacao de k elementos gera k! permutacoes desses elementos.
Isto nos permite obter o total de combinacoes possıveis de k elementos a partir do total
de permutacoes de k elementos, ja que
n(k) = k!C(n, k) =⇒ C(n, k) =n
(n− k)!k!=
(n
k
).
O numero(nk
)e chamado coeficiente binomial.
Note que se n e k sao inteiros nao negativos e k > n, entao(nk
)= 0. Por convencao,
definimos(nk
)= 0, se k < 0.
O raciocınio anterior nos leva a um novo algoritmo (com dois passos) para construir per-
mutacoes: primeiro selecionamos uma combinacao de k elementos e depois selecionamos
uma ordem para estes elementos.
Os exercıcios desta secao mostram algumas propriedades basicas dos conceitos definidos.
Maos a obra. Exercıcios A.3.
3.3 Amostras
Um dos experimentos basicos e importantes em probabilidade e o de obter uma amostra
de uma populacao finita.
Neste tipo de experimento, duas propriedades da amostragem sao essenciais:
• se a ordem e ou nao importante, e
• se um objeto amostrado e ou nao reposto na populacao antes da proxima extracao.
12 Estruturas de contagem
Figura 3.3: Amostra de tamanho k de uma populacao D com n elementos.
Consideremos uma populacao D = d1, d2, . . . , dn com n objetos, da qual queremos
obter uma amostra de k objetos, chamados unidades amostrais.
Cada uma das quatro formas possıveis de amostragens sera descrita com mais detalhe
a seguir.
Amostra ordenada com reposicao
Se a ordem for importante e as extracoes forem feitas com reposicao, entao uma amostra e
um elemento do produto cartesiano Dk, ou seja, uma amostra e um vetor (a1, a2, . . . , ak),
onde ai representa o i-esimo elemento extraıdo de D.
Observemos que podemos ter coordenadas repetidas, indicando que um mesmo elemento
foi extraıdo mais de uma vez.
Neste caso, pela regra do produto, o total de amostras possıveis de k elementos e igual
ao total de vetores possıveis em Dk, igual a nk.
Amostra ordenada sem reposicao
Se a ordem for importante e as extracoes forem feitas sem reposicao, entao uma amostra
de k elementos e simplesmente uma permutacao de tamanho k escolhida de D. Nova-
mente, pela regra do produto, o total de amostras possıveis e igual a n(k).
Amostra nao ordenada sem reposicao
Se a ordem nao for importante e as extracoes forem feitas sem reposicao, entao uma
amostra e uma combinacao de k elementos de D; neste caso, o total de amostras possıveis
Coeficientes multinomiais 13
e C(n, k).
Amostra nao ordenada com reposicao
Finalmente, consideremos o caso em que a ordem nao e importante e as extracoes sao
feitas com reposicao. As possıveis amostras podem ter apenas um elemento repetido
k vezes, ou apenas dois elementos diferentes no total de k extracoes, ou apenas tres
diferentes, ou assim por diante, ate k elementos diferentes, nao-ordenados. O total de
amostras possıveis, neste caso, e igual a(k + n− 1
k
).
Veja a prova B.4.
O software Probabilidade com urnas, disponıveis no site do projeto Matematica Mul-
timıdia [10] trata de diversos tipos de amostragens, podendo ser utilizados como material
auxiliar com os alunos.
Para pensar: em um jogo de bingo, qual tipo de amostragem estamos realizando? e em
uma loteria?
Maos a obra. Exercıcios A.3.
3.4 Coeficientes multinomiais
Consideremos o conjunto D = d1, d2, . . . , dn com n elementos.
Observemos que uma combinacao de j elementos de D define uma particao de D, for-
mada por um conjunto A, contendo os j elementos da combinacao, e AC , contendo os
n− j elementos restantes.
Figura 3.4: Particao de um conjunto em dois subconjuntos, com cardinalidades j e n−j.
14 Estruturas de contagem
Uma generalizacao natural deste conceito e o de particao de D em ate k subconjuntos
diferentes e disjuntos dois-a-dois, (A1, A2, . . . , Ak), com #Ai = ni ≥ 0, para todo i =
1, 2, . . . , k, tais que n1 + n2 + · · ·+ nk = n.
Figura 3.5: Particao de um conjunto em k subconjuntos, cada um com cardinalidade
nk.
O total de particoes possıveis de D em ate k subconjuntos, C(n;n1, n2, . . . , nk), e igual
a
C(n;n1, n2, . . . , nk) =n!
n1!n2! . . . nk!.
Veja a prova B.5.
Este numero e chamado coeficiente multinomial e e denotado tambem por(n
n1, n2, . . . , nk
).
Exemplo 1
Consideremos o conjunto T = 1, 2, . . . , kn. Os elementos de T sao vetores de compri-
mento n em que cada coordenada e um valor natural entre 1 e k, como por exemplo os
vetores
t = (1, 1, 2, 1, . . . , 1) t = (k, k, . . . , k) t = (k, 4, 5, k, 4, 5, . . . , 5), etc.
Para cada valor i ∈ 1, 2, . . . , k, denotemos por ni o total de vezes em que o valor i
aparece no vetor t.
Por exemplo, se n = 3 e k = 5, T e o conjunto de todos os vetores com tres coordenadas,
onde cada coordenada e um valor inteiro entre 1 e 5. Para o vetor t = (3, 3, 2), temos
que n1 = 0 = n4 = n5, ja que os valores 1, 4 e 5 nao aparecem no vetor, e n2 = 1 e
n3 = 2, ja que o valor 2 aparece uma vez e o valor 3 aparece duas vezes.
Com esta definicao, podemos perceber que a soma n1 +n2 + · · ·+nk deve ser igual a n,
que e o total de coordenadas do vetor t.
Coeficientes multinomiais 15
Entao, o total de sequencias em T tais que o valor i ocorre ni vezes, para i = 1, 2, . . . , k,
e igual a C(n;n1, n2, . . . , nk).
Veja a prova B.6.
Com este resultado, no exemplo anterior temos que o total de sequencias de 3 elementos
com um 2 e dois 3’s (e nenhum 1, 4 ou 5) e igual a
C(3; 0, 1, 2, 0, 0) =
(3
0, 1, 2, 0, 0
)=
3!
0! 1! 2! 0! 0!=
3 · 2 · 12
= 3,
que sao (3, 3, 2), (3, 2, 3), (2, 3, 3).
Exemplo 2
Consideremos n objetos de k tipos diferentes, k ≤ n, com ni elementos do tipo i, para
cada i = 1, 2, . . . , n.
Por exemplo, Joao tem 5 cadeiras, 2 azuis, 1 branca, 1 preta e 1 verde.
Admitindo que objetos de um mesmo tipo sao indistinguıveis entre si, entao o total de
permutacoes distinguıveis dos n objetos e igual a C(n;n1, n2, . . . , nk).
Observemos que cada permutacao distinguıvel destes objetos corresponde a um unico el-
emento T do Exemplo 1, e cada elemento de T define uma unica permutacao distinguıvel,
provando assim o resultado.
No exemplo das cadeiras, o Joao tem portanto C(5; 2, 1, 1, 1) = 120 formas diferentes de
colocar as cadeiras em linha.
Podemos verificar isto, contando da seguinte maneira: chamemos por 1, 2, 3, 4, 5 as
possıveis posicoes de cada cadeira.
As cadeiras azuis podem ser vizinhas nas posicoes 1-2, 2-3, 3-4, 4-5. Para cada uma
destas as outras 3 cadeiras podem se ordenar de 3!=6 formas diferentes.
Do mesmo modo, as cadeiras azuis podem estar a uma cadeira de distancia nas posicoes
1-3, 2-4, 3-5; a duas cadeiras de distancia, nas posicoes 1-4, 2-5; e totalmente afastadas
na posicao 1-5. Para cada uma destas possibilidade, temos 3! formas de ordenar as
restantes.
Finalmente, as cadeiras azuis podem ocupar cada uma dessas posicoes de duas maneiras
possıveis, trocando-as de lugar entre si.
Assim, temos 3!(4 + 3 + 2 + 1)2 = 120 possibilidades.
Maos a obra. Exercıcios A.3.
16 Estruturas de contagem
Apendice A
Exercıcios
A.1 Conjuntos
1. Mostre que ∅ ⊂ A, para qualquer conjunto A.
2. Dados conjuntos A e B de um conjunto universo Ω, mostre que A∩B ⊂ A ⊂ A∪B.
3. Dado um subconjunto A de um conjunto universo Ω, mostre que A ∪ AC = Ω e
que A ∩AC = ∅.
4. (Leis de De Morgan) Dados dois conjuntos A e B, mostre que
(a) (A ∪B)C = AC ∩BC
(b) (A ∩B)C = AC ∪BC
5. Seja Ω = 1, 2, 3, 4× 1, 2, 3, 4, 5, 6. Este conjunto pode ser interpretado como o
conjunto de resultados do lancamento de uma dado de 4 faces e um dado de 6 faces.
Considere os conjuntos A = (x, y) ∈ Ω : x e par e B = (x, y) ∈ Ω : x+ y = 5.Liste os elementos de cada um dos conjuntos a seguir: A, B, A∪B, A∩B, A \B,
B \A.
6. Seja Ω = 0, 13. Este conjunto pode ser visto como o conjunto de resultados
de tres lancamentos de uma moeda (0 denota coroa e 1 denota cara). Defina os
conjuntos A = (s1, s2, s3) ∈ Ω : s2 = 1 e B = (s1, s2, s3) ∈ Ω : s1 +s2 +s3 = 2.Liste os elementos de cada um dos conjuntos a seguir: Ω, A, B, AC , BC , A ∪ B,
A ∩B, A \B, B \A.
7. Seja Ω = 0, 12, o conjunto de resultados em dois lancamentos de uma moeda.
Determine P(Ω).
18 Exercıcios
8. Podemos denotar um conjunto de cartas de baralho como o conjunto produto
Ω = As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,Q,K × ♣,♥,♦,♠,
onde o primeiro elemento do par ordenado indica o valor da carta e o segundo
indica o naipe. Denotemos por A o conjunto de coracoes, e por B o conjunto de
cartas com personagens. Determine os conjuntos A ∪B, A ∩B, A \B, B \A.
9. * Considere a sequencia de conjuntos An = [0, 1 − 1/n], para n ∈ 1, 2, . . . .Determine
⋂An,
⋃An,
⋂ACn ,
⋃ACn .
Voltar 1.4.
A.2 Medida de Contagem
Considere os subconjuntos A,B,C,A1, A2, . . . , An ⊂ Ω, com Ω finito, para os seguintes
exercıcios.
Dica: antes de fazer as demonstracoes, construa pelo menos um exemplo, atribuindo
valores para as quantidades e conjuntos envolvidos.
1. Mostre que #AC = #Ω−#A.
2. Mostre que #(B \A) = #B −#(B ∩A).
3. Mostre que se A ⊂ B entao #(B \A) = #B −#A.
4. Suponha que Ω e um conjunto de sequencias de comprimento k, com elementos da
forma (x1, x2, . . . , xk). Mostre que se cada coordenada j tiver nj possıveis valores,
independentemente das demais coordenadas, entao
#Ω = n1 n2 . . . nk.
5. Mostre que se Ω tem n elementos, entao Ωk tem nk elementos.
6. Mostre que o numero de amostras ordenadas de k elementos que podem ser sele-
cionadas com reposicao de uma populacao de n objetos e igual a nk.
7. Mostre que o numero total de funcoes de um conjunto A com n elementos em um
conjunto B com m elementos e mn. Este resultado e uma motivacao para usar a
notacao BA para o conjunto de todas as funcoes de A em B.
Estruturas de contagem 19
8. Suponha que Ω tem n elementos. Mostre que o conjunto das partes de Ω tem 2n
elementos.
9. Um experimento consiste em lancar um dado comum de 6 faces, escolher uma
carta de um baralho e lancar uma moeda honesta. Quantos possıveis resultados
tem este experimento?
10. Uma moeda honesta e lancada 10 vezes, observando a sequencia de resultados.
Quantas sequencias possıveis ha? Quantas sequencias tem exatamente 3 caras?
11. Um experimento com dados e moedas consiste em lancar um dado e depois lancar a
moeda o numero de vezes mostrado no dado, observando a sequencia de resultados
da moeda. Quantos resultados possıveis existem? Quantos deles tem exatamente
duas caras?
Voltar 2.4.
A.3 Estruturas de contagem
Nos exercıcios abaixo, considere n,m, k inteiros nao negativos.
Dica: antes de fazer as demonstracoes, construa pelo menos um exemplo, atribuindo
valores para as quantidades envolvidas.
1. Mostre que(n0
)=(nn
)= 1.
2. Mostre que se n < k entao(nk
)= 0.
3. Utilizando argumento combinatorio, mostre que(n
k
)=
(n
n− k
),
ou seja, mostre que cada lado da igualdade representa uma forma diferente de
contar a mesma colecao. Dica: observe que ao selecionar um subconjunto de k
elementos de um conjunto de tamanho n, deixamos n−k elementos nao seleciona-
dos.
4. Utilizando um argumento combinatorio, mostre que(n
k
)=
(n− 1
k − 1
)+
(n− 1
k
).
Dica: fixe um elemento do conjunto, e conte o total de subconjuntos de tamanho k
que contem o elemento e o total de subconjuntos de tamanho k que nao o contem.
20 Exercıcios
5. Utilizando um argumento combinatorio, mostre que
k
(n
k
)= n
(n− 1
k − 1
).
Dica: considere duas formas de escolher um comite de tamanho k de um grupo
de tamanho n; na primeira, o comite e escolhido e depois um chefe dentre os
escolhidos, e na segunda, um chefe e escolhido da populacao e entao k−1 membros
sao escolhidos do restante n− 1 membros da populacao.
6. Utilizando um argumento combinatorio, mostre que
k∑j=0
(n
j
)(m
k − j
)=
(n+m
k
).
Dica: considere duas formas de escolher um comite de tamanho k de um grupo de
tamanho n + m com n homens e m mulheres; conte o numero de comites com j
homens e k − j mulheres.
Voltar 3.2.
Amostras
1. Um lote contem 12 itens bons e 8 itens defeituosos. Uma amostra de 5 itens
e extraıda. Determine o total de amostras contendo exatamente 3 itens bons.
Considere cada um dos quatro tipos de amostragem definidos.
Voltar 3.3
Coeficientes multinomiais
1. Em uma corrida com 10 cavalos, os tres primeiros lugares sao anotados. Quantos
resultados possıveis existem?
2. Uma placa de carro tem 3 letras e 4 dıgitos. Determine o total de placas com
letras e dıgitos todos diferentes.
3. Quatro casais estao sentados em uma fileira com 8 cadeiras. Determine o total de
arranjos em que eles podem estar sentados. Determine o total de arranjos em que
eles podem estar sentados de modo que:
(a) os homens fiquem juntos e as mulheres fiquem juntas;
Estruturas de contagem 21
(b) os homens fiquem juntos;
(c) os casais fiquem juntos.
4. Refaca o exercıcio anterior, assumindo agora que os casais estao sentados em uma
mesa redonda.
5. Em uma estante ha 12 livros, dos quais 3 sao de fısica, 5 sao de matematica e 4
sao de historia. Determine o total de arranjos de modo que:
(a) nao ha restricao;
(b) os livros de mesmo tipo devem ficar juntos;
(c) os livros de matematica devem ficar juntos.
6. Determine o total de arranjos diferentes das letras de: probabilidade, arranjo.
7. Um clube tem 20 membros: 12 homens e 8 mulheres, com os quais e necessario
criar um comite de 6 pessoas. De quantas formas pode ser composto o comite se:
(a) nao ha restricao;
(b) o comite deve ter 4 mulheres e 2 homens;
(c) o comite deve ter pelo menos 2 mulheres e pelo menos 2 homens.
8. Em um grupo de 10 pessoas, todas elas se apertam as maos. Quantos apertos de
mao sao dados?
9. Suponha que 5 dados distinguıveis de 6 faces sao lancados e que a sequencia obtida
e observada. Determine o total de sequencias. Determine o total de sequencias
com todos os resultados diferentes.
10. Refaca o exercıcio anterior, assumindo que os dados sao identicos.
Voltar 3.4.
22 Exercıcios
Apendice B
Demonstracoes
B.1 Desigualdade de Boole
Definamos os conjuntos B1 = A1 e Bi = Ai \ (A1 ∪ · · · ∪Ai−1) para i ∈ 1, 2, . . . , n.
Observe que os elementos de B2 sao os elementos de A2 que nao estao em A1. Do mesmo
modo, os elementos de B3 sao os elementos de A3 que nao estao nem em A1 nem em
A2, e assim por diante. A Figura B.1 mostra o caso para 3 conjuntos.
Figura B.1: Construcao da prova da desigualdade de Boole.
24 Demonstracoes
Portanto, os conjuntos B1, B2, . . . , Bn sao disjuntos dois a dois e tem a mesma uniao
que A. (Prove estas afirmacoes formalmente dentro da teoria de conjuntos) Desta forma
#(∪Ai) = #(∪Bi).
Pela regra da adicao, #(∪Bi) =∑
#Bi.
Finalmente, como Bi ⊂ Ai, temos que
# (∪iAi) = # (∪iBi) =∑
#Bi ≤∑
#Ai,
como queriamos provar.
Voltar 2.2.
B.2 Desigualdade de Bonferroni
Aplique a desigualdade de Boole aos conjuntos AC1 , AC2 , . . . , A
Cn e use as leis de De
Morgan.
Voltar 2.2.
B.3 Formula de inclusao-exclusao
Observemos que podemos escrever A ∪ B como a uniao dos conjuntos disjuntos A e
B \A. Pela regra da adicao, chegamos ao resultado.
A generalizacao para n conjuntos segue o mesmo raciocınio.
Voltar 2.3.
B.4 Amostragem nao-ordenada com reposicao
Para sistematizar a contagem, denotemos por xj o total de vezes em que o j-esimo
elemento da populacao foi observado na amostra, para j = 1, . . . , n. Como observamos
uma amostra de tamanho k, temos que x1 + x2 + · · ·+ xn = k.
O total de amostras possıveis, corresponde portanto ao total de solucoes inteiras nao
negativas da equacao anterior.
Uma forma bonita de resolver este problema e via modelo de urnas e bolinhas. Consid-
eremos n urnas e k bolinhas, k < n, que serao dispostas aleatoriamente nas urnas. A
Coeficientes multinomiais 25
equacao anterior representa este problema, e uma solucao possıvel corresponde a uma
forma possıvel de preencher as urnas.
Denotemos as urnas por n+ 1 barras verticais |, indicando os limitantes das urnas. Os
espacos entre as barras indicam cada uma das n urnas. Denotemos as k bolinhas por k
sımbolos .
Por exemplo, a configuracao
| | | |
representa 3 urnas: a primeira esta vazia, a segunda tem 3 bolinha e a terceira tem uma
bolinha.
Queremos contar o numero de maneiras de dispor k sımbolos entre n+1 barras |. Como
a primeira e a ultima barras devem permanecer nos extremos (ja que as bolinhas nao
podem ficar fora das urnas), devemos considerar todas as combinacoes entre k sımbolos
entre n− 1 barras |.
Com isto, o total de amostras possıveis de k elementos de uma populacao com n ele-
mentos diferentes, sem ordem e com reposicao, e igual a(k + n− 1
k
).
Voltar 3.3.
B.5 Coeficientes multinomiais
Dado o conjunto D = d1, d2, . . . , dn com n elementos, consideremos uma permutacao
de todos os elementos
π(d1, d2, . . . , dn) = (dπ1 , dπ2 , . . . , dπn).
Dados n1, n2, . . . , nk inteiros nao-negativos tais que n1 + n2 + · · · + nk = n, definamos
o conjunto A1 como o conjunto formado pelo primeiros n1 elementos da permutacao
anterior. Definamos A2 como o conjunto formado pelo seguintes n2 elementos da per-
mutacao, e assim por diante, ate obter Ak definido como o conjunto formado pelo ultimos
nk elementos da permutacao. Se para algum i, ni = 0, definimos o conjunto Ai como o
conjunto vazio.
Desta forma, para cada uma das n! possıveis permutacoes, construımos os conjuntos
A1, A2, . . . , Ak da mesma maneira.
26 Demonstracoes
Observemos que estes conjuntos sao disjuntos entre si e sua uniao corresponde ao con-
junto D, ja que todos os elementos aparecem na permutacao, e aparecem uma unica
vez. Em outras palavras, os conjuntos A1, A2, . . . , Ak definem uma particao de D.
Observemos tambem que qualquer permutacao envolvendo apenas os n1 primeiros ele-
mentos, define o mesmo conjunto A1; do mesmo modo, qualquer permutacao envolvendo
apenas os n2 elementos seguintes, define o mesmo conjunto A2, e assim por diante.
Sendo assim, dada uma pemutacao definindo os conjuntos A1, A2, . . . , Ak, temos
n1!n2! . . . nk!
permutacoes diferentes definindo os mesmos conjuntos A1, A2, . . . , Ak, que sao aquelas
que permutam apenas os elementos de cada conjunto entre si.
Portanto, o total de particoes diferentes de D e igual a n!/(n1!n2! . . . nk!), como que-
rıamos provar.
Voltar 3.4.
B.6 Coeficientes multinomiais - Exemplo 1
Para provar o resultado, consideremos um conjunto D = d1, d2, . . . , dn com n elemen-
tos.
Observemos que cada t ∈ T = 1, 2, . . . , kn define uma particao de D.
De fato, para cada vetor t = (t1, t2, . . . , tn) ∈ T , definamos os conjuntos A1, A2, . . . , Ak
de modo que o elemento di ∈ D pertenca ao conjunto Ati , dado pela coordenada i-esima
de t. Se o vetor t nao tiver nenhuma coordenada com valor igual a j ∈ 1, 2, . . . , k,entao Aj = ∅.
Esta relacao define biunivocamente cada particao de D a partir de t ∈ T . Portanto, o
total de elementos em T e igual ao total de particoes de D em ate k conjuntos.
Voltar 3.4.
Referencias Bibliograficas
[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)
Analise Combinatoria e Probabilidade. Editora SBM.
[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora
Edgard Blucher.
[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.
[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.
[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto
Euclides.
[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.
[7] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman
Co.
Paginas da internet
Em portugues
[8] ALEA, Accao Local de Estatıstica Aplicada, Portugal.
[9] Mais - Recursos Educacionais em Matematica, Brasil.
[10] Matematica Multimıdia, Unicamp.
Em ingles
[11] Historia da Matematica, Universidade de St. Andrews, Escocia.
[12] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.
Universidade Estadual de Campinas
Modulo III - D6
Analise Combinatoria, ProbabilidadeNocoes de Estatıstica
Tema 2 - Espacos de Probabilidade
Prof. Laura L. R. Rifo
- Novembro, 2010 -
Sumario
1 Experimentos aleatorios 1
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Experimento composto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Amostragem como experimento . . . . . . . . . . . . . . . . . . . . . . . 3
Dados, moedas, baralhos e urnas . . . . . . . . . . . . . . . . . . . . . . 4
Confiabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Genetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Espaco amostral e eventos 7
2.1 Espaco amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Criando novos eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
A partir de mais de dois eventos . . . . . . . . . . . . . . . . . . . . . . 9
3 Variaveis aleatorias 11
3.1 Eventos induzidos por uma variavel aleatoria . . . . . . . . . . . . . . . 11
3.2 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Lancamentos de uma moeda . . . . . . . . . . . . . . . . . . . . . . . . . 13
Lancamentos de um dado . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Experimentos compostos . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
ii Sumario
4 Medida de probabilidade 17
4.1 Probabilidade como grau de informacao . . . . . . . . . . . . . . . . . . 17
4.2 Diversas interpretacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4.3 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.4 Algumas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Desigualdade de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.5 Distribuicao de uma variavel aleatoria . . . . . . . . . . . . . . . . . . . 20
4.6 Distribuicao uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . 21
4.7 Distribuicoes discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.8 Formula de inclusao-exclusao . . . . . . . . . . . . . . . . . . . . . . . . 22
4.9 Moedas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Total de caras em n lancamentos uniformes . . . . . . . . . . . . . . . . 23
4.10 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.11 Distribuicao do maximo e do mınimo de variaveis uniformes . . . . . . . 25
5 Probabilidade condicional 27
5.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.2 Regra do produto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3 Lei da probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.4 Regra de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
6 Independencia 33
6.1 De dois eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.2 De uma colecao de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 34
6.3 De variaveis aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.4 Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Sumario iii
A Demonstracoes 39
A.1 Uniao de uma colecao de eventos . . . . . . . . . . . . . . . . . . . . . . 39
A.2 Intersecao de uma colecao de eventos . . . . . . . . . . . . . . . . . . . . 39
A.3 Desigualdade de Boole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Capıtulo 1
Experimentos aleatorios
1.1 Introducao
A teoria de probabilidades se baseia na nocao de experimento aleatorio, ou seja, um
experimento cujo resultado nao e conhecido com certeza.
Esta nocao e bastante ampla: tudo o que nao conhecemos pode ser considerado um
experimento aleatorio, um experimento ou observacao que sera feita, ou que ja aconteceu
ou que esta acontecendo no momento.
A observacao sobre se havera chuva amanha ou nao, ou o resultado do proximo jogo de
nosso time pode ser considerado um experimento aleatorio. O numero de especies ma-
rinhas abaixo de uma certa profundidade ou o nıvel de poluicao em um certo ponto de
nossa cidade neste momento tambem pode ser considerado um experimento aleatorio,
ja que nao dispomos de instrumentos de medicao extremamente precisos. A data ou
lugar do surgimento de seres humanos ou o numero de troncos linguısticos existentes na
America do Sul em 1500, mesmo ja tendo ocorrido, podem ser considerados experimentos
aleatorios, e de fato, sao objeto de inumeros estudos antropologicos e arqueologicos.
Uma definicao completa de um experimento aleatorio requer uma definicao precisa do
que e que esta sendo observado no experimento, ou seja, uma definicao do que e de fato
um resultado possıvel.
Os exemplos anteriores sao chamados experimentos simples.
2 Experimentos aleatorios
1.2 Experimento composto
Suponha que temos um experimento simples. A repeticao um certo numero de vezes
deste experimento simples pode ser visto como um novo experimento, chamado experi-
mento composto.
Inversamente, em muitos casos, podemos idealizar um experimento dado como uma
sequencia de subexperimentos simples.
Por exemplo, consideremos um experimento simples com apenas dois possıveis resulta-
dos, como a observacao da face obtida no lancamento de uma moeda. Repeticoes suces-
sivas deste tipo de experimento sao chamadas ensaios de Bernoulli, em homenagem ao
matematico Jacob Bernoulli (em ingles).
Se cada experimento simples tiver k possıveis resultados, como a observacao da face
obtida no lancamento de um dado de k faces, repeticoes deste experimento sao chamadas
ensaios multinomiais.
As repeticoes podem ser feitas de maneira independente ou com alguma forma de de-
pendencia entre si. Intuitivamente, as repeticoes sao independentes se o resultado de
qualquer uma delas nao entregar informacao sobre o resultado das demais repeticoes.
Maos a obra.
Exercıcios
1. Considere o experimento de lancar n moedas diferentes e observar o resultado de
cada moeda, adotando 1 para cara e 0 para coroa.
(a) Estabeleca um modelo probabilıstico para este experimento.
(b) Descreva o experimento como um experimento composto com repeticoes inde-
pendentes de um experimento simples, identificando o experimento simples.
(c) Descreva o experimento como uma amostragem com reposicao de uma popu-
lacao, identificando a populacao e o tamanho da amostra.
(d) Descreva o experimento como n ensaios de Bernoulli.
2. Refaca a questao anterior, considerando o experimento de lancar n dados diferen-
tes, cada um com k faces numeradas de 1 a k, observando o resultado de cada
dado. No item (d), troque ensaios de Bernoulli por ensaios multinomiais.
Aplicacoes 3
3. Considere o experimento de lancar um dado comum de 6 faces e entao lancar uma
moeda o numero de vezes obtido no dado, observando a sequencia de resultados da
moeda (1 para cara e 0 para coroa). Descreva o experimento como um experimento
composto, como etapas sucessivas de experimentos simples, identificando estes
experimentos simples. O applet Die-Coin simula este experimento para um dado,
com diversos pesos para cada face, e uma moeda com probabilidade p ∈ [0, 1] de
obter cara em um lancamento.
4. Considere o experimento de extrair n cartas de um baralho comum.
(a) Descreva o experimento como um experimento composto, com etapas depen-
dentes.
(b) Descreva o experimento como uma amostragem sem reposicao de uma popu-
lacao, identificando a populacao e o tamanho da amostra.
1.3 Aplicacoes
Amostragem
Na grande maioria dos estudos estatısticos, desejamos estudar uma populacao de inte-
resse: pessoas com uma certa caracterıstica (de uma certa cidade, ou com uma certa
doenca ou com uma certa faixa etaria, etc.), itens produzidos por uma fabrica, produtos
agropecuarios de uma certa regiao, por exemplo.
Em geral, queremos analisar diversas caracterısticas (numericas ou nao) desta populacao:
sexo, peso e pressao sanguınea de uma pessoa, tempo de vida util do item produzido,
quantidade de fertilizante, salinidade do solo e produtividade de uma plantacao de soja,
e assim por diante.
Analisar a populacao inteira pode ser custoso ou mesmo impossıvel: no exemplo dos
itens deverıamos testar TODA a producao para analisar a vida util, e claramente isto
nao faz sentido.
Desta forma, recorremos a uma amostra da populacao, observando as caracterısticas de
interesse em cada elemento da amostra, chamado unidade amostral.
Amostragem como experimento
Uma amostragem pode ser realizada basicamente de duas formas: com ou sem reposicao.
Na primeira, cada unidade amostral e devolvida a populacao antes de extrair a proxima,
4 Experimentos aleatorios
de modo que um unico objeto pode aparecer diversas vezes na amostra. Na segunda
forma, sem reposicao, as unidades amostrais nao sao devolvidas a populacao durante a
amostragem.
Podemos imaginar o processo de amostragem como um experimento composto, baseado
na repeticao do experimento simples de extrair um unico objeto da populacao e observar
as caracterısticas de interesse.
Em uma amostragem com reposicao, as repeticoes podem ser consideradas indepen-
dentes, enquanto que em uma amostragem sem reposicao, o experimento consiste em
etapas dependentes entre si.
Dados, moedas, baralhos e urnas
Os experimentos classicos de observar a face obtida no lancamento de uma moeda ou
um dado, e na extracao de uma carta de um baralho ou de uma bolinha de uma urna,
por exemplo, permitem construir modelos matematicos simples para fenomenos reais
mais complexos.
No applet Coin Sample e possıvel simular uma sequencia de n lancamentos de uma
moeda com probabilidade p de obter cara em cada lancamento individual.
No applet Dice Sample temos um experimento analogo com dado de seis faces; clicando
no dado, e possıvel alterar as probabilidades de cada face, de acordo com seis modelos
possıveis.
Um baralho comum pode ser representado como o espaco produto
Ω = As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J,Q,K × ♣,♥,♦,♠.
O applet Card simula uma extracao de n cartas de um baralho comum.
O software Probabilidade com urnas, do projeto Matematica Multimıdia [11], simula ex-
tracoes de bolinhas de uma urna, com ou sem reposicao, e apresenta o modelo conhecido
como urna de Polya.
Estes softwares estao disponıveis para serem utilizados por professores e alunos.
Confiabilidade
No modelo usual de estudos em confiabilidade, um sistema consiste em n componentes,
cada um deles ou funcionando bem ou com defeito.
Aplicacoes 5
O status de cada componente e desconhecido, e portanto define um experimento alea-
torio.
O funcionamento do sistema como um todo depende do status dos componentes e de
como eles estao conectados entre si. Por exemplo, um sistema em serie funciona se e
somente se todos os componentes estiverem funcionando, enquanto que um sistema em
paralelo funciona se e somente se pelo menos um componente estiver funcionando.
Figura 1.1: Diagrama de dois sistemas com n componentes: o de cima, em serie, o de
baixo, em paralelo.
Mais geralmente, um sistema k-de-n funciona se ao menos k componentes estiverem
funcionando.
O modelo definido acima e um modelo estatico. Podemos estender a definicao para um
modelo dinamico: inicialmente todas as componentes estao funcionando, mas em um
instante desconhecido (e portanto aleatorio) uma componente qualquer pode falhar. O
sistema como um todo tambem pode ter um instante de falha aleatorio que depende dos
tempos de falha das componentes e da estrutura do sistema, exigindo uma modelagem
matematica mais elaborada.
Para pensar: Considere o modelo de confiabilidade k-de-n. Quais valores de k represen-
tam um sistema em serie? E um sistema em paralelo?
Genetica
Em sistemas de reproducao sexuada, o material genetico dos descendentes e uma com-
binacao desconhecida (e portanto aleatoria) do material genetico dos pais. Em parti-
cular, o nascimento de um crianca pode ser considerado um experimento aleatorio com
relacao a resultados como cor dos olhos, do cabelo e outras caracterısticas possıveis. Em
medicina molecular, temos interesse por exemplo na transmissao de doencas geneticas.
Consideremos um modelo muito simples de uma caracterıstica hereditaria com dois
possıveis estados, como por exemplo uma planta de ervilha cuja vagem pode ser verde
6 Experimentos aleatorios
ou amarela. Dado que uma planta recebe dois genes para a caracterıstica, os possıveis
genotipos sao: vv, dois genes verdes; va, um gene verde e outro amarelo, e aa, um gene
amarelo de cada pai.
Os genotipos vv e aa sao chamados homozigotos, e o genotipo va, heterozigoto. Em
muitos casos, um dos estados herdados e dominante e o outro recessivo. Se, por exemplo,
o verde for um estado dominante para a cor da vagem, entao uma planta com genotipo
vv ou va tera vagens verdes, e uma com genotipo aa tera vagens amarelas.
Figura 1.2: Diagrama de duas situacoes de possıveis genotipos: para os filhos, a esquerda,
e para os pais, a direita.
Conhecer os genes dos pais nao nos permite afirmar certamente qual sera o genotipo do
filho, ou inversamente, conhecendo o genotipo do filho, existem diversas possibilidades
para os genotipos dos pais (que, alias, sao analisadas em testes de paternidade). Desta
forma, podemos considerar o genotipo desconhecido como um experimento aleatorio.
Capıtulo 2
Espaco amostral e eventos
2.1 Espaco amostral
O espaco amostral de um experimento aleatorio e um conjunto Ω contendo todos os
possıveis resultados do experimento. Um elemento ω ∈ Ω e chamado evento elementar.
Para experimentos simples, o espaco amostral pode ser exatamente o conjunto de todos
os resultados possıveis, mas em modelos matematicos mais complexos, o espaco amostral
poderia conter mais elementos se for conveniente.
Por exemplo, se o experimento for lancar um dado e observar a face obtida, o espaco
amostral pode ser definido como Ω = 1, 2, 3, 4, 5, 6, mas se o experimento for medir
o peso de seu gato de estimacao, poderıamos definir como espaco amostral o intervalo
Ω = (0,∞), mesmo que a maioria de seus elementos seja praticamente impossıvel.
Se o resultado de um experimento entregar informacao sobre diversas variaveis, entao
o espaco amostral contem as sequencias de valores que poderiam ser observadas. Por
exemplo, se um experimento consiste em medir o peso, o comprimento do pelo e a
cor do seu gato de estimacao entao o espaco amostral e formado por vetores com tres
componentes indicando cada uma destas caracterısticas. Assim, um evento elementar
poderia ser o vetor (4kg, pelo medio, laranja e branco com manchas pretas).
Neste caso, se tivermos informacao sobre n variaveis entregue pelo experimento, podemos
considerar o espaco amostral como o produto cartesiano Ω1 × Ω2 × · · · × Ωn, onde Ωi e
o espaco amostral relacionado a i-esima variavel.
Analogamente, se tivermos n repeticoes de um mesmo experimento, com espaco amostral
Ω, entao Ωn e o espaco amostral natural para o experimento composto, ou seja, para o
experimento que consiste em n repeticoes do experimento original.
8 Espaco amostral e eventos
Por exemplo, se considerarmos o experimento de lancar uma moeda 7 vezes, entao o
espaco amostral Ω consiste em todas as sequencias de caras e coroas, com 7 componentes.
Por outro lado, podemos ver este conjunto como o produto cartesiano do espaco amostral
mais simples, Ωi, consistindo de apenas dois elementos, cara e coroa. Denotando cara
por C e coroa por K, temos
Ω = CCCCCCC,CCCCCCK,CCCCCKC, . . . ,KKKKKKK= C,K × C,K × · · · × C,K = C,K7.
Ou seja, este conjunto tem 27 elementos.
Vemos neste exemplo que a forma de descrever um espaco amostral pode nos ajudar na
contagem de seus elementos.
2.2 Eventos
Chamamos evento qualquer conjunto observavel de possıveis resultados do experimento,
ou seja, qualquer subconjunto observavel do espaco amostral Ω.
Cada vez que o experimento e realizado, diremos que um evento A ocorre se o resultado
observado for um elemento de A, e diremos que nao ocorre se o resultado observado nao
for um elemento de A.
Em particular, sao eventos o proprio espaco amostral Ω, que por definicao e o evento
que sempre ocorre, e o conjunto vazio ∅, que por definicao e o evento que nunca ocorre.
No exemplo dos 7 lancamentos de uma moeda, um possıvel evento e “obter uma unica
cara”, definido pelo conjunto
A = CKKKKKK,KCKKKKK,KKCKKKK,KKKCKKK,
KKKKCKK,KKKKKCK,KKKKKKC.
Denotaremos por F o conjunto de todos os possıveis eventos associados ao experimento
aleatorio.
Maos a obra.
Exercıcios
1. Um experimento consiste em lancar um dado comum de 6 faces, ate aparecer face
3 ou 5. Seja A o evento em que a ultima face do experimento e 5 e nao 3. Defina
o espaco amostral Ω e descreva o evento A como subconjunto de Ω.
Criando novos eventos 9
2. Um experimento consiste em lancar dois dados comuns de 6 faces, ate que a soma
obtida seja 5 ou 7. Seja A o evento em que a soma e 5 e nao 7 no ultimo lancamento.
Suponha que sao registrados os pares obtidos em cada lancamento. Defina o espaco
amostral Ω e descreva o evento A como subconjunto de Ω.
3. No exercıcio anterior, suponha que apenas o ultimo par e registrado. Defina o
espaco amostral Ω e descreva o evento A como subconjunto de Ω.
2.3 Criando novos eventos
As propriedades e operacoes entre conjuntos, vistas na primeira parte do curso, permitem
descrever e contruir novos eventos a partir de eventos dados.
Dizemos que um evento ocorre em uma realizacao do experimento se for observado um
evento elementar pertencente ao evento.
Assim, por exemplo, dado um evento A, o evento AC e o evento que ocorre se e somente
se A nao ocorrer, ja que ω ∈ AC se e somente se ω /∈ A.
Do mesmo modo, dados os eventos A e B, o evento A ∪ B e o evento que ocorre se
pelo menos um dos eventos A ou B ocorrer, e A ∩B e o evento que ocorre se ambos os
eventos A e B ocorrerem.
Diremos que dois eventos A e B sao mutuamente exclusivos se eles nao puderem ocorrer
simultaneamente, ou seja, se A ∩B for o evento que nunca ocorre ∅.
Figura 2.1: Diagrama de dois eventos mutuamente exclusivos.
A partir de mais de dois eventos
Esta definicao continua valida para a uniao e a intersecao de mais de dois eventos. Dados
os eventos A1, A2, . . . , An, ∪Ai e o evento que ocorre se pelo menos um dos eventos
10 Espaco amostral e eventos
ocorrer, e ∩Ai e o evento que ocorre se todos os eventos ocorrerem. Formalmente,
ω ∈ ∪ni=1Ai se e somente se ω ∈ Ai, para algum i ∈ 1, 2, . . . , n,
ω ∈ ∩ni=1Ai se e somente se ω ∈ Ai, para todo i ∈ 1, 2, . . . , n.
Consideremos uma colecao enumeravel de eventos A = A1, A2, . . . de um experimento
aleatorio.
A uniao desta colecao ∪A e o evento que ocorre se e somente se pelo menos um evento
da colecao ocorrer. Veja a prova A.1.
Analogamente, a intersecao desta colecao ∩A e o evento que ocorre se e somente se todos
os eventos da colecao ocorrerem. Veja a prova A.2.
Por exemplo, se os Ai’s forem os intervalos [0,1], [0,1/2], [0,1/3], etc, entao, ∪A = [0, 1]
e ∩A = 0.
Maos a obra.
Exercıcios
Nos exercıcios seguintes, assuma que A e B sao eventos.
1. Mostre que A ⊂ B se e somente se a ocorrencia do evento A implica a ocorrencia
do evento B.
2. Mostre que A \B e o evento que ocorre se e somente se A ocorre e B nao ocorre.
3. Mostre que (A∩BC)∪ (AC ∩B) e o evento que ocorre se e somente se exatamente
um entre A e B ocorrer. Este evento e chamado a diferenca simetrica entre A e
B, e e denotado por A4B.
4. Mostre que (A ∩ B) ∪ (A ∪ B)C e o evento que ocorre se e somente se ou ambos
ou nenhum dos eventos A ou B ocorrerem.
5. Mostre em um diagrama de Euler-Venn todos os 16 eventos que podem ser cons-
truıdos a partir de A e B.
6. Considere o experimento de dois lancamentos de um dado comum de 6 faces.
Sejam Ω o espaco amostral, A o evento de que o resultado do primeiro lancamento
e igual a 1, e B o evento de que a soma dos dois resultados obtidos e igual a 7.
Descreva todos os elementos de: Ω, A, B, A ∪B, A ∩B, A \B, AC ∩BC .
Capıtulo 3
Variaveis aleatorias
Consideremos um experimento aleatorio com espaco amostral Ω.
Em muitos casos, estamos interessados em caracterısticas numericas associadas a um
resultado ω ∈ Ω.
Uma funcao real definida em Ω, X : Ω→ R, e chamada variavel aleatoria. Denotaremos
estas funcoes usualmente por letras maiusculas da segunda metade do alfabeto.
Uma variavel aleatoria em si pode tambem ser considerada um experimento aleatorio,
ja que seu valor (desconhecido) depende do resultado (desconhecido) do experimento.
Inversamente, se os resultados de um experimento forem valores numericos, entao o
resultado pode ser considerado uma variavel aleatoria.
Exemplo: Considere o experimento de lancar um dado e observar a face obtida. O
espaco amostral e um subconjunto real, Ω = 1, 2, 3, 4, 5, 6. Portanto a funcao X que
indica a face observada e uma variavel aleatoria, como na Figura 3.1.
Exemplo: Considere o experimento de lancar uma moeda 2 vezes e observar a sequencia
das faces obtidas. A funcao real X que indica o numero de caras de uma sequencia
observada e uma variavel aleatoria.
Quando o experimento e realizado e observamos o resultado ω, a variavel aleatoria
assume o valor X(ω) = x. Denotaremos por χ o conjunto dos possıveis valores assumidos
por X.
3.1 Eventos induzidos por uma variavel aleatoria
Denotemos por A o conjunto de eventos em Ω e por B o conjunto de eventos em R.
12 Variaveis aleatorias
Figura 3.1: Diagrama de uma funcao (variavel aleatoria) X entre os conjuntos Ω e R.
Dado um evento B ∈ B, denotaremos por (X ∈ B) o conjunto imagem inversa de B, ou
seja,
(X ∈ B) = ω ∈ Ω : X(ω) ∈ B
e o conjunto de resultados do experimento que tem a caracterıstica X com valor em B.
Dois casos particulares importantes desta notacao sao os eventos em Ω
(X = x) = ω ∈ Ω : X(ω) = x,
o conjunto de resultados do experimento com caracterıstica X exatamente igual a x, e
(X ≤ x) = ω ∈ Ω : X(ω) ≤ x,
o conjunto de resultados do experimento com caracterıstica X menor ou igual a x.
Exemplo. No exemplo dos 2 lancamentos de uma moeda, o evento (X = 1) e o conjunto
de sequencias em Ω que apresentam uma unica cara,
(X = 1) = CK,KC,
onde C denota cara e K coroa. O evento (X ≤ 1) e o conjunto de sequencias em Ω que
apresentam no maximo uma cara,
(X ≤ 1) = KK,CK,KC.
Maos a obra.
Exercıcios
Assuma que X e uma variavel aleatoria e que A e B sao eventos em R. As seguintes
afirmacoes trabalham com o conjunto imagem inversa e sua preservacao por operacoes
de conjuntos. Prove os resultados.
Aplicacoes 13
1. (X ∈ A ∪B) = (X ∈ A) ∪ (X ∈ B)
2. (X ∈ A ∩B) = (X ∈ A) ∩ (X ∈ B)
3. (X ∈ A \B) = (X ∈ A) \ (X ∈ B)
4. Se A e B sao disjuntos entao (X ∈ A) e (X ∈ B) tambem sao.
5. 1A∩B = 1A1B = min1A, 1B
6. 1A∪B = 1− (1− 1A)(1− 1B) = max1A, 1B
7. 1A\B = 1A(1− 1B)
8. 1AC = 1− 1A
9. A ⊂ B se e somente se 1A ≤ 1B.
3.2 Aplicacoes
Os exemplos que veremos geralmente tratarao de problemas com moedas e dados, por sua
relativa simplicidade matematica. No entanto, nao devemos esquecer que estes modelos
podem ser vistos como uma primeira resolucao para problemas reais mais complexos.
Lancamentos de uma moeda
Um experimento basico com moedas e o de n lancamentos sucessivos de uma moeda,
obtendo como resultado do experimento uma sequencia X = (X1, X2, . . . , Xn) de zeros
e uns, onde 0 denota coroa e 1 denota cara, por exemplo. Esta notacao e util, ja que
permite obter algumas caracterısticas do experimento de maneira rapida. Por exemplo,
se quisermos o total de caras obtidas nos n lancamentos, digamos S, basta observar que
S = X1 +X2 + · · ·+Xn, e se quisermos o total de coroas, basta obter n− S.
O applet Coin Sample realiza este experimento, permitindo ver um padrao nas respostas
obtidas. Por exemplo, selecione n = 6 lancamentos com p = 0, 5, o que indica que voce
lancara 6 vezes uma moeda balanceada (com mesma chance de obter cara ou coroa em
um lancamento qualquer). Rode o programa vinte vezes, e veja quantas vezes ocorreu o
evento (S = 2). Depois selecione outros valores de p e veja o que ocorre com a frequencia
deste evento ao repetir o experimento varias vezes.
Um experimento deste tipo, com repeticao de experimentos, cada um tendo apenas dois
possıveis resultados, e chamado uma sequencia de ensaios de Bernoulli.
14 Variaveis aleatorias
Lancamentos de um dado
Uma generalizacao natural e considerar n lancamentos de um dado de k lados (que
pode ser visto como uma moeda com k faces). Este tipo de experimento e chamado uma
sequencia de ensaios multinomiais. O caso especial de k = 6 corresponde a um dado
comum de 6 faces.
O applet Dice Sample realiza este experimento com um dado de 6 faces, permitindo ver
algum padrao nas respostas obtidas. Por exemplo, selecione n = 2 e rode o programa
diversas vezes. O que ocorre com a frequencia do evento A =“o resultado do primeiro
lancamento e par”?
O experimento Jogo dos Divisores, construıdo pelo projeto Matematica Multimıdia [11],
define funcoes numericas a partir das faces obtidas no lancamento de um dado comum.
Experimentos compostos
Consideremos agora o experimento em dois estagios dado-moeda: lancamos um dado
e depois lancamos uma moeda o total de vezes que foi obtido no dado. Registramos a
sequencia X de resultados da moeda. Seja N a variavel aleatoria que denota o valor
obtido no dado e S o total de caras obtidas nos lancamentos da moeda.
Figura 3.2: Experimento de lancar um dado e uma moeda.
Determine o espaco amostral Ω e #Ω. Expresse N e S como funcoes definidas em Ω.
Liste os elementos do evento (S = 5).
Resposta:
Ω = 1, 0, 11, 10, 01, 00, 111, 110, 101, 011, 100, 010, 001, 000, 1111, . . . , 000000 tem
#Ω = 2 + 22 + 23 + 24 + 25 + 26 = 126
Aplicacoes 15
elementos. A variavel aleatoria N e a funcao
N(1) = N(0) = 1
N(11) = N(10) = N(01) = N(00) = 2
N(111) = N(110) = N(101) = N(011) = · · · = N(000) = 3
N(1111) = N(1110) = N(1101) = N(1011) = · · · = N(0000) = 4
...
N(111111) = N(111110) = · · · = N(000000) = 6
e S e
S(0) = S(00) = S(000) = S(0000) = S(00000) = S(000000) = 0
S(1) = S(10) = S(01) = S(100) = S(010) = · · · = S(000001) = 1
S(11) = S(110) = S(101) = S(011) = · · · = S(000011) = 2
S(111) = S(1110) = S(1101) = S(1011) = · · · = S(000111) = 3
...
S(111111) = 6
O evento (S = 5) e descrito como o conjunto
(S = 5) = 11111, 111110, 111101, 111011, 110111, 101111, 011111.
Maos a obra.
Exercıcios
1. Considere o experimento de lancar uma moeda n = 4 vezes, observando a sequencia
de resultados, e seja Y o numero de caras obtidas.
(a) Descreva o espaco amostral Ω, listando todos os seus elementos.
(b) Descreva o evento (Y = k), para todo k possıvel.
(c) Quantos elementos tem o evento (Y = k)?
2. Considere o experimento anterior no caso geral de n lancamentos. Quantos ele-
mentos tem o espaco amostral? Quantos elementos tem o evento (Y = k), para
cada k = 0, 1, . . . , n?
16 Variaveis aleatorias
3. Considere o experimento de n = 2 lancamentos de um dado comum de 6 faces.
Sejam Y a variavel aleatoria que indica a soma obtida nos dois lancamentos, U a
variavel aleatoria que indica o menor resultado e V o maior resultado obtidos nos
dois lancamentos. Expresse cada uma destas variaveis aleatorias como uma funcao
do espaco amostral Ω e determine o conjunto de possıveis valores. Determine o
conjunto de possıveis valores de (U, V ).
4. No contexto do exercıcio anterior, denote por X1 o resultado do primeiro lanca-
mento e por X2, o resultado do segundo. Descreva os elementos dos seguintes
eventos como subconjuntos do espaco amostral Ω:
(a) (X1 < 3, X2 > 4);
(b) (Y = 7);
(c) (U = 2);
(d) (V = 5);
(e) (U = V − 1).
5. Suponha que 3 dados comuns de 6 faces sao lancados e que o resultado de cada
um (X1, X2, X3) e registrado. Uma pessoa paga $1 para lancar os dados e recebe
$1 por cada 6 que aparecer no lancamento. Seja W o lucro dessa pessoa em
uma realizacao do experimento. Descreva o espaco amostral Ω do experimento e
expresse W como funcao definida em Ω.
Capıtulo 4
Medida de probabilidade
4.1 Probabilidade como grau de informacao
Dependendo do grau de informacao do observador, e possıvel ter diversos graus de
precisao sobre os possıveis resultados de um experimento aleatorio. Um antropologo,
mesmo nao sabendo exatamente, deve ter uma ideia mais precisa a respeito do numero de
troncos linguısticos na America do Sul em 1500 do que alguem que nao tem informacao
especializada a respeito.
Este grau de informacao pode ser quantificado no que definiremos como funcao de pro-
babilidade. Da discussao anterior, na maioria dos casos reais, observadores diferentes
terao informacoes diferentes a respeito do fenomeno estudado, e portanto funcoes de
probabilidade diferentes. Em alguns casos teoricos, no entanto, e possıvel que haja con-
senso entre diversos observadores, levando assim a uma mesma funcao de probabilidade
para o problema estudado.
Qualquer que seja o caso, a probabilidade de um resultado reflete um grau de certeza a
respeito da ocorrencia desse resultado.
4.2 Diversas interpretacoes
Historicamente, encontramos basicamente duas interpretacoes para o conceito de pro-
babilidade.
A mais antiga e a chamada interpretacao frequentista, baseada na suposicao de que o
experimento pode ser repetido indefinidamente sob as mesmas condicoes. Neste caso, a
18 Medida de probabilidade
probabilidade de um evento e proporcional ao limite da frequencia observada do evento
nas repeticoes.
A segunda e a chamada interpretacao subjetivista, baseada no conhecimento ou grau
de informacao do observador a respeito dos possıveis resultados do experimento. Se o
experimento nao for repetıvel (como e o caso da maioria das situacoes na pratica), a
interpretacao frequentista fica sem sentido, e utilizamos naturalmente toda nossa in-
formacao para atribuir probabilidade a um evento de interesse.
A interpretacao frequentista pode ser vista como um caso particular da subjetivista, ja
que um observador poderia achar razoavel atribuir para um evento uma probabilidade
igual ao limite da frequencia se o experimento pudesse ser repetido.
Independentemente da interpretacao, uma definicao completa de uma probabilidade
requer uma definicao precisa do espaco amostral e do conjunto de eventos possıveis.
O processo de atribuir uma funcao de probabilidade aos resultados de um experimento
aleatorio e o que chamamos de modelagem probabilıstica ou estocastica.
O vıdeo BrasilxArgentina mostra uma aplicacao da teoria subjetivista em teoria de
decisao.
4.3 Definicao
Consideremos um experimento aleatorio com espaco amostral Ω e conjunto de eventos
F .
Uma medida de probabilidade P em Ω e uma funcao real com domınio F , P : F → R,
satisfazendo as seguintes propriedades:
P1 P (A) ≥ 0 para todo evento A ∈ F .
P2 P (Ω) = 1.
P3 Dada uma colecao contavel de eventos A1, A2, . . . , disjuntos dois a dois, entao
P (∪iAi) =∑i
P (Ai).
Estas propriedades sao chamadas axiomas de Kolmogorov, em homenagem ao matemati-
co russo Andrei Kolmogorov. A terceira propriedade e conhecida como a propriedade de
aditividade contavel, e afirma que a probabilidade de uma colecao finita ou enumeravel
de eventos mutuamente exclusivos e igual a soma de suas probabilidades.
Algumas desigualdades 19
As propriedades P1 e P2 sao uma convencao na qual decidimos medir a probabilidade
de um evento como um numero entre 0 e 1; mas a propriedade P3 e fundamental, e
analoga as demais forma de medir o “tamanho” de um conjunto: via cardinalidade de
conjuntos finitos, comprimento de intervalos reais, area de subconjuntos em R2, e volume
de subconjuntos em R3, por exemplo.
Maos a obra.
Exercıcios
Suponha que temos um experimento aleatorio com espaco amostral Ω e uma medida
de probabilidade P . Nos seguintes exercıcios, A e B sao eventos. Prove os seguintes
resultados usando os axiomas de Kolmogorov.
1. Regra do complementar. P (AC) = 1− P (A).
2. P (∅) = 0.
3. Regra da diferenca. P (B \A) = P (B)− P (A ∩B).
4. Se A ⊂ B entao P (B \A) = P (B)− P (A).
5. A probabilidade e uma funcao crescente relativa a ordem parcial dos conjuntos.
Se A ⊂ B entao P (A) ≤ P (B). Em particular, P (A) ≤ 1 para todo evento A.
6. Suponha que A ⊂ B.
(a) Se P (B) = 0 entao P (A) = 0.
(b) Se P (A) = 1 entao P (B) = 1.
7. Se P (A) = 0 entao P (A ∪B) = P (B).
8. Se P (A) = 1 entao P (A ∩B) = P (B).
4.4 Algumas desigualdades
Para os seguintes resultados, suponha que Ai : i ∈ I e uma colecao enumeravel de
eventos em Ω.
20 Medida de probabilidade
Desigualdade de Boole
P (∪i∈IAi) ≤∑i∈I
P (Ai).
Veja a prova A.3.
Desigualdade de Bonferroni
P (∩i∈IAi) ≥ 1−∑i∈I
(1− P (Ai)).
A prova e feita aplicando a desigualdade de Boole a colecao ACi : i ∈ I.
Maos a obra.
Exercıcios
1. Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos com P (Ai) = 0,
para i ∈ I. Use a desigualdade de Boole para mostrar que P (∪iAi) = 0.
Um evento A com P (A) = 0 e dito um evento nulo. Desta forma, a uniao enu-
meravel de eventos nulos e um evento nulo.
2. Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos com P (Ai) = 1,
para todo i ∈ I. Use a desigualdade de Bonferroni para mostrar que P (∩iAi) = 0.
Um evento A com P (A) = 1 e dito um evento quase certo. Desta forma, a
intersecao enumeravel de eventos quase certos e um evento quase certo.
4.5 Distribuicao de uma variavel aleatoria
A terna (Ω,F , P ) definida na secao anterior e chamada espaco de probabilidade e e o
que devemos definir para modelar um experimento aleatorio.
Suponha que X e uma variavel aleatoria definida em Ω, onde (Ω,F , P ) define um espaco
de probabilidade.
Entao a funcao PX definida por
PX(B) = P (X ∈ B) = P (ω ∈ Ω : X(ω) ∈ B)
e uma medida de probabilidade em R. Este resultado sai diretamente das propriedades
da imagem inversa ja estudadas.
Distribuicao uniforme discreta 21
A funcao PX e chamada distribuicao de probabilidade de X.
Desta forma, uma variavel aleatoria define um novo espaco de probabilidade em R,
(R,B, PX).
4.6 Distribuicao uniforme discreta
Suponhamos que Ω e um conjunto finito e nao-vazio. A distribuicao uniforme em Ω e
definida como
P (A) =#A
#Ω, A ⊂ Ω,
e e particularmente importante em experimentos amostrais e combinatorios, como os
definidos anteriormente.
Basicamente, se tivermos um espaco amostral finito, a distribuicao uniforme atribui aos
eventos de Ω uma probabilidade proporcional ao seu numero de elementos. Daqui a
importancia de construir formas eficientes de contagem.
Observemos que, neste caso, a probabilidade de cada resultado elementar e a mesma.
4.7 Distribuicoes discretas
Se Ω for um conjunto discreto e nao-vazio, podemos definir uma probabilidade em Adefinindo a probabilidade de todos os eventos elementares, P (ω), para ω ∈ Ω, que
denotaremos simplesmente por P (ω).
De fato, neste caso, temos que
P (A) =∑ω∈A
P (ω).
Generalizando esta ideia, se tivermos um particao enumeravel de Ω, Ai, i ∈ I, entao
podemos escrever
P (B) =∑i∈I
P (B ∩Ai).
Esta igualdade e conhecida como Lei da Probabilidade Total, e e util quando as proba-
bilidades das intersecoes sao conhecidas.
Estas particoes usualmente aparecem quando lidamos com variaveis aleatorias discretas,
que definem uma particao natural com os eventos da forma (X = x). Se X assumir
22 Medida de probabilidade
Figura 4.1: Lei da Probabilidade Total.
valores apenas em um conjunto enumeravel χ ⊂ R, entao
P (A) =∑x∈χ
P (A ∩ (X = x)) =:∑x∈χ
P (A,X = x).
4.8 Formula de inclusao-exclusao
A formula de inclusao-exclusao vista para a medida de contagem se aplica tambem a
medidas de probabilidade, e a demonstracao e muito similar.
Dados tres eventos A,B,C, temos que
P (A ∪B) = P (A) + P (B)− P (A ∩B),
e
P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B∩C)+P (A∩B∩C).
Em geral, dados A1, A2, . . . , An, temos que
P (∪Ai) =n∑i=1
P (Ai)−∑
1≤i<j≤nP (Ai ∩Aj) + · · ·+ (−1)n−1P (A1 ∩A2 ∩ · · · ∩An).
Maos a obra.
Exercıcios
Nos seguintes exercıcios, assuma que A,B,C sao eventos de um espaco amostral Ω.
1. Prove a formula de inclusao-exclusao.
2. Suponha que P (A) = 1/3, P (B) = 1/4, P (A ∩B) = 1/10. Expresse cada um dos
seguintes eventos em linguagem de experimentos e determine sua probabilidade:
A \B, A ∪B, AC ∪BC , AC ∩BC , A ∪BC .
Moedas 23
3. Suponha que P (A) = 0.3, P (B) = 0.2, P (C) = 0.4, P (A∩B) = 0.04, P (A∩C) =
0.1, P (B∩C) = 0.1, P (A∩B∩C) = 0.01. Expresse cada um dos seguintes eventos
em notacao de conjuntos e determine sua probabilidade:
(a) pelo menos um dos tres eventos ocorre;
(b) nenhum dos tres eventos ocorre;
(c) exatamente um dos tres eventos ocorre;
(d) exatamente dois dos tres eventos ocorrem.
4.9 Moedas
Consideremos o experimento de lancamento de uma moeda n vezes, observando a
sequencia de resultados obtidos X = (X1, . . . Xn), onde 1 denota cara e 0 denota coroa.
Figura 4.2: Resultado X do experimento “6 lancamentos de uma moeda”.
No experimento Coin, selecione n = 2 moedas e rode o experimento 50 vezes, atua-
lizando a tabela depois de cada rodada. Determine a frequencia dos eventos A =“o
primeiro lancamento e cara” e B =“os dois lancamentos sao cara”.
Total de caras em n lancamentos uniformes
Definamos a variavel aleatoria Y como o total de caras obtidas em n lancamentos de
uma moeda. Observemos que o espaco amostral do experimento e χ = 0, 1n.
Se assumirmos que a probabilidade de obter cara em cada lancamento e a mesma de
obter coroa, entao cada resultado elementar tem a mesma probabilidade de ocorrer,
ou seja, X tem distribuicao uniforme em χ. Como temos 2n resultados, cada um tem
probabilidade 1/2n = (1/2)n.
O evento (Y = k) consiste em todos os valores de X com exatamente k caras. Pelo ja
visto, temos um total de(nk
)possibilidades de ordenar as k caras em n lancamentos.
Portanto,
P (Y = k) =
(n
k
)(1
2
)n,
24 Medida de probabilidade
para todo k ∈ 0, 1, . . . , n.
O vıdeo Noite de forro mostra uma aplicacao destas distribuicoes.
Maos a obra.
Exercıcios
1. Considere o experimento de lancar uma moeda balanceada 3 vezes. Seja A o
evento “o primeiro lancamento e cara” e B, o evento “exatamente dois lancamentos
resultam em cara”. Para cada um dos eventos seguintes, liste seus elementos e
determine sua probabilidade: A, B, A ∩B, A ∪B, AC ∪BC , AC ∩BC , A ∪BC .
2. Considere o experimento de lancar uma moeda balanceada 4 vezes, e denote por
Y o total de caras observadas. Liste os elementos do evento (Y = k), para cada k
possıvel, e determine a probabilidade do evento.
4.10 Dados
Considere o experimento de lancar n vezes um dado de k faces, com faces numeradas
de 1 a k, registrando a sequencia de resultados X = (X1, X2, . . . , Xn). O caso k = 6
corresponde ao dado comum.
Figura 4.3: Resultado X do experimento “6 lancamentos de um dado”.
Se assumirmos que cada face tem a mesma probabilidade de ser observada em cada
lancamento, entao todos os kn valores possıveis de X tem a mesma probabilidade, 1/kn.
No experimento Dice, selecione n = 2 dados e rode o experimento 50 vezes, atualizando
a tabela depois de cada rodada. Determine a frequencia dos eventos A =“o primeiro
lancamento e menor que 3” e B =“a soma dos dois lancamentos e 6”.
Distribuicao do maximo e do mınimo de variaveis uniformes 25
4.11 Distribuicao do maximo e do mınimo de variaveis uni-
formes
Considere o experimento de lancar n vezes um dado de k faces igualmente provaveis, e
definamos as variaveis aleatorias U igual ao mınimo valor obtido nos n lancamentos e
V igual ao maximo valor.
Claramente, U e V podem assumir qualquer valor entre 1 e k. Obteremos a distribuicao
de U para n = 2 e k = 6. As provas do caso geral e da distribuicao de V sao analogas.
Observemos que (U = 6) ocorre somente se ambos os lancamentos forem 6. Como temos
um total de 62 = 36 possibilidades, entao P (U = 6) = 1/36. Para os demais casos, a
Tabela 4.1 mostra todos os possıveis resultados dos dois lancamentos e o valor de U em
cada caso.
(D1, D2) 1 2 3 4 5 6
1 1 1 1 1 1 1
2 1 2 2 2 2 2
3 1 2 3 3 3 3
4 1 2 3 4 4 4
5 1 2 3 4 5 5
6 1 2 3 4 5 6
Tabela 4.1: Possıveis resultados do mınimo de dois lancamentos de um dado.
Sendo assim, para determinar a probabilidade do evento (U = k) basta contar o total
de resultados cujo mınimo e igual a k.
O software Explorando o Jogo do Maximo trabalha com a simulacao de V para dois
dados.
26 Medida de probabilidade
Capıtulo 5
Probabilidade condicional
5.1 Definicao
Como antes, consideremos o esquema basico de um experimento aleatorio, um espaco
amostral Ω, um conjunto de eventos F e uma medida de probabilidade P .
Assumamos que um evento B tenha ocorrido. Usualmente, esta informacao altera a
probabilidade atribuıda a outros eventos. De fato, um outro evento A pode ocorrer se e
somente se A∩B pode ocorrer. Assim, a probabilidade de A, assumindo que B ocorreu,
deve ser proporcional a P (A ∩B).
Em particular, P (Ω) deve ser proporcional a P (Ω ∩B) = P (B).
Dado um evento B com P (B) > 0, definimos a probabilidade condicional dado B como
a funcao que a cada evento A ∈ F atribui o valor P (A|B) igual a
P (A|B) =P (A ∩B)
P (B).
A funcao P (A|B) e uma medida de probabilidade e tem, portanto, todas as propriedades
vistas no capıtulo anterior.
Os experimentos Jogo da trilha e Jogo das amebas mostram uma aplicacao de probabil-
idades condicionais para mais de dois eventos.
Maos a obra.
Exercıcios
Prove as seguintes afirmacoes, assumindo que A,B sao eventos com P (B) > 0.
28 Probabilidade condicional
1. A funcao P (A|B) e uma medida de probabilidade.
2. Se B ⊂ A entao P (A|B) = 1.
3. Se A ⊂ B entao P (A|B) = P (A)/P (B).
4. Se A e B forem disjuntos entao P (A|B) = 0.
5. Suponha que A tambem tem probabilidade positiva.
(a) P (A|B) > P (A) se e so se P (B|A) > P (B) se e so se P (A∩B) > P (A)P (B).
Neste caso, dizemos que A e B sao eventos positivamente correlacionados.
(b) P (A|B) < P (A) se e so se P (B|A) < P (B) se e so se P (A∩B) < P (A)P (B).
Neste caso, dizemos que A e B sao eventos negativamente correlacionados.
(c) P (A|B) = P (A) se e so se P (B|A) = P (B) se e so se P (A∩B) = P (A)P (B).
Neste caso, dizemos que A e B sao eventos nao correlacionados ou indepen-
dentes: intuitivamente, a ocorrencia de um dos eventos nao altera a proba-
bilidade do outro evento.
6. A e B tem a mesma correlacao que AC e BC .
5.2 Regra do produto
Eventualmente, podemos quantificar probabilidades condicionais de maneira simples e
usa-las para determinar a probabilidade de um evento.
Dados os eventos A e B,
P (A ∩B) = P (A)P (A|B),
e, mais geralmente, dados os eventos A1, A2, . . . , An,
P (A1 ∩A2 ∩ · · · ∩An) = P (A1)P (A2|A1) . . . P (An|A1 ∩A2 ∩ · · · ∩An−1).
Esta e chamada a regra do produto, e e particularmente util para experimentos que
consistem de etapas dependentes, com Ai um evento relacionado a etapa i.
5.3 Lei da probabilidade total
Com a regra do produto, podemos reescrever a Lei da Probabilidade Total como
P (B) =∑i∈I
P (Ai)P (B|Ai),
Lei da probabilidade total 29
onde Ai : i ∈ I e uma particao de Ω.
Este resultado e util quando conhecemos as probabilidades dos eventos da particao,
P (Ai), e as probabilidades condicionais, P (B|Ai), e com isso podemos determinar P (B)
por partes.
Maos a obra.
Exercıcios
1. Suponha que A,B sao eventos com P (A) = 1/3, P (B) = 1/4, P (A ∩ B) = 1/10.
Determine: P (A|B), P (B|A), P (AC |B), P (BC |A), P (AC |BC).
2. Suponha que A,B,C sao eventos com P (A|C) = 1/2, P (B|C) = 1/3, P (A ∩B|C) = 1/4. Determine: P (A \B|C), P (A ∪B|C), P (AC ∩BC |C).
3. Suponha que A,B sao eventos com P (A) = 1/2, P (B) = 1/3, P (A ∩ B) =
3/4. Determine: P (A ∩ B), P (A ∪ B), P (B|A), P (AC ∪ B); A e B sao positiva,
negativamente correlacionados ou nao correlacionados?
4. Uma empresa tem 200 funcionarios: 120 mulheres e 80 homens. Das 120 fun-
cionarias, 30 sao gerentes, enquanto que 20 dos 80 funcionarios sao gerentes. Se-
lecionando um funcionario, determine a probabilidade de que:
(a) seja mulher;
(b) seja gerente;
(c) seja gerente, dado que e mulher;
(d) seja mulher, dado que e gerente.
As caracterısticas mulher e gerente sao correlacionadas? como?
5. Considere o experimento de lancar 2 dados e observar o resultado obtido X =
(X1, X2) em cada dado. Assuma que os dados sao equilibrados e que os lancamen-
tos nao favorecem nenhuma face. Defina Y como a soma dos resultados. Para cada
par de eventos a seguir, determine a probabilidade de cada evento, a probabilidade
condicional de um evento dado o outro, e que tipo de correlacao eles apresentam.
(a) X1 = 3, Y = 5;
(b) X1 = 3, Y = 7;
(c) X1 = 2, Y = 5;
30 Probabilidade condicional
(d) X1 = 3, X1 = 2.
6. Simule o exercıcio anterior no applet Dice, selecionando n = 2.
7. Considere novamente o exercıcio anterior, e defina U como o resultado mınimo e
V como o resultado maximo. Determine:
(a) P (U = u|V = 4), para os valores possıveis de u;
(b) P (Y = y|V = 4), para os valores possıveis de y;
(c) P (V = v|Y = 8), para os valores possıveis de v;
(d) P (U = u|Y = 8), para os valores possıveis de u;
(e) P (X1 = x1, X2 = x2|Y = 8), para os valores possıveis de (x1, x2).
5.4 Regra de Bayes
Seja Ai : i ∈ I uma particao de Ω e B um evento. Da regra do produto, dado j ∈ I,
podemos escrever P (Aj |B) como
P (Aj ∩B) = P (Aj)P (B|Aj).
Pela Lei da Probabilidade Total obtemos entao
P (Aj |B) =P (Aj ∩B)
P (B)=
P (Aj)P (B|Aj)∑i∈I P (Ai)P (B|Ai)
,
conhecida como a Regra de Bayes.
Este resultado nos permite atualizar a probabilidade dos eventos Ai, apos saber ou
supor que B ocorreu. E comumente utilizada para atualizar a probabilidade dos diversos
modelos considerados para uma populacao apos obter informacao de uma amostra da
mesma.
Os vıdeos Teste de gravidez e Crime da rua do Gasometro apresentam duas situacoes
em que a regra de Bayes pode ser aplicada.
Maos a obra.
Exercıcios
1. Considere o experimento dado-moeda de lancar um dado e depois uma moeda o
numero de vezes que aparece no dado. Seja N o resultado do dado e C o evento de
que todos os lancamentos da moeda resultam em cara. Determine: P (C), P (N =
Regra de Bayes 31
n|C) para n ∈ 1, 2, 3, 4, 5, 6, compare estes resultados com P (N = n) para
n ∈ 1, 2, 3, 4, 5, 6, dizendo como os eventos C e (N = n)estao correlacionados.
2. Simule o exercıcio anterior no applet Die-Coin, comparando as frequencias obser-
vadas com as probabilidades calculadas no item anterior.
3. Uma bolsa contem 12 moedas indistinguıveis: 5 moedas equilibradas, 4 moedas
viesadas com probabilidade de cara igual a 1/3, e 3 moedas com duas caras. Uma
moeda e selecionada e lancada. Qual e a probabilidade de obter cara? Se o
resultado fosse cara, qual e a probabilidade condicional de cada tipo de moeda?
4. Considere o experimento moeda-dado, no qual uma moeda e lancada. Se o re-
sultado for coroa, lancamos um dado balanceado; se for cara, lancamos um dado
as-seis (as faces 1 e 6 tem probabilidade 1/4 cada uma, e as demais, 1/8 cada).
Seja H o evento de obter cara, e seja Y o resultado obtido no dado. Assumindo
que a moeda e balanceada, determine:
(a) P (Y = y) para y ∈ 1, 2, 3, 4, 5, 6;
(b) P (H|Y = y) para y ∈ 1, 2, 3, 4, 5, 6;
(c) compare as probabilidades do item anterior com P (H), indicando o tipo de
correlacao entre os eventos H e (Y = y).
(d) Simule o exercıcio anterior no applet Coin-Die, comparando as frequencias
observadas com as probabilidades calculadas no item anterior.
5. Uma fabrica tem 3 linhas de montagem para produzir chips de memoria. A linha
1 produz 50% dos chips, com uma taxa de defeituosos de 4%; a linha 2 produz
30% dos chips, com uma taxa de defeituosos de 5%; a linha 3 produz 20% dos
chips, com uma taxa de defeituosos de 1%. Ao selecionar um chip, determine a
probabilidade de que o chip seja defeituoso. Determine a probabilidade condicional
de cada linha se o chip for defeituoso.
6. Em uma populacao, composta igualmente por homens e mulheres, 10% dos homens
sao daltonicos, enquanto que apenas 1% das mulheres o sao. Determine a pro-
porcao de daltonicos na populacao, e a proporcao de daltonicos que sao homens.
32 Probabilidade condicional
Capıtulo 6
Independencia
6.1 De dois eventos
Como antes, suponhamos que temos um experimento aleatorio com espaco amostral Ω,
conjunto de eventos F e medida de probabilidade P .
Independencia e um dos conceitos fundamentais em teoria de probabilidade, e utilizado
como suposicao para uma ampla gama de modelos.
Dados dois eventos A,B, dizemos que eles sao independentes se
P (A ∩B) = P (A)P (B).
Se ambos os eventos tiverem probabilidade positiva, entao independencia e equivalente
a
P (A|B) = P (A) e P (B|A) = P (B).
Desta forma, fica evidenciado que dois eventos sao independentes se ao assumir que um
deles ocorre, a probabilidade do outro ocorrer nao e alterada.
Maos a obra.
Exercıcios
1. Suponha que A,B sao eventos disjuntos, ambos com probabilidade positiva. Mos-
tre que P (A ∩ B) = 0, mas que P (A)P (B) > 0. Portanto, A e B nao sao
independentes, mais ainda, eles sao negativamente correlacionados (se um dele
ocorrer, o outro nao pode ocorrer).
2. Suponha que A,B sao eventos independentes. Mostre que tambem sao indepen-
dentes: AC e B, B e AC , AC e BC .
34 Independencia
6.2 De uma colecao de eventos
Consideremos uma colecao A = Ai : i ∈ I de eventos. Dizemos que eles sao indepen-
dentes se para qualquer subcolecao finita A1, A2, . . . , Ak ⊂ A,
P (
k⋂i=1
Ai) =
k∏i=1
P (Ai).
Esta definicao de independencia e muito mais geral do que uma simples independencia
dois a dois; todas as colecoes finitas de Ai’s devem ser independentes, dois a dois, tres
a tres, etc. Os exercıcios dao exemplos desta diferenca.
Maos a obra.
Exercıcios
1. Descreva todas as condicoes para que A,B,C sejam eventos independentes.
2. Suponha que A,B,C sao eventos independentes. Mostre que os eventos A∪BC e
C tambem sao independentes.
3. Suponha que A1, A2, . . . , An e uma colecao finita de eventos independentes.
Mostre que
P (n⋃i=1
Ai) = 1−n∏i=1
(1− p(Ai)).
4. Suponha que A,B,C sao eventos independentes com P (A) = 0.3, P (B) = 0.5,
P (C) = 0.8. Expresse cada um dos seguintes eventos em notacao de conjuntos e
determine sua probabilidade:
(a) todos os tres eventos ocorrem;
(b) nenhum dos tres eventos ocorre;
(c) ao menos um dos tres eventos ocorre;
(d) exatamente um dos tres eventos ocorre;
(e) exatamente dois dos tres eventos ocorrem.
5. Suponha que A,B,C sao eventos independentes com P (A) = 1/2, P (B) = 1/3,
P (C) = 1/4. Determine a probabilidade dos seguintes eventos: (A ∩ B) ∪ C,
A ∪BC ∪ C, (AC ∩BC) ∪ CC .
De variaveis aleatorias 35
6.3 De variaveis aleatorias
Suponha que X1 e X2 sao variaveis aleatorias. Intuitivamente, duas variaveis aleatorias
sao independentes se o conhecimento do valor de uma delas nao altera a distribuicao de
probabilidade da outra variavel.
Formalmente, X1 e X2 sao variaveis aleatorias independentes se as colecoes de eventos
(X1 ∈ B) : B ∈ B e (X2 ∈ B) : B ∈ B
forem independentes, ou equivalentemente, se para cada escolha B1, B2 ∈ B, tivermos
que
P (X1 ∈ B1, X2 ∈ B2) = P (X1 ∈ B1)P (X2 ∈ B2).
Generalizando a definicao anterior, dizemos que uma sequencia de variaveis aleatorias
X1, X2, . . . e independente se qualquer subcolecao finita delas for independente.
Suponhamos que temos um experimento basico no qual observamos a variavel X0. Por
definicao, o resultado do experimento que consiste em repeticoes independentes do exper-
imento basico e uma sequencia de variaveis aleatorias independentes X = (X1, X2, . . . ),
cada uma com a mesma distribuicao de probabilidade que X0.
6.4 Ensaios de Bernoulli
Um sequencia de ensaios de Bernoulli e uma sequencia X = (X1, X2, . . . ) de variaveis
independentes identicamente distribuıdas, onde cada variavel pode assumir apenas os
valores 0 ou 1. Da terminologia de teoria da confiabilidade, usualmente chamamos o
resultado 1 de sucesso e o 0 de fracasso.
Um exemplo usual e o de sucessivos lancamentos de uma moeda nao necessariamente
balanceada, ou de repeticoes de um experimento basico no qual temos interesse em saber
se um evento A ocorre ou nao.
Este processo tem um unico parametro p = P (Xi = 1) que determina completamente o
modelo probabilıstico.
Para este modelo, temos
P (X1 = x1, X2 = x2, . . . , Xn = xn) = px1+x2+···+xn(1− p)n−(x1+x2+···+xn),
para xi ∈ 0, 1, i ∈ 1, 2, . . . , n.
36 Independencia
Observemos que esta sequencia de variaveis e permutavel, ou seja, se permutarmos a
sequencia (x1, x2, . . . , xn), a probabilidade nao muda.
Maos a obra.
Exercıcios
1. Seja X = (X1, X2, . . . ) uma sequencia de ensaios de Bernoulli. Mostre que
P (X1 = x1, X2 = x2, . . . , Xn = xn) = px1+x2+···+xn(1− p)n−(x1+x2+···+xn),
para xi ∈ 0, 1, i ∈ 1, 2, . . . , n.
2. Seja Y o total de sucessos nas n primeiras tentativas. Mostre que
P (Y = k) =
(n
k
)pk(1− p)n−k,
para k ∈ 0, 1, . . . , n. A distribuicao de Y e chamada distribuicao binomial com
parametros n e p.
3. Considere o experimento de lancar 2 dados balanceados de seis faces e observar
a sequencia obtida. Seja A o evento de obter 3 no primeiro dado, B o evento de
obter 4 no segundo dado e C o de que a soma seja 7.
(a) Mostre que os eventos A,B,C sao independentes dois a dois.
(b) Mostre que A ∩B implica C e que portanto eles sao dependentes.
4. No applet Dice Sample, selecione n = 2 e rode o experimento 500 vezes. Para
cada par de eventos no exercıcio anterior, determine o produto das frequencias
observadas e a frequencia observada da intersecao. Compare os resultados com o
valor teorico.
5. Considere o experimento de lancar um dado balanceado e observar a face obtida,
e os eventos A = 1, 2, 3, 4 e B = C = 4, 5, 6. Mostre que P (A ∩ B ∩ C) =
P (A)P (B)P (C), mas que B e C sao dependentes.
6. Um dado balanceado e lancado 4 vezes. Determine a probabilidade de que: 6 nao
ocorra; 6 ocorra pelo menos uma vez; a soma dos dois primeiros resultados seja 5
e a soma dos dois ultimos resultados seja 7.
7. Uma moeda com probabilidade de cara igual a 1/3 e lancada 5 vezes. Seja X o
resultado dos lancamentos (em 0’s e 1’s) e Y o total de caras. Determine:
Ensaios de Bernoulli 37
(a) P (X = x) para cada x ∈ 0, 15;
(b) P (Y = k) para cada k ∈ 0, 1, 2, 3, 4, 5;
(c) P (1 ≤ Y ≤ 3).
38 Independencia
Apendice A
Demonstracoes
A.1 Uniao de uma colecao de eventos
Dada uma colecao enumeravel de eventos A = A1, A2, . . . , a uniao ∪A e o evento que
ocorre se e somente se pelo menos um evento da colecao ocorrer.
De fato, consideremos uma realizacao do experimento, con resultado observado ω.
Entao, ∪A ocorre se e somente se ω ∈ ∪A. Isto significa que ω ∈ Ai, para algum i ∈ I,
que e equivalente a afirmar que Ai ocorre, para algum i ∈ I.
A.2 Intersecao de uma colecao de eventos
Dada uma colecao enumeravel de eventos A = A1, A2, . . . , a intersecao ∩A e o evento
que ocorre se e somente se todos os eventos da colecao ocorrerem.
De fato, consideremos o evento complementar (∩iAi)C = ∪iACi . Pela afirmacao anterior,
∪iACi ocorre se e somente se pelo menos um evento ACi ocorrer, ou seja, se pelo menos
um evento Ai nao ocorrer.
Assim ∩iAi = (∪iACi )C ocorre se e somente se nenhum dos eventos ACi ocorrer, ou seja,
se todos os eventos Ai ocorrerem.
A.3 Desigualdade de Boole
Suponha que Ai : i ∈ I e uma colecao enumeravel de eventos em Ω.
40 Demonstracoes
Consideremos inicialmente o caso em que I e um conjunto finito, ou seja, podemos
considerar I = 1, 2, . . . n.
Definamos os eventos B1 = A1 e Bi = Ai \ (A1 ∪ · · · ∪Ai−1) para i ∈ 2, . . . , n, como
feito no Tema 1.
Portanto, os conjuntos B1, B2, . . . , Bn sao disjuntos dois a dois e tem a mesma uniao
que A. Desta forma P (∪Ai) = P (∪Bi).
Pelo axioma de aditividade, P (∪Bi) =∑PBi.
Finalmente, como Bi ⊂ Ai e P e uma funcao crescente, temos que
P (∪iAi) = P (∪iBi) =∑i
P (Bi) ≤∑i
P (Ai),
como querıamos provar.
O caso nao finito e demonstrado usando o Princıpio de Inducao Finita e o argumento
anterior para os conjuntos ∪ni=1Ai e An+1.
Voltar 4.4.
Referencias Bibliograficas
[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)
Analise Combinatoria e Probabilidade. Editora SBM.
[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora
Edgard Blucher.
[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.
[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.
[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto
Euclides.
[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.
[7] Revista do Professor de Matematica. SBM.
[8] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman
Co.
Paginas da internet
Em portugues
[9] ALEA, Accao Local de Estatıstica Aplicada, Portugal.
[10] Mais - Recursos Educacionais em Matematica, Brasil.
[11] Matematica Multimıdia, Unicamp.
Em ingles
[12] Historia da Matematica, Universidade de St. Andrews, Escocia.
[13] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.
Universidade Estadual de Campinas
Modulo III - D6
Analise Combinatoria, ProbabilidadeNocoes de Estatıstica
Tema 3 - Nocoes de Estatıstica
Prof. Laura L. R. Rifo
- Janeiro, 2011 -
Sumario
1 Estatıstica e o metodo cientıfico 1
1.1 O metodo cientıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Estatıstica como aprendizagem . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Estudo sobre a malaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Amostragem, populacao e previsoes . . . . . . . . . . . . . . . . . . . . . 5
2 Representando dados 7
2.1 Grafico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Grafico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Grafico de setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Tabela de frequencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6 Diagrama de ramo-e-folhas . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.7 Outros graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Serie temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Grafico radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Cartogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 Resumindo dados 21
3.1 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2 Desvio-padrao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Relacao entre media e desvio-padrao . . . . . . . . . . . . . . . . . . . . 23
ii Sumario
3.4 Medianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Outros quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.6 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Elementos de Amostragem 27
4.1 Amostragem aleatoria simples . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2 Amostragem estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3 Amostragem por conglomerado . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Amostragem sistematica 1-em-k . . . . . . . . . . . . . . . . . . . . . . . 30
Capıtulo 1
Estatıstica e o metodo cientıfico
Esta parte do curso pretende apresentar ferramentas que permitam analisar criticamente
informacoes como as que recebemos diariamente dos meios de comunicacao.
Figura 1.1:
As inferencias obtidas a partir dos dados sao estatısticas, e tem essencialmente duas
caracterısticas: e possıvel obter evidencias por meio de experimentos ou observacoes, e
as conclusoes obtidas envolvem um grau de incerteza.
A experimentacao e a quantificacao da incerteza sao fundamentais em ciencia. Os cien-
tistas aprendem usando o metodo cientıfico. Mas cientistas diferentes usam diferentes
metodologias, e algumas delas nao tao cientıficas assim. E importante portanto ter uma
definicao precisa do que significa o metodo cientıfico.
2 Estatıstica e o metodo cientıfico
1.1 O metodo cientıfico
De acordo com o fısico Stephen Hawking, o objetivo fundamental da ciencia e entregar
uma descricao completa do universo em que vivemos. Os cientistas tentam alcancar este
objetivo contruindo teorias cientıficas e verificando as predicoes destas teorias. Hawking
nao ve a ciencia como uma forma de aproximar a realidade (seja la o que possa ser
realidade), mas como uma forma de pensar sobre a realidade. Este ponto de vista e o
que sera adotado nesta abordagem.
Uma teoria cientıfica pode ser vista como um modelo do universo, ou de uma parte
dele, e um conjunto de regras relacionando caracterısticas do modelo a observacoes que
podemos fazer.
Por exemplo, “a terra e redonda” e uma teoria cientıfica. Aristoteles e outros cien-
tistas da Grecia Antiga usaram o metodo cientıfico para verificar esta teoria, fazendo
observacoes e comparando-as com as previsoes da teoria. Primeiro, se a terra fosse re-
donda, ela deveria deixar sempre uma sombra redonda sobre a lua durante um eclipse
lunar (e isto ocorre), enquanto que se ela fosse um disco plano, a imagem seria as vezes
elıptica. Segundo, se a terra fosse redonda a estrela do Norte deveria aparecer cada vez
mais baixa no ceu quando vista de mais ao sul (isto acontece). Terceiro, se a terra fosse
redonda os mastros dos navios se aproximando deveriam aparecer antes que seus cascos
(e isto tambem acontece).
Estendendo o procedimento anterior, o metodo cientıfico e um processo que envolve
idealizar experimentos e atualizar o conhecimento usando a evidencia dos experimentos.
Experimentos melhores sao mais informativos. Mas experimentos sao caros, com custos
envolvendo tempo, dinheiro e recursos em geral. Estes custos, mesmo parecendo estar
separados da metodologia, eles sao centrais na metodologia e devem ser considerados
explicitamente.
Neste contexto, os metodos estatısticos entregam ferramentas matematicas que per-
mitem otimizar este processo.
Basicamente, podemos identificar os seguintes estagios:
1. Formulacao de uma hipotese, que tera certas consequencias
2. Amostragem ou coleta de dados
3. Resumo, representacao grafica e comparacao dos dados obtidos com o que seria de
se esperar de acordo com a hipotese estabelecida
Estatıstica como aprendizagem 3
4. Aceitacao ou rejeicao da hipotese. No caso de rejeicao, formulacao de uma nova
hipotese. No caso de aceitacao, manter a hipotese ate que novas amostras determinem
sua rejeicao.
Figura 1.2: Diagrama do metodo de aprendizagem.
Estas etapas formam um ciclo iterativo entre o avanco teorico (hipotese) e os procedi-
mentos de obtencao de dados.
A formulacao das hipoteses esta relacionada ao levantamento de possıveis respostas para
um problema especıfico.
Ao coletar dados, estamos interessados em obter informacao que permita manter a
validade de uma hipotese ou que entregue evidencias suficientes para rejeita-la e entao
formular novas hipoteses, que serao testadas com uma nova coleta de dados e assim por
diante.
A estatıstica tem um papel fundamental no planejamento e na obtencao de conclusoes
de experimentos.
1.2 Estatıstica como aprendizagem
A palavra estatıstica tem varios significados. Tecnicamente, estatısticas sao numeros
que resumem os resultados de um estudo. No singular, estatıstica e uma disciplina
cientıfica que estuda a forma em que as pessoas aprendem quando obtem informacoes,
respondendo a questao: o que este estudo significa?
Aprender e apenas uma parte da estatıstica. Outra parte do pensamento estatıstico
consiste em usar o que se aprendeu, por exemplo, guiando o processo de tomada de
decisoes, usando a informacao disponıvel.
4 Estatıstica e o metodo cientıfico
E importante levar em conta que o mesmo conjunto de dados pode levar a diferentes
conclusoes dependendo de outras informacoes disponıveis.
As duas partes principais do processo de aprendizagem sao o planejamento de experi-
mentos (que dados devem ser coletados e de que maneira?) e a analise dos dados do
experimento (como aprendemos dos dados coletados?).
Aprender de uma informacao numerica nao e um processo intuitivo; as vezes damos
credibilidade demais a uma poucas informacoes, mas, por outro lado, com muitas in-
formacoes, o processo de aprendizagem e mais difıcil.
Ao coletar informacoes, usualmente obtemos valores diferentes. A variabilidade nao
invalida os resultados do experimento, mas e importante saber reconhece-la e como
lidar com ela.
Precisamos tambem de um formalismo para incorporar os resultados obtidos em um
experimento a informacao que ja temos, permitindo assim descrever o conhecimento
disponıvel em um momento dado. Este conhecimento pode ser transformado em in-
ferencias, decisoes e planejamento de novos experimentos.
O problema de decidir entre diversas acoes possıveis ocorre nos negocios, medicina,
ciencia, e nas diversas situacoes do cotidiano. A decisao apropriada depende dos nossos
objetivos, dos custos das diversas consequencias de nossa escolha, e do nosso estado de
conhecimento sobre quais serao as consequencias.
1.3 Estudo sobre a malaria
Nos anos 50, foi realizado um estudo para determinar se portadores do gene de um certo
tipo de anemia (drepanocitose) eram mais resistentes a malaria do que nao-portadores.
Este tipo de anemia e mais comum em pessoas negras, de modo que foram recrutadas
30 pessoas negras voluntarias, das quais 15 eram portadores do gene e 15 nao eram.
Os 30 voluntarios foram injetados com malaria, sendo que 14 dos 15 nao-portadores
contraıram a doenca contra apenas 2 dos portadores.
Antes de continuar a analise, observemos que este estudo e altamente questionavel em
termos de custos: o estudo e claramente anti-etico. Das 30 pessoas expostas a doenca
com o proposito de obter informacao, 16 contraıram a doenca. Este e um alto preco
pela informacao.
O pensamento estatıstico mostra como usar a informacao obtida para concluir se porta-
dores do gene sao ou nao mais resistentes a malaria, ajudando a expressar este conheci-
Amostragem, populacao e previsoes 5
mento adquirido.
Mas estatıstica nao e simplesmente um apanhado de tecnicas para analisar dados. Por
exemplo, suponha que cada um dos 30 indivıduos do estudo anterior lancasse uma
moeda, tentando adivinhar qual face seria obtida, e que o resultado fosse que 14 dos
15 nao-portadores e 2 dos 15 portadores adivinhassem. Os dados seriam os mesmos,
mas eu nao comecaria a acreditar que nao-portadores tem mais dom de adivinhacao que
portadores.
As conclusoes seriam diferentes ao levar em conta o contexto em que os dados foram
coletados. A analise do contexto, ou seja, o entendimento do problema analisado, e
tambem importante.
1.4 Amostragem, populacao e previsoes
Uma tecnica comumente utilizada em estatıstica para estudar uma populacao e a rea-
lizacao de uma amostragem da populacao: escolhemos alguns indivıduos da populacao
a fim de mensurar as caracterısticas de interesse nesses indivıduos, para depois tirar
conclusoes para a populacao completa.
Figura 1.3: Uma amostra e uma colecao de informacoes.
Uma das perguntas em um processo de amostragem e se a amostra obtida e realmente
representativa da populacao, ou seja, se o que observamos na amostra e semelhante ao
que ocorre na populacao, em termos das perguntas que devem ser respondidas.
O conjunto de todas as possıveis observacoes (reais ou imaginadas) e chamado uma
populacao. Uma populacao pode ser finita ou infinita.
No experimento “Quantos peixes ha no lago?”, o objetivo e a realizacao de um processo
de amostragem para estimar o tamanho de uma populacao.
6 Estatıstica e o metodo cientıfico
Um problema tıpico de estatıstica envolve tirar conclusoes sobre alguma caracterıstica
da populacao a partir de uma amostra da populacao. Estas conclusoes podem levar a
tomada de decisoes baseadas na amostra.
As inferencias estatısticas extrapolam as informacoes de uma amostra para a populacao
que esta sendo amostrada.
Um tipo particular de inferencia e obter conclusoes ou previsoes para uma proxima
observacao (ou conjunto de informacoes) da populacao. As previsoes nao sao especıficas,
como “a proxima observacao sera 7”, mas estao sujeitas tambem a incertezas. A analise
destas incertezas tambem faz parte do metodo estatıstico.
O vıdeo Sem discriminacao aborda o problema de analisis precipitadas levarem a con-
clusoes incorretas com um caso real ocorrido em universidade nos anos 70, nos Estados
Unidos.
Capıtulo 2
Representando dados
Um dos objetivos centrais da estatıstica e a formalizacao do processo de aprendizagem
sobre uma populacao de interesse atraves de uma amostra da populacao.
O primeiro passo deste processo consiste na apresentacao e resumo da informacao
amostral.
Figura 2.1: Descricao de dados.
Reportar a informacao contida nos dados e um exercıcio de comunicacao: a forma de
graficar um conjunto de dados pode ser mais importante que as palavras que o acom-
panham. Aqui veremos alguns graficos basicos, mas cada problema tem suas particu-
laridades: em um problema especıfico voce poderia precisar criar seu proprio tipo de
grafico.
Alguns princıpios que devem ser seguidos ao construir um grafico sao:
1. ele deve ser entendıvel, agradavel de ver e nao complicado em excesso;
2. deve entregar toda a informacao possıvel (sem comprometer o item 1);
8 Representando dados
3. os aspectos do experimento ou dos dados que nao aparecem no grafico devem estar
explicados claramente na legenda.
O vıdeo 200 paıses, 200 anos em 4 minutos do Prof. Hans Rosling mostra uma forma
diferente e muito clara de mostrar alguns dados de saude mundial. Estes dados rela-
cionam renda per capita media (em dolares) com expectativa media de vida (em anos)
para todos os paıses do mundo e sua evolucao nos ultimos 200 anos. Vale a pena ver.
Exercıcio
Considere o seguinte conjunto de dados referentes ao peso, em kg, de uma turma de 92
alunos:
homens: 63.5, 65.5, 72.5, 85.5, 69, 74, 68, 85.5, 87, 62, 72.5, 69, 68.5, 65.5, 76.5, 79, 79,
76.5, 81, 62, 76.5, 70, 59, 83, 85.5, 69, 76.5, 69, 96, 68, 65.5, 69, 69, 68, 69, 68, 81, 72.5,
62, 72.5, 59, 69, 68, 65.5, 69, 68, 63.5, 81, 85.5, 65.5, 68, 74, 63.5, 65, 62, 55.4, 68
mulheres: 63.5, 54.5, 59, 62, 54.5, 56.5, 52, 65, 68, 50.5, 56.5, 59, 54.5, 59, 59, 54.5, 52,
56.5, 62, 56.5, 52, 55, 52, 46, 52, 68, 49.5, 52, 48.5, 43, 56.5, 59, 49.5, 68, 48.5
Registre estes dados em uma tabela com duas colunas: a primeira coluna indicando o
genero do aluno (M/F) e a segunda, com o peso (em kg) do aluno. Voce deve obter 92
linhas, referentes a cada aluno da amostra, com 57 homens e 35 mulheres.
2.1 Grafico de pontos
Um grafico de pontos e a forma mais simples de apresentar dados numericos. Cada
observacao e representada por um ponto colocado sobre uma reta, mostrando a posicao
relativa entre as observacoes.
Exemplo. Para encontrar a viscosidade da dimetilanilina a 20C, sao obtidas a se-
guintes mensuracoes: 146, 154, 141, 140, 136, 132, 147, 140, 147, 139, 140, 140 (em
centipoises ou cP). Os dados apresentam esta variabilidade porque nao ha controle de
todos os fatores que afetam a medicao (precisao de instrumento de medicao, expertise
da pessoa que realiza a mensuracao, etc). O grafico de pontos destes dados aparece na
Figura 2.2.
Neste grafico, cada ponto representa uma mensuracao, portanto para dados repetidos,
podemos colocar os pontos empilhados, como no exemplo. Podemos usar sımbolos (pon-
tos) menores se houver um grande numero de dados. Observemos que os extremos sao
Grafico de pontos 9
Figura 2.2: Grafico de pontos para os dados de viscosidade (em cP).
facilmente visıveis neste grafico, e que as mensuracoes estao concentradas proximas a
140cP.
Uma questao tıpica em ciencias e se ha relacao entre duas mensuracoes. O grafico de
pontos pode ser util para comparar mensuracoes em diferentes grupos.
Exemplo. Em uma entrevista feita com 97 estudantes, foram coletados dados sobre
seu consumo de cafeına (em mg) estimado a partir do consumo diario de cafe, cha e
outras bebidas contendo cafeına, e seu consumo de bebidas alcolicas (em doses). Os
pesquisadores queriam saber se havia alguma relacao entre as variaveis, classificando a
quantidade de doses nas categorias 0, 1-2, 3-5, 6+. Os resultados sao os mostrados na
Tabela 2.1.
Os dados da tabela podem ser graficados como na Figura 2.3. Em cada linha, temos
uma das categorias de consumo de bebida alcolica. Os pontos representam cada um
dos entrevistados e o tamanho do ponto representa o total de entrevistados na mesma
categoria com mesmo consumo de cafeına diaria.
Podemos perceber que de acordo com os dados coletados nao ha evidencias de algum
tipo de relacao entre o consumo diario de cafeına e consumo de alcool.
O grafico de pontos e adequado quando as observacoes sao numericas e o tamanho da
amostra e pequeno o suficiente para mostrar um ponto por observacao.
Exercıcio
Faca o grafico de pontos para os dados do peso dos alunos: (a) considerando todos os
dados da classe juntos; (b) classificando os dados nas categorias M e F. Voce observa
10 Representando dados
0 1-2 3-5 6+
68 0 0 210 505 68 260 390
180 0 68 260 598 68 260 390
180 68 68 260 805 68 260 390
210 93 68 278 810 98 260 398
210 98 98 373 975 98 260 525
323 165 98 390 98 260 570
368 210 98 390 98 270 665
368 210 98 398 113 323 860
698 210 113 405 165 323
260 165 405 180 328
293 180 405 180 373
323 180 435 210 373
405 180 435 210 373
405 210 480 225 373
435 210 495 260 373
Tabela 2.1: Consumo diario de cafeına (em mg) por categoria de consumo de alcool (em
doses).
Figura 2.3: Grafico de pontos para os dados de consumo de cafeına (mg) por categoria
de consumo de bebida alcolica (em doses).
alguma relacao entre peso e genero?
Grafico de barras 11
2.2 Grafico de barras
O grafico de pontos e adequado quando as observacoes sao numericas e o tamanho da
amostra e pequeno o suficiente para mostrar um ponto por observacao. No entanto se
tivermos muitos valores repetidos, um grafico de barras pode ser mais adequado.
Exemplo. No exemplo dos dados de consumo de cafeına, podemos representar os
dados pelo grafico de barras por categorias da Figura 2.4.
Figura 2.4: Grafico de barras para os dados de consumo de cafeına (mg) por categoria
de consumo de bebida alcolica (em doses).
Neste caso, dados repetidos sao representados pela altura da barra. Se uma observacao
aparece duas vezes mais que outra, a altura da barra correspondente deve ser o dobro da
altura da barra da outra. A largura da barra deve ser a mesma para todas as observacoes.
Exemplo Tratamento de leucemia. Um estudo foi realizado em 1963 para avaliar a
eficacia de um agente quimioterapeutico, 6-MP, para o tratamento de leucemia aguda.
Para realizar a avaliacao e necessario um grupo de comparacao, de modo que os pacientes
foram aleatorizados para dois grupos (6-MP ou placebo) mediante o lancamento de uma
moeda. O primeiro paciente receberia o 6-MP se a moeda indicasse cara ou placebo se
fosse coroa; o segundo paciente receberia o outro tratamento. O mesmo procedimento
foi seguido com o 3o e o 4o pacientes, com o 5o e o 6o, e assim por diante, com 21 pares
de pacientes. Para cada par, foi registrado se o procedimento 6-MP foi melhor (M) ou
pior (P) que o placebo, obtendo
MPMMM PMMMM MMMPM MMMMM M
12 Representando dados
Desta forma, o 6-MP foi mais eficaz em 18 dos 21 pares de pacientes. Podemos rep-
resentar estes dados com um grafico de barras, onde a altura de cada barra indica a
proporcao ou a quantidade de indivıduos na categoria correspondente, como na Figura
2.5.
Figura 2.5: Grafico de barras para os dados do tratamento 6-MP contra a leucemia
aguda.
Exercıcio
Faca o grafico de barras para os dados do peso dos alunos: (a) considerando todos os
dados da classe juntos; (b) classificando os dados nas categorias M e F. A relacao entre
peso e genero fica mais visıvel, menos visıvel ou nao ha diferenca entre este grafico e o
de pontos?
2.3 Grafico de setores
Outra alternativa ao grafico de barras, quando os dados estiverem classificados em ca-
tegorias, e o grafico de setores. Neste grafico a area de cada setor e proporcional a
frequencia de cada categoria na amostra completa.
Exemplo No exemplo do tratamento contra a leucemia aguda, podemos representar
os resultados como no grafico da Figura
O experimento Dobra a lıngua e coca a orelha propoe uma analise de dados, atraves
de tabelas e de graficos de barras e de setores, sobre duas informacoes antropometricas:
Tabela de frequencias 13
Figura 2.6: Grafico de setores para os dados do tratamento 6-MP contra a leucemia
aguda.
“Voce consegue dobrar a lıngua?”e “Qual e o formato do lobulo da sua orelha?”.
Exercıcio
Faca o grafico de setores e o de barras para os dados do peso dos alunos, para representar
a proporcao de homens e mulheres na classe.
2.4 Tabela de frequencias
Podemos resumir dados numericos com uma tabela de frequencias. Dividimos a reta
numerica em intervalos e contamos o total de mensuracoes dentro de cada intervalo. A
frequencia e o total de observacoes em cada intervalo e a frequencia relativa e a proporcao
de observacoes em cada intervalos, ou seja, e a frequencia dividida pelo tamanho da
amostra.
Cada intervalo e chamado intervalo de classe e seu ponto medio, marca de classe. Para
evitar confusao com os extremos de cada intervalo, e nao contar informacoes duas vezes,
podemos considerar intervalos abertos a esquerda e fechados a direita, (a, b].
Exemplo No exemplo do consumo de cafeına, observemos que o consumo mınimo e
0 e o consumo maximo e 975 mg, considerando todos os dados. Podemos dividir a reta
em intervalos de 100mg, entre 0 e 1000 mg, e contar o total de casos em cada intervalo,
como aparece na Tabela 2.2.
14 Representando dados
intervalo marca de frequencia frequencia
de classe classe relativa
0 - 100 50 21 0,216
100 - 200 150 12 0,124
200 - 300 250 24 0,247
300 - 400 350 20 0,206
400 - 500 450 10 0,103
500 - 600 550 4 0,042
600 - 700 650 2 0,021
700 - 800 750 0 0
800 - 900 850 3 0,031
900 - 1000 950 1 0,010
total 97 1
Tabela 2.2: Tabela de frequencias do consumo diario de cafeına (em mg).
Um criterio para escolher o total de intervalos nesta tabela e o mesmo que para a
escolha do grafico: a tabela deve entregar a informacao amostral, sem esconder dados
importantes e sem sobrecarregar a informacao.
Eventualmente, podemos considerar intervalos de tamanhos diferentes, se for mais con-
veniente.
Exemplo No exemplo do consumo de cafeına, observemos que os ultimos 4 intervalos
contem poucos ou nenhum dado, em relacao aos anteriores. Podemos considerar entao
o intervalo (600-1000], como na Tabela 2.3
intervalo marca de frequencia frequencia
de classe classe relativa
0 - 100 50 21 0,216
100 - 200 150 12 0,124
200 - 300 250 24 0,247
300 - 400 350 20 0,206
400 - 500 450 10 0,103
500 - 600 550 4 0,042
600 - 1000 800 6 0,062
total 97 1
Tabela 2.3: Tabela de frequencias do consumo diario de cafeına (em mg).
Histograma 15
Exercıcio
Construa duas tabelas de frequencias para os dados do peso dos alunos, considerando
todos os dados. Faca uma das tabelas com intervalos de mesmo comprimento e a outra,
nao.
2.5 Histograma
Podemos representar graficamente a informacao dada na tabela de frequencias atraves
do chamado histograma. Um histograma e um grafico de barras, onde a base de cada
barra e o intervalo de classe e a area de cada barra representa a frequencia do intervalo.
Observemos que se os intervalos tiverem todos o mesmo comprimento, entao a frequencia
de cada intervalo e representada pela altura da barra correspondente.
Se os comprimentos nao forem todos iguais, devemos escolher uma unidade de re-
ferencia, como por exemplo o comprimento do menor intervalo, como veremos no exem-
plo seguinte.
Exemplo No exemplo do consumo de cafeına, obtemos os seguintes histogramas, re-
ferentes a cada uma das tabelas de frequencias anteriores.
Figura 2.7: Histograma para os dados de consumo de cafeına (mg): a esquerda com
intervalos de mesmo comprimento; a direita, o ultimo intervalo e maior que os outros.
Lembremos que no histograma a area de cada barra deve representar a frequencia de
cada intervalo. Sendo assim, no ultimo intervalo devemos dividir a frequencia observada
por 4, ja que ele tem comprimento 4 vezes maior que os demais. Graficamente, este
16 Representando dados
procedimento nos leva a uma barra para o ultimo intervalo cuja altura representa a
altura media dos intervalos combinados.
O vıdeo Cada grafico no seu galho mostra diversos tipos de grafico, entre eles o grafico de
setores, o de barras e o histograma. Alem disso, mostra como interpretar as informacoes
ali presentes e discute qual o tipo de grafico mais adequado para cada tipo de variavel.
Exercıcio
O applet Histograma permite fazer um histograma com dados variando de a a w. Defina
estes limites para os dados de peso e ingresse os dados no applet. Observe o histograma
obtido.
2.6 Diagrama de ramo-e-folhas
O estatıstico John Tukey inventou uma forma rapida de resumir dados, mantendo a
informacao original, chamada diagrama de ramo-e-folhas.
Exemplo Consideremos o seguinte conjunto de dados referente ao ganho de peso (em
kg) de 100 porquinhos submetidos a uma certa dieta, durante um mes:
3 , 7 , 11, 12, 13, 14, 15, 16, 17, 17, 18, 18, 18, 19, 19, 19, 20, 20, 21, 21, 21, 22, 22, 23,
23, 24, 24, 24, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 30,
30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 32, 32, 33, 33, 33, 33, 33, 34, 34, 34, 35, 35, 35,
36, 36, 36, 37, 37, 38, 38, 39, 39, 39, 40, 40, 41, 41, 41, 42, 42, 42, 43, 43, 44, 45, 46, 47,
48, 48, 53, 57
ramo folhas
0 3 7
1 1 2 3 4 5 6 7 7 8 8 8 9 9 9
2 0 0 1 1 1 2 2 3 3 4 4 4 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9
3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 8 8 9 9 9
4 0 0 1 1 1 2 2 2 3 3 4 5 6 7 8 8
5 3 7
Tabela 2.4: Diagrama de ramo-e-folhas para o ganho de peso.
Neste diagrama, os ramos representam as casas decimais e as folhas as unidades. Os
ramos sao primeiramente colocados em uma linha vertical, depois adicionamos as folhas
em cada linha, mantendo a mesma distancia entre elas e de forma ordenada, como na
Tabela 2.4.
Outros graficos 17
Assim como na Tabela de frequencias, podemos definir os galhos de diversas maneiras.
Por exemplo, poderıamos considerar cada galho contendo apenas 5 dıgitos, de 0 a 4 ou
de 5 a 9. Assim, o diagrama anterior fica como na Tabela 2.5.
ramo folhas
0 3
0 7
1 1 2 3 4
1 5 6 7 7 8 8 8 9 9 9
2 0 0 1 1 1 2 2 3 3 4 4 4
2 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9
3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4
3 5 5 5 6 6 6 7 7 8 8 9 9 9
4 0 0 1 1 1 2 2 2 3 3 4
4 5 6 7 8 8
5 3
5 7
Tabela 2.5: Diagrama de ramo-e-folhas para o ganho de peso, com 5 dıgitos em cada
ramo.
Exercıcio
Construa o diagrama de ramo-e-folhas para os dados do peso dos alunos, considerando
todos os dados.
2.7 Outros graficos
Serie temporal
Muitas das informacoes que recebemos em nosso dia a dia dizem respeito a dados
numericos que apresentam variabilidade no tempo. Em economia, por exemplo, o preco
do real em relacao a alguma moeda estrangeira, a taxa mensal de desemprego no paıs
durante os ultimos 5 anos. Em meio ambiente, temos as temperaturas media e maxima
diarias em uma certa regiao durante o ultimo mes, ou os nıveis de radiacao observados.
Em estudos sociais, podemos considerar a evolucao da proporcao de votantes em um
certo candidato, e assim por diante.
Conjuntos de dados referentes a variaveis numericas observadas durante um perıodo de
tempo sao chamados series temporais.
18 Representando dados
O grafico da Figura 2.8 mostra a evolucao do salario mınimo real brasileiro, desde
sua instituicao em 1940, pelo governo do Estado Novo. Em 1943, foi incorporado a
Consolidacao das Leis do Trabalho (CLT) e, em 1963, foi estendido ao campo por meio
do Estatuto do Trabalhador Rural.
Figura 2.8: Evolucao temporal do salario mınimo real no Brasil.
Este tipo de grafico permite visualizar claramente a evolucao no tempo de variaveis
numericas.
O experimento Series Temporais realiza um estudo descritivo de um conjunto de dados
temporais com o fim de conhecer algumas das ferramentas utilizadas nesta area da
analise estatıstica.
Grafico radial
Em 1855, a enfermeira Florence Nightingale produziu graficos contundentes sobre a
mortalidade em hospitais militares na Gra-Bretanha.
Na Figura 2.9, o eixo radial mostra o total de mortes de soldados britanicos durante a
Guerra da Crimeia.
A area de cada regiao colorida, medida a partir do centro, representa a proporcao de
uma das variaveis medidas. A parte azul, mais externa, representa mortes por doencas
prevenıveis ou provenientes de infeccoes agudas, como colera e tifo. A parte mais clara
central, representa morte por ferimentos e a parte escura intermediaria, mortes por
outras causas.
Seus estudos estatısticos levaram a polıticas publicas para melhorar as condicoes nos
hospitais, diminuindo a taxa de mortalidade por infeccoes. Por seu trabalho, foi a
primeira mulher a ser eleita para a Royal Statistical Society, em 1858.
Outros graficos 19
Figura 2.9: Grafico radial construıdo por Florence Nightingale, em 1855.
Cartogramas
Em 2004, os fısicos Michael Gastner do Imperial College London e Mark Newman da Uni-
versidade de Michigan desenvolveram uma ferramenta que permitiu criar este incrıveis
graficos a respeito do nosso mundo.
Na Figura 2.10, vemos a esquerda o mapa mundi usual, em que a area ocupada por
cada paıs representa sua extensao geografica; a direita, a area ocupada por cada paıs
representa sua taxa de desnutricao infantil.
Figura 2.10: Cartogramas: a esquerda, a extensao territorial e, a direita, a taxa de
desnutricao infantil.
A taxa de desnutricao infantil consiste na proporcao de criancas do paıs com um quadro
de desnutricao. Esta pode ser da ordem de 1%, como no Chile e no Japao, ou chegar a
quase 50%, como em Bangladesh, Nepal e India.
Mais cartogramas podem ser encontrados na pagina do projeto Worlmapper. Voce nunca
mais vera o mundo do mesmo jeito.
20 Representando dados
Capıtulo 3
Resumindo dados
Passaremos dos graficos para as formulas: nosso objetivo e obter umas poucas simples
mensuracoes das caracterısticas cruas de um conjunto de dados.
Qualquer conjunto de mensuracoes tem duas propriedades importantes: o valor tıpico
ou central, e a dispersao em torno desse valor. Podemos ter uma ideia destes conceitos
nos dois histogramas hipoteticos da Figura 3.1.
Figura 3.1: Medida central e de dispersao para dois histogramas.
Denotaremos um conjunto de n observacoes pela lista de valores x1, x2, . . . , xn.
Suponha que, por exemplo, perguntamos a 5 pessoas quantas horas elas assistem TV
por semana, obtendo a lista: x1 = 5, x2 = 7, x3 = 3, x4 = 38, x5 = 7.
Qual e o valor central destes dados? Ha diversas formas de defini-lo, e veremos apenas
duas delas, a media e a mediana. Do mesmo modo, ha diversas formas de definir a
dispersao; estudaremoso desvio-padrao e a distancia interquartil.
22 Resumindo dados
3.1 Media
A media ou media amostral e representada por x, e e obtida somando todos os dados e
dividindo pelo total de observacoes:
x =soma dos dados da amostra
n=
x1 + x2 + · · ·+ xnn
.
Em nosso exemplo, x = (5 + 7 + 3 + 38 + 7)/5 = 60/5 = 12 horas, representa o tempo
medio semanal assistindo TV, na amostra obtida.
Podemos representar a soma pelo sımbolo∑
, assim x1 + x2 + · · ·+ xn =∑n
i=1 xi.
Geometricamente, imagine cada ponto da amostra na reta como um copo sobre uma
bandeja. A media representa o seu centro de massa, ou seja, o lugar onde segurar a
bandeja para que ela fique em equilıbrio.
Exercıcio
Obtenha a media para os dados do peso dos alunos, considerando todos os dados, e
depois obtenha o peso medio das alunos e dos alunos, separadamente.
3.2 Desvio-padrao
O desvio-padrao representa uma medida da dispersao media dos dados da amostra em
torno do valor medio, veja a Figura 3.2.
Figura 3.2: Dispersao dos dados com relacao a media.
Relacao entre media e desvio-padrao 23
Consideremos uma amostra x1, x2, . . . , xn e sua media x. Obtenhamos primeiramente o
quadrado das distancias de cada ponto da amostra ate a media
(x1 − x)2, (x2 − x)2, . . . , (xn − x)2,
e obtenhamos sua media aritmetica
1
n
((x1 − x)2 + (x2 − x)2 + · · ·+ (xn − x)2
).
O desvio-padrao, denotado por dp, e igual a raiz quadrada desta soma,
dp =
√1
n((x1 − x)2 + (x2 − x)2 + · · ·+ (xn − x)2),
e esta na mesma unidade dos valores observados.
Exercıcio
Obtenha o desvio-padrao para os dados do peso dos alunos, considerando todos os dados,
e depois obtenha o desvio-padrao do peso das alunos e dos alunos, separadamente.
3.3 Relacao entre media e desvio-padrao
Uma relacao empırica curiosa entre a media x e o desvio-padrao dp, que ocorre em
grande parte dos conjuntos de dados, e que
aproximadamente 2/3 da amostra encontra-se a distancia de 1dp da media
aproximadamente 95% da amostra encontra-se a distancia de 2dp da media
aproximadamente 99% da amostra encontra-se a distancia de 3dp da media
Esta propriedade ocorre para a maioria dos histogramas aproximadamente simetricos,
e mesmo para assimetricos, e permite estimar o desvio-padrao apenas olhando o his-
tograma.
A aproximacao nao e boa em conjuntos de dados com apenas dois valores diferentes,
como por exemplo, 0 0 0 0 0 0 0 1 1 1 1 1 1 1, em que os intervalos centrados na media
1/2 ou contem todos os dados ou nao contem nenhum.
Exercıcio
Verifique a proporcao da amostra sobre peso dos alunos dentro de cada um destes tres
intervalos em torno da media. Obtenha outros conjuntos de dados e verifique esta
relacao.
24 Resumindo dados
Figura 3.3: Intervalos a 1dp, 2dp e 3dp da media.
3.4 Medianas
A mediana e uma outra forma de centro: e o “ponto medio” dos dados.
Formalmente, a mediana de um conjunto de valores x1, x2, . . . , xn e um valor m tal que:
pelo menos metade da amostra e menor ou igual a m, e
pelo menos metade da amostra e maior ou igual a m.
No exemplo das horas de TV, temos que 4 valores sao menores ou iguais a 7 (3, 5, 7, 7)
e que 3 valores sao maiores ou iguais a 7 (7, 7, 38), portanto 7 e uma mediana: o tempo
mediano de TV semanal da amostra e igual a 7.
Na lista de valores 2, 3, 7, 8, temos que 3 e uma mediana, pois 2 valores sao menores
ou iguais e 3 valores sao maiores ou iguais; que 7 e uma mediana, e que qualquer valor
entre 3 e 7 e um valor mediano. Neste caso, temos mais de uma mediana amostral.
Observe que a mediana nao e afetada por valores extremos afastados da maioria dos
dados. De fato, no exemplo das horas de TV, se trocarmos 38 por 123, a mediana
continuara sendo 7, ja a media passara para 29.
Por esta razao a mediana e uma medida mais representativa que a media ao analisar,
por exemplo, salarios em uma empresa ou em uma cidade, onde os dados apresentam
uma dispersao assimetrica com relacao ao seu ponto central.
Outros quantis 25
Exercıcio
Obtenha a mediana para os dados do peso dos alunos, considerando todos os dados, e
depois obtenha o peso mediano das alunos e dos alunos, separadamente.
3.5 Outros quantis
Podemos generalizar o conceito de mediana para outra divisoes da amostra. Dado
p ∈ [0, 1], definimos o quantil p, e o denotamos q(p), ao valor tal que:
pelo menos p ∗ 100% da amostra e menor ou igual a q(p), e
pelo menos (1− p) ∗ 100% da amostra e maior ou igual a q(p).
Os quantis mais usados sao o primeiro quartil, correspondente a p = 0.25 tambem
denotado por q1, o terceiro quartil, para p = 0.75 e denotado por q3, e os decis, para
p = 0.1, 0.2, . . . , 0.9, denotados por d1, d2, . . . , d9, respectivamente.
Observe que a mediana corresponde ao segundo quartil e ao quinto decil.
Outra medida de dispersao para os dados e a chamada distancia interquartil, definida
como a distancia entre os quartis 1o e 3o, dq = q(0.75)− q(0.25).
Exercıcio
Obtenha o primeiro e o terceiro quartis para os dados do peso dos alunos, considerando
todos os dados, e depois obtenha-os para o peso das alunos e dos alunos, separadamente.
3.6 Boxplot
Uma representacao grafica util para comparar uma variavel numerica em diferentes
categorias e o chamado boxplot.
A Figura 3.4 mostra o boxplot dos dados do consumo de cafeına para as categorias de
doses. O eixo y representa a variavel quantidade de cafeına, e o eixo x, as categorias
comparadas.
Para cada retangulo que forma o grafico, a base representa o primeiro quartil, q1, o topo
representa q3 e a linha interna, a mediana.
Podemos, neste grafico, comparar uma medida central e a dispersao em cada categoria.
26 Resumindo dados
Figura 3.4: Boxplot para o consumo semanal de cafeına, por categoria de doses.
Os pontos isolados fora dos retangulos representam dados atıpicos da amostra, ou seja,
valores afastados da grande massa dos dados. Por convencao, um dado e atıpico se
estiver afastado da amostra a uma distancia de q1 ou q3 maior que 1.5dq.
As linhas verticais que saem do retangulo vao ate o menor e o maior valores nao-atıpicos
da amostra.
Os softwares Medidas do Corpo: Graficos univariados e Medidas do Corpo: Boxplot
fazem parte de um conjunto de recursos educacionais que analisam, do ponto de vista
estatıstico, algumas medidas do corpo humano. Nestes recursos sao apresentados e
discutidos os seguintes graficos univariados: de barra, de setores, histograma e boxplot,
relacionando-os com as medidas resumo anteriores.
Exercıcio
Grafique o boxplot para os dados do peso dos alunos, considerando todos os dados, e
depois grafique-os para o peso das alunos e dos alunos, separadamente. Que diferencas
voce observa nas categorias? Compare pontos centrais e dispersao, assim como presenca
ou ausencia de pontos atıpicos.
Capıtulo 4
Elementos de Amostragem
Ao estudar uma populacao, geralmente e impossıvel realizar observacoes do todos os
indivıduos. Um dos poucos casos em que podemos observar a populacao completa e a
populacao de votos, depois de contabiliza-los.
Nosso metodo e tomar uma amostra: uma parte relativamente pequena da populacao,
como fazem os institutos de pesquisa de opiniao ou de intencao de voto.
Duas questoes sao fundamentais no processo de amostragem:
1. qual deve ser o tamanho da amostra?
2. quao representativa e a amostra coletada?
A primeira questao foge ao escopo deste curso, mas pode ser encontrada no livro de
Meyer, nas referencias.
Figura 4.1: Amostragem aleatoria.
28 Elementos de Amostragem
Trataremos aqui de alguns processos de selecao que permitem, em princıpio, obter
uma amostra representativa da populacao, os chamados processos probabilısticos ou
aleatorios de amostragem.
Estes procedimentos asseguram que cada elemento de uma populacao finita tem a mesma
chance de ser escolhido para a amostra.
4.1 Amostragem aleatoria simples
Suponha que temos uma grande populacao de N objetos e que queremos extrair uma
amostra de tamanho n.
A amostragem aleatoria simples (a.a.s.) consiste em sortear n elementos desta pop-
ulacao, por exemplo, numerando todos os elementos da populacao e entao sorteando n
valores de 1 ate N .
Figura 4.2: Amostragem aleatoria simples.
Na pratica, nao e sempre simples obter uma lista da populacao, e se for, as unidades
sorteadas podem ser de difıcil acesso ou ter um custo alto ou mesmo ser impossıvel de
coletar.
Alem disso, se n for pequeno, nada garante que a amostra seja representativa: de um
grupo de 50 homens e 50 mulheres do qual queremos extrair 10 pessoas, poderıamos
sortear 9 mulheres e 1 homem para um estudo biomedico, viesando a resposta de uma
variavel para a qual sexo seja uma caracterıstica relevante.
Existem outros metodos mais eficientes e baratos que a a.a.s., se tivermos informacao
sobre a populacao em estudo, como os que veremos a seguir.
Amostragem estratificada 29
4.2 Amostragem estratificada
Quando a populacao e formada por subpopulacoes homogeneas com relacao a variavel
analisada, podemos realizar aas dentro de cada subpopulacao (ou estrato): esta e a
chamada amostragem estratificada.
Figura 4.3: Amostragem estratificada.
Por exemplo, se estivermos interessados em estudar a altura das pessoas adultas de uma
regiao, podemos dividir a populacao entre homens e mulheres. Dentro de cada um destes
estratos, realizamos entao uma aas.
Este procedimento permite diminuir a variabilidade das observacoes, obtendo estimati-
vas mais precisas dentro de cada grupo.
4.3 Amostragem por conglomerado
Se for natural dividir a populacao em conglomerados (cidades, quarteiroes, salas de aula,
etc), a amostragem por conglomerado realiza uma aas para escolher alguns conglomer-
ados e depois amostra todos os indivıduos dos conglomerados selecionados.
Esta metodologia pode ser muito eficiente em reduzir custos se os custos das viagens
entre unidades amostrais escolhidas aleatoriamente forem altos.
Um exemplo e dividir uma cidade em quarteiroes, e entao amostrar todas as casas de
quarteiroes selecionados aleatoriamente.
30 Elementos de Amostragem
Figura 4.4: Amostragem por conglomerado.
4.4 Amostragem sistematica 1-em-k
Este tipo de amostragem comeca ordenando a populacao de interesse, em uma lista de
nomes, em uma fila, no tempo, etc. Dado um valor natural k, selecionamos a primeira
unidade amostral aleatoriamente dentre os k primeiros. A seguir, selecionamos a amostra
escolhendo uma unidade a cada k unidades a partir da primeira.
Figura 4.5: Amostragem sistematica.
Por exemplo, um estudo sobre o transito nas rodovias poderia entrevistar um a cada
100 carros passando em um pedagio; uma pesquisa de boca de urna, normalmente usa
este sistema para evitar amostrar eleitores que comparecam em grupo para votar (e
provavelmente votantes de um mesmo candidato).
Amostragem sistematica 1-em-k 31
Este tipo de amostragem e facil de ser aplicado, sendo mais eficiente se as unidades
variarem suavemente ao longo da lista ou do tempo.
32 Elementos de Amostragem
Referencias Bibliograficas
[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)
Analise Combinatoria e Probabilidade. Editora SBM.
[2] Feller, P. (1976) Introducao a Teoria de Probabilidades e suas Aplicacoes. Editora
Edgard Blucher.
[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciencia Moderna.
[4] Halmos, P. (2001) Teoria Ingenua dos Conjuntos. Editora Ciencia Moderna.
[5] James, B. (1996) Probabilidade: um curso em nıvel intermediario. Colecao Projeto
Euclides.
[6] Meyer, P. (2000) Probabilidade: aplicacoes a estatıstica. Editora LTC.
[7] Revista do Professor de Matematica. SBM.
[8] Ross, S. (2010) Probabilidade: um curso moderno com aplicacoes. Editora Bookman
Co.
Paginas da internet
Em portugues
[9] ALEA, Accao Local de Estatıstica Aplicada, Portugal.
[10] Mais - Recursos Educacionais em Matematica, Brasil.
[11] Matematica Multimıdia, Unicamp.
Em ingles
[12] Historia da Matematica, Universidade de St. Andrews, Escocia.
[13] Laboratorio de Probabilidade e Estatıstica, Universidade do Alabama, EUA.
34 Referencias Bibliograficas
[14] Cartogramas: informacoes graficas sobre os paıses para saude, economia, ciencia,
poluicao, etc.