View
220
Download
0
Category
Preview:
Citation preview
10. TEORIA DAS PROBABILIDADES
Quadro 1: Motivação
Figura 1: Gráfico de pontos.
Figura 3: Polígono de frequências.
Figura 4: Função de distribuição de probabilidades
sobre o histograma.
A teoria das probabilidades estuda os modelos de probabilidades, definidos pela função f(x), para os diferentes
processos ou fenômenos em estudo. 10.1. CONCEITOS BÁSICOS
a) Experimento Aleatório é um experimento no qual: i) todos os possíveis resultados são conhecidos; ii) resulta num valor desconhecido, dentre todos os resultados
possíveis; iii) pode ser repetido em condições idênticas.
b) Espaço Amostral é o conjunto de todos os resultados possíveis para
um experimento aleatório.
É denotado por .
Pode ser:
- Discreto Finito: formado por um conjunto finito de pontos;
Infinito: conjunto infinito e enumerável de pontos;
- Contínuo formado por um conjunto não enumerável de pontos.
c) Um Evento é um subconjunto do espaço amostral, associado a um experimento. É denotado por letras maiúsculas: A, B, E, . . .
d) Um Evento Complementar: o evento complementar de A é dado
pelo conjunto dos pontos que pertencem ao espaço amostral mas não
pertencem a A. Ac A = .
É denotado por Ac. e) Dois eventos A e B são mutuamente exclusivos, ou disjuntos, se a
intersecção entre eles é vazia.
A B = .
Exemplos: Um dado equilibrado é lançado e seu número observado.
O espaço amostral é: = 1, 2, 3, 4, 5, 6 .
Sejam A = O número observado é menor ou igual a 4, então, A = 1, 2, 3, 4 B = O número observado é par, B = 2, 4, 6 C = O número observado é ímpar, C = 1, 3, 5
Então, temos
A B = 2, 4 e A C = 1, 3
B C = B e C são disjuntos
Bc = C, pois B C =
f) Evento elementar
Seja um espaço amostral finito = 1, 2, ..., N . Então os eventos elementares são formados por um único elemento do espaço amostral, sendo assim, um subconjunto unitário. Por exemplo:
A = 1 .
No lançamento de um dado equilibrado:
A1 = 1 , A2 = 2 , A3 = 3 , A4 = 4 , A5 = 5 , A6 = 6
são eventos elementares. 10.2. DEFINIÇÕES DE PROBABILIDADE
Exemplos:
a) Experimento: numa linha de produção, conta-se o número de peças com defeito, por lote;
A = 0, 1, 2, . . . , N , N = tamanho do lote
Eventos:
A1 = todas as peças são boas A1 = 0
A2 = no máximo cinco peças com defeito A2 = 0, 1, 2, 3, 4, 5
b) Experimento: numa indústria são contados os itens produzidos até a ocorrência de um item defeituoso;
B = 1, 2, 3, 4, . . . , ou ainda B = N*, N* = N – 0
Eventos: B1 = o item defeituoso ocorre até a 10ª peça produzida
B1 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
B2 = são produzidas no mínimo 200 peças antes do item defeituoso
B2 = X N* | X > 200
c) Experimento: Uma lâmpada é fabricada e, num ensaio, é anotado o tempo (semanas) até que ela se queime;
C = t R | t 0
Eventos: C1 = a lâmpada queima antes de completar 720 horas (4 sem.)
C1 = t < 4
C2 = a lâmpada dura pelo menos 1 ano (52 semanas)
C2 = t R | t 52
Obs: Neste caso o espaço amostral é contínuo.
10.3. PROBABILIDADES EM ESPAÇOS FINITOS
Seja A um evento associado a um espaço amostral discreto e finito , então
pontos de totalnúmero
a favoráveis pontos de número AA P .
AP é a probabilidade de ocorrência do evento A e deve satisfazer:
a) 10 AP ;
b) 1ΩP ;
c) Se A e B são disjuntos, então, BABA PPP .
Seja a função card(A) que retorna o número de elementos do conjunto A, então, a definição acima pode ser escrita como:
)card(
)card(
AAP .
Obs: Na teoria dos conjuntos, card é a abreviação de cardinalidade.
10.3.1. Propriedades de Probabilidade
i) Se é o espaço vazio, então:
P(vazio) = P() = 0
ii) P(espaço amostral todo) = P() = 1;
iii) Se Ac é o evento complementar de A, então:
)(1)( AAc PP
iv) Se A e B são eventos quaisquer, então:
)()()()( BABABA PPPP
10.3.2. Métodos de Contagem Quando o espaço amostral é equiprovável, ou homogêneo, o cálculo de probabilidades se resumo nas contagens dos elementos de cada um dos eventos e do espaço amostral. Desta forma, é importante o domínio de algumas técnicas de contagens.
i) Permutação: quando temos de permutar n elementos em n
posições diferentes
!P , nnn 1)2)(1(! nnnn , n! é o fatorial de n
ii) Arranjo: quando, de um total de n elementos, devemos tomar k
destes elementos e permutá-los
)1()2)(1()!(
!A ,
knnnn
kn
nkn .
iii) Combinação: quando temos de escolher k, dentre n elementos
distintos, sem considerar a ordem
)!(!
!C ,
knk
n
k
nkn
; note que
kk
knkn
,
,,
P
AC .
Exemplos: <a serem apresentados em sala aula>
10.4. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA
Sejam A e B eventos quaisquer tais que 0AP , então a
probabilidade de B condicionada ao evento A é definida por
)(
)()|(
A
ABAB
P
PP
.
Lê-se: probabilidade de B dado A.
10.4.1. INDENPENDÊNCIA ENTRE EVENTOS Dois eventos A e B são independentes se: )()|( BAB PP .
10.4.2. REGRA MULTIPLICATIVA DAS PROBABILIDADES
Da probabilidade condicional podemos escrever a probabilidade da intersecção entre A e B por
)()|()( AABBA PPP
ou
)()|()( BBABA PPP
E, se A e B forem independentes, então
)()()( BABA PPP .
Exemplos:
I) Considere as informações sobre a colaboração com a coleta seletiva do lixo residencial em pesquisa realizada com as 200 famílias da cidade
de UFSCarCity. Na tabela são apresentadas as famílias que colaboram e as que não colaboram pelo nível de escolaridade do chefe da família.
Escolaridade
Colabora com a coleta seletiva Total
SIM NÃO
Ensino Fundamental − EF 38 10 48
Ensino Médio − EM 74 16 90
Superior − ES 54 08 62
Total 126 74 200
Uma família é sorteada ao acaso, qual é a probabilidade de que:
a) Colabore com a coleta seletiva?
63.0200
126)SIM( P
b) O chefe da família tenha nível de escolaridade no ensino médio?
45.0200
90)EM( P
c) O chefe da família tenha nível de escolaridade superior e não
colabore com a coleta seletiva?
04.0200
8)NÃOES( P
d) O chefe da família tenha nível de escolaridade no ensino fundamental ou colabore com a coleta seletiva?
200
54741038)SIMEF(
P
88.0200
176
200
3848126)SIMEF(
P
e) Sabendo que o chefe da família escolhida tem nível de escolaridade
no ensino médio, qual é a probabilidade de que não colaborem com a coleta seletiva?
1778.090
16
200/90
200/16)EM|NÃO( P
f) Se o chefe da família não tem nível de escolaridade superior, qual é a
probabilidade de que a família colabore com a coleta seletiva?
)EMEF(
)]EFSIM(EM)(SIM|[EM)](EF|SIM[
P
PP
8116.0138
112
200/)9048(
200/)7438(EM)](EF|SIM[
P
II) Um aluno responde a um teste de múltipla escolha com quatro alternativas, sendo uma só correta. A probabilidade de que saiba a resposta é de 30%. Se ele não sabe a resposta, vai “chutar”.
Definindo: A = o aluno acerta a questão e S = o aluno sabe a resposta.
a) Qual a probabilidade dele acertar a questão? b) Se ele acertou a questão, qual é a probabilidade de que ele realmente
saiba a resposta? a) Qual a probabilidade dele acertar a questão?
P(A) = P(acertar sabendo ou acertar chutando)
P(A) = P(acertar sabendo) +P(acertar chutando)
P(A) = P(A | S) P(S) + P(A | Sc) P(Sc)
P(A) = (1.0)(0.3) + (0.25)(0.7) = 0.475
b) Se ele acertou a questão, qual é a probabilidade de que ele realmente
saiba a resposta?
632.0475.0
3.0
)A(
)AS()A|S(
P
PP
** Esse resultado é conhecido como “teorema de Bayes”.
10.5. Teorema de Bayes
Considere um espaço amostral dividido em duas partes E1 e E2 tais
que
i) E1 E2 =
ii) E1 E2 = ;
Então E1 e E2 formam uma partição de Ω.
Considere, agora, um evento A ocorrendo sobre a partição de .
Ω
Ω
Assim, podemos escrever A como sendo:
)()( 21 EAEAA .
Então, a probabilidade de ocorrência de A é calculada por:
)()()()()( 2121 EAEAEAEAA PPPP
da regra multiplicativa, temos que:
)()|()()|()( 2211 EEAEEAA PPPPP
O resultado acima é conhecido como lei da probabilidade total.
Em outras palavras, temos que a probabilidade de ocorrência de A é
dada pela soma das probabilidades de A nas partes de , ponderadas
pelas probabilidades de ocorrência destas partes.
Considerando a partição de e sabendo que ocorreu o evento A, desejamos calcular a probabilidade de que tenha ocorrido uma pate
específica EJ da partição.
Então, o Teorema de Bayes define esta probabilidade por
)(
)()|(
)(
)()|( JJJ
JA
EEA
A
AEAE
P
PP
P
PP
, J = 1, 2.
Podemos, ainda escrever o resultado acima como:
)()|()()|(
)()|()|(
2211
JJJ
EEAEEA
EEAAE
PPPP
PPP
, J = 1, 2.
Esse resultado se deve ao Revendo Inglês Thomas Bayes num
trabalho publicado em 1763, e recebe o seu nome em sua homenagem.
Exemplo 1) Numa população adulta 40% são homens e 60% mulheres. Sabe-se, ainda, que 50% dos homens e 30% das mulheres são fumantes. Determine: a) A probabilidade de que uma pessoa escolhida ao acaso nesta
população seja fumante. Partição do espaço amostral: sexo = H , M .
H = a pessoa escolhida é do sexo masculino (homem) 40.0)H( P
M = a pessoa escolhida é do sexo feminino (mulher) 60.0)M( P
Eventos: F = a pessoa escolhida é fumante ;
cF = a pessoa escolhida não é fumante . Como 50.0)|( HFP e 30.0)|( MFP , então, pela regra da
probabilidade total: )e()e()( MFPHFPFP
)()()( MFPHFPFP
)()|()()|()( MPMFPHPHFPFP
60.030.040.050.0)( FP
38.0)( FP
b) Sabendo que a pessoa escolhida é fumante, qual a probabilidade de
que seja um homem? A probabilidade de que seja um homem sabendo que é um fumante é
determinada pelo teorema de Bayes:
)(
)()|(
FP
FHPFHP
)(
)()|()|(
FP
HPHFPFHP
5263.038.0
40.050.0)|(
FHP
A probabilidade de ser um homem, dado que é fumante, é 0.5263. Uma forma conveniente para se representar as probabilidades acima é através da ”arvore de probabilidades”, nas quais representamos as probabilidades das partes e probabilidades condicionais em ramos, conforme Figura (10.1). Nesse esquema, as probabilidades conjuntas (das intersecções) são obtidas percorrendo-se os ramos e multiplicando-se as probabilidades.
Figura 10.1: Regra multiplicativa em diagrama de árvore para o exemplo 1.
Exemplo 2) Sabe-se que numa população 8% das pessoas são infectadas por um vírus causador de uma doença muito grave. Um teste para detecção do vírus é eficiente em 99% dos casos nos quais os indivíduos são infectados, mas, resulta em 2% de resultados positivos para os não infectados (falsos positivos). Se o teste de uma pessoa dessa população der resultado positivo, qual a probabilidade de que ela esteja de fato infectada? Definindo-se: I = grupo das pessoas infectadas;
cI = grupo dos não infectados;
T = o resultado do teste é positivo;
T = o resultado do teste é negativo; tem-se as probabilidades: 08.0)( IP
92.0)( cIP
99.0)|( ITP
02.0)|( cITP
Porém, deseja-se calcular a probabilidade: )|( TIP
que, pela regra da probabilidade condicional, é dada por
)(
)(
)(
)e()|(
TP
TIP
TP
TIPTIP .
Pela regra do produto e pela lei da probabilidade total, encontramos
)( TP fazendo:
)e()e()( cITPITPTP
)()()( cITPITPTP
)()()()|()( cc IPITPIPITPTP
92.002.008.099.0)( TP
0184.00792.0)( TP
0976.0)( TP
Portanto, a probabilidade de que o resultado de um teste seja positive é de 0.0976. Sabendo que uma pessoa da população fez o teste o teste e o resultado foi positivo, qual é a probabilidade de que realmente seja infectada? Pelo teorema de Bayes, temos:
)(
)()|(
TP
TIPTIP
)(
)()|()|(
TP
IPITPTIP
8115.00976.0
0792.0)|( TIP
Qual seria a confiança no teste se o resultado fosse negativo, ou seja, qual a probabilidade de o teste sendo negativo a pessoa de fato não seja infectada?
Deseja-se: )|( TIP c, mas
)(
)()|(
)(
)()|(
TP
IPITP
TP
TIPTIP
cccc
Como:
)()()()|()( IPITPIPITPTP cc
08.001.092.098.0)( TP
0008.09016.0)( TP
9024.0)( TP
então,
9991.09024.0
9016.0
)(
)()|()|(
TP
IPITPTIP
ccc
,
portanto, se o teste for negativo a pessoa pode se sentir segura. Na Figura (10.2) é apresentada o diagrama de árvore para o resultado acima.
Figura 10.2: Regra multiplicativa em diagrama de árvore para o exemplo 2.
10.5.1. AVALIAÇÃO DE TESTES DIAGNÓSTICOS EM SAÚDE Considere que estamos interessados na detecção de uma doença D , Assim sendo, definiremos: D : evento em que uma pessoa tem a doença;
cD : evento em que uma pessoa não tem a doença.
É claro que D e cD são mutuamente exclusivos, ou seja, cDD Ø.
Considere, agora, um teste T para a detecção da doença. Então,
definimos os eventos:
T : resultado positivo do teste;
T : resultado negativo do teste.
Duas medidas importantes na avaliação de testes diagnósticos são a sensibilidade e especificidade, que são as probabilidades deste
acertar no diagnóstico:
i) Sensibilidade: definida pela probabilidade de um teste resultar em
positivo, dado que a pessoa tem a doença
)(
)()|(
DP
DTPDTP
ii) Especificidade: definida pela probabilidade de um teste resultar
em negativo, dado que a pessoa não tem a doença
)(
)()|(
c
cc
DP
DTPDTP
A prevalência da doença D é definida como (lei da probabilidade total)
)()|()()|()( TPTDPTPTDPDP .
Um teste diagnóstico pode resultar em erro, diagnosticando como
positivo alguém que não tem a doença ou, diagnosticando como negativo alguém que tem a doença. As probabilidades de erro são, então, definidas por:
)|( cDTP Probabilidade de um teste resultar em positivo, dado que a pessoa não tem a doença.
Recebe o nome de Prob(falso positivo).
* P(falso positivo) = 1 − especificidade
)|( DTP Probabilidade de um teste resultar em negativo, dado que a pessoa tem a doença.
Recebe o nome de Prob(falso negativo).
* P(falso negativo) = 1 − sensibilidade
Duas outras medidas são importantes na avaliação de testes diagnósticos. Os valores preditivos positivo e negativo,
definidos por:
)|( TDP Probabilidade de que uma pessoa cujo resultado do teste deu positivo tenha a doença
Recebe o nome de Valor preditivo positivo.
)|( TDP c
Probabilidade de que uma pessoa cujo resultado do teste deu negativo não tenha a doença
Recebe o nome de Valor preditivo negativo.
Reunindo os dados numa tabela de dupla entrada, teremos:
Presença da Resultado do Teste Total
Doença T T
D a b a + b
cD c d c + d
Total a + c b + d n
Desta forma:
i) Sensibilidade: ba
aDTP
)|(
ii) Especificidade: dc
dDTP c
)|(
iii) Prob(falso positivo): dc
cDTP c
)|(
iv) Prob(falso negativo): ba
bDTP
)|(
Exemplo 3) Um teste foi realizado para se avaliar a competência dos técnicos que analisaram exames Papanicolau, na detecção de câncer
do colo do útero, em 306 laboratórios. Os resultados foram:
P(T | câncer) = 0.1625 P(falso negativo)
P(T | câncer) = 0.8375,
ou seja, a sensibilidade do Papanicolau foi de 0.8375.
Note que P(T | câncer) = 1 − P(
T | câncer).
Ainda:
P(T | não câncer) = 0.1864 P(falso positivo)
P(T | não câncer) = 0.8136,
ou seja, a especificidade do Papanicolau foi de 0.8136.
A prevalência da doença foi considerada como 8,3 por 10 mil mulheres, segundo uma publicação da área da saúde. Logo:
000083.0)câncer( P
Desta forma:
999917.0000083.01)câncer(1)câncer não( PP
Para calcular os valores preditivos, vamos aplicar o teorema de Bayes: i) valor preditivo positivo:
)(
)câncer()|câncer(
TP
TPTPVPP
)(
)câncer()câncer|()|câncer(
TP
PTPTPVPN
Mas:
)câncer não()câncer não|(
)câncer()câncer|()(
PTP
PTPTP
186454.0999917.01864.0000083.08375.0)( TP
Assim, o valor preditivo positivo do teste de Papanicolau é de:
000373.0186454.0
000083.08375.0)|câncer(
TPVPP .
Este resultado indica que, para cada 1 milhão de testes com Papanicolau positivos, espera-se 373 casos verdadeiros de câncer no colo uterino.
Apesar do Papanicolau ter sensibilidade e especificidade altas, tem um valor preditivo positivo baixíssimo.
ii) valor preditivo negativo:
)(
)câncer não()|câncer não(
TP
TPTPVPN
)(
)câncer não()câncer não|()|câncer não(
TP
PTPTPVPN
Mas:
)câncer não()câncer não|(
)câncer()câncer|()(
PTP
PTPTP
813546.0999917.08136.0000083.01625.0)( TP
Assim, o valor preditivo negativo do teste de Papanicolau é de:
999983.0813546.0
999917.08136.0)|câncer não(
TPVPN .
Este resultado indica que, para cada 1 milhão de mulheres com
Papanicolau negativos, espera-se que 999.983 não tenham câncer no colo uterino.
Apesar do Papanicolau ter sensibilidade e especificidade altas e um baixíssimo valor preditivo positivo, tem um valor preditivo negativo muito
alto, indicando que o Papanicolau é um excelente teste para exclusão da suspeita de câncer quando a mulher não tem a doença.
Exemplo 4) Um estudo sobre a incidência de tuberculose foi realizado com 1820 indivíduos, dos quais, 30 tinham tuberculose. Todos os
pacientes foram examinados com raio X do tórax que indicou 73 resultados positivos, ou sejam, dos 1820 exames, 73 deram positivo para tuberculose. Os dados finais do estudo são apresentados na tabela:
Tuberculose Raio X
Total RX
RX
T_SIM 22 8 30
T_NÃO 51 1739 1790
Total 73 1747 1820
Definindo os eventos: D = o indivíduo tem a doença (tuberculose) e
cD = o indivíduo não tem a doença.
De um levantamento de 1987, tem-se que a prevalência da tuberculose é
000093.0)doente indivíduo()( PDP
Logo,
999907.0)doença a sem indivíduo()( PDP c
Portanto:
i) Sensibilidade: 7333.030
22)|( DRXP
ii) Especificidade: 9715.01790
1739)|( cDRXP
iii) Prob(falso positivo): 0285.01790
51)|( cDRXP
iv) Prob(falso negativo): 2667.030
8)|( DRXP
v) Valor preditivo positivo: )|( RXDP
)(
)()|()|(
RXP
DPDRXPRXDPVPP
Mas:
02857.0999907.00285.0000093.07333.0)( RXP
Então:
00239.002857.0
000093.07333.0
VPP
Note que, a priori, a probabilidade de que um indivíduo selecionado
aleatoriamente da população, tenha tuberculose é de 0.000093.
No entanto, após a realização do raio X, com resultado positivo, esse mesmo indivíduo tem probabilidade 0.00239 de ter a doença. Esta probabilidade é chamada de probabilidade a posteriori.
Como 0.00239/0.000093 = 25.7, a probabilidade de que um indivíduo com resultado positivo do raio X tenha tuberculose é 25/7 vezes maior do que uma pessoa escolhida aleatoriamente da população.
vi) Valor preditivo negativo: )|( RXDP c
)(
)()|()|(
RXP
DPDRXPRXDPVPN
ccc
Mas:
97144.0999907.09715.0000093.02667.0)( RXP
Então:
999974.097144.0
999907.09715.0
VPN
Recommended