27
Profa. Camila Nagamine - Bioestat´ ıstica Universidade Estadual de Santa Cruz – UESC Departamento de Ciˆ encias Exatas e Tecnol´ ogicas Professora: Camila M. L. Nagamine Curso: Licenciatura Biologia- EaD Disciplina: Bioestat´ ıstica Parte I - Introdu¸ ao ` a Teoria da Probabilidade 1 Introdu¸ ao Relativamente ` a esse t´ opico, estudaremos a teoria matem´ atica utilizada para se estudar a incerteza proveniente de experimentos de car´ ater aleat´ orio. No nosso cotidiano, lidamos sempre com situa¸ oes onde est´ a presente a incerteza do resultado, emb- ora, muitas vezes, os resultados poss´ ıveis sejam conhecidos. Por exemplo, no lan¸ camento de uma dado, se estamos interessados na face voltada para cima, s´ o saberemos o resultado quando o experimento se concretizar, ou seja, quando o dado atingir a superf´ ıcie sobre a qual foi lan¸ cada, embora, sabemos que os resultados poss´ ıveis para esse experimento s˜ ao 1, 2, 3, 4, 5, 6. Torna-se conveniente ent˜ ao, dispormos de uma medida que exprima a incerteza presente nos aconteci- mentos. Tal medida ´ ea probabilidade. 2 Conceitos Fundamentais Vamos estabelecer algumas defini¸ oes antes de passarmos ` a defini¸ ao propriamente dita de probabili- dade. 1. Experimento Determin´ ıstico: s˜ ao experimentos que ao serem repetidos nas mesmas condi¸ oes, produzem os mesmos resultados. Por exemplo, se colocarmos uma panela com ´ agua para ferver e anotarmos a temperatura de ebuli¸ ao da ´ agua, o resultado ser´ a sempre 100 0 C . Logo, esse ´ e um experimento determin´ ıstico. 2. Experimento Aleat´ orio: s˜ ao aqueles experimentos que realizados sob as mesmas condi¸ oes, apre- sentam varia¸ oes nos resultados de diferentes observa¸ oes. Exemplo 2.1. Considere os seguintes experimentos: Lan¸ car uma moeda e observar o resultado da face voltada para cima. Lan¸ car duas moedas e observar o resultado das faces voltadas para cima. Lan¸ car um dado e observar o resultado mostrado na face voltada para cima. Plantar 10 sementes de feij˜ ao e observar o n´ umero de sementes germinadas. Fazer o cruzamento de dois animais e observar o sexo do animal que nasceu. 3. Espa¸ co Amostral: O espa¸ co amostral de um experimento aleat´ orio ´ e o conjunto de todos os resultados poss´ ıveis desse experimento. Vamos denotar tal conjunto pela letra grega ˆ omega: Ω. Licenciatura em Biologia - EaD, UESC - 2012.1

Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

  • Upload
    ledieu

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Universidade Estadual de Santa Cruz – UESCDepartamento de Ciencias Exatas e Tecnologicas

Professora: Camila M. L. NagamineCurso: Licenciatura Biologia- EaD

Disciplina: Bioestatıstica

Parte I - Introducao a Teoria da Probabilidade

1 Introducao

Relativamente a esse topico, estudaremos a teoria matematica utilizada para se estudar a incertezaproveniente de experimentos de carater aleatorio.

No nosso cotidiano, lidamos sempre com situacoes onde esta presente a incerteza do resultado, emb-ora, muitas vezes, os resultados possıveis sejam conhecidos. Por exemplo, no lancamento de uma dado,se estamos interessados na face voltada para cima, so saberemos o resultado quando o experimento seconcretizar, ou seja, quando o dado atingir a superfıcie sobre a qual foi lancada, embora, sabemos que osresultados possıveis para esse experimento sao 1, 2, 3, 4, 5, 6.

Torna-se conveniente entao, dispormos de uma medida que exprima a incerteza presente nos aconteci-mentos. Tal medida e a probabilidade.

2 Conceitos Fundamentais

Vamos estabelecer algumas definicoes antes de passarmos a definicao propriamente dita de probabili-dade.

1. Experimento Determinıstico: sao experimentos que ao serem repetidos nas mesmas condicoes,produzem os mesmos resultados. Por exemplo, se colocarmos uma panela com agua para ferver eanotarmos a temperatura de ebulicao da agua, o resultado sera sempre 1000C. Logo, esse e umexperimento determinıstico.

2. Experimento Aleatorio: sao aqueles experimentos que realizados sob as mesmas condicoes, apre-sentam variacoes nos resultados de diferentes observacoes.

Exemplo 2.1. Considere os seguintes experimentos:

• Lancar uma moeda e observar o resultado da face voltada para cima.

• Lancar duas moedas e observar o resultado das faces voltadas para cima.

• Lancar um dado e observar o resultado mostrado na face voltada para cima.

• Plantar 10 sementes de feijao e observar o numero de sementes germinadas.

• Fazer o cruzamento de dois animais e observar o sexo do animal que nasceu.

3. Espaco Amostral: O espaco amostral de um experimento aleatorio e o conjunto de todos osresultados possıveis desse experimento. Vamos denotar tal conjunto pela letra grega omega: Ω.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 2: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 2.2. Nos exemplos dados acima, temos:

• Ω = K, C em que C=cara e K=coroa

• Ω = (c; c), (c; k), (k; c), (k; k)

• Ω = 1, 2, 3, 4, 5, 6

• Ω = 0, 1, 2, 3, 4, 5, 6, ..., 10

• Ω = femea,macho

Quando o espaco amostral e finito ou infinito enumeravel, e chamado espaco amostral discreto. Casocontrario, isto e, quando Ω e nao enumeravel, vamos chama-lo de espaco amostral contınuo.

Exemplo 2.3. Duas pecas sao retiradas de uma linha de producao. Cada peca e classificada comoboa (B) ou defeituosa (D). O espaco amostral para esse experimento e Ω = BB,BD, DB, DD,que e tambem um espaco amostral discreto.

Exemplo 2.4. Seja o experimento que consiste na determinacao da vida util de um componenteeletronico. O espaco amostral associado a este experimento e formado pelos numeros reais naonegativos, ou seja: Ω = t ∈ R, t > 0, onde t e o tempo de vida do componente. Portanto, esse eum espaco amostral contınuo.

4. Eventos aleatorios: Denominamos de evento aleatorio ou simplesmente evento, a todo resultadoou subconjunto de um experimento. Representamos por letras maiusculas do nosso alfabeto. Oconjunto vazio, como ja e tradicional, sera denotado por ∅.Os elementos de Ω sao chamados eventos elementares. A classe dos eventos de um espaco amostralΩ, que denotaremos por F(Ω), e o conjunto de todos os eventos do espaco amostral. A tıtulo deilustracao, consideremos um espaco amostral com tres elementos: Ω = ω1, ω2, ω3. A classe doseventos aleatorios e

F(Ω) = ∅, ω1, ω2, ω3, ω1, ω2, ω1, ω3, ω2, ω3, ω1, ω2, ω3

Os eventos representados por um conjunto unitario sao denominados eventos simples. Dizemos queΩ e um evento certo, ou seja sempre ocorre, e que, ∅ e um evento impossıvel, nunca ocorre.

Exemplo 2.5. Lancam-se dois dados. Enumerar os seguintes eventos:A: saıda de faces iguais;B: saıda de faces cuja soma seja igual a 10;C: saıda de faces cuja soma seja menor que 2;D: saıda de faces cuja soma seja menor que 15;

Podemos determinar o espaco amostral atraves de uma tabela de dupla entrada (produto cartesiano),dada por:

D1/D2 1 2 3 4 5 61 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 3: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Os eventos pedidos sao:A = (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)B = (4, 6), (5, 5), (6, 4)C = ∅ evento impossıvelD = Ω evento certo

2.1 Operacoes com Eventos

Sejam A e B dois eventos associados a um espaco amostral (ω). Temos as seguintes operacoes:

2.1.1 Uniao

A uniao de dois eventos A e B e o evento que corresponde a ocorrencia de pelo menos um deles. Noteque isso significa que pode ocorrer apenas A, ou apenas B ou A e B simultaneamente. Esse evento serarepresentado por A ∪B:

2.1.2 Intersecao

A intersecao de dois eventos A e B e o evento que equivale a ocorrencia simultanea de A e B. Repre-sentada por A ∩B:

2.1.3 Disjuntos ou Mutuamente Exclusivos

Dois eventos A e B sao mutuamente exclusivos quando eles nao podem ocorrer simultaneamente, istoe, quando a ocorrencia de um impossibilita a ocorrencia do outro. Isto significa dizer que os eventos A eB nao tem elementos em comum, ou seja, A ∩B = ∅.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 4: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

2.1.4 Complementar

O complementar de um evento A, denotado por A ou Ac, e a negacao de A. Isto e, formado peloselementos que nao pertencem a A e temos que:

A ∪ A = Ω

A ∩ A = ∅

2.1.5 Diferenca

A diferenca entre dois eventos A e B, representada por A − B, ou equivalentemente, por A ∩ B, e oevento formado pelos pontos do espaco amostral que pertencem a A mas nao pertencem a B:

Alem disso, A−B 6= B − A.

3 Probabilidade

De maneira informal, probabilidade e uma medida da certeza de ocorrencia de um evento. Formalmente,existem duas definicoes de probabilidade: a definicao classica e a frequentista.

A definicao que denominamos de classica baseia-se no conceito primitivo de eventos “equiprovaveis”(igualmente possıveis). Consideremos um experimento finito de eventos simples. Vamos supor que podemosatribuir a mesma chance de ocorrencia a cada um dos eventos simples desse experimento. Nessas condicoesdefinimos:

Definicao 3.1. Consideremos um espaco amostral Ω com N elementos simples, que supomos equiprovaveis.Seja A um evento de Ω composto por m elementos simples. A probabilidade de A, denotada por P (A) edefinida por

P (A) =m

N=

numero de resultados favoraveis a ocorrencia do evento A

numero de resultados possıveis

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 5: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Se Ω nao for enumeravel, o conceito se aplicara ao comprimento de intervalos, medida de areas ousimilares, dando origem ao que chamamos de probabilidade geometrica. Por exemplo, para Ω sendo umintervalo dos reais, temos:

P (A) =comprimento de A

comprimento total do espaco amostral

Exemplo 3.1. Considere o seguinte experimento aleatorio: lancar uma moeda e observar a face voltadapara cima.

Para o exemplo acima, podemos definir os eventos:A=c=ocorrer cara e B=k=ocorrer coroa

Para o experimento acima se a moeda for nao viciada, os eventos A e B serao equiprovaveis e

P (A) = P (B) = 1/2.

No lancamento de um dado nao viciado, os eventos simples sao equiprovaveis com probabilidade 16.

P (sair um numero par) = 3/6 = 1/2,

P (sair numero 1 ou 3) = 2/6 = 1/3 e

P (sair numero maior do que 2) = 4/6 = 2/3.

Definicao 3.2. Na maioria das situacoes praticas, os eventos simples do espaco amostral nao sao equiprovaveise nao podemos calcular probabilidades usando a definicao classica. Neste caso, vamos calcular probabili-dades como a frequencia relativa de um evento, que consiste em repetir o experimento aleatorio, digamosn vezes e anotar quantas vezes o evento A associado a esse experimento ocorre. Seja n(A) o numero devezes que o evento A ocorreu nas n repeticoes do experimento. A razao

P (A) =n(A)

n

e denominada frequencia relativa de A nas n repeticoes do experimento.

Repetindo-se o experimento um grande numero de vezes, nas mesmas condicoes, independente, observa-se que a frequencia relativa de ocorrencia do evento A tende a uma constante p.

Buffon, realizou 4040 lancamentos de uma moeda e observou a frequencia de 0,5064 caras. Karl Pearsonfez 24.000 lancamentos de uma moeda tendo obtido uma frequencia relativa de 0,5005 para caras. Quandoa verdadeira frequencia e 0,5 se a moeda for honesta.

As definicoes apresentadas acima tem o apelo da intuicao e permanecem sendo usadas para resolverinumeros problemas. Entretanto, elas nao sao suficientes para uma formulacao matematica mais rigorosade probabilidade. Ao redor de 1930, A. N. Kolmogorov apresentou um conjunto de axiomas matematicospara definir probabilidade, permitindo incluir as definicoes anteriores como casos particulares.

Definicao 3.3. Uma funcao, P (·), definida numa classe F(Ω) de eventos e denominada probabilidade sesatisfaz os Axiomas Kolmogorov:

Ax.1) P (Ω) = 1;

Ax.2) Para todo subconjunto A ∈ F, 0 ≤ P (A) ≤ 1;

Ax.3) Para toda sequencia A1, A2, . . . ,∈ F, mutuamente exclusivos, temos: P (∪∞i=1Ai) =∞∑i=1

P (Ai).

A trinca (Ω, F, P ) e denominada espaco de probabilidade.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 6: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 3.2. Uma amostra de 6800 pessoas de uma determinada populacao foi classificada quanto a cordos olhos e a cor dos cabelos. Os resultados foram:

Considere o experimento aleatorio que consiste em classificar um indivıduo quanto a cor dos olhos. Oespaco amostral e dado por

Ω = A, V, C

em que:A = a pessoa tem olhos azuisV = a pessoa tem olhos verdesC = a pessoa tem olhos castanhos

Os eventos acima nao sao equiprovaveis. Entao vamos calcular a probabilidade de ocorrer um eventocomo a frequencia relativa deste evento:

P (A) =numero de pessoas de olhos azuis

numero de pessoas na amostra=

2811

6800= 0, 4134

O valor obtido e na verdade uma estimativa da probabilidade. A qualidade desta estimativa dependedo numero de replicacoes do experimento, ou seja, do tamanho da amostra.

A medida que o tamanho da amostra cresce, a estimativa aproxima-se mais do valor verdadeiro daprobabilidade. Vamos, no entanto, assumir que o numero de replicacoes e suficientemente grande para quea diferenca entre a estimativa e o valor verdadeiro da probabilidade seja desprezıvel.

As probabilidades dos eventos V e C sao:

P (V ) =3132

6800= 0, 4606 e P (C) =

857

6800= 0, 1260

3.1 Propriedades da Probabilidade

Dado (Ω, F, P ), considere que os conjuntos mencionados sao eventos nesse espaco de probabilidade,temos as seguintes propriedades:

Propriedade 3.1. P (Ac) = 1− P (A)

Propriedade 3.2. Para dois eventos A e B quaisquer,

P (B) = P (B ∩ A) + P (B ∩ Ac)

Propriedade 3.3. Se A ⊂ B entao, P (A) ≤ P (B).

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 7: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Propriedade 3.4. Regra da adicao de probabilidade (generalizavel para qualquer n): Para dois eventos Ae B quaisquer,

P (A ∪B) = P (A) + P (B)− P (A ∩B).

Voltando ao exemplo, vamos calcular algumas probabilidades.Seja L o evento: a pessoa tem cabelos loiros.

Qual a probabilidade de uma pessoa ter olhos azuis e cabelos loiros?O evento a pessoa tem olhos azuis e cabelos loiros e chamado de evento intersecao. Ele contemtodos os elementos do espaco amostral pertencentes concomitantemente ao evento A e ao evento L e seradenotado por A ∩ L, e a probabilidade deste evento e:

P (A ∩ L) =1768

6800= 0, 26

Qual a probabilidade de uma pessoa ter olhos azuis ou cabelos louros? O evento a pessoa temolhos azuis ou cabelos louros e chamado de evento uniao e sera denotado por A∪L. Ele contem todosos elementos do espaco amostral que estao em A, ou somente em L, ou em ambos, e a probabilidade desteevento e:

P (A ∪ L) = P (A) + P (L)− P (A ∩ L) =2811

6800+

2829

6800− 1768

6800=

3872

6800= 0, 5694

3.2 Probabilidade Condicional

Em muitas situacoes praticas, o experimento aleatorio com o qual trabalhamos pode ser separado emetapas. A informacao do que ocorreu em uma determinada etapa pode influenciar nas probabilidades deocorrencia das etapas sucessivas. Nestes casos, dizemos que ganhamos informacao e podemos “recalcular”as probabilidades de interesse. Essas probabilidades “recalculadas” recebem o nome de ProbabilidadeCondicional.

Vamos introduzir o conceito de probabilidade condicional considerando uma situacao especial em que oespaco amostral tem eventos equiprovaveis. A probabilidade de um evento A ocorrer, dado que um outroevento B ocorreu, e chamada probabilidade condicional do evento A dado B.

Exemplo 3.3. A probabilidade de que uma pessoa venha a contrair AIDS dado que ele/ela e um usuariode drogas injetaveis e uma probabilidade condicional.

Exemplo 3.4. Um estudo sobre panfletos de supermercado, em que deseja-se calcular a probabilidade deque um panfleto de propaganda seja jogado no lixo dado que contem uma mensagem sobre o cuidado dedepositar lixo no lixo.

Exemplo 3.5. Uma frase que ocorrera repetidamente neste material: ”Se a hipotese nula for verdadeira,a probabilidade de se obter um resultado como este e ...”. Aqui a palavra se substitui a palavra dado que,mas o sentido e o mesmo.

Definicao 3.4. Sejam A e B dois eventos de um espaco amostral Ω. A probabilidade condicional do eventoA dada a ocorrencia do evento B (representada por P (A|B)e dada por:

P (A|B) =P (A ∩B)

P (B)P (B) > 0

Da definicao de probabilidade condicional, deduzimos a regra do produto, que e uma relacao bastanteutil nas operacoes de probabilidade condicional. A regra do produto e dada pela expressao;

P (A ∩B) = P (B)P (A|B)

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 8: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

A expressao acima pode ser generalizada de modo a exprimir a probabilidade da intersecao de n eventosA1, A2, ..., An por meio das probabilidades condicionais sucessivas:

P (A1 ∩ A2 ∩ ... ∩ An) = P (A1)× P (A2|A1)× P (A3|A1 ∩ A2)...× P (An|A1 ∩ A2 ∩ ... ∩ An−1)

Exemplo 3.6. Frequentemente assumimos, com alguma justificativa, que a paternidade leva a responsabil-idade. Pessoas que passam anos atuando de maneira descuidadosa e irracional de alguma forma parecemse tornar em pessoas diferentes uma vez que elas se tornam pais, mudando muitos dos seus antigos padroeshabituais. Suponha que uma estacao de radio tenha amostrado 100 pessoas, 20 das quais tinham criancas.Eles observaram que 30 dessas pessoas usavam cinto de seguranca, e que 15 daquelas pessoas tinhamcriancas. Os resultados sao mostrados na Tabela 2.

A partir da informacao na Tabela 2 podemos calcular probabilidades simples (ou marginais ou incondi-cionais), conjuntas e condicionais.

• A probabilidade de uma pessoa amostrada aleatoriamente usar cinto de seguranca e 30/100 = 0, 30.

• A probabilidade de uma pessoa ter crianca e usar cinto de seguranca e 15/100 = 0, 15.

• A probabilidade de uma pessoa usar cinto de seguranca dado que tem crianca e 15/20 = 0, 75.

• A probabilidade de uma pessoa ter crianca dado que usa cinto de seguranca e 15/30 = 0, 50.

3.3 Independencia de eventos

Em certas famılias de eventos do espaco de probabilidade, a funcao de probabilidade tem uma pro-priedade particular de grande importancia, tanto na pratica quando teorica. Ela se refere a indiferenca nocalculo da probabilidade de um evento A frente a ocorrencia de um outro evento B. E como se nao acres-centassemos nada da ocorrencia de B, que fosse capaz de modificar a probabilidade atribuıda ao evento Aanteriormente.

A definicao de independencia de eventos permite muitas vezes, separar o experimento em parte maissimples de serem estudadas e, assim, possibilitar uma enorme simplificacao nos calculos probabilısticos deinteresse.

Definicao 3.5. Sejam A e B dois eventos de um espaco amostral Ω. A e B sao ditos independentes se aprobabilidade de um ocorrer nao afetar a probabilidade do outro ocorrer, isto e, se:

• P (A|B) = P (A)

• P (B|A) = P (B)

A condicao de independencia pode tambem ser expressa na seguinte forma alternativa e equivalente:

P (A ∩B) = P (A).P (B)

A expressao equivalente apresentada na definicao de independencia, e muito conveniente para efetuarcalculos e definir outros tipos de independencia.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 9: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

3.4 Particao do Espaco Amostral

Os eventos A1, A2, ..., An formam uma particao do espaco amostral se eles nao tem intersecao entre sie se sua uniao e igual ao espaco amostral. Isto e,

Ai ∩ Aj = ∅ para i 6= j e⋃n

i=1 Ai = ΩA figura abaixo ilustra a particao com 8 eventos.

3.5 Teorema da Probabilidade Total

Teorema 3.1. Suponha que os eventos A1, A2, ..., An formam uma particao de Ω. Entao, para qualquerevento B, temos:

P (B) =n∑

i=1

P (Ai)P (B|Ai)

Para ilustrar a aplicacao deste teorema, vejamos o exemplo a seguir.

Exemplo 3.7. Uma urna contem 3 bolas brancas e 2 amarelas. uma segunda urna contem 4 bolas brancase 2 amarelas. Escolhe-se ao acaso, uma urna e dela retira-se, tambem ao acaso uma bola. Qual a proba-bilidade de que a bola retirada seja branca?Solucao:As urnas I e II formam uma particao do espaco amostral, pois, I ∩ II = ∅ e I ∪ II = Ω.Sejam os eventos: B : a bola e branca e A :a bola e amarela.

Entao aplicando o teorema da probabilidade total temos:

P (B) = P (I)× P (B|I) + P (II)× P (B|II)

= 1/2× 3/5 + 1/2× 4/6 = 0, 63

3.6 Teorema de Bayes

Teorema 3.2. Suponha que os eventos A1, A2, ..., An formam uma particao de Ω e que suas probabilidadessao conhecidas. Suponha ainda que para um evento B, P (B) > 0, se conhecam as probabilidades P (B|Ai)para todo i = 1, 2, ..., n. Entao para qualquer j, j = 1, 2, ..., n, temos:

P (Aj|B) =P (AjP (B|Aj)∑n

i=1 P (B|Ai)P (Ai)

Demonstracao:Na expressao do lado direito, o numerador e P (B∩Aj) pela regra do produto de probabilidades. O denom-inador e P (B) pelo teorema da probabilidade total. Portanto, pela definicao de probabilidade condicionalo teorema esta demonstrado. O teorema de bayes e tambem chamado de teorema da probabilidade aposteriori. Ele relaciona uma das parcelas da probabilidade total com a propria probabilidade total.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 10: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

4 Exemplos

Exemplo 4.1. O doente sadio e o sadio doenteUma das formas de avaliar a eficiencia de um teste para detectar uma doenca e quantificar a probabilidadede erro. em geral, testes sofisticados envolvem varios procedimentos laboratoriais.

Denominamos falso-positivo ao erro em que o teste indica positivo para uma pessoa que nao tem adoenca. Por outro lado, teremos um erro falso-negativo se o teste nao acusar a doenca em uma pessoadoente. Nao e difıcil imaginar os incovenientes dessas ocorrencias. Os erros originam doentes sadios esadios doentes.

As probabilidades dos erros sao calculadas condicionalmente a situacao do paciente. Seus comple-mentares fornecem as probabilidades de acerto do teste, ou seja, a probabilidade de indicar doenca aosdoentes e nao doenca aos sadios.

Para fixar as ideias, considere que um determinado teste resulta positivo para os doentes com probabil-idade 0,95 e positivo para os nao doentes com probabilidade 0,01. Se a incidencia da doenca na populacaoe de 5 para cada 100 habitantes. Qual e a probabilidade de uma pessoa estar realmente doentese o teste deu positivo?. Observe que, estando doente ou nao existe uma probabilidade nao nula doteste indicar a presenca da doenca.

A situacao acima ocorre de forma similar em varias areas e e tıpica para a aplicacao do Teorema deBayes.Solucao:Definimos os eventos:A: o teste e positivoD: a pessoa esta doente.Assim, as informacoes disponıveis sao:

P (D) = 0, 05; P (A|D) = 0, 95; P (A|D) = 0, 01

A probabilidade desejada e P (D|A) e, sera calculada atraves do Teorema de Bayes

P (D|A) =P (A|D)P (D)

P (A|D)P (D) + P (A|D)P (D)

=0, 95× 0, 05

0, 95× 0, 05 + 0, 01× 0, 95=

0, 05

0, 06= 5/6 = 0, 83

A situacao acima ocorre de forma similar em varias areas e e tıpica para a aplicacao do teorema de Bayes.

Exemplo 4.2. Considerando o Exemplo 3.2

a) Qual a probabilidade de uma pessoa escolhida ao acaso da populacao ter olhos azuis dado que possuicabelos loiros?

P (A|L) =P (A ∩ L)

P (L)=

1768/6800

2829/6800= 0, 6250

Observe que quando condicionamos em L, restringimos o espaco amostral ao conjunto das pessoasloiras. Note que P (A) = 0, 4134 < P (A|L) = 0, 6250 e que os eventos A e L nao sao independentespois P (A|L) 6= P (A).

b) Qual a probabilidade de uma pessoa escolhida ao acaso da populacao nao ter cabelos loiros dado quetem olhos castanhos?

P (L|C) = 1− P (L|C) = 1− 115/6800

857/6800= 1− 0, 1342 = 0, 8658

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 11: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 4.3. Um casal possui 2 filhos sendo que pelo menos um deles e do sexo masculino. Qual e aprobabilidade de que ambos sejam do sexo masculino?Define-se os eventos M = crianca do sexo masculino e F = crianca do sexo feminino. Logo, deseja-se obter a probabilidade de que ambos sejam do sexo masculino dado que pelo menos um e do sexo mas-culino.

P (MM | pelo menos um M) = P (MM)/P (MF ∪ FM ∪MM) =1/4

3/4= 1/3

Exemplo 4.4. Uma clınica envia amostras de equinos para 3 laboratorios de analises A, B e C nasseguintes proporcoes 0,2; 0,3 e 0,5, respectivamente. A probabilidade de cada um dos laboratorios elaboraruma analise errada e de, respectivamente, 1/2, 1/3 e 1/6.

a) Uma analise resultou errada, qual a probabilidade de ter sido feita pelo laboratorio A? Pelo B? PeloC?b) Qual a probabilidade de um exame executado resultar errado?Solucao:

P (A1) = 0, 2 P (B|A1) = 1/2

P (A2) = 0, 3 P (B|A2) = 1/3

P (A3) = 0, 5 P (B|A3) = 1/6

a)

P (A1|B) =0, 2× 1/2

0, 2× 1/2 + 0, 3× 1/3 + 0, 5× 1/6=

0, 11,76

= 0, 3529

Analogamente:P (A2|B) = 0, 3529

P (A3|B) = 0, 2941

b)

P (B) =P (A ∩B1) + P (A ∩B2) + P (A ∩B3)

=P (A1)× P (B|A1) + P (A2)× P (B|A2) + P (A3)× P (B|A3) =1, 7

6

5 Avaliacao da qualidade de testes diagnosticos

Ao fazer um diagnostico, um clınico estabelece um conjunto de diagnosticos alternativos com basenos sinais e sintomas do paciente. Progressivamente ele reduz suas alternativas ate chegar a uma doencaespecıfica.

Alternativamente, ele pode ter fortes evidencias de que o paciente tem uma determinada doenca e desejaapenas sua confirmacao. Para chegar a uma conclusao final o clınico utiliza-se de testes diagnosticos:

• exames de laboratorio (ex. dosagem de glicose)

• exame clınico (ex. auscultacao do pulmao)

• questionario (ex. CDI (Childrens Depression Inventory))

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 12: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Um teste diagnostico e um instrumento capaz de diagnosticar a doenca com determinada precisao.Para cada teste diagnostico existe um valor de referencia que determina a classificacao do resultado doteste como negativo ou positivo.

Um teste diagnostico e considerado util quando ele identifica bem a presenca da doenca. Antes de seradotado o teste deve ser avaliado para verificar sua capacidade de acerto. Esta avaliacao e feita aplicando-se o teste a dois grupos de pessoas: um grupo doente o outro nao doente. Nesta fase, o diagnostico e feitopor outro teste chamado padrao ouro.

Os resultados obtidos podem ser organizados de acordo com a tabela abaixo:

O teste e aplicado a n indivıduos, dos quais sabidamente (a + b) sao doentes e (c + d) sao nao doentes.

Exercıcio 5.1. Em um estudo sobre o teste ergometrico, Wriner et al. (1979) compararam os resultadosobtidos entre indivıduos com e sem doenca coronariana. O teste foi definido como positivo se foi observadomais de 1mm de depressao ou elevacao do segmento ST, por pelo menos 0, 08s, em comparacao com osresultados obtidos com o paciente em repouso. O diagnostico definitivo (classificacao como doente ou naodoente) foi feito atraves de angiografia (teste padrao ouro).

Sejam os eventos:D+ = a pessoa tem doenca coronarianaD− = a pessoa nao tem doenca coronarianaT+ = o resultado do teste ergometrico e positivoT− = o resultado do teste ergometrico e negativoTemos interesse em responder duas perguntas:1. Qual a probabilidade do teste ser positivo dado que o paciente e doente?2. Qual a probabilidade do teste ser negativo dado que o paciente nao e doente?

Em outras palavras, interessa conhecer as probabilidades condicionais:

s = P (T + |D+) =P (T + ∩D+)

P (D+)=

a

a + b

e = P (T − |D−) =P (T − ∩D−)

P (D−)=

d

c + d

Estas probabilidades sao chamadas sensibilidade e especificidade. Numa situacao ideal a sensibili-dade e a especificidade deveriam ser 1.

Calcule s e e para o exemplo do teste ergometrico.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 13: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

6 Variaveis Aleatorias

Definicao 6.1. Sejam E um experimento e Ω um espaco amostral associado ao experimento. Uma funcaoX que associe a cada elemento wi ∈ Ω um numero real, X(wi), e denominada variavel aleatoria.

Uma variavel aleatoria X e, portanto, uma funcao cujo domınio e o espaco amostral e contra-domınioe conjunto dos numeros reais, ou seja, X : Ω → R

No inıcio deste material foi feita uma distincao entre variaveis contınuas e discretas.Esta distincao e reintroduzida aqui porque a distribuicao de dois tipos de variaveis sao tratadas de

maneiras diferentes em probabilidade. Com variaveis discretas pode-se falar da probabilidade de ocorrenciade um valor especıfico. Com variaveis contınuas, por outro lado, fala-se da probabilidade de se obter umvalor dentro de um intervalo especıfico.

6.1 Variavel Aleatoria Discreta

Uma quantidade X, associada a cada possıvel resultado do espaco amostral, e denominada de variavelaleatoria discreta se assume valores nem um conjunto finito ou infinito enumeravel, com certa probabili-dade.

6.1.1 Funcao Discreta de Probabilidade

Seja X uma variavel aleatoria discreta. A funcao que atribui a cada valor da variavel X sua probabili-dade e denominada funcao discreta de probabilidade ou simplesmente funcao de probabilidade. A notacaoa ser utilizada e:

P (X = xi) = p(xi)

ou ainda,

X x1 x2 x3...pi p1 p2 p3...

Uma funcao de probabilidade satisfaz:

0 ≤ pi ≤ 1 e∑

i

pi = 1

Note que, na maioria dos casos, X tera apenas um numero finito de valores possıveis e, assim, a verificacaode que a soma de probabilidades e igual a 1 sera feita atraves de uma soma finita. As variaveis aleatoriassao completamente caracterizadas pela funcao de probabilidade e uma parte importante da Estatıstica ejustamente obter, para uma dada variavel de interesse, a funcao que melhor represente seu comportamentona populacao.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 14: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 6.1. Considere o experimento de lancar uma certa moeda e observar se ocorre cara (c) ou coroa(r). Descreva o comportamento da variavel aleatoria X : numero de caras em dois lancamentos dessamoeda. A variavel X pode assumir os valores, 0, 1 e 2. Para atribuir probabilidades a cada um dessesvalores, e necessario fazer algumas suposicoes a respeito da probabilidade de ocorrencia de cara ou coroa.Admitindo que a moeda e honesta, as probabilidades de cada face sera iguais, isto e P (c) = P (r) = 1/2.Supondo ainda a independencia entre lancamentos, de modo que a ocorrencia de uma determinada faceno primeiro lancamento, nao altera a probabilidade de cara ou coroa no segundo lancamento.

Podemos considerar como espaco amostral o seguinte conjunto:

Ω = cc, cr, rc, rr

Para deduzir a funcao de probabilidade de X, observe que o valor 1 ocorre nos eventos cr, rc, enquantoque os valores 0 e 2 tem apenas um evento a eles associado, respectivamente rr e cc. Segue entao que asprobabilidades associadas aos valores de X sao as seguintes:

X 0 1 2∑

pi 1/4 2/4 1/4 1

6.1.2 Funcao de Distribuicao de Probabilidade

A funcao de distribuicao ou funcao acumulada de probabilidade de uma variavel aleatoria discreta Xe definida, para qualquer numero real x, pela seguinte expressao:

F (X) = P (X ≤ x)

Exemplo 6.2. Considerando o exemplo anterior, cuja variavel X = numero de caras em dois lancamentosde uma moeda equilibrada. A funcao de probabilidade e dada por:

X 0 1 2∑

pi 1/4 2/4 1/4 1

Suponha agora que desejamos calcular a probabilidade da ocorrencia de no maximo uma cara. O queprecisamos obter e a funcao de distribuicao no ponto 1, ou seja, calcular a probabilidade acumulada deocorrencia de valores menores ou iguais a 1. Assim,

F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = 3/4.

Note que, tendo em vista que a variavel so assume valores inteiros, esse valor fica inalterado no intervalo[1, 2). Isto e, F (1, 2); F (1, 45) ou F (1, 99) tem todos o mesmo valor acima. Por essa razao escrevemos:

F (x) = P (X ≤ x) = 3/4 para 1 ≤ x < 2.

Os valores completos da funcao de distribuicao sao os seguintes:

F (x) =

0, x < 0;1/4, 0 ≤ x < 1;3/4, 1 ≤ x < 2;1, x ≥ 2.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 15: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

6.2 Variavel Aleatoria Contınua

Definicao 6.2. Seja X uma variavel aleatoria. Se X assume valores em um conjunto infinito nao enu-meravel, e denominada variavel aleatoria contınua.

No instante em que X e definida uma variavel aleatoria contınua, nao temos condicao de calcularP (X = x) para todos os valores de X, uma vez que, neste caso, X assume valores em um intervalo dareta, isto e, um conjunto nao enumeravel. A funcao de probabilidade sera contınua, onde a curva limitadapela area em relacao aos valores de x sera 1.

Se quisermos calcular a probabilidade de X assumir um valor x entre a e b devemos calcular :

P (a ≤ x ≤ b) =

∫ b

a

f(x)dx

Pelo fato de que a area representa probabilidade, e a mesma tem valores numericos positivos, logo afuncao precisa estar inteiramente acima do eixo das abscissas (x).

Definicao 6.3. Dizemos que f(x) e uma funcao contınua de probabilidade ou funcao densidade de prob-abilidade para uma variavel aleatoria contınua X, se satisfaz as seguintes condicoes:

i) f(x) ≥ 0, ∀x ∈ R

ii)∫ +∞−∞ f(x)dx = 1. Em outras palavras, a area definida por f(x) e igual a 1.

iii) para quaisquer a, b, com −∞ < a < b < +∞, teremos:

P (a ≤ X ≤ b) =

∫ b

a

f(x)dx.

Observacao 6.1. A funcao densidade de probabilidade (f.d.p), nao e uma probabilidade. Somente quandoela for integrada entre dois limites e que produzira uma probabilidade, que sera a area sob a curva dafuncao y = f(x).

P (a < X < b) = A

Observacao 6.2. Constitui uma consequencia da descricao probabilıstica de X, acima, que, para qualquervalor especificado de X, digamos a, teremos P (X = a) = 0, pois:

P (X = a) =

∫ a

a

f(x)dx = 0.

Tendo em vista este fato segue que,

P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b).

Observacao 6.3. Se X tomar valor apenas num intervalo [c, d), podemos simplesmente tomar f(x) =0,∀x [c, d]. Em consequencia, a f.d.p ficara definida para todos os valores reais de X, e poderemos exigirque

∫ +∞−∞ f(x)dx = 1.

Definicao 6.4. Seja X uma variavel aleatoria contınua com funcao densidade de probabilidade f(x),podemos definir a sua funcao de distribuicao acumulada, F (X), como:

F (X) = P (X ≤ x)

Segue-se que: F (X) =∫ x

−∞ f(t)dt para todo real x.

Para variaveis aleatorias contınuas, o seguinte resultado e importante:

Propriedade 6.1. Para todos os valores de x para os quais F (X) e derivavel temos:

F ′(X) =dF (X)

dx= f(x)

Introduziremos aqui apenas dois modelos probabilısticos usados para variaveis discretas e contınuas.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 16: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

7 Distribuicao Binomial

A distribuicao binomial e uma distribuicao discreta. Ela lida com situacoes em que cada resultado deuma serie de ensaios independentes resulta num dentre dois resultados possıveis.

Mais formalmente, considere um ensaio realizado n vezes, sob as mesmas condicoes, com as seguintescaracterısticas:

1. cada repeticao do ensaio produz um dentre dois resultados possıveis, denominados tecnicamente porsucesso (S) ou fracasso (F ), ou seja, a resposta e dicotomica.

2. a probabilidade de sucesso, P (S) = p, e a mesma em cada repeticao do experimento. (Note queP (F ) = (1− p).

3. os ensaios sao independentes, ou seja, o resultado de um ensaio nao interfere no resultado do outro.

Definicao 7.1. O numero total de sucessos X e uma variavel aleatoria com distribuicao binomial comparametros p e n se sua funcao de probabilidade e dada por:

P (X = x) =

(n

x

)px(1− p)n−x x = 0, 1, ..., n

com(

nx

)representando o coeficiente binomial calculado por:

(nx

)= n!

x!(n−x)!= Cn

x

Usaremos a notacao X ∼ B(n; p) para indicar que a variavel X tem distribuicao Binomial comparametros n e p.

A media da variavel aleatoria X e a variancia sao respectivamente:

µ = n p e σ2 = n p (1− p)

O modelo Binomial e comumente empregado em situacoes que envolvem, por exemplo, pesquisaseleitorais, em que os indivıduos na populacao sao ou nao favoraveis a determinado partido ou candidato;proporcao de pecas defeituosas produzidas em uma linha de producao e assim por diante.

E importante notar que as probabilidades sao completamente caracterizadas pela informacao dosparametros.

8 Exemplos

Exemplo 8.1. Uma moeda e lancada 20 vezes. Qual a probabilidade de saı rem 8 caras?Seja X =numero de caras (sucessos)

X = 0, 1, 2, ..., 20 ⇒ p = P (c) = 1/2

Entao,X ∼ B(20; 1/2)

P (X = 8) =

(20

8

)(1/2)8(1/2)20−8 = 0, 12013

Exemplo 8.2. Uma usina hidroeletrica tem 5 geradores que funcionam independentemente, cada umcom probabilidade 0,98 de estar em operacao. Qual a probabilidade de que exatamente dois estejam emfuncionamento em determinado instante?Seja X =numero de geradores em funcionamentoEntao,

X ∼ B(5; 0, 98)

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 17: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Entre os 5 estabelecimentos, ou seja, n = 5, qual a probabilidade de 2 terem tratores:

P (X = 2) =

(5

2

)(0, 98)2(1− 0, 98)5−2 = 0, 000077

Outras probabilidades podem ser calculadas de modo analogo.

Exemplo 8.3. Um recipiente contem um grande numero de sementes de feijao para as quais o fornecedorgarante um poder de germinacao de 0,8. Se 5 dessas sementes sao plantadas, determine:a) A distribuicao de probabilidades para a variavel X : numeros de sementes germinadas.b) A probabilidade de que germinem no maximo 4 sementes.

Solucao:

a) Distribuicao de Probabilidade de X:

b)P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232

ouP [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232

Exemplo 8.4. Certo tratamento quando aplicado a bovinos com certa enfermidade cura 60% dos casos.Tendo dois bovinos sob esse tratamento, qual a probabilidade:a) de que os dois morramb) de que os dois sejam curadosc) de que um seja curado e o outro naod) Qual o numero medio de curas e qual sua variabilidade?

X = xi 0 1 2P (X = xi) 0, 16 0, 48 0, 36

X : numero de sobreviventesp = 0, 6; q = 0, 4; n = 2

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 18: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Solucao:a)P (X = 0) = C0

2(0, 6)0(0, 4)2 = 0, 16b)P (X = 2) = C2

2(0, 6)2(0, 4)1 = 0, 48c)P (X = 1) = C1

2(0, 6)1(0, 4)1 = 0; 36d)µ = np = 2× 0, 6 = 1, 2σ2 = npq = 2× 0, 6× 0, 4 = 0; 48σ =

√0, 48 = 0, 6928

Exemplo 8.5. Certa doenca dada em pintos tem uma fatalidade de 30%. Em 6 casos desta doenca,estabeleca a distribuicao de probabilidade da v.a X : numero de sobreviventes.

Baseado nessa distribuicao, calcule:a) a probabilidade de que todos sobrevivamb) a probabilidade de que nenhum sobrevivac) a probabilidade de que os dois sobrevivamd) a probabilidade de que pelo menos dois sobrevivame) a probabilidade de que no mınimo quatro morramf) o numero medio de sobreviventesg) a variancia e o desvio padrao do numero de sobreviventes.h)Se um produtor de frangos quer obter no final de um determinado perıodo 150 frangos, baseado naincidencia dessa doenca, qual o numero mınimo de pintos que ele deve comprar? Qual a variabilidadedesse numero?

X = xi 0 1 2 3 4 5 6P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,1176

Temos que p = 0, 7; q = 0, 3; n = 6.Solucao:a)P (X = 6) = 0, 11764b)P (X = 0) = 0, 00073c)P (X = 2) = 0, 05954d)P (X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906e)P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048f)µ = np = 6× 0, 7 = 4, 2g)σ2 = npq = 6× 0, 7× 0, 3 = 1, 26σ =

√1, 26 = 1, 12

h)150 = n× 0, 7 ⇒ n = 214σ2 = npq = 214× 0, 7× 0, 3 = 45 ⇒ σ = 6, 7.

9 Distribuicao Normal

Existem varias distribuicoes teoricas que podem ser usadas para representar fenomenos reais. Den-tre estas, uma das mais importante e a distribuicao normal. A seguir faremos um breve estudo destadistribuicao. Importancia da Distribuicao Normal:

1. Representa com boa aproximacao as distribuicoes de frequencias observadas de muitos fenomenosnaturais e fısicos;

2. Distribuicoes importantes, como por exemplo a Binomial e Poisson, podem ser aproximadas pelaNormal, simplificando o calculo de probabilidades;

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 19: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

3. A distribuicao amostral das medias (e proporcoes) em grandes amostras se aproxima da DistribuicaoNormal, o que nos permite fazer estimacoes e testes estatısticos.

Exemplo 9.1. O peso de recem-nascidos e uma variavel aleatoria contınua. A Figura 1 e Figura 2 abaixomostram a distribuicao de frequencias relativas de 100 e 5000 pesos de recem-nascidos com intervalos declasse de 500g e 125g, respectivamente.

1

O segundo histograma e um refinamento do primeiro, obtido aumentando-se o tamanho da amostra ereduzindo-se a amplitude dos intervalos de classe.

2

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 20: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Ele sugere a curva na Figura 3, que e conhecida como curva normal ou Gaussiana.

A variavel aleatoria considerada neste exemplo e muitas outras variaveis da area biologica podem serdescritas pelo modelo normal ou Gaussiano.

A equacao da curva Normal e especificada usando dois parametros: a media µ, e o desvio padrao σ.Denotamos N(µ, σ) a curva Normal com media µ e σ desvio padraos.A media refere-se ao centro da distribuicao e o desvio padrao ao espalhamento (ou achatamento) da

curva.A distribuicao normal e simetrica em torno da media o que implica que a media, a mediana e a moda

sao todas coincidentes.

Definicao 9.1. A variavel aleatoria X, que tome todos os valores reais, tem uma distribuicao normal commedia µ e variancia σ2 se sua funcao densidade de probabilidade for da forma:

f(X) =1

σ√

2πe−

12(

x−µσ )

2

, −∞ < x < ∞,

Os parametros µ e σ seguem as seguintes condicoes: −∞ < µ < +∞ e σ > 0.

Usaremos a notacao X ∼ N(µ, σ2).Observando que a equacao da definicao acima nos da uma famılia de funcoes com parametros µ e σ,

vamos examinar o aspecto grafico delas, uma vez que o mesmo sera de fundamental importancia no calculodas probabilidades.

A distribuicao Normal e uma distribuicao que surge em muitas situacoes onde valores extremos saomenos provaveis do que valores moderados.

Algumas caracterısticas da densidade da normal podem ser, facilmente, observadas de seu grafico:

• O aspecto grafico da funcao f(x) tem forma de sino;

• O domınio de f e toda reta real;

• Como f depende de x somente atraves da expressao (x− µ)2 torna-se evidente que o grafico de f esimetrico em relacao a reta x = µ, ou seja, f(µ − a) = f(µ + a), para qualquer a pertencente aosreais;

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 21: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Figura: f.d.p. de uma v.a normal.

• A funcao f tem um ponto de maximo para x = µ, ja que a mesma e crescente em (−∞, µ) edecrescente em (µ,∞);

• O grafico tem pontos de inflexao para x = µ± σ, uma vez que em σ unidades para a direita e paraesquerda de µ o grafico de f muda de concavidade. Por isso, se σ for relativamente grande, o graficotende a ser “achatado”, enquanto que se σ for pequeno, o grafico tende a ser “pontiagudo”.

• O grafico e assintotico em relacao ao eixo das abscissas, isto e,

limx→±∞f(x) = 0.

• A area sob a curva e acima do eixo das abscissas e igual a 1 para qualquer densidade.

Felizmente, voce nao tem que memorizar esta equacao. O importante e que voce entenda como a curvae afetada pelos valores numericos de µ e σ2. Isto e mostrado no diagrama da Figura 4.

4

A area sob a curva normal (na verdade abaixo de qualquer funcao de densidade de probabilidade) e 1.Entao, para quaisquer dois valores especıficos podemos determinar a proporcao de area sob a curva entreesses dois valores.

Para a distribuicao Normal, a proporcao de valores caindo dentro de um, dois, ou tres desvios padraoda media sao:

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 22: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

µ± 1σ → 68.3%

µ± 2σ → 95.5%

µ± 3σ → 99.7%

Exemplo 9.2. Suponhamos que no exemplo do peso do recem-nascidos µ = 2800g e σ = 500g. Entao:P (2300 ≤ X ≤ 3300) = 0, 683P (1800 ≤ X ≤ 3800) = 0, 955P (1300 ≤ X ≤ 4300) = 0, 997

Usando este modelo podemos dizer que cerca de 68% dos recem-nascidos pesam entre 2300g e 3300g. Opeso de aproximadamente 95% dos recem-nascidos esta entre 1800g e 3800g. Praticamente todos os bebesdesta populacao nascem com peso no intervalo (1300, 4300).

Na pratica desejamos calcular probabilidades para diferentes valores de µ e σ.Para isso, a variavel X cuja distribuicao e N(µ, σ) e transformada numa forma padronizada Z com

distribuicao N(0, 1) (chamada distribuicao normal padrao) pois tal distribuicao e tabelada.A quantidade Z e dada por

Z =X − µ

σ

Dessa forma, convertemos as probabilidades de interesse em probabilidades equivalentes da N(0, 1).

Sua densidade e simetrica ao redor de µ e vai diminuindo a massa de probabilidade, a medida queseus valores se movem para as extremidades. Dessa forma, o modelo Normal e adequado para variasquantidades envolvendo medidas populacionais tais como peso, altura, dosagem entre outras.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 23: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Uso de Tabelas:Ha varios tipos de tabelas que oferecem as areas (probabilidades) sob a curva norma padrao. O tipo

mais frequente e a Tabela de Faixa Central. A tabela de faixa central nos oferece a area entre Z = 0 eZ = Zα ou P (0 < Z < Zα). A simetria da curva em torno de Z = 0 nos permite obter a area entrequaisquer valores de Z (positivos e negativos).

A Tabela oferece a area entre 0 e Zα ou P (0 ≤ Z ≤ Zα).

10 Exemplos

Exemplo 10.1. Desejam-se as probabilidades:a) P (0 ≤ Z ≤ 1)b)P (Z ≥ 1, 93)Solucao:a)Para se obter a probabilidade desejada, basta entrar com a abscissa 1, 0 (na primeira coluna) e 0, 00 (naprimeira linha) da tabela. Assim:

P (0 ≤ Z ≤ 1) = 0, 3413

b)Entra-se na tabela com 1, 9 na primeira coluna e 0, 03 na primeira linha obtendo 0,4732. Porem, essae a area compreendida entre 0 e 1,93. Lembrando que a area embaixo da curva vale 1 e que a funcao esimetrica em relacao a origem Z = 0, tem-se:

P (Z ≥ 1, 93) = 0, 50− 0, 4732 = 0, 0268

Exemplo 10.2. As alturas dos alunos de determinada escola sao normalmente distribuıdas com media1, 60m e desvio padrao 0, 30m. Encontre a probabilidade de um aluno medir entre 1,50 e 1, 80m.Solucao:

µ = 1, 60 e σ = 0, 3 → Z =X − 1, 6

0, 3

P (1, 50 ≤ X ≤ 1, 80) =P (−0, 33 ≤ Z ≤ 0, 67)

= P (0 ≤ Z ≤ 0, 33) + P (0 ≤ Z ≤ 0, 67)

= 0, 1293 + 0, 2486

= 0, 3779 = 37, 79%

pois,

Z1 =1, 50− 1, 60

0, 3= −0, 33 Z2 =

1, 80− 1, 60

0, 3= 0, 67

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 24: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 10.3. Suponha que a pressao arterial sistolica em pessoas jovens saudaveis tenha distribuicaoN(120, 10).1. Qual e a probabilidade de se encontrar uma pessoa com pressao sistolica acima de 140mmHg?

P (X ≥ 140) =P (X − 120

10=

140− 120

10)

=P (Z ≥ 2)

=1− P (Z < 2)

=1− 0, 9772

=0, 0228

Ou seja, 2, 28% das pessoas jovens e sadias tem pressao sistolica acima de 140mmHg.2. Quais sao os limites de um intervalo simetrico em relacao a media que engloba 95% dos valores das

pressoes sistolicas de pessoas jovens e sadias?Neste caso queremos encontrar a e b tais que: P (a ≤ X ≤ b) = 0, 95.

Primeiro padronizamos essa probabilidade, isto e,

P (a ≤ X ≤ b) = P

(a− 120

10≤ X − 120

10≤ b− 120

10

)= 0, 95

Ou seja,P (a′ ≤ Z ≤ b′) = 0, 95.

Escolhendo uma solucao simetrica temos −a′ = b′.Como P (Z ≤ b′) = 0.975, da tabela da gaussiana padrao obtemos a′ = −1, 96 e b′ = 1, 96.Consequentemente, a−120

10= −1, 96 e b−120

10= 1, 96, ou seja, a = 100, 4 e b = 139, 6. Para essa

populacao de jovens saudaveis, o intervalo [100, 4; 139, 6] engloba 95% dos valores pressoricos, isto e,aproximadamente entre 100mmHg e 140mmHg

10.1 Relacao entre Binomial e Normal

Uma consequencia do Teorema do Limite Central, e a aproximacao de calculos de probabilidade daBinomial pela distribuicao Normal. Sendo X ∼ B(n, p), desejamos calcular P (a ≤ X ≤ b) com ae b inteiros e a ≥ 0, b ≤ n. para n suficiente grande, a aproximacao sera feita atraves da variavelY ∼ N(µ = np, σ2 = np(1−p)). Em geral, essa aproximacao e aceitavel sempre que np ≥ 5 e np(1−p) ≥ 5.

Como estamos aproximando uma variavel discreta por uma contınua, alguns cuidados precisam sertomados. Para melhorar a aproximacao, um recurso e utilizar a correcao de continuidade que consiste emacrescentar ou retirar 0, 5 ao valor que se pretende calcular a probabilidade.

11 Construcao de faixas de referencia

Trataremos aqui da construcao de faixas de referencia ou simplesmente de um valor de referencia.Tal procedimento permite a caracterizacao do que e tıpico em uma determinada populacao.E empregado largamente em Ciencias da Saude, por exemplo, nos resultados de exames de laboratorio.

Entretanto, tal metodologia tem muitas outras aplicacoes, tais como a determinacao de nıveis toleraveisde barulho ou a caracterizacao dos nıveis de poluicao em uma regiao.

Uma Faixa de Referencia e um intervalo de valores de determinada caracterıstica que contem umacerta porcentagem de indivıduos da populacao sadia. Por exemplo, uma faixa de referencia de 90% para ataxa de glicose no sangue de homens adultos vai de 80 a 100 mg/dl. Isto quer dizer que 90% dos homensadultos sadios possuem taxa de glicose entre 80 e 100 mg/dl.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 25: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

Exemplo 11.1. O histograma mostrado na Figura 5 trata-se de taxas de hemoglobina (g/dl) de 147mulheres clinicamente sadias.

5

Tomando o histograma desta figura como aproximacao para a sua distribuicao entre, vemos que valoresmenores que 12g/dL sao pouco comuns.

E, pois, razoavel considerar um diagnostico de anemia ao se observar uma paciente com valor dehemoglobina de 11g/dL.

Por causa da variabilidade entre indivıduos, a analise de um valor especıfico de hemoglobina em mul-heres deve ser feita confrontando-o com a faixa de 12− 16g/dL. E a chamada faixa de referencia.

Resumindo, construiu-se uma faixa de referencia para a taxa de hemoglobina em mulheres, tendo porbase um grande numero de mulheres sadias e estudando a forma da distribuicao dos dados.

O procedimento sugerido acima e geral. Todo exame de laboratorio que produz uma medida comoresultado e analisado confrontando-se seu valor com uma faixa de referencia.

Hipotese de construcao: A construcao de faixas de referencia baseia-se na hipotese de que a pop-ulacao de sadios e a de doentes produzem para a medida de interesse valores que flutuam em torno demedias diferentes, gerando curvas com alguma intersecao. A Figura 6 ilustra a situacao quando as dis-tribuicoes de sadios e doentes sao Gaussianas.

Veremos dois metodos para construcao de faixas de referencia: o metodo da curva de Gauss e ometodo dos percentis.

11.1 Metodo da curva de Gauss

Este metodo pressupoe que a variavel de interesse tem distribuicao Gaussiana (normal). Portanto,antes de utiliza-lo, e necessario verificar se as observacoes dos indivıduos sadios provem de uma distribuicaonormal ou aproximadamente normal.

Uma faixa de referencia usual considera aproximadamente 95% dos indivıduos sadios, cujos limites,conforme vimos sao:

µ± 2σ

De um modo geral, µ e σ sao desconhecidos, mas para a construcao dessas faixas devemos nos basear numgrande numero de indivıduos sadios. Assim, e de se esperar que tanto X quanto S estejam proximos de µ

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 26: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

6

e σ. Consequentemente, as faixas de normalidade sao construıdas a partir das informacoes amostrais, ie:

X ± 2S

De maneira analoga, podem ser obtidas outras faixas de referencia compreendendo outras porcentagensde indivıduos sadios, tais como, 90%, 98%, etc.

Licenciatura em Biologia - EaD, UESC - 2012.1

Page 27: Parte I - Introdu¸c˜ao `a Teoria da Probabilidade 1 ...nead.uesc.br/arquivos/Biologia/mod5bloco1/texto-bioestatistica... · Profa. Camila Nagamine - Bioestat´ıstica Universidade

Profa. Camila Nagamine - Bioestatıstica

11.2 Metodo dos percentis

Um metodo alternativo para obter valores de referencia e percentis.Uma das maneiras de construir uma faixa de referencia e usar o metodo dos percentis como os limites

inferior e superior da faixa. Este nao exige qualquer suposicao sobre a forma da distribuicao. Este metodopode ser utilizado para a situacao em que os dados estao ou nao agrupados.

A abordagem mais comum e construir uma faixa de referencia simetrica, de modo que a proporcao deindivıduos abaixo do limite inferior seja igual a proporcao de indivıduos acima do limite superior da faixa.Assim, se desejamos uma faixa de referencia de 90%, entao 10% dos indivıduos sadios ficarao de fora dafaixa. Destes, 5% terao valores inferiores ao limite inferior e 5% terao valores acima do limite superior.

Isto nos remete a ideia de percentil. O limite inferior da faixa deve ser o valor que deixa 5% abaixodele, ou seja, o percentll de ordem 5. Do mesmo modo, o limite superior da faixa deve ser o valor quedeixa 5% acima dele, ou seja, 95% abaixo dele, isto e, o percentil de ordem 95.

Exemplo 11.2. Teor de gordura fecal em criancas sadias (continuacao)Pode-se obter a faixa de referencia de 95% projetando-se os percentis de ordem 0,025 e 0,975, que sao0,4 g/24hs e 4 g/24hs. Portanto, espera-se que o teor de gordura fecal de 95% das criancas sadias dapopulacao estudada esteja entre esses limıtrofes. Em termos do limite superior de 95%, terıamos um valorde referencia de 3,8 g/24hs.

De modo geral, se desejarmos uma Faixa de Referencia de (100 − α)%, onde α e a porcentagem deindivıduos que ficarao do lado de fora da faixa, entao os limites inferior e superior da faixa serao dados,respectivamente, pelos percentis de ordem α/2 e de ordem (100− α/2).

Faixa de Referencia de (100− α)% = [Pα/2; P(100−α/2)]

Este e o chamado Metodo dos Percentis para o calculo de uma Faixa de Referencia.

Exemplo 11.3.Faixa de Referencia de 95% = [P2.5; P97.5],

pois α = 5, α/2 = 2.5 e 100− α/2 = 97.5

Faixa de Referencia de 99% = [P0.5; P99.5],

pois α = 1, α/2 = 0.5 e 100− α/2 = 99.5

11.3 Consideracoes finais

1. Um indivıduo com resultado fora da faixa de referencia deve ser considerado um paciente que necessitade mais investigacoes.

2. O tamanho da amostra e crucial na obtencao de faixas de referencia representativas. Tal represen-tatividade depende da escolha adequada do metodo de construcao e da variabilidade dos dados.

3. Podem existir indivıduos sadios fora da faixa de referencia e indivıduos doentes cuja medida pertencea faixa de referencia.

Licenciatura em Biologia - EaD, UESC - 2012.1