notas aula 3

Embed Size (px)

Citation preview

UNIVERSIDADEFEDERALDEMINASGERAISINSTITUTODECIENCIASEXATASDEPARTAMENTODEESTATISTICAEstatsticaeProbabilidadeparaEngenhariasClodioPereiradeAlmeida&GregorioSaraviaAtuncarNotasdeaula2010cpa/gsaIntroducaoA ideia para este trabalho surgiu da vontade de se reunir em uma unica fonte, e em portugues, materialque atendesse `as ementas dos cursos basicos de estatstica e probabilidade ministrados pelo Departamentode Estatstica do Instituto de Ciencias Exatas (ICEX) da UFMG para os ciclos basicos dos diversos cursosde engenharia.Esperamos que sirva para despertar nos alunos que o utilizarem a consciencia da importancia destasciencias(EstatsticaeProbabilidade)comoferramentasvaliosasparatodasasareasdoconhecimentohumano, especialmente para as ciencias exatas.As tabelas constantes do apendice foram elaboradas pelos autores.Clodio Almeida e Gregorio AtuncarBelo Horizonte, agosto de 20102Sumario1 Introducao`aAnalisedeDados 61.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2 Organizacao de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.1 Tipos de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.2 Construcao de tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.3 Representa cao graca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3 Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.1 Medidas de posicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3.2 Medidas de variabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.3.3 Propriedades da media, mediana e variancias amostrais . . . . . . . . . . . . . . . 231.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 Probabilidade 262.1 Experimentos aleatorios, espaco amostral e eventos . . . . . . . . . . . . . . . . . . . . . . 262.1.1 Operacoes com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.1.2 Operacoes com mais de dois eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 292.2 Denicao de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.2.1 Denicao frequentista de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . 322.2.2 Axiomas de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.2.3 Regras de adicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.2.4 Denicao classica de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.3 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4 Regras da multiplica cao e probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . . 372.4.1 Regra da multiplica cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.4.2 Regra da probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.5.1 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.5.2 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 VariaveisAleatoriasDiscretas 473.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2 Variaveis aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3 Distribuicoes de probabilidades e funcoes de probabilidade. . . . . . . . . . . . . . . . . . 483.4 Func oes de distribuicao acumuladas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.5 Media e variancia de uma variavel aleatoria discreta . . . . . . . . . . . . . . . . . . . . . 513.6 Distribuicoes discretas mais comuns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.6.1 Distribuicao uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.6.2 Distribuicao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563.6.3 Distribuicao binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563SUMARIO cpa/gsa3.6.4 Distribuicao geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603.6.5 Distribuicoes binomial negativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633.6.6 Distribuicao hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.6.7 Distribuicao de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704 VariaveisAleatoriasContnuas 734.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.2 Probabilidade: distribuicoes e funcao de densidade . . . . . . . . . . . . . . . . . . . . . . 734.3 Func ao de distribuicao acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 764.4 Media e variancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 774.5 Distribuicao uniforme contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 804.6 Distribuicao normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 824.6.1 Calculo de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 844.6.2 Aproxima coes das distribuicoes binomial e de Poisson pela normal . . . . . . . . . 884.7 Distribuicao exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 914.8 Distribuicoes de Erlang e Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.8.1 Distribuicao de Erlang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.8.2 Distribuicao Gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.9 Distribuicao de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954.10Distribuicao Lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 964.11Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 975 Inferencia 995.1 Inferencia estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 995.2 Amostragem aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 995.3 Estimacao de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1015.3.1 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1015.3.1.1 Propriedades de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 1025.3.1.2 Desvio Padrao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055.3.1.3 Erro Quadratico Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055.3.2 Metodos de estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055.3.2.1 Metodo dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055.3.2.2 Metodo de Maxima Verossimilhan ca. . . . . . . . . . . . . . . . . . . . . 1065.3.3 Distribuicoes amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1105.3.3.1 Distribuicao da media amostral - caso normal . . . . . . . . . . . . . . . 1105.3.3.2 Distribuicao da diferenca de medias . . . . . . . . . . . . . . . . . . . . . 1115.3.3.3 Distribuicao Quiquadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 1125.3.3.4 Distribuicaot de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . 1145.3.3.5 DistribuicaoFde Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . 1155.3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165.3.5 Estimacao por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1185.3.5.1 Intervalo de conanca para a media de uma distribuicao normal . . . . . 1195.3.5.2 Intervalo de conanca para o parametrop da distribuicao binomial . . . . 1235.3.5.3 Intervalo de conanca para diferenca de duas medias - Caso normal . . . 1245.3.5.4 Intervalo de conanca para variancia de uma distribuicao normal . . . . . 1275.3.5.5 Intervalo de conanca para razao de variancias - Caso normal . . . . . . 1285.3.5.6 Intervalo de conanca para a media - distribuicao nao normal . . . . . . 1305.4 Teste de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1315.4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1315.4.2 Teste sobre media - caso normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1355.4.2.1 Variancia conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1354SUMARIO cpa/gsa5.4.2.2 Variancia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1395.4.3 Testes sobre a media, caso nao normal . . . . . . . . . . . . . . . . . . . . . . . . . 1415.4.3.1 Um caso particular: testes sobre proporcoes . . . . . . . . . . . . . . . . . 1415.4.4 Teste sobre variancia de uma populacao com distribuicao normal . . . . . . . . . . 1435.4.5 Testes sobre diferenca de medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1455.4.5.1 Variancias conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1455.4.5.2 Variancias desconhecidas mas iguais . . . . . . . . . . . . . . . . . . . . . 1465.4.5.3 Variancias desconhecidas e diferentes . . . . . . . . . . . . . . . . . . . . 1485.4.6 Teste sobre razao de variancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1506 Bibliograa 1547 Apendice 1565Captulo1Introducao`aAnalisedeDados1.1 ConceitosEstatstica: e uma ciencia que desenvolve metodologias para coletar, descrever, organizar, analisar einterpretar dados.E uma ferramenta poderosa para tomada de decisao, resolucao de problemas, planeja-mento de produtos e processos, com in umeras aplicacoes. Daremos aqui um maior enfoque `as aplicacoesna engenharia.Nessas notas abordaremos as seguintes areas:1. EstatsticaDescritiva: eutilizadanaetapainicialdaanaliseparaquepossamosnosfamiliarizarcomosdados, etirarmosconclusoesinformaisediretassobreapopulacaocombasenosdadosobservados. Utilizamos as seguintes tecnicas (para resumir os dados):gracostabelasmedidas2. Probabilidade: Tecnicas que permitem medir incertezas sobre fenomenos aleatorios. Construmosmodelos probabilsticos para descrever o comportamento de objetos aleatorios.3. Inferencia Estatstica: Tecnicas que permitem extrapolar para a populacao, conclusoes obtidas desubconjuntos ou amostras desta populacao. As principais tecnicas usadas saoEstimacao pontualIntervalos de conancaTestes de hipotesesPopula cao:E o conjunto de todos os elementos a serem estudados. Sao exemplos:1. a populacao brasileira;2. a totalidade dos carros produzidos no Brasil;3. uma jazida de minerio de ferro de determinada mina;4. o sangue no corpo de uma pessoa.61.1. CONCEITOS cpa/gsaAmostra:E um subconjunto desta populacao.1. a populacao do Parana;2. carros produzidos pela Fiat;3. um testemunho ou porcao retirada da mina;4. uma ampola de sangue colhida para um exame.Fenomeno aleatorio: Qualquerfenomenocujoresultadonaopodeserpreviamenteantecipado. Porexemplo o resultado de uma partida de futebol. Em contraposicao temos os fenomenosdeterminsticosquesaoregidospelasleisdafsicaequenaopossueminteresseestatstico, jaqueserepetirmosaex-periencia, sob as mesmas condicoes, elas apresentarao sempre o mesmo resultado. Por exemplo o tempode queda livre de um mesmo corpo de uma altura xa.Parametro: Resumo de uma caracterstica obtido a partir de todos os elementos de uma populacao.Estatstica: Resumo da caracterstica de interesse levando-se em conta apenas os elementos da amostra.Veja abaixo um croquis representando simbolicamente os conceitos apresentados ate aqui:PopulaoAmostra (tcnicasdeamostragem)parmetro: caractersticapopulacionalEstatsticadescritiva ModelosProbabilsticosTcnicasdeInfernciaFigura 1.1: Estatstica simbolicamente71.2. ORGANIZAC AODEDADOS cpa/gsa1.2 OrganizacaodedadosVeremosnestasecaocomopodemosclassicardadosealgunsrecursosparasimplicarsuaapre-senta cao e organizacao.1.2.1 TiposdedadosQualitativos: representam uma qualidadedos elementos da populacao, normalmente nao mensuraveisnumericamente. Podem ser:Nominais: o conjunto das possveis respostas nao possui uma ordenacao natural. Ex: Sexo, Raca,Religiao, etc.Ordinais: e possvel ordenar o conjunto das possveis respostas. Ex: Classe Social, Escolaridade dochefe da famlia, Faixa de renda familiar, etc.Quantitativos:representam uma quantidadenumericamente mensuravel dos elementos da populacao.Podem ser:Discretos: em geral sao fruto de uma contagem. O conjunto de possveis respostas e enumeravel.Ex: N umerodelhosnafamlia 0,1,2,..., n umerodepessoaschegandoemumala 0,1,2,...,n umero de caras obtidas em 5 lancamentos de uma moeda 0,1,2,3,4,5 etc.Contnuos: Oconjuntodepossveisrespostas eumintervaloden umerosreais. Ex: peso[0, ),altura [0, ) idade [0, ), etc.1.2.2 ConstrucaodetabelasO conjunto de informacoes disponveis apos tabulacao de questionario ou pesquisa de campo e denomi-nado tabela de dados brutos. Nela sao listados individualmente cada elemento da populacao ou amostra,com os valores de todas as variaveis estudadas.Veja no exemplo da proxima pagina uma pesquisa realizada com alunos de duas turmas de determinadaescola e publicada em [6] (a ttulo de exerccio, classique cada variavel desta tabela por tipo e subtipo,conforme visto na subsecao 1.2.1).81.2. ORGANIZAC AODEDADOS cpa/gsaId TurmaSexo Idade Altura Peso Filh Fuma Toler Exer Cine OpCine TV OpTV1 A F 17 1,60 60,5 2 NO P 0 1 B 16 R2 A F 18 1,69 55,0 1 NO M 0 1 B 7 R3 A M 18 1,85 72,8 2 NO P 5 2 M 15 R4 A M 25 1,85 80,9 2 NO P 5 2 B 20 R5 A F 19 1,58 55,0 1 NO M 2 2 B 5 R6 A M 19 1,76 60,0 3 NO M 2 1 B 2 R7 A F 20 1,60 58,0 1 NO P 3 1 B 7 R8 A F 18 1,64 47,0 1 SIM I 2 2 M 10 R9 A F 18 1,62 57,8 3 NO M 3 3 M 12 R10 A F 17 1,64 58,0 2 NO M 2 2 M 10 R11 A F 18 1,72 70,0 1 SIM I 10 2 B 8 N12 A F 18 1,66 54,0 3 NO M 0 2 B 0 R13 A F 21 1,70 58,0 2 NO M 6 1 M 30 R14 A M 19 1,78 68,5 1 SIM I 5 1 M 2 N15 A F 18 1,65 63,5 1 NO I 4 1 B 10 R16 A F 19 1,63 47,4 3 NO P 0 1 B 18 R17 A F 17 1,82 66,0 1 NO P 3 1 B 10 N18 A M 18 1,80 85,2 2 NO P 3 4 B 10 R19 A F 20 1,60 54,5 1 NO P 3 2 B 5 R20 A F 18 1,68 52,5 3 NO M 7 2 B 14 M21 A F 21 1,70 60,0 2 NO P 8 2 B 5 R22 A F 18 1,65 58,2 1 NO M 0 3 B 5 R23 A F 18 1,57 49,2 1 SIM I 5 4 B 10 R24 A F 20 1,55 48,0 1 SIM I 0 1 M 28 R25 A F 20 1,69 51,6 2 NO P 8 5 M 4 N26 A F 19 1,54 57,0 2 NO I 6 2 B 5 R27 B F 23 1,62 63,0 2 NO M 8 2 M 5 R28 B F 18 1,62 52,0 1 NO P 1 1 M 10 R29 B F 18 1,57 49,0 2 NO P 3 1 B 12 R30 B F 25 1,65 59,0 4 NO M 1 2 M 2 R31 B F 18 1,61 52,0 1 NO P 2 2 M 6 N32 B M 17 1,71 73,0 1 NO P 1 1 B 20 R33 B F 17 1,65 56,0 3 NO M 2 1 B 14 R34 B F 17 1,67 58,0 1 NO M 4 2 B 10 R35 B M 18 1,73 87,0 1 NO M 7 1 B 25 B36 B F 18 1,60 47,0 1 NO P 5 1 M 14 R37 B M 17 1,70 95,0 1 NO P 10 2 M 12 N38 B M 21 1,85 84,0 1 SIM I 6 4 B 10 R39 B F 18 1,70 60,0 1 NO P 5 2 B 12 R40 B M 18 1,73 73,0 1 NO M 4 1 B 2 R41 B F 17 1,70 55,0 1 NO I 5 4 B 10 B42 B F 23 1,45 44,0 2 NO M 2 2 B 25 R43 B M 24 1,76 75,0 2 NO I 7 0 M 14 N44 B F 18 1,68 55,0 1 NO P 5 1 B 8 R45 B F 18 1,55 49,0 1 NO M 0 1 M 10 R46 B F 19 1,70 50,0 7 NO M 0 1 B 8 R47 B F 19 1,55 54,5 2 NO M 4 3 B 3 R48 B F 18 1,60 50,0 1 NO P 2 1 B 5 R49 B M 17 1,80 71,0 1 NO P 7 0 M 14 R50 B M 18 1,83 86,0 1 NO P 7 0 M 20 BDetalhes sobrecampos databelaFilh: nolhos nafamlia- Toler: toleranciaaocigarro(I) ndiferente, (P) incomodapoucoe(M)incomodamuito-Exerc: horasdeatividadefsicaporsemana-Cine: n umerodevezesquevaiaocinemaporsemana- OpCine: opiniaosobrequalidadedassalas(B)regularaboae(M)muitoboa- TV: horasassistindoTVporsemana- OpTV:opiniaosobrequalidadeprogramac aonaTV:(R)ruim,(M)media,(B)boae(N)naosabe.Apesar de conter muita informacao, a tabela de dados brutos nao e pratica para respondermos rapi-damenteaquestoesdeinteresse. Assim, apartirdatabeladedadosbrutosnormalmenteconstrumosuma nova tabela denominada tabela de frequencia.A tabela de frequencia mais simples e aquela que lista os valores observados para determinada variavel,e o n umero de ocorrencias (ou frequencia absoluta) de cada um destes valores.91.2. ORGANIZAC AODEDADOS cpa/gsaEla possui a forma:A freq. obsX1n1X2n2. . . . . .. . . . . .XrnrTotal nDenota-se por ni o n umero de vezes que a resposta Xi apareceu na amostra de tamanho N (frequenciaabsoluta).Utilizando os dados da pesquisa apresentada na tabela da pagina anterior, temos por exemplo paraas variaveis Turmae Sexo:Turma freq. obsA 26B 24Total 50Sexo freq. obsM 13F 37Total 50Para comparacao com outros grupos ou conjuntos de dados e conveniente acrescentarmos uma colunadefrequenciarelativadenidaporfi=nin(frequenciaobservadadivididapelototal deobservacoes).Temosassimospercentuaisemcadaclasse. Alemdissopodeserinteressanteainclusaodafrequenciaacumulada:para dados ordenados a frequencia acumulada ate a classe Xi e a soma de todas as frequenciasobservadas ate ela inclusive. Da mesma forma, a frequencia relativa acumulada ate a classeXi e a somade todas as frequencias relativas ate a da classei. A tabela completa para a variavel idade da pesquisa eapresentada a seguir:Tabela 1.1: Frequencia da variavel idadeIdade freq. obs freq. acum. freq. relat. fr. rel. acum.17 9 9 0,18 0,1818 22 31 0,44 0,6219 7 38 0,14 0,7620 4 42 0,08 0,8421 3 45 0,06 0,9022 0 45 0 0,9023 2 47 0,04 0,9424 1 48 0,02 0,9625 2 50 0,04 1Total 50 1Para representarmos variaveis contnuas, como elas podem assumir qualquer valor real em um certointervalo, caria inviavel criarmos tabelas de frequencia como as anteriores. Se tomarmos a variavel peso,mesmocomoarredondamentodeumacasadecimal apresentadonatabela, teramosquaseomesmon umero de itens da tabela de dados brutos. Assim a alternativa e criarmos classes ou faixas de valores.Para tanto siga o seguinte roteiro:1. Ordene os valores do menor para o maior e identique o maximo e o mnimo observado.2. Calcule a amplitude total fazendoAT= max min.101.2. ORGANIZAC AODEDADOS cpa/gsa3. Escolhaon umerokdeclassesedenah=ATk. Normalmentesaousadasentre5e8classes.A literatura universal usa o valorkcomo o inteiro mais proxuimo do valor dado pela formula deSturges(k=1 + 3,3log n), masesseeapenasumvalorreferencial. Naoentraremosemmaisdetalhes sobre a escolha do n umero de classes. O leitor interessado nesse assunto pode consultar,por exemplo [1] e referencias contidas naquele trabalho. O valorh sera chamado de amplitude declasse.4. Calculeasfrequenciasabsolutascontandoon umerodeobserva coesemcadaclasse, chameestevalor deni,i = 1, . . . k.5. Calcule entao:(a) frequencias relativas -fi =nin(b) frequencias acumuladas -faci =

ij=1nj(c) frequencias relativas acumuladas -Fi =

ij=1fjExemplo:Represente atraves de uma tabela de frequencia a variavel peso da pesquisa apresentada na tabela dapagina 9.Solucao:1. Apos ordenacao vemosmax = 95kg emin = 44kg.2. AT= 95 44 = 51kg3. O n umero de observa coes e n = 50. De acordo com a formula de Sturges, k = 1+3,3log(50) = 6,61.Usaremosentao7classes. Comk=7, ovalordehseradadoporh=517=7,28.... Usaremosh = 7,3.4. Montamos a tabela, usando a conven cao de classes abertas `a esquerda e fechadas `a direita:Tabela 1.2: Distribuicao de frequencia variavel pesoPeso nifacifiFi44 51,3 10 10 0,20 0,2051,3 58,6 19 29 0,38 0,5858,6 65,9 7 36 0,14 0,7265,9 73,2 7 43 0,14 0,8673,2 80,5 1 44 0,02 0,8880,5 87,8 5 49 0,10 0,9887,8 95,1 1 100 0,02 1,00Total 50 1Eventualmente mesmo dados discretos podem ser agrupados para serem representados em tabelas dedistribuicaodefrequencia.Outrarepresenta caointeressanteeochamadoDiagramaderamoefolhas, indicadoparavariaveisque possuam valores com pelo menos dois dgitos. Para construir o diagrama de ramo e folhas, dividimos111.2. ORGANIZAC AODEDADOS cpa/gsacada valor da variavel em estudo em duas partes: um ramo, consistindo em um ou mais dgitos iniciais,e uma folha, com os dgitos restantes.O exemplo de um diagrama de ramo e folhas para as alturas dos alunos da pesquisa:Tabela 1.3: Diagrama Ramo e Folhas variavel alturaRamo Folha Frequencia14 5 115 8 7 5 4 7 5 5 716 0 9 0 4 2 4 6 5 3 0 8 5 9 2 2 5 1 5 7 0 8 0 2217 6 2 0 8 0 1 3 0 0 3 0 6 0 1318 5 5 2 0 5 0 3 7Eventualmentepodeserinteressanteaumentaron umeroderamosparafacilitaravisualizacaodosdados. No exemplo acima podemos dividir cada um dos ramos em 2 outros com as indicacoes por exemplode 16B (Baixo) com as folhas 0, 1, 2, 3 e 4 e 16A (Alto) com as folhas 5, 6, 7, 8 e 9. Ficaria entao:Tabela 1.4: Ramo e Folhas variavel altura - mais ramosRamo Folha Frequencia14A 5 115B 4 115A 8 7 5 7 5 5 616B 0 0 4 2 4 3 0 2 2 1 0 0 1216A 9 6 5 8 5 9 5 5 7 8 1017B 2 0 0 1 3 0 0 3 0 0 1017A 6 8 6 318B 2 0 0 3 418A 5 5 5 3121.2. ORGANIZAC AODEDADOS cpa/gsa1.2.3 RepresentacaogracaA representacao dos dados em forma graca e importante ferramenta de analise e apresentacao de re-sultados em qualquer analise estatstica. Apresentamos a seguir alguns tipos principais de representacaograca.Diagrama circular, disco ou pizza - Tipo de graco muito utilizado para representa cao de variaveisqualitativas. Como exemplo veja a variavel OpTV da tabela da pagina 9:R78%B6%N14%M2%Figura 1.2: Graco de disco da variavel OpTVGracodebarras - Utiliza o plano cartesiano com os valores da variavel no eixo das abcissas e asfrequenciasouporcentagensnoeixodasordenadas. Paracadavalordavariaveldesenha-seumabarracomalturacorrespondendo`asuafrequenciaouporcentagem. Estetipodegracoseadaptamelhor`asvariaveisquantitativasdiscretasouqualitativasordinais. Arepresentacaodasidadesdosalunosdapesquisa seria:051015202517 18 19 20 21 22 23 24 25IdadeFrequnciaFigura 1.3: Graco de barras da variavel idade131.2. ORGANIZAC AODEDADOS cpa/gsaHistograma-Arepresentacaogracadastabelasdedistribuicaodefrequencia echamadaHisto-grama. Represente no eixo das abcissas a escala de medidas, desenhando os limites das classes. No eixovertical represente a frequencia absoluta (ou relativa) de cada classe. O histograma da tabela 1.2 (peso)e:05101520PesoFrequncia44 58,6 65,9 73,2 80,5 87,8 95,1 51,3Figura 1.4: Histograma da variavel pesoDurante a passagem dos dados da tabela de dados brutos ou do diagrama de ramos e folhas para atabela distribuicao de frequencia ou para histogramas, perde-se alguma informacao sobre nossos dados,mas esta perda e plenamente compensada pelos ganhos de concisao e facilidade de interpreta cao.Polgonodefrequencia - Este graco e obtido unindo-se com segmentos de reta os pontos mediosdapartesuperior decadabarranohistograma. Ospontosmediosdapartesuperior dasbarrasdaprimeira e ultima classes devem ser ligados respectivamentes ao pontos de coordenadas (LI1h/2, 0) e(LSk + h/2, 0), ondeLI1 e o limite inferior da primeira classe,LSko limite superior da ultima classe eh a amplitude da classe.44 51,3 58,6 65,9 73,2 80,5 87,8 95,15101520FrequnciaPesoFigura 1.5: Polgono de frequencia - Peso141.2. ORGANIZAC AODEDADOS cpa/gsaGracodefrequenciaacumulada - Uma variacao do Histograma e o graco de frequencia acu-mulada. Neste graco a altura de cada barra e o n umero total de observacoes que e menor que o limitesuperior de cada classe. O graco de frequencia acumulada para mesma variavel (peso) da pesquisa caentao:Peso44 58,6 65,9 73,2 80,5 87,8 95,1 51,301020304050Frequncia

acumuladaFigura 1.6: Distribuicao de frequencia acumulada para variavel pesoOgiva - Um outro graco, chamado de ogiva, e construdo a partir do graco de frequencia acumu-lada, e denido pela poligonal formada por segmentos de reta unindo o ponto inicial inferior da primeirabarra e os pontos nais de cada classe. O nome dessse graco advem da sua aparencia, conforme pode-severicar na gura abaixo:Peso44 58,6 65,9 73,2 80,5 87,8 95,1 51,301020304050Frequncia

acumuladaFigura 1.7: Graco de ogiva - peso151.3. MEDIDAS cpa/gsa1.3 MedidasMedidas sao resumos ou sumarios da informacao trazida pela amostra em um unico n umero. Podemser classicadas em:Posi cao(outendenciacentral): sao medidas de localizacao do meio ou do centro de uma distribuicao.Ex: media, mediana, moda.Variabilidade: medemoespalhamentoouvariabilidadedosdados. Ex: amplitudetotal, variancia,desvio padrao.Associacao: medem relacoes entre variaveis. Ex: coeciente de correlacao.Assimetriaecurtose: medidas relacionadas comalteracoes naformadadistribuicao, atraves dasrelacoesentresuasmedidasdetendenciacentral(moda, mediaemediana)-assimetriaouoseuachatamento - curtose.1.3.1 MedidasdeposicaoTendem a representar os elementos comuns da populacao.Media:eumvalorquerepresentaocentrodemassaoupontodeequilbriodadistribuicao(histo-grama).E calculado por:X =

ni=1Xin=X1 +X2 + +Xnn(dados brutos).Paramelhorcompreensaodoconceitodemediacomocentrodemassa, imagineumaamostracomosseguintesvalores 8, 9, 5, 5, 4, 3, 6, 4. Fa camosumDiagramadepontos, queeumgraco util paravisualizacaodepequenasamostras. ParatantosimplesmenteplotamosumpontoparacadavalordaamostrasobreumsegmentodeRquecontenhatodososvalores. Sehouverrepeticoesplotamosumponto sobre o outro. Note que a media pode ser pensada como um centro de massa porque se cada pontotivesse a mesma massa, digamos 1 kg, o triangulo representando a media equilibraria exatamente estespesos.2 4 6 8 10Mdia= 5,5Se os dados estiverem agrupados em tabela de distribuicao de frequencia como no exemplo abaixo,Variavel freq. absolutaX1n1X2n2. . . . . .. . . . . .Xrnrfazemos:X =n1X1 +n2X2 + +nrXrn=

ri=1niXin.161.3. MEDIDAS cpa/gsaSe conhecemos a frequencia relativa, o calculo da media passa a ser:X =n1nX1 +n2nX2 + +nrnXr = fr1X1 +fr2X2 + +frrXr =r

i=1fiXi.Exemplo: Para calcularmos a media dos dados abaixo:X freq. absoluta freq. relativa1 3 0,32 4 0,43 2 0,25 1 0,1X =1 + 1 + 1 + 2 + 2 + 2 + 2 + 3 + 3 + 510=2210= 2,2 (pelos dados brutos)X =1 3 + 2 4 + 3 2 + 5 110= 2,2 (pela frequencia absoluta)X = 1 0,3 + 2 0,4 + 3 0,2 + 5 0,1 = 2,2 (pela frequencia relativa)Dados agrupados em classe: Para calcularmos a media nestes casos devemos inicialmente calcularopontomediodecadaclasse, denotando-opor PMi. Apartir distocalculamos amediausandoafrequencia absoluta ou a frequencia relativa com uma das seguintes expressoes:X =

ni=1PMininX =n

i=1PMifiVamos calcular opesomediodos alunos denossoexemploapartir databeladedistribuicaodefrequencias (tabela 1.2), incluindo o ponto medio de cada classe;Tabela 1.5: Peso - inclusao ponto medio da classePeso PMifreq. abs. freq. rel. freq. acum.44,0 51,3 47,65 10 0,20 0,2051,3 58,6 54,95 19 0,38 0,5858,6 65,9 62,25 7 0,14 0,7265,9 73,2 69,55 7 0,14 0,8673,2 80,5 76,85 1 0,02 0,8880,5 87,8 84,15 5 0,10 0,9887,8 95,1 91,45 1 0,02 1,00Total 50 1Assim:X =47,65 10 + 54,95 19 + 62,25 7 + 69,55 7 + 76,85 1 + 84,15 5 + 91,45 150=3032,250= 60,64ou:X = 47,650,20+54,950,38+62,250,14+69,550,14+76,850,02+84,150,10+91,450,02 = 60,64171.3. MEDIDAS cpa/gsaObserva coes: a media e uma medida afetada por valores extremos. Veja no exemplo inicial em que amedia dos dados e 2,2, se retirarmos o valor 5 a media cai para 1,89.Sepensarmosemcalcularovalormediodeumavariavel paratodaapopulacao, teremosamediapopulacional, normalmente designada pela letra grega (mi).Mediana: e o valor que divide o conjunto de dados ao meio, de tal forma que pelo menos 50% dos va-lores observados sao menores ou iguais `a mediana e pelo menos 50% sao maiores ou iguais a ela. Notacao:md ouMd. A mediana tambem caracteriza o elemento comum da amostra.Exemplo: 1, 1, 1, 3, 3, 5, 3, 3, 2, 2. Primeiro passo e ordenar os dados:1 1 1 2 2 [ 3 3 3 3 5Osdoiscandidatosamdsaoo2eo3. entaotomamosopontomedioentreelescomoamediana:md =2+32= 2,5.Se tivessemos:1 1 1 3 3 4 4 5 5Nesse caso,md = 3Observa cao: Sempre que houver um n umero mpar de observa coes a mediana sera a observacao cen-tral na amostra ordenada da menor para a maior, e sempre que houver um n umero par de observacoes amediana sera o ponto medio entre as duas observa coes centrais.Dadosagrupadosemclasse: Nesse caso os dados ja estao ordenados e os procedimentos sao:1. Localize a classe mediana, que sera a primeira classe com frequencia relativa acumulada maior ouigual a 0,5. Observe:L - limite superior da classe medianal - limite inferior da classe mediana2. Calcule a frequencia relativa da classe mediana. Chame-a defmd3. Determine a frequencia relativa acumuladaate a classe anterior `a classe mediana, oufamd4. Calcule a diferenca 0,5 famd. Esta diferenca e a frequencia relativa da classe (l md)l L50%md5. O valor da mediana e obtido resolvendo-se a seguinte equacao:md l0,5 famd=L lfmdmd = l + (L l)_0,5 famdfmd_181.3. MEDIDAS cpa/gsaAssim para calcularmos a mediana dos pesos na tabela 1.5, seguimos o passo a passo:1. Classe mediana: 51,3 58,6 L = 58,6 l = 51,32. fmd = 0,383. famd = 0,204. 0,5 famd = 0,305. md = 51,3 + (58,6 51,3)(0,5 0,20)0,38= 51,3 + 7,3 3038= 57,06kgObserva cao: a mediana nao e afetada por valores extremos.Percentil: O percentil de ordem de um conjunto de dados e um valorP%tal que pelo menos%dos valores sao inferiores ou iguais a ele e pelo menos (100 )% dos valores sao maiores ou iguais a ele.Observa coes:1. A mediana e o percentil de ordem 50.2. Os percentis de ordem 25, 50 e 75 sao chamados respectivamente de Quartil 1, Quartil 2 e Quartil3 (ou primeiro, segundo e terceiro quartis).Q125% 75%Q250% 50%Q325% 75%Q325%Q2Q125% 25% 25%Deformasimilaraocalculodamediana, paraobtermosopercentil Papartirdeumatabeladefrequencia, seguimos os passos descritos abaixo:1. Localizar a classe a qual pertence o percentilP.2. Encontrar a frequencia relativa da classe onde estaP. Denote-a porfP.3. Encontrar a frequencia acumulada ate a classe anterior `a classe do percentil P. Denote-a por faP.4. Calcular a diferenca faP.5. Fazendo a regra de tres:Ll fPPl faPP = l + (Ll) faPfP191.3. MEDIDAS cpa/gsaExemplo:Calcule o terceiro quartil da variavel peso da pesquisa, a partir da tabela 1.5.Solucao:1. Classe 65,9 73,22. fP = 0,143. faP = 0,724. faP = 0,75 0,72 = 0,035. Q3 = P75 = 65,9 + 7,3 0,030,14= 67,46kgModa:Eovalormaisfrequentenaamostra. Notacao: moouMo. Amodarepresentatambemovalor mais comum.Exemplo:No conjunto de observacoes 1, 1, 3, 3, 5, 3, 3, 2, a moda emo = 3.Em um conjunto de dados pode haver mais de uma moda:Exemplo:Para o conjunto 1, 1, 1, 1, 3, 3, 3, 3, 5, mo1 = 1 e mo2 = 3. Neste caso se diz que o conjunto e bimodal.Se houver mais de duas modas diz-se que o conjunto e multimodal. Por outro lado se nenhum valorse repete o conjunto nao tem moda.Ponto medio: O valor que esta a meio caminho entre o menor e o maior valor de uma amostra:ponto medio =Maximo + Mnimo2Esta medida e menos usada, mas serve para ilustrar mais uma das diversas maneiras de se representar atendencia central de uma amostra.1.3.2 MedidasdevariabilidadeMedem o espalhamento ou dispersao dos dados. Complementam importantes informacoes escondidaspelas medidas de tendencia central.Amplitude total: Aamplitudetotaldeumaamostra edenidacomoadiferencaentreomaioreomenor valor da amostra.AT= Max MinExemplo: a amplitude total da variavel altura da amostra dos alunos eAT= 1,85 1,45 = 0,40 m(40 cm).201.3. MEDIDAS cpa/gsaVariancia amostral (S2): Avarianciaeumamedidadedispersaoquelevaemcontatodasasob-servac oes feitas. Ela mede a dispersao em torno da media amostral x.Considere as observa coes: X1, X2, X3, . . . , Xn:Observacao desvios [desvios[ (desvios)2X1(X1X) [X1X[ (X1X)2X2(X2X) [X2X[ (X2X)2. . . . . . . . . . . .. . . . . . . . . . . .Xn(XnX) [XnX[ (XnX)2Temos:n

i=1(XiX) =n

i=1Xin

i=1X =n

i=1Xin X =n

i=1Xin

ni=1Xin=n

i=1Xin

i=1Xi = 0Assim dene-se a variancia amostral como:S2=

ni=1(XiX)2(n 1)Exemplo: Tomedoisconjuntosaseguir, amboscom x=5(Notetambemqueambospossuemamesma amplitude total e a mesma mediana):conj. 1 = 3, 4, 5, 6, 7 conj. 2 = 3, 5, 5, 7S21=(3 5)2+ (4 5)2+ (5 5)2+ (6 5)2+ (7 5)2(n 1)=4 + 1 + 0 + 1 + 44= 2,5S22=(3 5)2+ (5 5)2+ (5 5)2+ (7 5)2(n 1)=4 + 0 + 0 + 43= 2,667Observa cao: Se tivessemos calculando a variancia de uma populacao de tamanhoNteriamos:Variancia populacional = 2=

Ni=1(Xi)2N.Alguns autores usam o denominadorn na denicao da variancia amostral. Avaliaremos as vantagense desvantagens de cada denominador quando falarmos de Inferencia (captulo 5).Inconvenientes da Variancia:1. As unidades de medida da variancia amostral sao o quadrado da unidade original da variavel (m2paraaltura, kg2parapeso, etc.). Paraevitar-seestedesconfortoestabeleceu-seodesviopadraodenido por:S = S2=

ni=1(XiX)2(n 1),que mostra a variabilidade medida na unidade original da variavel analisada.211.3. MEDIDAS cpa/gsa2. Avariancianaopermitecompararavariabilidadededadosmedidosemdiferentesunidadesdemedidaoumedidosnamesmaunidademascommediasdiferentes. Aqui asolucaofoi acriacaodeumamedidachamadacoecientedevariac aoquenaosofreinuencianemdamedianemdaunidade de medida. O coeciente de variacao e denido comoCVamostral =SX(coef. varia cao amostral= desvio padrao amostral dividido pela media amostral)CVpopulacional =(coef. variacao populacional= desvio padrao dividido pela media populacional)Exemplo: Em qual grupo ha mais varia cao em torno da media:Variavel media varianciaaltura 1,70m 0,0025m2peso 60kg 2,25kg2CVa =0,00251,70= 2,9% CVp =2,2560= 2,5%A variavel altura apresenta variabilidade maior que a variavel peso.Dadosagrupadosemclasses Para calcular a variancia de dados agrupados em classes, considereo ponto medio de cada classe, denotado porPMie faca;S2=

ki=1(PMiX)2ni(n 1),ondeni e a frequencia observada para a i-esima classe ek o n umero de classes.Se conhecemos apenas as frequencias relativas das classe, a variancia amostral poderia ser aproximadapor:S2=k

i=1(PMiX)2fi_fi =nine a frequencia relativa da classei_.Exemplo: Determine a variabilidade em torno da media para o peso dos alunos da tabela da pagina9, lembrando que ja calculamos o peso medio (60,64kg):Tabela 1.6: Peso - Calculo da varianciaPMifreq. rel. (PMiX)2(PMiX)2fi47,65 0,20 (47,65 60,64)2= 168,740 33,74854,95 0,38 (54,95 60,64)2= 032,376 12,30362,25 0,14 (62,25 60,64)2= 002,592 0,36369,55 0,14 (69,55 60,64)2= 079,388 11,11476,85 0,02 (76,85 60,64)2= 262,764 5,25584,15 0,10 (84,15 60,64)2= 552,720 55,27291,45 0,02 (91,45 60,64)2= 949,256 18,985Total 137,041Assim vemos queS2= 137,041kg2e por conseguinteS = s2= 137,041 = 11,706kg.E o coeciente de variacao eCV=SX=11,70660,64= 19,30 %.221.4. EXERCICIOS cpa/gsaObserva cao: A variancia tambem e afetada por valores extremos.Desvio medio: Medida de variabilidade em torno da media assim denida:DM=

ni=1[XiX[npara dados nao agrupados,DM=n

i=1(PMiX)fipara dados agrupados em tabela de frequencia.1.3.3 Propriedadesdamedia,medianaevarianciasamostraisConsidere a amostraX1,X2, . . . ,Xn. Nas secoes anteriores, vimos queX,S2Xemedxrepresentamrespectivamenteamediaamostral, varianciaamostral emedianaamostral; edenimosaformuladecalculo de cada uma dessas medidas.Suponha agora que tenhamos de utilizar alguma relacao linear das observa coes dessa amostra. Comoexemplo, imagine queXseja o comprimento de parafusos em milmetros e que o peso em gramas dessesparafusos possa ser calculado porY= aX +b, ondea eb sao duas constantes qualquer. Pode-se provarque:Y= a X +bmedy = amedx +bS2Y= a2S2X1.4 ExercciosUsando a tabela da pagina 25, com dados de 49 alunos de uma turma de engenharia civil do ICEX,responda as questoes a seguir:1. Dena o tipo e subtipo de cada uma das 8 variaveis da tabela.2. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumu-lada para a variavel idade.3. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumu-lada para a variavel peso. (Calcule o n umero de classes pela formula de Sturges).4. ConstruaumdiagramadeRamoeFolhasparaavariavelaltura. Utilizeinicialmente5ramosedepois, para melhor visualizacao, construa outro diagrama a partir do primeiro com 10 ramos.5. Esboce um diagrama circular (ou pizza) para a variavel provedor.6. Faca um graco de barras com a variavel ano de incio do curso.231.4. EXERCICIOS cpa/gsa7. Com auxlio da tabela do exerccio 3, esboce um histograma com a frequencia relativa da variavelpeso.8. Calcule usando os dados brutos a media da variavel idade.9. Usando a tabela construda no exerccio 3 encontre a media da variavel peso.10. Usando o histograma abaixo, ache a mediana e o terceiro quartil (percentil 75%) da variavel altura.1,97 1,91 1,85 1,79 1,73 1,67 1,61 1,55302520151050AlturaFrequncia0,0410,0820,1220,2650,3060,1020,082Histograma da altura11. Ache a(s) moda(s) da variavel bairro.12. Usando a tabela construda no exerccio 3 encontre a variancia da variavel peso.13. Usando a tabela construda no exerccio 2 ache o desvio padrao da variavel idade.241.4. EXERCICIOS cpa/gsaNoAnoinciocursoIdade(Anos)Peso Altura Naturalidade Estado Bairro Provedordeinternet1 2008 19 70 1,83BeloHorizonte MG Funcionrios hotmail.com2 2008 19 73 1,83BeloHorizonte MG Prado hotmail.com3 2008 19 75 1,71BeloHorizonte MG Anchieta hotmail.com4 2008 19 85 1,83BeloHorizonte MG NovaCachoeirinha hotmail.com5 2008 20 43 1,59BeloHorizonte MG Betnia hotmail.com6 2008 20 51 1,69Ipatinga MG Funcionrios hotmail.com7 2008 20 59 1,70BeloHorizonte MG Serra hotmail.com8 2008 20 61 1,65BeloHorizonte MG OuroPreto hotmail.com9 2008 20 65 1,72Varginha MG Liberdade hotmail.com10 2008 20 71 1,72BeloHorizonte MG Santa Tereza gmail.com11 2008 20 71 1,76BeloHorizonte MG CoraoEucarstico hotmail.com12 2008 20 73 1,75BomDespacho MG Prado gmail.com13 2008 20 76 1,71Viosa MG Sion hotmail.com14 2008 20 77 1,95BeloHorizonte MG Santo Antnio hotmail.com15 2008 20 90 1,80BeloHorizonte MG NovaFloresta hotmail.com16 2008 20 99 1,70Patrocnio MG OuroPreto hotmail.com17 2008 21 58 1,72BeloHorizonte MG DonaClara yahoo.com.br18 2008 21 59 1,64BeloHorizonte MG Floresta yahoo.com.br19 2008 21 64 1,60BeloHorizonte MG Barreiro hotmail.com20 2008 21 64 1,71BeloHorizonte MG Serra hotmail.com21 2008 21 64 1,74BeloHorizonte MG Jardim Amrica gmail.com22 2008 21 68 1,75Salvador BA OuroPreto hotmail.com23 2007 21 70 1,70BeloHorizonte MG Savassi hotmail.com24 2007 21 73 1,75BeloHorizonte MG Buritis hotmail.com25 2007 21 75 1,85BeloHorizonte MG FernoDias hotmail.com26 2008 21 77 1,72BeloHorizonte MG Belvedere hotmail.com27 2008 21 77 1,85Formiga MG Lourdes hotmail.com28 2008 21 82 1,85BeloHorizonte MG CarlosPrates yahoo.com.br29 2006 22 63 1,73Itana MG Lourdes gmail.com30 2008 22 68 1,85BeloHorizonte MG PadreEustquio yahii.com.br31 2008 22 75 1,81BeloHorizonte MG Luxemburgo hotmail.com32 2008 22 100 1,91BeloHorizonte MG Caiara hotmail.com33 2006 23 64 1,64BeloHorizonte MG Planalto ig.com.br34 2007 23 65 1,71Jaguarau MG NovaFloresta hotmail.com35 2007 23 72 1,73MontesClaros MG Floresta yahoo.com.br36 2008 23 80 1,75BeloHorizonte MG SoJooBatista hotmail.com37 2007 23 80 1,78SantaBrbara MG SantaIns gmail.com38 2008 24 57 1,58SeteLagoas MG Liberdade hotmail.com39 2006 24 75 1,75Itabira MG Santo Antnio yahoo.com.br40 2008 25 57 1,69BeloHorizonte MG DonaClara hotmail.com41 2008 25 70 1,70BeloHorizonte MG CoraoEucarstico yahoo.com.br42 2008 25 70 1,72SeteLagoas MG OuroPreto yahoo.com.br43 2007 25 75 1,74BeloHorizonte MG Estoril gmail.com44 2007 25 80 1,79BeloHorizonte MG PadreEustquio yahoo.com.br45 2006 25 87 1,76BeloHorizonte MG Cento hotmail.com46 2009 26 48 1,62BeloHorizonte MG Santo Andr hotmail.com47 2006 26 95 1,77SantaMaria RS Sobradinho hotmail.com48 2006 27 65 1,65BeloHorizonte MG SantaCruz hotmail.com49 2007 29 67 1,57Timteo MG Castelo yahoo.com.br25Captulo2Probabilidade2.1 Experimentosaleatorios,espacoamostraleeventosExperimento Aleatorio - A ideia do que seja um experimento aleatorio e bastante intuitiva. Imagi-nemos dois times disputando a nal de um campeonato de futebol. Se o jogo termina empatado, pode-sejogar uma prorrogacao (tempo adicional),e no caso do empate persistir,pode-se decidir o campeao deacordo com o historico de cada time,disputa de penaltes,etc. Persistindo o empate,pode-se decidir ocampeonato lancando uma moeda. Perante esses fatos, surge a pergunta:e justo denir o campeao dessaforma?Milhares e ate milhoes de torcedores aceitam. Porque?Pensemos em outro exemplo de experimento aleatorio. Suponha que um engenheiro observa a quali-dade de um item (defeituoso ou nao defeituoso). Se a linha de producao estiver calibrada, espera-se queuma proporcao muito pequena de itens apresentem defeito (1 em cada 100 ou em cada 1.000, por exemplo).Osdoisexemplosprecedentesfornecemaideiadeumexperimentoaleatorio. Nocasodamoeda,assumindoqueelasejahonesta, naotemosargumentoparaacreditarqueumdosresultados(caraoucoroa) tenha maior chance de acontecer. No caso dos itens produzidos por uma linha de producao, natu-ralmente acreditamos que a proporcao de defeituosos seja muito pequena. Mas em ambos os casos, antesde realizar o experimento, nao sabemos qual sera o resultado. Embora nao saibamos qual sera o resultadona realizacao de um experimento, podemos ter certeza que no caso da moeda acontecera cara(C) ou coroa(K),enocasodalinhadeproducao,sabemosqueumitemobservadoresultaradefeituoso(D)ounaodefeituoso (N). Alem do mais se realizarmos um n umero n grande de cada experimento, espera-se que osn umeros de caras e coroas sejam proximos. Ja no caso dos itens observados, espera-se que a proporcaode defeituosos seja pequena.Nao daremos uma denicao formal de experimento aleatorio,mas os dois exemplos precedentes saoilustrativos. Ao nos referirmos a experimento aleatorio, usaremos a notacao. Exemplos:1 : lancar uma moeda;2 : observar a qualidade de um item de uma linha de producao3 : observar a taxa de inacao no mes de marco de 2010;4medir a altura de um aluno;5observar o tempo de vida de um equipamento;6contar o n umero de alunos presentes na sala de aula.262.1. EXPERIMENTOSALEATORIOS,ESPAC OAMOSTRALEEVENTOS cpa/gsaNo experimento1, ao lancarmos uma moeda, temos certeza que acontecera cara (C) ou coroa (K).No experimento2 temos certeza que o item observado sera defeituoso (D) ou nao defeituoso (N). isto e,em cada caso sabemos qual e o conjunto de todos os resultados do experimento aleatorio. Chamamos aesse conjunto de espacoamostral e denotaremos por .1 = C, K sera o espaco amostral associado ao experimento1;2 = D, N sera o espaco amostral associado ao experimento2.analogamente temos,3 = r : r > 0;4 = X R : X> 0;5 = t R : t > 0;6 = 0, 1, 2, . . . N. Neste casoNsera o n umero de alunos matriculados ou que frequentam as aulas.Oespacoamostral ()foi denidocomooconjuntodetodososresultadospossveisdeumexpe-rimentoaleatorio. QuerdizerentaoquerepresentaoConjuntoUniversoqueconhecemosdaTeoriaElementar de Conjuntos. Dentro desse conjunto podemos denir subconjuntos e a cada desses subcon-juntos chamaremos de evento.No experimento5, podemos estar interessados em que o tempo de vida do equipamento atenda aotempo de garantia. Se o tempo e em anos, podemos estar interessados no evento em quet seja maior doque 1.Usaremosasprimeirasletrasdoalfabetoemmai usculaspararepresentareventos: A, B, C, . . . .A = t R :t> 1 representa o evento de que o equipamento atende ao tempo de garantia no experi-mento52.1.1 Operac oescomeventosUniaodeeventos(AB) e o evento que ocorre se A ou B ou ambos eventos ocorrerem. O diagrama deVenn utilizado para relacoes entre conjuntos pode ser utilizado para relacoes entre eventos. Imagineque o espaco amostral seja representado pelos pontos no retangulo abaixo e que os eventosA eBsao os subconjuntos nos pontos das regioes indicadasWA BFigura 2.1: Espaco amostral e eventosA eBWA BFigura 2.2: A BComauxliodosoperadoreslogicos( oue e)podemosdescreveraoperacaouniaodeeventos ilustrada na gura 2.2 como:A B = : A B272.1. EXPERIMENTOSALEATORIOS,ESPAC OAMOSTRALEEVENTOS cpa/gsaExemplo: Experimento: lancamento de um dado.EventoA ocorre face par.EventoB ocorre face inferior a 4._A B = 1, 2, 3, 4, 6Interse caodeeventos(A B) e o evento que ocorre seA eBocorrem simultaneamente.WA BFigura 2.3: A BPodemos escrever:A B = : A BNo mesmo exemplo anterior temos:EventoA ocorre face par.EventoB ocorre face inferior a 4._A B = 2Observa cao 1: SeA B = , dizemos queA eBsao disjuntos ou mutuamente exclusivos.WABFigura 2.4: A eBdisjuntosObserva cao 2: As operacoes uniao e intersecao de eventos sao comutativas. Isto e:A B = B A e A B = B AEventoscomplementares(NotacaoAC)OeventoACocorreseoeventoAnaoocorre.Eformadopor todos os pontos de que nao estao emA. AssimAC= : / AWACAFigura 2.5: ACeA sao complementaresA eACsao eventos complementares se e somente seAC A = eAC A = 282.1. EXPERIMENTOSALEATORIOS,ESPAC OAMOSTRALEEVENTOS cpa/gsaExemplo: no lancamento de um dado, seA ocorrer face par, entaoB ocorrer face mpar, eevento complementar deA.Diferencadeeventos(AB) e o evento em queA ocorre eBnao ocorre. Escrevemos:AB = : A / BWA BFigura 2.6: A -BNote queAB = A BC. Deixamos a prova como exerccio.DiferencasimetricaE aquele evento em queA ouBocorrem, mas nao ambos simultaneamente. Re-presentamos por:AB = (AB) (B A)WA BFigura 2.7: AB2.1.2 Operac oescommaisdedoiseventosPropriedades DistributivasPD1: A (B C) = (A B) (A C)PD2: A (B C) = (A B) (A C)As guras abaixo ilustram as propriedades distributivas:WABCFigura 2.8: A (B C)WABCFigura 2.9: A (B C)292.1. EXPERIMENTOSALEATORIOS,ESPAC OAMOSTRALEEVENTOS cpa/gsaLeis de Morgan:LM1: (A B)C= AC BCLM2: (A B)C= AC BCWA BFigura 2.10: (A B)CWA BFigura 2.11: (A B)CProvaremos PD1 e LM1 para ilustracao e deixaremos a prova dos outros dois resultados para o leitor.Antes da prova, recordaremos as propriedades dos operadores logicos relacionando proposicoes.Pensemos no exemplo seguinte: pela manha o aluno vai para a escola e `a tarde vai para a bibliotecaouparaocinema. Essaproposicaocomposta eequivalente`aseguinte: Pelamanhaoalunovaiparaaescola e `a tarde vai para a biblioteca ou pela manha o aluno vai para a escola e `a tarde vai ao cinema.Temos, no paragrafo precedente, um exemplo da propriedade distributiva dos operadores logicos. Deforma geral, sejamp,q er tres proposicoes simples. Denotemos porp q ep q as proposicoes (p eq) e(p ouq) respectivamente.Pode-se provar que:p (q r) (p q) (p r)Omitimosaprovadessapropriedade,quepodeserfeitaatravesdaconstrucaodatabeladevaloresde verdade das duas proposicoes compostasp (q r) e (p q) (p r).No exemplo do aluno, as proposicoes seriam:p: O aluno vai para a escola pela manha;q: o aluno vai para a biblioteca `a tarde;r: o aluno vai ao cinema `a tarde.PodemosprovaraPD1usandoapropriedadedistributivadosoperadoreslogicos. Umaformadeprovar igualdade de dois conjuntos e escolher um elemento arbitario de um deles e provar que pertenceao outro.Seja entao A (B C). Denap : A,q : Ber : C. Entao: A (B C) ( A) ( (B C)) ( A) ( B C) p (q r) (p q) (p r) ( A B) ( A C) ( A B) ( A C) (A B) (A C)302.1. EXPERIMENTOSALEATORIOS,ESPAC OAMOSTRALEEVENTOS cpa/gsaParaprovar LM1, apresentaremos outrapropriedadedos operadores logicos. Sejampe q duasproposicoes. A negacao de pq e equivalente `a negacao de uma delas. Isto e, se Np representa a negacaodep, entao:N(p q) = (Np) (Nq)Aplicando essa propriedade e fazendop : A eq : A podemos escrever: (A B)C / (A B) (/ A) (/ B) ( AC) ( BC) AC BCAspropriedadesdistributivaseasleisdeMorganpodemseestenderparaauniaoouinterse caodemais de dois eventos. SejamB1,B2, . . . ,Bnuma colecao de eventos e sejaA um outro evento:PD1: A_n

i=1Bi_=n

i=1(A Bi)PD2: A_n

i=1Bi_=n

i=1(A Bi)LM1:_n

i=1Bi_C=n

i=1BCiLM2:_n

i=1Bi_C=n

i=1BCiWAB1B2B3Figura 2.12: A_3

i=1Bi_312.2. DEFINIC AODEPROBABILIDADE cpa/gsa2.2 Denicaodeprobabilidade2.2.1 DenicaofrequentistadeprobabilidadeComo atribuirmos probabilidades a elementos do espaco amostral? A primeira ideia foi baseada emcaractersticas teoricas do fenomeno ou experimento e na observacao das frequencias de sua ocorrencia.Da surgiu:Denicao1. Consideremosnrepeticoesindependentesdeumexperimentoaleatorio. SejaAumevento qualquer (A ). DenaPn(A) =nAn(ondenA e o n umero de vezes em que ocorre o evento A)e denaP(A) =limnPn(A)P(A) assim denida e chamada de probabilidadefrequencial deAExemplos:1. Num lancamento de um dado, a probabilidade de ocorrencia da facei e dada porPn(i) =# ocorrencia da facei# total de lc. do dado=n{i}n.Quando o n umero de lancamentos e muito grande, Pn(i) se estabiliza e voce toma esse valor comoa probabilidade de ocorrencia da facei.2. Suponhaquetemosumalinhadeproducaoemgrandeescala. Retiramosnitensdestalinhadeproducao, e a cada retirada contamos o n umero de itens defeituosos (A= item defeituoso)n No defeituosos Pn(A)10 0 0/10 = 050 2 2/50 = 0,04100 6 6/100 = 0,06500 29 29/500 = 0,0581000 51 51/1000 = 0,0515000 249 249/5000 = 0,050Observandoatabelaacimavemosque P10(A)=0, P50(A)=0,04, P100(A)=0,06, eassimpordiante.`Amedidaqueaumentamosovalorden, espera-seque Pn(A)seaproximedaproporcaode defeituosos. Pela denicao frequentista de probabilidade vemos que a probabilidade de um itemdefeituoso nesta linha de producao converge para 0,05.322.2. DEFINIC AODEPROBABILIDADE cpa/gsa2.2.2 AxiomasdeprobabilidadeApartirdadenicaofrequentistadeprobabilidade, apresentadanasubsecaoanterior, eimediatoobservar que:1. Pn() =nn= 12. Desde que 0 na n para todon, entao 0 Pn(A) 13. SeA B = , entao Pn(A B) = Pn(A) +Pn(B)Se em (1), (2) e (3) tomarmos o limite quandon , teremos:A1)P() = 1A2)0 P(A) 1A3)P(A B) = P(A) +P(B) seA B = (A1),(A2)e(A3)saochamdadosAxiomasdeprobabilidade. Baseadanessesaxiomas econstrudatoda a Teoria de Probabilidade. (O leitor interessado em aprofundar estudos pode consultar, por exem-plo, [5] ou [8]).A seguir apresentaremos alguns resultados basicos que serao usados no decorrer da disciplina:Proposicao1.P_n

i=1Ai_=n

i=1P(Ai), seAi Aj = parai ,= j : i,j = 1, . . . ,nProposicao2.P() = 0Proposicao3.P(AC) = 1 P(A)Proposicao4.SeA B, entao P(A) P(B)Provas:1. Faremos a prova para n = 3. O caso geral decorre do Princpio da Inducao Matematica. Se A1,A2eA3sao tais queA1 A2 = A1 A3 = A2 A3 = entaoP(A1 A2 A3) = P(A1 (A2 A3))= P(A1) +P(A2 A3)= P(A1) +P(A2) +P(A3)Observe queA1 (A2 A3) = (A1 A2) (A1 A3) = 2. e sao mutuamente exclusivos, e = . Assim pelo terceiro axioma P() = P() + P().Mas pelo primeiro axioma P() = 1, logo P() = 0.3. ComoACeAsaocomplementarestemos A AC=eA AC= . Entaopeloaxioma3,P(A) +P(AC) = P() e pelo axioma 1, P(A) +P(AC) = 1, logo P(AC) = 1 P(A).4. Podemos escreverBcomoB = A (AC B). Os eventosA e (AC B) sao disjuntos, entao peloaxioma 3 podemos escrever P(B) = P(A) +P(AC B). Como, pelo axioma 2, P(AC B) 0 logoP(B) P(A).332.2. DEFINIC AODEPROBABILIDADE cpa/gsa2.2.3 RegrasdeadicaoUniaodedoiseventosnaodisjuntos: A probabilidade da uniao de dois eventos nao disjuntos edada por:Proposicao5.P(A B) = P(A) +P(B) P(A B)Podemos provar de maneira simples:WA BFigura 2.13: A B CA B = A (B AC)P(A B) = P(A) +P(B AC) xmas,B = (B A) (B AC)assim P(B) = P(B A) +P(B AC)ou P(B AC) = P(B) P(B A) ylevandoy emx temos P(AB) = P(A)+P(B)P(AB).Tresoumaiseventos: Expandindooresultadodaproposicao5, podemosdesenvolverformulaspara uniao de quantos eventos quisermos. Mas quanto maior o n umero de eventos mais complexas camestas formulas. Vamos registrar apenas para 3 eventos:P(A B C) = P(A) +P(B) +P(C) P(A B) P(A C) P(B C) +P(A B C)Deixamos como exerccio a prova dessa proposicao (aplique duas vezes a proposicao 5).Exemplo:Todos os socios de um clube praticam pelo menos 1 esporte. Sabe-se que 60% deles praticam futebol,55% praticam voleibol e 50% praticam peteca. Alem disso 30% praticam volei e peteca,30% futebol evolei e 25% futebol e peteca. Se voce escolher aleatoriamente um socio deste clube, qual a probabilidadede que ele pratique os tres esportes?Solucao:SechamarmososeventosA=osociopraticafutebol, B=osociopraticavoleibol eC=osociopratica peteca, a probabilidade solicitada e P(A B C). Podemos escrever:P(A B C) = P(A) +P(B) +P(C) P(A B) P(A C) P(B C) +P(A B C) = 1e da0,60 + 0,55 + 0,50 0,30 0,30 0,25 +P(A B C) = 1 P(A B C) = 0,22.2.4 DenicaoclassicadeprobabilidadeDenicao2. Seja um experimento aleatorio com espaco amostral nito = 1, 2, . . . ,n. Se temosevidencias de que todos os resultados tem a mesma chance de acontecer, dene-seP(i) =1ni = 1, 2, . . . , n.342.3. PROBABILIDADECONDICIONAL cpa/gsaParaA , dene-seP(A) =#Anonde #A =cardinal deA =n umero de elementos deA.Neste caso dizemos que os resultadosisao equiprovaveis.2.3 ProbabilidadeCondicionalDenicao 3. Se B e um evento tal que P(B) > 0, a probabilidade condicional de um evento A dadoo eventoB, denotada por P(A[B) eP(A[B) = P(A B)P(B)A probabilidade condicional deA dadoBrevela a incerteza que se tem sobre o eventoA supondo aocorrenciadoeventoB. Podemosinterpreta-lacomoachancerelativadeArestritaaofatodequeBocorreu.Exemplos:1. Uma classe de estatstica teve a seguinte distribuicao das notas nais:Homens MulheresReprovados 4 6Aprovados 8 14Um aluno e sorteado na sala. Qual e a probabilidade de(a) Se e mulher, ter sido aprovada.(b) Ser mulher dado que foi aprovado.(c) Ser mulher e ter sido aprovado.Soluc oes:Dena os eventosA : ser aprovado eM: ser mulher, temos(a) P(A[M) =P(AM)P(M)=14/3220/32= 0,7(b) P(M[A) =P(MA)P(A)=14/3222/32= 0,64(c) P(A M) = 14/32 = 0,4375352.3. PROBABILIDADECONDICIONAL cpa/gsa2. As informacoes abaixo referem-se aos candidatos que prestaram vestibular na UFMG em 2004:ClasseSocialCandidato foiaprovado TotalNao SimA 2.974 393 3.367B 17.394 1.725 19.119C 17.618 1.040 18.658D 8.034 265 8.299E 2.482 64 2.546Total 48.502 3.487 51.989Um aluno e sorteado ao acaso. Qual e a probabilidade de:(a) ter sido aprovado(b) ser da classe A(c) ser da classe A e ter sido aprovado(d) ser da classe A ou ter sido aprovado(e) ser da classe A uma vez que foi aprovado(f) ter sido aprovado, uma vez que e da classe ASoluc oes:ChamandooseventosA:ocandidatotersidoaprovadoeB:ocandidatopertencer`aclasseA,temos(a) P(A) =3.48751.989= 0,067(b) P(B) =3.36751.989= 0,0647(c) P(A B) =39351.989= 0,0075(d) P(A B) = P(A) +P(B) P(A B) = 0,067 + 0,0647 0,0075 0,1242(e) P(B[A) =P(AB)P(A)=0,00750,067= 0,1119(f) P(A[B) =P(BA)P(B)=0,00750,0647= 0,1159362.4. REGRASDAMULTIPLICAC AOEPROBABILIDADETOTAL cpa/gsa2.4 Regrasdamultiplicacaoeprobabilidadetotal2.4.1 RegradamultiplicacaoDa mesma forma como foi denida P(A[B), se P(A) > 0 podemos denirP(B[A) = P(B A)P(A)Temos entao que:P(A B) = P(A[B)P(B) = P(B[A)P(A)Esta expressao e conhecida como regradamultiplicacao.Exemplo:Acredita-se que na populacao de Belo Horizonte 20% de seus habitantes sofrem algum tipo de alergia,sendo classicados como alergicos para ns de sa ude p ublica. Sendo alergico, a probabilidade de ter reacaoacertoantibiotico ede0,5. Paraosnaoalergicosestaprobabilidade edeapenas0,05. Escolhendo-seuma pessoa ao acaso da populacao de BH, qual a probabilidade de que ela:(a) - Seja do grupo dos alergicos e tenha alergia ao ingerir o antibiotico?(b) - Seja do grupo dos nao alergicos e nao tenha alergia ao ingerir o antibiotico?Solucao:Se zermosA : ser do grupo dos alergicos eB : ter reacao, temos:(a) P(A B) = P(B[A)P(A) = 0,5 0,2 = 0,1(b) P(AC BC) = P(BC[AC)P(AC) = 0,95 0,8 = 0,762.4.2 RegradaprobabilidadetotalAregradamultiplica cao e utilparadeterminarmosaprobabilidadedeumeventoquedependadeoutros eventos.Suponha que voce tenha duas linhas de producao de parafusos, 1 e 2, e que a primeira linha produza1.000 parafusos por hora com uma taxa de defeitos de 0,02 e a segunda produza 500 parafusos por hora,mas com uma taxa de defeitos 0,008. Escolhendo-se aleatoriamente um parafuso de um lote da producaode uma hora das duas linhas, qual a probabilidade que ele seja defeituoso?Claramente a resposta dependede qual linha saiu aquele parafuso.Se chamarmos A parafuso saiu da linha 1, B parafuso saiu da linha 2 e C parafuso e defeituosopodemos armar queC = (C A) (C B)e como (C A) e (C B) sao disjuntos podemos escrever queP(C) = P(C A) +P(C B) = P(C[A)P(A) +P(C[B)P(B) = 0,02 2/3 + 0,008 1/3 = 0,016372.4. REGRASDAMULTIPLICAC AOEPROBABILIDADETOTAL cpa/gsaDe modo mais geral, para quaisquer 2 eventosA eBpodemos escrever:P(B) = P(B A) +P(B AC) = P(B[A)P(A) +P(B[AC)P(AC)Para generalizarmos o conceito da probabilidade total, denimos:Denicao4. Dizemos que os eventosA1,A2, . . . ,Anformam uma particao do espaco amostral se1. Ai Aj = i ,= j2.n

i=1Ai = 3. P(Ai) > 0 i = 1, 2, . . . , nFigura 2.14: Exemplo de uma particao do espaco amostral WA1 A2A3A4A6A5A7Podemos assim enunciar o TeoremadaProbabilidadeTotal:Teorema1. Seja A1,A2, . . . ,Anumaparticaodoespacoamostral esejaBumeventoqualquer,entaoP(B) =n

i=1P(Ai)P(B[Ai)Figura 2.15: Teorema da probabilidade totalWA1A2A3A4A6A5A7BProva: Desde que os eventosA1,A2, . . . ,Anformam uma particao de , podemos escrever:B = B (Ai) = ni=1(B Ai) com [(B Ai) (B Aj)] = parai ,= j.Entao pelo axioma 3:P(B) =n

i=1P(B Ai).382.5. TEOREMADEBAYES cpa/gsaSe aplicarmos a regra do produto a cada termo da soma, temos:P(B) =n

i=1P(Ai)P(B[Ai).Exemplo:Uma montadora de veculos recebe diariamente em contrato de fornecimento just in time, 20% dedado componente do fabricanteA, 30% do fabricanteB e 50% do fabricanteC. Inspecoes anteriores nasfabricas destes fornecedoresmostraram queestes componentes produzidos poreles apresentavam taxasde defeitos de 0,7%, 0,4% e 0,2% respectivamente. Cada veculo e equipado com um componente esco-lhido aleatoriamente entre os recebidos na vespera. Durante a vistoria nal, o inspetor de qualidade damontadora esta inspecionando este componente. Qual a probabilidade dele apresentar defeito?Solucao:Se chamarmosXo evento de que o componente inspecionado apresenta defeito, eA, BeCrespecti-vamente o evento que o componente inspecionado foi fabricado respectivamente pelo fornecedorA, B ouC, podemos escrever:P(X) = P(A)P(X[A) +P(B)P(X[B) +P(C)P(X[C)= 0,2 0,007 + 0,3 0,004 + 0,5 0,002= 0,0014 + 0,0012 + 0,0010 = 0,00362.5 TeoremadeBayes2.5.1 IndependenciaEm alguns casos, a probabilidade condicional, P(B[A), pode ser igual a P(B). Neste caso especial, ainformacao da ocorrencia ou nao deA nao altera a probabilidade da ocorrencia deB. Assim podemosdenir:Denicao5. DoiseventosAeBsaoindependentessequalquerumadasseguintesarmacoesforverdadeira:1. P(A[B) = P(A)2. P(B[A) = P(B)3. P(A B) = P(A)P(B)E muito simples mostrar a equivalencia destas tres condicoes. Mostremos por exemplo a equivalenciade (1) e (3): Suponha que (1) e verdadeira. Entao P(AB) = P(B)P(A[B) = P(B)P(A). Reciprocamentese (3) e verdadeira, entaoP(A[B) = P(A B)P(B)= P(A).Convidamos o leitor para demonstrar as outras equivalencias.392.5. TEOREMADEBAYES cpa/gsaExemplos:1. Usandoosdadosdovestibularde2004conclui-sequeoseventosocandidatoeaprovadoeocandidato e da classe Anao sao independentes pois:P(A) = 0,067 P(A[B) = 0,11592. Uma empresa produz pecas em duas maquinas (1 e 2). Estas maquinas podem apresentar desajustescomprobabilidadesrespectivamente0,05e0,10. Suponhaqueasmaquinastrabalhemdeformaindependente. Noinciododiaumtesteerealizadoecasoamaquinaestejaforadoajusteamaquina para de operar e vai para manutencao. Para que se cumpra o nvel mnimo de producaodiaria e necessario que pelo menos uma maquina esteja funcionando. Qual a probabilidade de quea empresa cumpra a producao do dia?Soluc ao: Se zermos O1: maquina 1 esta operando e O2 : maquina 2 esta operando, a probabilidadede que a producao seja cumprida e;P(O1ouO2) = 1 P[(O1ouO2)C] = 1 P(OC1eOC2 ) = 1 P(OC1 OC2 )Mas pela independenciaP(OC1 OC2 ) = P(OC1 )P(OC2 ) = 0,05 0,10 = 0,005E assim a probabilidade que a producao do dia seja cumprida e 1 0,005 = 0,995.Quando consideramos tres ou mais eventos, podemos estender a denicao de independencia:Denicao6. Os eventosA1,A2, . . . ,Ansao independentes, se e somente se para qualquer subconjuntodestes eventosAi1, Ai2, . . . , AikP(Ai1 Ai2 Aik) = P(Ai1) P(Ai2)P(Aik)Umapropriedadeimportante: SejamA1, A2, . . . , Aneventos independentes e sejaBum eventoformadoporoperacoesentreoseventosAi1, . . . , AireCumoutroeventoformadoporoperacaoentrealgunsdoseventosrestantes. EntaoBeCsaoeventosindependentes. Essa eachamadapropriedadehereditaria da independencia.Exemplo:SejamA1, A2, . . . , A10eventos independentes, entaoa- A1 (A5 A8) eA3 (A4 AC7 ) sao independentes.b- A1 A2 A3e (A4 A5) (A6 A7) sao independentes.Exemplo:O sistema mostrado a seguir so funciona se houver um caminho de componentes (numeradosde 1 a 6) funcionando do pontoA para o pontoB:0,90,90,90,950,950,99 A124356B402.5. TEOREMADEBAYES cpa/gsaA probabilidade de que cada componente funcione esta indicada. Assumindo que cada componentefunciona de forma independente, calcule a probabilidade que o sistema opere.Solucao:Dena:Ai : componentei funciona,i = 1, . . . , 6;B1 : subsistema formado pelos componentes 1, 2 e 3 funciona;B2 : subsistema formado pelos componentes 4 e 5 funciona;B3 : subsistema formado pelo componente 6 funciona;A : sistema funciona.Assim podemos escrever:A = B1 B2 B3x= (A1 A2 A3) (A4 A5) (A6)Sabemos que P(A1 A2 A3) e dada por:[P(A1) +P(A2) +P(A3) P(A1 A2) P(A1 A3) P(A2 A3) +P(A1 A2 A3)]e que como os componentes funcionam de forma independente e o mesmo que[P(A1) +P(A2) +P(A3) P(A1)P(A2) P(A1)P(A3) P(A2)P(A3) +P(A1)P(A2)P(A3)]assim:P(B1) = 0,9 + 0,9 + 0,9 0,81 0,81 0,81 + 0,729 = 0,999De forma equivalente:P(A4 A5) = P(B2) = [P(A4) +P(A5) P(A4)P(A5)] = 0,95 + 0,95 0,9025 = 0,9975Retornando ax e usando a independencia podemos escrever:P(A) = P(B1) P(B2) P(B3) = 0,999 0,9975 0,99 0,9872.5.2 TeoremadeBayesPartindo da denicao de probabilidade condicional e usando a comutatividade da interse cao podemosescrever:P(A B) = P(A[B)P(B) = P(B A) = P(B[A)P(A)e agora, usando o segundo e quarto termos da igualdade vem um resultado util que nos permite escrevera probabilidade deA dadoBem termos da probabilidade deBdadoA:P(A[B) = P(B[A)P(A)P(B)Partindo desta expressao, e escrevendo o denominador usando a regra da probabilidade total, obtemoso Teorema de Bayes, que tem este nome em homenagem ao Reverendo Thomas Bayes, matematico inglesda primeira metade do seculoXV I:412.5. TEOREMADEBAYES cpa/gsaTeorema 2 (Teorema de Bayes). SeA1,A2, . . . ,An for uma particao de eB qualquer evento, entaoP(A1[B) =P(B[A1)P(A1)P(B[A1)P(A1) +P(B[A2)P(A2) + +P(B[An)P(An)Exemplos:1. Suponhaqueumfabricantedesorvetesrecebe20%detodooleitequeconsomedafazendaF1,30% da fazendaF2 e o restante daF3. A vigilancia sanitaria inspecionou as fazendas de surpresae observou que 20% dos galoes de leite produzidos na fazendaF1 estavam adulterados por adicaode agua, o mesmo ocorrendo com 5% e 2% dos galoes respectivamente produzidos nas fazendasF2eF3. Naind ustriadesorveteosgaloesdeleitesaoarmazenadossemidenticacaodasfazendasprodutoras. Um galao e sorteado ao acaso na ind ustria. Calcule:(a) a probabilidade de que o galao esteja adulterado(b) a probabilidade do galao estando adulterado ter vindo da fazendaF1Soluc ao:(a) SejaA o leite esta adulterado eFi o leite veio da fazendaFiF1F2F3AFigura 2.16: 3 FornecedoresA = (A F1) (A F2) (A F3)P(A) = P[(A F1) (A F2) (A F3)]P(A) = P(A F1) +P(A F2) +P(A F3)P(A) = P(A[F1)P(F1)+P(A[F2)P(F2)+P(A[F3)P(F3)Assim:P(A) = 0,2 0,2 + 0,05 0,3 + 0,02 0,5 = 0,065(b) Pelo teorema de Bayes temosP(F1[A) =P(A[F1)P(F1)P(A[F1)P(F1) +P(A[F2)P(F2) +P(A[F3)P(F3)=0,2 0,20,065= 0,61542. Das pacientes da Clnica de Ginecologia com idade acima de 40 anos, 60% sao ou foram casadas e40% sao solteiras. Sendo solteira, a probabilidade de ter tido um dist urbio hormonal no ultimo anoe de 10%, enquanto para as demais esta probabilidade aumenta para 30%. Pergunta-se:(a) Qual a probabilidade de uma paciente escolhida ao acaso ter tido um dist urbio hormonal no ultimo ano?(b) Se a paciente escolhida tiver tido um dist urbio, qual a probabilidade dela ser solteira?(c) Se escolhemos duas pacientes ao acaso ecom reposicao,quala probabilidade de pelo menosuma ter o dist urbio?422.6. EXERCICIOS cpa/gsaSoluc ao:Sejam os eventosS paciente e solteira eH paciente teve dist urbio hormonal no ultimo ano.(a) P(H) = P(H[S)P(S) +P(H[SC)P(SC) = 0,10 0,40 + 0,3 0,6 = 0,22(b) P(S[H) =P(H|S)P(S)P(H)=0,100,40,22= 0,1878(c) SejaHio evento de que a i-esima paciente tenha tido dist urbio hormonal. Da:P(H1 H2) =P(H1) +P(H2) P(H1 H2)=P(H1) +P(H2) P(H2[H1)P(H1)=0,22 + 0,22 0,222= 0,39162.6 Exerccios1. Prove queA (B C) = (A B) (A C).2. Tres eventos sao mostrados no diagrama de Venn na Figura 2.17 a seguir:WABCFigura 2.17: Diagrama de Venn exerccio 2Reproduza a gura e sombreie a regiao que corresponde a cada um dos seguintes eventos:(a) Ac(b) (A B) (A Bc)(c) (A B) C(d) (B C)c(e) (A B)c C432.6. EXERCICIOS cpa/gsa3. Imagine o experimento aleatorio do lancamento de um dado honesto. O espaco amostral e 1, 2, 3, 4, 5, 6.Considere os eventosP: resultado e par, eQ : resultado e maior ou igual a 4. Calcule:(a) P(P)(b) P(Q)(c) P(PC)(d) P(P Q)(e) P(P Q)4. Se P(A) = 0,3 , P(B) = 0,2 eP(A B) = 0,1 determine:(a) P(AC)(b) P(A B)(c) P(AC B)(d) P(A BC)(e) P[(A B)c](f) P(AC B)5. Discosdepolicarbonatoplasticoprovenientesdeumfornecedorsaoanalisadoscomrelacao`are-sistencia a arranhoes e a choques. Os resultados da analise de 100 discos estao resumidos a seguir:resistenciaachoquealta baixaresistenciaa alta 80 9arranhao baixa 6 5Faca A denotar o evento em que um disco tenha alta resistencia a choque eB denotar o evento emque um disco tenha alta resistencia a arranhao. Determine as seguintes probabilidades:(a) P(A)(b) P(B)(c) P(A[B)(d) P(B[A)6. Uma empresa de embalagens trabalha com maquinas de corte de papelao. A aspereza nas bordas dasembalagens aumenta `a medida que as laminas da ferramenta de corte vao sendo gastas. Somente1%dasembalagensfabricadascomlaminasnovasexibemrugosidade. Essepercentual aumentapara 3% se as laminas estiverem com meia-vida e para 5% no caso de laminas gastas. Se 25% daslaminas forem novas,60% mediamente aadas e 15% forem gastas,que proporcao de embalagensproduzidas pela empresa apresentarao aspereza nas bordas?442.6. EXERCICIOS cpa/gsa7. Uma placa de aco contem 20 parafusos. Considere que cinco parafusos nao estejam apertados ate olimite apropriado. Quatro parafusos sao selecionados ao acaso, sem reposicao, para vericacao dotorque.(a) Qual e a probabilidade de que todos os quatros parafusos selecionados estejam apertados ateo limite apropriado?(b) Qual eaprobabilidadedequenomnimoumdos parafusos selecionados naotenhasidoapertado ate o limite apropriado?8. Ocircuitoaseguiroperase, esomentese, houverumcaminhodeequipamentosfuncionaisdaesquerda para a direita. Considere que os equipamentos falhem independentemente, sendo a pro-babilidade de falha de cada equipamento mostrada na Figura 2.18. Qual e a probabilidade de queo circuito opere?Figura 2.18: Circuito do Exerccio 89. Emumaoperacaodeenchimentoautomatico,aprobabilidadedeenchimentoincorretoquandooprocesso e operado a baixa velocidade e 0,001. Quando o processo e operado a alta velocidade, aprobabilidade de enchimento incorreto e 0,01. Suponha que 30% dos reservatorios sejam enchidosquando o processo e operado a alta velocidade e o restante sejam enchidos a baixa velocidade.(a) Qual e a probabilidade de um reservatorio incorretamente enchido?(b) Se um reservatorio incorretamente enchido for encontrado, qual e a probabilidade de que eletenha sido enchido durante a operacao em alta velocidade?10. Considere o circuito dado na Figura 2.19. Assuma que os equipamentos falhem independentemente,sendo que a probabilidade de falha de cada equipamento esta indicada. Qual e a probabilidade deque o circuito opere?Figura 2.19: Circuito do Exerccio 10452.6. EXERCICIOS cpa/gsa11. Sabe-se que 6%, 8% e 10% dos parafusos produzidos pelas empresas A, B e C respectivamente, saodefeituosos. Uma empresa de montagens compra 40% dos parafusos que utiliza da empresa A, 40%da empresaBe o restante da empresaC.(a) Da compra realizada em um mes, um parafuso e inspecionado. Qual a probabilidade de queele seja defeituosa?(b) Se o parafuso inspecionado apresentar defeito, qual a probabilidade de que tenha sido produzidopela empresaB?12. A ultima pesquisa de amostra de domiclios realizada em um bairro da periferia de Belo Horizonteconstatouque80%dasresidenciaspossuiamtelevisao, 60%possuiamradioe35%computador.Alem disso 20% dos domiclios pesquisados possuiam TV e computador, 15% computador e radio, e10% possuiam os tres itens da pesquisa (TV, radio e computador). Qual o percentual de domiclioscom TV e radio?13. A U.F.M.G. recebe giz de tres fabricantes diferentes, digamosA, BeC, numa proporcao respec-tivamentede60%,30%e10%. Testesanterioresdemonstramqueopercentualdequebradessesfabricantes ede2%(fabricanteA), 5%(fabricanteB)e7%(fabricanteC). Umprofessorretiraaleatoriamente de uma caixa um giz. Responda:(a) Qual a probabilidade do giz retirado estar quebrado?(b) Se o giz estiver quebrado, qual a probabilidade dele ter sido fabricado pelo fornecedorB?(c) Se o giz estiver inteiro, qual a probabilidade de ter sido fabricado pelo fornecedorC?14. A variavel aleatoriaXassume os valores relacionados na tabela a seguir, com as correspondentesprobabilidades.X 0 1 2 3 4 5 6f(x) 0,04 0,18 0,31 0,28 0,14 0,04 0,01(a) Calcule a funcao de probabilidade acumuladaF(X), descreva-a detalhadamente e esboce seugraco.(b) Calcule a P(X 3) e P(2 X< 5).(c) Qual a media e a variancia dessa V.A.?46Captulo3VariaveisAleatoriasDiscretas3.1 IntroducaoNem todo espaco amostral e constitudo por n umeros. O objetivo de uma variavel aleatoria e quan-ticar cada elemento do espaco amostral. Assim denimos:Denicao7. Uma variavelaleatoria e uma funcao que associa um n umero real a cada resultado doespaco amostral de um experimento aleatorioSuponhaoexperimentosimples deinspecionar dois itens emumalinhadeproducao. Oespacoamostral desta experiencia e = DD, DN, ND, NN onde D representa item defeituoso e Nitem naodefeituoso. Uma variavel aleatoria pode ser n umero de itens defeituosos observados.N ND DN DN D012UUma variavel aleatoria e denotada por um letra mai uscula (por exemplo X) e os valores que ela podeassumir comoxi. No exemplo anterior os valores que a varavel aleatoria n umero de itens defeituososobservadospode assumir saox1 = 0,x2 = 1 ex3 = 2.Desde queXe uma funcao,o conjunto dos valores possveis de uma variavel aleatoriaXe referidocomo contradomniodeXe sera denotado por RX, com RX R. A partir deste conceito divimos asvariaveis aleatorias em:Denicao8. Umavariavel aleatoriadiscretaeumavariavel aleatoriacomcontradomnionitoouinnito enumeravel.Uma variavel aleatoria contnua e aquela cujo contradomnio e um intervalo ou um subconjunto dosn umeros reais.473.2. VARIAVEISALEATORIASDISCRETAS cpa/gsaExemplosdevariaveisaleatoriascontnuas: peso, altura, correnteeletrica, pressao, temperatura,tempo.Exemplos de variaveis aleatorias discretas: n umero de pecas defeituosas em um lote, bitstransmiti-dos que foram recebidos com erros, pessoas doentes em uma amostra da populacao.3.2 VariaveisaleatoriasdiscretasAlguns exemplos de variaveis aleatorias discretas:1. Um sistema de comunicacao por voz de uma empresa possui 48 linhas externas. A cada intervalodetempoosistema esupervisionadoeregistra-seon umerodelinhasemuso. SezermosX=n umero de linhas em uso. Os valores possveis deX = 0, 1, 2, . . . , 48.2. Noprocessodefabricacaodesemicondutores, ofabricantedevesepreocuparcomon umerodepartculascontaminantes. SedenirmosavariavelaleatoriaY =n umerodepartculascontami-nantes em uma pastilha, os valores possveis deY= 0, 1, 2, . . . 3. Na construcao de um predio as fundacoes de estacas cravadas devem atingir 15 metros de profundi-dade. A cada 5 metros o operador registra se houve alteracao no ritmo de perfuracao previamenteestabelecido. Cada alteracao registrada representa um custo adicional de 50 UPCs (unidade padraode construcao) no custo total da fundacao. Como se comporta a variavelZ = custo da fundacao?4. OestabelecimentodepolticasdeabastecimentodoCentroComunitarioSa udePediatricadede-terminado bairro e estabelecido conforme o n umero de criancas da regiao. O ultimo censo indicouque20%dasfamliasnaotemlhos, 30%possuem1lho, 35%possuem2lhoseasdemaissedividem igualmente entre 3, 4 ou 5 lhos. Denimos a variavelN= n umero de lhos.3.3 DistribuicoesdeprobabilidadesefuncoesdeprobabilidadeFrequentementeestamosinteressadosnaprobabilidadecomqueumavariavel aleatoriaassumeumvalor em particular.FuncaodeprobabilidadeUm modelo probabilstico consiste em atribuir a cada valor da v.a. Xasuaprobabilidadedeocorrencia. Afuncaoqueatribui acadavalorxideXasuaprobabilidadeechamadadefuncaodeprobabilidadeoufuncaodemassa. Assim, seXeumavariavelaleatoriaassumindo os valoresx1, x2, x3, . . . , xNa funcao de probabilidadefX() associada aXe:fX(xi) = P(X = xi) i = 1, 2, 3, . . . , NNoexemplodavariavelaleatorian umerodepecascomdefeitoobservadas,supondoquealinhadeproducaoeemgrandeescalaeproduz6%deitensdefeituosos, afuncaodeprobabilidadedeXestarepresentada na tabela abaixo:x1x2x3X 0 1 2pi0,8836 0,1128 0,0036483.3. DISTRIBUICOESDEPROBABILIDADESEFUNCOESDEPROBABILIDADE cpa/gsaPodemos escrever tambem:fX(x) =___0,8836 sex = 0,0,1128 sex = 1,0,0036 sex = 2.Sao propriedades da funcao de probabilidade:fX(xi) 0 xien

i=1fX(xi) = 1Variaveisaleatoriassaotaoimportantesquealgumasvezesignoramosoespacoamostral original eso trabalhamos coma distribuicao de probabilidadesda v.a. Assimsendo no exemploda inspecao dosdoisitens, resumimosoexperimentonosvalorespossveisde X(0, 1, 2)enaonoespacoamostral = DD,DN,ND,NN.Exemplo:Com os dados do ultimo censo a assistente social do centro de sa ude constatou que na regiao 20% dasfamlias nao tem lhos,30% possuem 1 lho,35% possuem 2 lhos e as demais se dividem igualmenteentre 3, 4 ou 5 lhos. Suponha que uma famlia seja escolhida aleatoriamente e dena a v.a. Ncomo on umero de lhos desta famlia.(a) Construa a funcao de probabilidade paraNe (b) Desenhe o seu gracoSolucao:Se N e o n umero de lhos na famlia temos que os valores possveis de N sao: 0, 1, 2, 3, 4, 5. Supondoque todas as famlias tem chances iguais de serem sorteadas:(a) Funcao de probabilidadefN(0) = P(N= 0) = 0,20 fN(1) = P(N= 1) = 0,30 fN(2) = P(N= 2) = 0,35fN(3) = fN(4) = fN(5) =1 [fN(0) +fN(1) +fN(2)]3=1 0,20 0,30 0,353= 0,05(b) Graco:1n2 3 4 5fN(n)00,050,200,300,35493.4. FUNCOESDEDISTRIBUIC AOACUMULADAS cpa/gsa3.4 Fun c oesdedistribuicaoacumuladas`As vezes necessitamos de expressar probabilidades acumuladas. No exemplo anterior poderamos estarinteressados na probabilidade da famlia sorteada ter 2 ou menos lhos.Este valor seria:P(N 2) = P(N= 0) +P(N= 1) +P(N= 2) = 0,20 + 0,30 + 0,35 = 0,85Vemosassimqueousodeprobabilidadescumulativaseummetodoalternativodedescreverumavariavel aleatoria. Assim denimos:Denicao 9. A funcao de distribuicao acumulada de uma variavel aleatoria discreta X avaliada emx, denotada porF(x), eF(x) = P(X x) =

xixf(xi)O graco abaixo representa a funcao de distribuicao cumulativa da variavel aleatoriaNdo exemploanterior:1n2 3 4 5FN(n)00,200,500,851,00Noteque, mesmoseavariavel aleatoriasopodeassumirvaloresinteiros, afuncaodedistribuicaocumulativa podera ser denida em valores nao inteiros.Na gura anterior:F(2,5) = P(N 2,5) = P(N 2) = 0,85Propriedadesdafuncaodedistribuicaocumulativa:1. Sex < y F(x) F(y) (Fe nao decrescente)2. limxa+F(x) = F(a) (Fe contnua `a direita)3. limxF(x) = 0 e limxF(x) = 1503.5. MEDIAEVARIANCIADEUMAVARIAVELALEATORIADISCRETA cpa/gsaA prova de (1) e simples:F(x) = P(X x).Sex < y = [X y] = [X x] [x < X y].A prova das propriedades (2) e (3) fogem do escopo deste curso. Detalhes podem ser encontrados em[8].Podemos, a partir da func ao de distribuicao, determinar a funcao de probabilidade de uma v.a. comovemos no exemplo a seguir:Exemplo:Suponha que a funcao de distribuicao acumulada da v.a. Xe seu respectivo graco sejam:F(x) =___0 sex < 2,0,2 se2 x < 0,0,7 se 0 x < 2,1 se 2 x.x2FX(x)00,200,701,00-2Pelo graco deF(x) podemos ver que os unicos pontos que recebem probabilidade diferente de zerosao 2, 0 e 2 e assim:f(2) = 0,2 0 = 0,2 f(0) = 0,7 0,2 = 0,5 f(2) = 1 0,7 = 0,3Ou seja, a v.a. Xassume os valores 2, 0, 2 com probabilidades respectivamente 0,2; 0,5 e 0,3.Em geral se a variavel aleatoria pode assumir os valoresx1< x2< x3< . . . ; e se conhecemosF(xk)para cadaxk RX, podemos escrever:f(xk) = F(xk) F(xk1)3.5 MediaevarianciadeumavariavelaleatoriadiscretaDoisn umerossaofrequentementeusadospararesumiradistribuicaodeumavariavel aleatoria. Amediaeamedidadocentrooumeiodadistribuicaodeprobabilidadeeavarianciaeamedidadadispersaoouvariabilidadedadistribuicao. Estas medidas naosaocaractersticas exclusivas deumadistribuicao, ja que podemos ter duas distribuicoes diferentes com mesma media e mesma variancia (vejagura 3.1) , mas mesmo assim sao importantes e uteis.513.5. MEDIAEVARIANCIADEUMAVARIAVELALEATORIADISCRETA cpa/gsa2 4 6 8 10 0 2 4 6 8 10 0Figura 3.1: Distribuicoes diferentes com mesma media e varianciaVimos no captulo 1 que para uma amostra de dados a media e variancia amostrais eram x =1nn

i=1xie S2=1(n 1)n

i=1(xi x)2.Para uma variavel aleatoria discreta temos:Denicao10.A media ou valoresperado de uma variavel aleatoria discretaX, denotada(o) como ou E(X), e = E(X) =

kxkf(xk)A variancia deX, denotada por2ouV (X), e2= V (X) = E(X )2=

k(xk )2f(xk) =

kx2kf(xk) 2O desviopadrao deXe = 2Vemosportantoqueamediadeumavariavel aleatoriadiscretaeamediaponderadadosvalorespossveis deX, onde os pesos sao as probabilidades.De forma similar a variancia usaf(x) como peso para multiplicar cada desvio quadrado (x )2.A igualdade das formulas da variancia apresentadas acima pode ser demonstrada usando propriedadesdos somatorios e a denicao de:V (X) =

x(x )2f(x) =

xx2f(x) 2

xxf(x) +2

xf(x)=

xx2f(x) 22+2=

xx2f(x) 2Quando mais de uma variavel aleatoria estiverem envolvidas em um estudo, nas medias e nas varianciasusaremos um subscrito para diferencia-las, ou seja:X: sera a media da v.a.X Y: sera a media da v.a.Y2X: sera a variancia da v.a.X 2Y: sera a media da v.a.Y523.5. MEDIAEVARIANCIADEUMAVARIAVELALEATORIADISCRETA cpa/gsaExemplo:Um canal digital transmite dados com certa probabilidade de erro. Seja X o n umero de bits recebidoscom erro nos quatro proximos bits transmitidos. Os valores possveis de Xsao 0,1,2,3,4. Suponha quetenhamos as seguintes probabilidades:P(0) = 0,6561 P(1) = 0,2916 P(2) = 0,0486 P(3) = 0,0036 P(4) = 0,0001Calcule a media e a variancia da v.a. X.Solucao: = E(X) = 0f(0) + 1f(1) + 2f(2) + 3f(3) + 4f(4)= 0(0,6561) + 1(0,2916) + 2(0,0486) + 3(0,0036) + 4(0,0001)= 0,4Para calcularmos a variancia e conveniente montarmos a tabela:x x 0,4 (x 0,4)2f(x) f(x)(x 0,4)20 0,4 0,16 0,6561 0,1049761 0,6 0,36 0,2916 0,1049762 1,6 2,56 0,0486 0,1244163 2,6 6,76 0,0036 0,0243364 3,6 12,96 0,0001 0,001296Assim:V (X) = 2=5

i=1f(xi)(xi0,4)2= 0,36Algumas propriedades da media e da variancia:1. SeXe uma v.a. nao negativa entao E(X) 0Prova: E(X) =

xxipicomoxi 0 epi 0 logo E(X) 02. SeX = c entao E(X) = cProva: ComoX = c P(X = c) = 1 e da E(X) = cP(X = c) = c3. E(aX +b) = aE(X) +bProva: Podemosfacilmenteverque P(aX + b=ax1 + b)= P(X=x1)=P1logo E(aX + b)=

ni=1(axi +b)pi =

ni=1(axi)pi +

ni=1bpi = a

ni=1xipi +b

ni=1pi = aE(X) +b4. E(X +Y ) = E(X) +E(Y )5. Para qualquer variavel aleatoriaXtemosV (X) 06. SeX = c entaoV (X) = 07. V (aX +b) = a2V (X)8. SeXe uma v. aleatoria discreta com funcao de probabilidadef() eh uma funcao deX, entaoE[h(X)] =

kh(xk)f(xk)533.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsaExemplo:Com os dados do exemplo anterior onde X e o n umero de bits com erro nos proximos 4 transmitidos,qual o valor esperado do quadrado do n umero de erros?Solucao:h(x) = X2e portantoE[h(X)] = E(X2) = 020,6561 + 120,2916 + 220,0486 + 320,0036 + 420,0001 = 0,52.(Note que este valor e diferente de E(X)2= 0,42= 0,16. A E(X2) nao e, de modo geral, igual a E(X)2).3.6 DistribuicoesdiscretasmaiscomunsEstudaremosnestasecaoadistribuicaodeprobabilidadedealgumasvariaveisaleatorias, queporpossurem caractersticas especiais comuns sao agrupadas em famlias, que recebem denominacoes queremetemaestas caractersticas especiais. Estas variaveis aparecemconstantementeemaplicacoes eexperimentos reais, que podem ser modelados a partir do conhecimento das caractersticas destas variaveisaleatorias.3.6.1 DistribuicaouniformediscretaA v.a. discreta mais simples e aquela que assume apenas um n umero nito de valores, cada qual coma mesma probabilidade. DenimosDenicao 11. Uma variavel aleatoriaXtem uma distribuicao uniforme discreta se cada um dosnvalores de seu contradomnio, isto ex1,x2, . . . ,xNtiver igual probabilidade. Assimf(xi) = 1/N i = 1, . . . ,NSuponha queXtem distribuicao uniforme e que assuma os valores x1,x2, . . . ,xN temosE(X) =N

i=1xipi =N

i=1xi1N=

Ni=1xiNV (X) = E(X2) [E(X)]2=

Ni=1x2iN_

Ni=1xiN_2=N

Ni=1x2i [

Ni=1xi]2N2SuponhaagoraqueocontradomniodeXsejaconstitudopelosinteirosconsecutivosa, a + 1, a +2, . . . , b. Vemos que a v.a. assume (b a + 1) valores, cada um com probabilidade1(b a + 1). Assimpodemos calcular: =b

k=ak_1(b a + 1)_=1(b a + 1)b

k=ak =1(b a + 1)_b

k=1k a1

k=1k_=1(b a + 1)_b(b + 1) (a 1)a2_=b +a2543.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsaObservac ao: Temos usado que:1. A soma dos inteiros 1, 2, . . . ,r e igual ar(r + 1)2.2. A soma dos quadrados 12, 22, . . . ,r2e igual ar(r + 1)(2r + 1)6.Essas sao propriedades que valem para todo n umero natural e o leitor pode provar usando o Princpio deInducao Matematica.V (X) = E(x2) [E(X)]2=b

k=ak2_1(b a + 1)__b +a2_2=1(b a + 1)_b

k=1k2a1

k=1k2__b +a2_2=1(b a + 1)_b(b + 1)(2b + 1)6 (a 1)a(2a 1)6__b +a2_2=1(b a + 1)_2b3+ 3b2+b 2a3+ 3a2a6__b +a2_2=2a2+ 2ab a + 2b2+b6b2+ 2ab +a24=a22ab 2a +b2+ 2b12=(b a + 1)2112Exemplos:1. No lancamento de um dado honesto, seja a variavel aleatoriaXo n umero da face superior. Qual aesperanca e a variancia deX?Soluc aoE(X) =6 + 12= 3,5 V (X) =(6 1 + 1)2112 2,922. A central telefonica de uma empresa possui 48 linhas externas. Dena a v.a. Xcomo o n umero delinhas ocupadas em determinado instante, e considere queXtenha distribuicao uniforme discreta.Se denirmos Ycomo a proporcao das linhas telefonicas que estao em uso em determinado instante,qual a media e variancia deY ?Soluc aoEmprimeirolugarnotequeseY eaproporcaodelinhasocupadas, entaoY =X/48. Ouseja,Y= aXondea = 1/48. Pelas propriedades da media e variancia de variaveis aleatorias temos queE(aX) = aE(X) eV ar(aX) = a2V ar(X). Entao calculamos:E(Y ) = E(X/48) =148E(X) =148(0 + 48)2= 0,5V (Y ) = V (X/48) = V (X)/482=[(48 0 + 1)21]/122304=2400/122304=2002304 0,087.553.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsa3.6.2 DistribuicaodeBernoulliExperimento de Bernoulli: Dizemos que o experimento e de Bernoulli se existem dois resultadospossveis: sucesso (S) com probabilidadep e fracasso (F) com probabilidade (1 p).Considere um experimento de Bernoulli com probabilidade pde sucesso. Dena X(S) = 1 e X(F) = 0.Sendo assim, P(X = 1) = p e P(X = 0) = 1 p , o que pode ser representado porf(x) = px(1 p)1x, x = 0 oux = 1A variavelXassim denida tem Distribuicao de Bernoulli, notacao: X Bernoulli(p)Mediaevariancia: Podemos ver queE(X) =1

x=0xf(x) = 0f(0) + 1f(1) = 0p0(1 p)1+ 1P1(1 p)0= pV (X) = E(X2) [E(X)]2= 02(1 p) + 12(P) p2= p p2= p(1 p)Exemplos: lancamento de uma moeda, escolha de uma peca em um lote, etc.3.6.3 DistribuicaobinomialSerealizamosnrepeticoesindependentesdeumexperimentodeBernoulli comprobabilidadepdesucesso, entao denimos a variavel aleatoriaX: n umero de sucessos ocorridos.X : S RXcom RX RCalculodafuncaodeprobabilidadedeX: emprimeirolugarefacil verqueRX= 0,1,2 . . . ,n.Calculemos entao P(X = k). Para calcular esta probabilidade, precisamos contar o n umero de sequenciasde tamanhon contendokS

s en kF

s. Se todos osS

s e todos osF

s fossem diferentes teramosn!sequencias diferentes (n umero de arranjos den elementos diferentes).PorsimplicidadetomemosasequenciaS1S2S3. . . SkF1F2F3...Fnk. PorconsiderarmososS

sdife-rentes, essa sequencia e diferente de S2S1S3. . . SkF1F2F3...Fnk e e diferente de qualquer outra sequenciaobtidatrocandoalgumasposicoesdosS

s. EntaoporconsiderarmososS

sdiferentes, cadasequenciaesta sendo repetidak! vezes. Pelo mesmo argumento cada sequencia esta sendo repetida (n k)! vezespor considerarmos os F

s diferentes. Entao, como na realidade nao ha diferencas entre os S

s e nem entreosF

s, o n umero de sequencias comkS

s e (n k)F

s e igual a:n!k!(n k)!=_nk_Finalmente, desdequeasrepeticoesdosexperimentossaoindependentes, aprobabilidadedeumasequencia comkS

s e (n k)F

s e igual apk(1 p)nk.Conclui-se, entao, que:P(X = k) =n!k!(n k)!pk(1 p)nk=_nk_pk(1 p)nkparak = 0, 1, . . . ,n.563.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsaPodemos entao formalizar a:Denicao12. AvariavelaleatoriaXquecontaon umerodesucessosemnrepeticoesindependentesde experimentos de Bernoulli (somente dois resultados possveis designados como sucessoe fracassoea probabilidade de sucesso em cada tentativa, denotada porp, constante), tem distribuicaobinomialcom parametrosn ep, notacaoX b(n,p) e funcao de probabilidade:f(x) =_nx_px(1 p)nx, x = 0, 1, . . . , nO nome da distribuicao vem da expansao binomial. Lembre-se que para as constantesa eb temos:(a +b)n=n

k=0_nk_akbnkPartindo da expansao binomial, fazendoa = p eb = 1 p podemos checar que a soma das probabili-dades para uma variavel aleatoria binomial e igual a 1, conforme esperado, ja quen

k=0_nk_akbnk= (a +b)n= (p + 1 p)n= 1Exemplos:1. A eciencia de uma vacina e de 80%. Sorteamos 3 indivduos em uma populacao vacinada, e estessao submetidos a um teste de imuniza cao.(a) Encontre a distribuicao do n umero de individuos imunizados na amostra.(b) Qual a probabilidade do n umero de indivduos imunizados na amostra ser maior ou igual a 1?Soluc ao:(a) Se chamarmos de sucesso o fato do indivduo sorteado estar imunizado, vemos que p = 0,80.A v.a. aleatoriaX, n umero de sucessos na amostra, pode assumir os valores 0,1,2,3 VemosentaoqueX b(3; 0,8), poisaprobabilidadedecadaindivduoserimunizadoe0,8eestaprobabilidadeexaparatodoindivduo. Alemdisso, saberqueumindivduoeimunizadonao modica a incerteza sobre os outros indivduos, ou seja, os eventos sao independentes.(b)P(x 1) = P(x = 1) +P(x = 2) +P(x = 3) = 1 P(x = 0) = 1 _30_0,800,23= 1 _3!0!3! 1 0,008_= 1 0,008 = 0,9922. Umalinhadeproducaoemgrandeescalaproduz6%deitensdefeituosos. 30itensdaproducaosemanal sao observados. Calcular a probabilidade de(a) Observar no maximo 2 defeituosos?(b) Observar entre 8 e 10 defeituosos?573.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsaSoluc ao(a) SeXe o n umero de itens defeituosos na amostra, vemos queX b(30; 0,06) e assimP(X 2) =2

k=0_30k_(0,06)k(0,94)30k=_300_(0,06)0(0,94)30+_301_(0,06)1(0,94)29+_302_(0,06)2(0,94)28= 0,156256 + 0,299213 + 0,276931 = 0,7324(b) A probabilidade de observarmos entre 8 e 10 defeituosos:P(8 X 10) =10

k=8_30k_(0,06)k(0,94)30k=_308_(0,06)8(0,94)22+_309_(0,06)9(0,94)21+_3010_(0,06)10(0,94)20= 0,000252 + 0,000039 + 0,000005 = 0,000297Asgurasaseguirmostramexemplosdedistribuicoesbinomiais. Paranxo(noexemplo20)`amedida quep aumenta de 0 a 0,5 a distribuicao se torna mais simetrica.Figura 3.2: Distribuicao Binomial comn xo ep crescenteBinomial(20;0,1)0,000,050,100,150,200,250,300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20xf(x)Binomial(20;0,23)0,000,050,100,150,200,250,300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20xf(x)Binomial(20;0,36)0,000,050,100,150,200,250,300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20xf(x)Binomial(20;0,5)0,000,050,100,150,200,250,300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20xf(x)583.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsaFigura 3.3: Distribuicao Binomial comp xo en crescenteBinomial(50;0,23)0,000,030,060,090,120,150 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200xf(x)Binomial(100;0,23)0,000,030,060,090,120,150 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200xf(x)Binomial(150;0,23)0,000,030,060,090,120,150 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200xf(x)Binomial(200;0,23)0,000,030,060,090,120,150 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200xf(x)Mediaevariancia: Amedia eavariancia deumavariavel aleatoriabinomialdependemsomentedos parametrosn ep. Imagine o exemplo anterior da linha de producao e para cada uma das 30 pecasda amostra voce denisse novas v.as. X1, X2, . . . , X30tais que:Xk =_1 sek-esima amostra fosse defeituosa,0 caso contrario.Sabemos que cada nova variavel aleatoriaXk e uma Bernoulli de parametrop = 0,06, e que a esperancadeXk ep. Podemos escrever a v.a. Xcomo:X =30

k=1Xke agora calcular a media deXpor (como osX

ks sao independentes):E(X) = E_30

k=1Xk_=30

k=1E(Xk) =30

k=1p = 30p = 30 0,06 = 1,8Podemos generalizar entao para:SeX b(n,p), entao = E(X) = npAlem disto pode-se provar (foge ao escopo deste curso) que2= V (X) = np(1 p)593.6. DISTRIBUICOESDISCRETASMAISCOMUNS cpa/gsa3.6.4 DistribuicaogeometricaSuponha novamente um experimento de Bernoulli ,com probabilidadep de sucesso. Se repeticoesindependentes de sao realizadas ate que aconteca o primeiro sucesso, denaX : N umero de repeticoes.Neste caso o contradomnio e RX= 1,2,3, . . . Calculo da funcao de probabilidade deX: Observemos queX=kse nas primeirask 1 repeticoesacontecemF

s (fracassos) e nakesima aconteceS(sucesso). Portanto a probabilidade de queXsejaigual ak sera (1 p)k1p.Podemos entao denir:Denicao13. Em uma serie de repeticoes de experimentos independentes de Bernoulli, com probabili-dade p de sucesso, a varia