IP 2015.1 Completo

Embed Size (px)

Citation preview

  • 8/18/2019 IP 2015.1 Completo

    1/99

    UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICADisciplina: Introdução à Probabilidade (4 créditos) Período: 2015.1Professor(a):Aluno(a):

    ESTATÍSTICA DESCRITIVA

    1 Conceitos Preliminares

    1.1 A Ciência Estatística

    O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito,logo relaciona a Estatística com tabelas e gráficos nos quais os dados obtidos são represen-

    tados, ou melhor, relaciona à números específicos. Ouvimos, assim, falar em estatísticasdo IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas deopinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em-pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciênciaou método científico que estuda os fenômenos aleatórios e, procura inferir as leis que osmesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto oprimeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapaà noção corrente.

    Definição 1.1   (Estatística).   A Estatística é uma ciência que se preocupa com a 

    coleta, organização, descrição, análise e interpretação dos dados, a fim de extrair in- formações a respeito de uma população.

    Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-mente em duas partes:

    1.   Estatística Descritiva - que se preocupa com a organização e descrição dos dadosexperimentais;

    2.  Estatística Inferencial - que, a partir da observação de alguns dados experimentais,

    realiza a análise e interpretação de dados com o objetivo de generalizar e preverresultados, utilizando-se para isto da Teoria das Probabilidades.

    Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitosfundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudoda inferência estatística.

    (Desenhar figura representando uma visão sistêmica da estatística)

    1

  • 8/18/2019 IP 2015.1 Completo

    2/99

    1.2 População e Amostra

    Definição 1.2   (População).   A população é um conjunto de todos os elementos 

    (pessoas, objetos, etc) que possuem pelo menos uma característica em comum, a(s)qual(is) os relacionam ao problema que está sendo estudado.

    Exemplo 1: Se o problema a ser pesquisado está relacionado com a qualidade deum certo produto produzido numa indústria, a população pode ser composta por todas aspeças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos.

    Exemplo 2: Se o objetivo de um estudo é pesquisar o nível de renda familiar de umacerta cidade, a população seria todas as famílias desta cidade. Mas, se o objetivo fossepesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seriacomposta por todos os chefes de família desta cidade.

    A População pode ser:

    1.   Finita - Quando o número de unidades de observação pode ser contado e é limitado;

    2.   Infinita - Quando a quantidade de unidades de observação é ilimitada;

    Podemos citar como exemplo de  população finita o conjunto formado pelos alunosque cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo depopulação infinita seria o conjunto formado por todos os alunos de estatística do Brasil,pois este conjunto é composto por um número incontável de elementos.

    Definição 1.3  (Amostra).  A amostra é apenas uma parte da população, ou seja, é 

    qualquer subconjunto não vazio da população.

    Vários motivos levam a necessidade de se observar apenas uma parte da população,como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deveser obtida através de   técnicas de amostragem, as quais tem como objetivo principalgarantir a representatividade da população, ou seja, fazer com que a amostra seja umretrato fiel da população.

    Exemplos de amostra podem ser conjuntos formados por apenas uma parte dos ele-

    mentos populacionais descritos nos  Exemplos 1   e  2 .

    1.3 Variáveis (ou Dados)

    Definição 1.4   (Variável).  Uma Variável nada mais é que uma característica (ou 

    dado) associada a cada elemento da população ou da amostra. A variável apresenta diferentes valores, quando sujeita a mensurações sucessivas, e, em geral, é denotada pelas letras maiúsculas do nosso alfabeto.

    2

  • 8/18/2019 IP 2015.1 Completo

    3/99

    Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é impor-tante identificar qual é o tipo de dado (ou variável) que será analisado, pois, é mediantea este conhecimento que o pesquisador poderá ou não adotar determinadas técnicas esta-tísticas para a resolução de problemas. Por exemplo, será que é possível calcular o pesomédio de lutadores de boxe, quando os dados são coletados segundo a categoria de peso:Leve, Médio ou Pesado?

    1.4 Tipos de Variáveis

    Basicamente, as variáveis podem ser classificadas como sendo  Qualitativas ou  Quanti-tativas.

    1.  Variáveis Qualitativas - quando os valores que elas podem receber são referentesà qualidade, atributo ou categoria. Exemplos são:

    •  Raça: podendo assumir os valores Branco ou Negro;•  Sexo: Masculino ou Feminino;•  Escolaridade:   1◦ grau completo, 2◦ grau completo, superior, pós-graduado;•  Conceito de qualidade: péssima qualidade, regular ou boa qualidade.

    As variáveis qualitativas podem, ainda, ser classificadas como:  Nominais ou  Ordi-nais.

    (a)  Variáveis qualitativas nominais - São caracterizadas por dados que se apre-

    sentam apenas sob o aspecto qualitativo. Por exemplo: raça e sexo.(b)   Variáveis qualitativas ordinais   - São caracterizadas por categorias que a-

    presentam uma ordenação natural. Por exemplo: escolaridade e conceito dequalidade.

    2.  Variáveis Quantitativas - Quando os valores que ela pode assumir são numéricos,os quais podem ser obtidos através de uma contagem ou mensuração.

    As variáveis quantitativas podem ser classificadas de acordo com o processo de ob-tenção; podendo ser:  Discreta ou  Contínua.

    (a)  Variáveis quantitativas discretas - São variáveis numéricas obtidas a partirde procedimento de contagem. Por exemplo: Quantidade de pessoas numafamília, quantidade de acidentes numa indústria, etc.

    (b)   Variáveis quantitativas contínuas  - São variáveis numéricas cujos valoressão obtidos por um procedimento de mensuração, podendo assumir quaisquervalores num intervalo dos números reais. Por exemplo: temperatura, altura,salário, etc..

    3

  • 8/18/2019 IP 2015.1 Completo

    4/99

    Observação: O fato de uma variável poder ser expressa por números não significaque ela seja necessariamente quantitativa, por que a classificação da variável depende decomo foi medida. Por exemplo, para a variável peso de um lutador de boxe, se for anotadoo peso marcado na balança, a variável é quantitativa contínua; por outro lado, se esse pesofor classificado segundo as categorias do boxe, a variável é qualitativa ordinal.

    1.5 Fases do Método Estatístico

    Assim como qualquer ciência, a estatística utiliza o método científico, que consiste dascinco etapas básicas seguintes:

    1. Definir cuidadosamente o problema.

    Nesta etapa o pesquisador deve certificar-se de que é clara a finalidade de um estudoou análise. Ao definir o que se quer estudar, ou seja, o problema, é necessário que se

    faça um levantamento sobre quais estudos já foram realizados no campo de pesquisaabordado. Deve-se também especificar quem ou o quê será observado no estudo, ouseja, a população a ser pesquisada.

    2. Formular um plano para a coleta dos dados adequados.

    Nesta fase, o pesquisador deverá listar as variáveis (características ou dados) quesejam relevantes para se atingir os objetivos propostos pela pesquisa. Além disso,deve-se decidir se a coleta dos dados será realizada através de um censo ou amos-tragem, ou seja, se todos os elementos da população serão observados ou se apenasuma parte da população é que será observada e neste último caso deve-se decidir poralguma técnica de amostragem, podendo ser probabilística ou não.

    Os dados podem ser classificados quanto à forma de coleta, como:

    (a)  Dados primários - Quando o próprio pesquisador é quem elabora e aplica osinstrumentos necessários para a coleta dos dados, ou seja, quando a Coleta éDireta;

    (b)  Dados secundários - Quando o pesquisador utiliza informações já colhidas poroutrem, retirando-as de livros, revistas, mapas anuários, etc.

    3. Coligir ou apurar os dados.

    Esta fase consiste em resumir os dados, através de sua contagem e agrupamento.É possível que nesta fase seja identificado a presença de dados absurdos fazendo-senecessário a eliminação ou correção destes tipos de dados.

    4. Analisar e interpretar os dados.

    5. Relatar as conclusões de maneira que sejam facilmente entendidas por quem as forusar na tomada de decisões.

    4

  • 8/18/2019 IP 2015.1 Completo

    5/99

    1a LISTA DE EXERCÍCIOS

    1 - Defina e/ou explique com suas próprias palavras, o que você entende por CiênciaEstatística e quais os principais ramos (partes) da Estatística.

    2 - Através de um exemplo, defina: População e Amostra.

    3 - O que você entende por variável? Justifique a sua resposta por intermédio de umexemplo.

    4 - Como você diferencia uma variável discreta de uma variável contínua? Utilize umexemplo para melhor ilustrar.

    5 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem.

    6 - Qual é o principal objetivo de qualquer plano de amostragem?

    7 - As estatísticas geradas por intermédio de uma amostra devem ser representativasdesta amostra ou da população de origem? Justifique a sua resposta.

    8 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenhaum tamanho apropriado? Justifique a sua resposta.

    9 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos devariáveis.

    a) Nome b) Nível de satisfação

    c) Idade d) Número de dias hospedado numa pousada

    5

  • 8/18/2019 IP 2015.1 Completo

    6/99

    2 Análise Exploratória de Dados

    2.1 Introdução

    A estatística pode ser considerada como um instrumento ou um conjunto de métodos

    matemáticos que devem ser utilizados quando se pretende transformar dados em informação.Para ilustrar este processo, veja a Figura 1:

    12 15 1815 12 1818 15 1817 19 20

    Conjunto de dados

    MédiaModa

    MedianaProporção

    Quantis

    Conjunto de informações

    Figura 1:

    No primeiro retângulo, tem-se um conjunto de observações da variável idade de umgrupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podemrepresentar esses números.

    2.2 Organização de Dados: Tabelas e Gráficos

    2.2.1 Distribuição de Frequências

    O primeiro passo para se resumir um conjunto de dados é ordená-los em ordem cres-

    cente ou decrescente, e proceder a contagem do número de ocorrência (frequência) de cadadado. À ordenação dos dados denominamos de Rol. Assim, o rol para o conjunto de dadosda Figura 1 fica:

    Rol de dados: (Organize!)

    Desta maneira, fica fácil verificar a frequência com que cada um dos dados foi obser-vado, por exemplo: o valor 12 ocorreu 2 vezes; o valor 15 ocorreu 3 vezes, e assim por

    diante.Uma maneira adequada de apresentar os dados e suas respectivas frequências é através

    de uma  Tabela de Frequências, a qual é constituída por   uma coluna  referente aosdados  e  outra  referente às   frequências absolutas  associadas a cada valor observado(ni). Veja como fica para o conjunto de dados da Figura 1:

    6

  • 8/18/2019 IP 2015.1 Completo

    7/99

    Tabela 1: Tabela de Frequências da variávelidade, para um grupo de 12 pessoas.Idade Frequência (ni)

    1215

    17181920

    Total de observações (n)Fonte: Figura 1

    Uma medida bastante útil na interpretação de tabelas de frequências é a  frequênciarelativa (f i), a qual é dada pela razão entre a frequência do i-ésimo valor observado,  ni, eo total de dados observados, n. Pode-se, ainda, representar a frequência relativa em termos

    de porcentagem, bastando para isso multiplicar a frequência relativa  f i por 100.Para alguns tipos de variáveis, tais como a qualitativa ordinal e as quantitativas (dis-

    creta ou contínua), pode ser útil também, a informação de quantas observações apresentamvalores menores ou iguais a um certo valor fixado. Este tipo de informação é denominadode frequência absoluta acumulada,  N i, a qual também pode ser expressa em termosrelativos ou por porcentagens (F i).

    Vejamos, agora, como fica a tabela de frequências anterior com estas informaçõesadicionadas:

    Tabela 2: Tabela de Frequências da variável

    idade, para um grupo de 12 pessoas.Idade   ni   f i   f i × 100 (%)   F i (%)

    12 215 317 118 419 120 1

    Total (n) 12Fonte: Figura 1

    Observação:   Ao conjunto de todos os pares de valores, referentes a cada dado obser-vado e sua respectiva frequência, denominamos de  Distribuição de Frequências . Destaforma, os pares  (12, 2), (15, 3), (17, 1), (18, 4), (19, 1)  e  (20, 1)   representam a distribuição de frequências da variável idade para esse grupo de pessoas.

    7

  • 8/18/2019 IP 2015.1 Completo

    8/99

    Exercício:  Construa uma Tabela de Frequências para a variável  OpTV, referenteaos alunos matriculados na disciplina Introdução à Probabilidade - Turma , nestesemestre.

    2.2.2 Representação Gráfica

    Uma representação gráfica da distribuição de frequências de uma variável tem a vantagemde, numa maneira rápida e concisa, informar sobre a variabilidade da mesma.

    Gráfico de Colunas - é mais adequado para variáveis discretas mas também pode serutilizado para variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominaiscujos nomes das categorias são pequenos. Neste gráfico, cada valor observado é represen-tado por retângulos de mesma base e alturas proporcionais às frequências. Para ilustrar,veja como fica este gráfico para a distribuição de frequências da variável idade, utilizandoa frequência absoluta e relativa em termos de porcentagem:

    Gráfico de Pizza ou de Setores - é adequado para representar variáveis discretasdesde que não assumam uma quantidade muito grande de valores. É adequado também paravariáveis qualitativas nominais. Este gráfico é caracterizado por um círculo de raio arbitráriorepresentando a frequência absoluta ou percentual total de dados. O círculo por sua vez édividido em setores(fatias) que correspondem, proporcionalmente, às frequências com queas categorias da variável em estudo ocorrem. O cálculo do ângulo,  θ0, correspondente auma fatia do gráfico de pizza, é feito através da seguinte fórmula:

    θ0 = f i × 3600,

    obtida a partir de uma simples regra de três.

    8

  • 8/18/2019 IP 2015.1 Completo

    9/99

    Exercício:  Construa um Gráfico de Pizza para representar distribuição de frequênciasda variável OpTV, referente aos alunos matriculados na disciplina Introdução à Probabili-dade - Turma , neste semestre.

    Exercício de Fixação

    1 - O seguinte conjunto de dados é referente ao número de acidentes por dia em certotrecho de rodovia no mês de setembro de certo ano:

    2 0 1 2 3 1 6 1 0 01 2 2 1 2 0 1 4 2 30 1 0 2 1 2 4 1 1 1

    Responda as seguintes questões:

    a) Qual o número mínimo de acidentes, num certo dia? E o número máximo?Resp.: 0 e 6

    b) Frequêntemente, ocorreram quantos acidentes por dia? E o que isso representa

    em termos de percentuais? Resp.: 1 e 36,7%c) Represente graficamente a distribuição de frequência da variável número deacidentes por dia, no mês de setembro.

    9

  • 8/18/2019 IP 2015.1 Completo

    10/99

    2.2.3 Distribuição de Frequências para Dados Agrupados em Classes

    Em algumas situações, é necessário o agrupamento de dados em categorias ou classespara se proceder a construção de uma tabela de frequências. Por exemplo, em um conjuntode dados contínuos, um mesmo valor não ocorrerá com grande frequência, ou até mesmo,não se repetirá por mais de uma vez. Uma vantagem em agrupar os dados em classesconsiste na organização de grandes conjuntos de dados de forma mais clara e objetiva.Por outro lado, uma desvantagem, consiste na perda de informações por não se saberexatamente quais os valores ocorridos dentro de cada classe.

    Para ilustrar como proceder a construção de uma tabela de frequências em classes,considere o seguinte conjunto de dados:

    Tabela 2: Dados referentes às notas no 1o estágio de 20 estudantes de estatística.

    Código do aluno 1 2 3 4 5 6 7 8 9 10Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0Código do aluno 11 12 13 14 15 16 17 18 19 20Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0

    Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela defrequências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamentodos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos:

    1. Organizar os dados num  Rol.

    2. Estabelecer o Número de Intervalos (categorias ou classes) para se dividir o con-

     junto de dados.A escolha do número de classes é arbitrária e pode ser estabelecida de acordo como bom senso do pesquisador ou obtido por alguma fórmula matemática construídapara este fim. Uma sugestão prática é a escolha entre 5 e 15 classes com a mesmaamplitude. Duas fórmulas matemáticas que podem orientar na escolha do número declasses são:

    (a)   k = 5, se  n ≤ 25, ou  k = √ n, se  n > 25(b)   k = 1 + 3, 3 × log10(n)

    Onde  k é o número de classes e  n é o número total de observações.3. Calcular a Amplitude Total:

    AT ot = xmax − xmin,onde xmax é o valor máximo e xmin é o valor mínimo observado no conjunto de dados.

    4. Determinar a Amplitude de Classe:

    h = AT ot

    k

    10

  • 8/18/2019 IP 2015.1 Completo

    11/99

    5. A partir do menor valor observado no conjunto de dados, ou de algum valor imedia-tamente inferior e adequadamente escolhido, delimitar as classes, ou seja, determinaros limites inferiores e superiores de cada classe.

    Neste momento, os seguintes símbolos são úteis:

    (a)   li   −−−−|

      Li  - para indicar que o valor extremo inferior (l

    i) não pertence à

    i-ésima classe, enquanto que o valor extremo superior (Li) pertence.

    (b)   li   |−−−−   Li - para indicar que o valor extremo inferior (li) pertence à  i-ésimaclasse, enquanto que o valor extremo superior (Li) não pertence.

    6. Após todos estes passos, só resta proceder a contagem do número de observaçõespertencentes à cada uma das classes e organizar estas informações numa tabela defrequências para dados agrupados.

    De acordo com estes passos, o conjunto de dados anterior pode ser organizado como:

    (Construir a tabela de frequências para dados agrupados)

    2.2.4 Representação Gráfica para Dados Agrupados em Classes (Histo-grama)

    Para a representação gráfica de variáveis quantitativas contínuas é necessário alguma adap-tação do gráfico de colunas, uma vez que, em geral, é necessário agrupar os dados emclasses e, consequentemente, há perda de informações.

    Histograma  - é um gráfico indicado para representar dados agrupados em classes.Este gráfico é uma adaptação do gráfico de colunas, onde as bases correspondem aosintervalos de classe e as alturas são proporcionais às frequências (absolutas ou relativas) de

    classe. Veja como fica o histograma para a distribuição das notas:

    (Construir o histograma para a distribuição de frequências em classes)

    11

  • 8/18/2019 IP 2015.1 Completo

    12/99

    2.2.5 Distribuição de Frequências com Amplitude de Classes Desiguais

    Em algum momento o prezado leitor poderá ter a necessidade de construir uma distribui-ção de frequências em classe com amplitudes desiguais. Em tal situação é recomendávelsubstituir as frequências absolutas pelo que chamamos de   densidades de frequências absolutas ,  dia, calculadas da seguinte forma:

    dia  = nihi

    ,

    em que  hi é a amplitude da i-ésima classe, dada por  Li − li.Semelhantemente, tal distribuição também pode ser feita utilizando a  densidade de 

    frequência relativa, dir , calculada de maneira análoga à densidade de frequência absoluta,trocando-se apenas o valor de ni pelo valor de  f i, ou seja:

    dir  =  f i

    hi.

    Exercício::  Construa um histograma para representar a distribuição de frequências aseguir.

    Variável Frequência Absoluta   (ni)10| − 20 1320| − 30 1730| − 50 20

    50| − 100 25TOTAL   75

    12

  • 8/18/2019 IP 2015.1 Completo

    13/99

    Exercícios de Fixação

    1 - Segue abaixo os dados da variável taxa de mortalidade infantil de 34 municípios:

    32,3 62,2 10,3 22,0 13,1 9,9 11,9 20,0 36,4 23,5

    18,0 22,6 20,3 38,3 19,6 27,2 28,9 18,4 27,3 21,723,7 13,9 36,3 32,9 29,7 25,4 23,8 15,7 17,0 39,222,7 29,9 18,3 33,0

    Obtenha uma distribuição de frequências com 7 classes, começando do valor  0 (in-cluso) e com amplitudes de classe iguais a 10. Apresente alguns comentários sobre ataxa de mortalidade infantil dos 34 municípios.

    2 - Em uma pesquisa foram anotados os tempos decorridos entre a incidência de umacerta doença e sua cura, em 50 pacientes. Estes tempos são os seguintes, em horas:

    21 44 27 323 99 90 20 66 39 1647 96 127 74 82 92 69 43 33 1241 84 02 61 35 74 02 83 03 1341 10 24 24 80 87 40 14 82 5816 35 114 120 67 37 126 31 56 04

    Construa um histograma e comente sobre alguns aspectos relevantes desta distribui-ção.

    13

  • 8/18/2019 IP 2015.1 Completo

    14/99

    2.3 Medidas Resumo para Variáveis Quantitativas

    2.3.1 Medidas de Tendência Central

    Nesta seção veremos algumas medidas que tem como objetivo resumir um conjuntode dados em um único valor o qual possa fornecer informações sobre o comportamento dosdados, ou seja, sobre a distribuição de frequências da variável.

    As medidas de tendência central são bastante utilizadas e representam o centro ou omeio de um conjunto de dados. As principais são: a mediana, a moda e a média aritmética.

    A seguir, estas medidas são definidas e obtidas para os dois seguintes conjuntos dedados que representam o número de gols registrados em cada partida de futebol, durante5 e 6 jogos, respectivamente:

    Conjunto de dados 1: Número de gols por partida de futebol, em 5 jogos.

    3 2 1 2 5

    Conjunto de dados 2: Número de gols por partida de futebol, em 6 jogos.

    5 3 2 1 2 5

    1.  Mediana - É o  valor que divide o conjunto de dados ordenados em duas partesiguais, ou seja, 50% das unidades observadas possuem valores menores ou iguais aovalor mediano e as demais 50% possuem valores acima da mediana.

    Para se obter o valor da mediana é necessário seguir os seguintes passos:

    1◦) Ordenar o conjunto de dados em ordem crescente (ou descrescente);2◦) Identificar a posição central do conjunto de dados, ou seja, a posição ondese encontra o valor da mediana. Esta(s) posição(ões) pode(m) ser verificada(s)utilizando-se as seguintes fórmulas:

    (a)   P M d  =   n+12   , se o total de observações,  n, é ímpar. Assim, a mediana seráo valor observado na posição  P M d;

    (b)   P 1M d  =   n2   e P 2M d =  n2

     + 1, se o total de observações, n, é par. Pois, nestecaso, existem duas posições centrais e a mediana será a média aritmética dosvalores observados nestas duas posições.

    Notação:   Md ou  Md(X ).

    Exemplo 1:  A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados:

    1 2   2  mediana

    3 5

    14

  • 8/18/2019 IP 2015.1 Completo

    15/99

    Note que, o número de observações,  n = 5, é ímpar, logo o valor da mediana (valorcentral) está na posição  P M d =   n+12   =

      5+12

      = 3, que é igual a  M d = 2.

    Exemplo 2:  Ordenando em ordem crescente o conjunto de dados 2, teremos oseguinte rol de dados:

    1 2   2 3  dois valores centrais

    5 5

    Agora, neste caso, o número de observações,  n  = 6, é par, e, portanto, existem doisvalores centrais localizados nas posições  P 1M d   =   n2   =

      62

      = 3  e   P 2M d   =   n2   + 1 =3 + 1 = 4. Assim, a mediana será a média aritmética dos valores que se encontramnestas duas posições, dada por:

    Md = xP 1Md  + xP 2Md

    2  =

     2 + 3

    2  = 2, 5.

    2.   Moda  - É o valor (ou os valores) no conjunto de dados que ocorre(m) com maiorfrequência, se existir(em).

    Notação:   M o ou  M o(X ).

    Exemplo 3:  O primeiro conjunto de dados,  1 2 2 3 5, é dito ser  unimodal,tendo em vista que um único valor ocorre com maior frequência. Assim, a moda é

    M o = 2.

    Exemplo 4:  O segundo conjunto de dados,  1 2 2 3 5 5, é dito ser bimodal,tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim,

    os valores modais são:   M o  = 2 e  M o = 5.

    Outros Exemplos:  - Classifique os conjuntos de dados a seguir com relação à moda:

    a) 2 4 7 9 11 17

    b) 2 4 4 7 7 7 9 11 17 17

    c) 2 2 2 4 4 4 7 7 7

    d) 2 2 2 4 4 4 7 7 7 9

    e) -1 0 0 1 1 2 3 3 4 4 5 6 6

    15

  • 8/18/2019 IP 2015.1 Completo

    16/99

    3.   Média Aritmética (Média)  - É obtida a partir da razão entre a soma dos valoresobservados e o total de observações:

    Média =  soma dos valores

    total de observações (n)

    Notação:   Me,  M e(X ) ou  x.

    Exemplo 5:  A partir do conjunto de dados 1, a média é obtida por:

    Me(X ) = x  =  soma dos valores

    total de observações (n) =

     1 + 2 + 2 + 3 + 5

    5  = 2, 6.

    Observação:  A média aritmética pode ser expressa através do uso do símbolo desomatório    (sigma). Por exemplo, se   x1, x2, . . . , xk   são   k   valores distintos davariável  X , podemos escrever:

    Me(X ) = x  = x1 + x2 + . . . + xk

    k  =

     1

    k

    ki=1

    xi.

    Agora, se, de um total de n valores observados (ou observações), x1 ocorreu n1 vezes,x2 ocorreu n2 vezes, etc., xk ocorreu nk vezes, então a média de X  pode ser reescritacomo:

    Me(X ) = x  = x1.n1 + x2.n2 + . . . + xk.nk

    n  =

      1

    n

    ki=1

    xi.ni   (1)

    =k

    i=1

    xi.nin

      (2)

    =k

    i=1

    xi.f i,   (3)

    onde:

    •   ni é frequência absoluta do valor observado  xi,•   n = ki=1 ni é o total de observações, e,•   f i é frequência relativa do valor observado  xi.

    16

  • 8/18/2019 IP 2015.1 Completo

    17/99

    Exemplo 6:  A partir do segundo conjunto de dados, 1 2 2 3 5 5, temos:

    M e(X ) = x  =  1

    n

    k

    i=1xi.ni =

     1

    6(1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) = 18

    6  = 3.

    Exercícios de Fixação

    1 - Dado o seguinte conjunto de dados:

    12 12 15 15 15 17 18 18 18 18 19 20

    Determine a média, moda e mediana.

    Solução:

    2.3.2 Separatrizes: Quartis, Decis e Percentis

    Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota-dos por  Q1, Q2 e  Q3, dividem as observações  ordenadas  (em ordem crescente) em quatropartes iguais. A grosso modo:

    -  Q1  separa os  25% inferiores dos  75% superiores dos valores ordenados;

    -  Q2  separa os  50% inferiores dos  50% superiores, ou seja, é a mediana; e

    -  Q3  separa os  75% inferiores dos  25% superiores dos dados;

    Analogamente, há nove  decis, denotados por  D1, D2, . . . , D9, que dividem os dadosem 10 grupos com cerca de 10% deles em cada grupo. Finalmente, há 99  percentis quedividem os dados em 100 grupos com cerca de 1% em cada grupo.

    Basicamente, dois passos são necessários para se encontrar as medidas em questão.Primeiro deve-se identificar a sua posição, e, em seguida, determinar o seu valor.

    Veja a seguir, como obter os valores referentes aos percentis, quando se está traba-lhando com dados brutos ou em distribuição de frequências para dados  não  agrupados:

    17

  • 8/18/2019 IP 2015.1 Completo

    18/99

    1◦) Identificar a posição do percentil que se deseja encontrar, através da seguinteexpressão:

    L =

      k

    100

    × n

    Onde:

    -  L é o valor que indica a posição do percentil de interesse;

    -  k é o  k − ésimo percentil; e-  n é o total de dados observados.

    2◦) Utilizar a seguinte regra:

    1. Se  L   for um número  não inteiro, então, arredonda-se o valor de  L  para o maiorinteiro mais próximo, e, assim, o valor do  k

    −ésimo percentil, P k, é dado pelo valor

    que ocupa esta nova posição obtida.

    2. Se L  for um número inteiro, então o valor do  k − ésimo percentil, P k, será a médiaaritmética dos valores que estão nas posições  L e  L + 1.

    Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processopara calcular os quartis e decis, tendo-se o cuidado de calcular o valor de  L, pelas fórmulasL =

    k4

    × n, k  = 1, 2, 3 e  L = k10

    × n, k  = 1, 2, . . . , 9, respectivamente. Pode-se,ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e ospercentis:

    Quartis DecisQ1  =  P 25   D1 = P 10Q2  =  P 50   D2 = P 20

    Q3  =  P 75...

    D9 = P 90

    Exercícios de Fixação

    1 - Dado o seguinte conjunto de dados:

    12 12 15 15 15 17 18 18 18 18 19 20

    Determine os quartis, o sétimo decil e o décimo nono percentil.

    18

  • 8/18/2019 IP 2015.1 Completo

    19/99

    2.3.3 Medidas de Dispersão ou de Variabilidade

    Na sumarização de um conjunto de dados, uma única medida representativa da posiçãocentral, esconde toda a informação sobre a variabilidade dos dados. Veja, por exemplo, osseguintes dados:

    Variável   X   : 3 4 5 6 7

    Variável   Y   : 4 5 5 6

    Variável   Z  : 5 5 5 5

    Note que a média   Me(X ) =  M e(Y ) =   Me(Z ) = 5, a qual nada informa sobre avariação dos valores nos dois grupos. Assim, torna-se importante o conhecimento de umamedida que forneça este tipo de informação.

    19

  • 8/18/2019 IP 2015.1 Completo

    20/99

    Na prática, existem várias medidas que expessam a variabilidade de um conjunto dedados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a  distânciade cada valor observado em relação à média. Estas distâncias são denominadas de desviosem relação à média.

    Definição 2.1   (Variância).   É uma medida que representa a variabilidade de um 

    conjunto de dados, e é obtida pelo cálculo da média dos quadrados dos desvios em relação à média aritmética:

    V ar(X ) =   s2

    =  1

    n

    ki=1

    (xi − x)2 × ni

    =k

    i=1(xi − x)2 × ni

    n

    =k

    i=1

    (xi − x)2 × f i

    Vejamos, agora, como fica a variância para as variáveis  X , Y   e  Z :

    Exercício

    1. Mostre que:k

    i=1 (xi − x)2

    ×ni  =

    k

    i=1 x2i ni

    −nx2,

    e, por isso, a variância também pode ser obtida pela seguinte fórmula:

    V ar(X ) = s2 =  1

    n

    ki=1

    x2i ni − x2.

    20

  • 8/18/2019 IP 2015.1 Completo

    21/99

    Definição 2.2  (Desvio Padrão).  É a raiz quadrada da variância.

    D.P.(X ) = s  =√ 

    s2 =

     

    k

    i=1(xi − x)2 × f i

    O uso do desvio padrão como medida de variabilidade é preferível pelo fato de serexpresso na mesma unidade de medida dos valores observados, pois a variância pode causarproblemas de interpretação por ser expressa em termos quadráticos.

    Definição 2.3   (Coeficiente de Variação).  O coeficiente de variação (CV) é uma 

    medida relativa de variabilidade. O seu valor é determinado por intermédio do quoci-ente entre o desvio padrão e a média aritmética dos dados.

    CV (X ) =  s

    x × 100   (expresso em porcentagem (%)).

    A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o graude representatividade da média. Esta medida também é bastante útil na comparaçãoentre conjuntos de dados, em relação à variabilidade, ainda que as unidades de medida nosconjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuiçõesda variável peso expressa em quilogramas (Kg) e altura expressa em metros (m).

    Um critério de decisão sobre a representatividade ou não da média, pode ser dada pelaseguinte linha de corte:

    Se  CV  ≥ 50%, a média não  é  representativa.Se  CV

  • 8/18/2019 IP 2015.1 Completo

    22/99

    Exemplo 9: A tabela abaixo apresenta informações sobre as notas dos alunos de duasturmas, A e B:

    Turma: Média (x̄) Desvio Padrão (s) Terceiro Quartil (Q3)A 9,0 4,0 7,0

    B 6,0 3,2 4,0

    a) Qual das duas turmas apresentou notas com maior variabilidade?

    b) Analise a representatividade da média em cada turma.

    c) Interprete os resultados obtidos para o terceiro quartil.

    Exercícios de Fixação

    1 - Dado o seguinte conjunto de dados:

    12 12 15 15 15 17 18 18 18 18 19 20

    Determine o desvio padrão e o CV.

    22

  • 8/18/2019 IP 2015.1 Completo

    23/99

    2.4 Medidas Resumo para Dados Agrupados

    Sabemos que ao agrupar um conjunto de dados em classes, perde-se informação sobrecada valor individual e, no caso em que seja impossível recuperar cada valor observado, pode-se supor que todos os dados dentro de uma classe tenham seus valores iguais ao  pontomédio desta classe, que denotaremos por  si. Assim, pode-se, por exemplo, utilizar ospontos médios das classes,   si, e suas respectivas frequências,   ni, para calcular a médiaaritmética de maneira análoga ao exposto anteriormente. Da mesma forma, pode-se adotarcomo valor modal, o ponto médio da classe modal (que é a classe de maior frequência) ecomo mediana, o ponto médio da classe mediana (que é a classe cuja frequência absolutaacumulada atinge, ou ultrapassa pela primeira vez, o valor  n/2).

    Para o cálculo da variância, quando os dados estão agrupados em classes, basta subs-tituir os verdadeiros valores observados  xi pelo ponto médio da   i-ésima classe, si.

    Exemplo 10: Dada a seguinte distribuição de frequência da variável S =salário (dadosagrupados em classes):

    Salário   ni4, 00  8, 00 10

    8, 00  12, 00 1212, 00  16, 00 816, 00  20, 00 820, 00  24, 00 2

    Determine o valor (aproximado) da média, moda e mediana. Determine também odesvio padrão e o CV. Determine a mediana aproximada usando o histograma. Determine,

    ainda, os quartis aproximados pelos pontos médios de classe e usando o histograma.

    23

  • 8/18/2019 IP 2015.1 Completo

    24/99

    2a LISTA DE EXERCÍCIOS

    1 - Obtenha a média e a mediana para o seguinte conjunto de dados:

    20 30 40

    a) Se substituímos o valor  40 por  70, os valores da média e da mediana serão osmesmos? Justifique?

    b) Analisando os resultados acima, ressalte uma característica vantajosa da medi-ana em relação à média.

    2 - Na turma A do curso normal da Escola X, estão matriculados 50 alunos no cor-rente ano. O levantamento das fichas biométricas revelou as seguintes estaturas emcentímetros:

    165 164 151 160 155 169 153 156 165 160

    170 157 162 162 155 154 151 155 162 150

    168 160 154 151 168 155 156 158 166 155

    154 152 163 156 170 158 171 159 175 154

    159 158 153 158 156 162 165 156 161 157

    a) Elabore uma distribuição de frequências, fazendo o limite inferior da primeira classeigual a 150 (inclusive) e amplitudes dos intervalos de classe igual a 5 cm.

    b) Baseado na distribuição de frequência calcule: a média, a mediana e a moda.

    c) Construa um histograma para representar este conjunto de dados.

    3 - As taxas de juros recebidas por 10 ações durante certo período foram (medidas emporcentagem): 2.59; 2.64; 2.60; 2.62; 2.57; 2.55; 2.61; 2.50; 2.63; 2.64. Calcule amédia e a mediana.

    4 - Dados os conjuntos de números:   A  = {

    1000; 1001; 1002; 1003; 1004; 1005

    } e  B   =

    {0, 1, 2, 3, 4, 5} podemos afirmar que:a) o desvio-padrão de A é igual a 100 vezes o desvio-padrão de B.

    b) o desvio-padrão de A é igual ao desvio-padrão de B.

    c) o desvio-padrão de A é igual ao desvio-padrão de B multiplicado pelo quadrado de1000.

    d) o desvio-padrão de A é igual ao desvio-padrão de B dividido por 1000.

    e) o desvio-padrão de A é igual ao quadrado do desvio-padrão de B.

    24

  • 8/18/2019 IP 2015.1 Completo

    25/99

    3 Análise Bidimensional

    3.1 Introdução

    Em algumas análises de dados pode surgir a necessidade de se fazer um estudo sobre

    o comportamento conjunto de duas ou mais variáveis e para isso a distribuição conjunta defrequências é de grande utilidade.

    Na presente nota de aula estudaremos apenas o caso de duas variáveis e, sendo assim, épossível observar a ocorrência de três situações distintas que requerem técnicas estatísticastambém distintas. As três situações distintas que podem ocorrer são:

    •  As duas variáveis são Qualitativas;•  As duas variáveis são Quantitativas;

    •  Uma variável é Qualitativa e a outra Quantitativa.Na presente nota de aula, estudaremos apenas os dois primeiros casos.

    3.2 Associação entre Duas Variáveis Qualitativas

    Para ilustrar como podemos realizar uma análise sobre a associação entre duas variáveisqualitativas, veremos, por exemplo, como se comportam as variáveis: região de procedência(X ) e grau de instrução (Y ), das quais alguns valores hipotéticos foram registrados na tabelaa seguir, a qual chamamos de   Distribuição de Frequências Conjunta  das variáveis  X e  Y :

    Tabela 1 - Distribuição de frequências conjunta das variáveis  X  e  Y .

    X Y    freq. conj. (nij)Capital   10 Grau 4Capital   20 Grau 5Capital Superior 2Interior   10 Grau 3Interior   20 Grau 7

    Interior Superior 2Outra   10 Grau 5Outra   20 Grau 6Outra Superior 2

    Tal distribuição de frequências é melhor representada por uma  Tabela de Dupla En-trada onde, além das frequências conjunta, também podem ser apresentadas as frequênciasditas marginais ou unidimensionais de  X   e  Y . Para o nosso exemplo, esta tabela é dadapor:

    25

  • 8/18/2019 IP 2015.1 Completo

    26/99

    Tabela 2 - Distribuição de frequências conjunta das variáveis  X  e  Y .

    Y    1◦ Grau   2◦ Grau Superior   Total marginal de X X Capital   n11 = 4   n12 = 5   n13  = 2   n1. = 11Interior   n21 = 3   n21 = 7   n21  = 2   n2. = 12

    Outra   n31 = 5   n32 = 6   n32  = 2   n3. = 13Total marginal de  Y    36  n.1 = 12   n.2 = 18   n.3  = 6   n.. = 36

    Observações:

    1. Cada célula do corpo da tabela apresenta o número de ocorrência simultânea (nij   ∀i, j)dos valores  (x, y) de  X  e  Y , constituindo a distribuição conjunta;

    2. A coluna dos totais, frequências marginais de  X , ni.

    , i = 1, 2, 3, constitui a distribui-ção marginal de  X ;

    3. A linha dos totais, frequências marginais de Y , n.j, j  = 1, 2, 3, constitui a distribuiçãomarginal de  Y ;

    4. Assim como no caso de uma única variável, as frequências absolutas podem serexpressas em termos de frequências relativas e/ou porcentagens, sendo que, estasmedidas podem ser obtidas em relação ao total geral, em relação ao total de cadalinha ou em relação ao  total de cada coluna, de acordo com  os objetivos dapesquisa. Vejamos como ficam estas tabelas:

    Tabela 3 - Frequências percentuais da distribuição conjunta das variáveis  X  e  Y , emrelação ao total de dados observados.

    Y    1◦ Grau   2◦ Grau Superior   Total marginal de X X CapitalInteriorOutraTotal marginal de  Y    100%

    26

  • 8/18/2019 IP 2015.1 Completo

    27/99

    Tabela 4 - Frequências percentuais da distribuição conjunta das variáveis  X  e  Y , emrelação ao total de linha (frequência marginal de  X ).

    Y    1◦ Grau   2◦ Grau Superior   Total marginal de X X Capital 100%

    Interior 100%Outra 100%Total marginal de  Y    100%

    Tabela 5 - Frequências percentuais da distribuição conjunta das variáveis  X  e  Y , emrelação ao total de coluna (frequência marginal de  Y ).

    Y    1◦ Grau   2◦ Grau Superior   Total marginal de X X CapitalInteriorOutraTotal marginal de  Y    100% 100% 100% 100%

    Exercício de Fixação

    A partir dos dados apresentados na Tabela 2, determine:

    a) O percentual de pessoas que possuem o 2 ◦ grau e que são do interior. Resp: 19,4%.;

    b) Sabendo-se que uma pessoa veio do interior, qual é a probabilidade, em termospercentuais, de ter o  2◦ grau? Resp: 58,3%.

    c) Dentre os que possuem o  2◦ grau, qual é o percentual de pessoas provenientes dointerior? Resp: 38,9%;

    27

  • 8/18/2019 IP 2015.1 Completo

    28/99

    3.2.1 Independência entre Variáveis

    Ocorre com bastante frequência em análises de distribuição conjunta o questionamentosobre a  existência de dependência ou não entre as variáveis, além da necessidadede se saber o grau de dependência entre elas, caso exista.

    De modo geral, o grau de dependência entre duas variáveis é quantificado pelos coe-ficientes de associação ou correlação. Usualmente, esses coeficientes variam de zero atéum, sendo que, às vezes, variam de -1 a 1. Desta maneira, valores próximos de zero dãoindícios de independência entre as variáveis e, valores próximos de 1 (ou -1) indicam umalto grau de dependência positiva (ou negativa).

    Uma maneira pouco rigorosa mas bastante prática para se ter uma idéia sobre a exis-tência ou não de associação/dependência entre duas variáveis qualitativas é obtida quandoobservamos se a proporção em cada categoria de uma variável (fixada o total em linhaou coluna) é igual ou próxima à proporção marginal (de   X   ou de   Y ). Pois caso estasproporções sejam razoavelmente próximas, temos um indício de independência entre as

    variáveis; caso contrário; a evidência é de que as variáveis sejam dependentes.

    Ilustração: Para cada uma das tabelas abaixo, verifique se há alguma indicação dedependência entre as variáveis.

    Tabela 6 - Distribuição conjunta das frequências e proporções de alunos, segundo sexo(X) e curso escolhido (Y).

    X    Masculino Feminino   Total marginal de  Y Y Economia 85 (61%) 35 (58%) 120 (60%)

    Administração 55 (39%) 25 (42%) 80 (40%)Total marginal de  X    140 (100%) 60 (100%) 200 (100%)

    Comentário :

    Tabela 7 - Distribuição conjunta das frequências e proporções de alunos, segundo sexo(X) e curso escolhido (Y).

    X    Masculino Feminino   Total marginal de  Y Y 

    Física 100 (71%) 20 (33%) 120 (60%)Ciências Sociais 40 (29%) 40 (67%) 80 (40%)Total marginal de  X    140 (100%) 60 (100%) 200 (100%)

    Comentário :

    28

  • 8/18/2019 IP 2015.1 Completo

    29/99

    3.2.2 Medidas de Associação entre Duas Variáveis Qualitativas

    Uma medida de dependência bastante utilizada para variáveis qualitativas é o  coeficientede contingência, o qual é dado por

    C  =   χ2

    χ2 + n,

    onde   n  é o número de observações e   χ2 é uma medida conhecida por qui-quadrado dePearson, a qual é obtida a partir da seguinte soma

    χ2 =r

    i=1

    s j=1

    (nij − eij)2eij

    ,

    onde o somatório é estendido a todas as caselas de frequências conjunta em uma tabela

    r × s de dupla entrada (r categorias de  X  e  s de  Y ), e•   nij  é a frequência observada na ij-ésima casela;•   eij  é a frequência esperada na ij-ésima casela, caso houvesse independência entre as

    variáveis, ou seja, quando a proporção em cada categoria de uma variável (fixada ototal em linha ou coluna) é igual ou próxima à proporção marginal. Deste modo, afrequência esperada é dada, por exemplo, por:

    eij  = f i. × n.j  =  ni.n..

    × n.j  =  ni. × n.jn..

    Observações:

    •  Se a hipótese de não-associação for verdadeira, o valor do qui-quadrado,   χ2, deveestar próximo de zero; caso contrário; o valor deve ser grande. Como não existelimitação para este valor, sua classificação como grande ou pequeno se torna umatarefa inviável. Desta forma, torna-se necessário fazer uma padronização do mesmo,e iso é feito ao calcularmos o coeficiente de contingência.

    •  Um inconveniente do coeficiente de contigência  C  é que seu valor máximo dependede  r  e  s e, para evitar esse inconveniente, costuma-se definir um outro coeficiente,que também apresenta uma vantagem adicional de variar entre 0 e 1. Este novocoeficiente de contigência é dado por

    T   =

       χ2/n

    (r − 1)(s − 1) .

    Neste caso, quanto mais próximo de 1 o valor de   T   estiver, maior é o grau deassociação/dependência entre as duas variáveis qualitativas; por outro lado, quantomais próximo de 0, menor é o grau de associação/dependência.

    29

  • 8/18/2019 IP 2015.1 Completo

    30/99

    Exemplo 1: Utilizando uma medida de associação, verifique se há associação entreas variáveis:

    a)  Região de Procedência  e  Grau de Instrução , cujos valores observados se encontramna Tabela 2. Resp.:   T  ∼= 0, 076

    b)   Sexo  e  Curso Escolhido , cujos valores observados se encontram:

    (i) Na Tabela 6; Resp.:   T  ∼= 0, 022(ii) Na Tabela 7. Resp.:   T  ∼= 0, 3563

    30

  • 8/18/2019 IP 2015.1 Completo

    31/99

    3.3 Medidas de Associação entre duas Variáveis Quantitativas

    No caso em que as variáveis são ambas do tipo quantitativa, pode-se aplicar um proce-dimento análogo ao realizado para a análise de variáveis qualitativas. E, por se tratar devariáveis quantitativas, antes de construir uma tabela de dupla entrada, os dados marginaispodem ser agrupados em intervalos de classe, assim como no caso de uma única variável.Apesar de ser possível analisar as variáveis quantitativas de modo análogo ao caso devariáveis qualitativas, nas análises de associação entre variáveis quantitativas são possíveisrealizar procedimentos analíticos e gráficos mais refinados, como veremos a seguir.

    Diagrama de Dispersão

    O diagrama (ou gráfico) de dispersão nada mais é que a representação de pares dosvalores observados  (x1, y1), (x2, y2), . . . , (xn, yn) num sistema cartesiano. Vejamos a ilus-tração de alguns gráficos que podem surgir na prática:

    Coeficiente de Correlação (Linear)

    Ao ser observada uma associação entre variáveis quantitativas, seria muito útil saber-mos sobre a intensidade desta associação. Aqui, veremos apenas uma medida referenteao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico dedispersão aproximam-se de uma reta.

    Definição 3.1  (Covariância).  Dados  n pares de valores  (x1, y1), (x2, y2),..., (xn, yn),

    chamamos de covariância entre as variáveis X e Y à medida dada por 

    cov(X, Y ) =n

    i=1(xi − x)(yi − y)

    n  .

    ou seja, a média dos produtos dos valores centrados das variáveis.

    Definição 3.2   (Coeficiente de Correlação Linear).   Dados   n   pares de valores 

    (x1, y1), (x2, y2), ..., (xn, yn), chama-se coeficiente de correlação linear entre as variáveis X e Y o valor obtido por 

    corr(X, Y ) =  cov(X, Y )

    dp(X )dp(Y ).

    31

  • 8/18/2019 IP 2015.1 Completo

    32/99

    ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis.

    Alternativamente, o coeficiente de correlação também pode ser escrito como

    corr(X, Y ) =   1n

    ni=1

    (xi − x)(yi − y)dp(X )dp(Y )   ,

    ou ainda,

    corr(X, Y ) =

    ni=1 xiyi − nx y 

    (n

    i=1 x2i − nx2)(

    ni=1 y

    2i − ny2)

    ,

    sendo esta última fórmula uma expressão mais operacional e com uso mais frequente.

    Enquanto o coeficiente  T  para variáveis qualitativas só assume valores ente 0 e 1, ocoeficiente de correlação pode assumir qualquer valor entre -1 e 1.

    Propriedades:

    1. |corr(X, Y )| ≤ 1;2. Quanto mais próximo corr(X, Y ) estiver de −1 ou de  1, mais forte é a relação linear

    entre X  e  Y ; quanto mais pťroximo de zero, mais fraca a relação linear entre elas;

    3.   corr(X, Y ) = 0 ⇒ ausência de correlação linear entre  X  e  Y ;4.   corr(X, Y ) = 1 ou  corr(X, Y ) = −1 ⇒ correlação linear perfeita entre  X  e  Y ;5.   corr(X, Y ) >  0 ⇒ X  e  Y  variam no mesmo sentido;6.   corr(X, Y ) <  0 ⇒ X  e  Y  variam em sentidos contrários.

    Exemplo 2: Numa amostra de cinco operários de uma dada empresa foram observadasduas variáveis.   X : anos de experiência num dado cargo e  Y : tempo, em minutos, gasto

    na execução de uma tarefa relacionada com esse cargo. As observações são apresentadasna tabela abaixo.

    X 1 2 4 4 5Y 7 8 3 2 2

    Obs.: 

    xi = 16, 

    x2i   = 62, 

    yi = 22, 

    y2i  = 130, 

    xiyi  = 53.

    Você diria que a variável  X  pode ser usada para explicar a variação de  Y ? Justifique.

    32

  • 8/18/2019 IP 2015.1 Completo

    33/99

    3a LISTA DE EXERCÍCIOS

    1 - Realizou-se um estudo com 456 pessoas machucadas em acidentes de motocicleta,e os resultados amostrais, selecionados aleatoriamente, estão resumidos na tabela aseguir.

    Com capacete Sem capaceteCom ferimentos faciais 30 182Todos os ferimentos não faciais 8 236

    Com base nestes resultados, o capacete parece ser eficaz para evitar ferimentos faciaisem um acidente? Justifique.

    2 - Uma teoria plausível é a de que as pessoas que fumam são menos preocupadas com suasaúde e segurança e são, portanto, menos inclinadas a usar o cinto de segurança. Um

    estudo de usuários e não usuários de cintos de segurança forneceu os seguintes dadosamostrais, selecionados aleatoriamente, resumidos na tabela a seguir. Verifique se aquantidade de fumo (dada em número de cigarros fumados por dia) é independente douso do cinto de segurança. Essa teoria é apoiada pelos dados amostrais? Justifique.

    Uso do cinto \ No de cigarros 0 1 - 14 15 - 34 35 ou maisUsa cinto de segurança 175 20 42 6Não usa cinto de segurança 149 17 41 9

    3 - Um pesquisador coleta os dados dispostos na tabela e suspeita que há uma relação

    significante entre o tempo de propaganda na TV (em minutos por mês) e as vendasmensais de um produto (em centenas de dólares). Os dados amostrais confirmama suspeita do pesquisador? Justifique sua resposta com base em uma medida deassociação linear.

    Tempo de propaganda 15 20 20 30 40 45 50 60Vendas 104 128 152 224 216 312 320 352

    4 - Um levantamento obtido, junto aos funcionários de um pequeno escritório, buscarelacionar as variáveis:   anos de estudo   (X ) e   número de diferentes empregos nos 

    últimos cinco anos  (Y ).

    X    8 9 10 11 12Y    4 2 1 2 1

    a) Construa o diagrama de dispersão.

    b) Calcule o coeficiente de correlação e  interprete o resultado encontrado.

    33

  • 8/18/2019 IP 2015.1 Completo

    34/99

    RELAÇÃO DE EXERCÍCIOS PARA O   1◦ ESTÁGIO

    Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin.

    Capítulo 2 (Resumo de Dados)

    Problema Página (5a. Edição) Página (6a. Edição)2 15 15

    4 e 5 22 2211 28 28

    Capítulo 3 (Medidas Resumo)

    Problema Página (5a. Edição) Página (6a. Edição)1 a 3 40 40

    6 41 41

    16 58 5619 60 60

    25 e 26 62 61 e 6227 63 6240 66 65 e 66

    Capítulo 4 (Análise Bidimensional)

    Problema Página (5a. Edição) Página (6a. Edição)1 a 3 73 e 74 72 e 73

    6 76 759 80 79

    18 a 21 95 9422 e 26 96 95

    29 97 96

    34

  • 8/18/2019 IP 2015.1 Completo

    35/99

    UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICADisciplina: Introdução à Probabilidade (4 créditos) Período: 2015.1Professor(a):Aluno(a):

    NOTAS DE AULA PARA O   2o ESTÁGIO

    4 Teoria das Probabilidades

    4.1 Introdução

    O estudo da teoria das probabilidades é de extrema importância, pois nos forneceferramentas apropriadas para descrever e interpretar situações em que os resultados não

    podem ser previstos com certeza. Tais situações são denominadas   fenômenos aleatórios .Ao jogarmos uma moeda para o ar, de modo geral, não podemos afirmar se ocorrerá

    cara ou coroa. Da mesma forma, quando lançamos um dado não sabemos qual das faces1, 2, 3, 4, 5, ou 6 ocorrerá. No campo dos negócios e do governo há numerosos exemplosde tais situações. Por exemplo, a incerteza existe quando desejamos realizar uma previsãosobre a procura de um novo produto, a opinião pública em relação a determinado assunto,o sucesso de um novo plano econômico, etc - tudo isso contém algum elemento de acaso.

    Na Estatística, a incerteza existe quando se quer fazer alguma afirmação  a respeito dealguma característica populacional baseada em informações  extraídas  de dados amostrais .

    Neste caso, a aplicação da Teoria das Probabilidades  é de fundamental importânciapara a solução de problemas de Inferência Estatística.

    Independente de qual seja a aplicação em particular, a utilização das probabilidadesindica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de umevento futuro. Assim é que em muitos casos, pode ser impossível afirmar com antecipaçãoo que ocorrerá. No entanto, é possível dizer o que pode ocorrer.

    O ponto central em todas essas situações é a possibilidade de quantificar quão provávelé determinado evento.

    Em suma, podemos dizer que, as probabilidades são utilizadas para exprimir a chancede ocorrência de determinado evento.

    4.2 Definições Básicas

    Definição 4.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). São aque-

    les onde o processo de experimentação está sujeito a influências de fatores casuais e conduz a resultados incertos.

    Notação :   E .

    35

  • 8/18/2019 IP 2015.1 Completo

    36/99

    Exemplo 1:

    E 1  :  Jogar uma moeda e observar a face superior.

    E 2  :  Lançar um dado e observar o número da face superior.

    E 3: Uma lâmpada é fabricada. Em seguida é testada a duração da vida útil dessa

    lâmpada.E 4: Numa linha de produção, conta-se o número de peças defeituosas num dia.

    Observações:

    a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmascondições;

    b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrevero conjunto de todos os possíveis resultados do experimento;

    c) Quando o experimento é repetido um grande número de vezes, surgirá uma regula-ridade nos resultados. Esta regularidade, chamada de regularidade estatística, é que tornapossível construir um modelo matemático preciso com o qual se analisará o experimento.

    Definição 4.2   (Espaço Amostral).  É o conjunto de todos os possíveis resultados 

    de um experimento aleatório.

    Notação :   S  ou  Ω.

    Exemplo 2:

    Os espaços amostrais associados aos experimentos aleatórios  E 1, E 2,  E 3 e  E 4 são:

    Ω1 =

    Ω2 =

    Ω3 =

    Ω4 =

    36

  • 8/18/2019 IP 2015.1 Completo

    37/99

    Definição 4.3 (Evento). Dado um espaço amostral  Ω associado a um experimento E ,

    definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquer coleção de resultados do experimento  E .

    Notação :   A,  B, C , D, etc.

    Observações:

    i) Dizemos que o evento   A   ocorre se o resultado do experimento,   ω, pertencer aoevento. Caso contrário, dizemos que  A não ocorre.

    ii) Como os eventos de um espaço amostral são conjuntos, todas as operações dateoria dos conjuntos são válidas para obter novos eventos. Considere, por exemplo, dois

    eventos A e  B, então o evento:

    a) A ∪ B  ocorrerá se, e somente se,  A ocorrer, ou  B  ocorrer, ou ambos ocorrerem;b)  A ∩ B  ocorrerá se, e somente se,  A e  B  ocorrerem simultaneamente;c) A ocorrerá se, e somente se,  A não ocorrer;

    Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamenteempregado quando estivermos combinando conjuntos. Para ilustrar, vejamos como ficaeste diagrama representando os eventos descritos nos itens a, b e c:

    (Desenhar os Diagramas de Venn, para cada evento)

    Observação:  Leis de D’Morgan

    (i)   A ∪ B  = A ∩ B(ii)   A ∩ B  = A ∪ B

    37

  • 8/18/2019 IP 2015.1 Completo

    38/99

    Exemplo 3:

    a) Considerando o espaço amostral Ω2, exemplos de eventos seriam:

    A: Ocorre face par  =

    B: Ocorre um número menor que 4  =

    C : Ocorre um número maior que 0  =D: Ocorre o número 10  =

    b) Considerando o espaço amostral  Ω3, um exemplo de evento seria:

    A: A vida útil de uma lâmpada é menor que 10 horas  =

    Definição 4.4   (Eventos Mutuamente Excludentes).  Dois eventos,   A  e  B, são

    denominados, mutuamente excludentes, se eles não puderem ocorrer simultaneamente,ou seja,  A ∩ B  = φ.

    Exemplo 4: Esboce um Diagrama de Venn, representando dois eventos mutuamenteexcludentes.

    Exemplo 5: Ao lançar um dado e observar o número da face superior, temos que oevento A: observar face par é mutuamente excludente do evento  B: observar face ímpar,

    pois é impossível observar a ocorrência simultânea destes dois eventos, ou seja,  A ∩B  = φ.

    Exemplo 6: Lança-se um dado e observa-se o número da face superior. Considerandoeste experimento aleatório e os eventos:

    A: Ocorre face par  =

    B: Ocorre um número menor que 4  =

    C : ocorre face menor que 7  =

    D: ocorre face cujo valor é maior que 6  =

    Determine em notação de conjuntos os seguintes eventos:

    a)   A ∪ Bb)   A ∩ Bc)   A

    d)   B

    e)   A ∪ B

    38

  • 8/18/2019 IP 2015.1 Completo

    39/99

    f)   A ∩ Bg)   A ∪ Bh)   A ∩ Bi)   A

    −B  = A

    ∩B

     j)   B − A =  B ∩ A

    Exemplo 7: Sejam A  e  B  dois eventos. Expresse as sentenças a seguir em termos deoperações entre eventos:

    a)   A e  B  ocorrem simultaneamente;

    b) Pelo menos um dos eventos ocorre;

    c) Nenhum dos eventos ocorre;

    d) Apenas A ocorre;

    e) Apenas B  ocorre;

    f) Exatamente um dos eventos ocorre.

    4.3 Abordagens para Definir Probabilidade

    4.3.1 Aproximação da Probabilidade pela Frequência Relativa (Lei dosGrandes Números)

    Definição 4.5   (Frequência Relativa).  Suponha que um experimento é repetido  n

    vezes, e sejam   A   e   B   dois eventos associados ao experimento. Seja   nA   o númerode vezes que o evento  A  ocorre nas   n   repetições. A frequência relativa do evento  A,representada por  f A, é definida como

    f A = nA

    n .

    Propriedades:

    (i) 0 ≤ f A ≤ 1;(ii) f A = 1, se, e somente se,  A ocorrer em todas as  n repetições;

    (iii) f A = 0, se, e somente se,  A nunca ocorrer nas  n repetições;

    (iv) Se   A  e   B   forem eventos mutuamente excludentes, e se   f A∪B   for a frequênciarelativa associada ao evento  A ∪ B,  então,

    f A∪B  = f A + f B.

    39

  • 8/18/2019 IP 2015.1 Completo

    40/99

    Teorema 4.1  (Lei dos Grandes Números).  Ao repetir um experimento um grande número de vezes, a probabilidade de um evento A  é aproximada pela frequência relativa,isto é,

    P (A) ∼= f A =  nAn

     ,   quando  n → ∞.

    Observação   : Esta aproximação será tanto melhor quanto maior for o número derepetições do experimento.

    Exemplo 8: Ao lançar uma moeda honesta 5 vezes, ocorreram 4 caras. Baseadoneste resultado, qual a probabilidade (aproximada) do evento  A :  ocorrer cara?

    Exemplo 9: Considere as seguintes situações:

    (i) Numa pesquisa de mercado, 5 pessoas foram entrevistadas das quais 4 disseram quecomprariam um novo produto a ser lançado.

    (ii) Numa outra pesquisa de mercado, 300 pessoas foram entrevistadas das quais 140disseram que comprariam um novo produto a ser lançado.

    a) Para cada pesquisa, determine a probabilidade de que uma pessoa qualquer compreo novo produto.

    b) Em qual das duas probabilidades estimadas você confia mais?

    4.3.2 Definição Clássica de Probabilidade

    4.3.2.1 Introdução e definição

    Definição 4.6   (Evento Simples e Evento Composto).  Cada um dos possíveis 

    resultados que compõe o espaço amostral  e1, e2, e3, . . .  é um evento simples, enquantoum evento composto,  A, é uma coleção de eventos simples.

    40

  • 8/18/2019 IP 2015.1 Completo

    41/99

    Exemplo 10: Ao lançar um dado, os eventos simples serão: {1}, {2}, {3}, {4}, {5} e{6} e um evento composto seria  A : número par = {2, 4, 6}.

    Definição 4.7   (Definição Clássica de Probabilidade).  Suponha que um expe-

    rimento tenha   n   eventos simples diferentes, cada um dos quais pode ocorrer com a mesma chance. Se  r eventos simples são favoráveis à ocorrência do evento  A, então

    P (A) = Número de eventos simples favoráveis à ocorrência do evento  A

    Número total de resultados possíveis   =

     #A

    #Ω =

      r

    n.

    Observações:

    (1) Nesta definição é fundamental que os eventos simples sejam igualmente prováveis,e, neste caso, é evidente que:

    (i)  P (e1) = P (e2) = ...  =  P (en) =   1n , e(ii)  P (e1) + P (e2) + ... + P (en) =   1n +

      1n

     + ... +   1n

     = n. 1n

     = 1.

    (2) Espaços amostrais com as características acima descritas são conhecidos comoEspaços Amostrais Finitos e Equiprováveis.

    (3) O evento  Ω  é denominado evento certo, pois P (Ω) =   #Ω#Ω

     = 1.

    (4) O evento  φ  é denominado evento impossível, pois  P (φ) =   #φ#Ω

     =   0#Ω

     = 0.

    Exemplo 11: Considere o experimento  E : lançar um dado equilibrado e observar onúmero da face superior. Considere também, os seguintes eventos:

    .   A: Ocorre face par  =

    .   B: Ocorre um número menor que 4  =

    .   C : ocorre face menor que 7  =

    .   D: ocorre face cujo valor é maior que 6  =

    .   A ∩ B  =

    .   A

    ∪B  =

    .   B  =

    Determine a probabilidade de ocorrência de cada um dos eventos acima definidos.

    41

  • 8/18/2019 IP 2015.1 Completo

    42/99

    4.3.3 Definição Axiomática de Probabilidade

    Definição 4.8 (Definição Axiomática de Probabilidade). Dado um espaço amos-

    tral  Ω, a probabilidade de um evento  A ocorrer, representado por  P  (A) , é uma funçãodefinida em  Ω, que associa a cada evento  A um número real, satisfazendo os seguintes 

    axiomas:(i) 0 ≤ P  (A) ≤ 1;(ii)  P  (Ω) = 1;

    (iii) Se A e B forem mutuamente excludentes  (A ∩ B  = φ), entãoP  (A ∪ B) = P  (A) + P  (B) .

    Observação:  A probabilidade de um evento A, denotada por  P  (A) , indica a chancede ocorrência do evento A. Quanto mais próxima de 1 é   P  (A), maior é a chance de

    ocorrência do evento A, e quanto mais próxima de zero, menor é a chance de ocorrênciado evento A.

    Principais Teoremas:

    T1. Se  φ denota o conjunto vazio (Evento Impossível), então

    P  (φ) = 0.

    T2. Se  A é o evento complementar de A, então

    P (A) = 1 − P  (A) .

    T3. Se A e B são dois eventos quaisquer, entãoP  (A ∪ B) = P  (A) + P  (B) − P  (A ∩ B) .

    T4.P 

    A ∩ B = P  (A) − P  (A ∩ B) .P 

    A ∩ B = P  (B) − P  (A ∩ B) .Exemplo 12: Considere um experimento aleatório com espaço amostral Ω e os eventos

    A e  B  associados tais que:   P (A) = 1/2,  P (B) = 1/3 e  P (A

    ∩B) = 1/4. Determine:

    a) P (A)

    b)  P (B)

    c) P (A ∪ B)d)  P (A ∩ B)e) P (A ∪ B)f)  P (A ∩ B)g)  P (A ∩ B)

    42

  • 8/18/2019 IP 2015.1 Completo

    43/99

    4.4 Noções Básicas de Técnicas de Contagem

    Nem sempre a tarefa de calcular a probabilidade de um evento aleatório, da formaP (A) = r/n, é simples. Em algumas situações é necessário alguns procedimentos sistemá-ticos de contagem ou enumeração para se obter o número de maneiras,  r, pelas quais  A

    pode ocorrer, bem como o número total de maneiras,  n, pelas quais o espaço amostral  S pode ocorrer.

    É no contexto descrito acima, que as técnicas de contagem são de fundamental im-portância. Neste curso, veremos apenas alguns dos principais procedimentos de contagem.

    4.4.1 Princípio Fundamental da Contagem - Regra da Multiplicação

    Suponha que um experimento possa ser realizado em k etapas, de modo que, para a primeira

    etapa existem n1 resultados possíveis, para a segunda etapa  n2 resultados possíveis, e assimsucessivamente, até que para a  k − ésima etapa existem  nk  resultados possíveis. Então,existe um total de

    n1 × n2 × .... × nkresultados possíveis para este experimento.

    Exemplo 13: Ao lançar um dado e uma moeda, quantos resultados possíveis podemser obtidos? Resp.: 12

    Exemplo 14: Uma companhia produz fechaduras que usam segredos numéricos paraserem abertas. Se cada segredo consiste de três números distintos, escolhidos dentre osinteiros de  0 a  9, quantos segredos diferentes poderão ser fabricados? Resp.: 720

    Exemplo 15: Quantos números naturais de 4 algarismos podem ser formados usando-se apenas os algarismos 2, 3, 4 e 5, de forma que sejam menores do que 5000 e divisíveispor 5? Resp.: 48

    4.4.2 Permutações

    Dizemos que permutações  de n  elementos distintos são as sequências formadas com todosos n elementos e que se destinguem umas das outras pela ordem de seus elementos. Assim,permutar os  n objetos equivale a colocá-los dentro de uma caixa com  n compartimentos,em alguma ordenação.

    Notação:   P nn  ou, simplesmente, P n.

    43

  • 8/18/2019 IP 2015.1 Completo

    44/99

    Aplicando, então, a regra da multiplicação, temos que a caixa poderá ser arrumada den(n − 1)(n − 2) · · · 1 maneiras e, assim,

    P n = n(n − 1)(n − 2) · · · 1.Definição 4.9  (Fatorial).  Sendo  n um inteiro positivo, definimos  n! = n(n − 1)(n −

    2) · · · 1 e o denominamos de fatorial de  n. Também definimos  0! = 1.Desta maneira, temos que:

    P n = n!.

    4.4.3 Arranjos

    Dado um conjunto de n  elementos, chama-se de  arranjo simples  dos n  elementos tomadosk   a   k   (0  ≤   k  ≤   n) a toda sequência de   k   elementos distintos do conjunto, que sedestingue das demais pela ordem dos seus elementos. assim, arranjar  n  objetos equivale

    a colocá-los dentro de uma caixa com  n compartimentos, em alguma ordenação, um emcada compartimento, até que o  k-ésimo compartimento seja preenchido.

    Notação:   Ank .

    Desta forma, aplicando-se a regra da multiplicação, temos que:

    Ank  = n(n − 1)(n − 2) · · · (n − k + 1).Note que:

    n! = n(n

    −1)(n

    −2)

    · · ·(n

    −k + 1)(n

    −k)!

    ⇒ n(n − 1)(n − 2) · · · (n − k + 1) =   n!(n − k)! .

    Portanto,

    Ank  =  n!

    (n − k)!Observação: Note que, se  k  =  n, temos

    Ann =  n!

    (n − n)!  = n!

    0!  = n! = P n,

    ou seja, permutações são casos particulares de arranjos.

    Exemplo 16: De um baralho com 52 cartas, 3 cartas são retiradas sucessivamente esem reposição. Quantas sequências de cartas são possíveis de se obter?

    Exemplo 17: De quantas maneiras podemos dispor 8 pessoas em um banco com 8lugares?

    Exemplo 18: Quantos são os anagramas da palavra ALUNO?

    44

  • 8/18/2019 IP 2015.1 Completo

    45/99

    4.4.4 Combinações

    Chamamos de   combinações  de  n objetos distintos tomados  k a  k ao número de maneirasde escolher  k dentre esses  n objetos, sem considerarmos a ordem.

    Notação:   C n

    k   ou   nk .Considerando que Ank  leva em consideração a ordem em que os  k  elementos são esco-

    lhidos, e que  k elementos podem ser permutados de  k! maneiras, temos que:

    C nk   = Ank

    k!  =

      n!

    (n − k)!1

    k! =

      n!

    k!(n − k)! .

    Portanto,

      nk

    =   n!

    k!(n−k)!.

    Exemplo 19: Qual é o número de possíveis empreendimentos quando desejamosselecionar dois dentre quatro? Resp: 6

    Exemplo 20: Suponha que num lote com 20 peças existem cinco defeituosas. Esco-lhemos 4 peças do lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que aordem dos elementos seja irrelevante:

    a) Quantas amostras possíveis existem? Resp: 4845

    b) Dentre todos os possíveis resultados, quantos levam à escolha de duas peças defei-

    tuosas? Resp.: 1050c) Qual é a probabilidade de sair duas peças defeituosas? Resp.: 0,217

    45

  • 8/18/2019 IP 2015.1 Completo

    46/99

    4.5 Probabilidade Condicional

    Em algumas situações, a probabilidade de ocorrência de um certo evento pode serafetada se tivermos alguma informação sobre a ocorrência ou não de um outro evento.Considere, por exemplo, o seguinte experimento:

    E  : Lançar um dado.Seja o evento  A: sair o  no 3  =

    Então, P (A) =

    Considere, agora, o seguinte evento:

    B: sair um número ímpar  =

    Logo,  P (B) =

    Suponha, agora, que soubéssemos da ocorrência de  B  e que quiséssemos calcular aprobabilidade de  A. Iremos denotar essa probabilidade como  P (A | B). Assim,

    P (A | B) =Formalmente definimos probabilidade condicional da seguinte maneira.

    Definição 4.10   (Probabilidade Condicional).  Dados dois eventos,  A  e  B, deno-

    taremos  P (A | B) a probabilidade condicionada do evento  A, quando  B  tiver ocorrido,por:

    P (A | B) =  P (A ∩ B)P (B)

    com  P (B) = 0.

    Exemplo 21: Dois dados são lançados e os seguintes eventos são considerados:

    A = {(x1, x2); x1 + x2 = 10}, eB  = {(x1, x2); x1 > x2}.Baseado nestas informações, obtenha as seguintes probabilidades:

    a)   P (A)

    b)   P (B)

    c)   P (A ∩ B)d)   P (A | B)e)   P (B | A)

    Resp.: 1/12; 5/12; 1/36; 1/15 e 1/3

    46

  • 8/18/2019 IP 2015.1 Completo

    47/99

    4.5.1 Teorema do Produto

    A partir da definição de probabilidade condicional, poderemos enunciar o teorema doproduto:

    Teorema 1.2  (Teorema do Produto)

    P (A | B) =   P (A∩B)P (B)

      ⇒ P (A ∩ B) = P (B)P (A | B).Analogamente,

    P (B | A) =   P (A∩B)P (A)

      ⇒ P (A ∩ B) = P (A)P (B | A).

    Exemplo 22: Em um lote de 12 peças, 4 são defeituosas. Se duas peças são retiradasuma após a outra sem reposição, qual a probabilidade de que:

    a) ambas sejam boas? Resp.: 14/33

    b) ambas sejam defeituosas? Resp.: 1/11c) pelo menos uma seja defeituosa? Resp.: 19/33

    Exemplo 23: Uma urna contém duas bolas brancas, três vermelhas e cinco azuis.Qual a probabilidade de se retirar sem reposição uma bola azul, uma branca e uma vermelhaexatamente nessa ordem? Resp.: 1/24

    4.6 Eventos Independentes

    A probabilidade da ocorrência de dois eventos simultaneamente,  P (A ∩ B), dependeda natureza dos eventos, ou seja, se eles são independentes ou não. Dois ou mais eventossão independentes quando a ocorrência ou não-ocorrência de um não influencia a ocorrênciado(s) outro(s).

    Um evento  A  é considerado independente de um outro evento  B  se a probabilidadecondicional de  A dado  B  é igual a probabilidade de  A, isto é, se

    P (A | B) = P (A).

    47

  • 8/18/2019 IP 2015.1 Completo

    48/99

    É evidente que se  A  é independente de  B , então  B  é independente de  A. Assim,

    P (B | A) = P (B).

    Logo, considerando o  Teorema do Produto , observamos que, se  A e  B  forem eventosindependentes, segue que

    P (A ∩ B) = P (A)P (B).

    Observação: A recíproca é verdadeira, isto é, se  P (A ∩ B) = P (A)P (B), então  Ae  B  são eventos independentes.

    Definição 4.11  (Eventos Independentes).  Dois eventos  A e  B  são independentes 

    se, e somente se P (A ∩ B) = P (A)P (B).

    Exemplo 24: Se duas moedas equilibradas (sem vício) são lançadas, determine qual aprobabilidade de ambas darem cara? E se três moedas fossem lançadas, qual a probabilidadede ocorrer três caras? Resp.: 1/4 e 1/8

    Exemplo 25: A probabilidade de que A resolva um problema é de   2/3, e a pro-babiliddae de que B o resolva é de  3/4. Se ambos tentarem independentemente, qual aprobabilidade de:

    a) Ambos resolverem o problema? Resp.: 1/2

    b) O problema ser resolvido? Resp.: 11/12

    48

  • 8/18/2019 IP 2015.1 Completo

    49/99

    4.7 Teorema da Probabilidade Total

    Definição 4.12 (Partição do Espaço Amostral). Dizemos que os eventos  C 1, C 2,...,C n

    representam uma partição do espaço amostral  Ω, quando

    a)  C i∩

    C  j  = φ, para todo  i

     = j ,

    b) ∪ni=1C i = Ω,c)  P (C i) >  0, para todo  i.

    Considere, agora, um evento   B   referente a   Ω, e   C 1, C 2,...,C n  uma partição de   Ω.Assim, podemos escrever

    B  = (B ∩ C 1) ∪ (B ∩ C 2) ∪ (B ∩ C 3) ∪ ... ∪ (B ∩ C n).

    Logo,

    P (B) = P (B ∩ C 1) + P (B ∩ C 2) + P (B ∩ C 3) + ... + P (B ∩ C n).

    Então, como P (B∩C  j) = P (C  j )P (B | C  j), obteremos o que se denomina o Teoremada Probabilidade Total:

    P (B) = P (C 1)P (B | C 1) + P (C 2)P (B | C 2) + ... + P (C n)P (B | C n).

    Exemplo 26: A proporção de peças produzidas pelas máquinas I, II e III é 30%, 30% e40%, respectivamente. Dentre estas peças, 4%, 3% e 2%, respectivamente, são defeituosas.

    Escolhida uma peça da produção conjunta das três máquinas, qual a probabilidade damesma ser defeituosa? Resp.: 0,029

    4.8 Teorema de Bayes

    Sob as mesmas hipóteses do teorema da probabilidade total, podemos calcular a pro-babilidade de  C i dada a ocorrência de  B  da seguinte forma

    P (C i | B) =   P (C i)P (B | C i)n j=1 P (C  j)P (B | C  j)

    , i = 1, 2,...,n.

    Este resultado   é o que chamamos de   Teorema de Bayes. Esse teorema é útilquando conhecemos as probabilidades dos  C 

    i s e a probabilidade condicional de B  dado C i,mas não conhecemos diretamente a probabilidade de  B.

    49

  • 8/18/2019 IP 2015.1 Completo

    50/99

    Exemplo 27: Considerando os dados do  Exemplo 26, suponha que uma peça es-colhida aleatoriamente, foi testada e verificou-se ser defeituosa. Qual é a probabilidade deque a peça tenha sido produzida pela máquina  I? E pela máquina   II? E pela  III? Resp.:0,414; 0,31 e 0,276

    Exemplo 28: Suponha três urnas com as seguintes configurações: a urna 1 contém3 bolas pretas, 1 branca e 5 vermelhas; a urna 2 contém 4 bolas pretas, 3 brancas e 2vermelhas; a urna 3 contém 2 bolas pretas, 3 brancas e 3 vermelhas. Escolheu-se uma urnaao acaso e dela extraiu-se uma bola ao acaso, verificou-se que a bola é branca. Qual aprobabilidade da bola ter vindo da urna 1, 2? E da 3? Resp.: 0,136; 0,407 e 0,458

    Exemplo 29: Você entrega ao seu amigo uma carta, destinada a sua namorada, para

    ser colocada no correio. Entretanto, ele pode esquecer com probabilidade 0,1. Se nãoesquecer, a probabilidade de que o correio extravie a carta é de 0,1. Finalmente, se foienviada pelo correio, a probabilidade de que a namorada não a receba é de 0,1.

    a) Sua namorada não recebeu a carta, qual a probabilidade de seu amigo ter esquecidode colocá-la no correio?

    b) Avalie as possibilidades desse namoro continuar, se a comunicação depender dascartas enviadas.

    50

  • 8/18/2019 IP 2015.1 Completo

    51/99

    4a LISTA DE EXERCÍCIOS

    1 - De uma linha de produção são retirados três (3) artigos e cada um é classificadocomo bom (B) ou defeituoso (D). Determine o espaço amostral deste experimentoaleatório e expresse também o evento  A: obter dois artigos defeituosos.

    2 - Pedro tem dois automóveis velhos. Se nas manhãs frias, há 20% de probabilidade deum deles não funcionar e 30% de outro não funcionar,

    a) qual a probabilidade de nenhum funcionar? Resp.: 0,06

    b) qual a probabilidade dos dois funcionarem? Resp.: 0,56

    c) qual a probabilidade de pelo menos um funcionar? Resp.: 0,94

    d) qual a probabilidade de exatamente um funcionar? Resp.: 0,38

    3 - Considere o lançamento de dois dados equilibrados com o interesse de observar o

    número das faces superiores.a) Calcule a probabilidade dos eventos:

    i) A: sair face par nos dois dados. Resp.: 1/4ii) B: sair face par no primeiro dado. Resp.: 1/2

    iii) C: sair face par no segundo dado. Resp.: 1/2

    d) Os eventos B e C são independentes? Resp.: Sim.

    4 - De 120 estudantes, 60 estudam Francês, 50 Espanhol e 20 estudam Francês e Es-panhol. Se um estudante é escolhido ao acaso, encontre a probabilidade de que

    ele:a) estude Francês e Espanhol? Resp.: 1/6

    b) estude pelo menos uma das línguas? Resp.: 3/4

    c) não estude nem Francês nem Espanhol? Resp.: 1/4

    5 - A empresa Mar e Sol Pousadas Ltda. possui 350 funcionários. Destes, 280 possuemplano de saúde particular, 180 possuem plano de saúde coletivo e 30 não possuemplano de saúde de nenhum dos dois tipos. Calcule a probabilidade de um funcionárioescolhido ao acaso:

    a) Não possuir plano de saúde. Resp.: 3/35

    b) Possuir pelo menos um dos planos. Resp.: 32/35

    c) Possuir ambos os planos. Resp.: 14/35

    d) Possuir exatamente um dos planos. Resp.: 18/35

    6 - Em uma prova caíram dois problemas. Sabe-se que 134 alunos acertaram o primeiro,88 erraram o segundo, 120 acertaram os dois e 56 acertaram apenas um problema.Qual a probabilidade de que um aluno, escolhido ao acaso:

    51

  • 8/18/2019 IP 2015.1 Completo

    52/99

    a) Tenha acertado exatamente um dos problemas. Resp.: 56/250

    b) Tenha acertado pelo menos um dos problemas. Resp.: 176/250

    c) Tenha acertado apenas o segundo problema. Resp.: 42/250

    d) Não tenha acertado problema algum. Resp.: 74/250

    7 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja sabera probabilidade de um computador falhar durante os dois primeiros anos. Sabendo-seque só existem duas possibilidades; ou o computador falha durante os dois primeirosanos ou não falha, qual é essa probabilidade? Agora se você conhecesse o resultadode uma pesquisa do PC World feita com 4000 usuários de computadores, na qualrevela que 992 computadores falham durante os dois primeiros anos, qual será aprobabilidade estimada? Resp.: 0,5 e 0,248.

    8 - Um terço dos eleitores de certa comunidade é constituido de mulheres, e 40% doseleitores votaram na última eleição presidencial. Supondo que esses dois eventossejam independentes, determine a probabilidade de escolher um eleitor da lista geral,que seja mulher e que tenha votado na última eleição presidencial. Resp.: 0,13

    9 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sairduas bolas pretas supondo que os sorteios são feitos com reposição? Resp.: 25/49

    10 - Se cada carta de um baralho de 52 cartas tem a mesma chance de ser escolhida,então qual é a probabilidade de:

    a) se extrair cada uma delas? Resp.: 1/52

    b) de se extrair uma dama? Resp.: 4/52

    11 - Qual a probabilidade de se obter três ou menos pontos no lançamento de um dado?Resp.: 1/2

    12 - Uma urna contém duas bolas brancas, três pretas e cinco azuis.

    a) Qual a probabilidade de se extrair uma bola branca? Resp.: 1/5

    b) Qual a probabilidade de se extrair uma bola preta ou uma azul? Resp.: 4/5

    13 - No lançamento de dois dados qual a probabilidade de sair o par (5,2)? Resp.: 1/36

    14 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 eque a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de umacriança seja menino é 0.52, qual é a probabilidade de que:

    a) A segunda criança seja um menino, sabendo-se que o primeiro é um menino?Resp.: 0,577.

    b) A segunda criança seja uma menina, sabendo-se que a primeira é uma menina?Resp.: 0,542.

    15 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas sãoretiradas ao acaso, sem reposição, determine a probabilidade de três bolas verdesocorrerem. Resp.: 0,0083.

    52

  • 8/18/2019 IP 2015.1 Completo

    53/99

    16 - A probabilidade de que um time de futebol vença seu próximo oponente é estimadaem 0,7 se não chover, mas só em 0,5 se chover. Se os registros meteorológicosmostrarem que choveu 40 por cento das vezes, na data do jogo, nos anos passados,qual a probabilidade de que o time vença seu próximo oponente? Resp.: 0,62.

    17 - Empregados de certa firma são submetidos a um teste de aptidão quando empregados

    pela primeira vez. A experiência mostrou que dos 60 por cento que passaram no teste,80 por cento deles eram bons trabalhadores, enquanto dos 40 por cento dos que nãoconseguiram passar só 30 por cento foram avaliados como bons trabalhadores. Quala probabilidade de que um empregado escolhido ao acaso seja um bom trabalhador?Use aqui a técnica da árvore. Resp.: 0,60.

    18 - Suponhamos que seja  p  a probabilidade de que o tempo (com sol ou nublado) seja omesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois deamanhã tenhamos também um dia de sol? Resp.:   2 p2 − 2 p + 1

    19 - Um saco contém três moedas, uma das quais foi cunhada com duas caras, enquanto

    as outras duas são normais e não viciadas. Uma moeda é retirada ao acaso e jogada.Dado que o resultado foi cara, qual a probabilidade de que essa seja a moeda de duascaras? Resp.: 0,5.

    20 - As probabilidades de que três homens atinjam um alvo são, respectivamente,   16

    ,  14  e   1

    3.

    Cada um atira uma vez em direção ao alvo.

    a) Determine a probabilidade  p de que exatamente um deles atinja o alvo. Resp.:0,431.

    b) Se apenas um atinge o alvo, qual a probabilidade de ele ser o primeiro homem?

    Resp.: 0,194.

    53

  • 8/18/2019 IP 2015.1 Completo

    54/99

    5 Variáveis Aleatórias

    5.1 Introdução

    Ao descrever um espaço amostral  Ω associado a um experimento  E , podemos obser-

    var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, porexemplo, o seguinte experimento:

    E 1: Lançar duas moedas e observar a face superior de cada uma.

    Neste experimento, temos  Ω = {CC,CK,KC,KK } e, na prática, o que realmentepodemos estar interessados em observar é, por exemplo, o número de vezes que ocorrecara (C), ou seja, temos interesse num número real que está associado a cada resultado doespaço amostral  Ω.

    Definição 5.1   (Variável Aleatória).   Seja   E   um experimento aleatório e   Ω   um 

    espaço amostral associado ao experimento. Dizemos que a  função X  é uma  variávelaleatória  quando associa a cada elemento do espaço amostral,   ω ∈   Ω, um númeroreal, x =  X (ω).

    Notação:   X ,  Y , Z , etc.

    Esquematicamente, temos:

    (Esboçar a função (ou variável aleatória) que associa a cada elemento

    do espaço amostral,   ω ∈ Ω, um número real,   x =  X (ω)   )

    54

  • 8/18/2019 IP 2015.1 Completo

    55/99

    Exemplo 1: Considere o experimento

    E 1: Lançar duas moedas e observar a sequência de caras (C) e coroas (K).

    Se  X  é a variável aleatória que representa o número de vezes que ocorre cara (C):

    a) Descreva o espaço amostral, Ω, e obtenha os possíveis valores que a variável aleatóriaX  pode assumir.

    b) Represente através de um gráfico o espaço amostral e a função X  = X (ω), isto é, avariável aleatória  X .

    Solução:

    Através do Exemplo 1, podemos notar que, ao descrever um espaço amostral  Ω  as-sociado a um experimento  E , não necessariamente, um resultado individual é um número.Neste exemplo, vimos que  Ω = {KK,CK,KC,CC } e, na prática, o que realmente po-demos estar interessados em observar é o número de vezes que ocorre cara (C), ou seja,temos interesse num número real que está associado a cada resultado do espaço amostralΩ.

    Definição 5.2   (Eventos Equivalentes).  Sejam um experimento   E   e seu espaço

    amostral  Ω