4_apostila de Estatística i

Embed Size (px)

Citation preview

  • 1

    FACULDADE UNIVILA CURSO DE ADMINISTRAO

    APOSTILA DE ESTATSTICA I

    Vila Velha 2004

    Este trabalho contm uma compilao de textos de diversos autores, tendo sido elaborado com o objetivo exclusivo de ser um apoio didtico para o aluno em sala de aula. Professora Walquiria Torezani

  • 2

    I - A Natureza da Estatstica

    1- Panorama Histrico

    A origem da palavra Estatstica est associada palavra latina STATUS (Estado). H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito e at mesmo o 4o. livro do Velho Testamento faz referncia a uma instruo dada a Moiss, para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear. Usualmente, estas informaes eram utilizadas para a taxao de impostos ou para o alistamento militar. O Imperador Csar Augusto, por exemplo, ordenou que se fizesse o Censo de todo o Imprio Romano.

    Contudo, mesmo que a prtica de coletar dados sobre colheitas, composio da populao humana ou de animais, impostos, etc., fosse conhecida pelos egpcios, hebreus, caldeus e gregos, e se atribuam a Aristteles cento e oitenta descries de Estados, apenas no sculo XVII a Estatstica passou a ser considerada disciplina autnoma, tendo como objetivo bsico descrio dos BENS do Estado.

    A palavra Estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall (1719-1772), que foi um notvel continuador dos estudos de Hermann Conrig (1606-1681). Gottfried determinou os objetivos da Estatstica e suas relaes com as demais cincias.

    Com a Escola Alem as tabelas tornaram-se mais completas, surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes desse todo (amostras).

    Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus processos e tcnicas, Tm contribudo para a organizao dos negcios e recursos do mundo moderno.

    2- O que Estatstica?

    A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.

    A utilizao de tcnicas, destinadas anlise de situaes complexas ou no, tem aumentado e faz parte do nosso cotidiano. Tome-se, por exemplo, as transmisses esportivas. Em um jogo de futebol, o nmero de escanteios, o nmero de faltas cometidas e o tempo de posse de bola so dados fornecidos ao telespectador e fazem com que a concluso sobre qual time foi melhor em campo se torne objetiva (no que isso implique que tenha sido o vencedor...). O que tem levado a essa qualificao de nossas vidas no dia a dia?

    Um fator importante a popularizao dos computadores. No passado, tratar uma grande massa de nmeros era uma tarefa custosa e cansativa, que exigia horas de trabalho tedioso. Recentemente, no entanto, grandes quantidades de informaes podem ser analisadas rapidamente com um computador pessoal e programas adequados. Desta forma o computador contribui, positivamente, na difuso e uso de mtodos estatsticos. Por outro lado, o computador possibilita uma automao que pode levar um indivduo sem preparo especfico a utilizar tcnicas inadequadas para resolver um dado problema. Assim, necessria a compreenso dos conceitos bsicos da Estatstica, bem como as suposies necessrias para o seu uso de forma criteriosa.

    A grosso modo podemos dividir a Estatstica em trs reas: Estatstica Descritiva Probabilidade Inferncia Estatstica

    Vamos caracterizar estas trs reas

  • 3

    Estatstica Descritiva

    A Estatstica Descritiva pode ser definida como um conjunto de tcnicas destinadas a descrever e resumir dados, a fim de que possamos tirar concluses a respeito de caractersticas de interesse. Em geral utilizamos a Estatstica Descritiva na etapa inicial da anlise quando tomamos contato com os dados pela primeira vez. Objetivando tirar concluses de modo informal e direto, a maneira mais simples seria a observao dos valores colhidos. Entretanto ao depararmos com uma grande massa de dados percebemos, imediatamente, que a tarefa pode no ser simples.Para tentar retirar dos dados informaes a respeito do fenmeno sob estudo, preciso aplicar algumas tcnicas que nos permitam simplificar a informao daquele particular conjunto de valores. A finalidade da Estatstica Descritiva tornar as coisas mais fceis de entender, de relatar e discutir.

    A mdia industrial Dow-Jones, a taxa de desemprego, o custo de vida, o ndice pluviomtrico, a quilometragem mdia por litro de combustvel, as mdias de estudantes so exemplos de dados tratados pela Estatstica Descritiva.

    Probabilidade A Probabilidade pode ser pensada como o teoria matemtica utilizada para estudar a incerteza oriunda de fenmenos que envolvem o acaso. Jogos de dados e de cartas, ou o lanamento de uma moeda para o ar enquadram-se na categoria do acaso. A maioria dos jogos esportivos tambm influenciada pelo acaso at certo ponto. A deciso de um fabricante de cola de empreender uma grande campanha de propaganda visando a aumentar sua participao no mercado, a deciso de parar de imunizar pessoas com menos de vinte anos contra determinada doena, a deciso de arriscar-se a atravessar uma rua no meio do quarteiro, todas utilizam a probabilidade consciente ou inconscientemente. Inferncia Estatstica Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao, a um grande conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de valores, usualmente de dimenses muito menores. Deve-se notar que se tivermos acesso a todos os elementos que desejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica; entretanto, elas so indispensveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza econmica, tica ou fsica.

    Estudos complexos que envolvem o tratamento estatstico dos dados, usualmente incluem as trs reas citadas acima. 3 - Fases do Trabalho Estatstico O trabalho estatstico um mtodo cientfico, que consiste das cinco etapas bsicas seguintes:

    1- Coleta e crtica de dados 2- Tratamento dos dados 3- Apresentao dos dados 4- Anlise e interpretao dos resultados 5- Concluso

  • 4

    Vamos tratar cada uma dessas etapas:

    Coleta e crtica dos dados Aps definirmos cuidadosamente o problema que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio.

    A coleta pode ser direta ou indireta. A coleta direta quando feita sobre elementos informativos de registro

    obrigatrio (nascimentos, casamentos e bitos, importao e exportao de mercadorias), elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de inquritos e questionrios.

    A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) Contnua quando feita continuamente, tal como a de nascimentos e bitos

    e a de freqncia dos alunos s aulas. b) Peridica quando feita em intervalos constantes de tempo, como os censos

    e as avaliaes mensais dos alunos. c) Ocasional Quando feita extemporaneamente, a fim de atender a uma

    conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.

    A coleta se diz indireta quando inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos por uma coleta direta. Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou certo vulto, que possam influir sensivelmente nos resultados.

    A crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas; interna quando visa observar os elementos originais dos dados da coleta.

    Tratamento dos dados

    Nada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao Pode ser manual ou eletrnica.

    Apresentao dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada tabelas e grficos tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico.

    Coleta

    Amostragem

    Censo

    Tratamento

    Apresentao

    Anlise

    Concluso

  • 5

    Anlise dos resultados

    Aps a apresentao dos dados devemos calcular as medidas tpicas convenientes para fazermos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Indutiva ou Inferencial, e tirarmos desses resultados concluses e previses. Concluso

    de responsabilidade de um especialista no assunto que est sendo pesquisado, que no necessariamente um estatstico, relatar as concluses de maneira que sejam facilmente entendidas por quem as for usar na tomada de decises.

    4 - A Estatstica nas Empresas

    No mundo atual, a empresa uma das vigas-mestra da economia dos povos.A

    direo de uma empresa de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decises, e o conhecimento e o uso da Estatstica facilitaram seu trplice trabalho de organizar, dirigir e controlar a empresa.

    Por meio de sondagem, de coleta de dados e de recenseamento de opinies, podem conhecer a realidade social, os recursos naturais, humanos e financeiros disponveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcanados a curto, mdio ou longo prazo.

    A Estatstica ajudar em tal trabalho, como tambm na seleo e organizao da estratgia a ser a dotada no empreendimento e, ainda, na escolha das tcnicas de verificao e avaliao da qualidade e da quantidade do produto e mesmo das possveis lucros e/ou perdas.

    Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para evitar esquecimento, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho.

    O esquema do planejamento o plane, que pode ser resumido, com o auxilio da Estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos clculos matemticos-estatisticos que lhes deram origem.

    O homem de hoje, em suas mltiplas atividades, lana mo de tcnicas e processos estatsticos, e s estudando-os evitaremos o erro das generalizaes apresentadas a respeito de tabelas e grficos apresentados em jornais, revistas e televiso, freqentemente cometido quando se conhece apenas por cima um pouco de Estatstica.

  • 6

    II Amostragem 1- Populao e Amostras

    Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum

    denominamos Populao estatstica ou universo estatstico. Esse termo refere-se no somente a uma coleo de indivduos, mas tambm

    ao alvo sobre o qual reside nosso interesse. Assim, nossa populao pode ser tanto todos os habitantes de Vila Velha, como todas as lmpadas produzidas por uma fbrica em um certo perodo de tempo, ou todo o sangue no corpo de uma pessoa.

    Como em qualquer estudo estatstico temos em mente pesquisar uma ou mais caractersticas dos elementos de alguma populao, esta caracterstica deve estar perfeitamente definida. E isso se d quando, considerando um elemento qualquer, podemos afirmar, sem ambigidade, se esse elemento pertence ou no populao. Vamos entender que, em Estatstica, a palavra populao tem significado muito mais amplo do que no vocabulrio leigo. Para o estatstico, todos os valores que uma varivel pode assumir, nos elementos de um conjunto, constitui uma populao.

    Algumas vezes podemos acessar toda a populao para estudarmos caractersticas de interesse, mas em muitas situaes, tal procedimento no pode ser realizado, por impossibilidade ou inviabilidade econmica ou temporal. Por exemplo, uma empresa no dispe de verba suficiente para saber o que pensa todos os consumidores de seus produtos. H ainda razes ticas, quando, por exemplo, os experimentos de laboratrio envolvem o uso de seres vivos. Alm disso, existem casos em que a impossibilidade de acessar toda a populao de interesse incontornvel como no caso da anlise do sangue de uma pessoa ou em um experimento para determinar o tempo de funcionamento das lmpadas produzidas por uma indstria.

    Tendo em vista as dificuldades de vrias naturezas para observar todos os elementos da populao, tomaremos alguns deles para formar um grupo a ser estudado. A essa parte proveniente da populao em estudo denominamos amostra.

    Uma amostra um subconjunto finito de uma populao.

    Etapas da anlise estatstica.

    Estatstica descritiva Consistncias dos dados Interpretaes iniciais

    Populao

    Amostra

    Inferncia Estatstica Estimao de quantidades desconhecidas

    Extrapolao dos resultados Teste de Hipteses

  • 7

    Os pesquisadores trabalham com amostras. Primeiro, porque as populaes infinitas s podem ser estudadas atravs de amostras. As populaes finitas muito grandes tambm s podem ser estudadas atravs de amostras. Finalmente, o estudo cuidadoso de uma amostra tem mais valor cientifico do que o estudo rpido de toda a populao.

    Exemplos:

    De populao infinita: A produo futura de uma mquina.

    As extraes, com repetio das bolas de uma urna. Os nascimentos de bebs.

    O nmero de peixes do mar constitui uma populao finita muito grande, pois esse nmero , em dado momento, matematicamente finito, mas to grande que pode ser considerado infinito para finalidade pratica.

    Os alunos de uma sala de aula, os produtos de um supermercado, os livros de uma biblioteca, os automveis de vila velha, so exemplos de populaes finitas.

    A distino entre populao e amostra fundamental porque com base nos dados de uma amostra que os estatsticos inferem sobre a populao. Exemplo: Uma pesquisa de opinio para saber o resultado das eleies para o governo do estado de So Paulo em 1988, a populao considerada foram todos os eleitores do estado e para constituir a amostra o IBOPE coletou a opinio de cerca de 1600 eleitores. As medidas estatsticas obtidas com base na populao so denominadas parmetros. As medidas obtidas com base em amostras so denominadas estimativas. Tanto parmetros quanto estimativas so numricos a nica diferena o fato de os parmetros serem obtidos com base na populao e as estimativas com base nas amostras. Os parmetros so em geral desconhecidos porque, na pratica, no possvel observar toda a populao. Mas, como j disse algum, no preciso beber todo o vinho para saber que gosto ele tem. Ento o pesquisador obtm uma amostra para ter uma idia do valor do parmetro. Embora nenhum plano de amostragem possa garantir que a amostra seja exatamente semelhante populao da qual foi extrada, se a amostra for suficientemente grande e obtida com a tcnica correta, na maioria das vezes, poderemos estimar o valor do erro possvel, isto dizer quo prxima esta a amostra da populao, em termos de representatividade. Mas ainda, amostras sucessivas da mesma populao tendem a fornecer estimativas similares entre si e com valores em torno do verdadeiro, ou seja, o valor do parmetro. Exemplo: Imagine que a prefeitura de uma metrpole quer tomar uma medida administrativa que afeta os lojistas: Metade (0,5) deles a favor e metade (0,5) contra, mas ningum conhece essas propores. Voc toma ento uma amostra de dois lojistas para afirmar a proporo de lojistas favorveis. Na sua amostra, podem ser favorveis medida: a) Nenhum dos dois b) Somente um deles c) Os dois As estimativas da proporo de lojistas favorveis medida seriam: a) 0 b) 0,5 c) 1

  • 8

    Assim, vimos que, amostras diferentes do estimativas diferentes do parmetro. o que os estatsticos chamam de flutuao amostral. Das estimativas possveis desse parmetro, com base em uma amostra de tamanho 2, que muitssimo pequena, apenas um caso coincide com o valor verdadeiro do parmetro e as outras so muito ruins. Se a amostra fosse de tamanho 1000, uma proporo muito maior de estimativas estaria em torno do valor verdadeiro do parmetro.

    Existe uma tcnica especial, a amostragem, para recolher amostras, que garantam, tanto quanto possvel, o carter de representatividade do todo, que possam ser usadas para permitir fazer inferncias acerca da populao de que originou. Quanto mais complexa for a amostragem, maiores cuidados devero ser tomados nas anlises estatsticas utilizadas; em contrapartida, o uso de um esquema de amostragem mais elaborado pode levar a uma diminuio no tamanho da amostra necessrio para uma dada preciso. Antes de escolher a amostra, preciso definir a tcnica de amostragem, isto , os critrios que sero usados para escolher os elementos da populao que constituiro a amostra. De acordo com a tcnica usada, tem-se um tipo de amostra. 2- Amostragem X Censo Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma populao, enquanto que um censo requer o exame de todos os itens. Embora concentremos nossa ateno nas amostras, conveniente considerar tambm a alternativa do censo. primeira vista pode parecer que a inspeo completa ou total de todos os itens de uma populao seja mais conveniente do que a inspeo de apenas uma amostra deles. Na prtica, o contrrio que quase vlido

    Firmas comerciais e entidades governamentais recorrem amostragem por vrias razes. O custo usualmente um fator relevante. Colher dados e analisar resultados custam dinheiro e, em geral quanto maior o nmero de dados colhidos, maior o custo. Outra razo para o emprego de amostragem que o valor da informao dura pouco. Para ser til, a informao deve ser obtida e usada rapidamente. A amostragem a nica maneira de se fazer isso. Por vezes, o exame de determinado artigo o destri. Testar cadeiras quanto a sua resistncia ao peso obviamente as destri; se fssemos testar todas as cadeiras, no sobrariam cadeiras para a venda. A amostragem prefervel ao censo quando: a) A populao pode ser infinita, e obviamente no seria possvel examinar todos os

    itens da populao o que tornaria ento o censo impossvel. b) Uma amostra pode ser mais atualizada do que o censo. Se se necessita de uma

    informao rapidamente, um estudo de toda a populao pode consumir demasiado tempo e perder utilidade. Alm disso, se a populao tende a modificar-se com o tempo, um censo poder, na realidade, combinar vrias populaes.

    c) Os testes podem apresentar carter destrutivo, ou seja, os itens examinados so

    destrudos no prprio ato do experimento. Ento o censo nos daria o panorama preciso de uma populao que no existe mais.

    d) O custo de um censo pode ser proibitivo, normalmente se o custo individual

    elevado e se existem muitos itens na populao. e) A preciso pode sofrer no caso de um censo de uma grande populao. A

    amostragem envolve menor nmero de observaes e, conseqentemente, menor nmero de coletores de dados. Com grande nmero de agentes, h menor coordenao e controle, aumentando a chance de erros. A amostragem pode

  • 9

    revelar maior uniformidade nos mtodos de coleta de dados, e maior comparabilidade entre os dados, do que um censo.

    f) O tipo de informao pode depender da utilizao de uma amostra ou de um censo.

    Freqentemente as despesas com coleta de dados sofrem restries oramentrias. Existe tambm a premncia do tempo. Se nos decidirmos por um censo, os problemas de custo e de tempo podem conduzir a uma limitao do censo a apenas uma ou a poucas caractersticas por item. Uma amostra com o mesmo custo e mesmo tempo, poderia proporcionar resultados mais aprofundados sobre um menor nmero de itens.

    Entretanto, h certas situaes em que mais vantajoso fazer um censo. Entre essas situaes destacamos: a) A populao pode ser to pequena que o custo e o tempo de um censo sejam

    pouco maiores que para uma amostra. b) Se o tamanho da amostra grande em relao ao da populao, o esforo

    adicional requerido por um censo pode ser pequeno, alm disso, o censo eliminar a variabilidade amostral.

    c) Se se exige preciso completa, ento o censo o nico mtodo aceitvel. Em face

    da variabilidade amostral, nunca podemos ter certeza de quais so os parmetros verdadeiros da populao. Um censo nos dar essa informao, embora erros na coleta dos dados e outros tipos de tendenciosidade possam afetar a preciso dos resultados.

    d) Ocasionalmente, j se dispe da informao completa, de modo que no h

    necessidade de amostra. 3- Amostragem Probabilstica Uma amostragem ser probabilstica se todos os elementos da populao tiverem probabilidade conhecida, e diferente de zero, de pertencer amostra. Desta forma, a amostragem probabilstica implica um sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Consideraremos aqui os seguintes planos de amostragem probabilstica: 1 Amostragem Aleatria Simples 2 Amostragem Proporcional Estratificada 3 Amostragem Sistemtica Amostragem Aleatria Simples Este tipo de amostragem equivalente a um sorteio lotrico. A Amostragem Aleatria Simples constituda de elementos retirados ao acaso da populao. Ento todo elemento da populao tem probabilidade fixa de ser amostrado. Por isso que a esse tipo de amostragem tende a produzir amostras representativas. Exemplo: Geralmente so considerados aleatrios os seguintes processos:

    A chegada de carros a um posto de pedgio As chamadas telefnicas numa grande mesa de operao A chegada de clientes aos caixas de um supermercado A produo de qualquer processo mecnico Sucessivos lances de moeda ou de dado Tempo de servio em estaes de pedgio

    de mxima importncia dar cuidadosa ateno maneira como se escolhem os itens, bem como se eles so igualmente provveis.

  • 10

    Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. O que voc faria? Como queremos uma amostra de 2% dos cadastros, precisamos sortear 10 deles. Faremos isso seguindo os seguintes passos: 1 Numeramos os cadastros de 001 a 500. 2 - Para o sorteio exibiremos duas opes:

    a) Escreva os nmeros de 001 a 500, em pedaos iguais de um mesmo papel, colocando-os dentro de uma caixa. Agite sempre a caixa para misturar bem os pedaos de papel e retire, um a um, dez nmeros que formaro a amostra.

    b) Coloque em uma urna, bolas numeradas de zero a nove, inclusive, misture

    bem e retire uma. Anote o nmero dessa bola que ser o primeiro dgito do nmero do cadastro que ser amostrado. Volte a bola retirada urna, misture bem e retire outra. O nmero dessa segunda bola ser o segundo dgito do nmero do cadastro que ser amostrado. O procedimento dever ser repetido at completar os trs dgitos da numerao utilizada. Como a populao constituda por 500 cadastros, devem ser desprezados os nmeros maiores do que 500, bem como os nmeros que j foram sorteados e o nmero 000. O sorteio dever ser repetido at se conseguir a amostra de 10 cadastros.

    O processo de seleo exige que se atribuam nmeros consecutivos aos itens listados escolhendo-se depois, aleatoriamente, os nmeros dos itens que comporo a amostra. Conceitualmente, podemos usar cartas, dados, fichas numeradas ou bolas numeradas para gerar nmeros aleatrios para gerar nmeros aleatrios correspondentes aos nmeros de nossa listagem. Na prtica, tais dispositivos so empregados raramente, por vrias razes. Uma dela que cada dispositivo deixa algo a desejar; os mtodos no so perfeitamente aleatrios. As cartas, por exemplo, podem aderir umas s outras, impedindo um embaralhamento perfeito. As arestas de um dado podem estar desgastadas. E sempre h o perigo de as bolas de uma urna no terem sido convenientemente misturadas.Em vista disso, e porque a amostragem aleatria vital para a inferncia estatstica, existem tabelas especialmente elaboradas, chamadas Tabelas de Nmeros Aleatrios, construda de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas. Na tabela de nmeros aleatrios os dez algarismos 0,1,2,...,7,8,9, podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por colunas, num sentido ou noutro, por linhas, diagonalmente etc., e podem ser considerados aleatrios. A opo de leitura, porm, deve ser feita, antes de iniciado o processo. Para usar uma tabela de nmeros aleatrios devemos: 1 Fazer uma lista dos nmeros da populao 2 Numerar consecutivamente os itens na lista, a comear do zero, 3 Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de

    algarismos em cada um seja igual ao nmero de algarismos do ltimo nmero da sua listagem.

    4 Desprezar quaisquer nmeros que no correspondam a nmeros da lista ou que sejam repeties de nmeros lidos anteriormente. Continue o processo at ter o nmero desejado de observaes.

    5 Usar os nmeros assim escolhidos para identificar os itens da lista a serem includos na amostra.

  • 11

    EXEMPLO DE UMA TABELA DE NMEROS ALEATRIOS (retirada de: STEVENSON, William J. Estatstica aplicada

    administrao, So Paulo: Harbra, 1981)

    3690 2492 7171 7720 6509 7549 2330 5733 4730 0813 6790 6858 1489 2669 3743 1901 4971 8280 6477 5289 4092 4223 6454 7632 7577 2816 9202 0772 2160 8236 0812 4195 5589 0830 8261 9232 5692 9870 3583 8997 1533 6566 8830 7271 3809 2080 3828 7880 0586 8482 7811 6807 3309 2729 1039 3382 7600 1077 4455 8806 1822 1669 7501 7227 0104 4141 1521 9104 5563 1392 8238 4882 8506 6348 4612 8252 1062 1757 0964 2983 2244 5086 0303 7423 3298 3979 2831 2257 1508 7642 0092 1629 0377 3590 2209 4839 6332 1490 3092 0935 5565 2315 8030 7651 5189 0075 9353 1921 2605 3973 8204 4143 2677 0034 8601 3340 8383 7277 9889 0390 5579 4620 5650 0210 2082 4664 5484 3900 3485 0741 9069 5920 4326 7704 6525 6905 7127 5933 1137 7583 6450 5658 7678 3444 8387 5323 3753 1859 6043 0294 5110 6340 9137 4094 1957 0163 9717 4118 4276 9465 8820 4127 4951 3781 5101 1815 7068 6379 7252 1086 8919 9047 0199 5068 7447 1664 9278 1708 3625 2864 7274 9512 0074 6677 8676 0222 3335 1976 1645 9192 4011 0255 5458 6942 8043 6201 1587 0972 0554 1690 6333 1931 9433 2661 8690 2313 6999 8231 5627 1815 7171 8036 1832 2031 6298 6073 3995 9677 7765 3194 3222 4191 2734 4469 8617 2402 6250 9362 7373 4757 1716 1942 0417 5921 5295 7385 5474 2123 7035 9983 5192 1840 6176 5177 1191 2106 3351 5057 0967 4538 1246 3374 7315 3365 7203 1231 0546 6612 1038 1425 2709 5775 7517 8974 3961 2183 5295 3096 8536 9442 5500 2276 6307 2346 1285 7000 5306 0414 3383 3251 8902 8843 2112 8567 8131 8116 5270 5994 4675 1435 2192 0874 2897 0262 5092 5541 4014 3543 6130 4247 4859 2660 7852 9096 0578 0097 3521 8772 6612 0721 3899 2999 1263 7017 8057 5573 9396 3464 1706 9204 3389 5678 2589 0288 7478 7569 7551 3380 2152 5411 2647 7242 2800 3339 2854 9691 9562 3252 9848 6030 8472 2266 5505 8474 3167 8552 5409 1556 4247 4652 2953 6381 2086 5457 7703 2758 2963 8167 6712 9820

  • 12

    Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. Como voc usaria a tabela de nmeros aleatrios para extrair essa amostra? Depois de numerar os cadastros podemos escolher, por exemplo, percorrer a ltima coluna da tabela de cima para baixo lendo os trs primeiros algarismos de cada linha. Os nmeros obtidos dessa forma so:

    473, 828, 920, 923, 380, 272, 750, 488, 224, 764, 309, 192, 838, 466, 652, 344, 913, 412.

    Desprezando os nmeros que so maiores do que 500 (e eventuais repeties) devemos tomar para a amostra os cadastros de nmeros:

    473, 380, 272, 488, 224, 309, 192, 466, 344, 412. Dispondo-se de uma lista precisa dos itens da populao, relativamente simples escolher uma amostra aleatria com o auxilio de uma tabela de nmeros aleatrios. Na realidade, a lista no precisa conter todos os itens. As locaes dos itens podem constituir uma alternativa, como por exemplo, os quarteires de uma cidade, ou os arquivos de uma firma etc. Amostragem Sistemtica Quando os elementos da populao j se acham ordenados, no h necessidade de construir um sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, as linhas de produo etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A Amostragem Sistemtica constituda de elementos retirados da populao segundo um sistema preestabelecido. Exemplo 1: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. Como voc obteria uma amostra sistemtica? Precisamos obter uma amostra de tamanho 10. Para obter a amostra podemos dividir 500 por 10, e obter 50. Sorteamos um nmero entre 1 e 50, inclusive, para ser o primeiro cadastro da mostra e a partir desse nmero, contamos 50 cadastros e retiramos o ltimo para fazer parte da amostra. Procedemos dessa forma at completarmos os 10 cadastros da amostra. Exemplo 2: No caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso, estaramos fixando o tamanho da amostra em 10% da populao. preciso especial cuidado com o sistema de seleo. No forme uma amostra com as primeiras pessoas de uma fila ou, se so atendidos 10 clientes por dia, no escolha para a amostra, o dcimo de cada dez clientes. Estes procedimentos podem determinar amostras tendenciosas. Recomenda-se sempre sortear o primeiro elemento que ser selecionado para a mostra e, a partir da, usar o sistema de seleo. Amostragem Proporcional Estratificada Muitas vezes a populao se divide em subpopulaes, denominadas de Estratos. Como provvel que a caracterstica em estudo dessa populao apresente, de estrato em estrato, um comportamento heterogneo e, dentro de cada estrato, um comportamento homogneo, convm que o sorteio dos elementos da amostra leve em considerao tais estratos. A amostra proporcional estratificada composta por elementos proveniente de todos os estratos. Exemplo: Vamos obter uma amostra proporcional estratificada de 10% para a pesquisa da estatura de 90 alunos de uma escola onde 54 so meninos e 36 so meninas.

  • 13

    Temos aqui dois estratos, sexo masculino e sexo feminino. a) O primeiro passo determinar o tamanho da amostra em cada estrato:

    Sexo Populao 10% Amostra M 54

    4,5100

    5410 = 5

    F 36 6,3

    1003610 = 4

    Total 90 9

    1009010 = 9

    b) Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90 meninas. c) obtemos uma amostra aleatria ou sistemtica de cada sexo e reunimos as informaes numa s amostra, denominada amostra estratificada. 4- Amostragem No Probabilstica Quando nem todos os elementos da populao tiverem uma probabilidade diferente de zero de pertencerem amostra, dizemos que a amostragem no-probabilstica. Este processo de amostragem subjetivo e seu regimento depende do conhecimento que possui o pesquisador a respeito da estrutura da populao. empregada, muitas vezes, por simplicidade ou pela impossibilidade de se obter amostragens probabilsticas. Se os efeitos das amostragens no-probilsticas podem ser considerados equivalentes aos das amostragens probabilsticas, ento os processos de amostragens no-probabilsticas tambm podem ser considerados vlidos. Consideraremos aqui os seguintes planos de amostragem no probabilstica: 1 Amostragem a Esmo 2 Amostragem por Julgamento Amostragem a Esmo o caso em que o pesquisador procura ser aleatrio, sem, no entanto, utilizar um sorteio aleatrio rigoroso Exemplo: Se tirarmos 100 parafusos de uma caixa que contm 10.000 parafusos do mesmo modelo e tamanho, de certo no faramos uma amostragem aleatria simples, pois seria extremamente trabalhosa, mas faramos retiradas a esmo. Os resultados de uma amostragem a esmo so os mesmos de uma amostragem probabilstica se a populao homognea e se no existe a possibilidade de o amostrador ser influenciado (mesmo que inconscientemente) por alguma caracterstica dos elementos da populao. No seria o caso da amostra dos parafusos, acima, se estes tivessem modelos e tamanhos diferentes, e isto afetasse a caracterstica observada nos parafusos. Amostragem por Julgamento Neste tipo de amostragem, a amostra colhida na parte da populao que acessvel. Ento se faz uma distino entre populao-objeto (aquela que se tem em mente ao realizar o estudo) e a populao-amostrada (a parte da populao que acessvel). Se essas duas populaes tiverem as mesmas caractersticas, este tipo de amostragem vai ser equivalente a uma amostragem probabilstica. Se o tamanho da amostra bem pequeno, digamos, de um a cinco itens, a amostragem aleatria pode dar totalmente no-representativos, ao passo que uma

  • 14

    pessoa familiarizada com a populao pode especificar quais os itens mais representativos da populao.

    Exemplo: Uma cadeia de restaurantes pode querer experimentar uma nova tcnica de servio, empregando bandejas com aquecimento. Problemas de custo podem fazer com que a experincia se limite a dois restaurantes, os quais podem diferir consideravelmente em termos de tamanho, localizao, clientela e lucratividade. Ao invs de uma seleo aleatria dos dois locais a ser usado como teste, ser melhor confiar no conhecimento da administrao para fazer tal escolha. Ocasionalmente, os itens amostrais, se apresentam convenientemente grupados. Uma pesquisa mdica deve trabalhar com os pacientes disponveis.Este grupo no pode ser considerado como uma amostra aleatria do pblico em geral e seria perigoso tentar tirar concluses gerais com base em tal estudo. Entretanto, os resultados poderiam proporcionar uma base para a elaborao de um plano de amostragem aleatria para validar os resultados bsicos. Os perigos inerentes pesquisa mdica, bem como a outros tipos de pesquisa, freqentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntrios. Outros exemplos similares seriam portadores de doenas fatais, cadveres, animais, etc. Finalmente, a amostragem por julgamento pode ser mais rpida e menos custosa porque no preciso construir uma listagem dos itens da populao. Tenha-se em mente que a amostragem por julgamento no permite a avaliao objetiva do erro amostral, de modo que conveniente usar a amostragem probabilstica sempre que possvel.

    Comparao de Planos de Amostragem Tipo Caracterizado por

    Aleatria Lista de itens Sistemtica Lista aleatria de itens Estratificada Subgrupos Homogneos A Esmo e Por julgamento

    No necessita de uma listagem de itens

    5- Amostras Tendenciosas Talvez voc nunca faa um trabalho que exija amostragem. Mas muito provavelmente voc ler ou usar resultados de trabalhos cujos dados foram obtidos por amostragem. Ento saiba que importante entender o que uma amostra tendenciosa. Primeiro, as inferncias devem ser feitas apenas para a populao de onde a amostra foi retirada. No tem sentido, por exemplo, estudar os hbitos de higiene dos ndios bolivianos e fazer inferncia para a populao da periferia da cidade de So Paulo. Tambm preciso verificar se a amostra foi retirada da populao usando um processo delineado segundo critrios estatsticos. A amostra deve ter o tamanho usual da rea em que a pesquisa se enquadra. Na prtica, o tamanho da amostra determinado mais por consideraes reais ou imaginrias a respeito do custo de cada unidade amostrada do que por tcnicas estatsticas. Veja o que se faz na sua rea de trabalho, consultando a literatura e verifique o que seu oramento permite fazer. As amostras muito pequenas podem ser excelentes estudos de casos, mas no permitem fazer inferncia estatstica. Mas tambm desconfie de amostras muito grandes. Ser que o pesquisador tinha tempo e dinheiro para fazer um bom levantamento de tantos dados? E veja como foi feito o questionrio. So mais confiveis as respostas obtidas atravs de entrevistas, desde que o entrevistador tenha sido treinado. Estude as perguntas. Elas eram claras? As respostas podem ser, por alguma razo, mentirosas? Leia o artigo e se pergunte: 1 Qual a populao? 2 Como a mostra foi selecionada? 3 Qual o tamanho da amostra? 4 Como o questionrio foi feito? 5 As perguntas eram claras?

  • 15

    Se estas perguntas no tiverem resposta satisfatria, a amostra pode ser tendenciosa. Exemplo: Para estimar o tamanho dos morangos de uma caixa, no seria correto examinar o tamanho dos 10 morangos que esto na parte de cima, pois provavelmente, a amostra seria tendenciosa uma vez que os vendedores de morango arrumam as caixas de maneira a colocar as frutas maiores nas camadas mais superficiais. preciso cuidado na forma de tomar a amostra porque os erros de amostragem fazem com que os resultados da amostragem sejam diferentes dos resultados do censo. Quando a pesquisa exige que os participantes respondam a um questionrio, preciso especial ateno forma de obter as respostas. Se o questionrio enviado s pessoas pelo correio, a taxa de resposta baixa. Tendem a responder mais as pessoas que tm opinio formada, seja a favor ou contra o assunto. Ento a amostra pode ser tendenciosa pelo fato de no conter pessoas indiferentes ao tema tratado. Por telefone obtm-se respostas mais rapidamente, mas no Brasil a maioria das residncias no tem telefone. Ento a amostra pode ser tendenciosa pelo fato de s terem sido entrevistadas pessoas suficientemente ricas para ter um telefone. As entrevistas pessoais tm a taxa mais alta de respostas, mas exigem do entrevistador tempo e treinamento. Mesmo assim, muitas unidades podem no responder. A falta de resposta se explica pela inabilidade do pesquisador para entrar em contato com as pessoas ou para conseguir respostas daqueles que, a principio, se recusam a responder. Se essas pessoas diferem da populao a amostra tendenciosa. Mas existem, ainda outras fontes de erros nos resultados de um levantamento por amostragem. Exemplo: A origem do erro pode estar na prpria pergunta que feita ao entrevistado.

    A pessoa pode mentir sobre sua idade ou sobre sua renda A pessoa pode no lembrar e dar resposta errada quando perguntada sobre

    questes do tipo: Quantos cigarros o senhor fumou na semana passada?. Quem no entende a pergunta pode dar qualquer resposta, apenas para no

    mostrar ignorncia. Perguntas mal feitas que induzem a certa resposta. Por exemplo, Voc acha

    justo pessoas de idade ficarem passeando de nibus de graa, enquanto estudantes e trabalhadores tm que pagar?

    Finalmente, cabe tratar aqui algumas questes de tica que surgem quando se faz um levantamento de dados. claro que podem existir abusos. Esses abusos no so, contudo, da ordem dos que, vez por outra, ocorrem nos experimentos cientficos. De qualquer forma, a primeira questo de tica que pode surgir o fato de a pessoa que responde estar sendo usada para uma pesquisa, sem saber disso. As pessoas devem ser avisadas de que esto sendo entrevistadas para uma pesquisa e tm o direito de se recusar a participar. Ainda, na maioria das vezes, quem responde no sabe o uso que se far do dado. Mas todo pesquisador deve informar s pessoas que participam da pesquisa quais so os seus objetivos e tem o dever de informar, depois de terminado o trabalho, quais foram as suas concluses. Outra questo tica, muito mais sria do que as anteriores a dos pesquisadores sociais que se infiltram em certos grupos, fingindo pertencer a eles, s para obter informaes. Essa atitude defensvel apenas nos rarssimos casos em que a informao obtida pela pesquisa absolutamente essencial e no pode ser obtida por outros meios. E, por ltimo, vem a questo da identificao, sem a necessria autorizao, de quem responde, usando expedientes como questionrios com cdigos secretos. Definitivamente, a identificao por cdigo no tica. Um estatstico conhecido disse, certa vez, que possvel mentir usando estatstica, mas que se mente mais, e melhor, sem estatsticas. preciso entender que as amostras podem levar a concluses erradas. Contudo, as opinies pessoais, sem base em dados, levam em geral, a concluses muito mais erradas.

  • 16

    III Organizao de Dados

    1- Variveis

    Os dados estatsticos se obtm mediante um processo que envolve a observao ou outra mensurao de caractersticas de uma populao ou amostra tais como renda anual numa comunidade, sexo dos indivduos de uma tribo indgena, percentagem de acar em cereais, etc. Cada uma dessas caractersticas chamada de varivel, porque originam valores que tendem a exibir certo grau de variabilidade quando se fazem mensuraes sucessivas. Exemplo: Suponha que um questionrio foi aplicado aos alunos do 3 perodo do curso de administrao da UNIVILA fornecendo as seguintes informaes:

    1) Id: Identificao do aluno 2) Turma: Turma em que o aluno foi alocado (A ou B) 3) Sexo: F se feminino, M se masculino. 4) Idade: Idade em anos 5) Altura: Altura em metros 6) Peso: Peso em quilogramas 7) Filhos: Nmero de filhos na famlia Para a varivel sexo so dois os valores possveis: F ou M Para a varivel Filhos os valores possveis so expressos atravs de

    nmeros naturais: 0, 1, 2, 3,... Para a varivel Altura temos uma situao diferente, pois os resultados

    podem assumir um nmero infinito de valores dentro de um determinado intervalo.

    Claramente tais variveis tm naturezas diferentes no que tange aos possveis

    valores que podem assumir. Tal fato deve ser levado em conta nas anlises dos dados, pois para cada tipo de varivel existe um tratamento diferente.

    2- Classificao das variveis

    Vamos considerar dois grandes tipos de variveis: A) Quantitativas (numricas): So as variveis cujos valores so expressos em nmeros. Elas podem ser subdivididas em quantitativas discretas e quantitativas contnuas. As variveis discretas podem ser vistas como resultantes de contagens, assumindo assim, valores inteiros. J as variveis contnuas geralmente provm de uma mensurao e podem assumir qualquer valor em intervalos dos nmeros reais. Exemplos:

    So variveis quantitativas discretas: Nmero de irmos, de alunos numa sala de aula, de defeitos num carro novo, etc.

    So variveis quantitativas contnuas: Altura, peso, comprimento, espessura, velocidade, etc.

    B) Qualitativas (no numricas): So as variveis cujos possveis valores que assumem representam atributos e/ou quantidades. Se tais variveis tm uma ordenao natural, indicando intensidades crescentes de realizao, ento elas sero classificadas como qualitativas ordinais ou por postos. Caso contrrio, quando no possvel estabelecer uma ordem natural entre seus valores definindo apenas uma categoria, elas so classificadas como qualitativas nominais. Exemplos:

    So variveis qualitativas nominais: Turma (A ou B), sexo (F ou M), cor dos olhos, campo de estudo, etc.

  • 17

    So variveis qualitativas ordinais: Tamanho (pequeno, mdio ou grande), Classe social (baixa, mdia ou alta), etc. Podemos resumir a classificao das variveis no seguinte esquema:

    interessante notar que muitas populaes podem originar os quatro tipos de dados como ilustramos na tabela abaixo.

    Tipo de variveis Populaes Quantitativas Qualitativas

    Contnua Discreta Nominal Ordinal

    Alunos de Estatstica

    Idade, peso N na classe sexo Por perodo

    Automveis Velocidade em km/h

    N de defeitos por carro

    cores limpeza

    Venda de Imveis

    Valor em reais

    N de ofertas Acima do preo Muito dispendioso

    3- Distribuio de Freqncia Uma distribuio de freqncia um mtodo de grupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o nmero ou a percentagem de observaes em cada classe. O nmero ou percentagem numa classe chama-se freqncia de classe. Uma distribuio de freqncia pode ser apresentada sob forma grfica ou tabular. Tipos de freqncias

    Freqncia simples ou absoluta (f): So os valores que realmente representam o nmero de dados de cada classe.

    Freqncia relativa (fr): So os valores das razes entre as freqncias simples e a freqncia total. Normalmente calcula-se a freqncia relativa para efeito de comparao com outros grupos ou conjunto de dados. Convm notar que, quando estivermos comparando dois grupos com relao s freqncias de ocorrncia dos valores de uma dada varivel, grupos com um nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos valores da varivel. Dessa forma, o uso de freqncia relativa vem resolver este problema.

    Freqncia acumulada (F): o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Normalmente utilizamos esse tipo de freqncia quando tratamos de variveis qualitativas ordinais ou quantitativas em geral.

    Freqncia acumulada relativa (Fr): o total das freqncias relativas de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Como no caso anterior utilizamos esse tipo de freqncia quando tratamos de variveis qualitativas ordinais ou quantitativas em geral.

    Varivel

    Qualitativa

    Quantitativa

    Nominal

    Ordinal

    Discreta

    Contnua

  • 18

    O processo de construo de uma distribuio de freqncia para determinado conjunto de dados depende do tipo de dados em estudo, isto , contnuos, discretos, nominais ou ordinais. Vamos estudar cada caso.

    Os dados coletados so registrados em fichas que contm, alm dos dados de interesse, diversas outras informaes. Portanto, terminada a fase de coleta dos dados, preciso retirar os dados das fichas e organiz-los. Esta fase do trabalho denominada, tecnicamente, de tratamento dos dados.

    Tabelas e Grficos

    Os dados depois de tratados podem ser apresentados em tabelas. Existem normas nacionais para a organizao de tabelas, ditadas pela ABNT. Essas normas no sero tratadas aqui, mas convm saber que as tabelas devem ter os seguintes componentes:

    Ttulo: Precede a tabela e explica, em poucas palavras, o dado em estudo. Se for o caso, indica o tempo e o lugar a que os dados se referem.

    Cabealho: Especifica o contedo de cada coluna Coluna Indicadora: Especifica em cada linha os valores que os dados podem

    assumir. Corpo da tabela: Apresenta a freqncia dos dados. Fonte: Especifica a entidade, o pesquisador ou pesquisadores que forneceram

    os dados, quando esses no foram coletados por voc.

    Exemplo Valor em dlares dos principais produtos que

    o Brasil vende Argentina

    Produto Valor em dlares (em bilhes)

    Automveis 606 Veculos de carga 541 Autopeas 531 Motores 264 Minrio 248 Tratores 130 Fonte: poca 25 de janeiro de 1999

    A organizao dos dados em tabelas de freqncia proporciona um meio eficaz de estudo do comportamento de caractersticas de interesse. Muitas vezes, a informao contida nas tabelas pode ser mais facilmente visualizada atravs de grficos. Meios de comunicao apresentam, diariamente, grficos das mais variadas formas para auxiliar na apresentao das informaes. rgos pblicos e empresas se municiam de grficos e tabelas em documentos internos e relatrios de atividades e desempenho. Graas proliferao de recursos grficos, cuja construo tem sido cada vez mais simplificada em programas computacionais, existe hoje uma infinidade de tipos de grficos que podem ser utilizados. Deve ser notado, entretanto, que a utilizao de recursos visuais na criao de grficos deve ser feita cuidadosamente; um grfico desproporcional em suas medidas pode dar falsa impresso de desempenho e conduzir a concluses equivocadas. Obviamente, questes de manipulao incorreta da informao podem ocorrer em qualquer rea e no cabe culpar a Estatstica. O uso e a divulgao tica e criteriosa de dados devem ser pr-requisitos indispensveis e inegociveis. Exemplos: Vamos definir quatro tipos bsicos de grficos:

    Grfico de disco: usado para mostrar a importncia relativa das propores. Esse tipo de grfico se adapta melhor s variveis qualitativas nominais.

    Titulo

    Cabealho

    Coluna Indicadora

    Corpo da tabela

  • 19

    Grfico de barras: Utiliza o plano cartesiano com os valores da varivel no eixo das abscissas e as freqncias ou porcentagens no eixo das ordenadas. Esse tipo de grfico se adapta melhor s variveis discretas ou qualitativas ordinais.

    Histograma: a representao grfica de uma distribuio de freqncia por meio de retngulos justapostos. Esse tipo de grfico se adapta melhor s variveis quantitativas contnuas.

    Polgono de freqncia: uma alternativa ao histograma construdo mediante a conexo dos pontos mdios dos intervalos do histograma com linhas retas.

    Distribuio de Freqncia para Variveis Quantitativas Contnuas Os principais estgios na construo de uma distribuio de freqncia para dados contnuos so: 1 Organizar os dados brutos em um rol de ordem crescente ou decrescente. 2 Determinar a amplitude total dos dados que a diferena entre o maior e menor dos dados. 3 Determinar quanto ao nmero de classes a usar (k). aconselhvel usar entre 5 e 15 classes. Menos que cinco classes pode ocultar detalhes importantes dos dados, e mais que quinze torna a apresentao demasiado detalhada. Uma regra prtica consiste em tomar a raiz quadrada do nmero total de dados ( n ) e ajust-la, se necessrio, aos limites de 5 a 15. 4 Determinar a amplitude de cada classe dividindo a amplitude total por k. Se necessrio o valor encontrado deve ser aproximado para cima com o mesmo nmero ou mais casas decimais que os valores das variveis. 5 Estabelecer os intervalos das classes comeando com um inteiro logo abaixo do menor valor observado e somando a amplitude das classes. Os intervalos de classe devem ser escritos, de acordo com a Resoluo 866/66 do IBGE em termos de desta quantidade at menos aquela, empregando, para isso, o smbolo (incluso por limite inferior e excluso do limite superior). 6 Relacionar os intervalos e fazer a contagem dos pontos por classe. A contagem total deve ser igual a n. 7 construir uma tabela de freqncia ou um grfico de freqncia. Exemplo: Considere os dados brutos que representam a safra, em alqueires, por rvore, para um conjunto de 40 pessegueiros.

    Safra atual em (alqueire/ rvore) para 40 Pessegueiros 11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3 4,4 6,1 27,5 32,8 18,5 16,4 15,1 6,0

    10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5 14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2 3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7

    Vamos construir uma tabela para representar esses dados: 1- Construo do Rol em ordem crescente

    Safra atual em (alqueire/ rvore) para 40 Pessegueiros 3,2 3,5 4,4 4,7 6 6,1 7,4 7,8 8,1 9,2 10,0 10,7 11,1 11,2 12,2 12,5

    12,6 12,9 13,7 14,5 14,8 15,1 15,8 16,0 16,2 16,4 16,4 18,2 18,5 19,1 19,1 21,0 22,3 22,6 23,5 25,0 26,2 27,5 32,4 32,8

    2 Amplitude Total (AT) = 32,8 3,2 = 29,6 3 Nmero de classes ( K ) = 632,640 =

  • 20

    4 Amplitude da classe (AC) = 593,46

    6,29 = 5 Intervalos de variao das classes:

    1 classe: Limite inferior: 3 Limite superior: 3 + AC = 3 + 5 = 8 2 classe: Limite inferior = Limite superior da classe anterior: 8

    Limite superior: 8 + 5 = 13 3 classe: Vai de 13 a 18 4 classe: Vai de 18 a 23 5 classe: Vai de 23 a 28 6 classe: Vai de 28 a 33

    6 Construo da tabela

    Safra Anual (em alqueire/rvore) para 40 Pessegueiros

    Nmero de alqueires

    Nmero de rvores

    3 8 8 8 13 10 13 18 9 18 23 7 23 28 4 28 33 2 Total 40

    O histograma correspondente :

    Safra Anual (em alqueire/rvore) para 40 Pessegueiros

    0

    5

    10

    15

    0 5,5 10,5 15,5 20,5 25,5 30,5

    Safra (alqueires)

    N d

    e r

    vore

    s

    O polgono de freqncias dado por:

    Distribuio de Freqncia para Variveis Quantitativas Discretas A tabela de freqncia, nesses casos, consiste em listar os valores possveis da varivel, numricos ou no e fazer a contagem na tabela de dados brutos do nmero de suas ocorrncias. Na construo de uma distribuio de freqncia utilizando variveis contnuas, perde-se certa quantidade de informaes porque os valores individuais perdem sua identidade quando so grupados em classes. Isso pode ou no ocorrer com variveis discretas, dependendo da natureza das variveis e dos objetivos do analista. Exemplo: Considere os seguintes dados relativos ao nmero de acidentes dirios num grande estacionamento, durante um perodo de 50 dias.

    N de acidentes dirios num estacionamento, durante 50 dias 0 0 0 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 8 8 8 8 9

    Safra Anual (em alqueire/rvore) para 40 Pessegueiros

    0

    2

    4

    6

    8

    10

    12

    5,5 10,5 15,5 20,5 25,5 30,5Safra (em alqueires)

  • 21

    Podemos construir uma distribuio de freqncia, sem perda dos valores originais, utilizando como classes os inteiros de 0 a 9.

    Podemos ver pela freqncia acumulada que em 25 dias (dos 50) ocorreram at 4 acidentes por dia.

    Dizemos que no h perda de informaes porque poderamos reconstruir os dados originais a partir desta tabela. Por outro lado, poderamos tratar essa varivel como se fosse contnua, gerando a seguinte tabela:

    Para a distribuio de freqncia sem perda de informaes construmos o grfico

    de barras, enquanto que para a distribuio com perda de informaes

    construmos um histograma.

    a) Grfico de barras (sem perdas)

    b) Histograma (com perdas)

    N de acidentes dirios num estacionamento, durante 50 dias.

    N de acidentes f F 0 3 3 1 2 5 2 5 10 3 6 16 4 9 25 5 7 32 6 7 39 7 6 45 8 4 49 9 1 50

    Total 50

    N de acidentes dirios num estacionamento, durante 50 dias.

    N de acidentes

    f fr

    0 2 5 0,10 2 4 11 0,22 4 6 16 0,32 6 8 13 0,26 8 10 5 0,10 Total 50 1,00

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    0 1 2 3 4 5 6 7 8 9

    N de acidentes dirios num estacionamento, durante 50 dias

    012345678

    9101112131415

    1 3 5 7 9n de acidentes

    16

    N de acidentes dirios

    N de acidentes dirios num estacionamento, durante 50 dias

  • 22

    De modo geral, prefere-se uma distribuio de freqncia sem perda de informaes quando:

    Os dados so constitudos de valores inteiros H menos de, digamos, 16 dados H suficientes observaes para originar uma distribuio significativa. Por outro lado, uma distribuio de freqncia com perda de informaes til

    quando: Esto em jogo inteiros e no-inteiros (ou no inteiros somente) S existem inteiros, porm em nmero demasiadamente elevado para permitir

    uma distribuio til. A perda de informaes de importncia secundria.

    Distribuio de Freqncia para Variveis Qualitativas Nominais ou Ordinais Talvez as distribuies de freqncia mais simples sejam as relativas as variveis nominais ou ordinais. Tal simplicidade decorre do fato de que as classes so facilmente reconhecveis, tornando mnimos os clculos. Exemplo 1: Considere os dados nominais referentes venda de bebidas leves em um dia no Mercado Peg-Pag, dispostos na tabela de freqncia abaixo:

    Venda de Bebidas Leves em um Dia no Mercado Peg-Pag

    Tipo de Bebida

    f fr

    Cola 600 0,60 Limo 200 0,20 Laranja 100 0,10 Uva 50 0,05 Cereja 40 0,04 Outros 10 0,01

    Total 1000 1,00

    As categorias so os diversos tipos de bebidas. Pode haver diversos tipos de bebidas com vendas bastante baixas, tais como soda, cerveja e chocolate, que foram englobadas numa nica categoria, que chamamos de Outros, para tornar os dados mais abrangentes. Podemos optar pela construo de um grfico de barras horizontais ou verticais usando as freqncias simples ou destacar os percentuais de vendas de cada bebida construindo um grfico de setores com as freqncias relativas. a) Grfico de barras verticais

    b) Grfico de setores

    0

    100

    200

    300

    400

    500

    600

    700

    Cola Limo Laranja Uva Cereja Outros

    Venda de Bebidas Leves em um Dia no Mercado Peg-Pag

    Cola60%

    Limo20%

    Laranja10%

    Uva5%

    Cereja4%

    Outros 1%

    Venda de Bebidas Leves em um Dia no Mercado Peg-Pag

    Tipo

  • 23

    Exemplo 2: Consideremos os dados relativos ao aproveitamento num curso de Matemtica para o 1 perodo de Administrao 2003/2 da Faculdade UNIVILA, apresentados abaixo de forma ligeiramente diferente das tabelas de freqncias anteriores, apenas para ilustrar outra maneira de preparar uma tabela de freqncia.

    Classificao dos alunos de Matemtica do 1 perodo de Administrao 2003/2 da Faculdade UNIVILA

    Classificao Fraca Razovel Mdia Boa Excelente Total Nmero de

    alunos 2 4 20 10 4 40

    Percentagem 0,05 0,10 0,50 0,25 0,10 1,00 Podemos representar esses dados em um grfico de barras horizontais ou de setores usando os valores das freqncias relativas

    a) Grfico de barras horizontais

    b) Grfico de setores

    Diagrama de Pareto

    usado na gesto de qualidade para estabelecer a ordem em que as causas das perdas ou de outros tipos de fracasso devem ser sanadas.

    O Diagrama de Pareto apresenta fracassos e insucessos em ordem de freqncia. Tem-se, ento, a ordem em que devem ser sanados os erros, resolvidos os problemas, atendidas as reclamaes, diminuindo o desperdcio. Diz-se, por isso, que o Diagrama de Pareto estabelece prioridades. Mas o Diagrama de Pareto tambm

    Classificao dos alunos de Matemtica do 1 perodo de Administrao 2003/2 da Faculdade

    UNIVILA 5% Razovel

    10%

    Mdia 50%

    Boa25%

    Excelente10%

    Fraca

    Classificao dos alunos de Matemtica do 1 perodo de Administrao 2003/2 da Faculdade

    Excelente

    Boa

    Razovel Fraca

    Mdia

    55504515 403530 25201050Percentagem

  • 24

    pode ser usado para identificar causas de sucesso como, por exemplo, as causas do aumento de venda de um produto. Exemplo: Consideremos a distribuio de freqncia das reclamaes feitas no Procon por rea em 1999.

    Reclamao do Procon por rea rea fr Fr

    Servios 40 40 Assuntos financeiros 23 63 Produtos 21 84 Habitao 8 92 Sade 7 99 Alimentos 1 100 Fonte: Procon, 1999.

    Observe que os dados esto apresentados em ordem decrescente de freqncias relativas. O Diagrama de Pareto, neste caso, :

    Note que a linha que est desenhada acima das colunas obtida com base na doma dos valores das colunas. O Diagrama de Pareto para essas reclamaes no Procon deve ser interpretado da seguinte forma: Como a maior parte de reclamaes se concentram nas areo de servios e assuntos financeiros, o Procon dever centralizar suas investigaes nessas reas.

    Reclamaes no Procon por rea

    40

    23 21

    8 71

    40

    63

    84

    9299

    100

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    110

    Servios Assuntos financeiros Produtos Habitao Sade Alimentosrea

  • 25

    IV Sries Estatsticas Denominamos Srie Estatstica toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do tempo ou da espcie. Da podemos inferir que numa srie estatstica observamos a existncia de trs elementos ou fatores:

    Tempo Espao Espcie

    Basicamente existem trs tipos de sries estatsticas: Temporais ou Cronolgicas, Geogrficas e Categricas. 1- Sries Temporais

    So constitudas por dados produzidos e monitorados ao longo do tempo.

    Tambm so chamadas de sries histricas ou cronolgicas. Exemplos: So sries temporais:

    2- Sries Geogrficas So constitudas por dados provenientes de diferentes regies geogrficas. Tambm so chamadas de sries espaciais, territoriais ou de localizao. Exemplos: So sries geogrficas:

    Nmero de apartamentos vendidos no ms de janeiro na cidade de So

    Paulo por ano. Ano N de

    Apartamentos 1995 1299 1996 533 1997 659 1998 1040 1999 402

    Fonte: Secovi SP (1999)

    Preo do Acm no varejo em So Paulo segundo o ano Anos Preo mdio

    (US$) 1989 2,24 1990 2,73 1991 2,12 1992 1,89 1993 2,04 1994 2,62

    Fonte: APA

    Durao mdia dos estudos superiores 1994

    Pases Nmero de anos

    Itlia 7,5 Alemanha 7,0 Frana 7,0 Holanda 5,9 Inglaterra Menos de 4 Fonte: Revista Veja

    Nmero de desempregados, em milhes, nos dez pases com mais

    desemprego em 1998.

    Pases N de

    desempregados (em Milhes)

    ndia 38.960,1 Indonsia 10.625,7 Rssia 8.028,8 Brasil 6.649,9 EUA 6.173,4 China 6.125,1 Alemanha 4.075,7 Espanha 3.347,1 Japo 2.930,3 Itlia 2.896,2 Fonte: Pochmann (1999)

  • 26

    3 Sries Categricas So constitudas por dados obtidos nas diferentes categorias de uma mesma varivel. Tambm so chamadas de sries especficas. Exemplos: So sries categricas:

    Rebanhos brasileiros em 1992 Espcies Quantidade

    (1000 cabeas) Bovinos 154.440,8Bufalinos 1.423,3Eqinos 549,5Asininos 47,1Muares 208,5Sunos 34.532,2Ovinos 19.955,6Caprinos 12.159,6Coelhos 6,1Fonte: IBGE 4 Sries Conjugadas Muitas vezes temos necessidade de apresentar, em uma nica tabela, a variao de valores de mais de uma varivel, isto , fazer uma conjugao de duas ou mais sries. Conjugando duas sries em uma nica tabela. Obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificao: uma horizontal e uma vertical. Exemplo: A srie conjugada abaixo uma srie geogrfico-temporal.

    Terminais telefnicos em servio de 1991 a 1993 Regies 1991 1992 1993

    Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro-oeste 713.357 778.925 884.822 Fonte: Ministrio das comunicaes

    Patrimnio lquido, segundo o banco,

    em1998. Banco Patrimnio lquido

    (milhes de reais) Banco do Brasil 6.629,9Banespa 4.143,2Bank Boston 693,0Boa Vista 419,6Bradesco 6.320,9HSBC 1.176,5Ita 4.650,7Safra 931,2Santander 960,7Unibanco 2.906,3Fonte: EFC/Bancos (1999)

  • 27

    V Construo de tabelas e grficos usando o Excel 1- Construo de tabelas de freqncia para Variveis Discretas Suponhamos que um grupo tenha feito quarenta entrevistas e que uma das variveis observadas tenha sido Nmero de filhos. A funo FREQNCIA no Excel calcula a freqncia de cada um dos valores observados. Para isso preciso que os dados estejam digitados (em colunas ou em linhas) e que fornea os intervalos com os quais queremos que se faa a contagem. Exemplo: Considere a seguinte tabela primitiva de dados: Nmero

    do quest. N de filhos

    Nmero do quest.

    N de filhos

    Nmero do quest.

    N de filhos

    Nmero do quest.

    N de filhos

    1 1 11 1 21 0 31 1 2 0 12 2 22 1 32 0 3 0 13 0 23 1 33 1 4 1 14 2 24 1 34 0 5 0 15 0 25 0 35 1 6 1 16 1 26 1 36 0 7 0 17 2 27 0 37 0 8 1 18 2 28 3 38 0 9 1 19 1 29 0 39 0

    10 2 20 4 30 2 40 0 Usando o Excel faa um pequeno banco de dados conforme mostrado a seguir. Nas clulas A2 a A41 digite os nmeros dos questionrios. Nas clulas B2 a B41 digite os dados (nmero de filhos). Nas clulas C2 a C6 digite os valores 0, 1, 2, 3, 4 (so os limites das classes). Marcar as clulas D2 a D7. Na barra de ferramentas escolha INSERIR FUNO Escolha primeiramente a opo ESTATSTICA. Depois escolha a opo FREQNCIA OK. O primeiro dado que ser pedido Matriz_dados e voc deve, neste campo marcar os valores onde esto os dados; no nosso caso B2 a B41. A seguir, pede-se Matriz_bin e voc deve, neste campo, marcar os valores que correspondem aos limites das classes, no nosso caso C2 a C6. Logo abaixo da Matriz_bin aparecer o resultado: {17; 15; 6;1;1;0}. Para que estes valores sejam mostrados na planilha d CTRL + SCHIFT + ENTER. O resultado deve ser interpretado desta forma:

    N de filhos f 0 17 1 15 2 6 3 1 4 1

    5 ou mais 0 Total 40

    2- Construo de tabelas de freqncia para Variveis Qualitativas Para construir tabelas de freqncia para Variveis Qualitativas procede-se da mesma maneira que para as Variveis Discretas tomando-se apenas o cuidado de codificar os possveis valores da varivel e digitar a tabela primitiva no Excel usando esse cdigo.

  • 28

    Exemplo: Uma varivel qualitativa com trs valores (A, B, C) foi observada em cada um dos vinte elementos de uma amostra. Obteve-se:

    B A A C A B B B A A C A B B A C B B B A

    Podemos codificar os valores dessa varivel como: A = 0, B = 1 e C = 2. Devemos prosseguir como na construo de tabelas para variveis quantitativas discretas digitando o seguinte banco de dados no Excel:

    1 0 0 2 0 1 1 1 0 0 2 0 1 1 0 2 1 1 1 0

    A tabela fornecida pelo Excel ser:

    0 81 92 3

    0 Que para ser interpretada deve ser decodificada. O resultado deve ser interpretado desta forma:

    Varivel f A 8 B 9 C 3

    outros 0 Total 20

    3 - Construo de tabelas de freqncia para Variveis Contnuas Suponhamos que um grupo tenha feito vinte e duas entrevistas e que uma das variveis observadas tenha sido Tempo de realizao de um dado exerccio. Como esta varivel contnua, no podemos usar a funo FREQNCIA par construir uma tabela de freqncias. ATENO! Confira se no seu computador tem a opo Anlise de dados... na opo FERRAMENTAS. Se no tiver, escolha, na opo FERRAMENTAS a opo SUPLEMENTOS. Marque no quadrinho Ferramentas de anlise e OK. Exemplo: Considere a seguinte tabela primitiva de dados:

    Nmero do quest.

    Tempo Nmero do quest.

    Tempo

    1 0,0 12 2,7 2 0,5 13 2,3 3 0,6 14 4,5 4 1,5 15 3,7 5 3,3 16 2,9 6 4,2 17 0,7 7 3,9 18 4,7 8 1,0 19 3,1 9 5,8 20 4,1

    10 4,8 21 4,9 11 4,0 22 1,2

  • 29

    Usando o Excel faa um pequeno banco de dados conforme mostrado a seguir. Nas clulas A2 a A23 digite os nmeros dos questionrios. Nas clulas B2 a B23 digite os dados (tempos). Agora v para: FERRAMENTAS ANLISE DE DADOS HISTOGRAMA OK Os dados pedidos so: - Intervalo de entrada: Marcar no banco de dados, a coluna referente aos dados, no nosso caso B2 a B23. - Intervalo de sada: Indique uma clula vazia, a partir da qual ser mostrada a tabela (p.ex. G2). A planilha apresentada ser a seguinte:

    0 1 1,45 5 2,9 4 4,35 7 mais 5

    Que deve ser interpretada desta forma:

    Tempos f o 1,45 6 1,45 2,90 4 2,90 4,35 7 4,35 5,80 5 Total 22

    4- Construo de grficos de barras. O grfico estatstico uma forma de apresentar os dados estatsticos. A principal vantagem de um grfico sobre uma tabela que ele permite uma visualizao imediata da distribuio dos valores observados. O primeiro passo para se descrever graficamente um conjunto de dados observados verificar as freqncias dos diversos valores das variveis. Para fazer um grfico de barras no Microsoft Excel acompanhe o exemplo: Exemplo: Considere a seguinte tabela de freqncia:

    N de filhos f 0 17 1 15 2 6 3 1 4 1

    Total 40 1) Digitar os valores da varivel (antecedidos de uma aspa simples) e as freqncias, como abaixo: A B 2) Marcar as clulas A1 a B6 1 N de filhos f 2 o 17 3) na barra de ferramentas: INSERIR GRFICO. 3 1 15 Tipo de grfico: Colunas Avanar Avanar 4 2 6 Colocar o ttulo do grfico: 5 3 1 Distribuio do nmero de filhos de 40 entrevistados 6 4 1 Colocar nome no eixo X: N de filhos Colocar nome no eixo Y: f

  • 30

    Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda Avanar. 4) Escolher a opo Como nova planilha e concluir. 5) (opcional) Clique 2 vezes na parte colorida do grfico. No alto, escolha o opo padres escolha variar cor por ponto. O grfico ser apresentado da seguinte forma:

    Nmero de filhos de 40 entrevistados

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    0 1 2 3 4

    Nmero de filhos

    freq

    nci

    a

    Obs: Quando o varivel quantitativa preciso digitar os valores da varivel com uma aspa simples antes de cada valor (5 ENTER, por exemplo) para diferenciar para o Excel quem a varivel e quem a freqncia. 5- Construo de Histogramas.

    A Construo de um Histograma no Excel requer alguns detalhes. Acompanhe

    a partir do exemplo. Exemplo: Para a varivel Tempo de realizao de um dado exerccio , construmos a seguinte tabela de freqncia:

    Tempos f o 1,45 6 1,45 2,90 4 2,90 4,35 7 4,35 5,80 5 Total 22

    Vamos construir o histograma que representa essa varivel: Procedimento: 1) preciso calcular os pontos mdios de cada classe:

    0 1,45 ponto mdio = 0,725 1,45 2,90 ponto mdio = 2,125 e assim sucessivamente.

    2) Digitar os pontos mdios (antecedidos de uma aspa simples) e as freqncias, como abaixo:

  • 31

    A B 3) Marcar as clulas A1 a B5 1 Pontos

    mdios f 4) na barra de ferramentas: INSERIR GRFICO.

    Tipo de grfico: Colunas Avanar Avanar 2 0,725 6 Colocar o ttulo do grfico: 3 2,125 4 Distribuio dos tempos de 22 pessoas para a 4 3,625 7 realizao de um exerccio. 5 5,175 5 Colocar nome no eixo X: Tempo Colocar nome no eixo Y: f

    Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda Avanar. 5) Escolher a opo Como nova planilha e concluir. 6) (opcional) Clique 2 vezes na parte colorida do grfico. No alto, escolha o opo padres escolha variar cor por ponto. O grfico ser apresentado da seguinte forma:

    Distribuio dos tempos de 22 pessoas para a realizao de um exerccio.

    0

    1

    2

    3

    4

    5

    6

    7

    8

    0,725 2,125 3,625 5,175

    Tempos

    f

    Para que este grfico seja um histograma preciso fazer as seguintes alteraes: 1) Clique 2 vezes em alguma das barras. A janela Formatar seqncia de dados ir aparecer. 2) Escolha, no alto, Opes.

    Na opo: sobreposio, passe o nmero para 100 Na opo: largura do espaamento, passe para 0 OK

    3) (Opcional) Clique 2 vezes na parte cinza do grfico. Na parte rea escolha a opo nenhuma OK.

    O grfico agora estar como o da esquerda:

  • 32

    Tempo de 22 pessoas para execuo de um exerccio

    0

    1

    2

    3

    4

    5

    6

    7

    8

    0,725 2,175 3,625 5,075

    Tempo

    N d

    e pes

    soas

    Observao: Para alterar o tipo e o tamanho das letras dos eixos, clique duas vezes sobre o eixo vai aparecer uma janela Formatar eixos escolha fonte, altere o tipo e OK. 6 - Construo de Polgonos de Freqncias. Para se construir um polgono de freqncias, preciso entrar com os dados da seguinte forma: A B 1) Marcar as clulas A1 a B12 1 Pontos

    mdios f 2) na barra de ferramentas: INSERIR GRFICO.

    Tipo de grfico: Linha Avanar Avanar 2 0,725 6 3) Colocar o ttulo do grfico: 3 2,125 4 Distribuio dos tempos de 22 pessoas para a 4 3,625 7 realizao de um exerccio. 5 5,175 5 Colocar nome no eixo X: Tempo

    Ainda nesta janela escolha, no alto, legenda e desmarque a opo mostrar legenda Avanar 4) Escolher a opo Como nova planilha e concluir. O grfico agora estar como o da esquerda:

    Distribuio dos tempos de 22 pessoas para arealizao de um exerccio.

    0

    1

    2

    3

    4

    5

    6

    7

    8

    0,725 2,125 3,625 5,175

    Tempos

    f

  • 33

    VI Medidas de Tendncia Central 1- Introduo Se estivermos numa parada de nibus urbano e nos pedirem alguma informao sobre a demora em passar um determinado nibus, que diremos? Ningum imagina que poderamos dar como resposta uma tabela de freqncias que pacientemente coletamos no ltimo ms, ou ano! Quem pergunta deseja uma resposta breve e rpida que sintetiza a informao que dispomos e no uma completa descrio dos dados coletados. Para resumir a quantidade de informao contida em um conjunto de dados, os estatsticos definem medidas que descreve, atravs de um s nmero, caractersticas dos dados. Algumas dessas medidas descrevem a tendncia central, isto , a tendncia que os dados tm de se agrupar em torno de certos valores. Dentre as medidas de tendncia central, destacamos:

    A mdia Aritmtica A Mediana A Moda

    2 A Mdia Aritmtica A mdia aritmtica a idia que ocorre maioria das pessoas quando se fala em mdia. E como ela possui certas propriedades matemticas convenientes, a mais importante das trs medidas que estudaremos. A mdia aritmtica de um conjunto de dados a soma de todos eles dividido pelo nmero deles. Exemplo: Calcule a mdia dos dados: 0, 2, 4, 6, 8. Basta somar todos os valores e dividir o resultado pelo nmero de parcelas que 5. Assim temos:

    45

    86420 =++++ Ou seja, a mdia aritmtica, nesse caso, 4. Quando algum fala sobre um conjunto de dados, tanto pode estar se referindo a uma amostra como a uma populao. Utilizamos o smbolo para a mdia de uma populao e o smbolo x para representar a mdia de uma amostra. A mdia da populao tambm obtida dividindo a soma dos dados pelo nmero de elementos da populao. No calculamos porque, em geral, temos apenas uma amostra da populao. Mas a mdia da amostra uma estimativa da mdia da populao. s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados que ela representa, por isso costumamos dizer que a mdia aritmtica no tem existncia concreta. Exemplo: Calculando a mdia dos dados: 2, 4, 6, 8 temos:

    54

    8642 =+++ Isto , a mdia aritmtica, nesse caso, 5. Esse ser o nmero representativo dessa srie de valores, embora no esteja representado nos dados originais. Desvio em relao mdia Denominamos desvio em relao mdia a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica. Designando o desvio pelo smbolo id , podemos escrever:

    xxd ii =

  • 34

    Onde ix um elemento do conjunto de valores. Exemplo: Sabendo-se que a produo leiteira diria da vaca Mimosa, durante uma semana, foi de 10, 14, 13, 15, 16, 18, 12 litros, temos, para a produo mdia semanal:

    147

    987

    12181615131410 ==++++++ Logo, 14=x litros. Os desvios em relao mdia so dados por:

    2141241418214161141511413

    0141441410

    7

    65

    43

    2211

    ==========

    ======

    ddddd

    xxdxxd

    A soma dos desvios dos nmeros de um conjunto a contar da mdia zero. Exemplo: No exemplo anterior temos:

    04102214 =++++ Propriedades da mdia aritmtica A mdia aritmtica tem certas propriedades interessantes e teis, que explicam por que ela a medida de tendncia central mais usada: 1 - A mdia aritmtica de um conjunto de nmeros pode sempre ser calculada. 2 - Para um dado conjunto de nmeros a mdia aritmtica nica. 3 - A mdia sensvel a (ou afetada por) todos os valores do conjunto. Assim, se um valor se modifica, a mdia tambm se modifica. Exemplo: A mdia dos nmeros 1, 2, 2, 3, 4, dada por

    4,25

    43221 =++++ Se alterarmos o conjunto para 1, 2, 3, 3, 4 a mdia passa a ser dada por

    6,25

    43321 =++++

    4 Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante. Simbolicamente se,

    cxy ii = ento

    cxy = . Exemplo: Somando-se 2 litros de leite a cada produo diria da Mimosa temos que:

    14 e 20,18,17,15,16,12 7654321 ======= yyyyyyy Da:

    167

    1127

    14201817151612 ==++++++=y Lembrando que a mdia anterior era 14=x , temos que:

    221416 +=+== xy .

  • 35

    5 - Multiplicando-se (ou dividindo-se) uma constante (c) de todos os valores de uma varivel, a mdia do conjunto fica multiplicada (ou dividida) dessa constante. Simbolicamente se,

    cxy ii = ento

    cxy = . Exemplo: Multiplicando-se por 3 cada produo diria da Mimosa temos que:

    36 e 54,48,45,39,42,30 7654321 ======= yyyyyyy Da:

    427

    2947

    36544845394230 ==++++++=y Lembrando que a mdia anterior era 14=x , temos que:

    331442 === xy . A Mdia Aritmtica Ponderada A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a mesma importncia. Apesar desse caso ser o mais geral, h excees. Podemos considerar casos em que as observaes tenham importncias diferentes. Nesses casos, devemos ponderar a importncia de cada varivel para calcular a mdia aritmtica. Exemplo 1: Em uma faculdade a mdia semestral de cada disciplina calculada considerando as duas mdias bimestrais com peso 3 cada uma um exame final com peso 4. Se um aluno obtm 8,0 no 1 bimestre, 9,0 no 2 bimestre e 9,6 no exame final de Estatstica, Qual ser a sua mdia semestral em Estatstica? O clculo da mdia aritmtica deve levar em conta os pesos desiguais das notas. Assim, para esse aluno temos:

    Avaliao Notas Peso 1 Bimestre 8,0 3 2 Bimestre 9,0 3 Exame final 9,6 4 Total 10

    Logo: ( ) ( ) ( ) 94,810

    4,8910

    6,940,930,83ponderada mdia ==++= Isto , A mdia semestral desse aluno em Estatstica 8,94. Exemplo 2: Suponha que em outra faculdade a mdia semestral de cada disciplina calculada considerando um exame no meio do perodo e um exame final, este ltimo com o dobro do peso daquele. Qual ser a mdia semestral em Estatstica de um estudante com 8,5 no primeiro exame e 9,6 no exame final? Neste caso temos:

    Avaliao Notas Peso Meio do Perodo 8,5 1 Exame final 9,6 2 Total 3

    Logo: ( ) ( ) 23,93

    7,273

    6,925,81ponderada mdia ==+= Portanto sua mdia semestral em Estatstica 9,23.

  • 36

    Clculo da Mdia Aritmtica para Dados Agrupados Se os dados se repetem para calcular a mdia preciso multiplicar cada valor pela sua respectiva freqncia. Na verdade, ao fazer isso, estamos usando uma variante da frmula de clculo da mdia ponderada, onde os pesos so substitudos pelas freqncias das classes. Exemplo 1: Durante uma manh, um feirante vendeu determinado produto a preos variados: 12 unidades foram vendidas a 2 reais; 10 unidades foram vendidas a 3 reais e 8 unidades foram vendidas a 6 reais. Qual foi o preo mdio de venda desse produto naquela manh? Podemos construir um rol para a varivel Preo de venda do produto: 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 6 6 6 6 6 6 6 6 Para calcular o preo mdio basta somar todos esse valores e dividir o resultado por 30 que o nmero total de produtos vendidos. Observe essa conta:

    40,330

    10230

    48302430

    6831021230

    6666666633333333332222222222228x610x312x2

    ==++=++

    ++++++++++++++++++++++++++++=xxx

    x

    44444 844444 76444444 8444444 764444444 84444444 76

    Assim o preo mdio do produto pela manh foi R$ 3,40. Observe agora, a tabela de freqncia dessa varivel:

    Valor f 2 12 3 10 6 8

    Total 30 A segunda igualdade da expresso acima, nos mostra que basta ponderar cada preo praticado pela freqncia com que foi praticado, para calcular o preo mdio de venda. Para facilitar as contas, podemos criar uma coluna auxiliar na tabela de freqncia, chamada de multiplicao, correspondente aos produtos ii fx , e calcular o preo mdio dividindo o total dessa coluna pelo total da coluna de freqncia simples.

    Valor f Multiplicao2 12 2 x 12 = 24 3 10 3 x 10 = 30 6 8 6 x 8 =48

    Total 30 102 Nesse caso o clculo da mdia aritmtica se resume conta:

    40,330

    102 ==x Exemplo 2: Foram coletadas 150 observaes da varivel X, representando o nmero de vestibulares (um por ano) que um mesmo estudante prestou. Os dados esto na tabela abaixo:

  • 37

    X f 1 75 2 47 3 21 4 7

    Total 150

    Quantas vezes, em mdia, cada aluno prestou vestibular? Criando a coluna multiplicao temos:

    X f Multiplicao1 75 75 2 47 94 3 21 63 4 7 28

    Total 150 260

    73,1150260 ==X

    Pode ser de interesse estudar o gasto dos alunos associado com as despesas do vestibular. Para simplificar um pouco a situao, vamos supor que se atribui, para cada aluno, uma despesa fixa de R$ 1300,00, relativo preparao e mais R$ 50,00 para cada vestibular prestado. De posse dessas informaes, vamos calcular a mdia da varivel D: Despesa com vestibular. Pela definio desta nova quantidade temos:

    130050 += XD Logo do clculo que fizemos imediato que:

    50,1386130073,150 =+=D .

    Se os dados esto distribudos em classes, para calcular a mdia aritmtica multiplique o ponto mdio de cada classe por sua respectiva freqncia, some e divida o total pela soma das freqncias e a mdia resultante uma aproximao. Nesse caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, o que nem sempre o caso. Entretanto, se no dispomos dos dados originais, no h outra alternativa razovel. Exemplo: Imagine que a margem de lucro na venda de um produto varivel, mas que, ao longo de seis meses, foram registrados os valores apresentados na tabela abaixo. Calcule a mdia aritmtica da margem de lucro nesse perodo.

    Margem de lucro, em termos de percentual do valor de compra, segundo a classe.

    Classe f Ponto mdio Multiplicao 15 25 30 20 600 25 35 45 30 1350 35 45 150 40 6000 45 55 45 50 2250 55 65 30 60 1800

    Total 300 12000 Logo a margem mdia de lucro ser dada por:

    40300

    12000 ==x .

  • 38

    3 A Mediana. Uma segunda medida de tendncia central de um conjunto de nmeros a mediana. Mediana o valor que ocupa a posio central do conjunto dos dados ordenados. Da definio de mediana, segue-se que sua caracterstica principal dividir um conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores mediana, a outra metade ter valores superiores mediana. A mediana de uma amostra ser indicada por md. Para calcular a mediana, necessrio primeiro ordenar os valores (comumente) do mais baixo ao mais alto. Em seguida, conta-se at a metade dos valores para achar a mediana.

    Em geral, a mediana ocupa a posio 2

    1+n , onde n representa a quantidade de valores do conjunto. O processo para determinara a mediana o seguinte: 1 Ordenar os valores 2 Se o nmero de dados mpar, a mediana o valor que est no centro da srie. 3 Se o nmero de dados par, a mediana a mdia dos dois valores que esto no

    centro da srie. Exemplo 1: Calcule a mediana dos dados: 3,9,5,7,9,1,9. Para obter a mediana, ordene os dados:

    1,3,5,7,9,9,9. A posio da mediana dada por:

    428

    217 ==+

    Assim a mediana o elemento que ocupa a 4 posio na srie dos dados ordenados. Isto , a mediana 7. Note que antes do 7, existem trs nmeros menores: 1,3,5 e, depois do 7, trs nmeros maiores: 9,9,9. Exemplo 2: Calcule a mediana dos dados: 42,3,9,5,7,9,1,9. Para obter a mediana, ordene os dados:

    1,3,5,7,9,9,9,42. A posio da mediana dada por:

    5,429

    218 ==+

    Como o nmero de dados par, a mediana a mdia aritmtica dos valores que ocupam a 4 e a 5 posio na srie dos dados ordenados. Assim, a mediana dada por:

    82

    162

    97 ==+ . Logo temos quatro valores maiores do que 8 (1,3,5,7), e quatro valores menores do que 8 (9,9,9,42). Clculo da Mediana para Dados Agrupados Se os dados se agrupam em uma distribuio de freqncia, o clculo da mediana se processa de modo muito semelhante quele dos dados no agrupados, implicando, porm, a determinao prvia das freqncias acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuio em dois grupos que contenham o mesmo nmero de elementos. Tambm o processo e os resultados diferem, dependendo de dispormos ou no dos dados originais. Se dispusermos dos dados originais, o processo ser o seguinte: 1 Determine as freqncias acumuladas.

  • 39

    2 Determinar a posio da mediana. 3 Identificar a freqncia acumulada imediatamente superior ao valor determinado

    em (1). 4 A mediana ser aquele valor da varivel que corresponde a tal freqncia

    acumulada se o nmero de dados for mpar. 5 A mediana ser a mdia aritmtica entre o valor da varivel correspondente a essa

    freqncia acumulada e o da posio anterior se o nmero de dados for par. Exemplo 1: Considere a distribuio relativa a 33 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino:

    N de meninos

    f F

    0 2 2 1 6 8 2 10 18 3 11 29 4 4 33

    Total 33

    Determine a mediana desse conjunto. A posio da mediana dada por:

    172

    342

    133 ==+=posio A menor freqncia acumulada que supera esse valor 18, que corresponde ao valor 2 da varivel, sendo esse o valor mediano. Logo:

    Md = 2 meninos. Exemplo 2: Considere a distribuio relativa a 8 pessoas, tomando para varivel o nmero de vezes que vo ao cinema por ms:

    N de idas ao Cinema

    f F

    12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8

    Total 8

    Determine a mediana desse conjunto. A posio da mediana dada por:

    5,429

    218 ==+=posio

    Devemos determinar os valores da varivel que esto na posio 4 e 5. Para a posio 5 temos que a menor freqncia acumulada que supera esse valor 6, que corresponde ao valor 16 da varivel, e para a posio 4 temos que o valor da varivel correspondente 15. Logo:

    5,15231

    21615 ==+=Md

    Sem os dados originais ficamos restritos suposio de que os valores na classe que contm a mediana so distribudos de forma uniforme. Assim, o processo ser o seguinte: 1 Determine as freqncias acumuladas. 2 Identificar o intervalo que contm a mediana. 3 Determinar a aposio da mediana nesse intervalo. 4 Ordenar os valores daquela classe.

  • 40

    5 Identificar a mediana. Exemplo 1: Considere a distribuio relativa a 40 pessoas, tomando para varivel estatura de cada uma.

    Estaturas f F 150154 4 4 154158 9 13 158162 11 24 162166 8 32 166170 5 37 170172 3 40

    Total 40 Vamos calcular a mediana desses dados: A posio da mediana dada por:

    5,20241

    2140 ==+=posio

    Devemos determinar os valores da varivel que esto na posio 20 e 21. Esses dois valores esto na 3 classe que correspondem s estaturas de 158cm a 162cm. Existem 11 valores nessa classe (24 13 = 11) e a mediana a mdia aritmtica dos valores que esto nas posies 7 (20 13) e 8 (21 13) dessa classe. A amplitude dessa classe :

    4158162 = Supondo que os valores se distribuem uniformemente pela classe devemos dividir a amplitude da classe por 11 para determinar o suposto valor de cada elemento. Graficamente temos:

    Ou ainda:

    Assim, devemos tomar a mdia aritmtica dos valores:

    55,16055,21581147158 =+=+ .Correspondente 20 posio.

    e

    91,16091,21581148158 =+=+ . Correspondente 21 posio.

    Logo:

    73,1602

    46,3212

    91,16055,160 ==+=Md Dizemos ento que metade dos alunos mede menos de 160,73cm e a outra metade mede mais de 160,73cm. Comparao entre Mdia Aritmtica e Mediana A escolha da mdia, ou da mediana, como medida de tendncia central de um conjunto, depende de diversos fatores. A mdia sensvel a (ou influenciada por) cada valor do conjunto, inclusive os extremos. Por outro lado, a mediana relativamente insensvel aos valores extremos.

    Elemento 158 158,37 158,73 159,10 159,46 159,82 160,19 160,55 160,91 161,27 161,64 Posio

    na classe 0 1 2 3 4 5 6 7 8 9 10

    158 162

    20 posio

    Mediana

    21 posio14 posio

  • 41

    A mediana descreve bem os grandes conjuntos de dados. De qualquer forma, em algumas circunstncias, a mediana descreve, melhor do que a mdia, a tendncia central dos dados. Exemplo: A mediana dos dados 5,7,10,13,65 o nmero 10. Calculando a mdia desses dados temos que:

    205

    1005

    65131075 ==++++=X Graficamente temos:

    Neste conjunto h um dado discrepante que o 65. Esse valor puxa a mdia para cima, mas no afeta a mediana. Por outro lado, para o conjunto 5,7,10,13,15, a mediana ainda o nmero 10, e sua mdia dada por:

    105

    505

    15131075 ==++++=X Neste conjunto no h discrepncia de valores. Um exemplo clssico em que a mediana pode descrever melhor a tendncia central dos dados do que a mdia dado pelos salrios de uma categoria profissional. o caso dos salrios dos jogadores de futebol no Brasil. A existncia de alguns salrios muito altos afeta mais a mdia do que a mediana. Ento, a mediana d, melhor do que a mdia, idia do salrio tpico dessa categoria de profissionais. De modo geral, a mdia possui certas propriedades matemticas que a tornam atraente. Alm disso, a ordenao dos dados para determinar a mediana pode ser enfadonha, e o clculo da mediana no pode ser feito com mquina de calcular, ao contrrio do que ocorre com a mdia. 4 A Moda. A moda o valor que ocorre com maior freqncia num conjunto. A moda de uma amostra ser indicada por mo. Exemplo: Determine a moda dos dados: 0,0,2,5,3,7,4,7,8,7,9,6. A moda 7, porque o valor que ocorre o maior nmero de vezes. Um