apostila_estatistica_

Embed Size (px)

DESCRIPTION

apostila de estatistica

Citation preview

  • NOTAS DE AULA: ESTATISTICA

    BASICA

    Curso: Fisioterapia

    Profs. Flavio Bittencourt/Adriana DiasUNIFAL-MG / ALFENAS

    2016/1

  • SUMARIO

    1 SOMATORIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 Indices ou notacao por ndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Notacao de somatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4 Somatorios mais usados na Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 INTRODUCAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 ALGUMAS DEFINICOES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33.1 Variavel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33.1.1 Variaveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.1.2 Variaveis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.1.3 Variaveis independentes e dependentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.3 Populacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.4 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.5 Parametro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.6 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.7 Estimativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 AMOSTRAGEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.1 Importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84.2 Numeros aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84.3 Tipos de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94.3.1 Amostragem nao probabilstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94.3.2 Amostragem probabilstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 ESTATISTICA DESCRITIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.1 Apresentacao dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.1.1 Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.1.2 Construcao de tabelas de distribuicao de frequencias . . . . . . . . . . . . . . . . . . . . . 195.1.3 Tipos de distribuicao de frequencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235.1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245.1.5 Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245.1.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295.2 Medidas Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295.2.1 Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295.2.2 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355.2.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365.2.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395.2.5 Medidas de Variabilidade (Dispersao) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405.2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446 PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456.1.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456.1.2 Experimento determinstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456.1.3 Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466.1.4 Espaco amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466.1.5 Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476.2.1 Probabilidade a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476.2.2 Probabilidade a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486.2.3 Importante saber! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496.3 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496.3.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506.4 Regra do produto e independencia de eventos . . . . . . . . . . . . . . . . . . . . . . . . . 516.5 Independencia de tres ou mais eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

  • 6.6 Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536.6.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556.6.2 Exerccios extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 DISTRIBUICAO DE PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.1 Variavel aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.2 Distribuicao de probabilidade ou funcao de probabilidade . . . . . . . . . . . . . . . . . . . 587.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.2.2 Media e variancia de uma variavel aleatoria discreta . . . . . . . . . . . . . . . . . . . . . . 597.2.3 Distribuicao binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607.2.4 Distribuicao Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617.2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627.2.6 Exerccios Extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637.3 Distribuicao normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637.3.1 Calculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647.3.2 Condicoes para que uma funcao seja funcao densidade de probabilidade . . . . . . . . . . . 647.3.3 A distribuicao normal: informacoes adicionais . . . . . . . . . . . . . . . . . . . . . . . . . 647.3.4 Calculo de probabilidades de variaveis normais . . . . . . . . . . . . . . . . . . . . . . . . . 657.3.5 Distribuicao normal padronizada ou distribuicao normal padrao . . . . . . . . . . . . . . . 657.3.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678 TEORIA DA ESTIMACAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688.2 Distribuicao de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698.2.1 Distribuicao amostral das medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698.2.2 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708.2.3 Distribuicao amostral das proporcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718.2.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728.3 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728.4 Estimacao intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728.4.1 Intervalo de confianca para a media de uma populacao normal com variancia populacional

    2 conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738.4.2 Intervalo de confianca para a media de uma populacao normal com variancia populacional

    2 desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758.4.3 Intervalo de confianca para uma proporcao . . . . . . . . . . . . . . . . . . . . . . . . . . . 778.4.4 Determinacao do tamanho amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778.4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 799 TEORIA DA DECISAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 809.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 809.2 Erros envolvidos num teste de hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819.3 Mecanica operacional dos testes de hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . 819.4 Teste de hipoteses para uma media de uma populacao normal quando a variancia popula-

    cional for desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819.4.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 839.5 Teste de hipoteses para proporcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 849.5.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 859.6 Teste de hipoteses para comparacao das variancias de duas populacoes normais . . . . . . 859.7 Teste de hipoteses para duas medias de populacoes normais com variancias populacionais

    desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 869.7.1 Testes de hipoteses para duas medias, sendo 21 =

    22 =

    2 . . . . . . . . . . . . . . . . . . 869.7.2 Testes de hipoteses para duas medias, sendo 21 6= 22 . . . . . . . . . . . . . . . . . . . . . 879.7.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8910 TESTES QUI-QUADRADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8910.1 Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9010.2 Teste de Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9110.3 Teste de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9310.3.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9511 CORRELACAO LINEAR E REGRESSAO LINEAR SIMPLES . . . . . . . . . . . . . . . 9611.1 Diagrama de dispersao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9611.2 Coeficiente de Correlacao Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

  • 11.3 Coeficiente de determinacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9811.3.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9911.4 Regressao Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10011.4.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10312 Tabelas de distribuicoes de probabilidade teoricas . . . . . . . . . . . . . . . . . . . . . . . 105REFERENCIAS BIBLIOGRAFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

  • Estatstica Basica 1 SOMATORIO

    1 SOMATORIO

    1.1 Indices ou notacao por ndices

    O smbolo xi (leia-se x ndice i) representa qualquer um dos n valores, x1, x2, x3, . . . , xnassumidos pela variavel X, na amostra ou no conjunto de dados. Evidentemente pode ser usada qualqueroutra letra alem de i.

    1.2 Notacao de somatorio

    O smbolo

    ni=1

    xi e usado para representar a soma de todos os valores de xi desde i = 1 ate

    i = n, ou seja: ni=1

    xi = x1 + x2 + + xnExemplo: Considere a variavel X = {1, 0, 1, 2, 1}, cada valor (ou elemento) de X corresponde,

    respectivamente, a x1, x2, x3, x4, x5. Alguns somatorios podem ser calculados:

    a)

    5i=1

    xi = x1 + x2 + x3 + x4 + x5 = 1 + 0 + (1) + 2 + 1 = 3

    b)

    (5i=1

    xi

    )2= (x1 + x2 + x3 + x4 + x5)

    2= (1 + 0 + (1) + 2 + 1) = (3)2 = 9

    c)

    5i=1

    x2i = x21 + x

    22 + x

    23 + x

    24 + x

    25 = (1)

    2 + (0)2 + (1)2 + (2)2 + (1)2 = 7

    d)

    3i=1

    xi = x1 + x2 + x3 = 1 + 0 + (1) = 0

    e)

    5i=3

    xi = x3 + x4 + x5 = 1 + 2 + 1 = 2

    f)

    5i=1i 6=3, 4

    xi = x1 + x2 + x5 = 1 + 0 + 1 = 2

    1.3 Propriedades

    Sejam: a, b e k constantes; X e Y variaveis e xi e yi os valores que as variaveis X e Y assumem,entao:

    (P1) Somatorio de uma constante vezes uma variavel e igual a` constante vezes o somatorio da variavel:ni=1

    axi = ax1 + ax2 + ax3 + ...+ axn = a

    ni=1

    xi

    (P2) Somatorio de uma constante e igual ao numero de termos vezes a constante:ni=1

    k = k + k + k + . . .+ k + k (n1+1 ) vezes

    = n k

    ni=a

    k = k + k + k + . . .+ k + k (na+1 ) vezes

    = (n a+ 1) k

    (P3) Somatorio de uma soma e igual a` soma dos somatorios:ni=1

    (axi byi) = ani=1

    xi bni=1

    yi

    (P4) Somatorios de um produto de variaveis e igual ao produto dos somatorios destas variaveis:ni=1

    mj=1

    xiyj =

    ni=1

    xi mj=1

    yj

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 1

  • Estatstica Basica 1 SOMATORIO

    E importante lembrar que:

    ni=1

    xiyi 6=ni=1

    xi ni=1

    yi

    ni=1

    (xiyi

    )6=

    ni=1

    xi

    ni=1

    yi

    (ni=1

    xi

    )26=

    ni=1

    x2i

    1.4 Somatorios mais usados na Estatstica

    i. Soma simples:

    ni=1

    xi = x1 + x2 + ...+ xn

    ii. Soma de quadrados:

    ni=1

    x2i = x21 + x

    22 + ...+ x

    2n

    iii. Quadrado da soma:

    (ni=1

    xi

    )2= (x1 + x2 + ...+ xn)

    2

    iv. Soma de produtos:

    ni=1

    xiyi = x1y1 + x2y2 + ...+ xnyn

    v. Produto da soma:

    ni=1

    xi

    ni=1

    yi = (x1 + x2 + ...+ xn) (y1 + y2 + ...+ yn)

    Observacao: algumas vezes omite-se os limites do somatorio, quando isso acontecer deve-seconsiderar a soma de todos os elementos, desde i = 1 ate i = n:

    x =

    ni=1

    xi

    1.5 Exerccios

    1. Indicar, por meio da notacao de somatorio, cada uma das expressoes seguintes:a) x21 + x

    22 + x

    23 + ...+ x

    210

    b) (x1 + y1) + (x2 + y2) + ...+ (x8 + y8)c) f1x

    31 + f2x

    32 + f3x

    33 + ...+ f20x

    320

    d) (y21 1)2 + (y22 1)2 + . . .+ (y212 1)2e) (x1 1) + (x2 2)2 + (x3 3)3 + . . .+ (xn n)n2. Desenvolver os termos de cada uma das seguintes somas:

    a)

    6i=1

    xi

    b)

    4i=1

    (yi 3)2

    c)

    Ni=1

    a

    d)

    ni=a

    b

    e)

    5k=1

    fkxk

    f)

    3j=1

    (xj a)

    3. As variaveis, X e Y , assumem os valores: x1 = 2; x2 = 4; x3 = 5; x4 = 8 e y1 = 3; y2 = 8;y3 = 10; y4 = 6, respectivamente. Calcular:

    a)x

    b)y

    c)xy

    d)x2

    e)y2

    f)xy

    g)xy2

    h)

    (x+ y)(x y)

    4. Dados os valores das variaveis: X = {2, 4, 4, 3, 2}, Y = {1, 2, 3, 6, 7}, obtenha:

    a)

    4i=1

    xi

    b)

    5i=1

    yi

    c)

    5i=1

    4x2i

    d)

    5i=1

    xiyi

    e)

    5i=1

    (3xi + 2yi)

    f)

    4i=2

    xiyi +

    5i=1

    y2i

    2 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 2 INTRODUCAO

    5. Na Estatstica usa-se com frequencia calcular a media e a variancia amostral, representadas na forma

    de somatorios por: x =

    ni=1

    xi

    ne s2 =

    1

    n 1

    ni=1

    x2i

    (ni=1

    xi

    )2n

    , respectivamente, sendo n umaconstante que representa o numero de elementos (ou dados, ou observacoes) de um conjunto qualquer oude uma variavel. Considere os valores assumidos por uma variavel X qualquer: X = {2, 4, 5, 6, 1, 6};calcule a media e a variancia.

    6. a) Use os valores da variavel X do exerccio anterior para demonstrar que

    ni=1

    (xi x) = 0.b) Use as propriedades de somatorio, lembre-se que x e uma constante, para demonstrar algebricamente

    que

    ni=1

    (xi x) = 0.

    2 INTRODUCAO

    A Estatstica como ciencia somente se estruturou no seculo passado, sendo uma ferramentaindispensavel na vida moderna. Hoje, cada vez mais pessoas encontram-se expostas a ela em maior oumenor intensidade. E definida como a ciencia que se ocupa da coleta, da organizacao, da descricao, daanalise e da interpretacao de dados:a) no plural (estatsticas), indica qualquer colecao consistente de dados numericos reunidos com a finali-dade de fornecer informacoes acerca de uma atividade qualquer. Por exemplo, estatsticas demograficasreferem-se a dados numericos sobre nascimentos, falecimentos, matrimonios, desquites etc.b) no singular (estatstica), indica um corpo de tecnicas, ou ainda uma metodologia desenvolvida paraa coleta, a classificacao, a apresentacao, a analise, a interpretacao de dados e a utilizacao desses dadospara a tomada de decisoes.

    3 ALGUMAS DEFINICOES

    3.1 Variavel

    As variaveis sao as caractersticas pesquisadas ou registradas. E por meio das variaveis que setorna possvel descrever o fenomeno. As variaveis sao caractersticas que podem ser observadas ou medidasem cada elemento pesquisado (seja por censo ou por amostragem, levantamento ou experimento), sob asmesmas condicoes. Para cada variavel, para cada elemento pesquisado, em um dado momento, ha apenasum resultado possvel.

    As variaveis podem ser basicamente classificadas de acordo com o seu nvel de mensuracao (oquanto de informacao cada variavel apresenta) e seu nvel de manipulacao (como uma variavel relaciona-secom as outras no estudo). Esquematicamente a classificacao das variaveis segundo o nvel de mensuracaopode ser visualizada na Figura 1.

    Figura 1 Classificacao das variaveis

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 3

  • Estatstica Basica 3 ALGUMAS DEFINICOES

    Em relacao ao nvel de manipulacao as variaveis sao independentes e dependentes conformeilustra a Figura 2.

    Figura 2 Relacao entre variaveis

    3.1.1 Variaveis qualitativas

    Tambem denominadas de variaveis categoricas, sao aquelas cujas realizacoes sao atributos (ca-tegorias) do elemento pesquisado, como sexo, grau de instrucao, especie. Estas podem ser nominais ouordinais. As variaveis nominais podem ser medidas apenas em termos de quais itens pertencem as diferen-tes categorias, mas nao pode quantificar nem mesmo ordenar tais categorias. Por exemplo, pode se dizerque dois indivduos sao diferentes em termos da variavel A (sexo, por exemplo), mas nao se pode dizerqual deles tem mais da qualidade representada pela variavel. Exemplos tpicos de variaveis nominaissao: sexo, naturalidade, etnia etc.

    As variaveis ordinais permitem ordenar os itens medidos em termos de qual tem menos e qualtem mais da qualidade representada pela variavel, mas ainda nao permitem que se diga o quanto mais.Um exemplo tpico de uma variavel ordinal e o status socio-economico das famlias residentes em umalocalidade: sabe-se que media-alta e mais alta do que media, mas nao se pode dizer, por exemplo, quee 20% mais alta. A propria distincao entre mensuracao nominal, ordinal e intervalar representa um bomexemplo de uma variavel ordinal. Pode-se dizer que uma medida nominal prove menos informacao doque uma medida ordinal, mas nao se pode dizer quanto menos ou como esta diferenca se compara a`diferenca entre mensuracao ordinal e quantitativa.

    3.1.2 Variaveis quantitativas

    Sao aquelas cujas realizacoes sao numeros resultantes de contagem ou mensuracao, como numerode filhos, numero de visitantes, velocidade em km/h, peso, altura etc. As variaveis quantitativas saodiscretas ou contnuas. As variaveis quantitativas discretas sao aquelas que podem assumir apenas algunsvalores numericos que geralmente podem ser listados (numero de filhos, numero de acidentes). As variaveisquantitativas contnuas sao aquelas que podem assumir qualquer valor em um intervalo (velocidade, peso,altura).

    Muitos pesquisadores preferem as variaveis quantitativas por acharem que estas contem maisinformacoes do que as qualitativas. Observe os seguintes exemplos: quando a variavel distancia de umalocalidade e descrita em termos de longe e perto, sabe-se que longe e mais distante que perto, masnao se tem ideia de quao mais distante; se, contudo, descreve-se a distancia de forma numerica, medidaem metros, e uma localidade dista de um ponto de referencia 600 metros e outra dista 400, nao so se sabeque a segunda e mais perto do que a primeira, mas sao 200 metros mais perto.

    E importante ressaltar que a forma como a variavel esta sendo medida definira o seu nvel demensuracao. Por exemplo, a variavel velocidade de um carro; se definirmos velocidade como resultado deuma medicao por meio de radar resultando em um valor em km/h, trata-se de uma variavel quantitativacontnua; se, porem, definirmos a velocidade como resultado de uma medicao em que alguem declara avelocidade como baixa, media ou alta, ela passa ser qualitativa ordinal.

    3.1.3 Variaveis independentes e dependentes

    As variavies independentes sao aquelas que sao manipuladas, enquanto que as dependentes saoapenas medidas ou registradas (como manipulacao das variaveis independentes). Esta distincao confundemuitas pessoas que dizem que todas as variaveis dependem de alguma coisa. Entretanto, uma vez quese esteja acostumado a esta distincao ela se torna indispensavel.

    As variaveis independentes sao aquelas que podem influenciar os valores das variaveis depen-dentes. Somente a realizacao do estudo vai permitir verificar se ha realmente tal influencia e, somente,poderemos afirmar que a variavel independente e a causa da variavel dependente assumir determinadoresultado se o estudo for um experimento (pesquisa experimental).

    4 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 3 ALGUMAS DEFINICOES

    Os termos variavel dependente e independente aplicam-se principalmente a` pesquisa experimen-tal, onde algumas variaveis sao manipuladas, e neste sentido sao independentes dos padroes de reacaoinicial, intencoes e caractersticas das unidades experimentais. Espera-se que outras variaveis sejam de-pendentes da manipulacao ou das condicoes experimentais. Ou seja, elas dependem do que as unidadesexperimentais farao em resposta.

    Exemplo: Quando voce vai ao restaurante o valor a ser pago e dependente da quantidade decomida. Voce pode controlar a quantidade de comida no prato, mas o valor dependera desta quantidade.Ao se estudar o numero de suicdios ocorridos durante os anos 2007 a 2012 numa determinada cidade,voce manipula a variavel ano (2007 a 2012), mas o numero de suicdios sera registrado conforme o ano.

    3.2 Dados

    Sao os valores ou fenomenos obtidos na mensuracao ou observacoes de alguma variavel emestudo. Logo, os dados podem ser qualitativos (nominais ou ordinais) ou quantitativos (discretos oucontnuos) e independentes ou dependentes. Por exemplo, se a variavel estudada for sexo de indivduosque visitam um santuario, os dados sao, masculino, masculino, feminino, feminino etc.

    Considerando que a variavel estudada seja numero de filhos de um grupo de 20 casais, asrespostas obtidas, 0, 2, 3, 1, 2, 0, ... sao os dados, e neste caso, os dados sao discretos. Ao se estudara altura dos estudantes de uma sala de aula, os dados obtidos sao denominados contnuos, pois algunsvalores podem ser: 1,59m, 1,75m, 1,80m etc.

    3.3 Populacao

    Os dados sao coletados para estudar uma ou mais caractersticas de uma populacao de inte-resse. Populacao e o conjunto de medidas da(s) caracterstica(s) de interesse em todos os elementosque a(s) apresenta(m). Se, por exemplo, estamos avaliando as opinioes de eleitores sobre os candidatos apresidente, a populacao da pesquisa seria constituda pelas opinioes declaradas pelos eleitores em questao.

    3.4 Amostra

    Uma amostra da populacao e um subconjunto finito e representativo da populacao. Por exem-plo, se a populacao da pesquisa for constituda pelas opinioes declaradas pelos eleitores, uma amostraseria parte dessas declaracoes. Quer dizer que e necessario amostrar um grupo de eleitores e a partir delesconstituir uma amostra das declaracoes das suas opinioes.

    3.5 Parametro

    E uma constante que caracteriza uma populacao. Sao exemplos de parametros:

    : media populacional 2: variancia populacional : desvio padrao populacional p: proporcao populacional etc.

    3.6 Estimador

    E uma expressao algebrica (formula) utilizada para obter um valor aproximado de um parame-tro. Sao exemplos de estimadores:

    x =

    ni=1

    xi

    n: media amostral

    s2 = 1n 1

    ni=1

    x2i

    (ni=1

    xi

    )2n

    : variancia amostral

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 5

  • Estatstica Basica 3 ALGUMAS DEFINICOES

    s =s2: desvio padrao amostral

    p = yn

    : proporcao amostral, sendo y o numero de sucessos observados em uma amostra de tamanho n

    etc.

    3.7 Estimativa

    E o valor numerico de um estimador. E determinada usando os dados amostrais.Se o estimador e x, uma estimativa pode ser x = 1,72 m.

    Exemplo: O objetivo de uma pesquisa e conhecer o consumo medio semanal de combustvel deambulancias do Hospital HS em um dado ano.Variavel: Consumo semanal de combustvel das ambulancias do Hospital HS em um dado anoPopulacao: Todos os consumos semanais de combustvel das ambulancias em um dado ano: N = 52consumos semanaisParametro: Consumo medio semanal de combustvel das ambulancias em um dado ano: Amostra (parte da populacao): algumas semanas, por exemplo, n = 20 consumos semanais

    Estimador: x =

    ni=1

    xi

    nEstimativa: 60 L de combustvel em media por semana.

    3.8 Exerccios

    1. A altura de um estudante (em cm) e a sua naturalidade sao as variaveis estudadas por um pesquisador.Estas duas variaveis sao:a) ambas contnuasb) ambas discretasc) quantitativas contnuasd) qualitativas nominaise) quantitativa e qualitativa, respectivamente2. Logo ao nascer, os filhotes sao pesados e medidos, para saber se estao dentro da faixa ideal para aespecie. Estas duas variaveis sao:a) qualitativasb) ambas discretasc) contnua e discreta, respectivamented) discreta e contnua respectivamentee) ambas contnuas3. Relacione a segunda coluna de acordo com a primeira.

    (1) Variavel qualitativa nominal ( ) Numero de filhotes por camundongas nascidos hoje

    (2) Variavel qualitativa ordinal ( ) Pesos de recem nascidos (em g) observados em um mes

    (3) Variavel quantitativa discreta ( ) Diametro cefalico de ratos que serao cobaias

    (4) Variavel quantitativa cont- ( ) Sexo dos 43 alunos de uma turma

    nua ( ) Profissao dos entrevistados de uma pesquisa eleitoral

    ( ) Classificacao de candidatos de um concurso

    ( ) Estado civil dos professores do curso biotecnologia

    ( ) Tempo de vida (em h) de lampadas dos microscopios

    ( ) Volume de agua contida nos reservatorios de uma cidade

    ( ) Escolaridade dos participantes de um congresso

    4. Relacione a segunda coluna de acordo com a primeira.

    (1) Dado qualitativo nominal ( ) Numero de filhotes por camundongas nascidos hoje

    (2) Dado qualitativo ordinal ( ) Pesos de recem nascidos (em g) observados em um mes

    6 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 4 AMOSTRAGEM

    (3) Dado quantitativo discreta ( ) Diametro cefalico de ratos que serao cobaias

    (4) Dado quantitativo contnua ( ) Sexo dos 43 alunos de uma turma

    ( ) Profissao dos entrevistados de uma pesquisa eleitoral

    ( ) Classificacao de candidatos de um concurso

    ( ) Estado civil dos professores do curso biotecnologia

    ( ) Tempo de vida (em h) de lampadas dos microscopios

    ( ) Volume de agua contida nos reservatorios de uma cidade

    ( ) Escolaridade dos participantes de um congresso

    5. Classifique as variaveis em variavel independente (VI) e variavel dependente (VD).a) Avaliacao se diferentes nveis de estresse ( ) afetam a frequencia cardaca em humanos ( ).b) Uma pesquisa avalia o efeito do nvel da escolaridade ( ) sobre a renda anual da famlia ( ).c) Nota obtida na prova de Estatstica ( ) de acordo com o tempo semanal de estudo ( ).d) Na pesquisa frequencia do aluno na monitoria ( ) e a aprovacao na disciplina de Estatstica ( )foram avaliados 50 alunos.e) Uma pesquisa avalia as funcoes exercidas em uma empresa de produtos qumicos ( ) de acordo como sexo do funcionario ( ).f) Uma pesquisa avalia em uma empresa os salarios atuais ( ) em funcao do sexo do funcionario ( ).g) Um pesquisador gostaria de estudar como estao os salarios atuais ( ) em funcao dos anos de educacaodo funcionario ( ) na empresa que ele trabalha.6. Qual das declaracoes e verdadeira?a) Parametros descrevem amostras e estimativas descrevem populacoes.b) Estimativas descrevem amostras e populacoes.c) Parametros descrevem populacoes e estimativas descrevem amostras.d) Parametros descrevem amostras e populacoes.

    4 AMOSTRAGEM

    E a parte da estatstica que estuda os diversos processos de obtencao de amostras com o objetivode que elas sejam representativas da populacao em estudo. Amostras representativas sao aquelas queguardam ou reproduzem as mesmas caractersticas da populacao.

    Experiencia com amostragem e fato no nosso cotidiano. Quando voce verifica o tempero de umprato, nao sera necessario comer tudo o que tem na panela. Quando voce verifica a temperatura do seucorpo, nao precisa colocar o termometro em todas as suas partes. Ao verificar a calibragem do pneu doseu carro, voce se baseia em apenas um ponto. Ao realizar um exame de sangue o laboratorio retira 40mL, pois e suficiente para os exames de rotina.

    De acordo com estas situacoes, a amostragem torna-se necessaria, entretanto, o uso inadequadode um procedimento de amostragem pode induzir a um vies de interpretacao, como, por exemplo, naomexer a sopa antes de tirar uma colher para verificar a temperatura do prato todo.

    Considerando-se uma populacao a ser estudada, por meio de tecnicas de amostragem, obtem-seuma amostra (ou varias amostras), posteriormente calcula-se as estatsticas de interesse para a realizacaode inferencias (aproximar ou concluir) sobre as caractersticas da populacao (parametros). A Figura 3esquematiza a obtencao de uma amostra e o uso de alguns estimadores para o calculo das estimativasque serao uteis para a realizacao de inferencia de um ou mais parametros de interesse.

    Figura 3 Esquematizacao do processo de amostragem

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 7

  • Estatstica Basica 4 AMOSTRAGEM

    Uma das principais subdivisoes da Estatstica e a Amostragem, que reune os metodos neces-sarios para coletar adequadamente amostras representativas e suficientes para que os resultados obtidospossam ser generalizados para a populacao de interesse. Na pratica, nem sempre, a populacao estudadae homogenea. Detalhes no planejamento deverao ser considerados pelo pesquisador para a execucao deum trabalho de amostragem com sucesso.

    4.1 Importancia

    Como o interesse maior esta na populacaoo ideal seria pesquisar toda a populacao, em suma,realizar um censo (como o IBGE faz periodicamenteno Brasil). Contudo, por razoes economicas ou pra-ticas (para obter rapidamente a informacao ou evi-tar a extincao ou exaustao da populacao) nem sem-pre e possvel realizar um censo, como exemplificaa Figura1 4. Por razoes economicas entende-se alimitacao de recursos ou o alto custo; por razoespraticas, entende-se a limitacao de tempo e/ou doacesso a todos os indivduos da populacao. Quandoeste for o caso, e prefervel conhecer a populacao apartir de uma parte dela (amostra), pois a principalvantagem de se usar amostragem ao inves de censopara pesquisar algo da populacao e o menor custoe o menor tempo para a operacao.

    Figura 4 Nao seria melhor uma amostra?

    4.2 Numeros aleatorios

    Antes de se estudar cada tipo de amostragem, deve-se procurar uma ferramenta que seja viavelpara a selecao (ou sorteio) dos indivduos da populacao em estudo. Procedimentos como papeizinhosenumerados, palitinho, bingo entre outros sao uteis, mas em alguns casos nao sao funcionais. A ferramentautilizada pela estatstica e a tabua de numeros aleatorios, ou numeros aleatorios gerados por programascomputacionais, ou ate mesmo gerados pela sua calculadora (funcao random).

    Nas planilhas eletronicas (Excel, LibreOffice Calc) basta digitar em uma celula qualquer ocomando = aleatorio() e teclar Enter. Na sua calculadora cientfica existe a tecla RAN# que gera umnumero aleatorio entre 0 e 0,999. Se voce multiplicar RAN# pelo tamanho da sua populacao, a calculadoragerara um numero compreendido entre 0 e o tamanho N da sua populacao.

    Para usar qualquer tipo de dispositivo aleatorio deve-se considerar o tamanho N da populacaoda qual se quer selecionar indivduos e quantos algarismos sao necessarios para identificar um indivduo.Por exemplo: se a sua populacao tiver 10 indivduos, voce podera identifica-los pelos numeros de 0 a 9,ou por 01, 02, , 10; na primeira situacao foi utilizado um algarismo para identificar cada indivduo, nasegunda, dois; se tiver 100 indivduos, voce podera usar dois algarismos (00, 01, 02, , 99) ou tres (001,002, 003, , 100); se tiver 932 indivduos, tres algarismos serao necessarios.

    Existem diversos modelos de tabuas de numeros aleatorios e diversas formas de gerar numerosaleatorios. O uso de tabuas de numeros aleatorios ou a funcao random da calculadora e bastante simples.E importante saber quantos algarismos sao necessarios para se identificar um indivduo da populacao.

    Exemplo: Numa populacao2 de tamanho N = 300 indivduos, por algum motivo, sera obtidauma amostra de tamanho n = 10. Como devera ser realizada a selecao destes 10 indivduos? E quaisserao sorteados?Resolucao:

    + Primeiramente deve-se enumerar os indivduos, por exemplo de 001 a 300.+ Considerando a Tabela 3 como uma tabela de numeros aleatorios obtida em um livro (ou

    por um programa de computador) e necessario:- Decidir qual parte do numero aleatorio sera adotada, por exemplo, na Tabela 3 cada

    numero possui 5 dgitos, a populacao esta identificada por 3 dgitos; desses 5 dgitos, quais serao ado-tados? Os tres primeiros? Os tres internos? Os tres finais? Etc. Adontado uma situacao ela deve serseguida para quaisquer outros numeros obtidos da tabela;

    - Escolher a`s cegas um numero;

    1 Fonte: http://rogeriocarpi.wordpress.com/2010/02/10/6-respostas-persuasivas-para-quem-nao-acredita-em-amostragem/.Acesso em: 06 nov. 2014 2 N sera sempre usado para representar o tamanho da populacao e n sempre se referira aotamanho da amostra.

    8 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 4 AMOSTRAGEM

    - Obter outros numeros sistematicamente, na linha tal qual se le um livro (da esquerdapara a direita), como se le uma lista de classificacao (de cima para baixo) ou de outra forma;

    - Considerar apenas os numeros que fizerem parte do intervalo de valores que identifi-cam os indivduos da populacao, os demais numeros fora do intervalo deverao ser descartados;

    - Selecionar tantos indivduos quanto for o tamanho da amostra.+ Da Tabela 3 a`s cegas foi escolhido o numero 67824 e que serao considerados somente os 3

    primeiros dgitos de cada numero aleatorio obtido da leitura realizada da esquerda para a` direita. Como678 nao e um numero que esta no intervalo de 001 a 300 ele sera descartado e sera, entao, observado oproximo numero, 52681, do qual 526 devera ser adotado, mas que da mesma forma que o numero anterior,devera ser descartado. O mesmo acontece com os numeros 31148 e 83761. Depois, o proximo numero databela e o numero 07236 que indentifica o indivduo de numero 072, pois 072 e um numero do intervalo de001 a 300. Outros numeros aleatorios da sequencia sao 66537, 70834, 33260, 72583, 31768, 30247, 90313,77538 que deverao ser, tambem, descartados pelo mesmo motivo. Portanto, seguindo o procedimento, osnumeros aproveitaveis da tabela sao: 05367, 21768, 09324, 29734, 09525, 29448, 05783, 13143, 05070 osquais identificam os indivduos 053, 217, 093, 297, 095, 294, 057, 131 e 050. Juntamente com 072 estesnumeros identificam os n = 10 indivduos que comporao a amostra.

    Tabela 3 Tabua de numeros aleatorios

    00071 11404 10478 24317 60312 25164 12446 6268986770 65621 95574 93724 49741 65251 11256 0122243287 93998 73709 00325 78627 36815 87116 9480007386 22667 52883 05673 74698 64385 12125 0623316458 33362 67824 52681 31148 83761 07236 6653770834 33260 72583 31768 30247 90313 77538 0536754121 21768 09324 79572 29734 68417 97521 5669809525 76354 93561 63399 84743 39751 29448 3179095267 75464 05783 98523 48585 66947 30541 6472890400 93614 13143 58366 05070 37304 48277 3413273045 41818 07465 32104 56402 53973 20565 5487365401 27959 64237 63240 53541 13547 33938 6125812452 33456 66657 01233 09002 87756 07654 5679954333 22333 43321 43338 00032 09993 23233 5003298772 98876 55532 32185 23875 44542 75500 0440343554 76539 00672 11144 15655 30033 74421 23793

    Nota: tabela resumida

    Caso use a calculadora ou uma planilha eletronica, a ideia e a mesma. Entretanto, a tecnologiapermite selecionar somente indivduos dentro do intervalo, facilitando o trabalho do pesquisador.

    4.3 Tipos de amostragem

    O modo como a amostra sera retirada da populacao e definida pelo tipo de amostragem, podendoser nao probabilstica ou probabilstica. Cada qual apresenta suas particularidades e aplicacoes.

    4.3.1 Amostragem nao probabilstica

    Esse tipo de amostragem e usada quando a selecao de indivduos e justificada ou racional. Osindivduos serao selecionados de modo nao probabilstico, ou seja, eles nao apresentam probabilidade iguala de pertencer a` amostra. As estatsticas observadas na amostra nao podem ser generalizadas para apopulacao por nao ter como estimar o erro amostral, contudo se as caractersticas da populacao acessvelforem semelhantes a` populacao em estudo, as estatsticas podem ser equivalentes aos de uma amostragemprobabilstica, embora nao haja garantia da sua confiabilidade.

    Entre as diversas justificativas para o seu uso, destacam-se:

    i) Inacessibilidade a toda populacao;

    ii) A populacao nao pode ser enumerada;

    iii) A populacao e formada por material contnuo;

    iv) A escolha da amostra e feita intencionamente.

    Os tipos de amostragem nao probabilstica mais comuns sao:

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 9

  • Estatstica Basica 4 AMOSTRAGEM

    i) Amostragem a esmo - e utilizada quando ha inacessibilidade a toda populacao, quando nao e possvelenumerar todos os indivduos da populacao ou quando a populacao e formada por material contnuo.Exemplos:

    a) Num lote com 20.000 ampolas de certo medicamento selecionar aleatoriamente 100 ampolasseria muito trabalhoso, entao, simplesmente seleciona-se algumas a esmo.

    b) Numa fabrica em que se produz um certo produto em serie, nao e possvel enumerar todosos indivduos e nem ter acesso a todos, entao, neste caso, seleciona-se os que estao sendo produzidosno momento.

    c) Estudo sobre a qualidade do ar, estudo sobre a qualidade da agua, estudo sobre a qualidadedo solo, estudo sobre nvel de glicose no sangue etc, sao exemplos em que a populacao alvo e formadapor material contnuo.

    ii) Amostragem intencional - o pesquisador escolhe deliberadamente certos elementos para formar a

    amostra baseado num pre-julgamento. E um tipo de amostragem muito usado em estudos quali-tativos. O risco de se obter uma amostra viciada e muito grande por se basear na preferencia dopesquisador. Exemplo: Ao experimentar os efeitos de uma nova droga para o tratamento da AIDSo pesquisador escolhe n = 20 pacientes terminais entre todos os pacientes com a doenca.

    iii) Amostragem por cotas - e semelhante a uma amostragem estratificada proporcional3, diferenciandopor nao empregar sorteio na selecao dos elementos a serem amostrados. Muito empregada naspesquisas eleitorais em que a populacao e dividida em subgrupos, segundo informacoes do IBGE,dos quais seleciona-se uma cota proporcional ao seu tamanho. Os indivduos que farao parte daamostra sao selecionados pelos entrevistadores e nao de forma aleatoria (probabilstica).

    4.3.2 Amostragem probabilstica

    Uma amostragem probabilstica considera que todos os elementos da populacao tem probabi-lidade conhecida e nao nula de pertencer a` amostra. Ela e aplicavel sempre que for possvel enumerar apopulacao de modo que cada indivduo tenha a mesma chance de compor uma amostra.

    A amostragem probabstica pode ser:

    Amostragem simples ao acaso (ASA)

    E usada quando a populacao e homogenea, podendo ser com ou sem reposicao. Sendo comreposicao, um indivduo podera fazer parte da amostra mais de uma vez. E se for sem reposicao, umindviduo so tem oportunidade de aparecer na amostra apenas uma unica vez.

    Suponha uma populacao composta pelas caractersticas de interesse de 3 indivduos A, B e C, daqual se deseja obter uma amostra de tamanho 2. Tem-se, entao, N = 3 e n = 2. Portanto, se amostragemfor com reposicao e possvel obter Nn amostras diferentes, ou seja, Nn = 32 = 9 amostras diferentes:AA, AB, AC, BA, BB, BC, CA, CB ou CC. Se a amostragem for sem reposicao e possvel formar CN, namostras distintas4. Por exemplo, na populacao descrita anteriormente obtem-se CN, n = C3, 2 = 3amostras diferentes: AB, AC ou BC.

    Para executar uma amostragem simples ao acaso (ASA), deve-se:

    Enumerar todos indivduos da populacao; Realizar o sorteio; Coletar as informacoes dos indivduos amostrados.

    Exemplo: Uma sala de aula possui 30 alunos. Pretende-se conhecer a idade media da turma.Suponha que a idade (em anos) de cada um seja: 25, 20, 35, 21, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20,19, 25, 23, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Extraia uma amostra aleatoria simples detamanho n = 10 desta populacao.Solucao;O primeiramente enumera-se os indivduos. Os numeros entre parenteses indentificam os alunos, assim:25(01), 20(02), 35(03), 21(04), 22(05), 24(06), 25(07), 30(08), 38(09), 24(10), 20(11), 20(12), 25(13), 20(14), 19(15),25(16), 23(17), 24(18), 28(19), 24(20), 24(21), 22(22), 28(23), 26(24), 23(25), 25(26), 22(27), 27(28), 25(29), 23(30).Agora, e realizar o sorteio. Usando a funcao random da calculadora os n = 10 alunos selecionados foram:

    3 E um tipo de amostragem probabilstica 4 CN, n =N !

    n!(N n)!

    10 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 4 AMOSTRAGEM

    11o, 10o, 5o, 23o, 25o, 10o, 4o, 2o, 1o, 28o.Destes alunos sorteados, obtem-se, respectivamente, as seguintes idades: 20, 24, 22, 28, 23, 24, 21, 20,25, 27. Portanto a idade media e igual a 23,4 anos.

    Amostragem sistematica (AS)

    E usada quando a populacao e homogenea e possui algum tipo de organizacao, como filas, ruas,ordem alfabetica, data de aniversario, data de entrada no hospital etc. A amostragem sistematica euma adaptacao da amostragem simples ao acaso e e usada quando a populacao util e muito grande e asunidades amostrais nao podem ser numeradas de forma conveniente ou exequvel. Consiste em lecionarcada indivduo de ordem k, sendo o primeiro indivduo sorteado entre 1 e k.

    Para realizar uma amostragem sistematica (AS), segundo [1], deve-se:

    Ordenar os elementos da populacao segundo algum criterio. Determinar o intervalo de amplitude (k), tambem denominado de passo de amostragem:

    k =N

    nSendo:

    k: o intervalo de amplitude (e um numero inteiro, quando necessario, deve-se arredondar);

    N : o tamanho da populacao (numero de indivduos) e

    n: o tamanho da amostra.

    Usar um dispositivo aleatorio para sortear um numero entre 1 e k. Este numero e denominado deincio casual i e representa o primeiro e unico elemento que foi sorteado da populacao.

    Determinar os demais elementos (indivduos) utilizando-se o incio casual i e o passo de amostragemk conforme o esquema a seguir:

    i+ k, i+ 2k, i+ 3k, . . . , i+ (n 1)k;Sendo i + k o segundo elemento, i + 2k o terceiro elemento e assim ate o i + (n 1)k o n-esimoelemento. Logo, os elementos que fazem parte da amostra sao:

    i, i+ k, i+ 2k, i+ 3k, . . . , i+ (n 1)k; Coletar as informacoes dos indivduos amostrados.

    Exemplo: Suponha que em um hospital ha 80 criancas diagnosticadas com cancer e que poralgum motivo deseja-se uma amostra de tamanho5 n = 10 para tracar o perfil dessas criancas [1]. Quaiscriancas serao selecionadas?Solucao:

    Considerando que as criancas estejam ordenadas de alguma forma, como por exemplo, porordem alfabetica agrupadas em pastas, como a Figura 5.

    Figura 5 Pastas com os nomes das criancas

    Cabera, agora, calcular o intervalo de amplitude (passo de amostragem):

    k =N

    n=

    80

    10= 8

    Sorteia-se um numero entre 1 e k = 8 para determinar o incio casual. Suponha que foi sorteadoo numero 1, entao os elementos amostrados sao:5 Este tamanho de amostra nao foi determinado, portanto nao e possvel a generalizacao dos resultados para a populacaode criancas, serve apenas para ilustracao

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 11

  • Estatstica Basica 4 AMOSTRAGEM

    i = 1i+ k = 1 + 8 = 9

    i+ 2k = 1 + 2 8 = 17i+ 3k = 1 + 3 8 = 25i+ 4k = 1 + 4 8 = 33

    i+ 5k = 1 + 5 8 = 41i+ 6k = 1 + 6 8 = 49i+ 7k = 1 + 7 8 = 57i+ 8k = 1 + 8 8 = 65i+ 9k = 1 + 9 8 = 73

    Se, por acaso, o numero sorteado entre 1 e k = 8 fosse igual a 3, teria i = 3 e as criancasamostradas seriam:

    3, 11, 19, 27, 35, 43, 51, 59, 67, 75.

    Amostragem por conglomerado (AC)

    E usada quando a populacao pode ser agrupada em subconjuntos ou conglomerados heteroge-neos que possui a caracterstica da populacao em estudo. Esses agrupamentos normalmente consistem deunidades como regioes, cidades, partes do censo, de onde e selecionada uma amostra simples ao acaso. Oobjetivo principal e facilitar a coleta de informacao dos elementos da amostra.

    Para realizar uma amostragem por conglomerado e necessario:

    Dividir a populacao em conglomerados (heterogeneos dentro e homogeneos entre si); Sortear os conglomerados a serem estudados por meio de uma ASA; Coletar informacoes de todos os indivduos que compoem o conglomerado ou selecionar alguns

    indivduos por meio de outras tecnicas de amostragem dentro de cada conglomerado de acordo como tamanho da amostra necessario.

    Na Figura 6 e apresentada uma populacao de tamanho N composta por M conglomerados daqual sao selecionados m conglomerados para avaliar os n indivduos que deverao ser amostrados6.

    Figura 6 Esquematizacao da amostragem por conglomerado

    Uma amostragem por conglomerado e indicada quando: nao se possui uma lista contendo todosos nomes dos elementos da populacao; existe grande heterogeneidade entre os elementos da populacao; epreciso fazer entrevistas ou observacoes em grandes areas geograficas e o custo para a obtencao dos dadoscresce com o aumento da distancia entre os elementos.

    Exemplo: Um pesquisador quer identificar os principais fatores causadores de estresse no tran-sito em adultos das cidades de Minas Gerais com mais de 100.000 habitantes.Populacao: N adultos das cidades de Minas Gerais com mais de 100.000 habitantes;Conglomerados: M cidades com mais de 100.000 habitantes;Amostra de conglomerados: m cidades selecionadas;Amostra de elementos: n adultos das m cidades da amostra de conglomerados.

    Amostragem estratificada (AE)

    E usada quando a populacao e heterogenea, mas pode ser agrupada em grupos menores ho-mogeneos denominados de estratos. E uma adaptacao da amostragem simples ao acaso, diferenciando,apenas, por ter subgrupos mutuamente exclusivos, os estratos, de onde sao extradas amostras aleatorias.

    6 Sera considerado, para simplificar, que no conglomerado sorteado todos os seus elementos serao estudados

    12 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 4 AMOSTRAGEM

    Tem por objetivo: melhorar a representatividade da amostra quando os elementos da populacao sao he-terogeneos, porem, podem ser agrupados em subpopulacoes (estratos) contendo elementos homogeneos.Os estratos podem ser: sexo, idade, nvel socioeconomico, regiao etc.

    Para realizar uma amostragem estratificada e importante seguir os procedimentos:

    Dividir a populacao em k estratos (homogeneos dentro e heterogeneos entre si);

    Enumerar os indivduos dentro de cada estrato;

    Obter de cada estrato de tamanho Ni, com i = 1, 2, . . . , k, amostras de tamanho ni das quais osindivduos serao sorteados por meio de uma ASA;

    Coletar as informacoes dos indivduos selecionados de cada amostra.

    Na Figura 7 esta representada uma populacao dividida em k estratos da qual se observa que emcada estrato de tamanho Ni foram obtidas, respectivamente, amostras de tamanho ni. Alem disso nota-seque a soma dos tamanhos de cada estrato e igual ao tamanho da populacao e que a soma dos tamanhosde cada amostra obtida do seu respectivo estrato e igual ao tamanho da amostra a ser pesquisada.

    Figura 7 Esquematizacao da amostragem estratificada

    De acordo com as caractersticas dos estratos, a amostragem estratificada pode ser:

    Amostragem estratificada uniforme

    Quando os k estratos tiverem tamanhos iguais ou proximos, as amostras de cada estrato podempossuir mesmos tamanhos. Neste caso o tamanho de cada amostra a ser obtida de cada estrato dapopulacao e calculada por:

    ni =n

    k

    Em que:ni: e o tamanho da amostra a ser obtida de cada estrato, i = 1, 2, . . . , k;

    n: e o tamanho da amostra, sendo queki=1

    ni = n;

    k: e o numero de estratos desta populacao.

    Exemplo: No hospital HS estao em observacao 500 pessoas de 0 a 40 anos. Por algum motivodividiu-se a populacao em k = 5 estratos, ou seja, 5 categorias de idades. Posteriormente, contou-sequantas pessoas faziam parte de cada estrato (idade). Foi definido7 que o tamanho da amostra n a serobtida e igual a 50. A divisao dos estratos e o numero de pessoas por estrato e apresentado na Tabela 4.

    7 O calculo para determinar o tamanho da amostra sera apresentado na Secao 8.4.4

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 13

  • Estatstica Basica 4 AMOSTRAGEM

    Tabela 4 Estratificacao das 500 pessoas em observacao no hospital HS

    Estratos (Idades) Numero de indivduos

    00 ` 02 10002 ` 05 9805 ` 10 10410 ` 20 10220 ` 40 96

    Total 500

    Calcule o tamanho da amostra a ser obtida em cada estrato.Solucao: Como cada estrato apresenta tamanho muito proximo, optou-se por uma amostra estratificadauniforme sendo que o tamanho de cada amostra a ser obtida de cada estrato e igual a:

    ni =n

    k=

    50

    5= 10

    Desta forma, a divisao dos estratos, o numero de pessoas por estrato e o tamanho da amostraa ser obtida em cada estrato podem ser visualizados na Tabela 5.

    Tabela 5 Estratificacao das 500 pessoas em observacao no hospitalHS e os respectivos tamanhos dos estratos e tamanhos de amostras

    Estratos (Idades) Numero de indivduos Tamanho da amostra

    00 ` 02 100 1002 ` 05 98 1005 ` 10 104 1010 ` 20 102 1020 ` 40 96 10

    Total 500 50

    Deve-se observar que a soma dos tamanhos de cada estrato e igual ao tamanho da populacaoem estudo e que a soma das amostras obtidas de cada estrato e igual ao tamanho da amostra de interesse.

    Amostragem estratificada proporcionalNesta amostragem estratificada, do estrato i deve-se obter uma quantidade (amostra) ni de

    elementos que e proporcional ao tamanho Ni de cada estrato da populacao de tamanho N . O tamanhoni de cada estrato e determinado por:

    ni =NiN n

    Em que:ni: e o tamanho da amostra a ser obtida no estrato iNi: e o tamanho do estrato i;N : e o tamanho da populacao;n: e o tamanho da amostra.

    Exemplo: Em um hospital estao em observacao 1000 pessoas de 0 a 40 anos. Por algum motivodividiu-se a populacao em k = 5 estratos, ou seja, 5 categorias de idades. Posteriormente, contou-sequantas pessoas faziam parte de cada estrato (idade). Foi definido que o tamanho da amostra n a serobtida e igual a 50. A divisao dos estratos e o numero de pessoas por estrato podem ser observados naTabela 6.

    Tabela 6 Estratificacao das 1000 pessoas em observacao no hospital HS

    Estratos (Idades) Numero de indivduos

    00 ` 02 50002 ` 05 32005 ` 10 10010 ` 20 5020 ` 40 30

    Total 1000

    Determine o tamanho das amostras a serem obtidas em cada estrato da populacao em estudo.Solucao:

    Para obter o tamanho das amostras a serem retiradas de cada estrato deve-se calcular:

    14 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 4 AMOSTRAGEM

    Para o estrato 1: n1 = N1N n = 500

    1000 50 = 25

    Para o estrato 2: n2 = N2N n = 320

    1000 50 = 16

    Para o estrato 3: n3 = N3N n = 100

    1000 50 = 5

    Para o estrato 4: n4 = N4N n = 50

    1000 50 = 2,5

    Para o estrato 5: n5 = N5N n = 30

    1000 50 = 1,5

    Organizando os resultados obtidos na Tabela 7, observa-se que foi arredondado para cima otamanho da amostra do estrato 4 e que foi truncado o valor obtido para o tamanho da amostra do estrato5. Tal operacao foi realizada a fim de que a soma dos tamanhos das amostras retiradas dos estratos fosseigual a n = 50.

    Tabela 7 Estratificacao das 1000 pessoas em observacao no hospital

    HS e os respectivos tamanhos dos estratos e tamanhos de amostrasEstratos (Idades) Numero de indivduos Tamanho da amostra

    00 ` 02 500 2502 ` 05 320 1605 ` 10 100 0510 ` 20 50 0320 ` 40 30 01

    Total 1000 50

    Novamente, nota-se que a soma dos tamanhos de cada estrato e igual ao tamanho da populacaoe que a soma dos tamanhos das amostras obtidas dos estratos e igual ao tamanho da amostra a serestudada.

    Amostragem estratificada otimaEm uma amostragem estratificada otima alem do tamanho de cada estrato e considerada,

    tambem, a variabilidade dos dados do estrato para determinar o tamanho da amostra a ser obtida nosmesmos. Com isso consegue-se otimizar a obtencao de informacoes sobre a populacao, pois naqueleestrato em que houver menor variacao ela podera influenciar na obtencao de uma menor quantidade deelementos amostrados.

    Assim, o tamanho de cada amostra a ser retirada do seu respectivo estrato e calculado por:

    ni =Niinki=1

    Nii

    Sendo:ni: e o tamanho da amostra a ser obtida no estrato iNi: e o tamanho do estrato i;n: e o tamanho da amostra;k: e o numero de estratos;i: e o desvio padrao populacional do estrato i.Crtica:Necessidade de conhecer o desvio padrao populacional em cada estrato para a variavel estratificadora, oque em geral nao possvel. Usa-se, entao, estima-lo por meio de uma amostra piloto encontrando, assim,o desvio padrao amostral8 que e usado para estimar o desvio padrao populacional.Quando a variavel em estudo e qualitativa nao existe o desvio padrao populacional.

    4.4 Exerccios

    1. Observe a figura ao lado. Responda: o quetem isto a ver com amostragem? Se tem algo, qualamostragem poderia ser realizada pelo marido paranao escutar uma bronca da sua esposa? Justifique.

    8 O calculo do desvio padrao amostral sera visto na Secao 5.2.5

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 15

  • Estatstica Basica 4 AMOSTRAGEM

    2. Um cientista pretende observar o comportamento dos 67 primatas de uma reserva, para isso ele querestudar 10 deles. Entao, ele cria uma estrutura amostral atribuindo a esses primatas os numeros 01, 02,. . ., 67, e obtem a seguinte sequencia de numeros gerada por computador:

    39126 49648 81754 09284 1021923109 31157 00890 12782 1692274448 63933 69134 38845 7731513332 25819 91862 19203 1286420783 68735 09460 63677 52029

    Se ele utiliza os dois primeiros numeros de cada numero aleatorio (comecando, assim, com 39, 49, 81, 09,. . .), quais primatas serao selecionados?3. Os 35 alunos de uma determinada sala de aula possuem as seguintes idades em anos: 25, 20, 35, 21,22, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23,28, 27, 22. Com o objetivo de estimar a idade media, como voce extrairia uma amostra simples ao acaso,de tamanho n = 10 desta populacao? Determine a idade media da turma. De todos os detalhes.4. Os 60 pacientes de um medico apresentam os nveis de glicose em jejum em mg/dL:

    62 58 62 69 58 70 66 78 77 64 68 7859 54 77 73 78 80 74 71 60 79 78 7377 60 81 75 64 66 63 66 62 84 81 7878 77 78 76 75 71 75 74 68 87 78 7679 67 66 77 76 72 80 78 76 64 75 79

    Sorteie 10 pacientes, sem reposicao, desse conjunto. Use a tabua de numeros aleatorios abaixo, adotepares de numeros, como se le um livro, comecando por 70, 89, 18, 88, 21, 97, 45, ...

    70891 88821 97452 20353 06361 70990 18735 5608626943 40213 23032 58781 27620 97239 15102 8648301587 05547 41280 00572 18550 32127 48564 5874819827 45549 06723 64692 55592 31574 11217 3279463345 61088 01293 93914 32518 61105 56574 5010511601 04533 53473 74240 32640 16851 23814 3843903748 67555 03404 91598 66248 13918 92221 1945011166 20498 99753 86323 46310 05831 65045 77398

    a) Quais foram os pacientes sorteados?b) Quais sao os valores de glicemia de cada indivduo amostrado?5. Se os 35 alunos do exerccio 3 estivessem organizados em 5 filas de 7 alunos cada, qual seria a tecnicade amostragem mais indicada? Selecione uma amostra de tamanho n = 10 e determine a idade media daturma dando todos os detalhes.6. Uma empresa tem 3.414 empregados repartidos nos seguintes setores:

    Setores No de funcionariosAdministrativo 314Transporte 948Operarios 1.451Outros 701

    Deseja-se selecionar uma amostra de tamanho n = 50 de funcionarios para uma entrevista. Qual o tipode amostragem e recomendado para esta situacao? Justifique e apresente todos os passos para selecionaros 50 funcionarios.7. Uma industria de cosmesticos possui 100 funcionarios dos quais 70 trabalham exclusivamente dentroda fabrica e 30 ora trabalham dentro, ora trabalham fora. As idades dos 100 funcionarios sao apresentadasna ordem de como foram coletadas (le-se segundo as linhas, tal como se le um livro) de modo que assetenta primeiras idades sao dos funcionarios que trabalham exclusivamente dentro da industria e astrinta ultimas daqueles que trabalham ora dentro, ora fora da industria.

    33 38 34 34 34 31 36 35 32 3735 34 30 37 36 33 34 34 32 3935 33 33 34 31 32 36 33 29 3634 35 34 33 31 35 35 35 37 3234 34 36 35 34 33 32 38 34 3333 32 34 35 37 35 35 30 35 3436 36 33 34 33 32 31 37 35 3439 40 40 42 39 38 40 40 40 4040 41 45 41 40 39 41 41 40 4239 40 41 40 40 42 39 39 38 40

    16 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    a) Qual e a populacao em estudo?b) Qual e a variavel em estudo e sua classificacao?c) Uma amostra, de dez indivduos foi retirada da populacao de cem, com auxlio dos numeros aleatorios.A seguir, foi calculada a idade media da amostra das dez idades. Que valor voce acha que foi obtido paraessa media?d) Suponha agora que se pensasse em fazer amostragem estratificada. Em sua opiniao, seria razoavel, nocaso? Caso afirmativo, indique como voce procederia, ainda utilizando os numeros aleatorios. Suponhaque o tamanho da amostra continue sendo igual a dez.e) Suponha agora que tivesse sido utilizada amostragem estratificada uniforme, num total ainda de dezidades, e que tivessem sido obtidos, no primeiro e no segundo estratos, respectivamente, x1 = 33,8 ex2 = 40,2. Em quanto voce estimaria a idade media da populacao de cem idades?8. A Reitoria da UNIFAL-MG quer aplicar um questionario a` comunidade academica (servidores, alunose professores) para avaliar a opiniao sobre a modificacao do calendario academico durante a Copa. Dispoede um cadastro com 107 servidores, 525 alunos e 214 professores. Deseja-se amostrar 100 pessoas. Qualo tipo de amostragem voce utilizaria e quantos indivduos de cada categoria seriam avaliados?9. Deseja-se selecionar uma amostra de domiclios da cidade de Alfenas. Um total de 5 ruas com carac-tersticas proximas comporao as subdivisoes da populacao em estudo. No quadro abaixo, A1 representao primeiro domiclio da Rua A, A2 o segundo, e assim por diante.

    Ruas DomicliosA A1 A2 A3 A4 A5 A6 . . . A56B B1 B2 B3 B4 B5 B6 . . . B85C C1 C2 C3 C4 C5 C6 . . . C48D D1 D2 D3 D4 D5 D6 . . . D108E E1 E2 E3 E4 E5 E6 E7 E8 . . . E209

    Inicialmente foram sorteadas duas ruas (B e D) e depois foram selecionados todos os domiclios de cadarua. Identifique o tipo de amostragem realizada.

    5 ESTATISTICA DESCRITIVA

    A estatstica descritiva e a area da estatstica que aplica varias tecnicas para a organizacao,a apresentacao e a descricao de um conjunto de dados. O objetivo e a descricao dos dados ao inves deusar os dados em aprendizado sobre a populacao. As principais caractersticas do conjunto de dados eapresentada por meio de tabelas, de graficos e de metodos numericos.

    Neste captulo serao vistos alguns exemplos de tabelas e de graficos que poderao representar, ob-jetivamente, as informacoes e caractersticas de uma variavel e, posteriormente, os metodos numericos quepodem representar uma amostra: medidas de posicao, medidas separatrizes e medidas de variabilidade.

    5.1 Apresentacao dos dados

    5.1.1 Tabelas

    A tabela e uma ferramenta bastante eficiente de mostrar o comportamento da(s) variavel(is),facilita a compreensao e a interpretacao dos dados. O seu objetivo e fornecer uma ideia mais precisa epossibilitar uma inspecao mais rigorosa aos dados.

    Uma tabela e composta basicamente por:l cabecalho;l corpo;l rodape.

    O ttulo aparece sempre na parte superior da tabela devendo sempre conter informacoes querespondam a`s perguntas relacionadas ao fenomeno estudado:l o que esta representando?l onde ocorreu?l quando ocorreu?

    O cabecalho indica a natureza do conteudo de cada coluna, por exemplo, o nome da variavelindependente e o nome da variavel dependente.

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 17

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    O corpo e representado por colunas e subcolunas dentro das quais serao registrados os dadose/ou informacoes.

    O rodape e um espaco na parte inferior da tabela utilizado para inserir notas e/ou fonte dosdados. Em muitos casos e dispensavel.

    Embora existam diversas classificacoes para as tabelas, neste material as tabelas serao conside-radas como distribuicao de frequencias. Uma distribuicao de frequencia e um agrupamento dos dadosem classes de modo a contabilizar o numero de ocorrencias em cada classe. O numero de ocorrencias decada classe recebe o nome de frequencia absoluta. O objetivo da tabela de distribuicao de frequenciase fornecer uma boa visualizacao do comportamento dos dados. E usada, tambem para discriminar adistribuicao de probabilidade de uma amostra (ou populacao). Alguns exemplos serao apresentados aseguir.

    Serie temporal

    Tambem conhecida como serie cronologica, serie evolutiva ou serie historica. E a serie em queos dados sao observados de acordo com o tempo em que ocorrem, permanecendo constantes o local e ofenomeno.

    Tabela 9 Numero de notificacoes de obitos ao SIM, por doencasendocrinas nutricionais e metabolicas. Brasil, 2005 a 2011

    Ano Numero de obitos

    2005 53.9832006 58.9042007 61.8602008 64.6312009 66.9842010 70.2762011 73.929

    Fonte: SIM-CGIAE/SVS/MS. Disponvel em: http://www.datasus.gov.br

    Serie geografica

    Tambem chamada de serie de localizacao, serie regional ou serie territorial. E a serie em que osdados sao observados de acordo com a localidade em que ocorreram, permanecendo constantes a epoca eo fenomeno. Exemplo:

    Tabela 10 Internacoes por acidente de transito segundo a Unidadede Federacao, faixa etaria de 25 a 29 anos, nov-2013

    Regiao Numero de internacoes

    Sudeste 144Nordeste 94Centro-Oeste 10Sul 9Norte 4

    Fonte: Ministerio da Saude. Disponvel em: http://www.datasus.gov.br

    Serie especfica ou categorica

    E a serie em que os dados sao agrupados de acordo com categorias ou especies, permanecendoconstantes a epoca e o local. Exemplo:

    Tabela 11 Notificacoes de obitos ao SIM. Brasil, 2011*

    Causa Numero de obitos

    Algumas doencas infecciosas e parasitarias 49.175Neoplasias (tumores) 184.384Doencas do sangue 6.344Doencas endocrinas nutricionais e metabolicas 73.929Transtornos mentais e comportamentais 13.725Doencas do sistema nervoso 26.948Doencas do olho e anexos 23Doencas do ouvido e da apofise mastoide 150

    Fonte: SIM-CGIAE/SVS/MS. Disponvel em: http://www.datasus.gov.br

    * Informacoes parciais

    18 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    Serie de dupla entrada ou tabela de contigencia

    E a serie que e constituda da conjugacao ou juncao de uma ou mais series. E util paramostrar dois ou mais tipos de variaveis em relacao a um item. Deve ser lida na vertical e na horizontalsimultaneamente para que as linhas e as colunas sejam relacionadas.

    Tabela 12 Notificacoes de obitos ao SIM. Brasil, 2007 a 2011*

    CausaAno

    2007 2008 2009 2010 2011

    Algumas doencas infecciosas e parasitarias 45.945 47.295 47.010 48.823 49.175Neoplasias (tumores) 161.491 167.677 172.256 178.990 184.384Doencas do sangue 5.719 5.825 6.011 6.284 6.344Doencas endocrinas nutricionais e metabolicas 61.860 64.631 66.984 70.276 73.929Transtornos mentais e comportamentais 10.948 11.852 11.861 12.759 13.725Doencas do sistema nervoso 20.413 21.609 23.018 25.303 26.948Doencas do olho e anexos 26 39 23 31 23Doencas do ouvido e da apofise mastoide 118 125 125 125 150

    Fonte: SIM-CGIAE/SVS/MS. Disponvel em:

    * Informacoes parciais

    5.1.2 Construcao de tabelas de distribuicao de frequencias

    Quando a variavel for qualitativa

    A construcao consiste na organizacao dos dados com as suas respectivas frequencias absolutas.A primeira coluna da tabela contera informacoes a respeito da variavel (os dados observados) e na segundacoluna sera apresentada as frequencias com que aparecem os dados.

    Exemplo: O Congresso de Homeopatia, realizado na cidade de Alfenas-MG em 2014, usou umquestionario para perguntar aos participantes como eles avaliam a organizacao, a recepcao, os temas daspalestras, o coffee break, os minicursos e os anais. Cada variavel foi avaliada de acordo com uma escalaque varia de excelente (E), otimo (O), bom (B), medio (M) e fraco (F). Confeccione uma tabela pararepresentar as respostas dos dados coletados sobre a organizacao de 30 participantes que participaram dapesquisa:

    B B O E M M F F O BO F B O E O M M B BE F B M F B M O E B

    Os dados coletados podem ser organizados conforme e apresentado na Tabela 13.

    Tabela 13 Avaliacao da organizacao do Congresso de Homeopatia,Alfenas-MG, 2014

    Escala Numero de Participantes

    Excelente 4

    Otimo 6Bom 9Medio 6Fraco 5

    Total 30

    Quando a variavel for quantitativa discreta

    A distribuicao de frequencia para dados discretos e uma serie que possui uma coluna para asclasses e outra coluna para as frequencias. As classes (1a coluna da tabela) sao formadas por numerosinteiros, nao possuem divisoes, representam o valor observado na variavel estudada. As frequenciasrepresentam o numero de vezes que o valor da classe aparece no conjunto de dados. Porem, quando setem uma variavel quantitativa discreta que apresenta muitas observacoes, levando a um numero grandede classes, e mais racional realizar o agrupamento dos valores em varios intervalos de classe.

    Exemplo: Numa fila de um PSF da cidade Gama foram entrevistados 50 casais durante osmeses abril e maio de 2010 (dados fictcios). O objetivo da pesquisa era descobrir o numero de filhospor casal. O resultado da pesquisa esta apresentado abaixo, sendo os dados dispostos conforme foramcoletados (dados brutos), da esquerda para a` direira, seguindo-se pelas linhas como se le um texto.

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 19

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    2 3 0 2 1 1 1 3 2 56 1 1 4 0 1 5 6 0 21 4 1 3 1 7 6 2 0 13 1 3 5 7 1 3 1 1 03 0 4 1 2 2 1 2 3 2

    Os dados como sao apresentados anteriormente sao denominados de dados brutos, ou seja,sao aqueles que nao foram numericamente organizados, estao na forma como foram coletados.

    Para iniciar a tabulacao e necessario ordenar os dados, em ordem crescente ou decrescente. Osdados ordenados sao chamados de rol. Assim, para os dados anteriores:

    0 0 0 0 0 0 1 1 1 11 1 1 1 1 1 1 1 1 11 1 2 2 2 2 2 2 2 22 3 3 3 3 3 3 3 3 44 4 5 5 5 6 6 6 7 7

    Por ter poucas categorias e nao ter valores diversos pode-se agrupar os dados de acordo com afrequencia, conforme e apresentado na Tabela 14:

    Tabela 14 Numero de filhos de 50 casais entrevistados numa filade um PSF, Cidade Gama, abril-maio de 2010*

    Numero de Filhos Numero de Casais

    0 61 162 93 84 35 36 37 2

    Total 50

    * Dados fictcios

    Quando a variavel for quantitativa contnua

    Numa distribuicao de frequencia para dados contnuos as classes (1a coluna da tabela) saoformadas por intervalos de valores agrupados definidos de alguma forma. As frequencias representam onumero de valores que estao compreendidos em cada intervalo (classe). A construcao desta tabela nao epadronizada, a maioria das vezes fica mais a cargo do pesquisador (pela experiencia) do que por meio dealgoritmos.

    Tambem pode acontecer de a variavel estudada ser discreta, mas o numero de valores observadosser muito grande ou estes valores apresentarem muito diversos. Para este caso as classes formadas porintervalos evitara tabelas com grande extensao, a nao interpretacao dos valores do fenomeno e, tambem,classes com valores nulos.

    Nao existe uma regra unica para construcao da tabela de distribuicao de frequencia, mas eimportante que a distribuicao conte com um numero adequado de classes. Se o numero de classes forexcessivamente pequeno acarretara perda de detalhe e pouca informacao se podera extrair da tabela.Por outro lado, se for utilizado um numero excessivo de classes, havera alguma classe com frequencianula ou muito pequena, nao atingindo o objetivo da classificacao que e tornar o conjunto de dadossupervisionaveis.

    Procedimentos que serao adotados para construcao de uma tabela de distribuicao de frequenciaspara variaveis quantitaticas contnuas9:

    Ordenar os valores Determinar o numero de classes10 k:

    a) k entre 5 e 20 classes, conforme a familiaridade do pesquisador com os dados;b) k =

    n quando n 100 e k = 5 log n quando n > 100, sendo n o numero de dados11.

    9 E tambem para a quantitativa discreta quando apresentar muitos valores ou valores dispersos 10 Nao existe um consenso

    sobre como determinar o numero de classes e o intervalo das classes 11 Esta sera a formula adotada em todas as situacoes

    20 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    c) k = 1 + 3,222 log n, em que n representa o numero de dados; Determinar o intervalo das classes c:

    Se adotar as duas ultimas maneiras de determinar k, c e dado por:

    c =A

    k 1Em que:c: e o intervalo ou amplitude da classe;A: amplitude total, dada pela diferenca entre a maior e menor observacoes;k: numero de classes.

    Determinar o limite inferior da primeira classe LI1:LI1 = menor observacao c

    2

    Determinar o limite superior da primeira classe LS1:LS1 = LI1 + c

    Determinar os demais limites inferiores e superiores das outras classes ate a classe k:LI2 = LS1 LS2 = LI2 + c

    LI3 = LS2 LS3 = LI3 + cLI4 = LS3 LS4 = LI4 + c

    ......

    LIk = LSk1 LSk = LIk + c

    As frequencias representam os valores contidos nos intervalos determinados pelos limites infe-riores e superiores de cada classe de modo que sejam LIi e < LSi. Nesse material as classes seraodefinidas por LIi ` LSi.

    Exemplo: Considere a variavel quantitativa discreta Numero de pacientes atendidos na ClnicaRX de segunda a sexta, durante 94 dias, jan-mai, 2010. Observe que a variavel e discreta, mas porconter valores diversos as classes serao compostas por intervalos de valores.

    8 24 46 13 38 54 44 20 17 1418 15 30 24 20 8 24 18 9 1038 79 15 62 23 13 62 18 8 2211 17 9 35 23 22 37 36 8 1310 6 92 16 15 23 37 36 8 1344 17 9 30 26 18 37 43 14 928 41 42 35 35 42 71 50 52 1719 7 28 23 29 29 58 77 72 3412 40 25 7 32 34 22 7 44 159 16 31 30

    Os dados anteriores sao brutos. Portanto, e necessario ordena-los (rol) de alguma forma. Assim:

    6 6 7 7 7 8 8 8 8 99 9 9 9 10 10 11 12 13 1313 13 14 14 14 15 15 15 15 1616 17 17 17 17 18 18 18 18 1920 20 22 22 22 23 23 23 23 2424 24 25 26 28 28 29 29 30 3030 31 32 34 34 34 35 35 35 3637 37 38 38 40 41 42 42 43 4444 44 46 50 52 54 58 62 62 7172 77 79 92

    Agora, calcula-se o numero de classes:

    k =

    94 = 9,69 10Como k representa o numero de classes, logo tem que ser um valor inteiro, assim sera adotado

    k = 10, mas poderia ser k = 9. Como k = 10 sabe-se que a tabela de distribuicao de frequencias tera 10classes, ou seja, 10 intervalos de valores.

    O tamanho de cada intervalo, amplitiude da classe, e dado por c, assim:

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 21

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    c =A

    k 1 =92 610 1 = 9,56

    Como os valores (dados) sao numeros inteiros nao justifica trabalhar com casas decimais, po-dendo ser adotado c = 10 desde de que ao final da construcao da tabela se observe que todos os valoresforam agrupados nas k = 10 classes.

    O proximo calculo e a determinacao dos limites de cada classe. O limite inferior da primeiraclasse LI1 e determinado por:

    LI1 = menor observacao c2

    Logo,

    LI1 = 6 102

    = 1

    O limite superior da primeira classe LS1 e calculado por:

    LS1 = LI1 + c

    LS1 = 1 + 10 = 11

    Os demais limites ate a 10a classe, sao:

    Classe Limite inferior Limite superior

    2aLI2 = LS1 LS2 = LI2 + cLI2 = 11 LS2 = 11 + 10 = 21

    3aLI3 = LS2 LS3 = LI3 + cLI3 = 21 LS3 = 21 + 10 = 31

    4aLI4 = LS3 LS4 = LI4 + cLI4 = 31 LS4 = 31 + 10 = 41

    5aLI5 = LS4 LS5 = LI5 + cLI5 = 41 LS5 = 41 + 10 = 51

    6aLI6 = LS5 LS6 = LI6 + cLI6 = 51 LS6 = 51 + 10 = 61

    7aLI7 = LS6 LS7 = LI7 + cLI7 = 61 LS7 = 61 + 10 = 71

    8aLI8 = LS7 LS8 = LI8 + cLI8 = 71 LS8 = 71 + 10 = 81

    9aLI9 = LS8 LS9 = LI9 + cLI9 = 81 LS9 = 81 + 10 = 91

    10aLI9 = LS8 LS9 = LI9 + cLI9 = 91 LS9 = 91 + 10 = 101

    Apos realizar todas as operacoes, monta-se a tabela de distribuicao de frequencias sendo aprimeira coluna composta pelas classes e a segunda coluna composta pelas frequencias (numero de valorescontidos no intervalo determinado nas classes). O resultado de toda esta operacao e apresentado naTabela 16.

    Tabela 16 Numero de pacientes atendidos na Clnica RX desegunda a sexta, durante 94 dias, jan-mai, 2010

    Numero de atendimentos Numero de dias

    1 ` 11 1611 ` 21 2621 ` 31 1931 ` 41 1441 ` 51 0951 ` 61 0361 ` 71 0271 ` 81 0481 ` 91 0091 ` 101 01

    Total 94

    Fonte: Dados fictcios

    22 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    5.1.3 Tipos de distribuicao de frequencias

    A tabela de distribuicao de frequencias construda anteriormente e denominada de tabela dedistribuicao de frequencias simples absolutas. Alem dessa classificacao, as tabelas de distribuicao defrequencias, podem ser:

    Tipos de frequencias

    Simples

    {AbsolutasRelativas

    Acumuladas

    Crescentes

    {AbsolutasRelativas

    Decrescentes

    {AbsolutasRelativas

    Distribuicao de frequencias simples

    a) Frequencia simples absoluta: e o numero de repeticoes de um valor individual ou deuma classe de valores da variavel estudada. Exemplo: Na Tabela 16 cada frequencia fi, i = 1, . . . , 9,representa o numero de valores que estao em cada classe.

    b) Frequencia simples relativa: representa a proporcao de observacoes de um valor indivi-dual ou de uma classe em relacao ao numero total de observacoes. Para calcular a frequencia relativabasta dividir a frequencia absoluta da classe ou do valor individual pelo numero total de observacoes. Eum valor importante para comparacoes.

    fri =fin

    Em que:fri: frequencia simples relativa da classe i, i = 1, . . . , k;fi: frequencia simples absoluta da classe i, i = 1, . . . , k;n: numero de observacoes.

    Exemplo: Com os dados obtidos na Tabela 16 tem-se a seguinte tabela de distribuicao defrequencias relativas:

    Tabela 17 Valores relativos de pacientes atendidos naClnica RX de segunda a sexta, durante 94 dias, jan-mai, 2010

    Numero de atendimentos Numero de dias

    1 ` 11 0,170211 ` 21 0,276721 ` 31 0,202131 ` 41 0,148941 ` 51 0,095751 ` 61 0,031961 ` 71 0,021371 ` 81 0,042681 ` 91 0,000091 ` 101 0,0106

    Total 1,0000

    Fonte: Dados fictcios

    Cada frequencia relativa foi calculada por:

    fr1 =16

    94= 0,1702

    fr2 =26

    94= 0,2767

    fr3 =19

    94= 0,2021

    fr4 =14

    94= 0,1489

    fr5 =09

    94= 0,0957

    fr6 =03

    94= 0,0319

    fr7 =02

    94= 0,0213

    fr8 =04

    94= 0,0426

    fr9 =00

    94= 0,0000

    fr10 =01

    94= 0,0106

    Para expressar os resultados em termos percentuais, multiplica-se o quociente obtido por 100:

    fpi = fri 100%

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 23

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    Importante: para fins de analises matematicas todas as observacoes contidas num intervalode classe serao consideradas iguais ao ponto medio da classe. Essa hipotese e a hipotese tabular basica(HTB). O ponto medio da classe i e dado por:

    Xi =LIi + LSi

    2Em que:Xi: e o ponto medio da classe i;LIi e LSi: sao, respectivamente, o limite inferior e superior da classe i.

    Distribuicao de frequencias acumuladas

    a) Frequencias acumuladas crescentes absolutas: tambem denominada de distribuicao

    de frequencia absoluta acumulada abaixo de. E a frequencia total de todos os valores inferiores ao limitesuperior de um dado intervalo de classe.

    b) Frequencias acumuladas decrescentes absolutas: tambem denominada de frequencia

    absoluta acumulada acima de. E a frequencia total de todos os valores superiores ao limite inferior deum dado intervalo de classe.

    As frequencias relativas em cada caso sao obtidas por meio da divisao de cada frequenciaacumulada pelo total de observacoes.

    5.1.4 Exerccios

    1. No Pronto Socorro Santa Casa (2012), foi contabilizado o numero de pessoas que foram atendidas naemergencia por acidente de carro em 20 grupos de 100 pessoas cada. Os dados obtidos foram: 9, 10, 10, 8,12, 11, 8, 11, 7, 9, 10, 10, 9, 11, 9, 10, 10, 10, 9, 10. Construa uma tabela de distribuicao de frequencias.2. Dez alunos da UNIFAL-MG/Alfenas (2014/1) foram selecionados e se submeteram a um exame desangue apresentando os seguintes valores de glicemia em mg/dL: 80, 60, 68, 79, 62, 76, 70, 78, 78, 77.Monte uma tabela de distribuicao de frequencias.3. Foi realizada uma pesquisa a qual tinha por objetivo conhecer a altura dos estudantes do sexo masculino(em metros) da Faculdade X, 2010. Os dados sao os apresentados abaixo:

    1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,951,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 2,001,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,83 1,851,70 1,72 1,72 1,73 1,75 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,84 1,861,70 1,72 1,72 1,73 1,75 1,75 1,76 1,78 1,78 1,80 1,80 1,82 1,84 1,871,70 1,72 1,72 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,82 1,84 1,901,70 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,901,71 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,901,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,901,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,90

    Monte uma tabela com a distribuicao de frequencias absolutas, relativas e percentuais.4. Com os dados obtidos no que representam o numero de nascimentos porano segundo a regiao construa:a) uma tabela para os dados de nascidos da regiao sudeste;b) uma tabela para os dados de nascidos do ano de 2013;c) uma tabela de dupla entrada em que o ano de nascimento seja representado na vertical;d) uma tabela de dupla entrada em que a regiao de nascimento seja representada na vertical.Os dados sao:

    2010 2011 2012 2013 TotalRegiao Norte 305.865 313.029 307.430 312.378 1.238.702Regiao Nordeste 841.386 851.181 833.013 821.903 3.347.483Regiao Sudeste 1.123.910 1.144.213 1.153.422 1.148.317 4.569.862Regiao Sul 369.856 378.000 381.531 386.755 1.516.142Regiao Centro-Oeste 220.851 226.737 230.393 234.674 912.655

    5.1.5 Graficos

    A representacao grafica e outro recurso que tem por objetivo dar uma ideia, a mais imediatapossvel, do comportamento dos dados, proporcionando maior facilidade na compreensao, para chegar aconclusoes sobre o comportamento do fenomeno em estudo.

    24 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    Um grafico deve ter, dentre outras, as seguintes caractersticas:. Clareza: possibilita a leitura e interpretacoes correta dos valores do fenomeno;/ Simplicidade: possibilita a analise rapida do fenomeno observado. Evita-se perder com particularidadessem importancia;0 Veracidade: indispensavel, pois, se o grafico nao representar uma realidade, perde sua finalidade.

    Classificacao quanto a` forma:a) Diagramas: graficos geometricos dispostos em duas dimensoes. Sao mais usados na representacao deseries estatsticas.b) Cartogramas: e a representacao sobre uma carta geografica, sendo muito usado na Geografia, Historiae Demografia.c) Estereogramas: representam volumes e sao apresentados em tres dimensoes.d) Pictogramas: a representacao grafica que consta de figuras representativas do fenomeno. Despertalogo a atencao do publico.

    Classificacao quanto ao objetivo:a) Graficos de informacao - o objetivo e proporcionar uma visualizacao rapida e clara da intensidade dascategorias ou dos valores relativos ao fenomeno. Sao graficos tipicamente expositivos, devendo ser o maiscompleto possvel, dispensando comentarios explicativos.Caractersticas:- deve conter ttulo;- as legendas podem ser omitidas, desde que as informacoes presentes possibilitem a interpretacao dografico.b) Graficos de analise - estes graficos fornecem informacoes importantes na fase de analise dos dados,sendo tambem informativos. Os graficos de analise, geralmente, vem acompanhados de uma tabela e umtexto onde se destacam os pontos principais revelados pelo grafico ou pela tabela.

    Sao varias as opcoes de representacao grafica, dentre as quais pode-se citar: os graficos decolunas, de linhas, de barras etc.

    Grafico em linha

    Os graficos lineares sao usados frequentemente para a representacao de series temporais. Paraconstru-lo, basta marcar os pontos e uni-los por meio de segmentos de reta, formando uma poligonal.Considerando os dados apresentados na Tabela 9, pode-se representa-los graficamente segundo a Figura 8:

    50000

    55000

    60000

    65000

    70000

    75000

    80000

    2005 2006 2007 2008 2009 2010 2011

    N

    me

    ro d

    e

    bit

    os

    AnosFigura 8 Numero de notificacoes de obitos ao SIM, por doencas endocrinas nutricionais e metabolicas. Brasil,

    2005 a 2011

    Grafico em colunas

    Os graficos em colunas tornam possveis as comparacoes das grandezas, representando-as pormeio de retangulos de mesma base e alturas proporcionais a`s respectivas grandezas. Estes graficos saomais utilizados, quando as inscricoes a serem inseridas sob os retangulos forem curtas.

    As orientacoes para construcao de um grafico em colunas sao:a) os retangulos so diferem no comprimento, e nao na base, a qual e atribuda;b) os retangulos devem ser separados por espacos, um dos outros, sendo estes todos iguais, mas naodevem ser menores do que a metade da base dos retangulos;c) os retangulos devem ser desenhados, observando-se a ordem de grandeza, para facilitar a leitura ea analise comparativa dos valores. Entretanto, se a serie representada for temporal, os dados a seremdispostos no eixo horizontal devem ser colocados em ordem crescente de tempo.

    UNIFAL-MG/Alfenas Profs. Flavio Bittencourt/Adriana Dias 25

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    Observacao: O espaco entre as colunas pode variar de 1/3 a 2/3 do tamanho da base dacoluna.

    As informacoes apresentadas na Tabela 10 podem ser visulizadas na Figura 9:

    0

    20

    40

    60

    80

    100

    120

    140

    160

    Sudeste Nordeste Centro-Oeste Sul Norte

    N

    me

    ro d

    e in

    tern

    a

    es

    Regies

    Figura 9 Internacoes por acidente de transito segundo a Unidade de Federacao, faixa etaria de 25 a 29 anos,nov-2013

    Grafico em barras

    Os graficos em barras tem a mesma finalidade que os graficos em colunas, sendo preferveis estes,quando as inscricoes a serem inseridas forem longas. Sao mais usados para representar series especficas,com uma unica diferenca que e a posicao em que estao dispostos os retangulos, na horizontal. As alturasdos retangulos sao iguais e arbitrarias e os comprimentos sao proporcionais aos respectivos dados.

    As barras devem ser separadas uma das outras pelo mesmo espaco de forma que as inscricoesidentifiquem as diferentes barras. O espaco entre as barras pode ser a metade (1/2) ou dois tercos (2/3)de suas larguras.

    As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar acomparacao dos valores. A categoria outros (quando existir) e representada na barra inferior, mesmoque o seu comprimento exceda o de alguma outra.

    Os dados da Tabela 11 sao apresentados graficamente como pode ser visualizado na Figura 10:

    0 40000 80000 120000 160000 200000

    Doenas do olho e anexos

    Doenas do ouvido e da apfise mastide

    Doenas do sangue

    Transtornos mentais e comportamentais

    Doenas do sistema nervoso

    Algumas doenas infecciosas e parasitrias

    Doenas endcrinas nutricionais e metablicas

    Neoplasias (tumores)

    Nmero de bitos

    Figura 10 Notificoes de obitos ao SIM. Brasil, 2011

    Grafico em colunas compostas

    Este tipo de grafico e apropriado para comparar diversas quantidades agrupadas. Este graficoconsiste em colunas duplas ou superpostas e dispostas sem espaco entre si. Ele proporciona economia deespaco, sendo mais indicado quando a serie apresenta um numero significativo de categorias.

    Para exemplificar, sera construdo um grafico com os dados apresentados pela Tabela 12, apre-sentado na Figura 11

    26 Profs. Flavio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas

  • Estatstica Basica 5 ESTATISTICA DESCRITIVA

    Figura 11 Notificoes de obitos ao SIM. Brasil, 2007 a 2011

    Grafico em setores

    E a representacao grafica de uma serie estatstica em um crculo de raio qualquer, por meiode setores com angulos centrais proporcionais a`s ocorrencias. Para constru-lo, parte-se do princpio dequ