3.4. Representação de dados qualitativos em tabelas e gráficos
Para a representação de dados qualitativos em tabelas e gráficos
vamos precisar definir algumas quantidades:
n = tamanho da amostra ou frequência absoluta total;
k = número de categorias ou classes;
ni = frequência absoluta da i-ésima categoria ou classe, i = 1, 2, ...,
k;
nnk
ii
1
fi = frequência relativa da i-ésima categoria ou classe, i = 1, 2, ..., k;
n
nf ii , tal que: 1
11
k
i
ik
ii
n
nf
3.4.1. Tabelas de frequências de variáveis qualitativas
Representação das frequências das categorias da variável
qualitativa numa tabela com as frequências absolutas e relativas.
Categorias Freq. absolutas Freq. relativas
Categoria 1 n1 f1 = n1 / n
⁞ ⁞ ⁞
Categoria i ni fi = ni / n
⁞ ⁞ ⁞
Categoria k nk fk = nk / n
Totais n 1
Exemplo 1: Causas mais comuns de intoxicação e envenenamento
em crianças de 1 a 5 anos.
Tabela 1: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5 anos.
Causas
(categorias)
Valores
Absolutos
Valores
Relativos
Medicamentos 152 0.380
Produtos Domésticos 49 0.123
Produtos Químicos 45 0.113
Animais Peçonhentos 34 0.085
Pesticidas Domésticos 26 0.065
Plantas 23 0.058
Outros 71 0.178
Total 400 1.00 Fonte: Adaptado do livro Bioestatística, Arango, H.G.
A tabela pode, ainda, ser representada com os valores relativos
e/ou as respectivas porcentagens:
Tabela 2: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5 anos (valores percentuais).
Causas
(categorias)
Valores
Absolutos
Valores
Relativos
Valores
Percentuais
Medicamentos 152 0.380 38.00
Produtos Domésticos 49 0.123 12.25
Produtos Químicos 45 0.113 11.25
Animais Peçonhentos 34 0.085 8.50
Pesticidas Domésticos 26 0.065 6.50
Plantas 23 0.058 5.75
Outros 71 0.178 17.75
Total 400 1.00 100.00 Fonte: Adaptado do livro Bioestatística, Arango, H.G.
Exemplo 2: Número de declarações de imposto de renda por pessoa
física no ano de 2012.
Tabela 3: Declarações de imposto de renda em 2012 por faixas de renda.
Faixas de renda Valores absolutos Valores relativos
Até 5 mil reais 10.578.893 0.4130
De 5 a 50 mil reais 4.986.451 0.1946
De 50 a 100 mil reais 2.690.803 0.1050
De 100 a 300 mil reais 4.255.263 0.1661
De 300 a 500 mil reais 1.336.082 0.0522
De 500 a 1000 mil reais 1.061.113 0.0414
Acima 1500 mil reais 708.948 0.0277
Totais 25.617.553 1.0000 Fonte: Receita Federal - http://www.receita.fazenda.gov.br
A tabela pode, ainda, ser representada com os valores relativos em
porcentagens:
Tabela 4: Declarações de imposto de renda em 2012 por faixas de renda
(valores percentuais).
Faixas de renda Valores
absolutos
Valores
relativos
Valores
percentuais
Até 5 mil reais 10.578.893 0.4130 41.30
De 5 a 50 mil reais 4.986.451 0.1946 19.46
De 50 a 100 mil reais 2.690.803 0.1050 10.50
De 100 a 300 mil reais 4.255.263 0.1661 16.61
De 300 a 500 mil reais 1.336.082 0.0522 5.22
De 500 a 1000 mil reais 1.061.113 0.0414 4.14
Acima 1500 mil reais 708.948 0.0277 2.77
Totais 25.617.553 1.0000 100.00 Fonte: Receita Federal - http://www.receita.fazenda.gov.br
Obs: Existe uma norma especifica do IBGE para a construção de
tabelas que pode ser observada.
3.4.2. Representação gráfica de variáveis qualitativas
A representação gráfica de variáveis qualitativas é feita
basicamente de gráficos de barras (ou colunas) ou gráficos de
setores (pizza), com suas diversas variações. Podem, também, ser
utilizados gráficos pictóricos, que, na prática são variações dos
gráficos de barras.
A seguir são apresentados os gráficos de barras e setores para as
Tabelas 1 e 2.
I) Gráfico de barras verticais ou colunas:
Gráficos do exemplo 1: Causas comuns de intoxicação e
envenenamento em crianças de 1 a 5 anos.
a) Gráfico de barras verticais ou colunas:
Figura 1: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5, anos em valores absolutos.
Figura 2: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5, anos em valores percentuais.
b) Gráfico de barras horizontais:
Figura 3: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5, anos em valores absolutos.
Gráficos do exemplo 2: Número de declarações do IRPF por faixas
de renda (2012).
a) Gráfico de barras verticais ou colunas:
Figura 4: Número de declarações de IRPF (mil unidades), por
faixas de renda, ano base 2012.
b) Gráfico de barras horizontais:
Figura 5: Número de declarações de IRPF, em valores percentuais,
por faixas de renda, ano base 2012.
II) Gráfico de setores (pizza):
Figura 6: Gráfico de setores (pizza) para causas mais frequentes de
intoxicação e envenenamento em crianças de 1 a 5, anos
em valores percentuais.
Variação: gráfico de pizza 3D
Figura 7: Gráfico de setores (pizza) 3D para causas mais frequentes de
intoxicação e envenenamento em crianças de 1 a 5.
Variação do gráfico de pizza, o gráfico de rosca
Figura 8: Gráfico tipo rosca para causas mais frequentes de intoxicação
e envenenamento em crianças de 1 a 5, anos em valores
percentuais.
3.4.3. Representações gráfica: o que se deve evitar:
a) Barras (ou colunas) muito afinadas e compridas:
Figura 9: Origem dos alunos da turma de Bioestatística
por distância, em km.
b) Barras (ou colunas) muito largas e baixas, com cores
distintas:
Figura 10: Origem dos alunos da turma de Bioestatística
por distância, em km.
c) Gráfico muito pequeno num espaço grande:
Figura 11: Origem dos alunos da turma de Bioestatística
por distância, em km.
d) Gráfico muito grande para o espaço:
Figura 12: Origem dos alunos da turma de Bioestatística
por distância, em km.
e) Gráfico fora de escala (propositalmente):
Tabela 5: Intenção de votos
Candidato Votos (%)
Candidato A 29.5
Candidato B 26.3
Candidato C 25.2
Candidato D 19.0
Total Geral 100
Figura 13: Intenção de votos para os 4 candidatos
Figura 14: Intenção de votos para os 4 candidatos
Figura 15: Intenção de votos para os 4 candidatos, lado a lado.
f) Gráfico muito muitas categorias:
Figura 13: Cidade de origem dos alunos de Bioestatística.
g) Interpretação equivocada:
Os limites atuais da distribuição de renda e riqueza no Brasil
Os 0,9% mais ricos do País detêm entre 59,9% e 68,5% da riqueza, sendo as principais
fontes de acumulação de riqueza os fluxos de renda e heranças. (Blog Carta Maior,
16/12/2014 )
Tabela 6: Distribuição de bens e direitos - 2006 e 2012.
Figura 14: Repartição da riqueza no Brasil pertencente aos percentuais
da população - 20121.
1 Fonte: http://idg.receita.fazenda.gov.br/dados/receitadata/estudos-e-tributarios-e-aduaneiros/trabalhos-academicos/trabalhos-academicos-pagina
3.5. Variáveis qualitativas em tabelas com dupla classificação
Muitas vezes as variáveis são apresentadas em tabelas com duas
classificações, conforme esquema.
Tabela 7: Tabela de dupla entrada l c: medalhas em Pequim 2008.
Continente Classificação A: Medalha Totais
das linhas Ouro Prata Bronze
América Latina1 3 12 10 25
América do Norte 93 79 46 218
África e Oceania 15 12 21 48
Ásia 32 24 34 90
Europa 83 92 132 307
Totais das colunas 226 219 243 688
1 América Latina = América do Sul, Central e México.
A Classificação A tem c = 3 categorias (colunas da tabela).
A Classificação B tem l = 5 categorias (linhas da tabela).
A tabela assim constituída pode ser identificada como:
tabela de dupla entrada (tabela l c );
tabela cruzada ou
tabela de contingência.
A tabela acima é uma tabela 53.
Cla
ssif
icaç
ão B
3.5.1. Caso especial l = c = 2, tabelas 22.
Tabela 8: Representação de uma tabela de dupla entrada 22.
A1 A2 Totais das linhas
B1 n11 n12 Total da linha 1
B2 n21 n22 Total da linha 2
Totais das
colunas
Total da
coluna 1
Total da
coluna 2
n
Exemplo 3: Crianças expostas à violência doméstica do pai contra a
mãe, variáveis situação civil da mãe e grupo (tabela 22).
Tabela 9: Tabela com dupla classificação segundo
situação civil da mãe por grupo.
Vive com o
companheiro Separada Totais
Expostos 11 4 15
Não Expostos 14 1 15
Totais 25 5 30
Assim temos:
n11 = 11 n12 = 4 n21 =14 n22 =1
Total da linha 1 = 15
Total da linha 2 = 15
Total da coluna 1 = 25
Total da coluna 2 = 5
Total geral: n = 30
Representação gráfica de uma tabela 22:
Figura 15: Representação gráfica da dupla classificação
situação civil da mãe por grupo.
3.5.2. Caso especial, tabelas em porcentagens.
A tabela de dupla classificação pode, ainda, ser construída levando
em consideração os percentuais em relação às colunas. Desta
forma, no exemplo acima teremos:
Tabela 10: Tabela situação civil da mãe por grupo,
em valores percentuais
Vive com o
companheiro (%)
Separada (%) Totais
Expostos 44 80 50
Não Expostos 56 20 50
Totais 100 100 100
Neste caso, a representação gráfica deve acompanhar a ordem de
grandeza.
Figura 16: Representação gráfica da situação civil da mãe
por grupo, em valores percentuais
Obs: quando se tem uma tabela com dupla classificação para se
comparar diferentes perfis é prudente que essa comparação
seja realizada considerando-se os valores percentuais.
Exemplo 4: Condições clínicas do periodonto de pacientes
atendidos na Clínica de Graduação da Faculdade de Odontologia
de Araraquara - UNESP, no período de 1994 a 1999 (tabela 43).
Tabela 11: Presença de doença por idade (anos).
Presença de
Doença
Faixa etária do paciente (anos)
Contagens Porcentagens
19-40 41-60 60 ou + 19-40 41-60 60 ou +
Diabete 11 11 3 30.6 17.7 15.8
Hipertensão 10 34 11 27.8 54.8 57.9
Discr. Sanguineas 5 1 3 13.9 1.6 15.8
Alt. Hormonais 10 16 2 27.8 25.8 10.5
Total 36 62 19 100.0 100.0 100.0
Idade x Presença de Doença
30.6
17.715.8
27.8
13.9
1.6
15.8
27.8 25.8
10.5
57.954.8
0
16
32
48
64
19-40 anos 41-60 anos 60 anos ou+
%
Diabete Hipetensão Discr.Sanguineas Alt.Hormonais
Figura 17: Faixa etária do paciente por Presença de doença.
Exemplo 5: Distribuição das medalhas das Olimpíadas de Pequim
(2008) segundo os continentes (tabela 53).
Tabela 12: Medalhas em Pequim 2008.
Continente Medalha Totais
das linhas Ouro Prata Bronze
América Latina1 3 12 10 25
América do Norte 93 79 46 218
África e Oceania 15 12 21 48
Ásia 32 24 34 90
Europa 83 92 132 307
Totais das colunas 226 219 243 688
1 América Latina = América do Sul, Central e México.
Figura 18: Medalhas nas olimpíadas de Pequim (2008).