Upload
silvia-osorio-ferrao
View
233
Download
0
Embed Size (px)
Citation preview
Exploração e Cruzamento de Variáveis com o SPSS
Exploração de Variáveis
Neste capítulo olharemos para a distribuição de uma variável, visualizando a sua representação gráfica.
Neste capítulo veremos também como obter
informação adicional sobre a distribuição das variáveis.
Consulte o ficheiro de dados
Resumo de uma distribuição
Na barra de menus escolher:
Analyze Descriptive Statistics Explore… Seleccionar a variável (ou variáveis) que se
pretende explorar e colocá-la na lista de variáveis dependentes.
Seleccionar a variável que define os grupos de casos e movê-la para a lista de factores.
Resumo de uma distribuição
Preparação do cálculo:
Resumo de uma distribuição
Obtém-se o seguinte resultado :
325 99,4% 2 ,6% 327 100,0%
319 99,7% 1 ,3% 320 100,0%
74 100,0% 0 ,0% 74 100,0%
26 100,0% 0 ,0% 26 100,0%
Emprego outrabalho de casaMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito
Idade dorespondente
N Percent N Percent N PercentValid Missing Total
Cases
Case Processing Summary
Número de casos da opção muito satisfeito.
Número de casos em falta para a mesma opção.
Percentagem de casos em falta.
Resumo de uma distribuição
Verifica-se que há 325 casos na categoria muito satisfeito para os quais a idade está disponível.
O número de casos em falta é 2. Isto significa que 2 casos muito
satisfeitos não têm um valor válido para a variável idade. Este número representa apenas 0,6% do total de casos, pelo que o seu efeito é de somenos importância.
O número de casos varia consideravelmente entre os quatro grupos: mais
de 300 indivíduos dizem-se moderadamente satisfeitos; 74 estão um pouco insatisfeitos; e apenas 26 estão muito insatisfeitos.
As conclusões extraídas sobre os últimos dois grupos têm que ser
cuidadosas, pois são baseadas num número pequeno de casos.
Resumo de uma distribuição
A tabela seguinte apresenta o resultado das estatísticas sobre os grupos de casos.
Idade do respondente
41,50 39,49 40,26 38,5841,05 39,11 39,83 38,19
40,00 39,00 38,00 36,5011,54 10,89 10,72 9,91
19 20 23 2282 75 72 6363 55 49 41
15,50 16,00 14,25 17,00
Mean5% Trimmed Mean
MedianStd. Deviation
MinimumMaximumRangeInterquartile Range
Muitosatisfeito
Moderadamentesatisfeito
Um poucoinsatisfeito
Muitoinsatisfeito
Emprego ou trabalho de casa
Resumo de uma distribuição
Utilize o editor de tabelas, Pivot Table Editor, para modificar a tabela.
Para esconder linhas ou colunas, fazer Ctrl+Alt+Click sobre o topo
da linha ou coluna. Depois premir o botão direito do rato e escolher Hide Category.
As médias das idades variam do valor mais elevado de 41,5 no
grupo muito satisfeito, até ao valor mais baixo de 38,58 no grupo muito insatisfeito.
O valor das medianas é sensivelmente mais baixo para todos os
grupos, porque as distribuições de idade têm caudas nos valores mais elevados de idade.
Resumo de uma distribuição
A média aparada (trimmed mean) evita este problema pois exclui os valores mais elevados, assim como os mais baixos. Na 5% trimmed mean, apenas são considerados 90% dos casos, no centro da distribuição, excluindo-se os 5% do extremo superior e os 5% do extremo inferior.
O desvio padrão mais elevado pertence ao grupo muito satisfeito,
pois este contém o valor de idade mais elevado: 82 anos. A linha Range dá-nos a amplitude de idades do grupo. O Interquartile range dá-nos a amplitude de idades do grupo,
medida entre os percentis 25 e 75, não sendo por isso afectado pelo valores extremos.
Resumo de uma distribuição
Para identificar os valores extremos, deve premir o botão Statistics na caixa de diálogo Explore e seleccionar a opção Outliers.
Resumo de uma distribuição
A tabela seguinte apresenta os valores extremos para o grupo muito satisfeito.
Emprego ou trabalho de casa: Muito satisfeito
344 82223 78263 77401 77208 73173 19364 20714 20665 21320 21
1234512345
Highest
Lowest
Idade dorespondente
CaseNumber Value
O caso 344 é o indivíduo mais velho, com 82 anos de idade.
O caso 173 é o indivíduo mais novo, com 19 anos de idade.
Resumo de uma distribuição
Com o Explore podem obter-se os percentis para cada grupo. Para isso deve premir o botão Statistics na caixa de diálogo
Explore e seleccionar a opção Percentiles.
Resumo de uma distribuição
Percentis (resultados):
24,00 27,00 33,50 40,00 49,00 57,40 61,00
24,00 26,00 31,00 39,00 47,00 55,00 60,00
25,00 27,00 32,75 38,00 47,00 55,50 60,25
24,10 28,00 30,00 36,50 47,00 51,60 59,5034,00 40,00 49,00
31,00 39,00 47,00
33,00 38,00 47,00
30,00 36,50 47,00
Emprego outrabalho de casaMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeitoMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito
Weighted Average(Definition 1)
Tukey's Hinges
5 10 25 50 75 90 95Percentiles
Idade do respondente
10% dos casos têm 27 ou menos anos, no grupo muito satisfeito.
10% dos casos têm 57,4 ou mais anos, no grupo muito satisfeito.
Histograma
Para obter o histograma, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Histogram.
Histograma
Idade do respondente
80,075,0
70,065,0
60,055,0
50,045,0
40,035,0
30,025,0
20,0
Histograma
Para SAT_EMP= Muito satisfeito
Freq
uênc
ia
70
60
50
40
30
20
10
0
Std. Dev = 11,54
Mean = 41,5
N = 325,00
O intervalo com o ponto médio 40 é o que tem mais casos.
O gráfico caule e folhas
Para obter o gráfico caule e folhas, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Stem-and-leaf.
O gráfico caule e folhas
Idade do respondente Stem-and-Leaf Plot paraSAT_EMP= Um pouco insatisfeito Frequency Stem & Leaf 2,00 2 . 33 13,00 2 . 5556777899999 7,00 3 . 0123334 18,00 3 . 555566666777788899 7,00 4 . 0012234 13,00 4 . 5556666677888 5,00 5 . 02223 5,00 5 . 55679 3,00 6 . 013 1,00 Extremes (>=72) Stem width: 10 Each leaf: 1 case(s)
Multiplicar o caule pela largura do caule e somar as folhas para obter os valores (60, 61 e 63).
Cinco casos têm 29 anos de idade.
Apenas um caso tem 34 anos de idade.
Se a largura do caule (stem width) fosse 100, então os valores do tronco de valor 6 seriam 600, 610 e 630.
A caixa de bigodes
Para obter a caixa de bigodes, seleccionar a opção Plots, ou Both na caixa de diálogo Explore.
A caixa de bigodes
2674319325N =
Emprego ou trabalho de casa
Muito insatisfeito
Um pouco insatisfeit
Moderadamente satisf
Muito satisfeito
Idad
e do
resp
onde
nte
90
80
70
60
50
40
30
20
10
64389729
277208
401263223
344
Valores isolados.
A caixa estende-se do percentil 25 até ao 75. A linha é a mediana.
As extremidades estendem-se ao maior e menor valor observado até 1,5 do comprimento da caixa.
Cruzamento de Variáveis
Uma tabela de frequências é insuficiente para visualizar o grau de satisfação no emprego, por cada categoria de salário. Para isso há necessidade de recorrer ao cruzamento de variáveis.
Na barra de menus escolher:
Analyze Descriptive Statistics Crosstabs…
Seleccionar a variável (ou variáveis) que vai ocupar as linhas da tabela e colocá-la em Row(s).
Seleccionar a variável (ou variáveis) que vai ocupar as colunas da tabela e colocá-la em Column(s).
Cruzamento de Variáveis
Preparação do cálculo:
Cruzamento de Variáveis
Mova diversas variáveis para as listas de linhas ou colunas, para obter múltiplos cruzamentos bivariados.
Para visualizar três ou mais variáveis em simultâneo, coloque
as variáveis adicionais em camadas sucessivas (layers).
Cruzamento de Variáveis
Cruzamento de sat_emp com receita4.
Count
53 90 74 110 327
93 79 61 87 320
24 17 14 19 74
4 8 7 7 26174 194 156 223 747
Muito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito
Empregooutrabalhode casa
Total
24,999ou menos
25,000 to39,999
40,000 to59,999
60,000ou mais
Total de receitas da família em quartis
Total
Emprego ou trabalho de casa * Total de receitas da família em quartis Crosstabulation
Cruzamento de Variáveis
Cruzamento de sat_emp com receita4 e sexo.
Count
30 51 41 57 179
44 44 36 49 173
10 10 7 14 41
2 3 6 4 1586 108 90 124 40823 39 33 53 148
49 35 25 38 147
14 7 7 5 33
2 5 1 3 1188 86 66 99 339
Muito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito
Empregooutrabalhode casa
TotalMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito
Empregooutrabalhode casa
Total
Sexo dorespondenteM
F
24,999ou menos
25,000 to39,999
40,000 to59,999
60,000ou mais
Total de receitas da família em quartis
Total
Emprego ou trabalho de casa * Total de receitas da família em quartis * Sexo do respondente
Percentagens de linha e coluna
Para visualizar-se as percentagens das células, deve premir o botão Cells na caixa de diálogo Crosstabs e seleccionar as opções Row, Column ou Total.
Percentagens de linha e coluna
53 90 74 110 327
30,5% 46,4% 47,4% 49,3% 43,8%
93 79 61 87 320
53,4% 40,7% 39,1% 39,0% 42,8%
24 17 14 19 74
13,8% 8,8% 9,0% 8,5% 9,9%
4 8 7 7 26
2,3% 4,1% 4,5% 3,1% 3,5%
174 194 156 223 747
100,0% 100,0% 100,0% 100,0% 100,0%
CountPercentagensna colunaCountPercentagensna colunaCountPercentagensna colunaCountPercentagensna colunaCountPercentagensna coluna
Muito satisfeito
Moderadamentesatisfeito
Um poucoinsatisfeito
Muito insatisfeito
Empregoou trabalhode casa
Total
24,999ou menos
25,000 to39,999
40,000 to59,999
60,000ou mais
Total de receitas da família em quartis
Total
Emprego ou trabalho de casa * Total de receitas da família em quartis Crosstabulation
Todas as colunas somam 100% de percentagem.
Visualização gráfica
Os resultados do cruzamento de variáveis podem ser apresentados graficamente.
Na barra de menus escolher:
Graphs Bar… Escolher Stacked e premir Define. Escolher a variável receita4 para o eixo das categorias. Escolher a variável sat_emp para a definição dos
clusters.
Visualização gráfica
Total de receitas da família em quartis
60,000 ou mais
40,000 to 59,999
25,000 to 39,999
24,999 ou menos
Cou
nt300
200
100
0
Emprego ou trabalho
Muito insatisfeito
Um pouco
insatisfeito
Moderadamente
satisfeito
Muito satisfeito
Visualização gráfica
Para apresentar a percentagem de casos, as variáveis devem ser escolhidas por ordem inversa.
Depois, no editor de gráficos deve fazer-se:
Series Transpose Data
Visualização gráfica
60,000 ou mais
40,000 to 59,999
25,000 to 39,999
24,999 ou menos
100
90
80
70
60
50
40
30
20
10
0
Emprego ou trabalho
Muito insatisfeito
Um pouco
insatisfeito
Moderadamente
satisfeito
Muito satisfeito
Visualização gráfica
Desta forma consegue-se comparar a distribuição inspeccionando as barras para cada grupo.
Observa-se que o grupo das pessoas com menor rendimento
é o que possui menor percentagem de indivíduos muito satisfeitos com o seu emprego. Representam também a menor percentagem de indivíduos muito insatisfeitos.
Pode ver-se que a soma das percentagens dos indivíduos
muito satisfeitos e moderadamente satisfeitos é sensivelmente a mesma para os quatro grupos.