El índice de activos para datos censales: Una aplicación para
predecir indicadores educativos en países en desarrollo
Rodrigo Lovatón Dávila, Dorothy Gondwe, Aine Seitz McCarthy,Phatta Kirdruang, and Uttam Sharma
Integrated Public Use Microdata Series- International (IPUMS-I)
IndiceMotivaciónPreguntas de investigaciónRevisión de literaturaDatosMetodologíaResultadosTrabajo en curso
MotivaciónNecesidad de una medida de nivel socioeconómico (NSE)
para investigación económica y demográfica: Estimación de pobreza e inequidad. Como variable de control en análisis de regresión.
Problemas con ingresos y gastos en encuestas de hogares: Datos costosos de recolectar. Dificultad para su medición / menor disponibilidad.
Uso de información censal para crear una medida de NSE: Microdatos censales tienen gran cobertura y son accesibles. Datos disponibles a través de IPUMS-International. Aplicación del enfoque basado en activos para crear una medida
de NSE.
Preguntas de investigación
1) ¿Es el índice de activos internamente
consistente cuando es aplicado a
microdatos censales?
2) ¿Es el índice de activos una medida válida
de nivel socioeconómico (NSE)?
Revisión de literatura El índice de activos es una buena proxy de ingresos
y gasto de consumo (McKenzie, 2005; Sahn y Steifel, 2000).
El índice de activos es confiable en la predicción de indicadores educativos, cuando es comparado con gastos (Filmer y Pritchett, 2001).
Validación del índice examinando indicadores de salud a través de estratos de NSE (Bollen et al., 2002; Filmer y Scott, 2008; Sahn y Stiefel, 2003).
La Encuesta Demográfica y de Salud Familiar (ENDES) usa un índice basado en activos.
DatosMicrodatos censales de IPUMS-International.
Mayor archivo de información gratuita y públicamente accesible de muestras censales: 211 muestras de 68 países, de 1960 a 2010
Actualmente, no incluye ninguna medida estándar de nivel socioeconómico para el hogar.
Encuesta Demográfica y de Salud Familiar (ENDES)País IPUMS-I ENDES
Brasil 2000 1996
Colombia 2005 2005
Perú 1993 1992
Senegal 2002 2005
Sudáfica 1996 1996
Categoría Ejemplos
ActivosTeléfono, radio, televisión, refrigerador, computadora, bicicleta, equipo de sonido, lavadora
Acceso a servicios Electricidad, agua, saneamiento
Características de la vivienda
Material predominante en paredes, pisos, techos
Metodología: ACP Supuesto: nivel socioeconómico no observado está reflejado en
características de la vivienda, acceso a servicios, y activos. Recodificación de variables categóricas en binarias y cálculo del
índice con Análisis de Componentes Principales (ACP).C1 = b11(X1) + b12(X2) + ... b1p(Xp)
Técnica de reducción de datos que forma un índice a partir de una combinación lineal de todas las variables.
Cada variable recibe un peso asignado en función de su contribución a la variabilidad total de los datos.
Se asigna a cada hogar un índice de acuerdo con la tenencia de dichas variables.
Definición de quintiles basados en el índice de activos.
Metodología: ACPWealth quintile (% owns asset)
Poorest 2nd 3rd 4th Richest TotalHas telephone 1.45 19.23 57.53 86.70 97.54 52.46 0.2278Has television 29.33 70.86 91.78 98.06 99.14 77.52 0.2127Has refrigerator 14.76 50.67 76.27 95.23 99.48 66.98 0.2211Uses water from aqueduct, inside the dwelling 9.88 55.64 88.03 94.88 97.09 68.56 0.2334Uses water from aqueduct, outside the dwelling 21.75 20.53 7.26 3.62 2.22 11.19 -0.0669Uses water from a public standpipe 1.45 1.32 0.32 0.08 0.02 0.64 -0.0143Uses water from well with pump 22.10 9.21 1.83 0.51 0.22 6.84 -0.0937Uses water from river, stream, or spring 34.51 5.07 0.46 0.14 0.06 8.29 -0.1556Uses water from tanker truck 2.25 2.94 0.63 0.15 0.04 1.21 -0.0165Uses toilet connected to sewer 3.77 49.09 87.66 96.35 98.81 64.96 0.2508Uses shared toielet connected to sewer 0.35 5.85 4.86 1.56 0.26 4.47 0.0115Uses own toilet connected to septic system 38.26 34.40 6.46 1.84 0.89 16.09 -0.1072Uses shared toilet connected to septic system 1.44 1.12 0.15 0.02 0.00 0.78 -0.0222Uses own unconnected flush toilet 11.64 5.16 0.60 0.12 0.02 3.48 -0.0665Uses shared unconnected flush toilet 0.40 0.17 0.01 0.00 0.00 0.17 -0.0137No sanitary service 44.14 4.21 0.25 0.10 0.02 10.05 -0.1809Has parquet or polished wood flooring 0.15 1.15 3.63 6.59 17.82 5.90 0.0786Has tile flooring 1.68 15.06 43.63 75.26 78.48 42.64 0.1963Has wood plank flooring 11.74 4.88 2.05 1.19 1.02 4.45 -0.0612Has cement flooring 37.54 71.01 50.16 16.91 2.67 35.51 -0.0482Has earth, mud, dung, or sand flooring 48.89 7.90 0.52 0.05 0.01 11.51 -0.1823
Factor scoreColombia 2005 - Resultados ACP
Metodología1) Consistencia interna
Eliminación de variables por etapas (stepwise), cálculo de correlaciones y el alpha de Cronbach.
Comparación gráfica de distribuciones de riqueza con el índice de la ENDES.
2) Validez Predicción de indicadores educativos (nivel
educativo alcanzado y asistencia a la escuela).
Metodología: Consistencia interna (I)Eliminación de variables por etapas
(stepwise), siguiendo el orden de los pesos del ACP (menor a mayor) y luego el índice es recalculado con las variables restantes.
Cálculo de correlaciones: verificación de consistencia de los rankings luego de la eliminación de cada variable.Comparación del ranking original de hogares al
ranking usando el nuevo grupo de variables.
Alpha de Cronbach: comparación de la consistencia interna entre índices.
21
2
11 X
K
iYi
KK
Resultados: Consistencia interna (I)
0.8
0.85
0.9
0.95
1
59 54 49 44 39 34 29 24 19 14 9Number of Variables Included
Cronbach alpha Spearman rank
0.800
0.850
0.900
0.950
1.000
62 57 52 47 42 37 32 27 22 17 12 7 2Number of Variables Included
Cronbach alpha Spearman rank
El alpha de Cronbach y las correlaciones calculadas durante el proceso de eliminación de variables muestran que el índice tiene una consistencia interna primero estable o creciente y luego decreciente a partir de cierto punto.
Peru 1993 Colombia 2005
Metodología: Consistencia interna (II)Comparación gráfica de funciones de
densidad kernel entre microdatos censales y ENDES.Se espera distribuciones similares de NSE,
dado que se trata de bases de datos de años similares.
Comparación de estadísticos resumen de distribuciones estandarizadas entre microdatos censales y ENDES.Percentiles, sesgo, y curtosis.
Resultados: Consistencia interna (II)
El índice de activos basado en microdatos censales muestra una similar distribución al correspondiente a la ENDES.
Senegal 2002 Brasil 2000
Metodología: Validez Aplicación a indicadores educativos1. Comparación de distribuciones de asistencia a
la escuela y nivel educativo según quintiles del índice para microdatos censales y ENDES.
2. Estimación de un modelo probit para asistencia a la escuela, controlando por el índice de activos y otras variables individuales y del hogar:
Pr(y=1|X) = Φ(X’β) Donde Pr(y=1|X) es la probabilidad de asistir a la escuela.
78.0
88.6
73.4
34.7
77.8
87.4
93.0
84.5
43.2
84.3
90.994.6
88.9
48.1
88.2
93.295.8
90.6
55.7
91.295.4 95.7
86.8
68.8
94.0
0
10
20
30
40
50
60
70
80
90
100
Brazil South Africa Peru Senegal Colombia
School enrollment according to DHS wealth quintiles
Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile
80.6 79.2
70.5
27.1
70.9
87.683.8
77.2
35.2
82.4
90.586.2 84.8
44.8
88.0
93.989.8
86.4
55.0
91.5
97.093.0
87.4
68.8
94.8
0
10
20
30
40
50
60
70
80
90
100
Brazil South Africa Peru Senegal Colombia
School enrollment according to census asset index
Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile
63.168.1
75.9
40.3
9.1
80.5 78.4
87.5
63.1
15.1
86.9 85.1
93.6
75.9
28.8
92.7 93.297.1
82.9
47.5
95.898.3 98.9
92.7
65.8
0
10
20
30
40
50
60
70
80
90
100
Brazil South Africa Peru Colombia Senegal
Adult primary school completion according to DHS wealth index
Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile
70.2
46.6
23.1
35.6
5.2
84.0
56.0
40.4
61.2
8.2
89.7
64.1 62.9
76.2
15.7
95.0
81.9
75.3
84.8
32.5
98.193.3
85.2
92.9
54.7
0
10
20
30
40
50
60
70
80
90
100
Brazil South Africa Peru Colombia Senegal
Adult primary school completion according to census asset index
Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile
Resultados: ValidezModelo probit para asistencia a la escuela usando
microdatos censales
Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.
Muestra Coeficiente Z-stat P-valueEfecto
marginal0.3169 125.61 < 0.01 0.0325
(0.0025) (0.0003)0.1225 113.41 < 0.01 0.0190
(0.0010) (0.0002) 0.1674 36.73 < 0.01 0.0344(0.0038) (0.0008) 0.2405 70.9 < 0.01 0.0461(0.0033) (0.0006)
Perú 1993
Sudáfrica 1996
Brasil 2000
Colombia 2005
Resultados: ValidezColombia 2005Perú 1993
Resultados del modelo probit para asistencia educativa durante el proceso de eliminación de variables.
El efecto marginal del índice de activos y el R2 son estables inicialmente y luego decrecientes.
0.100
0.105
0.110
0.115
0.120
0.125
0.130
0.135
0.010
0.013
0.016
0.019
0.022
0.025
0.028
62 57 52 47 42 37 32 27 22 17 12 7 2Marginal effect R-squared
0.050
0.052
0.054
0.056
0.058
0.060
0.000
0.002
0.004
0.006
0.008
0.010
0.012
59 54 49 44 39 34 29 24 19 14 9
Marginal effect R-squared
Discusión de resultados Procedimiento de eliminación de variables y las
distribuciones de densidad de kernel muestran que se trata de una medida consistente de nivel socioeconómico.
El modelo probit indica que el índice de activos tiene un efecto positivo y significativo en la asistencia a la escuela.
La metodología permite determinar estándares para el requerimiento de datos para obtener un índice válido. El análisis de más muestras de microdatos censales
permitirá obtener resultados más concluyentes respecto al grupo de variables esenciales para el índice.
Cuál es el “mejor” método para ACP?El ACP presentado previamente está basado en variables
categóricas recodificadas como binarias (“ACP binario”).Kolenikov y Angeles (2009) sugieren el uso de variables
ordinales, las cuales aportan información adicional a través del orden de las categorías.
Métodos alternativos aplicados a variables ordinales:“ACP policórico”: ACP basado en correlaciones policóricas.“ACP ordinal”: ACP basado en la forma “tradicional” para
calcular correlaciones pero aplicado a variables ordinales.
Trabajo en curso (1) Preguntas de investigación:
1. ¿Son los rankings de hogares basados en métodos alternativos muy diferentes?
2. ¿Cuál de los métodos para ACP tiene un mejor desempeño para examinar indicadores educativos? (usando quintiles o análisis de regresión)
Trabajo en curso (2)Metodología:
Tres métodos para ACP: binario, policórico, ordinal.Cálculo de índices basados en métodos alternativos
para 7 muestras de IPUMS-I (incluyendo Cambodia 1998 y Tailandia 2000).
Comparación de los índices usando:1. Clasificación de hogares según quintiles.
2. Comparación gráfica de densidades kernel.
3. Análisis de regresión para asistencia a la escuela.
Resultados preliminares (1)
La clasificación de hogares por quintiles es más similar entre los métodos aplicados a variables ordinales (ACP policórico y ACP ordinal), respecto del ACP binario.
Clasificación de hogares por quintiles (Colombia 2005)
9.92 9.69 1.99
80.53 80.76 96.27
9.55 9.56 1.74
0
20
40
60
80
100
Binario vs Policórico Binario vs Ordinal Ordinal vs Policórico
Menor quintil Mismo quintil Mayor quintil
Resultados preliminares (2)
Las distribuciones kernel para los métodos alternativos muestran similitudes, las cuales son mayores entre los índices aplicados a variables ordinales (forma de la distribución y la concentración de su masa.)
Colombia 2005Brasil 2000
Resultados preliminares (3) Muestra ACP binario ACP
policóricoACP
ordinalBrasil 2000 1.28 1.48 1.32
Colombia 2005 1.24 1.48 1.30
Perú 1993 1.10 1.20 1.12
Senegal 2002 1.12 1.24 1.16
Sudáfrica 1996 1.18 1.26 1.23
Cambodia 1998 1.20 1.58 1.34
Tailandia 2000 1.43 1.67 1.54
Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.
Modelo logit para asistencia a la escuela (odd-ratios)
Discusión de resultados preliminares ACP policórico y ordinal tienen mayor concordancia en
clasificación de hogares por quintiles que el ACP binario. Los odds-ratios del modelo logit para asistencia a la escuela
muestran un patrón en todas las muestras analizadas:ACP policórico > ACP ordinal > ACP binario
Los resultados preliminares sugieren que el ACP policórico y ordinal tienen un mejor desempeño que el ACP binario como control por nivel socioeconómico.
Siguientes pasos: inclusión de muestras adicionales y desarrollar un procedimiento de eliminación de variables por etapas.
Gracias.