Curso para la Producción de Curso para la Producción de Estadísticas sobre la Economía de la Estadísticas sobre la Economía de la
InformaciónInformación
Módulo 4: Implementación de una Módulo 4: Implementación de una encuesta sobre el uso de las TIC en las encuesta sobre el uso de las TIC en las empresasempresas
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Objetivos del ModuloObjetivos del Modulo
Al completar éste módulo, Vd. podrá:
Procesar datos Realizar el procedimientos de
ponderación (expansión) de los datos Editar los datos Saber cómo analizar los datos
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Contenido del Modulo 4Contenido del Modulo 4
4. Procesamiento y análisis de datos4.1. Edición de datos4.2. Ponderación de datos4.3. Estimación de los indicadores
TIC
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
4.1. Edición de datos4.1. Edición de datos
La información estadística proporcionada por las empresas puede contener los siguientes errores:– datos erróneos o faltantes,– clasificaciones incorrectas, y – respuestas incoherentes o ilógicas
– Con el fin de minimizar tales errores se pueden aplicar técnicas que optimicen la efectividad de– los instrumentos para la captura de datos y – de los procedimientos de recolección
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD Pasos en la validación de datosPasos en la validación de datos
Edición de datosMicroedición
Macroedición
Manejo de errores e inconsistencias internos
Estimación de datos faltantes (imputación)
Análisis de valores atípicos
Procedimientos de reponderación
Controles de calidad durante la recolección y el ingreso de datos
Archivo de datos limpios
Datos brutos
Edición de agregados
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Manejo de inconsistencias internas y erroresManejo de inconsistencias internas y errores
El control de la validez de un ítem (dato) individual requiere:– Verificar si pertenece a un conjunto de
respuestas válidas– Verificar las preguntas contra respuestas
válidas– Definición de las reglas que definen las relaciones
entre las preguntas (ver el ejemplo 24 del Manual)
– Verificaciones aritméticas (durante el ingreso de los datos o a lo largo de una serie de registros)
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Manejo de datos faltantesManejo de datos faltantes
Hay varios métodos para tratar la no-respuesta y evitar sesgos.
– Ponderación correctiva (por unidad) basada en la muestra y basada en la población
– Imputación Imputación determinista Imputación “hot deck” Imputación “cold deck” Imputación del valor de la media o del valor modal Imputación histórica
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Manejo de unidades mal clasificadasManejo de unidades mal clasificadas
Dos casos de clasificación errónea
– Una unidad no elegible incluida por error Esto reduce el tamaño efectivo de la muestra a menos
que se prepare una lista de reserva
– Una unidad elegible incluida en el estrato equivocado, u omitida del marco
La solución técnica consiste en recalcular los factores de ponderación de la muestra (ver ejemplo 27 del Manual)
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
Método de ponderación simpleMétodo de ponderación simple
El promedio de la muestra en el estrato h se define como
La estimación para el estrato h se calcula multiplicando el promedio del estrato, por el número total de empresas en el estrato, es decir
La fórmula para la estimación del estrato h puede escribirse de la manera siguiente para mostrar la asignación de factores de ponderación a cada unidad.
4.2. Ponderación de datos4.2. Ponderación de datos
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD 4.3. Estimación de los indicadores TIC4.3. Estimación de los indicadores TIC
Estimaciones de una proporción de la poblaciónEstimaciones de una proporción de la población
Expresión de una proporción:
Cuatro estimaciones diferentes:– Muestreo aleatorio simple de una población no
estratificada– Muestreo aleatorio estratificado
Con uno o más estratos investigados exhaustivamente
– Estimaciones de una razón con muestreo aleatorio simple
– Estimaciones de una razón con muestreo aleatorio estratificado
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
El indicador puede expresarse como la proporción muestral
El error estándar (SE) de la proporción muestral se estima por:
La expresión del error estándar es válida con un fracción de la muestra de 10% o menos
CASO 1. Muestreo aleatorio simple CASO 1. Muestreo aleatorio simple de una población no estratificadade una población no estratificada
)ˆ1(ˆ)1(
)ˆ( ppNn
nNpSE
n
a
N
anN
nN
anN
w
awp
n
ii
n
ii
n
i
n
ii
n
ii
n
iii
11
1
1
1
1
/
)/(
)/(ˆ
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD
CASO 2CASO 2.. Muestreo aleatorio simple estratificadoMuestreo aleatorio simple estratificado
Una estimación insesgada de p es:
donde, L: número de estratosNh : la población en el estrato h (h=1, 2, ... L)nh : el tamaño de la muestra en el estrato h (h=1, 2, ... L)
Estimación del error estándar de :
Ver Anexo 4 del Manual
L
hh
h
L
h
n
ihi
h
h
pN
N
N
an
N
p
h
1
1 1 ˆˆ
p̂
L
hh
h pVN
NpSE
1
2
)ˆ()ˆ(
M4: Implementación de una encuesta sobre el uso de las TIC en las empresasM4: Implementación de una encuesta sobre el uso de las TIC en las empresas
UNCTAD CASCASOO 3. 3. Estimación de una razón Estimación de una razón con muestreo aleatorio simplecon muestreo aleatorio simple
El indicador a estimar es
Entonces, la estimación natural de la razón p es
Finalmente, la aproximación de error estándar (SE) es
Donde es el promedio de la muestra, es decir
N
ii
N
ii
x
y
X
Yp
1
1
n
ii
n
ii
n
ii
n
ii
x
y
xnN
ynN
X
Yr
1
1
1
1
ˆ
ˆˆ
1
)ˆ(1
)ˆ( 1
2
n
xry
Nn
nN
xrSE
n
iii
xn
xx
n
ii
1