Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
Encuesta DemográficaRetrospectiva 2017EDERDiseño muestral
Instituto Nacional de Estadística y Geografía
Encuesta DemográficaRetrospectiva 2018
EDER
Diseño muestral
Obras complementarias publicadas por el INEGI sobre el tema: Temas, Categorías y Variables. Encuesta Nacional de Ingresos y Gastos de los Hogares.
Conociendo México
01 800 111 4634 www.inegi.org.mx
INEGI Informa @INEGI_INFORMA
DR © 2018, Instituto Nacional de Estadística y Geografía
Edificio Sede
Avenida Héroe de Nacozari Sur 2301
Fraccionamiento Jardines del Parque, 20276 Aguascalientes,
Aguascalientes, Aguascalientes, entre la calle INEGI,
Avenida del Lago y Avenida Paseo de las Garzas.
Catalogación en la fuente INEGI:
304.6 Encuesta Demográfica Retrospectiva (2017).
Encuesta Demográfica Retrospectiva 2017 : EDER : diseño muestral / Instituto
Nacional de Estadística y Geografía.-- México : INEGI, c2018.
7 p.
1. Demografía - Encuestas, 2017. 2. Población - México. I. Instituto Nacional de
Estadística y Geografía (México).
El Instituto Nacional de Estadística y Geografía (INEGI) presenta seis documentos metodológicos en los que se exponen las principales características de la Encuesta Demográfica Retrospectiva 2017 (EDER-2017).
En este documento, correspondiente al Diseño muestral, se describen las actividades que constituyen el proceso de obtención y tratamiento estadístico de la muestra, que inicia con la determinación de la cobertura y dominios de interés, para los cuales se pueden obtener estimaciones estadísticamente confiables, en función de los cuales se calcula el tamaño de la muestra y se determina su distribución, seguida de la selección de las unidades de muestreo.
Como parte del tratamiento, se describe el cálculo de las probabilidades de selección y su empleo para asignar el peso que debe tener cada unidad seleccionada. Finalmente se presentan las expresiones empleadas para obtener las estimaciones y sus medidas de calidad.
Presentación
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
Diseño muestral 1
1. Objetivo de la encuesta 1
2. Población objetivo 1
3. Cobertura geográfica 1
4. Marco de la encuesta 1
5. Tamaño de la muestra 1
6. Selección de la muestra 1
7. Ajuste a los factores de expansión 27.1 Ajuste por no respuesta 27.2 Ajuste por proyección 2
8. Estimadores 3
9. Estimadores de errores de muestreo 3
Anexo Distribución de la muestra en viviendas por 7entidad y trimestre para la Encuesta DemográficaRestrospectiva 2017 (EDER-2017)
Índice
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
1
1. Objetivo de la encuesta
El objetivo de la EDER-2017 es recolectar información sobre la naturaleza temporal de los procesos sociodemo-gráficos como migración, educación, ocupación, nupcialidad, fecundidad y mortalidad que ha experimentado la población de México.
2. Población objetivo
La encuesta está dirigida a la población de 20 a 54 años de edad que residen en las viviendas particulares dentro del territorio nacional.
3. Cobertura geográfica
La encuesta está diseñada para dar resultados a nivel nacional.
4. Marco de la encuesta
El marco de muestreo para la EDER-2017, fue conformado por todos los listados de viviendas con población resi-dente habitual de 20 a 54 años de edad, detectadas en el tercer y cuarto trimestre de 2017 por la Encuesta Nacional de los Hogares (ENH-2017).
El diseño de la muestra de la EDER-20171 se caracteriza por ser probabilístico; en consecuencia, los resultados obtenidos de la encuesta se generalizan a toda la población, a su vez es trietápico, estratificado y por conglomerados, donde la unidad última de selección es la persona.
5. Tamaño de la muestra
El tamaño de la muestra de la EDER-2017 se definió con la muestra que se levantó en el tercer y cuarto trimestre para la ENH-2017, resultando un acumulado para los dos trimestres de 33 021 viviendas. Este tamaño alcanzó para cubrir proporciones de 0.015, con un error relativo máximo esperado de 15%.
6. Selección de la muestra
La selección de la muestra se realizó de manera independiente entre las personas del grupo de 20 a 54 años de edad identificados previamente por la ENH-2017. Por lo tanto, la probabilidad de seleccionar de la k-ésima persona, de la j-ésima vivienda, de la i-ésima UPM, del h-ésimo estrato, de la e-ésima entidad es:
ehij
ehijENHehijehijk N
nPP =
Y su factor de expansión es:
ehij
ehijENHehijehijk n
NFF =
1 Ver el diseño muestral de la ENH-2017.
Diseño muestral
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
2
Donde:
= probabilidad de seleccionar la k-ésima persona, de la j-ésima vivienda, de la i-ésima UPM, del h-ésimo estrato, de la e-ésima entidad.
= probabilidad asociada de la ENH-2017 de la j-ésima vivienda, de la i-ésima UPM, del h-ésimo es-trato, de la e-ésima entidad, de la persona seleccionada para la EDER-2017.
= número de personas seleccionadas para la EDER-2017 en la j-ésima vivienda, en la i-ésima UPM,en el h-ésimo estrato, en la e-ésima entidad.
= número de personas identificadas en la ENH-2017 en la j-ésima vivienda, en la i-ésima UPM, en elh-ésimo estrato, en la e-ésima entidad.
= factor de expansión para la k-ésima persona, de la j-ésima vivienda, de la i-ésima UPM, del h-ésimoestrato, de la e-ésima entidad.
= factor de expansión de la j-ésima vivienda, de la i-ésima UPM, del h-ésimo estrato, de la e-ésimaentidad para la ENH-2017.
7. Ajuste de los factores de expansión
Los factores de expansión elaborados conforme al procedimiento antes descrito se ajustan en base a los siguientes conceptos:
7.1 Ajuste por no respuesta
Debido a que algunas personas seleccionadas, dentro de los grupos etarios de interés, no respondieron al instrumento de captación se efectuó un ajuste al factor de expansión.
El ajuste a los factores de expansión por no respuesta atribuida al informante a nivel estrato, en cada uno de los dominios, se efectúa mediante la siguiente expresión:
∑∑∑∑
∑∑∑∑=
h
EDERehijkehijk
i j k
hehijk
i j kehijk
*ehijk
F
FFF
I
Donde:
= factor de expansión corregido por no respuesta para la k-ésima persona, de la j-ésima vivienda, dela i-ésima UPM, del h-ésimo estrato, de la e-ésima entidad.
= factor de expansión para la k-ésima persona, de la j-ésima vivienda, de la i-ésima UPM, del h-ésimoestrato, de la e-ésima entidad.
=
variable indicadora que toma los valores 1 o 0. Si la k-ésima persona es seleccionada para la EDER-2017, en la j-ésima vivienda, en la i-ésima UPM, en el h-ésimo estrato, en la e-ésima entidad que tiene respuesta completa entonces la variable indicadora toma el valor de 1 la variable indica-dora toma el valor de 0 en otro caso.
7.2 Ajuste por proyección
Los factores ajustados por la no respuesta se corrigen, a fin de asegurar que en cada dominio de interés de la encuesta se obtenga la población total de acuerdo a la proyección de población determinada, la cual está referida al punto medio del levantamiento, mediante la siguiente expresión:
*ehijkF
ehijkF
EDERehijkI
ehijkF
ehijN
ENHehijF
ehijkP
ENHehijP
ehijn
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
3
D
D*D
**D PEXP
PROyFF =
Donde:
= factor de expansión corregido por proyección en el dominio D.
= factor de expansión corregido por no respuesta en el dominio D.
= población en el dominio D, según proyección.
= población total a la que expande la encuesta en el dominio D.
= dominio de interés para la encuesta.
8. Estimadores
El estimador del total nacional de la característica X de las personas objeto de estudio, esta definida por la siguiente expresión:
∑∑∑∑∑=k
ehijkehijjihe
XF X ˆ
Donde:
= factor de expansión final de la j-ésima vivienda, de la i-ésima UPM, del h-ésimo estrato, de la e-ésima entidad para las personas encuestadas .
= valor observado de la característica de interés X de la k-ésima persona, en la j-ésima vivienda, enla i-ésima UPM, en el h-ésimo estrato, en la e-ésima entidad, para las personas encuestadas.
= valor estimado de la característica X.
Para la estimación de proporciones, tasas y promedios se utiliza el estimador de razón:
YXR =
Donde, la variable Y se define en forma análoga a X .
9. Estimadores de errores de muestreo
Para la evaluación de los errores de muestreo de las principales estimaciones se usa el método de Conglomerados Últimos2, basado en que la mayor contribución a la varianza de un estimador, en un diseño polietápico es la que se presenta entre las unidades primarias de muestreo (UPM). El término Conglomerados Últimos se utiliza para denotar el total de unidades en muestra de una unidad primaria de muestreo.
Para obtener las precisiones de los estimadores de razón, conjuntamente al método de Conglomerados Últimos se aplicó el método de series de Taylor, obteniéndose la siguiente fórmula para estimar la precisión de R :
( )
−−
−∑
−∑∑=
2
h eh e
ehih eh e
ehiih e
h ee
h
2 3
hY
k1Y RX
k1X
1kk
Y1RV
h ekL
2
ˆˆˆˆˆˆ
ˆˆ
2 Véase Hasen, M. H. Horwitz, W.N. y Madow, W.G., Sample Survey Methods and Theory, (1953) Vol. 1 pág. 242.
ehijF
ehijkX
X
**DF*
DFDPROy
DPEXPD
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
4
Donde:
= total ponderado de la variable de estudio X en la i-ésima UPM, en el h-ésimo estrato, en la e-ésima entidad.
= total ponderado de la variable de estudio X en el h-ésimo estrato, en la e-ésima entidad.
= número de UPM en el h-ésimo estrato, en la e-ésima entidad.
= número de estratos, en la e-ésima entidad.
= el cuadrado del estimador del total de la característica Y.
Estas definiciones son análogas para la variable de estudio Y.
La estimación de la varianza del estimador de un total se calcula con la siguiente expresión:
( ) ˆˆˆˆ2
h eh e
ehi1ih e
h eL
1h
2 3
1eX
k1 - X
1 - kk X V
ehe k
NAL
∑∑∑====
Las estimaciones del error estándar (EE), efecto de diseño (DEFF) y coeficiente de variación (CV) se calculan mediante las siguentes expresiones:
( )θˆ V E E = ( )
( )VV DEFF
MASθθ
ˆˆˆˆ
=( ) V V C
θθ
ˆˆˆ
=
Donde:
= estimador del parámetro poblacional θ . = estimador de la varianza bajo muestreo aleatorio simple.
= estimador de la varianza bajo el diseño de muestreo descrito en este documento.
Finalmente, el intervalo de confianza α−1I al ( )%1100 α− , se construye de la siguiente forma:
( ) ( )
= α−1α−1 + θθθθα
ˆˆˆˆ ˆˆI V z, Vz - 22-1
Donde α es el nivel de significancia.
( )MASV θˆ
( )θV
θ
ehiX
eL
h eX
2Y
h ek
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
Anexo
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018
7
Distribución de la muestra en viviendas por entidad y trimestre para la Encuesta Demográ-fica Retrospectiva 2017 (EDER-2017)
Entidad Muestra en viviendasTotal
Clave Nombre Tercer trimestre del 2017
Cuarto trimestre del 2017
0102030405060708091011121314151617181920212223242526272829303132
AguascalientesBaja CaliforniaBaja California SurCampecheCoahuila de ZaragozaColimaChiapasChihuahuaCiudad de MéxicoDurangoGuanajuatoGuerreroHidalgoJaliscoMéxicoMichoacán de OcampoMorelosNayaritNuevo LeónOaxacaPueblaQuerétaroQuintana RooSan Luis PotosíSinaloaSonoraTabascoTamaulipasTlaxcalaVeracruz de Ignacio de la LlaveYucatánZacatecas
457495495494490485489553496514509520551475506490505485505485557495491526508515533531484532502490
526525570571536508547500495501533558500554491542515577497539522504535512543570513521508515526504
9831 0201 0651 0651 026 993
1 0361 053 991
1 0151 0421 0781 0511 029 997
1 0321020
1 0621 0021 0241 079 999
1 0261 0381 0511 0851 0461 052 992
1 0471 028
994Total 16 163 16 858 33 021
INEG
I. En
cues
ta D
emog
ráfic
a R
etro
spec
tiva
2017
. ED
ER. D
iseñ
o m
uest
ral.
2018