23
CAPÍTULO II. TEORÍA DE MUESTREO II.1 Muestreo Actualmente el muestreo puede ser considerado como un instrumento organizado para obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de importancia de los problemas que se desean resolver, además de ocuparse de la adecuada presentación de los hechos individuales registrados y de la manera en que éstos se recopilan y resumen. Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son mencionadas a continuación: Costo reducido . Si los datos obtenidos provienen de una pequeña fracción de la población, los gastos asociados a su recopilación serán mucho menores que si se intenta realizar un censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de muestras que solamente representan una pequeña fracción de la población. Mayor rapidez . Como consecuencia de lo anterior, los datos pueden recolectarse y resumirse rápidamente con una muestra, siendo esto de vital importancia cuando se requiere la información con urgencia. Mayor alcance . Para la realización de algunos tipos de encuestas se cuenta con personal y recursos limitados. Lo anterior conlleva a que la realización de un censo sea algo

Capítulo 2. Teoría de Muestreo

  • Upload
    dongoc

  • View
    226

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Capítulo 2. Teoría de Muestreo

CAPÍTULO II. TEORÍA DE MUESTREO

II.1 Muestreo

Actualmente el muestreo puede ser considerado como un instrumento organizado para

obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de

importancia de los problemas que se desean resolver, además de ocuparse de la adecuada

presentación de los hechos individuales registrados y de la manera en que éstos se

recopilan y resumen.

Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son

mencionadas a continuación:

Costo reducido. Si los datos obtenidos provienen de una pequeña fracción de la población,

los gastos asociados a su recopilación serán mucho menores que si se intenta realizar un

censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de

muestras que solamente representan una pequeña fracción de la población.

Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y

resumirse rápidamente con una muestra, siendo esto de vital importancia cuando se

requiere la información con urgencia.

Mayor alcance. Para la realización de algunos tipos de encuestas se cuenta con personal y

recursos limitados. Lo anterior conlleva a que la realización de un censo sea algo

Page 2: Capítulo 2. Teoría de Muestreo

impráctico, y por tanto se tiene mayor flexibilidad respecto a la información que se puede

llegar a obtener.

Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede

utilizar personal más capacitado y someterlo a entrenamiento intensivo, con el fin de tener

una supervisión cuidadosa del trabajo de campo y procesamiento de los resultados.

En el diseño de una muestra hay que considerar dos aspectos; inicialmente un proceso de

selección, en la que se incluyen en la muestra algunos elementos de la población; y

posteriormente un proceso de estimación, en el que se llevan a cabos los cálculos de las

estadísticas de la muestra, que son estimadores muestrales de valores de la población.

El diseño de una muestra considera las tareas de selección y estimación para realizar

inferencias que vayan del valor muestral al valor de la población. Un valor de la población

es una expresión numérica que sintetiza los valores de una o varias características de la

totalidad de la población; en otras palabras, una medida resumen de una cualidad de la

distribución de la variable o variables en la población definida.

El valor de la muestra, o estadística, es una estimación que se calcula a partir de los

elementos que conforman la muestra. Por el contrario, el valor de la población depende de

todos los elementos que forman parte de la población.

Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que

se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una

Page 3: Capítulo 2. Teoría de Muestreo

designación de solo una fracción de la población total a ser observada en la muestra, sin

embargo, al realizar un buen diseño de muestra, se tiene como consecuencia que estos

errores tengan la menor presencia posible.

Dentro del muestreo se pueden distinguir varias formas.

1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de

elementos que llegan por casualidad.

2. Selección experta, que se considera como un tipo de muestro no aleatorio, ya que

personas consideradas como expertas se encargan de escoger unidades que

consideran típicas o representativas.

3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables

demográficas, se construye una muestra relativamente proporcional a la población.

4. Muestreo de poblaciones móviles. En el que la población total es estimada de la

proporción de individuos en la recaptura, que han sido capturados de manera previa

y fueron marcados.

En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las

distribuciones de las variables de encuesta en la población. En un sentido contrario, en los

casos de muestreo probabilístico, se pueden llevar a cabo inferencias de la población por

medio de métodos estadísticos, sin tener que hacer suposiciones acerca de ella. En este

último, cada uno de los elementos de la población tiene una probabilidad conocida además

de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al

diseño de la muestra.

Page 4: Capítulo 2. Teoría de Muestreo

Las muestras probabilísticas en general son diseñadas para ser medibles, es decir, la

inferencia estadística de los valores de la población, resultado de la ejecución de un

muestreo en una población particular, pueda basarse en medidas de variabilidad.

El muestreo aleatorio simple es el proceso de selección básico y los demás procedimientos

de selección de muestras pueden considerarse como modificaciones de él.

1. Mesip, es un método de selección con igual probabilidad para todos los elementos

de la población.

2. Muestreo de elementos, en este tipo los elementos son también las únicas unidades

de muestreo.

3. La estratificación, se refiere a la selección de la muestra a partir de varias

subpoblaciones conocidas como estratos, en los que se ha divido la población.

4. La selección sistemática, se puede considerar como una alternativa de selección

aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias

separadas en lista usando un intervalo de selección.

5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una

muestra preseleccionada más grande, que contiene información que permite

mejorar la selección final.

Un buen diseño de muestra, requiere se equilibren en la medida de lo posible 4 criterios:

a. Orientación hacía la meta. El diseño completo, tanto al momento de realizar la

selección como la estimación, debe estar orientado a los objetivos de la

Page 5: Capítulo 2. Teoría de Muestreo

investigación. Estas consideraciones deben figurar al momento de seleccionar y

definir a la población, en la medición y procedimientos de muestreo.

b. La medibilidad es una característica que permite calcular, a partir de la información

de la muestra, estimaciones válidas o aproximaciones de su variabilidad de

muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia

estadística, y sirve como puente entre el resultado de la muestra, y el valor

desconocido de la población.

c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar

a cabo el diseño como se propuso de manera inicial. La simplicidad siempre debe

encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa

en gran medida la pérdida de un poco de eficiencia teórica. El arte del muestreo

consiste en llevar a cabo un diseño práctico que se comporte de la mejor manera

posible, aún cuando no sea perfecto, y se adapte a un modelo.

d. Economía, que se refiere a cumplir los objetivos con un costo mínimo. Una muestra

será demasiado pequeña si los resultados que ofrece carecen de precisión suficiente

para contribuir a las decisiones. Por otro lado, una muestra será demasiado grande

si sus resultados son más precisos de lo que se requiere. Es necesario mediar estas

dos situaciones considerando el costo en el que se incurre al realizar el muestreo.

En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar

y combinar para conseguir un buen diseño de muestreo.

Page 6: Capítulo 2. Teoría de Muestreo

A continuación se exponen características deseables de una muestra, que sin embargo no

son por sí mismos necesarios y suficientes para tener una buena muestra.

- Las muestras probabilísticas requieren de probabilidades no nulas y que sean conocidas.

- Las muestras medibles son muestras probabilísticas, diseñadas para permitir estimar la

variabilidad de muestreo.

- Los muestreos mesip, que son clases especiales de muestreo probabilístico, requieren

probabilidades iguales para cada uno de los elementos.

- Los muestreos de área usan segmentos de área como unidades de muestreo.

- Las muestras insesgadas denotan a aquellos diseños en los que el valor esperado es igual

al valor de la población.

- Las muestras precisas son aquellas que tienen errores estándar bajos.

- Las muestras económicas tienen costos unitarios bajos para una varianza fija.

- Las muestras eficientes denotan una precisión alta, es decir, baja varianza por elemento.

II.2 Muestreo Aleatorio Estratificado

II.2.1 Descripción.

En el muestreo estratificado a la población que consta de N unidades se le divide de

manera primaria en subpoblaciones con N1, N2,…, NL unidades respectivamente. Estas

poblaciones no deben contener ningún traslape, es decir, sus elementos deben ser

excluyentes, y al reunirlas deben comprender la totalidad de la población, de tal manera

que:

NNNN L =+++ ...21

Page 7: Capítulo 2. Teoría de Muestreo

A cada una de estas subpoblaciones se le denominará estrato. Para lograr el beneficio total

derivado de la estratificación, los valores de las Nh deben ser conocidos. Cuando los

estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta

selección independiente en cada uno de los diferentes estratos. El tamaño de las muestras

en cada uno de los estratos se denota por n1, n2,…,nL, respectivamente.

En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a

todo el procedimiento se le designará con el nombre de muestreo aleatorio estratificado.

De la muestra que se obtenga en cada uno de los estratos, se calcula la media

correspondiente, o cualquier otra estadística, y ésta se pondera apropiadamente para

obtener una estimación combinada del total de la población. Del mismo modo, se calculan

las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a

una estimación combinada para la población.

La estratificación es una técnica empleada comúnmente, debido a razones diversas entre

las que encontramos:

⇒ Existencia de una gran conveniencia administrativa, ya que si se cuenta con

diversas oficinas de campo, se pueden supervisar varias encuestas en distintas

partes de la población.

⇒ Presencia de problemas de muestreo que no son homogéneos para todas las partes

de la población, por lo que al dividirla es posible conseguir estratos que compartan

Page 8: Capítulo 2. Teoría de Muestreo

características similares, lo cual es una característica deseable al realizar la

estratificación.

⇒ Se puede llegar a producir una ganancia en precisión para algunas características

que se quieran conocer de la población. Es posible llegar a dividir una población

heterogénea en subpoblaciones que sean homogéneas internamente. Si cada uno de

los estratos es homogéneo, en el hecho de que las medidas de la población varíen

muy poco de una unidad a otra, se puede obtener un cálculo preciso de la media de

cualquier estrato de una pequeña muestra de éste. Estos cálculos pueden entonces

combinarse para obtener una estimación precisa del total de la población.

⇒ La estratificación es utilizada para reducir las varianzas de las estimaciones de la

muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los

estratos difieran entre ellas y a la homogeneidad que exista dentro de ellos.

⇒ Dentro de los diferentes estratos, se pueden utilizar diferentes métodos y

procedimientos.

a. Si la distribución física de algunas porciones de la población difiere

radicalmente, puede resultar beneficioso realizar procedimientos diferentes

a las partes.

b. Puede existir contraste en las listas disponibles para diversos sectores de la

población.

c. La existencia de naturaleza diversa en los elementos en algunas partes de la

población podría requerir la utilización de procedimientos distintos.

⇒ Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos

también se consideran como dominios de estudio. Donde un dominio se define

Page 9: Capítulo 2. Teoría de Muestreo

como una parte de la población para la cual se planean estimaciones separadas en el

diseño de la muestra.

La teoría del muestreo estratificado se relaciona con las propiedades de las estimaciones de

una muestra estratificada y con la mejor opción del tamaño de la muestra nh para obtener la

máxima precisión posible.

II.2.2 Notación

El sufijo h denota el estrato e i la unidad dentro del estrato.

Nh Número total de unidades en el estrato h

nh Número de unidades en la muestra del estrato h

yhi Valor de la i-ésima unidad

Wh=Nh/N Peso del estrato h

fh=nh/Nh Fracción de muestreo en el estrato h

h

N

ihi

hN

yY

h

∑== 1

_ Media poblacional

h

n

ihi

h n

yy

h

∑== 1

_ Media muestral

( )

11

2

2

−=∑=

h

N

ihhi

h N

Yys

h

Varianza poblacional

Page 10: Capítulo 2. Teoría de Muestreo

2)1()( Sn

fyV −= Varianza de la media en m.a.s.

II.2.3 Propiedades de los estimadores

Para obtener la media global, el estimador utilizado en muestreo estratificado es sty ,

donde:

L

L

hhh

L

hhh

st

NNNNdonde

yWN

yNy

+++=

== ∑∑

=

=

...21

1

1 (2.1)

El estimador sty en general no es el mismo para la media muestral. Esta media

muestral, y , puede escribirse:

n

yny

L

hhh∑

== 1 (2.2)

Es evidente que y coincide con sty , dado que en cualquier estrato se cumpla con lo

siguiente:

ffóNn

Nn

óNN

nn

hh

hhh ===

Lo cual implica que la fracción de muestreo sea la misma en cualquiera de los estratos.

Este tipo de estratificación se conoce como estratificación con asignación proporcional de

nh.

A continuación se describen las propiedades principales del estimador sty en los siguientes

teoremas:

Page 11: Capítulo 2. Teoría de Muestreo

Teorema 1. Si en cada estrato el estimador muestral hy es insesgado, entonces sty es un

estimador insesgado de la media poblacional _Y .

Demostración:

( ) ∑∑==

=⎟⎠

⎞⎜⎝

⎛=

L

hhh

L

hhhst YWyWEyE

11

debido a que los estimadores son insesgados en los estratos individuales. La media

poblacional puede escribirse:

∑∑∑∑

=

== = ===L

hhh

L

hhh

L

h

N

ihi

YWN

YN

N

yY

h

1

11 1

Lo cual completa la demostración.

Teorema 2. Si las muestras se obtienen de manera independiente en los diferentes estratos:

∑=

=L

hhhst yVWyV

1

2 )()( (2.3)

donde )( hyV es la varianza de hy sobre muestras repetidas del estrato h.

Demostración:

∑=

=L

hhhst yWy

1 (2.4)

sty es una función lineal de hy con sus respectivos pesos hW . Por tanto es posible

expresar el resultado estadístico para la varianza mediante la función lineal:

∑ ∑∑= = >

+=L

h

L

h

L

hjjhjhhhst yyCovWWyVWyV

1 1

2 )(2)()( (2.5)

Page 12: Capítulo 2. Teoría de Muestreo

Sin embargo, debido a que las muestras entre estratos se eligieron de manera

independiente, los términos de covarianza desaparecen. Lo cual da como resultado la

ecuación (2.3).

Lo importante acerca de estos resultados es que la varianza de sty depende solo de las

varianzas de los estimadores de las medias de los estratos individuales hY . Si fuera posible

fraccionar una población altamente variable en estratos tales que todos los elementos

tengan el mismo valor dentro del estrato, sería posible estimar Y sin error alguno. La

ecuación (2.4) muestra que el uso del peso correcto del estrato Nh/N al estimar sty

permite alcanzar este propósito.

Teorema 3. Para muestreo aleatorio estratificado, la varianza del estimador sty es:

∑ ∑= =

−=−=L

h

L

hh

h

hh

h

hhhhst f

nSW

nSnNN

NyV

1 1

22

2

2 )1()(1)( (2.6)

Demostración. Debido a que hy es un estimador insesgado de hY , el teorema (2.2) puede

aplicarse. Además aplicado a un estrato individual:

h

hh

h

hh N

nNnS

yV−

=2

)(

Por sustitución en el resultado del teorema 2, se obtiene:

∑ ∑ ∑= =

−=−==L

h

L

hh

h

hh

h

hhhhhhst f

nS

WnS

nNNN

yVNN

yV1 1

22

2

22

2 )1()(1)(1)(

Algunos casos particulares para esta fórmula se exponen en los siguientes corolarios.

Page 13: Capítulo 2. Teoría de Muestreo

Corolario 1. Si las fracciones de muestro nh/Nh son insignificantes para todos los estratos,

∑ ∑==h

hh

h

hhst n

SWn

SNN

yV2222

2

1)( (2.7)

Corolario 2. En el caso de asignación proporcional, se hace la siguiente sustitución en 2.6:

NnN

n hh =

Reduciéndose la varianza a:

∑ ∑−=⎟

⎠⎞

⎜⎝⎛ −

= 22 1)( hhhh

st SWn

fN

nNn

SNN

yV (2.8)

Corolario 3. Si el muestreo es proporcional y las varianzas en todos los estratos tienen el

mismo valor, Sw2, se obtiene el resultado siguiente:

⎟⎠⎞

⎜⎝⎛ −

=N

nNn

SyV w

st

2

)( (2.9)

Teorema 4. Si stY = styN es el estimador de la población total Y, entonces:

∑ −=h

hhhhst n

SnNNYV

2

)()ˆ( (2.10)

Lo cual se demuestra fácilmente utilizando el teorema 3.

Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador

insesgado de 2hS es:

( )∑=

−−

=hn

ihhi

hh yy

nS

1

22

11 (2.11)

Lo que nos lleva al siguiente teorema.

Page 14: Capítulo 2. Teoría de Muestreo

Teorema 5. Con muestreo aleatorio estratificado, un estimador insesgado de la varianza es

∑=

−==L

h h

hhhhstst n

snNN

Nysyv

1

2

22 )(1)()( (2.12)

Con la siguiente alternativa para propósitos de cálculo:

∑ ∑= =

−=L

h

L

h

hh

h

hhst N

sWn

sWys

1 1

2222 )( (2.13)

II.2.4 Asignación óptima

En muestreo estratificado la selección de tamaños de muestra nh en el estrato respectivo h,

puede llevarse a cabo para minimizar )( styV con un costo específico ó para minimizar el

costo con un valor específico de )( styV .

Considerando la función de costo más simple

∑+== hhncCCto 0cos (2.14)

Entre estratos el costo es proporcional al tamaño de la muestra, sin embargo, el costo por

unidad ch puede variar entre estratos. El término c0 representa un costo fijo. Esta función de

costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato

respectivo tienen el mayor peso.

Teorema 6. Si consideramos la función de costo anterior, la varianza de la media estimada

sty es mínima para un costo C, y el costo es mínimo para una varianza V( sty )

determinada, cuando nh es proporcional a hhh cSW / .

Page 15: Capítulo 2. Teoría de Muestreo

Demostración. Teniendo lo siguiente:

∑=

+=L

hhhnccC

10 (2.15)

∑ ∑ ∑= = =

−=−==L

h

L

h

L

h h

hh

h

hhh

h

hhst N

SWn

SWf

nSW

yVV1 1 1

222222

)1()( (2.16)

Los problemas a resolver son escoger nh para minimizar V con un determinado costo, y

posteriormente escoger nh tal que se minimice el costo con un valor determinado de V.

Ambos problemas resultan equivalentes a minimizar el producto

( ) ( )∑∑∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛=−⎟⎟

⎞⎜⎜⎝

⎛+= hh

h

hh

h

hh ncn

SWcC

NSW

VCV22

0

22

'' (2.17)

Lo anterior puede minimizarse usando la desigualdad de Cauchy-Schwarz. Si ah, bh son

conjuntos de números positivos:

( )( ) ( ) ∑∑∑∑∑>

−=−i ij

ijjihhhh babababa 2222 )( (2.18)

Con la expresión anterior, la siguiente desigualdad es posible:

( )( ) ( )222 ∑∑∑ ≥ hhhh baba (2.19)

sucediendo la igualdad si y solo si bh/ah es constante para toda h. En el caso presente se

considera

hhhhhhhhh

hhh cSWbancb

nSW

a === ,,

haciendo uso de la desigualdad (2.19)

( ) ( )( ) ( )22222

)'' ∑∑∑∑∑ ≥=⎟⎟⎠

⎞⎜⎜⎝

⎛= hhhhhhh

h

hh cSWbancn

SWCV

Page 16: Capítulo 2. Teoría de Muestreo

por lo tanto, el valor de nh que hace V’C’ mas pequeño es ( )2∑ hhh cSW . Ocurriendo un

mínimo cuando

hh

hh

h

h

SWcn

ab

= = k (2.20)

En términos del tamaño total de la muestra nh en el estrato, se tiene

∑∑==

)/(/

)/(/

hhh

hhh

hhh

hhhh

cSNcSN

cSWcSW

nn

(2.21)

Para completar la asignación es necesario obtener el valor de n. La solución dependerá si

se escogerá la muestra para obtener un costo determinado total C ó para obtener una

varianza determinada V para sty . En el caso de un costo fijo, se sustituyen los valores

óptimos de nh en la función de costo y se obtiene n.

( ))(

)/(

∑∑−

=hhh

hhho

cSN

cSNcCn (2.22)

Para el caso de V fija, sustituimos el valor óptimo de nh en la fórmula para )( styV .

( )∑∑∑

+= 2)/1(

/

hh

hhhhhh

SWNVcSWcSW

n (2.23)

El caso especial en el que ch = c conlleva a lo siguiente

∑∑==

hh

hh

hh

hhh SN

SNn

SWSW

nn (2.24)

El resultado anterior, en general es conocido como asignación de Neyman. Al sustituir el

valor de nh en la fórmula general para )( styV

( )N

SWn

SWyV hhhh

st∑∑ −=

22

min )( (2.25)

Page 17: Capítulo 2. Teoría de Muestreo

II.2.5 Precisión relativa de muestreo aleatorio estratificado y muestreo aleatorio

simple

Realizada de manera adecuada la estratificación puede traer como resultado una menor

varianza para la media estimada o total que la proporcionada con una muestra aleatoria

simple. Sin embargo si los valores de nh se encuentran lejos de los óptimos, la

estratificación puede tener como resultado una varianza mayor.

A continuación se describe la manera en que se obtiene ganancia por medio de la

estratificación, en comparación con el muestreo aleatorio simple.

nSfVmas

2

)1( −= (2.26)

NSW

nSW

SWn

fV hhhhhhprop

∑∑∑ −=−

=22

2)1( (2.27)

NSW

nSW

V hhhhopt

∑∑ −=22)(

(2.28)

De la identidad algebraica estándar para el análisis de varianza de una población

estratificada, se tiene

0/1)()1(

)()(

)()(

)()1(

22

22

22

22

→−+−=

−+−=

−+−=

=−=−

∑∑

∑∑∑

∑ ∑∑∑

∑∑

hh

hhh

hh

hhh

h ihhi

h h ih

ihhi

h ihi

NsiYYNSN

YYNYy

YYYy

YySN

∑∑ −+= 222 )( YYWSWS hhhh (2.29)

Page 18: Capítulo 2. Teoría de Muestreo

Por lo tanto

∑∑

−−

+=

−−

+−

=−=

2

222

)()1(

)()1()1()1(

YYWn

fV

YYWn

fSWn

fn

SfV

hhprop

hhhhmas

(2.30)

Por definición de Vopt, se debe tener Vprop ≥ Vopt. De las expresiones (2.27) y (2.28)

tenemos el siguiente resultado

( )( )( )∑

∑∑

−=

−=−

2

22

)(1

1

SSWn

SWSWn

VV

hh

hhhhoptprop

(2.31)

donde ∑= hh SWS es una media ponderada de las Sh.

Lo anterior se puede ver en el desarrollo siguiente

22222

22

222

2

2

)2()(

SSWSSSW

WSSWSSW

SSSSWSSW

hhhh

hhhhh

hhhhh

−=+−=

+−=

+−=−

∑ ∑∑∑ ∑

∑∑

Al realizar algunas sustituciones

∑∑ −−

+−+= 22 )()1()(1 YYWn

fSSWn

VV hhhhoptmas (2.32)

Al analizar la ecuación anterior, se puede notar que hay dos componentes que reducen la

varianza cuando se cambia de muestreo aleatorio simple a asignación óptima. El primer

componente que la reduce, que es el término en la extrema derecha, se debe a la

eliminación de las diferencias de las medias de los estratos; la segunda, es decir, el término

medio, proviene de la eliminación del efecto de las diferencias entre las desviaciones

estándar de los estratos.

Page 19: Capítulo 2. Teoría de Muestreo

El desarrollo anterior lleva a lo siguiente cuando 1/Nh es despreciable

maspropopt VVV ≤≤

En caso que tal término no fuera despreciable, se obtendría

⎥⎦⎤

⎢⎣⎡ −−−

−−

+= ∑∑ 22 )(1)()1(

)1(hhhhpropmas SNN

NYYN

NnfVV (2.33)

Lo cual induce a pensar que en algunos casos la estratificación puede proporcionar una

varianza mayor que el muestro aleatorio simple cuando

∑∑ −<− 22 )(1)( hhhh SNNN

YYN

II.2.6 Ganancias en precisión gracias al uso de la estratificación

La variable ideal para realizar estratificación, es aquella que se va a medir en la encuesta

correspondiente. Si fuera posible hacer esto, no habría traslape entre estratos, y la varianza

dentro del estrato sería menor que la varianza global.

Prácticamente lo anterior no es posible, sin embargo, cumpliéndose las condiciones

siguientes, se puede tratar de conseguir tal situación

1. La población conste de conjuntos que varíen considerablemente en tamaño.

2. Las variables que se intentan conocer estén altamente relacionadas con el tamaño

de tales conjuntos.

3. Se cuente con una buena medida de los tamaños de los distintos estratos.

La estratificación geográfica es muy común y generalmente va acompañada por un

incremento en la precisión por la existencia de muchos factores que hacen que las personas

Page 20: Capítulo 2. Teoría de Muestreo

vivan o se reúnan en un área común, mostrando similitudes en sus características

principales. Lo cual genera estratos con mayor uniformidad.

En lo que concierne a la estratificación proporcional respecto a la óptima, cuando se tienen

subpoblaciones con tamaños grandes y pequeños estratificadas por tamaño, el muestreo

proporcional resulta ineficiente, ya que en una subpoblación grande la varianza será mucho

mayor que en una pequeña. Por lo que utilizar una asignación óptima, generará mejores

estimaciones de los valores que se quieran conocer.

II.2.7 Construcción de estratos

Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar

estratos en los que las unidades de muestreo sean lo más homogéneas posibles respecto a

las variables que se desean conocer. Este objetivo se cumple cuando la variación entre

unidades de muestreo dentro del estrato sea menor que la variación de la población total.

Sean y0, yL el valor menor y valor mayor de y en la población que se encuentra en estudio.

El problema a resolver, es encontrar los límites entre estratos y1, y2,…, yL-1 tales que

∑∑==

−⎟⎠

⎞⎜⎝

⎛=

L

hhh

L

hhhst SW

NSW

nyV

1

22

1

11)( (2.34)

se minimice. Si se ignora el segundo término, resulta suficiente minimizar ΣWhSh. Debido a

que yh solo aparece en la suma en los términos WhSh y Wh+1Sh+1,se tiene lo siguiente

( ) )()( 11. ++∂∂

+∂∂

=∂∂ ∑ hh

hhh

hhh

h

SWy

SWy

SWy

(2.35)

Si se tiene que f(y) es la función de frecuencia de y,

Page 21: Capítulo 2. Teoría de Muestreo

)(,)(1

hh

hy

yh yf

yW

dttfWh

h

=∂∂

= ∫−

(2.36)

Además

∫∫

⎥⎥⎦

⎢⎢⎣

−=h

h

h

hh

h

y

y

y

yy

yhh

dttf

dtttf

dttftSW

1

1

1 )(

)(

)(

2

22 (2.37)

Al derivar lo anterior

)()(2)(2 222hhhhhhh

h

hhh

h

hh yfyfyyfy

yS

SWyW

S µµ +−=∂∂

+∂∂

donde hµ es la media de y en el estrato h. Sumándose a ambos lados 2hS f(yh) y

posteriormente al dividir entre 2Sh

h

hhhh

h

hh

h

hh

h

hh

SSy

yfyS

WyW

Sy

SW 22)()(

21)( +−

=∂∂

+∂∂

=∂

∂ µ

1

21

2111 )(

)(21)(

+

++++ +−−=

∂∂

h

hhhh

h

hh

SSy

yfy

SW µ (2.38)

Lo que deriva en las ecuaciones de cálculo para yh

1,,2,1)()(

1

21

21

22

−=+−

=+−

+

++ LhS

SyS

Sy

h

hhh

h

hhh Kµµ

(2.39)

No obstante, estas ecuaciones no son aplicables en la práctica, ya que hµ y 2hS dependen

de las fronteras. Por tanto, es necesario realizar una aproximación que permita conseguir

los resultados deseados. Sea

∫=y

y

dttfyZ0

)()( (2.40)

Page 22: Capítulo 2. Teoría de Muestreo

Si se consideran estratos numerosos y estrechos, f(y) debería ser aproximadamente

uniforme dentro de un estrato dado. Por lo que

)()( 1

1

−−== ∫−

hhh

y

yh yyfdttfW

h

h

&

)(121

1.−−= hhh yyS &

)()( 11

1

−− −==− ∫−

hhh

y

yhh yyfdttfZZ

h

h

&

Al sustituir las aproximaciones anteriores

∑∑∑=

−=

−=

−=−=L

hhh

L

hhhh

L

hhh ZZyyfSW

1

21

1

21

1)()(12 && (2.41)

Debido a que (ZL-Z0) es fija, resulta fácil verificar que la suma de la derecha se minimiza

al hacer (Zh-Zh-1) constante. Dado f(y), la regla consiste en computar el acumulado de √f(y)

y escoger yh de tal manera que se creen intervalos de amplitud similar en la escala del

acumulado de √f(y).

II.2.8 Cantidad de estratos

El concepto general de estratificación lleva a pensar que de una población dividida en k

estratos, siempre será posible mejorar la situación llevando a cabo más subdivisiones a los

estratos. De hecho, la estratificación puede llevarse al grado de tener un número de estratos

igual número de unidades que serán seleccionadas. Sin embargo, al sobrepasar un número

prudente de estratos, el aumentar su cantidad no resulta en una reducción considerable de

la varianza cuando la estratificación para cierta variable y se hace con respecto a otra

llamada x, como se demuestra a continuación de manera sencilla. Sea x una variable

uniforme de 0 a d, además y = x + e, donde e y x no tienen correlación alguna. Entonces

Page 23: Capítulo 2. Teoría de Muestreo

)()()( eVxVyV += . Supóngase el caso en el que se tienen k estratos con la misma

amplitud. Entonces

kNN

Wk

dS hhxh

112 2

22 ===

Si la asignación de la muestra es la misma, la varianza estimada de la media poblacional es

∑ +=n

Snk

dSWnk e

yhh

2222

12

Si el número de estratos aumentara a αk, la varianza relacionada con tal número será

nS

nkd e

2

2

2

2 121

En este caso el primer componente disminuye al realizar un incremento en el número de

estratos, pero el segundo componente se mantiene constante. Debido a lo anterior, se

llegará a un punto en el que el segundo componente se convierte en parte importante de la

varianza y aunque haya incrementos en el número de estratos, no habrá ganancias

significativas en la varianza.

II.3 Estratificación con más de una Variable

Dado que la mejor asignación para una variable puede no ser la mejor para otra, se debe

llegar a un arreglo para encuestas con más de una variable. El primer paso consiste en

reducir las variables consideradas en la asignación a un número relativamente pequeño

donde se consideren las más importantes. En el caso de que existan buenos datos previos,

se puede calcular la asignación óptima de cada característica y ver en que punto existen

desviaciones grandes. Puede darse el caso de variables que se encuentren tan

correlacionadas, que las asignaciones no difieran en gran medida.