Curso
Gestión de la calidadOperaciones Registrales
Guatemala, Junio 2015
MUESTREO Parte 1: Generalidades
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables
se hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el
estudio o investigación.
Muestreo
Procedimiento por el cual se extrae, de un conjunto de unidades que constituyen el objeto de estudio ( población), un número de casos reducido (muestra) elegidos con criterios tales que permitan la generalización a toda la población de los resultados obtenidos al estudiar la muestra.
Conceptos Iniciales
• Población: Conjunto de unidades de las que se desea obtener cierta información.
Unidades: Personas, Familias, Viviendas, Escuelas, Organizaciones, Artículos de Prensa
• Muestra: Selección de unas unidades concretas de la población que representen la característica que se
quiere medir.
Razones de Muestreo
• Disminución de costos ( tiempo, personal, material)
• Al disminuir el número de casos disminuyen también los errores asociados a la manipulación de los datos.
• Puede confiarse en la generalización de los resultados si se ha tenido cuidado al seleccionar la muestra.
Criterios importantes para la selección de la muestra
Salvo en poblaciones muy pequeñas y accesibles nunca se observan a todas las unidades de la población.
Se debe diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece.
Cualquier diseño muestral comienza con la búsqueda de la información que ayude a la identificación de las características de la población bajo estudio.
Condiciones que debe cumplir una “buena” muestra
• Que comprendan parte de la población y no la totalidad de ésta. ( salvo en los casos antes explicados en la lámina 5)
• Aunque el sentido común pareciera indicar que poblaciones más grandes deben producir muestras mayores, esto no es siempre cierto ya que:• El tamaño de la población NO es el único elemento que influye en el tamaño
de la muestra.
Condiciones que debe cumplir una “buena” muestra
La ausencia de distorsión en la elección de los elementos de la muestra.
Si esta elección presenta alguna anomalía, la muestra resultará por este mismo hecho viciada.
Que sea representativa o reflejo fiel de la población, de tal modo que reproduzca sus características básicas en orden a la investigación.
Condiciones que debe cumplir una “buena” muestra
Si hay sectores diferenciados en la población que se supone ofrecen características especiales la muestra también deberá comprenderlos en la misma proporción.
Tamaño de la muestra
Es el número de unidades a incluir en la muestra.
Existen varios factores que influyen en el:Tiempo y recursos disponibles
Modalidad de Muestreo
Tipo de Análisis Previsto
Varianza o heterogeneidad de la población
Margen de Error máximo admisible
Nivel de confianza de la estimación muestral
Modalidad de Muestreo Seleccionada
La selección de las modalidades de muestreo ( probabilísticos y no probabilísticos) se halla determinada por la confluencia de varios factores: los objetivos, los recursos, la accesibilidad de la población y el tiempo.
Los diseños no probabilísticos demandan un tamaño muestral menor.
Tipos de Muestreos
PROBABILÍSTICOS NO PROBABILISTICOS
•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral
•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos
Usos de cada tipo de muestreo
Muestreo Probabilísticos
Estimación de Parámetros
Comprobación de Hipótesis
Muestreos No Probabilísticos
Estudios Pilotos
Estudios Cualitativos
Investigaciones en poblaciones de difícil registro o localización ( Ej. Marginales, prostitutas, enfermos de VIH, etc…)
Ejemplo: ¿Muestreo Probabilístico?
• Se realiza un muestreo entre los alumnos que van a clases de la Materia Metodología, eligiéndolos al azar a la entrada del salón.
Este diseño es NO probabilístico porque aquellos que no van a clases NO PUEDEN ser elegidos
Ejemplo: ¿Muestreo Probabilístico?
• Se utiliza la lista de propietarios de líneas telefónicas para elegir a aquellos que serán encuestados.
Este diseño es NO Probabilístico porque aquellos que no tienen teléfono NO PUEDEN ser elegidos
Ejemplo: ¿Muestreo Probabilístico?
• Un investigador toma muestras del carbón extraído de una mina, tomando al azar trozos de carbón de la parte superior de cada carro.
Este diseño es NO probabilísticoporque solo se toma carbón
de la parte superior
Factores que influyen en el tamaño de la muestra :Tipo de análisis de datos previsto
La técnica de análisis influye en el tamaño de la muestra:
Comparación de Medias
Estimación de Proporciones ( parámetros)
Análisis Univariables
Análisis Multivariables
Heterogeneidad poblacional
Cuanto mas heterogénea sea la población mayor será su varianza poblacional lo que implicará mayores tamaños muestrales.
Cuando se desconoce el valor de la varianza poblacional se recurre al supuesto mas desfavorable, asumiendo una varianza poblacional igual a 0,5.
0,5 significa que una unidad seleccionada tiene 50 % de posibilidades de pertenecer o no a un grupo específico dentro de la población
2da Parte: Errores y Cálculo del tamaño de la muestra
6/4
/20
15
Errores, Errores, ERRORES
Aleatorio
Muestral
Sistemático
V = v± e
ValorVerdadero en la población
ValorMedido en la muestra
ERROR
Error Aleatorio
El error aleatorio no se suele ajustar a ninguna regla o norma , varían en cada caso , en su sentido y magnitud, y por ello tiende a anularse cuando se trata de un número elevado de casos. • Los errores aleatorios se comenten, por ejemplo, cuando
un encuestado elige erróneamente una casilla queriendo hacerlo en otra, cuando un encuestador marca erróneamente un dato, etc.
Errores Sistemáticos
• Un error sistemático es aquel que se produce de igual modo ( sentido y proporción) en todas las mediciones que se realizan sobre un parámetro de la muestra
• Contrario al error aleatorio, NO se anula en muestras grandes.
Errores Sistemáticos. Ejemplos
Las tendencias subjetivas conscientes o inconscientes del investigador.
Sustituciones, según criterio propio del investigador, de unidades de la muestra que habían sido elegidas al azar.
Insuficiente observación del conjunto de la población que influye en una deficiente definición de sus características.
Error Muestral
• Cuando se extrae una muestra de una población es frecuente que los resultados obtenidos de la muestra no sean exactamente los valores reales de la población.
• El error de muestreo ocurre al estudiar una muestra en lugar de la población total.
• La diferencia entre el valor del parámetro de una población y el obtenido de una muestra recibe el nombre de error muestral. ( y que no puede ser asociado a otro tipo
de explicación, es decir no es error aleatorio o sistemático)
Error Muestral
Por muy perfecta que sea la muestra siempre habrá grado de divergencia entre los parámetros estimados usándola y los de la verdadera población.
En el cálculo del error intervienen:Tamaño de la muestra
Varianza poblacional
Nivel de confianza
Tipo de muestreo
Estimación del Error
• Cuando variable bajo estudio es una media. (solo válido para variables numéricas)
Donde:Z: grado de confianza de la estimacións: desviación típica muestral de la variable analizadan: tamaño de la muestra1-f: Factor de corrección para poblaciones finitas. f= n/N
fze 1n
s
El error muestral es mayor en la medida que:
• Crece el grado de confianza que el investigador quiere dar a su estimación del parámetro medido mediante la muestra
• Es más elevada sea la variabilidad de la variable estudiada.
• Es menor el tamaño de la muestra.
Estimación del Error
• Cuando la variable bajo estudio es una proporción(ej, variables nominales u ordinales con pocascategorías)
Donde:Z: grado de confianza de la estimaciónp: proporción de la muestra para la categoría a examinarq: 1-pn: tamaño de la muestra1-f: Factor de corrección para poblaciones finitas. f= n/N
fn
pqze
1
1
Tamaño de la muestra vs. Error muestral
Margen de confianza en la estimación
• Expresa el grado de probabilidad que el investigador tiene en que su estimación se ajuste a la realidad.
• Los valores comúnmente utilizados son 95, 99, 99,9%
Correcciones para poblaciones finitas • Cuando el tamaño de la muestra es mayor del 5
% del tamaño de la población se debe utilizar el factor de corrección.
• Si por el contrario N>>n, f tiene a 0 y el factor de corrección ( 1-f) tienen a 1.
Margen de error admisible
Los incrementos en el tamaño de la muestra repercuten en una mayor precisión y por consiguiente en menor error muestral.
El error muestral interviene en el cálculo del tamaño de la muestra solo si el diseño es probabilístico.
En el muestreo probabilístico el investigador fija el error máximo admisible a priori y sobre esa base realiza el cálculo del tamaño de la muestra.
Cálculo del Tamaño de la Muestra *
2
e
zsn
2
2
1e
pqznn
Para comparaciones de mediaPara estimación de proporciones
* Para poblaciones infinitas (donde N>> n )
Por lo tanto el tamaño de la muestra
Es directamente proporcional al
nivel de confianza Z.
Es directamente proporcional a la variabilidad
del fenómeno a estudiar.
Es inversamente proporcional al error estimado.
EJEMPLO DEL CÁLCULO DEL TAMAÑO DE LA MUESTRA (POBLACIÓN INFINITA)• Estimando qué proporción de sujetos poseen una característica al nivel de confianza del 99.7% (Z=3) y
un error de admitido del 2%, será:
EL TAMAÑO DE LA POBLACIÓN NO FUE TOMADO EN CUENTA!!!
POR QUÉ P y Q valen 50 % ?
56252
505032
2
xx
n
Cálculo del Tamaño de la Muestra para poblaciones finitas. (f=n/N>0,05)
Ej. El número óptimo para un estudio de 60.000 personas estableciendo un nivel de confianza de 95.5%(z=2), y el margen de error en el 3%, sería
4 * 50 * 50 * 60.000
n = ---------------------------------
9 (60.000-1) + 4 * 50 * 50
n= 1091
pqZNe
pqNZn
22
2
)1(
Tamaño de la Muestra
Fuente: Metodología y Técnicas de Investigación Social. Piergiorgio Corbetta
3ra Parte
TIPOS DE MUESTREO
Recordando: Tipos de Muestreos
PROBABILÍSTICOS NO PROBABILISTICOS
•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral
•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos
Algunos tipos de muestreo Probabilístico
Simple Sistemático EstratificadoPor
Conglomerados
Muestreos Probabilísticos: Simple
Se realiza utilizando alguna fuente de elección aleatoria.
Supone que cada miembro de la población tiene elemento que lo identifica ( ej. Un número identificador) y mediante el cual puede ser elegido si “sale” sorteado.
La afirmación anterior implica que hay que tener un listado completo de TODOS los miembros de la población
Muestreos Probabilísticos: Simple
VentajasFacilidad en los cálculos estadísticos
Elevada probabilidad de lograr “equivalencia” entre las características de la muestra y las correspondientes a la población
DesventajasCada que cada miembro de la población tiene que ser identificado
Complicado en poblaciones grandes
Alto costo
Muestreos Probabilísticos: Muestreo Aleatorio Sistemático Similar al muestro simple salvo que:
1. Solo la primera unidad de la muestra se elige al azar siempre que el número seleccionado sea mayor que el coeficiente de elevación.
Coeficiente de Elevación = N/ n Donde
N: Tamaño de la población
n : Tamaño de la muestra
2. Los restantes elementos de la muestra se hayan sumando, sucesivamente el coeficiente de elevación.
Muestreos Probabilísticos: Muestreo Aleatorio Estratificado
• Presupone el conocimiento de las características de las unidades que forman la población para poder dividirla en grupos ( estratos)
• Se eligen los miembros de la muestra en cada estratocreado siguiendo algún tipo de muestreo de los vistos anteriormente.
Muestreo Probabilístico por Estratos Escuelas
Escuela Primarias
Escuela 1
Profesores
Escuela 2
Profesores
Escuela Secundarias
Escuela 1
Profesores
Escuela 2
Profesores
Estrato Primario
Se seleccionan ALEATORIAMENTE ni profesores de cada una de las escuelas seleccionadas . Ej. 2 de la escuela primaria 1 y 2 de la escuela primaria 2.
Muestreos Probabilísticos: Muestreo Aleatorio Estratificado cont…
• El objetivo de este tipo de muestreo es garantizar la representatividad equitativa de los estratos ( que implica representación equitativa de las características de la población).
• Se logra si: Son máximas las diferencias entre los estratos
Son mínimas las diferencias entre los miembros de un mismo estrato.
Los criterios de división de la población en estratos se hallen relacionadas con los objetivos de la investigación.
Muestreos Probabilísticos: Muestreo Aleatorio Estratificado cont…
Los tamaños de cada estrato pueden ser:Los mismos ( Afiliación simple)
Proporcional al peso relativo ( tamaño) del estrato dentro de la población (Proporcional)
En función de la heterogeneidad de cada estrato ( Óptima)
Ejemplo: Muestro por Estratos
Ejemplo tomado del Maria Ángeles Cea
Ejemplo Muestro por Estratos. Afiliación Simple
3
2500estratosn
Ejemplo Muestro por Estratos. Afiliación Proporcional
400250016,0
975250039,0
1125250045,0
3
2
1
xn
xn
xn
estrato
estrato
estrato
Ejemplo de Muestreo por Estratos. Afiliación Óptima
33600210016
101400260039
85500190045
x
x
x
Paso 1 : Multiplicar el porcentaje de la población correspondiente al estrato por la varianza del estrato
Paso 2: Se suman todos los valores obtenidos en el paso 1 (85500+101400+33600=220500)
Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.
152,0220500/33600Pr
460,0220500/101400Pr
388,0220500/85500Pr
3
2
1
estrato
estrato
estrato
oporción
oporción
oporción
Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando su proporción por el tamaño de la muestra global ( 2500)
2500380,1150,970
3802500152,0
11502500460,0
9702500388,0
x
x
x
Ventajas y Desventajas del Muestreo Aleatorio Estratificado
1. No es necesario disponer de la lista de toda la población sino de las subpoblaciones de orden superior extraídas ( por ej. las escuelas primarias y secundarias)
2. Existe una considerable reducción de costos
• Puede ocurrir que los miembros de una unidad superior se parezcan, reduciendo la representatividad de otros en la muestra final.
Ventajas Desventajas
Muestreo Aleatorio por conglomerados
• La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado.
• A diferencia de un estrato, un conglomerado es una unidad de elementos que contienen representantes de toda la población
Ejemplo: Muestreo por Conglomerados
Escuelas
Escuelas Primarias
Escuela 1 Escuela 2
Escuelas Secundarias
Escuela 1 Escuela 2
Todos los profesores de las Escuelas 2 (Primaria) y 1 (Secundaria) son parte de la muestra
Ejemplos de Conglomerados
• Zona Geográfica
• Edificio
• Una institución
• …..
Ventajas del muestreo por conglomerados
• Es ventajoso, desde el punto de vista de costos, si se pueden agrupar los miembros de la población por conglomerados, en los cuales el criterio de agrupación no sea la variable que se estudia.
• No es preciso tener un listado de toda la población, sino de las unidades ( conglomerados) por los que se agruparán.
Desventajas
• El error es mayor que cuando se utilizan otras técnicas de muestreo.
Tipos de muestreos NO Probabilísticos
Por Cuotas“ Bola de
Nieve”
Estratégicos
Muestro por Cuotas
• La población debe ser dividida en estratos definidos por variables cuya distribución dentro de la población sea conocida.
• Se procede a calcular el tamaño de cada estrato siguiendo el mismo procedimiento que si fuese un muestreo probabilístico estratificado. ( proporcional)
Muestro por Cuotas
• A diferencia del M. Probabilístico Estratificado el entrevistador es libre para escoger a quienes forman parte de cada estrato. (CUOTA)
Muestreo por cuotas
• Resulta más económico que los muestreos probabilísticos .
• Fácil de ejecutar el trabajo de campo
• No precisa el listado de la población
Supone mayor error muestral que los diseños probabilísticos.
No existe un método válido para calcular el error.
Dificultas para el control del trabajo de campo.
Limitaciones en la representatividad de la muestra para las características no especificadas en los controles de cuotas.
Ventajas Desventajas
Muestreo de Bola de Nieve
• Este modelo es particularmente útil cuando se muestrean poblaciones cuyos componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su identidad.
• A partir de unos pocos individuos el entrevistador, con ayuda de los primeros, va “ conociendo” a nuevos miembros de la muestra.
Muestreo Bola de Nieve
• El riesgo fundamental está asociado a la selección inadecuada de los primeros miembros de la muestra y de quienes dependerá el resto.
• También es posible que ocurran distorsiones si no se tiene en cuenta criterios muy específicos para la selección de la muestra.
Parte 4
Problemas del muestreo en la Investigación Social
Errores de cobertura
• ¿ Como se puede hacer un muestreo probabilístico si las unidades no son conocidas?
• ¿Cómo localizar a todos los posibles miembros de la población?
• Si se busca investigar sobre franjas particulares de la población el problema se hace más difícil de manejar
Error de Cobertura
• Se produce cuando no son incluidos determinados elementos de la población objeto de estudio en el proceso de selección muestral .
• La falta de cobertura impide la cooperación de un número de unidades muestrales, puesto que determinados individuos no pueden ser seleccionados en la muestra, dificultando con ello la capacidad de inferencia de los hallazgos de la investigación.
Error de Cobertura
• Este error produce una subestimación en los resultados, cuya amplitud depende de las características de las unidades omitidas
Problemas de Representatividad
Si no se ha logrado representatividad en una o varias variables, el investigador tiene 3 opciones:
a) Trabajar con la muestra no representativa y contar con ese límite
b) Redefinir la población. Por ejemplo: no hablar de enfermos de SIDA sino de enfermos de SIDA que son atendidos en el Hospital
c) Modificar deliberadamente la muestra para que represente el comportamiento de la variable bajo estudio.
Error de No Respuesta
Pérdidas por no
respuesta
Falta de contacto directo
Deseo explícito de
no responder
No respuesta por no
entender
Tipos de Error de no respuesta
Parcial
Total
6/4
/20
15
70
Ejemplos de errores de no respuesta
• El entrevistado puede no contestar una pregunta por falta de conocimiento sobre esa cuestión, por considerarla muy entrometida al invadir el ámbito de su privacidad, porque la considera irrelevante para los objetivos del estudio, etc.
• El entrevistador también contribuye a la no respuesta parcial por el “olvido” a la hora de recoger determinadas respuestas, o al tomarlas equivocadamente.
Ejemplos tomados de : HEADY, P. (1995). «Calibrating Measurement Error in the 1991 Census». Survey
Methods Centre Newsletter, vol. 15, nº 2, p. 3-7.
Ejemplos de errores de no respuesta• Por último, el cuestionario genera no respuestas
por problemas en la redacción de las preguntas, y por la utilización de preguntas «filtro» para que un grupo de preguntas no sean respondidas por determinados entrevistados que cumplen (o no cumplen) una serie de requisitos.
Consecuencias tiene la no respuesta
• Al reducirse el tamaño de la muestra aumenta el error.
Error
• Si el fenómeno está concentrado en sectores específicos de la población la muestra puede sesgarse.
Sesgo
Métodos de reducción del impacto de la no respuesta
Prevención
( durante la recolección de datos )
Intervención (luego de la recolección
de los datos )
Ponderación
Post-estratificación
Conocimiento de los que no
responden
Fin