47
DISEÑO DE MUESTREO Los estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan fundamentalmente utilizando técnicas de muestreo. Esto significa que a través del estudio de un pequeño grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables de interés de un grupo de mayor tamaño (universo 6 ), para después inferir sobre el comportamiento de esas variables en el universo. Esto es así porque hacer estos estudios en todo el universo, con excepción de aquéllos muy pequeños, tiene altos costos. 6 El "universo" también es llamado "población' en estadística. 3.1 Universo El universo debe ser definido desde los objetivos del estudio y puede serlo en términos geográficos (una localidad, un municipio, un distrito, una provincia, un país o cualquier otra categoría intermedia) o en términos sectoriales (la población urbana, las industrias de cerámica, los productores de leña). También se debe dar límites temporales a la definición del universo, porque su composición y características pueden cambiar con el correr del tiempo. Se recomienda que el universo tenga límites espaciales coincidentes con las agrupaciones estándares, de uso común, u oficiales de cada país (políticas, administrativas, naturales, etc.), para que sea posible estimar sus dimensiones a partir de bases de información ya existentes. El universo se define en forma preliminar al inicio del diseño metodológico de un estudio, para después precisarlo al conocer su tamaño y distribución espacial y temporal, a través de la revisión de informaciones existentes. La redefinición del universo puede significar ampliarlo o reducirlo. El primer caso puede ocurrir cuando se reconoce que existe un área con uso importante de dendrocombustibles o donde hay oferta real o potencial de ellos. La eliminación de áreas del universo puede deberse, por una parte, a que sea tal la carencia de información sobre la demanda o la oferta, que su incorporación al estudio lleve a un error mayor que su eliminación; y por otra, a que se reconozca que alguna localidad o área no forman parte del universo por no contar con usuarios de importancia. 3.2 Marco muestral

DISEÑO DE MUESTREO

Embed Size (px)

Citation preview

Page 1: DISEÑO DE MUESTREO

DISEÑO DE MUESTREO

Los estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan fundamentalmente utilizando técnicas de muestreo. Esto significa que a través del estudio de un pequeño grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables de interés de un grupo de mayor tamaño (universo6), para después inferir sobre el comportamiento de esas variables en el universo. Esto es así porque hacer estos estudios en todo el universo, con excepción de aquéllos muy pequeños, tiene altos costos.

6 El "universo" también es llamado "población' en estadística.

3.1 Universo

El universo debe ser definido desde los objetivos del estudio y puede serlo en términos geográficos (una localidad, un municipio, un distrito, una provincia, un país o cualquier otra categoría intermedia) o en términos sectoriales (la población urbana, las industrias de cerámica, los productores de leña). También se debe dar límites temporales a la definición del universo, porque su composición y características pueden cambiar con el correr del tiempo. Se recomienda que el universo tenga límites espaciales coincidentes con las agrupaciones estándares, de uso común, u oficiales de cada país (políticas, administrativas, naturales, etc.), para que sea posible estimar sus dimensiones a partir de bases de información ya existentes.

El universo se define en forma preliminar al inicio del diseño metodológico de un estudio, para después precisarlo al conocer su tamaño y distribución espacial y temporal, a través de la revisión de informaciones existentes. La redefinición del universo puede significar ampliarlo o reducirlo. El primer caso puede ocurrir cuando se reconoce que existe un área con uso importante de dendrocombustibles o donde hay oferta real o potencial de ellos. La eliminación de áreas del universo puede deberse, por una parte, a que sea tal la carencia de información sobre la demanda o la oferta, que su incorporación al estudio lleve a un error mayor que su eliminación; y por otra, a que se reconozca que alguna localidad o área no forman parte del universo por no contar con usuarios de importancia.

3.2 Marco muestral

Una vez definido el universo, se debe recabar información, lo más exacta posible, de sus dimensiones y distribución espacial y temporal, para con ello poder construir el marco muestral, que es la base para hacer el diseño de muestreo. El marco muestral es la información que ubica y dimensiona al universo y puede consistir de censos de vivienda y mapas agrupados por localidades, barrios, repartos, etc.; mapas de cobertura forestal con agrupamientos por tipos de vegetación o usos del suelo; listados de viviendas en localidades pequeñas, etc. La construcción del marco muestral se detalla en los apartados referentes a las variables generales de la demanda, oferta y abastecimiento (Capítulo 2).

3.3 Unidad de muestreo

Un concepto básico en la teoría del muestreo, que debe definirse claramente para construir el marco muestral, es la unidad de muestreo, que es la unidad mínima de observación de la que se obtendrá información de las variables útiles. Por convención estadística, se usará "N" para referirnos al número de unidades de muestreo que integran el Universo y "n" para el número de unidades de muestreo en la muestra. Para cada sector la unidad de muestreo más conveniente se

Page 2: DISEÑO DE MUESTREO

indica en la Tabla 3.1. Otras unidades de muestreo pueden ser definidas de acuerdo a los objetivos de los estudios.

Tabla 3.1 Unidad de muestreo según el grupo temático y sector o ramo de estudio.

Grupo Sector o ramo Unidad de muestreo

Demanda

Residencial

- urbana

- rural

Vivienda

Industrial

EstablecimientoComercial

Institucional

OfertaDirecta Parcela

Indirecta Establecimiento

Abastecimiento

ProductoresProductores individuales, empresas

Transportistas

Comercializadores

Después de haber definido el universo y la unidad muestral, y de contar con un marco muestral, el diseño del muestreo consiste de dos grandes etapas: definición del tipo de muestreo y determinación del tamaño de muestra.

3.4 Tipos de muestreo

Existen diferentes tipos de muestreo, pero todos se basan en el principio de aleatoriedad. Para poder hacer inferencias válidas de lo que ocurre en un universo a partir de una muestra es necesario que ésta sea representativa de él, lo cual se logra con laaleatoriedad y con un tamaño suficiente de la muestra.

La base de la inferencia estadística es la aleatoriedad. Esto significa que todos los elementos del universo tengan la misma oportunidad de ser elegidos para componer la muestra. Si no se los eligiera aleatoriamente se corre el grave riesgo de tener resultados NO representativos de toda la población, sino de un sector de ella. A esto se le llama sesgo. Un ejemplo de sesgo por elección NO aleatoria en un inventario de recursos leñeros, es elegir las parcelas cercanas a las vías de acceso. Por esa condición, es muy probable que sean las más explotadas y que tengan menores existencias de madera. Así, hacer la extrapolación al Universo de los resultados de esta muestra NO aleatoria, llevaría a una subestimación de las existencias.

El tamaño de la muestra es dependiente de la variabilidad del fenómeno a estudiar, del nivel de confianza fijado y del error admisible. Un error muy común es la afirmación de que, para que una muestra sea representativa de un Universo, debe ser de un tamaño directamente proporcional a su tamaño, es decir, que a mayor tamaño de¡ Universo debería ser mayor el tamaño de la muestra. Adelante se detallará la forma de obtener el tamaño de muestra.

3.4.1 Muestreo aleatorio simple

Consiste en elegir en forma aleatoria "n" unidades muestrales (UM) del universo. El proceso debe otorgar la misma oportunidad de selección a todas las UM en una sola ocasión.

Page 3: DISEÑO DE MUESTREO

Se asigna un número a cada UM y se selecciona la muestra aleatoriamente con ayuda de tablas de números aleatorios, calculadoras, sorteo, etc. Esta técnica solo puede ser aplicada cuando se dispone de un marco muestral completo, que incluya a todas las UM, y éstas puedan ser reconocidas e identificadas sin dificultad en el terreno. Por ejemplo, un listado telefónico, o una lista de domicilios con identificación de calle y número, o nombre del ocupante de la vivienda. En el caso de muestreo de recursos naturales, suele ser difícil identificar o localizar exactamente a las parcelas sorteadas, ya que se necesita un mapa detallado e instrumentos de localización geográfica de precisión adecuada.

Cuándo se debe usar el muestreo aleatorio simple:

Cuando se sabe que la variable de mayor interés se distribuye aleatoriamente en el universo.

Para universos pequeños (no más de 200 UMs). Para universos de poca dispersión geográfica. Cuando no se conoce el patrón de distribución para la variable de interés.

Muestreo aleatorio simpleUniverso- 70 ladrilleras en una ciudad- Todas son pequeñas, con producción entre 30 mil y 60 mil ladrillos por añoMarco Muestral- Listado de establecimientos de la Oficina Municipal TributariaUnidad Muestral- EstablecimientoSelección aleatoria- Se numeran los establecimientos y por medio de un sorteo o usando números aleatorios se eligen "n" establecimientos para entrevistar

3.4.2 Muestreo aleatorio estratificado

Este tipo de muestreo se utiliza cuando el universo original, de tamaño N, es fragmentado en estratos relativamente homogéneos en cuanto a la variable de interés. Esto es aconsejable siempre que la variación entre estratos sea mayor que la interna de cada estrato.

A cada uno de estos estratos se les trata independientemente como un universo, en cuanto al método de selección de las UM y de estimación de parámetros. Al interior de cada estrato, las UM se pueden seleccionar en forma aleatoria, por conglomerados o sistemáticamente.

El muestreo estratificado permite mejorar la precisión de las estimaciones con menor esfuerzo de muestreo, caracterizar a cada estrato por separado y facilitar la coordinación del trabajo de campo.

Es muy importante considerar que las unidades de muestreo deben pertenecer a un solo estrato, que los estratos deben ser reconocibles más allá de¡ grupo que hizo el estudio y que debe conocerse el tamaño del estrato. No es recomendable formar muchos estratos, pues se complicaría innecesariamente el estudio a campo y el análisis de datos.

Para tomar la decisión de hacer un muestreo estratificado existen criterios generales. En el grupo de demanda de dendrocombustibles, la

saturación y el consumo son las variables que en primera instancia deben definir la pertinencia de estratificar. En el grupo de oferta directa la estratificación se hace por tipo de fuente, clase de

Page 4: DISEÑO DE MUESTREO

cobertura o de uso de¡ suelo. Para el grupo de oferta indirecta, y abastecedores, productores, transportistas y comercializadores) se usa el volumen de producción o comercialización. Como se trata de variables que se deben conocer antes de hacer el estudio, es posible obtener datos de ellas por fuentes secundarias o por variables indicadoras, lo cual se detalla en el Capítulo 2.

¿Cuándo se debe usar el muestreo estratificado?

Se usa principalmente en poblaciones donde se supone o se conoce que la distribución de la(s) variable(s) de mayor interés es diferente entre subpoblaciones fácilmente identificables.

Por su baja eficiencia del muestreo, NO se recomienda aplicarlo en universos pequeños, con menos de 200 UM y variables de distribución normal.

Muestreo aleatorio estratificadoUniverso- 15 500 ha de tierra donde se produce leña en diferentes Usos del SueloEstratos- Potreros (3 000 ha)- Cercos vivos (4 000 ha)- Bosque natural (3 000 ha)- Vegetación secundaria (5 500 ha de manigua, acahual o capuera)Marco muestral- Mapa de uso del suelo a escala1:20 000Unidad muestral- Parcela (de tamaño específico para cada uso del suelo)Selección aleatoria- Elección de "n" parcelas al azar dentro de cada estrato (uso del suelo)

3.4.3 Muestreo por conglomerados

Un conglomerado es un conjunto espacialmente compacto de UM.

Los conglomerados se seleccionan aleatoriamente y dentro de cada uno se estudian todas sus UM o se hace un muestreo de ellos.

¿Cuándo se debe usar el muestreo por conglomerados?

- Se aplica cuando existe alta dificultad para llegar a todas las UM del universo debido a una gran dispersión espacial o a tener barreras físicas de acceso.

Muestreo por conglomeradosUniverso- Localidad con 650 viviendas distribuidas dispersamente en un área grande y con un trazado regular de calles.Conglomerados- Manzanas (cuadras)Marco muestral- Número total de viviendas en la localidad- Croquis de la localidad con el trazado actualizado de calles y una estimación promedio del número de viviendas por manzana

Page 5: DISEÑO DE MUESTREO

Unidad muestral- ViviendasSelección aleatoria- Se numeran las "manzanas" y se eligen al azar. En cada una de ellas se visita a todas las viviendas

3.4.4 Selección sistemática

Este no es propiamente un tipo de muestreo y es conveniente considerarlo como un esquema de selección regular de muestra.

La selección de la primera UM es aleatoria y las siguientes se eligen con un intervalo regular de UM, distancias o tiempo. Su limitación teórica consiste en que sólo el primer número se selecciona al azar, y los restantes no tienen la misma probabilidad de ser incluidos en la muestra. Su ventaja reside en que facilita la localización de UM en lugares donde hay dificultad de acceso y en que permite visitar UM que no se encuentren definidas en el marco muestral.

¿Cuándo se debe usar la selección sistemática?

Cuando no hay posibilidad de identificar en el marco muestral a cada una de las UM. Por ejemplo, en ciudades grandes donde no se tienen listados de viviendas

Cuando se dificulta el acceso a las UM, por distancias, falta de caminos o en terrenos abruptos. Por ejemplo, en un inventario forestal.

Combinación de tipos de muestreo

En un mismo estudio o diagnóstico, es posible combinar diferentes tipos de muestreo, según sean las características de los sectores o ramos considerados y el grado de compromiso aceptado entre la precisión y el costo de ejecución del estudio. Por ejemplo, en el sector residencial puede optarse por un muestreo estratificado bietápico con conglomerados, en tanto que para un ramo industrial pequeño, homogéneo y compacto se elija un aleatorio simple.

Selección sistemáticaUniverso- Ciudad con 3 000 viviendas distribuidas espacialmente en forma compactaMarco Muestral- Croquis de las calles de la ciudad- Número total de viviendas (actualizado)Unidad Muestral- ViviendaSelección sistemática- Se determina el intervalo de visita a las viviendas dividiendo el número total de viviendas por el número de viviendas a muestrear.- La primera vivienda se elige al azar y las restantes se visitan de acuerdo al intervalo calculado

3.5 Tamaño de la muestra

El tamaño de la muestra debe definirse independientemente para cada universo, en función de tres factores: la variabilidad de la variable numérica más importante, el nivel de confianza fijado y el nivel de error aceptable. Esto se resume en la siguiente fórmula7:

no = (s2 . t2 a ? )/ e2 (1) en términos de varianza y error absoluto

Page 6: DISEÑO DE MUESTREO

ó

no = (cvz . t2 a ? )/ e2 en términos de cv y error relativo

donde:no = tamaño de la muestras2 = varianza de la muestrat2 

a ? = valor crítico de la distribución t de Student, con un nivel de significanciaa y? grados de libertad

e = error aceptablecv = coeficiente de variación = desviación estándar de la muestra/ media

muestraln = grados de libertad = n - 1

La varianza ( s 2 )  o el coeficiente de variación (cv) indican el grado de heterogeneidad u homogeneidad de la variable de interés en la muestra y se los calcula -manualmente, con calculadora o con Excel- con los datos de una muestra preliminar o de algún estudio previo.

El error aceptable ( e )  se refiere a la diferencia que se permite entre la media de la muestra y la media del universo. Se fija de acuerdo al conocimiento previo que se tiene del fenómeno y es aconsejable que se encuentre entre el 10% y el 20%, lo cual puede expresarse también en valores absolutos con las unidades de medición de la variable en cuestión.

El valor crítico de   t  se obtiene de tablas en libros de estadística de Excel, definiéndose primero el nivel de significancia (a) o su complemento, el nivel de confianza (1-a). Para este tipo de estudios es suficiente con un nivel de confianza de 0.95, que equivale a a = 0.05(2). Además, se debe fijar preliminarmente un número de casos de la muestra (n) para definir los grados de libertad (? = n-1). Estos dos valores son los datos de entrada de las tablas de t. Posteriormente, por medio de un proceso iterativo, en donde el valor de n obtenido con la Fórmula 1 se utiliza para encontrar el valor de t, se precisa el tamaño de la muestra.

En esta fórmula se aprecia que el número de elementos que componen la muestra es directamente proporcional a la varianza y al valor de t cuadrado, e inversamente proporcional al cuadrado del error. El tamaño de muestra será grande cuando: a) el fenómeno en estudio sea muy variable (varianza o coeficiente de variación alto); b) el nivel de confianza fijado sea alto; y/o c) el error aceptable sea bajo. En cambio, el tamaño de la muestra será pequeño si encontramos un fenómeno poco variable, fijamos una confianza baja y se acepta un error alto.

Con ello queda demostrado que el tamaño de una muestra NO depende del tamaño del universo. Así, por ejemplo, partiendo de iguales niveles de confianza y error aceptado, en un bosque tropical húmedo con la misma superficie que un bosque templado de pino, el tamaño de muestra será mayor en el primero porque es sabido que tiene más heterogeneidad en la variable existencia de madera que el bosque de pino.

Hasta ahora no se ha considerado el tamaño del universo para determinar el tamaño de muestra. Sin embargo, para universos pequeños, menores a 120 U.M., es necesario corregir el valor de no obtenido de la Fórmula 1, a través del uso de la Fórmula8:

n = no/(1 +( no -1/N)                              (2)

donde:

no = tamaño de muestra obtenido en la fórmula anterior

Page 7: DISEÑO DE MUESTREO

N = tamaño del universo

n = tamaño definitivo de muestra

En el Anexo III se muestra una tabla con el cálculo del tamaño de muestra en el sector residencial, corregido por población finita, para la variable consumo específico de leña, que por un gran número de estudios de caso se conoce su coeficiente de variación.

Variables para calcular el tamaño de muestra

- Para la definición del tamaño de muestra de cualquier sector o ramo de demanda de   dendrocombustibles, se recomienda utilizar la variable consumo unitario.

- En los sectores industrial, comercio e institucionalno siempre es posible tener datos sobre consumo unitario, por lo que puede usarse el volumen de producción por unidad de tiempo, que está muy correlacionado con el consumo unitario.

- Para la oferta directa (bosques, plantaciones, etc.), las variables relevantes pueden ser la existencia o la productividad, pero se recomienda el uso de la primera por haber más información secundaria y ser más fácil de medir en un muestreo preliminar. Si no hay datos sobre existencias, puede utilizarse el área basa¡ (G).

- En los sectores o ramos de oferta indirecta(aserraderos, carpinterías, etc.) se debe usar el volumen   de producción por unidad de tiempo.

- En los sectores de abastecimiento, con los productores es conveniente usar el volumen de producción de dendrocombustibles, con los comercializadores el volumen de venta y con los transportistas la capacidad de transporte, todas expresadas por unidad de tiempo.

La decisión final sobre el tamaño de muestra dependerá del compromiso entre la precisión esperada en la estimación y la disponibilidad de recursos (monetarios, humanos y tiempo) para ejecutar el estudio a campo. Se recomienda que los sectores o ramos con mayor importancia en demanda, oferta y abastecimiento de dendrocombustibles se privilegien en la asignación de recursos para el estudio a campo, para lograr en ellos mayor precisión en la estimación. En aquellas situaciones en que no sea posible cubrir el tamaño de muestra derivado del cálculo estadístico, es forzoso estudiar un mínimo de 10 unidades de muestreo por sector, ramo o estrato, reportando en el informe del diagnóstico el error de estimación, despejando e de la Fórmula1.

7Fórmula usada para determinar el tamaño de muestra necesario para estimar la media poblacional, pues en pruebas de hipótesis para diferencias entre medias y varianzas existen otras fórmulas. Se recomienda tener como apoyo algunos libros de estadística, como Zar 1999; Cochran 1977; y Steel y Torrie 1988.

8 Llamada "corrección por población finita".

Page 8: DISEÑO DE MUESTREO

EJECUCIÓN DEL ESTUDIO

4.1 Diseño del estudio

El diseño del estudio lleva varias etapas. Éstas se han mencionado y tratado con mayor detalle en la Introducción y en los Capítulos precedentes, pero nuevamente las indicamos, profundizando en los puntos referentes al levantamiento de datos en campo, su procesamiento y análisis, y la redacción del informe final:

a) La primera etapa es la definición de los objetivos del estudio, que deben ser claros, concisos, alcanzables y contemplar las necesidades de todos los grupos de interesados. En los objetivos debe precisarse también el ámbito del estudio, tanto geográfico como sectorial. Conforme el estudio se desarrolla y sobre todo, cuando se hace la revisión de antecedentes, los objetivos pueden ser modificados.

b) Posteriormente se debe hacer una buena revisión de antecedentes. La información obtenida de esta revisión servirá para precisar los objetivos, decidir el nivel de aproximación del estudio (estudios rápidos o detallados), elegir las variables a analizar y las técnicas de obtención y procesamiento de datos.

c) De acuerdo a los objetivos, los recursos monetarios, humanos y tiempo disponibles, y de la calidad de los antecedentes en el tema, se elegirá el nivel de aproximación del estudio: rápido o detallado.

d) Con base en los objetivos, se debe hacer la selección de las variables a analizar (Capítulo 2).

e) Si se opta por un estudio detallado, será necesario hacer el diseño del muestreo, para lo cual es preciso contar con una muy buena base de información como marco muestra¡ (Capítulo 3).

4.2 Levantamiento de datos

En este punto ya es posible hacer el diseño del levantamiento de datos en campo y se prepara la lista de ejecución de actividades que deben considerar los siguientes aspectos:

construcción de los instrumentos de registro de datos; planeamiento de las rutas de levantamiento de datos y programación del

trabajo en campo; capacitación del personal en levantamiento de datos en campo y

procesamiento de información; integración de los equipos o brigadas de levantamiento de datos y asignación de

responsabilidades; recomendaciones generales para el manejo de la información.

4.2.1 Construcción de los instrumentos de registro de datos:

Page 9: DISEÑO DE MUESTREO

Para estudios rápidos las herramientas más comunes son la entrevista estructurada y no estructurada a informantes calificados, el diagnóstico rápido participativo y el regístro de informaciones secundarias y primarias.

En estudios detallados se utiliza la entrevista estructurada y planillas registro de datos de informaciones

primarias.

_ Entrevista no estructurada. Son aquéllas en las que se tiene un idea general de los temas de interés y que no lleva una secuencia preestablecida. Se usan cuando el entrevistado es una persona de alta jerarquía o que tiene desconfianza para brindar la información. Sirven para tener una visión preliminar del tema.

_ Entrevista estructurada. Éstas entrevistas utilizan cuestionarios. Se usan para la obtención de datos de demanda, abastecimiento y en algunos casos de oferta indirecta. Los cuestionarios pueden ser muy sencillos, a manera de "guía de preguntas", cuando no se quiere tener una entrevista muy formal, como es el caso de entrevistas a comerciantes de dendrocombustibles o a industrias usuarias. Los cuestionarios más elaborados se usan en encuestas y censos donde el número de casos es grande (mayor a 30) o cuando hay más de tres encuestadores. En el Anexo IV, se muestran algunos ejemplos de cuestionarios.

Algunas recomendaciones para el diseño de cuestionarios son:

El tipo y número de preguntas que contenga dependerá de las variables a analizar. No se debe incorporar preguntas que no tengan relación directa. Se recomienda que sea breve, usando vocabulario sencillo y con una secuencia de preguntas de acuerdo a la lógica del entrevistado.

En lo posible, las preguntas deben ser de respuesta cerrada, pues su procesamiento es más sencillo. Las preguntas abiertas son muy útiles para detectar opiniones, percepciones y preferencias; para estas variables no se recomiendan las preguntas de respuesta cerrada.

Para formular el cuestionario definitivo es necesario probar uno preliminar con una pequeña muestra de la población destino, pues con ello se logra reconocer la variabilidad de respuestas posibles o situaciones no consideradas originalmente.

Cuando se trabaje con muestras muy grandes y con preguntas complejas, es conveniente que las preguntas tengan instrucciones precisas de aplicación que queden resaltadas en el cuestionario.

_ Planillas de registro de datos. Sirven para registrar informaciones primarias y secundarias, tales como tamaños de población, diámetros, alturas y especies de árboles en parcelas de inventarios forestales, unidades locales, pesos específicos de madera, poder calorífico de combustibles, etc. Es muy importante que contengan todas las variables a registrar. Para asegurarse que las planillas sean completas, es necesario que se cotejen las variables asentadas en ellas con las planteadas en los objetivos del estudio. También es conveniente que se prueben en campo antes de considerarlas definitivas. En el Anexo V se muestran algunos tipos de planillas de registro de datos.

_ Diaqnósticos rápidos participativos. Consiste en la obtención de informaciones cualitativas con la participación colectiva de los sectores de usuarios, productores o comercializadores. Su utilidad es que brinda una visión rápida de conjunto sobre el tema de interés. Debe utilizarse solamente cuando se tengan vínculos muy estrechos con los participantes y exista la posibilidad de responder a sus expectativas, ya que éstas se presentan muy comúnmente en este tipo de ejercicios colectivos. Existen técnicas específicas que se pueden encontrar en publicaciones especializadas (ver McCraken, J. et.al., 1988; CIDE-WRI et.al., 1990; WRI-GEA, 1993).

Page 10: DISEÑO DE MUESTREO

4.2.2 Planeamiento de las rutas de levantamiento de datos y programación del trabaio en campo.

Siempre que sea posible es conveniente que el levantamiento de datos en campo se concentre en un periodo corto, pues de esta manera se logra mayor eficiencia de trabajo y calidad de datos. Un elemento de apoyo para la programación del levantamiento es un cronograma de actividades, que se basará en el total de trabajo a realizar, el rendimiento del equipo de trabajo y el tiempo dedicado a traslados.

Si en el estudio se incluyen análisis de la demanda, oferta y abastecimiento, o el área de trabajo es muy extensa, es conveniente localizar en un mapa todas las áreas de levantamiento de datos y programar rutas de trabajo donde coincidan diferentes sectores. De esta manera se puede obtener el mayor número de datos en cada viaje.

Antes de salir a campo es necesario contar con todos los materiales y equipos del levantamiento. Los cuestionarios deberán ser numerados antes de salir al campo, primero con una numeración consecutiva y única por sector, además de las indicaciones referentes al estrato, localidad y barrio.

4.2.3 Capacitación del personal en levantamiento de datos en campo y procesamiento de información.

Con esta actividad se espera que todas las personas que participen en el levantamiento de datos y el procesamiento conozcan con claridad los objetivos del estudio, el diseño de muestreo, las variables a analizar, las técnicas de obtención de datos y su procesamiento. Esto es de utilidad para que puedan resolver situaciones no previstas en el diseño, cuya aparición en campo o en el procesamiento de datos es muy común. Nótese que se habla tanto de levantamiento de datos como de su procesamiento, porque se espera que en ambas actividades participen las mismas personas, con la finalidad de garantizar mayor calidad de datos.

Durante la capacitación debe ponerse énfasis en el correcto uso de las técnicas de obtención de datos y particularmente en las referidas a la aplicación del cuestionario y las mediciones directas, como son consumo, contenido de humedad, medición de árboles y pesado de unidades locales.

Al término de la capacitación tiene que hacerse una prueba de homogeneidad de registro de datos, que consiste en comparar los resultados de aplicar un cuestionario y/o realizar las mediciones directas con los mismos usuarios (en entrevistas colectivas) o unidades de muestreo. Cuando las respuestas o mediciones sean iguales o semejantes entre los participantes,y el supervisor se puede considerar que la calidad de registro de datos es adecuada y confiable.

4.2.4 Integración de los equipos o brigadas de levantamiento de datos y asignación de responsabilidades

Al integrar las brigadas o equipos de trabajo en campo es muy importante que se definan las responsabilidades de cada integrante. Es necesario que cada equipo cuente con un supervisor. Este tendrá la responsabilidad de asegurar el cumplimiento de las actividades programadas, proveer los materiales necesarios, resolver situaciones no previstas en el diseño y revisar la calidad de las informaciones recabadas día a día. Cada uno de los demás miembros será responsable de tener siempre los materiales y equipos individuales de trabajo, recabar la información con calidad y apoyar al supervisor en la revisión del registro de datos.

Es fundamental que como parte del programa diario de trabajo se haga una sesión de revisión de la información. Para ello debe reunirse todo el equipo para entregar los cuestionarios y planillas de registro al supervisor y apoyarle en su revisión, de forma tal que todos los campos queden llenos y

Page 11: DISEÑO DE MUESTREO

se corrijan informaciones inconsistentes. Estas sesiones al final de cada día también sirven para intercambiar impresiones sobre el trabajo, con lo cual se pueden ajustar las actividades posteriores. Se desaconseja totalmente que las revisiones se hagan varios días después de levantada la información, pues con el paso del tiempo la memoria es menos confiable.

4.2.5 Recomendaciones generales para el manejo de la información

Para asegurar que la información obtenida en campo no se pierda, hay que seguir cuatro recomendaciones: a) los cuestionarios y planillas de registro que van a campo NUNCA deben ser impresas con impresora de chorro de tinta, pues con el agua se borran. Son adecuadas las fotocopias y las impresiones láser; b) siempre se debe escribir con lápiz de grafito, porque cualquier tinta se borra con el agua; c) cada encuestador debe guardar los cuestionarios y hojas de registro en bolsas de plástico cerradas herméticamente; y d) en cuanto sea posible, todas las planillas y registros de campo deben fotocopiarse y concentrarse en la oficina donde se hará el procesamiento.

El Inventario de recursos leñeros. El diseño y ejecución de esta actividad son más complejos que los levantamientos de demanda y abastecimiento. Por ello es que en el Anexo VI se presenta una guía rápida para resolver las tareas fundamentales de estas actividades.

4.3 Procesamiento y análisis de datos

Un vez terminado el levantamiento de datos en el campo debe iniciarse su procesamiento y análisis.

El ingreso de datos y su procesamiento debe hacerse inmediatamente después del levantamiento en campo, para evitar desligarse del tema. Se recomienda que las personas que hicieron el levantamiento de datos se encarguen también de su ingreso a la base digital. Esto es fundamental, porque al presentarse dudas sobre el significado de ciertas respuestas, los propios encuestadores-medidores podrán resolverlas.

4.3.1 Equipo y programas para el procesamiento de datos

Los datos se procesarán en computadora. Una computadora personal que cuente con Office de Microsoft es suficiente. La alternativa de diseñar una base de datos o un programa específicos se desaconseja: la ventaja de una mayor potencia de análisis que podría tener un programa especialmente diseñado no compensa las desventajas asociadas al costo y tiempo de su desarrollo, la subsiguiente dependencia del programador y la necesidad de entrenar a los usuarios. Un programa comercial como MS Excel es suficientemente potente, de difusión universal y conocido por muchísimas personas, evitando las desventajas antedichas.

Si es necesario capacitarse en el uso de Excel, se recomienda concentrarse en aprender cómo se introducen fórmulas, el uso de funciones, la ordenación de datos, el uso de filtros y la generación de tablas dinámicas y gráficos.

4.3.2 Construcción de la base e inqreso de datos

La base de datos se construye en hojas de cálculo de Excel.

En un "libro" de Excel se ingresará la información de un sector de usuarios, comercializadores o productores. La primera "hoja de cálculo" incluirá todos los datos primarios del sector, incluyendo a todos sus estratos. Esta hoja se llamará "Base". Las otras hojas que contendrá el libro serán: "campos calculados", "tablas dinámicas" y "gráficos".

Page 12: DISEÑO DE MUESTREO

En el caso de inventarios forestales, en cada hoja de cálculo pueden quedar los datos de cada estrato o incluso de cada parcela, si éstos son muchos. Para otro tipo de variables, como unidades locales o pesos específicos, las bases de datos se construirán de acuerdo a las necesidades y comodidad de los usuarios.

En la hoja de cálculo cada encabezado de columna será una variable o respuesta. En preguntas de respuesta múltiple, como es el caso de especies usadas como leña, forma de obtención de los combustibles, etc., se debe usar una columna para cada respuesta (ver ejemplo en recuadro).

Al ingresar los datos hay que asegurarse que se registre primero el número consecutivo del cuestionario, pues así se facilitan las posteriores. búsquedas de los datos originales. Se desaconseja totalmente el uso de códigos para ingresar las respuestas, ya que pueden no ser comprensibles para otros usuarios de la base o al paso del tiempo se puede olvidar su significado. El uso de Excel facilita el ingreso de respuestas completas que se repiten, pues tiene una memoria que pre-escribe la posible respuesta.

Para los análisis posteriores es muy importante que la sintaxis de las respuestas sea uniforme. Por ejemplo, si se ingresa como un mismo tipo de respuesta "Marabú", "marabú" y "marabu", Excel las considerará como respuestas diferentes

Ejemplo de base de datos de la encuesta al sector residencial

Número consecuti

vo

Provincia

Estrato

¿Con qué cocina alimentos o

hierve la ropa?

¿Cómo consigue la leña?

Periodicidad de

compra (días)

Cantidad que compr

a

Unidad

Local de

compra

Leña

Kerosene

GLP

Compra

Recolecta

Compra

recolecta

1San Juan

1 x x 15 2Paquet

e

2San Juan

1 x x x

3San Juan

2 x 30 1 20 kg

4San Juan

2 x 45 1 20 kg

5San Juan

2 x 60 1 30 kg

6San Juan

3 x 20 1 10 kg

7San Juan

3 x x x x 30 1Carga deburr

o

8San Juan

3 x x x 2 10 Rajas

Al término del ingreso de datos se debe hacer su validación para detectar errores en la digitación. Para pocos datos se puede hacer visualmente, poniendo mucho cuidado en las variables

Page 13: DISEÑO DE MUESTREO

numéricas. Cuando se manejen muchos datos se pueden hacer análisis exploratorios para detectar datos fuera de rango. En Excel es posible visualizar datos anómalos utilizando la función "ordenar". Algunos análisis útiles y disponibles en paquetes estadísticos sencillos son las distribuciones de frecuencia, diagramas de caja o diagramas de tallo y hoja. Al detectar datos fuera de rango se debe regresar a los cuestionarios o planillas de registro originales para identificar el carácter del error y decidir si es posible corregirlo.

Una vez que se tiene la seguridad de que los datos son correctos, se debe grabar la hoja de cálculo "Base" protegiendo el archivo contra escritura, para impedir su modificación involuntaria.

4.3.3 Procesamiento de datos

El procesamiento de datos involucra una serie de cálculos a partir de los datos obtenidos de fuentes secundarias o primarias. Con esta actividad se espera tener reportes de resultados presentados en forma sintética a diferentes escalas (unidad muestra¡, estratos y universo). Las etapas del procesamiento son el cálculo de campos y la generación de reportes de resultados primarios y secundarios.

4.3.4 Cálculo de campos

El cálculo de campos permite obtener un resultado a partir del procesamiento de los datos numéricos de cada unidad de muestreo.

En el caso de los datos de demanda, abastecimiento y oferta indirecta, obtenidos por cuestionario, el cálculo de campos se hará para cada unidad muestra¡ (familia, establecimiento de usuario, productor). Para la oferta directa (inventarios forestales) los cálculos se harán primero para cada uno los elementos de las unidades muestrales (árboles dentro de las parcelas) y posteriormente para cada parcela.

El cálculo de campos se debe hacer en una hoja del mismo libro, copiada de la hoja "Base" de datos original, sin omitir ninguna variable. El tener completa una hoja de cálculo con datos originales y calculados permitirá hacer los reportes de resultados utilizando diferentes variables. Para facilidad del manejo de los datos es aconsejable que los campos calculados estén la derecha de la última columna de variables y no intercalados entre ellas. Como los campos calculados del inventario forestal llevan dos etapas, los campos de "Parcelas" deberán integrarse en una nueva hoja resumen.

Los campos calculados más comunes, según sector, se presentan en el Anexo VII.

Page 14: DISEÑO DE MUESTREO

4.3.5 Reportes de resultados

Los reportes de resultados son un resumen de los datos de las unidades muestrales. Una herramienta muy útil para generarlos son las tablas dinámicas de Excel. Estos reportes deben siempre tenerse en formato impreso, además del digital, pues su manejo para análisis posteriores es más sencillo.

Los reportes de resultados originados en Cuestionarios de los sectores demanda, abastecimiento y oferta indirecta deben presentarse desagregados a diferentes escalas: subestratos, estrato y universo. Deben incluir:

para variables categóricas de respuesta cerrada: tablas de frecuencia absoluta y relativa;

para variables categóricas de respuesta abierta, un listado de las respuestas "crudas" con una agrupación por tipos de respuesta;

para todas las variables numéricas y campos calculados: promedio, desviación estándar, número de casos y error estándar. De algunas variables y campos calculados se pueden estimar estos mismos estadísticos, según algunas clases o grupos. Por ejemplo, promedio de consumo familiar diario de leña según tipo de usuario (exclusivo de leña o múltiple); diámetro de leños según especies; etc;

análisis estadísticos de comparación de algunas variables que en los primeros reportes de resultados indiquen que hay diferencias según algún grupo de usuarios, formas de adquisición, etc. Un ejemplo es la comparación de medias de consumos específicos de leña según dispositivos de combustión, que puede hacerse con un análisis de varianza o una "t" de Student;

para una mejor interpretación visual, las principales tablas de resultados pueden presentarse como gráficos en una hoja de cálculo aparte.

Los Reportes de resultados para oferta directa, en Inventarios de recursos leñeros son calculados para cada uno de los estratos de uso del suelo o tipo forestal, a partir de los resultados finales de

Page 15: DISEÑO DE MUESTREO

las parcelas medidas en cada estrato. Debe recordarse que cada parcela es una unidad muestra¡ y que el conjunto de las parcelas constituye la muestra del estrato.

Estos reportes deben incluir: promedio, desvío estándar, número de casos y error estándar, para los totales y por clases diámetricas, de las siguientes variables:

número de árboles; área basal (m2/ha); volumen cilíndrico (m3/ha); volumen real (m3/ha); biomasa leñosa en peso seco (t/ha); biomasa leñosa en unidades locales.

Una vez generados los reportes de resultados primarios para cada uno de los estratos o tipos de recurso, se los consolida en otro reporte, que es la Tabla de recursos leñeros. Este es el reporte principal, sinóptico, que dará una visión de conjunto sobre todos los recursos leñeros en términos absolutos y relativos. Las columnas que debe incluir esta tabla son:

1. tipo o clase de recurso;

2. superficie (ha);

3. área basa¡ media (m2/ha);

4. volumen real medio (m3/ha);

5. biomasa leñosa en peso seco (t/ha);

6. biomasa leñosa en unidades locales (UUha);

7. existencias brutas en volumen real, biomasa leñosa y unidades locales (son campos calculados a partir de 1 y 3, 4, 5, 6);

8. tasa de crecimiento anual (coeficiente ó %);

9. productividad bruta (m3/ha/año, t/ha/año, unidad local/ha/año);

10 coeficiente de disponibilidad (CD);

11. coeficiente de accesibilidad (CA);

12. existencias netas (m3, t, unidades locales) (= existencias brutas x CD x CA);

13. productividad neta (m3/año, t/año, unidades locales/año) (= productividad bruta x CD x CA).

Page 16: DISEÑO DE MUESTREO

En el Anexo IX se muestra un ejemplo de este tipo de tabla. En este caso la tabla es estática, porque muestra la situación en un año determinado. Pero también es posible organizarla como tabla de tendencias, si a la derecha del área para cada tipo de uso se agrega una columna con las respectivas tasas de cambio (estimadas o supuestas). Luego se puede introducir columnas adicionales para cada uno de los años o períodos futuros y mediante fórmulas sencillas (lineales para períodos cortos, exponenciales para los mas largos), calcular las existencias y disponibilidades futuras.

Después de que los datos se han procesado y analizado inicialmente, es posible hacer un análisis con mayor profundidad: el diagnóstico. El diagnóstico puede ser parcial o integral. En el Capítulo 5 se habla a detalle de ellos y de cómo formularlos.

4.4 Redacción del informe final

Una vez hecho el diagnóstico, se debe iniciar la redacción del informe final. Adelante se precisa sobre cómo hacerlo:

Los elementos que forzosamente incluirá un informe final de un estudio, son:

a) Resumen ejecutivo. El documento debe iniciar con un resumen del contenido para que el lector pueda tener una idea general de él. Los puntos que contendrá, en forma resumida, son: objetivos, resultados, conclusiones y recomendaciones.

b) Introducción. Se hablará del marco de ejecución del estudio (instituciones participantes), la relevancia del estudio y los antecedentes en el tema.

c) Objetivos. Deben plantearse en forma clara y concisa. Es conveniente desagregarlos en objetivos generales y específicos.

d) Metodología. Debe contener la descripción del universo de estudio y los criterios que definieron su elección; el diseño de muestreo completo y detallado; las herramientas e

Page 17: DISEÑO DE MUESTREO

instrumentos de obtención de datos; las técnicas de levantamiento de datos en campo; el modo de procesamiento de datos, incluyendo equipo y programas usados; y los tiempos y costos (en trabajo y en dinero) de la aplicación del estudio en cada una de sus etapas.

e) Resultados. Para iniciar este capítulo es necesario precisar los grupos temáticos que se tratarán (por ejemplo, saturación, obtención de combustibles, consumo, dispositivos de combustión, impacto ambiental, etc.). Los resultados deberán presentar tablas y gráficos. Algunos resultados relevantes son tan puntuales, que no vale la pena incluirlos en Tablas, pero sí en el texto. La redacción de resultados no debe ser una descripción de los gráficos y tablas, sino un ejercicio de análisis, donde se integren otros elementos que sean relevantes. Para ello será necesario apoyarse fuertemente en las comparaciones con otras informaciones del tema. En este capítulo se incluirán como un apartado los diagnósticos Integrales (Capítulo 5).

f) Conclusiones. Las conclusiones se referirán a los objetivos del estudio y a los resultados más relevantes, y nunca a asuntos que no se han tratado en la investigación. Deben presentarse en forma muy clara y concreta, pues el análisis a fondo ya fue hecho en el capítulo anterior. Es aconsejable que se agrupen por líneas generales de análisis, como pueden ser: importancia del uso de combustibles de madera; impacto económico; impacto ambiental; patrones de abastecimiento y consumo; eficiencia de dispositivos de combustión; eficiencia de sistemas de aprovechamiento de combustibles; etc.

g) Recomendaciones. Las recomendaciones sirven para orientar las acciones de los usuarios de la información, a saber: los planeadores energéticos, el sector público forestal y otras instituciones involucradas, los usuarios de combustibles, los productores, los abastecedores y los investigadores. Por ello las recomendaciones deben ser acordes con los resultados y conclusiones, además de ser realizables.

h) Bibliografía. Es la lista de referencias de las fuentes de información utilizadas para el estudio y mencionadas en el documento. No se trata solo de libros, sino de todas las fuentes consultadas como pueden ser revistas, diarios, otros documentos, grabaciones, informaciones personales, etc. Es importante que se citen completas y correctamente. Como existen diferentes formas de citarlas se recomienda que se revisen ejemplos en diversas publicaciones.

i) Abreviaturas y acrónimos. Para facilitar el entendimiento del texto, en una sección inicial del documento deben definirse los significados de todas las abreviaturas y acrónimos usados.

j) Unidades y equivalencias. Es muy importante esta sección para permitir la comparación de los resultados del estudio con otros trabajos. Deben incluir tanto unidades locales con su equivalencia al SI y unidades monetarias y su tasa de cambio a $EEUU.

k) Glosario. Cuando en el documento se usan términos específicos, lo cual es común en este tipo de estudios, es muy necesario incluir un glosario. Se recomienda referirse a la Terminología Unificada en Dendroenergía (FAO en preparación).

l) Anexos. En este apartado se deben incluir todos aquellos textos, tablas, gráficos, mapas, etc., que sirven de apoyo para el análisis de informaciones dentro del texto, pero que no están directamente relacionados con los resultados del estudio, o aquéllos que por su extensión resulta poco práctico incluirlos en el cuerpo del texto.

Page 18: DISEÑO DE MUESTREO

MUESTREO IRRESTRICTAMENTE ALEATORIO (MIA)

Si de una población de tamaño N se selecciona una muestra de tamaño n, de tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, el tipo de muestreo utilizado se llama irrestricto aleatorio.

En la práctica, una muestra aleatoria simple es seleccionada unidad por unidad. Las unidades de muestreo son numeradas de 1 a N, a continuación se seleccionan n números entre 1 y N, ya sea utilizando una tabla de números aleatorios o colocando los N números en una urna y las unidades de muestreo que lleven los números seleccionados constituirán la muestra. La muestra se selecciona sin repetición o sin sustitución, es decir, que cada unidad de muestreo solo puede aparecer una sola vez en una muestra determinada.

Este tipo de muestreo se utiliza cuando: la población es más o menos homogénea con respecto a las características que se desean estudiar; cuando los elementos de la población no se pueden enumerar fácilmente; cuando las estimaciones que se deben obtener se refieren a todo el conjunto y no a subgrupos de la población.

Cuando se selecciona una muestra el objetivo es tener estimaciones para los parámetros a través de la información suministrada por la muestra.

Determinación del tamaño de la muestra

Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los objetivos de la encuesta suelen requerir varias estadísticas y que al considerar cada una de ellas pueden llevar a un diseño diferente, por lo tanto, para determinar el tamaño de la muestra se debe elegir el principal objetivo y calcular el tamaño de muestra necesario para cumplir dicho objetivo. En caso de ser varios los objetivos principales se determina un tamaño de muestra para cumplir cada objetivo y entre todos ellos, se elige el mayor.

El tamaño de la muestra depende básicamente del tamaño de la población, del nivel de confianza o confiabilidad de las estimaciones, del grado de variación o dispersión de la variable a estudiar y del error de estimación.

Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una fórmula diferente para calcular el tamaño de la muestra.

nx=N s2

(N−1 ) ϵ 2

Zα /22 +s2

Donde:N = Población totalS2 = Varianza ϵ = es el error de estimaciónZα /2 = percentil que se halla en una tabla de la distribución normal y depende del nivel de confianza (1−α )

Page 19: DISEÑO DE MUESTREO

El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el tamaño de la muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y el noventa y nueve por ciento. A mayor confiabilidad mayor tamaño de muestra.

El grado de variación o dispersión de la variable se mide a través de la desviación estándar, la cual puede ser estimada a partir de una muestra piloto o a partir de la información recopilada en una investigación similar, realizada anteriormente.

El error de estimación es la máxima diferencia en valor absoluto, que se está dispuesto a aceptar, entre el valor del estimador y el valor del parámetro, a éste error de estimación se le nota como”ϵ”. El valor del error de estimación depende del estimador que se desee obtener y de la magnitud de la variable. Por ejemplo si se va a estimar la proporción de desempleados, un error de estimación lógico puede ser del 3 por ciento; pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de estimación lógico puede ser de 7 kilos. A mayor error de estimación menor tamaño de muestra.

Tamaño de muestra para estimar el promedio aritmético

Ejemplo

Una empresa tiene 98 operarios y desea determinar el tamaño de muestra necesario para estimar el tiempo promedio que requiere un operario para completar una labor, con un error de estimación máximo de medio minuto y una confiabilidad del 95 por ciento. Se toma una muestra piloto, con la cual se estima una desviación estándar de 1,2 minutos

Solución

El error de estimación es 0,5 minutos (ϵ =0.5). Para una confiabilidad del 95 por ciento, en la tabla de la distribución normal el valor de Zα /2 es 1.96:

nx=98 (1.2 )2

(98−1 ) (0.5 )2

(1.96 )2+(1.2 )2

= 98 ∙1.44

(97 )( 0.253.8416 )+1.44

=141.127.7524

=18.2

Debe seleccionar una muestra aleatoria de 18 obreros.

Tamaño de muestra para estimar el total

nx=N s2

(N−1 ) ϵ2

Zα /22 N2 +s2

Ejemplo

Si la misma empresa del ejemplo, desea estimar el tiempo total que necesitan sus obreros para terminar la labor, con un error máximo de 35 minutos y una confiabilidad del 95 por

Page 20: DISEÑO DE MUESTREO

ciento; por lo tanto,(ϵ=35 ), y para una confiabilidad del 95 por ciento Zα /2=1.96. El tamaño de muestra requerido es:

nx=98 (1.2 )2

(98−1 ) (35 )2

(1.962 ) (982 )+(1.2 )2

= 141.12

( 97 )( 122536,894.7264 )+1.44

=30.28

Debe seleccionar una muestra aleatoria de 30 operarios, para estimar el tiempo total con un error máximo de 35 minutos y una confiabilidad del 95 por ciento.

Tamaño de muestra para estimar la proporción

np=Npq

( N−1 ) ϵ2

Zα /22

+ pq=

N Zα /22 pq

ϵ 2 ( N−1 )+Zα /22 pq

Donde:

q=1−p

Cuando no se conoce la proporción (p), se puede suponer un valor para p de 0,5, ya que éste valor, siempre y cuando permanezcan constantes las demás condiciones, es el que nos proporciona el mayor tamaño de muestra posible.

Ejemplo

Se desea estimar el porcentaje de empleados en una ciudad que tiene una fuerza de trabajo de 35,250 personas. Por un trabajo realizado anteriormente se sabe que el porcentaje de empleados es del 75 por ciento. Qué tamaño de muestra será necesario para estimar la proporción con un error de estimación máximo del 8 por ciento.

Solución

El error de estimación (ϵ=0.08 ) y asumiendo un nivel de confianza del 95 por ciento, Zα /2=1.96, Se remplaza en la ecuación:

np=(35,250 ) (0.75 ) (0.25 )

(35,250−1 ) (0.08 )2

(1.96 )❑+(0.75 ) (0.25 )

=112.19

Por lo tanto se debe seleccionar una muestra aleatoria de 112 personas para estimar el porcentaje de empleados

Page 21: DISEÑO DE MUESTREO

MUESTREO ALEATORIO ESTARTIFICADO (MAE)

Muestreo estratificado (ME) consiste en clasificar primero los elementos de la población en grupos que no presenten traslapes o intersecciones, y de estos grupos o estratos seleccionar una muestra irrestricta aleatoria, tomando al menos un elemento de cada grupo o estrato. El proceso que se sigue para establecer los grupos se conoce como estratificación. Al formar los estratos se debe buscar que los elementos de cada estrato sean lo más homogéneos entre sí y que haya marcadas diferencias entre un estrato y otro. Estos estratos pueden reflejar regiones geográficas de un país, clases sociales dentro de una ciudad, etc. Cuando se utiliza el muestreo estratificado las probabilidades de selección de un grupo al otro pueden ser iguales o diferentes, aunque se debe conocer la probabilidad de selección que corresponde a cada uno. Las muestras se seleccionan separadamente para cada estrato y las estimaciones se realizan separadamente para cada estrato y se ponderan para obtener una estimación combinada para la población. El utilizar muestreo estratificado tiene sus ventajas como son: aumento en la exactitud de los resultados, reduciendo el error de muestreo y permite obtener estimaciones para cada estrato. A cambio de lo anterior, se necesita más información que en MIA para definir los estratos y el cálculo de los errores es más complejo que en MIA.

Razones para estratificar

Cuando los elementos de la población son muy heterogéneos respecto a las características a estudiar.

Para reducir las varianzas de las estimaciones, cuando existe máxima homogeneidad en los elementos de cada estrato y máxima heterogeneidad en los diferentes estratos.

Para controlar o aislar los factores o variables que condicionan directa o indirectamente las diferencias entre las características de los elementos de la población, factores que constituyen los criterios básicos para estratificar.

Cuando además de las estimaciones para toda la población se necesitan estimaciones para subgrupos de esa población.

Para reducir el costo por observación.

En le ME se requiere la siguiente notación adicional:

L = número de estratosNi = número de unidades muestrales en el estrato iN = tamaño de la población (N=N 1+N 2+.......+NL)

Cuando se utiliza el muestreo estratificado, se pueden obtener estimaciones en cada uno de los estratos, para lo cual se aplican las mismas fórmulas del muestreo irrestricto aleatorio.

Page 22: DISEÑO DE MUESTREO

Así mismo estas estimaciones se combinan para obtener estimaciones válidas para toda la muestra.

Determinación del tamaño de la muestra

Cuando se utiliza muestreo estratificado se debe seleccionar al menos un elemento de muestreo de cada estrato. Así que primero se determina el tamaño de la muestra y después se determina cuántos elementos se deben seleccionar de cada estrato. Dependiendo de los criterios que se tengan en cuenta para distribuir la muestra entre los estratos se tienen diferentes tipos de asignación o afijación y ellos son: proporcional, de Neyman y óptima.

Muestreo estratificado con asignación proporcional

Muestreo estratificado con asignación de Neyman

Muestreo estratificado con asignación óptima

Page 23: DISEÑO DE MUESTREO

Muestreo estratificado con asignación proporcional

la muestra se reparte entre los estratos proporcionalmente a los tamaños de éstos. Este tipo de asignación se utiliza cuando los costos y las varianzas de los estratos no son muy diferentes.

Tamaño de muestra para estimar el promedio aritmético con asignación proporcional .

Donde: B = error de estimación

k = percentil que se halla en la tabla de la distribución normal y depende del nivel de confianza

Una vez determinado el tamaño de la muestra, para repartirla proporcionalmente al tamaño de los estratos se utiliza la siguiente expresión:

EJEMPLO

Se desea estimar la nota promedio de los estudiantes de administración de empresas diurna y nocturna en una universidad. En la carrera diurna (estrato 1) hay 280 estudiantes y en la nocturna (estrato 2) hay 200 estudiantes. Determine el tamaño de muestra necesario para cumplir el objetivo con un error máximo de 0,15 y una confiabilidad del 95 por ciento.

Por un estudio realizado tiempo atrás se conocen las varianzas de las notas de administración diurna y nocturna, las que respectivamente son: 0,31 y 0,28.

Solución

Considerando que las varianzas son similares, se trabaja con muestreo estratificado con asignación proporcional. El error (B) es 0,15 y para una confiabilidad del 95 por ciento el valor correspondiente en la distribución normal es 1,96, entonces, k = 1,96:

Para hallar el tamaño de muestra se utiliza la ecuación 6.26

Page 24: DISEÑO DE MUESTREO

El tamaño de la muestra es de 46 estudiantes. Esta muestra se reparte proporcionalmente al tamaño de los estratos, con la ecuación 6.27

Se deben seleccionar 27 estudiantes de administración de empresas diurna y 19 de la nocturna.

Tamaño de muestra para estimar el total con asignación proporcional

Para repartir la muestra entre los estratos, se utiliza la expresión 6.27

EJEMPLO

Se desea hacer un estudio para estimar el consumo total de gasolina en una ciudad, halle el tamaño de muestra necesario para cumplir éste objetivo. Los vehículos se clasificaron en tres grupos o estratos, particulares (1), públicos (2) y oficiales (3). En la oficina de circulación y tránsito se obtuvo la siguiente información sobre los vehículos matriculados en la ciudad; vehículos particulares 7.627, públicos 2.392 y oficiales 534.

Solución

Como no se dispone de estudios similares, se toma una muestra piloto, con la cual se obtienen las siguientes varianzas sobre el consumo semanal en galones:

Asumiendo un error de estimación máximo de 15.000 galones , (B = 15.000), y una confiabilidad del 95 por ciento, el valor de k en la distribución normal es 1,96.

Page 25: DISEÑO DE MUESTREO

Considerando que las varianzas en los tres estratos son similares, se trabaja con muestreo estratificado con asignación proporcional. Para calcular el tamaño de la muestra se utiliza la ecuación 6.28 y para repartir la muestra en los estratos se usa la ecuación 6.27

Para estimar el consumo total de gasolina con un error máximo de 15.000 galones/semana, se debe seleccionar una muestra de 255 autos repartida así: 184 autos particulares, 58 públicos y 13 oficiales.

Recuerde que si se desea, se puede disminuir el error máximo admisible, pero esto conlleva a un aumento en el tamaño de la muestra.

 

6.6.5.1.3  Tamaño de muestra para estimar la proporción con asignación proporcional  

Una vez determinado el tamaño de la muestra, se reparte entre los estratos utilizando la expresión 6.27

EJEMPLO

Tomado de1 . En vista de la recesión económica existente, una empresa textil pretende reducir el número de dial laborables por semana a cuatro. Otra alternativa consiste en clausurar una de sus tres plantas y despedir a los trabajadores. Para tener una idea de la opinión de los trabajadores, el gerente de personal de la empresa desea seleccionar una muestra de empleados de las tres plantas para estimar la proporción de trabajadores que prefieren la reducción de la semana de trabajo, con un error de estimación máximo de 0,1.

La empresa emplea 150 personas en la planta 1, 65 en la planta 2 y 40 en la 3. Se estima que cerca del 75 por ciento de los de la planta tres están a favor de la reducción de la

Page 26: DISEÑO DE MUESTREO

semana de trabajo, mientras que en las otras plantas este porcentaje parece corresponder al 50 por ciento. Encuentre el tamaño de muestra y la asignación necesaria en cada estrato.

Solución

Por la diferencia en el tamaño de las plantas, se utiliza el muestreo estratificado con asignación proporcional.

Asumiendo un nivel de confianza del 95 por ciento, el valor correspondiente en la distribución normal es 1,96 (k=1,96).

Para determinar el tamaño de la muestra se utiliza la ecuación 6.29 y se reparte en los estratos con la ecuación 6.27

Page 27: DISEÑO DE MUESTREO

Muestreo estratificado con asignación de Neyman 

Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos, es recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. De ésta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos.

Tamaño de muestra para estimar la media con asignación de Neyman

Para repartir la muestra entre los estratos se utiliza la siguiente expresión:

EJEMPLO

 

Tomado de 1. Se desea hacer un estudio sobre producción media de madera aserrada en los E.U.

Todos los aserraderos han sido agrupados en estratos, de acuerdo con la producción. Hace 5 años se hizo un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla). Por lo tanto, se dispone de la siguiente información:

Determine el tamaño de muestra necesario para estimar la producción media de madera con un error máximo de 25.000 pies de tabla y una confiabilidad del 95 por ciento.

Page 28: DISEÑO DE MUESTREO

Solución

El error máximo es de 25.000 pies , pero se debe tener en cuenta que la producción está dada en miles, por lo tanto se divide por 1.000, es decir que B = 25.

Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con muestreo estratificado con la asignación de Neyman. Para determinar el tamaño de la muestra se utiliza el ecuación 6.30 y para repartir la muestra en los estratos se usa la ecuación 6.31.

Se debe tomar una muestra de 1.473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato dos y 690 en el estrato tres.

Se debe tomar una muestra de 1.473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato dos y 690 en el estrato tres.

 

Tamaño de muestra para estimar el total con asignación de Neyman

Page 29: DISEÑO DE MUESTREO

La muestra se reparte entre los estratos utilizando la expresión 6.31

EJEMPLO

 

La fábrica de tapas del ejemplo 6.7, desea determinar el tamaño de muestra necesario para estimar la producción semanal total, con un error máximo de 90.000 tapas y una confiabilidad del 95 por ciento.

Solución

Se considera que la información suministrada en el ejemplo 6.7 corresponde a una muestra piloto, de la cual se utilizan las varianzas obtenidas que son:

Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el tamaño de dichos estratos, el tipo de muestreo adecuado es el estratificado con asignación de Neyman.

La fórmula para calcular el tamaño de la muestra es la 6.32 y para repartirla en los estratos, se utiliza la ecuación 6.31

Page 30: DISEÑO DE MUESTREO

Por lo tanto, para estimar la producción total con un error máximo de 90.000 tapas y una confiabilidad del 95 por ciento, se debe seleccionar una muestra de 69 máquinas, repartidas así: 15 manuales, 24 semiautomáticas y 30 automáticas.

 

Tamaño de muestra para estimar la proporción con asignación de Neyman

Para repartir la muestra entre los estratos se utiliza la expresión:

Page 31: DISEÑO DE MUESTREO

Muestreo estratificado con asignación óptima

Cuando además de tener marcadas diferencias en la dispersión o variabilidad dentro de los estratos, el costo para obtener la información de un estrato a otro varía, se recomienda utilizar la asignación óptima. Con ésta asignación se tiene en cuenta el tamaño de los estratos, la dispersión o variabilidad dentro de ellos y el costo para recopilar la información.

Tamaño de muestra para obtener la media con asignación óptima

Donde: ch = costo de hacer una observación individual en el estrato h.

Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión

Donde: ch = costo de hacer una observación individual en el estrato h.

Tamaño de muestra para obtener el total con asignación óptima

La muestra se reparte entre los distintos estratos, utilizando la expresión 6.36

Tamaño de muestra para estimar la proporción con asignación óptima

Page 32: DISEÑO DE MUESTREO

Donde: ch = costo de hacer una observación individual en el estrato h.

La muestra se reparte entre los distintos estratos, utilizando la expresión

1U.S. Bureau of the Census: curso suplementario para un estudio de caso sobre encuestas y censos. Conferencias sobre muestreo. Washington D.C. 1971. p. 37

Page 33: DISEÑO DE MUESTREO

MUESTREO ALEATORIO ESTRATIFICADO

Fuente: http://www.arqhys.com/general/muestreo-aleatorio-estratificado.html

Es aquel en el que se divide la población en grupos en función de un carácter determinado y después se muestrea cada grupo aleatoriamente, para obtener la parte proporcional de la muestra.

Este método se aplica para evitar que por azar algún grupo de animales este menos representado que los otros.

Es un método de muestreo que emplea información auxiliar del marco muestral para crear estratos o grupos homogéneos en una población que se sabe heterogénea.

Estos grupos se diferencian por tener distinta distribución geográfica, poseer o no un cierto atributo, o presentar diversidad en los tamaños de las unidades que los conforman. Sea una población o universo dividido en clases, separadas y no vacías (estratos).

Una muestra de n elementos de esta población es una muestra aleatoria estratificada (MAE) si se cumple que:

La muestra se compone de sub-muestras de todos y cada uno de los estratos

Las sub-muestras se eligen en cada estrato por MAS S/R

La selección de la sub-muestra en cada estrato es independiente de la selección en los restantes estratos.

Algunas de las razones por la que se estratifica una muestra es:

Para lograr homogeneidad en los estratos y con ello disminuir la dispersión general de la variable en estudio.

Para lograr mayor precisión en los estimadores. Para disminuir el tamaño de la muestra.

Para brindar estimaciones en las sub poblaciones o estratos más importantes.

Cuando se requiere incrementar la eficiencia de la muestra por unidad de costo operativo.

¿Cómo se selecciona una Muestra Aleatoria Estratificada?

Primero. En cada estrato se elige una sub-muestra.

Page 34: DISEÑO DE MUESTREO

Segundo. La sub-muestra de cada estrato se elige por MAS.

Tercero. Las sub-muestras se eligen en forma independiente en cada estrato.

Cuarto. La muestra total es la unión de las   sub-muestras.

Ventajas del muestreo aleatorio estratificado

El método asegura que en la muestra habrá representantes de todos los estratos (incluso de los que representan pequeños grupos en la población).

Si cada estrato representa un dominio de estudio o éste se conforma con la unión de algunos estratos, entonces es seguro que la muestra proporcionará información de dicho dominio de estudio.

El método permite muestrear con distintas tasas de muestreo en las diferentes sub-poblaciones de interés (otorga  flexibilidad al diseño muestral).

El muestreo estratificado permite reducir el costo por varias vías:

Se pueden utilizar diferentes métodos de muestreo en cada estrato.

Permite asignar el tamaño de la muestra en cada estrato atendiendo a su costo (al costo variable unitario).

Permite reducir el tamaño de muestra (respecto del tamaño requerido en otros diseños) para una precisión o varianza dadas.

La estratificación permite aumentar la eficiencia de los estimadores.

Mayor eficiencia de los estimadores si, respecto de las principales variables a investigar, las unidades por estrato resultan homogéneas y los estratos resultan heterogéneos entre sí.

La regla de homogeneidad dentro y heterogeneidad entre consiste en definir los estratos de manera que las varianzas dentro sean pequeñas, a la vez que las medias de los estratos sean bien diferentes entre sí.

Desventajas del muestreo aleatorio estratificado

Necesidad de contar con un marco que tenga información auxiliar.

Dificultad para crear o formar los estratos.

¿Cuál es el número óptimo de estratos?

Page 35: DISEÑO DE MUESTREO

Los estimadores no son tan simples (como en el caso del MAS). En general en el MAE se utilizan estimadores ponderados.

Para determinar en forma óptima el tamaño de la muestra en cada estrato es necesario disponer de medidas de dispersión para cada estrato.

n