6
4.8 SELECCIÓN DEL TAMAÑO DE MUESTRA PARA ESTIMAR LA DIFERENCIA DE DOS MEDIAS En Estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población , necesarios para que los datos obtenidos sean representativos de la población. 1. Estimar un parámetro determinado con el nivel de confianza deseado. 2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía. 3. Reducir costes o aumentar la rapidez del estudio. Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así: Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el periodo de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial. El tamaño de una muestra es el número de individuos que contiene. Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente: n = ((k^2) * N*p*q) / ((e^2 * (N-1) )+( (k^2) * p*q)) N: es el tamaño de la población o universo (número total de posibles encuestados). k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de

2 YZRRAEL

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

4.8 SELECCIN DEL TAMAO DE MUESTRA PARA ESTIMAR LA DIFERENCIA DE DOS MEDIASEn Estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra extrada de una poblacin, necesarios para que los datos obtenidos sean representativos de la poblacin.1. Estimar un parmetro determinado con el nivel de confianza deseado.2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mnimo de garanta.3. Reducir costes o aumentar la rapidez del estudio.Por ejemplo, en un estudio de investigacin epidemiolgico la determinacin de un tamao adecuado de la muestra tendra como objetivo su factibilidad. As:Si el nmero de sujetos es insuficiente habra que modificar los criterios de seleccin, solicitar la colaboracin de otros centros o ampliar el periodo de reclutamiento. Los estudios con tamaos muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusin errnea de que no existe tal diferencia.Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vista econmico y humano. Adems es poco tico al someter a ms individuos a una intervencin que puede ser menos eficaz o incluso perjudicial.El tamao de una muestra es el nmero de individuos que contiene.

Una frmula muy extendida que orienta sobre el clculo del tamao de la muestra para datos globales es la siguiente:n = ((k^2) * N*p*q) / ((e^2 * (N-1) )+( (k^2) * p*q))N: es el tamao de la poblacin o universo (nmero total de posibles encuestados).k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigacin sean ciertos: un 95,5% de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores k ms utilizados y sus niveles de confianza son: K 1,15 1,28 1,44 1,65 1,96 2 2,58 Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99%(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la frmula k=1,96)e: es el error muestral deseado. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella. Ejemplos: Ejemplo 1: si los resultados de una encuesta dicen que 100 personas compraran un producto y tenemos un error muestral del 5% comprarn entre 95 y 105 personas. Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarn.Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estar en el intervalo 52-58% (55% +/- 3%). p: proporcin de individuos que poseen en la poblacin la caracterstica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opcin ms segura. q: proporcin de individuos que no poseen esa caracterstica, es decir, es 1-p. n: tamao de la muestra (nmero de encuestas que vamos a hacer).Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o est ms libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos. Para calcular el tamao de la muestra suele utilizarse la siguiente frmula:Otra frmula para calcular el tamao de la muestra es:n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 ) Donde: n = el tamao de la muestra.N = tamao de la poblacin.= Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5. Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relacin al 95% de confianza equivale a 1,96 (como ms usual) o en relacin al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador. e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

La frmula anterior se obtiene de la frmula para calcular la estimacin del intervalo de confianza para la media:X -Z /n ((N-n)/(N-1))X +Z /n ((N-n)/(N-1))

En donde el error es:e=Z /n ((N-n)/(N-1))Elevando al cuadrado el error se tiene: (e)^2=(Z /n ((N-n)/(N-1)))^2 e^2=Z^2 ^2/n (N-n)/(N-1)Multiplicando fracciones: e^2= (Z^2 ^2 (N-n))/n(N-1)Eliminando denominadores: e^2 n(N-1)=Z^2 ^2 (N-n)Eliminando parntesis: e^2 nN-e^2 n=Z^2 ^2 N-Z^2 ^2 nTransponiendo n a la izquierda: e^2 nN-e^2 n+Z^2 ^2 n=Z^2 ^2 NFactor comn de n:n(e^2 N-e^2+Z^2 ^2 )=Z^2 ^2 NDespejando n:n=(Z^2 ^2 N)/(e^2 N-e^2+Z^2 ^2 )Ordenando se obtiene la frmula para calcular el tamao de la muestra:n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )Ejemplo ilustrativo: Calcular el tamao de la muestra de una poblacin de 500 elementos con un nivel de confianza del 99%Solucin: Se tiene N=500, para el 99% de confianza Z = 2,58, y como no se tiene los dems valores se tomar =0,5, y e = 0,05.Reemplazando valores en la frmula se obtiene:n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )n=(5000,5^2 2,58^2)/((500-1) (0,05)^2+0,5^22,58^2 )=832,05/2,9116=285,77=286Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin estndar 1, y la segunda con media 2 y desviacin estndar 2. Ms an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las Ejemplo: Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22, respectivamente, un estimador puntual de la diferencia entre 1 y 2 est dado por la estadstica. Por tanto. Para obtener una estimacin puntual de 1- 2, se seleccionan dos muestras aleatorias independientes, una de cada poblacin, de tamao n1 y n2, se calcula la diferencia, de las medias muestrales.Recordando a la distribucin muestral de diferencia de medias:

Al despejar de esta ecuacin 1- 2 se tiene:

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra sean mayores a 30 se podr utilizar la varianza de la muestra como una estimacin puntual.Ejemplo: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el promedio para el motor B es 24 millas por galn. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estndar poblacionales son 6 y 8 para los motores A y B respectivamente. Solucin:Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor. En este caso ser la media del motor B menos la media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.

3.43