10
Distribuciones Muéstrales El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral. Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico. Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muéstrales son normales y en esto se basarán todos los resultados que alcancemos. Distribución muestral de media Si tenemos una muestra aleatoria de una población N(m,s ), se sabe (Teorema del límite central ) que la fdp de la media muestral es también normal con media m y varianza s 2 /n. Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para poblaciones cualesquiera. Es decir es el error típico, o error estándar de la media. ¿Cómo usamos esto en nuestro problema de estimación? 1º problema: No hay tablas para cualquier normal, sólo para

Distribución muestral de medias

Embed Size (px)

Citation preview

Page 1: Distribución muestral de medias

Distribuciones Muéstrales

El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella.

El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. 

Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral.

Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico.Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muéstrales son normales y en esto se basarán todos los resultados que alcancemos.

Distribución muestral de media

Si tenemos una muestra aleatoria de una población N(m,s ), se sabe (Teorema del límite central) que la fdp de la media muestral es también normal con media m y varianza s2/n. Esto es exacto para poblaciones normales y aproximado (buena

aproximación con n>30) para poblaciones cualesquiera. Es decir  es el error típico, o error estándar de la media.

¿Cómo usamos esto en nuestro problema de estimación? 1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la llamada z); pero haciendo la transformación (llamada tipificación)

N(, ), se sabe (Teorema del límite central) que la fdp de la media maestral es también normal con media  y varianza 2/n. Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para poblaciones

cualesquiera. Es decir  es el error típico, o error estándar de la media.

¿Cómo usamos esto en nuestro problema de estimación? 1º problema: No hay tablas para cualquier normal, sólo para la normal=0 y =1

Page 2: Distribución muestral de medias

(la llamada z); pero haciendo la transformación (llamada tipificación)

una normal de media  y desviación  se transforma en una z.

Llamando z al valor de una variable normal tipificada que deja a su derecha un área bajo la curva de, es decir, que la probabilidad que la variable sea mayor que ese valor es (estos son los valores que ofrece la tabla de la normal)

podremos construir intervalos de la forma

para los que la probabilidad es 1 - .

Teniendo en cuenta la simetría de la normal y manipulando algebraicamente

que también se puede escribir

o, haciendo énfasis en que  es el error estándar de la media,

Page 3: Distribución muestral de medias

Recuérdese que la probabilidad de que  esté en este intervalo es 1 - . A un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - )%, o nivel de significación de 100%. El nivel de

confianza habitual es el 95%, en cuyo caso =0,05 y z /2=1,96. Al valor  se le

denomina estimación puntual y se dice que  es un estimador de .

Ejemplo: Si de una población normal con varianza 4 se extrae una muestra

aleatoria de tamaño 20 en la que se calcula  se puede decir que  tiene una probabilidad de 0,95 de estar comprendida en el intervalo

que sería el intervalo de confianza al 95% para 

En general esto es poco útil, en los casos en que no se conoce  tampoco suele conocerse 2; en el caso más realista de 2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdpcontinua para la que hay tablas) en lugar de la z.

o, haciendo énfasis en que  es el error estándar estimado de la media,

Esta manera de construir los intervalos de confianza sólo es válido si la variable es normal. Cuando n es grande (>30) se puede sustituir t por z sin mucho error.

Page 4: Distribución muestral de medias

Ejercicio de Aplicación

La vida útil de una llanta es de 32000 kilómetros de promedio con una desviación estándar de 8900 kilómetros se pide:

a) Cuál es la probabilidad de que 8 llantas duren entre 32000 y 33000 kilómetros

b) Si compro 17 llantas cual es la probabilidad que dure menos de 27000 kilómetros

c) Si compro 24 llantas cual es la probabilidad que dure 30000 y 345000

Datos:

320008400

x 33000n 8

ߤߪ

Aplicar Formula:

Remplazar valores:

z=33000−320008400/√8

Resultado:

z= 10002969.86

z=0.34

El valor de la z se lo busca en la tabla

z= x−μσ /√n

Page 5: Distribución muestral de medias

Respuesta

Z=13.31%Entonces la probabilidad de que las llantas duran entre 32000 y 33000 kilómetros es del 13.31%

Literal b

Datos:

320008400

x 27000n 17

ߤߪ

Aplicar Formula:

z= x−μσ /√n

Page 6: Distribución muestral de medias

Remplazar valores:

z=27000−320008400 /√17

Resultado:

z= 50002037 .30

z=2.45

El valor de la z se lo busca en la tabla

Respuesta

Z=49.29%-50%Z= 0.71%Entonces la probabilidad de que las llantas duran menos de 27000 kilómetros es del 0.71%

Page 7: Distribución muestral de medias

Literal c

Datos:

320008400

x 30000n 24

ߤߪ

320008400

x 34500n 24

ߤߪ

Aplicar Formula:

Remplazar valores:

z=30000−320008400/√24

z=34500−320008400/√24

Resultado:

z= 20001714.64

z= 25001714.64

z=1.17 z=1.48El valor de la z se lo busca en la tabla

z= x−μσ /√n

Page 8: Distribución muestral de medias

Respuesta

Z1=37.90% Z2= 43.06%

Z=37.90%+43.06%Z=80.96%

Entonces la probabilidad de que las llantas duran entre 30000 y 34500 kilómetros es del 80.96%