38
Intervalos de Intervalos de Confianza Confianza M. C. José Juan Rincón Pasaye M. C. José Juan Rincón Pasaye UMSNH – FIE

Intervalos de Confianza

Embed Size (px)

DESCRIPTION

diapositiva

Citation preview

Page 1: Intervalos de Confianza

Intervalos de ConfianzaIntervalos de Confianza

M. C. José Juan Rincón PasayeM. C. José Juan Rincón Pasaye

UMSNH – FIE Mayo de 2003

Page 2: Intervalos de Confianza

ContenidoContenido

Estimación de parámetrosEstimación de parámetrosEstimación de intervalosEstimación de intervalosIntervalo de confianza para la mediaIntervalo de confianza para la mediaIntervalo de confianza para la Intervalo de confianza para la varianzavarianzaOtros Intervalos de ConfianzaOtros Intervalos de ConfianzaIntervalos de toleranciaIntervalos de toleranciaInts. de confianza y regresión linealInts. de confianza y regresión lineal

UMSNH-FIEUMSNH-FIE

Page 3: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Parámetros poblacionales y Estadísticos MuestralesParámetros poblacionales y Estadísticos Muestrales

UMSNH - FIEUMSNH - FIE

DatosDatos(Población de Interés)(Población de Interés)

MuestrasMuestras

-4 -2 0 2 40

20

40

60

80

100

120

140

160Histograma de la Poblacion

Clases

Fre

cuencia

-4 -2 0 2 40

2

4

6

8

10

12

14

16

Histograma de la Muestra

Clases

Fre

cuen

cia

ParámetrosParámetros::

Media (Media ())

Varianza(Varianza(22))

Desv. Est. (Desv. Est. ())

Etc.Etc.

EstadísticosEstadísticos::

Promedio ( )Promedio ( )

Varianza muestral(Varianza muestral(SS22))

Desv. Est. muestral(Desv. Est. muestral(SS))

Etc.Etc.

InferenciasInferencias

Muestreo

XX

Page 4: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Estimación de la media de una poblaciónEjemplo: Estimación de la media de una población

UMSNH - FIEUMSNH - FIE

EstimadorEstimador: : La media muestralLa media muestral ( ) que se calcula a partir de una muestra ( ) que se calcula a partir de una muestra de N datos como sigue:de N datos como sigue:

XX

)x...x(xN1

N21

____

X

Parámetro que se pretende estimar Parámetro que se pretende estimar : : La media de la población La media de la población ( ( µµ ) que en ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:

El estimador (en el ejemplo la media muestral) puede tomar diferentes El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, decir, el estimador es una variable aleatoriael estimador es una variable aleatoria

Es natural preguntarse : ¿Es natural preguntarse : ¿Cuál será la distribución de probabilidad del Cuál será la distribución de probabilidad del estimadorestimador? De hecho ¿? De hecho ¿cuáles serán sus parámetroscuáles serán sus parámetros? ¿? ¿tendrán que ver con los tendrán que ver con los de la poblaciónde la población??

Page 5: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado

UMSNH - FIEUMSNH - FIE

EstimadorEstimador: La media muestral ( ): La media muestral ( )XX )x...x(xN1

N21

____

X

Población de interés Población de interés : El conjunto de datos obtenidos al lanzar un dado legal : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasionesen diversas ocasiones

Parámetro de interés Parámetro de interés : La media (: La media (µµ) de la población) de la población

Experimento aleatorioExperimento aleatorio : Lanzar un dado: Lanzar un dado

Variable aleatoriaVariable aleatoria X= número obtenido en la cara superior X= número obtenido en la cara superior

Espacio muestralEspacio muestral = {1, 2 , 3, 4, 5 , 6} = {1, 2 , 3, 4, 5 , 6}

Distribución de la variable aleatoria XDistribución de la variable aleatoria X: Uniforme: Uniforme

Media teóricaMedia teórica: µ=3.5: µ=3.5

Page 6: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado

UMSNH - FIEUMSNH - FIE

Distribución de la variable aleatoria (X) del experimentoDistribución de la variable aleatoria (X) del experimento

Función de Probabilidad: Función de Probabilidad: f(x) = P(X=x)f(x) = P(X=x)

xx 11 22 33 44 55 66

f(x)f(x) 1/61/6 1/61/6 1/61/6 1/61/6 1/61/6 1/61/6

1 2 3 4 5 60

0.05

0.1

0.15

0.2

x

f(x)

Función de Probabilidad

Page 7: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado

UMSNH - FIEUMSNH - FIE

Distribución del estadístico . Distribución del estadístico .

MuestraMuestra xx11 xx22 xx33 xx44 xx55 xx66 xx77 xx88 xx99 xx1010

11 11 33 55 11 11 22 22 44 22 22 2.12.1

22 11 55 33 66 33 33 66 44 22 55 3.83.8

33 66 11 55 33 55 44 55 33 22 22 3.23.2

44 22 55 22 44 11 55 33 66 66 44 3.83.8

55 33 66 55 44 55 44 33 22 33 44 3.73.7

...... ......

XX

XX

XX

Cada muestra puede considerarse como:Cada muestra puede considerarse como:

10 valores de la variable aleatoria X, 10 valores de la variable aleatoria X,

1 sólo valor para 10 variables aleatorias X1 sólo valor para 10 variables aleatorias X11,X,X22,...,X,...,X1010

Diferentes cálculos de para N=10:Diferentes cálculos de para N=10:

Page 8: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado

UMSNH - FIEUMSNH - FIE

Distribución del estadístico . Distribución del estadístico . XX

XXSi obtenemos 1000 muestras, obtendremos 1000 valores de , para Si obtenemos 1000 muestras, obtendremos 1000 valores de , para estos 1000 valores realizamos el histograma:estos 1000 valores realizamos el histograma:

1 2 3 4 5 60

0.05

0.1

0.15

0.2

0.25

X

frec

uenc

ia r

elat

iva

Distribución de la media muestral

Page 9: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado

UMSNH - FIEUMSNH - FIE

Código en Matlab:Código en Matlab:

%se simula el dado%se simula el dado

x=round(rand(N,n)*6+0.5);x=round(rand(N,n)*6+0.5);

M=sum(x)/N;M=sum(x)/N;

[X,c]=hist(M,15);[X,c]=hist(M,15);

%se grafica el histograma de frecuencia relativa en p.u.%se grafica el histograma de frecuencia relativa en p.u.

X=X/n;X=X/n;

bar(c,X)bar(c,X)

RecordatorioRecordatorio: Cada muestra puede considerarse como:: Cada muestra puede considerarse como:

10 valores de la variable aleatoria X, 10 valores de la variable aleatoria X,

1 sólo valor para 10 variables aleatorias X1 sólo valor para 10 variables aleatorias X11,X,X22,...,X,...,X1010

Page 10: Intervalos de Confianza

Estimación de ParámetrosEstimación de Parámetros

En general: un En general: un estadísticoestadístico que pretende estimar un parámetro que pretende estimar un parámetro es una v. a. Que depende de las N variables aleatorias que es una v. a. Que depende de las N variables aleatorias que forman una muestra, es decirforman una muestra, es decir

UMSNH - FIEUMSNH - FIE

= f(X= f(X11,X,X22,...,X,...,XNN))

Así, una Así, una muestramuestra es un conjunto de valores es un conjunto de valores (x(x11,x,x22,...,x,...,xNN)) tomados tomados

por las variables aleatorias por las variables aleatorias (X(X11,X,X22,...,X,...,XNN).).

Es natural suponer que la distribución Es natural suponer que la distribución f(Xf(Xii)=P(X)=P(Xii=x=xii)) de cada de cada

variable de la muestra es igual a la de la poblaciónvariable de la muestra es igual a la de la población

Sin embargo, la distribución Sin embargo, la distribución f( ) = P( = )f( ) = P( = ) del estadístico del estadístico como se vió en el ejemplo del dado es otra cosa. como se vió en el ejemplo del dado es otra cosa.

Page 11: Intervalos de Confianza

Estimación de IntervalosEstimación de Intervalos

En la explicación previa, un estimador produce En la explicación previa, un estimador produce un valorun valor que pretende aproximar a un parámetro que pretende aproximar a un parámetro . A este enfoque se le . A este enfoque se le llama llama estimación puntualestimación puntual

UMSNH - FIEUMSNH - FIE

En el enfoque de En el enfoque de estimación de intervalosestimación de intervalos, para un parámetro , para un parámetro no se estima un valor, sino un intervalo de la forma no se estima un valor, sino un intervalo de la forma l l u u, , donde los valores extremos l, u dependen del valor numérico del donde los valores extremos l, u dependen del valor numérico del estadístico para una muestra en particular y de la distribución estadístico para una muestra en particular y de la distribución de muestreo de de muestreo de

Es decir, l,u dependen de la muestra, por lo tanto son valores de Es decir, l,u dependen de la muestra, por lo tanto son valores de variables aleatorias L, Uvariables aleatorias L, U

Page 12: Intervalos de Confianza

Estimación de IntervalosEstimación de Intervalos

Partiendo de la distribución de muestreo para , es posible Partiendo de la distribución de muestreo para , es posible determinar valores de L,U tales que se cumpla lo siguiente:determinar valores de L,U tales que se cumpla lo siguiente:

UMSNH - FIEUMSNH - FIE

P(L P(L U) =1 – U) =1 – Donde 0 < Donde 0 < < 1 < 1

Es decir, se puede garantizar con una probabilidad de 1-Es decir, se puede garantizar con una probabilidad de 1- que que la muestra elegida contendrá el valor verdadero de la muestra elegida contendrá el valor verdadero de

Al intervalo resultanteAl intervalo resultante l l u u se le conoce comose le conoce como elel intervalo intervalo de confianza de confianza del 100(1– del 100(1– para el parámetro desconocido para el parámetro desconocido

Page 13: Intervalos de Confianza

Estimación de IntervalosEstimación de Intervalos

EjemploEjemplo: Construcción repetida de un intervalo de confianza : Construcción repetida de un intervalo de confianza para la media para la media

UMSNH - FIEUMSNH - FIE

Si los intervalos de confianza mostrados son del 95% significa Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos que si se construye un gran número de ellos, el 95% de ellos contendrá a la mediacontendrá a la media

Page 14: Intervalos de Confianza

Estimación de IntervalosEstimación de Intervalos

En la práctica se obtiene En la práctica se obtiene solamente una muestrasolamente una muestra y se calcula con y se calcula con ella un intervalo de confianza dicho intervalo contiene o no ella un intervalo de confianza dicho intervalo contiene o no contiene a contiene a , no es razonable asignar una probabilidad a este , no es razonable asignar una probabilidad a este evento.evento.

UMSNH - FIEUMSNH - FIE

La proposición a decuada es que el intervalo La proposición a decuada es que el intervalo contiene a contiene a “con “con una confianza” del 95%una confianza” del 95%

La longitud del intervalo de confianza (La longitud del intervalo de confianza (u-lu-l) es una medida de la ) es una medida de la calidad de la información obtenida en la muestra, al semi calidad de la información obtenida en la muestra, al semi intervalo intervalo u-u-, o , o -l-l se le llama se le llama Precisión del estimadorPrecisión del estimador..

¿Qué significado tiene un intervalo grande?¿Qué significado tiene un intervalo grande?¿És deseable que sea grande o que sea pequeño?¿És deseable que sea grande o que sea pequeño?

¿Qué relación tiene con el valor de 1-¿Qué relación tiene con el valor de 1-??

Page 15: Intervalos de Confianza

Estimación de IntervalosEstimación de Intervalos

Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)

UMSNH - FIEUMSNH - FIE

SituaciónSituación: Se tiene una población con media desconocida : Se tiene una población con media desconocida , pero , pero se supone conocida la varianza se supone conocida la varianza 22..

Se toma una muestra aleatoria Se toma una muestra aleatoria (X(X11,X,X22,...,X,...,XNN)). Con esta muestra se . Con esta muestra se

calcula el estadístico el cual es un estimador puntual calcula el estadístico el cual es un estimador puntual insesgadoinsesgado para la media para la media desconocida. Se puede obtener un desconocida. Se puede obtener un intervalo de confianza del 100(1-intervalo de confianza del 100(1-) % para ) % para si consideramos si consideramos los siguientes hechos acerca de la distribución de :los siguientes hechos acerca de la distribución de :

XX

XX

Page 16: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)

UMSNH - FIEUMSNH - FIE

1.1. Si la población es Normal, la distribución de es NormalSi la población es Normal, la distribución de es Normal

2.2. Si la población no es Normal, el Si la población no es Normal, el Teorema del límite centralTeorema del límite central nos nos garantiza una distribución de aproximadamente normal garantiza una distribución de aproximadamente normal cuando cuando N N

3.3. La media de es La media de es ( es insesgado) ( es insesgado)

4.4. La varianza de es La varianza de es 22/N/N

Teorema del Límite Central: Teorema del Límite Central:

Afirma que la media muestral tiene una distribución Normal Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30)muestra sea muy grande (de manera práctica N>30)

XX

XX

XX

XX

XX

Page 17: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)

UMSNH - FIEUMSNH - FIE

De acuerdo a lo anterior, podemos suponer que la variable De acuerdo a lo anterior, podemos suponer que la variable

Tiene una distribución Tiene una distribución N(0,1)N(0,1)

de la figura: P{-zde la figura: P{-z/2 /2 Z Z z z/2/2 }=1- }=1-..

Con lo cual el intervalo de confianza del 100(1-Con lo cual el intervalo de confianza del 100(1-)% para la media )% para la media eses

N/

μX___

Z σ

-z-z/2 /2 zz/2/2 Z Z

/2 /2 /2/2

Nσ/zμNσ/z α/2

__

α/2

__

xx

Page 18: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Los siguientes son datos de conductividad térmica de cierto tipo de : Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F):hierro (en BTU/hr-ft-°F):

41.60 41.48 42.34 41.95 41.8641.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.0442.18 41.72 42.26 41.81 42.04

Una estimación puntual para la media, es Una estimación puntual para la media, es = 41.924. = 41.924. Hallar un intervalo de Hallar un intervalo de confianza del 95 % y uno del 99% para la media.confianza del 95 % y uno del 99% para la media.

Se supone que la población tiene una distribución Normal con Se supone que la población tiene una distribución Normal con =0.3=0.3

Usamos la expresión para encontrar el Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Matlab para calcular intervalo de confianza para la media: Usando Matlab para calcular zz/2/2 = = norminv(0.025,0,1)norminv(0.025,0,1)

l = 41.924 - 1.96(0.3)/l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.11010 = 42.110

Entonces el Entonces el intervalo de confianza del 95%intervalo de confianza del 95% es es

41.738 41.738 42.11 42.11

Y la Y la longitudlongitud de este intervalo es 3.92 de este intervalo es 3.92/ / NN

Nσ/zμNσ/z α/2

__

α/2

__

xx

XX

Page 19: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)

UMSNH - FIEUMSNH - FIE

Selección del tamaño de la muestra:Selección del tamaño de la muestra:La La precisiónprecisión del intervalo de confianza es del intervalo de confianza es zz/2/2//NN esto significa esto significa que al usar para estimar que al usar para estimar , el , el errorerror de estimación, dado por de estimación, dado porE=| - E=| - || es menor o igual que es menor o igual que zz/2/2//NN, con una confianza de , con una confianza de 100(1-100(1-)%.)%.

El problema inverso consiste en calcular El problema inverso consiste en calcular NN para obtener un error para obtener un error EE con una confianza del 100(1- con una confianza del 100(1-)% previamente especificado:)% previamente especificado:

NN1/21/2= z= z/2/2/E/E

XXXX

EjercicioEjercicio: Calcular el tamaño adecuado de la muestra para lograr : Calcular el tamaño adecuado de la muestra para lograr que el error de estimación de conductividad del hierro sea menor que el error de estimación de conductividad del hierro sea menor de 0.05 Btu/hr-ft-°F con una confianza del 95%de 0.05 Btu/hr-ft-°F con una confianza del 95%

Page 20: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))

UMSNH - FIEUMSNH - FIE

Si no se conoce la varianza Si no se conoce la varianza 22 de la población, de la población, una posibilidad es una posibilidad es utilizar la varianza muestral Sutilizar la varianza muestral S22 en las ecuaciones obtenidas para en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocidaestimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (Este procedimiento funciona para muestras grandes (N>30N>30), por ), por ello los intervalos de confianza anteriores se les suele llamarello los intervalos de confianza anteriores se les suele llamarintervalos de confianza para muestras grandes.intervalos de confianza para muestras grandes.

Si las muestras son pequeñas el enfoque anterior no funciona y Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido para lograr un procedimiento válido se supondrá que la población se supondrá que la población tiene una distribución Normaltiene una distribución Normal

Page 21: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))

UMSNH - FIEUMSNH - FIE

Si la población es Normal, la siguiente estadísticaSi la población es Normal, la siguiente estadística

Tiene una Tiene una distribución tdistribución t con N-1 grados de libertad con N-1 grados de libertad

T=X

S/ N

-t-t/2,N-1 /2,N-1 tt/2,N-1/2,N-1 T T

/2 /2 /2/2

Page 22: Intervalos de Confianza

Intervalo para la mediaIntervalo para la media

Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))

UMSNH - FIEUMSNH - FIE

de la figura: de la figura: P{-tP{-t/2,N-1 /2,N-1 T T t t/2,N-1/2,N-1 }=1- }=1-.. Con lo cual el Con lo cual el

intervalo de confianza del 100(1-intervalo de confianza del 100(1-)% para la media es)% para la media es

T=X

S/ N

-t-t/2,N-1 /2,N-1 tt/2,N-1/2,N-1 T T

/2 /2 /2/2

x t /2,N 1s/ N x t /2,N 1s/ N

EjercicioEjercicio: Repetir el ejemplo de la conductividad del hierro : Repetir el ejemplo de la conductividad del hierro suponiendo que no se conoce la varianzasuponiendo que no se conoce la varianza

Page 23: Intervalos de Confianza

Intervalo para la VarianzaIntervalo para la Varianza

Intervalo para la Varianza de una distribución Intervalo para la Varianza de una distribución NormalNormal

UMSNH - FIEUMSNH - FIE

Si la Población es Normal, la distribución muestral del estadístico Si la Población es Normal, la distribución muestral del estadístico siguientesiguiente

Donde Donde SS22 es la varianza muestral es la varianza muestral usada como estimador puntual de usada como estimador puntual de 22

Es de tipo Es de tipo Ji-cuadradaJi-cuadrada con N-1 grados de libertad con N-1 grados de libertad

X N 1S2

2

00 22/2,N-1/2,N-1 22

/2,N-1/2,N-1 XX

/2 /2 /2/2

Page 24: Intervalos de Confianza

Intervalo para la VarianzaIntervalo para la Varianza

Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal

UMSNH - FIEUMSNH - FIE

De acuerdo a la figura, De acuerdo a la figura, P(P(221-1-/2,N-1/2,N-1 X X 22

/2,N-1/2,N-1) = 1-) = 1-

Por lo tanto, el intervalo de confianza del 100(1-Por lo tanto, el intervalo de confianza del 100(1-)% buscado )% buscado para la varianza espara la varianza es

X N 1S2

2

00 22/2,N-1/2,N-1 22

/2,N-1/2,N-1 XX

/2 /2 /2/2

N 1s2

1 /2,N 12 2

N 1s2

/2,N 12

EjercicioEjercicio: Hallar el intervalo de confianza del 95% para la : Hallar el intervalo de confianza del 95% para la varianza en el ejemplo de la conductividad del hierrovarianza en el ejemplo de la conductividad del hierro

Page 25: Intervalos de Confianza

Intervalo para la VarianzaIntervalo para la Varianza

Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal

UMSNH - FIEUMSNH - FIE

Intervalos de confianza unilateralesIntervalos de confianza unilaterales.- En el caso de la varianza es .- En el caso de la varianza es más común buscar cotas inferiores o superiores que ambas a la vezmás común buscar cotas inferiores o superiores que ambas a la vez

N 1s2

1 ,N 12 2

Intervalo de confianza inferiorIntervalo de confianza inferior.- Se obtiene reemplazando el .- Se obtiene reemplazando el límite superior por límite superior por y y 22

/2,N-1 por /2,N-1 por 22,N-1,N-1, obteniendo:, obteniendo:

Intervalo de confianza superiorIntervalo de confianza superior.- En forma similar, se reemplaza .- En forma similar, se reemplaza el límite inferior por el límite inferior por 00 y y 22

/2,N-1 por /2,N-1 por 22,N-1,N-1, obteniendo:, obteniendo:

2 N 1s2

,N 12

Page 26: Intervalos de Confianza

Intervalo para la VarianzaIntervalo para la Varianza

Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal

UMSNH - FIEUMSNH - FIE

Ejercicio: Ejercicio: Un fabricante de detergente líquido está interesado Un fabricante de detergente líquido está interesado en la efectividad de su proceso para llenar envases de en la efectividad de su proceso para llenar envases de detergente. La norma dice que no se debe tener una desviación detergente. La norma dice que no se debe tener una desviación estándar estándar en el proceso mayor de 0.15, ya que de lo contrario en el proceso mayor de 0.15, ya que de lo contrario habrá envases más vacíos de lo permitido.habrá envases más vacíos de lo permitido.

Se toma una muestra aleatoria de 20 envases y se obtiene una Se toma una muestra aleatoria de 20 envases y se obtiene una varianza muestral varianza muestral ss22=0.0153 onzas=0.0153 onzas22. ¿Es esta medición una . ¿Es esta medición una evidencia de que se está cumpliendo la norma con una evidencia de que se está cumpliendo la norma con una confianza del 95% ?confianza del 95% ?

SugerenciaSugerencia: se puede usar la función : se puede usar la función chi2invchi2inv de Matlab de Matlab

Page 27: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción

UMSNH - FIEUMSNH - FIE

Se toma una muestra de tamaño N de una población muy grande y Se toma una muestra de tamaño N de una población muy grande y resulta que X datos de la muestra pertenecen a alguna clase de resulta que X datos de la muestra pertenecen a alguna clase de interés. Entonces interés. Entonces un estimador puntual de la proporción un estimador puntual de la proporción pp de los de los datos de la población que pertenecen a la clasedatos de la población que pertenecen a la clase en cuestión es: en cuestión es:

Nótese que N y p son los parámetros de una Nótese que N y p son los parámetros de una distribución binomialdistribución binomial

La distribución de muestreo de se puede considerar La distribución de muestreo de se puede considerar aproximadamente aproximadamente Normal con media p y varianza p(1-p)/NNormal con media p y varianza p(1-p)/N, , siempre que p no esté muy cerca de 0 o de 1 y si N es siempre que p no esté muy cerca de 0 o de 1 y si N es relativamente granderelativamente grande

PP

P=X/NP=X/N^

Page 28: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción

UMSNH - FIEUMSNH - FIE

De lo anterior, la distribución de la variableDe lo anterior, la distribución de la variable

Es aproximadamente N(0,1)Es aproximadamente N(0,1)

Entonces, partiendo de Entonces, partiendo de P{-zP{-z/2 /2 Z Z z z/2/2 }=1- }=1-

Obtenemos el siguiente intervalo de confianza aproximado del Obtenemos el siguiente intervalo de confianza aproximado del 100(1-100(1-)% para la proporción p de la población que pertenece a la )% para la proporción p de la población que pertenece a la clase dada:clase dada:

Z P pp1 p

N

p z /2p1 p

N p p z /2p1 p

N

Page 29: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: De 1000 casos de cáncer pulmonar seleccionados al : De 1000 casos de cáncer pulmonar seleccionados al azar, 823 son de pacientes que fallecieron. Construya un intervalo azar, 823 son de pacientes que fallecieron. Construya un intervalo de confianza del 95% para la tasa de mortalidad del cáncer de confianza del 95% para la tasa de mortalidad del cáncer pulmonarpulmonar

SoluciónSolución: La tasa de mortalidad es la proporción de los que : La tasa de mortalidad es la proporción de los que mueren a los que contraen el cáncer pulmonar, de la muestra mueren a los que contraen el cáncer pulmonar, de la muestra tenemos que tenemos que = 0.823= 0.823. Por otro lado . Por otro lado zz0.0250.025=1.96=1.96, entonces:, entonces:

Es decir, Es decir, 0.7990.799 pp0.8470.847

0.823 1.960.8231 0.823

1000 p 0.823 1.960.8231 0.823

1000

pp

Page 30: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales

UMSNH - FIEUMSNH - FIE

SituaciónSituación: Se tienen dos poblaciones normales e independientes : Se tienen dos poblaciones normales e independientes con varianzas desconocidas con varianzas desconocidas 11

22, , 2222 respectivamente. Se tienen respectivamente. Se tienen

disponibles dos muestras aleatorias de tamaños Ndisponibles dos muestras aleatorias de tamaños N11, N, N22 una de cada una de cada

población respectivamente. Sean Spoblación respectivamente. Sean S112 2 SS22

22 las varianzas muestrales las varianzas muestrales

respectivas. Se busca un intervalo de confianza del 100(1-respectivas. Se busca un intervalo de confianza del 100(1-)% del )% del cociente de varianzas cociente de varianzas 11

22/ / 2222

Para hallar el intervalo de confianza se debe recordar que la Para hallar el intervalo de confianza se debe recordar que la distribución de muestreo del estadístico siguientedistribución de muestreo del estadístico siguiente

Es de Es de tipo Ftipo F con N con N22-1 y N-1 y N11-1 grados de libertad en el numerador y -1 grados de libertad en el numerador y

denominador respectivamente. denominador respectivamente. (Ver la figura siguiente)(Ver la figura siguiente)

F S2

2/ 22

S12/ 1

2

Page 31: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales

UMSNH - FIEUMSNH - FIE

Así, de la figura: Así, de la figura: P{fP{f/2,N2-1,N1-1/2,N2-1,N1-1 FF ff/2,N2-1,N1-1/2,N2-1,N1-1}=1-}=1-

Por lo tanto, el intervalo de confianza buscado es:Por lo tanto, el intervalo de confianza buscado es:

F S2

2/ 22

S12/ 1

2

00 ff/2,N2-1,N1-1/2,N2-1,N1-1 ff/2,N2-1,N1-1/2,N2-1,N1-1 FF

/2 /2 /2/2

S12

S22 f /2,N2 1,N1 1

12

22

S12

S22 f1 /2,N2 1,N1 1

f /2,N2 1,N1 1 1f1 /2,N2 1,N1 1

Page 32: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para : Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma rugosidad promedio. El ingeniero del proceso desea rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor seleccionar el proceso con la menor variabilidad variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas del primer proceso, obteniendo una desviación estándar muestral sdel primer proceso, obteniendo una desviación estándar muestral s11= 5.1 micropulgadas, = 5.1 micropulgadas,

luego toma una muestra de 15 piezas del segundo proceso, obteniendo sluego toma una muestra de 15 piezas del segundo proceso, obteniendo s22= 4.7. ¿Puede = 4.7. ¿Puede

elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la rugosidad?rugosidad?

SoluciónSolución: Suponiendo que los dos procesos son Normales e independientes. : Suponiendo que los dos procesos son Normales e independientes. Usando la función Usando la función finvfinv de Matlab, obtenemos de Matlab, obtenemos ff0.950.95=2.7386=2.7386 y y ff0.050.05=0.3898=0.3898, por lo , por lo

tanto,tanto,

Haciendo operaciones:Haciendo operaciones:

Como el intervalo incluye la unidad, Como el intervalo incluye la unidad, nono se puede concluir que los procesos se puede concluir que los procesos tengan variabilidad sgnificativamente diferente con una confianza del 90%tengan variabilidad sgnificativamente diferente con una confianza del 90%

5.12

4.720.3898 12/ 2

2 5.12

4.722.7386

0.46 12/ 2

2 3.23

Page 33: Intervalos de Confianza

Otros intervalos de ConfianzaOtros intervalos de Confianza

Resumen de intervalos de confianzaResumen de intervalos de confianza

UMSNH - FIEUMSNH - FIE

Parámetros de interésParámetros de interés SuposicionesSuposiciones

La media La media Dist. Muestral Normal (o N Dist. Muestral Normal (o N grande)grande)

22 conocida conocida

22 desconocida (Dist. Muestral T) desconocida (Dist. Muestral T)

La varianza La varianza 22 Dist. Normal (Dist. Muestral JiDist. Normal (Dist. Muestral Ji22 ) )

Proporción Proporción pp Dist. Muest. Normal (N grande, p alejado de 0 y de 1)Dist. Muest. Normal (N grande, p alejado de 0 y de 1)

Cociente de varianzas Cociente de varianzas

22//22

Dos poblaciones Normales e independientes (Dist. Dos poblaciones Normales e independientes (Dist. Muestral tipo F)Muestral tipo F)

Diferencia de medias Diferencia de medias

Distribuciones Distribuciones normales, normales,

22 y y

2 2 conocidasconocidas

2 2 = =

2 2 desconocidas (Dist muest T)desconocidas (Dist muest T)

2 2

2 2 desconocidas (Dist muest T)desconocidas (Dist muest T)

Diferencia entre dos Diferencia entre dos proporciones proporciones pp11-p-p22

Dist. Muestral Normal (NDist. Muestral Normal (N11 y N y N22 grandes, p grandes, p11 y p y p22

alejados de 0 y de 1)alejados de 0 y de 1)

Otras... (Ver libros de estadística)Otras... (Ver libros de estadística)

Page 34: Intervalos de Confianza

Intervalos de ToleranciaIntervalos de Tolerancia

ConceptoConcepto

UMSNH - FIEUMSNH - FIE

En ocasiones no nos interesa estimar algún parámetro, sino En ocasiones no nos interesa estimar algún parámetro, sino establecer establecer un rango en donde se puede esperar que caigan un rango en donde se puede esperar que caigan observaciones (datos) individualesobservaciones (datos) individuales en un proceso. en un proceso.

La respuesta es muy sencilla si se conoce la distribución y los La respuesta es muy sencilla si se conoce la distribución y los parámetros de la población, por ejemplo, si se obtuvo una muestra parámetros de la población, por ejemplo, si se obtuvo una muestra aleatoria de una población Normal con media aleatoria de una población Normal con media y varianza y varianza 22 conocidas, se esperará que el 95% de los datos caerán entre los conocidas, se esperará que el 95% de los datos caerán entre los límiteslímites

1.961.96

A este intervalo se le llama A este intervalo se le llama intervalo de toleranciaintervalo de tolerancia y si y si y y son son conocidos la cobertura del 95% es exactaconocidos la cobertura del 95% es exacta

Page 35: Intervalos de Confianza

Intervalos de ToleranciaIntervalos de Tolerancia

ConceptoConcepto

UMSNH - FIEUMSNH - FIE

Si Si y y son desconocidos a veces se puede determinar una son desconocidos a veces se puede determinar una constante constante kk tal que los límites tal que los límites k k constituyan un intervalo de constituyan un intervalo de tolerancia para una distribución normaltolerancia para una distribución normal

En este caso los límites del intervalo son variables aleatorias y la En este caso los límites del intervalo son variables aleatorias y la proporción de datos cubierta por el intervalo no es exacta. proporción de datos cubierta por el intervalo no es exacta.

Entonces se debe introducir un Entonces se debe introducir un intervalo de confianzaintervalo de confianza para la para la proposición de los límites del proposición de los límites del intervalo de toleranciaintervalo de tolerancia..

En la bibliografía se pueden consultar tablas para elegir estos En la bibliografía se pueden consultar tablas para elegir estos límites dada una confianza deseada para el caso Normal.límites dada una confianza deseada para el caso Normal.

xx

Page 36: Intervalos de Confianza

Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal

Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media

UMSNH - FIEUMSNH - FIE

En la regresión lineal se supone un modelo de la formaEn la regresión lineal se supone un modelo de la forma

yy = m = mxx + b + b

Para describir la “respuesta” Para describir la “respuesta” yy del proceso bajo la entrada del proceso bajo la entrada xx

Para una muestra de N puntos (valores de x, y) se calculan valores Para una muestra de N puntos (valores de x, y) se calculan valores estimados estimados mm, , bb de de mm, , bb resolviendo las ecuaciones normales, de resolviendo las ecuaciones normales, de manera que se obtiene un modelo estimado y = manera que se obtiene un modelo estimado y = mmx + x + bb

Se puede encontrar un intervalo de confianza para la respuesta Se puede encontrar un intervalo de confianza para la respuesta media media y/xoy/xo dado un valor xdado un valor x0 0 como se explica a continuacióncomo se explica a continuación

Así, para un dato xAsí, para un dato x00, se puede estimar una predicción puntual para , se puede estimar una predicción puntual para

y/xoy/xo (respuesta media) mediante: (respuesta media) mediante: y/xoy/xo = = mmxx00+ + bb

^^^ ^

^ ^ ^

^

Page 37: Intervalos de Confianza

Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal

Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media

UMSNH - FIEUMSNH - FIE

Un intervalo de confianza alrededor de la respuesta media Un intervalo de confianza alrededor de la respuesta media y/xoy/xo del del

100(1-100(1-)% para el valor de x=x)% para el valor de x=x00 está dado por: está dado por:

Donde Donde y/xo y/xo se calcula a partir del modelo de regresión estimadose calcula a partir del modelo de regresión estimado

Además, Además, 22= = (y(yi i - (m x- (m xii+b) )+b) )22/(N-2)/(N-2) y y SSxxxx = = (x(xii-x)-x)22 . .

Obsérvese que el ancho de este intervalo de confianza es mínimo Obsérvese que el ancho de este intervalo de confianza es mínimo para para xx00= x= x y crece a medida que y crece a medida que |x|x0 0 - x|- x| aumenta. En la siguiente aumenta. En la siguiente

gráfica se muestra un comportamiento típico de este intervalográfica se muestra un comportamiento típico de este intervalo

^

__

__

Y x0 t /2 2 1

N x0 x2

Sxx Y x0 Y x0 t /2 2 1

N x0 x2

Sxx

__

^^

Page 38: Intervalos de Confianza

Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal

Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media

UMSNH - FIEUMSNH - FIE

Recta de regresiónRecta de regresión

Puntos experimentalesPuntos experimentales

Límites del intervalo de confianza Límites del intervalo de confianza para la respuesta mediapara la respuesta media

Observación: Estos límites de intervalo están basados en los puntos experimentales dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los límites para nuevos datos se les llama límites de predicción y son más amplios que los límites para la respuesta media