15
INSTITUTO TECNOLÓGICO DE CAMPECHE INGENIERÍA INDUSTRIAL UNIDAD III.- DISEÑO DE BLOQUES INVESTIGACION CONCEPTUAL JOSUÉ DANIEL CASTILLO MOO ESTADISTICA INFERENCIAL II GRUPO. VI4

inv concep stinfi 2 uni 3.docx

Embed Size (px)

Citation preview

INSTITUTO TECNOLÓGICO DE CAMPECHE

INGENIERÍA INDUSTRIAL

UNIDAD III.- DISEÑO DE BLOQUES

INVESTIGACION CONCEPTUAL

JOSUÉ DANIEL CASTILLO MOO

ESTADISTICA INFERENCIAL II

GRUPO. VI4

SAN FRANCISCO DE CAMPECHE A 21 DE ABRIL DEL 2015

INSTITUTO TECNOLOGICO DE CAMPECHE

UNIDAD III.- DISEÑO DE BLOQUES

Competencias específicas a desarrollar:

- Conocer y aplicar características particulares del diseño por bloques en el diseño de experimentos de sistemas logísticos e industriales.- Interpretar los resultados, comparar métodos y seleccionar la mejor opción en la toma de decisiones.

- TEMAS DE INVESTIGACIÓN CONCEPTUAL -

Contenido> Diseño de bloques completos aleatorizados.........................................................2

Diseño y análisis estadístico.................................................................................2

¿Cuándo es necesario hacer bloques?................................................................2

> Pruebas sobre medias de tratamientos individuales.............................................3

Método de la diferencia significativa mínima de Fisher........................................3

Otros métodos para pruebas sobre la diferencia d/medias d/2 tratamientos........5

> Análisis de residuales y verificación del modelo...................................................7

> Diseño de cuadrados latinos.................................................................................7

> Diseño de cuadrados greco-latinos.......................................................................8

1 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

> Diseño de bloques completos aleatorizados

Con este diseño se quiere estudiar la influencia de un factor tratamiento (T ) con I niveles en una variable de interés en presencia de una variable extraña, el factor bloque, B , que tiene J bloques.

Diseño y análisis estadístico

La formulación matemática del modelo de diseño en bloques completamente aleatorizados con un factor principal (factor tratamiento), T , con I niveles y un factor secundario (factor bloque), B , con J niveles o bloques es la siguiente:

Para cada i = 1,...,I; j = 1,...,J, 

siendo,

* Y ij el resultado del tratamiento i-ésimo, i = 1,2,...,I de T  al bloque j-ésimo, j = 1,2,...,ni.

*   es la media de toda la población. Mide el nivel medio de todos los resultados.

*  i es el efecto del tratamiento i-ésimo de T  , i = 1,2,...,I. Mide el efecto incremental del tratamiento del nivel i  de T  sobre el efecto global. Se verifica que

 i = 1I

i = 0,

*  j es el efecto del bloque j-ésimo, j = 1,2,...,J, mide el efecto incremental del tratamiento del factor secundario (bloque) sobre el efecto global ( ). Se verifica que   j = 1

Ji = 0,

*  ij es el error experimental o perturbación, son variables aleatorias

independientes idénticamente distribuidas (i.i.d.) con distribución N .

¿Cuándo es necesario hacer bloques?

El motivo de la denominación de este modelo es la siguiente: se ha agrupan las unidades experimentales en J bloques, en función de  , aleatorizado la forma de asignar los tratamientos dentro de cada bloque y es un diseño completo y equilibrado porque cada tratamiento se utiliza exactamente una vez dentro de cada bloque.

2 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

En este modelo, un bloque es un grupo de I unidades experimentales tan parecidas como sea posible con respecto a la variable  , asignándose aleatoriamente cada tratamiento a una unidad dentro de cada bloque.

> Pruebas sobre medias de tratamientos individuales

Método de la diferencia significativa mínima de Fisher

Una vez que se rechazoH 0 en el ANOVA, el problema es probar la igualdad de

todos los posibles pares de medias con la hipótesis:

En un ANOVA de un sentido se utiliza una prueba F para probar la hipótesis nula

de que todas las medias de tratamiento son iguales. Si ésta es rechazada se

puede concluir que las medias de tratamiento no son todas iguales. Pero esta

prueba no indica cuáles son diferentes del resto. A veces un experimentador

considera dos tratamientos específicos, i y j, y quiere estudiar la diferencia μi−μ j.

En este caso el método de la diferencia significativa mínima de Fisher (DSM) es

adecuado y puede usarse para construir intervalos de confianza para μi−μ j o para

probar la hipótesis nula que μi−μ j=0. Otras veces, un experimentador tal vez

desee determinar todos los pares de medias que se pueda concluir que difieren de

otro. En este caso se debe utilizar otro tipo de procedimiento que se llama método

de comparaciones múltiples. Se analizarán dos métodos de comparaciones

múltiples, el de Bonferroni y el de Tukey-Kramer.

El método de la diferencia significativa mínima de Fisher

Se inicia mediante la decripción del método DSM de Fisher para construir

intervalos de confianza de Fisher. El intervalo de confianza para la diferencia μi−μ j

se centra en la diferencia de las medias muestrales X i−X j .Determinar qué tan

ancho hacer el intervalo de confianza requiere calcular la desviación estándar de

X i−X j Sean J iy J jlos tamaños de muestra en los niveles iy j, respectivamente.

Debido al supuesto de que todas las observaciones están distribuidas

3 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

normalmente con varianza σ 2, por lo que X i−X j. Está distribuido normalmente con

media μi−μ j y varianza σ2( 1

J i

+ 1J j

)La varianza σ 2 se estima con MSE, para las

razones que se explicaron previamente en el análisis de los intervalos de

confianza para las medias de tratamiento. Ahora la cantidad

tiene una distribución t de Student con N - 1 grados de libertad. (El valor N - 1 es el

número de grados de libertad usado para calcular MSE; La cantidad

se llama diferencia significativa mínima. Esta última

constituye la base para los intervalos de confianza y las pruebas de hipótesis.

La razón de que la cantidad se llame la diferencia

significativa mínima es que la hipótesis nula de las medias iguales se rechazó con

un nivel de α siempre que la diferencia en las medias muestrales |X i−X j| supere

este valor. Cuando el diseño es balanceado, con todos los tamaños muestral

4 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

iguales a J, la diferencia significativa mínima es igual a para

todos los pares de medias.

Otros métodos para pruebas sobre la diferencia d/medias d/2 tratamientos

El método de Bonferroni de comparaciones múltiples

El método de Bonferroni, es un método general, válido siempre que

algunos intervalos de confianza o pruebas sean considerados

simultáneamente. La aplicación del método es simple. Sea C el número

de pares de las diferencias que van a compararse.

Por ejemplo, si hay I tratamientos, y todos los pares de diferencias que

van a compararse, entonces C=I (I−1) /2. El método de Bonferroni es el

mismo que el método de DSM, excepto que α se sustituye con α /C.

5 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

El método de Tukey-Kramer de comparaciones múltiples

El método de Tukey-Kramer está basado en la distribución de rango

studentizado, en lugar de la distribución t de Student. Dicha

distribución tiene dos grados de libertad como valores, que para el

método de Tukey-Kramer son Iy N−I . (En comparación, la prueba F

utiliza I−1 y N−I grados de libertad.) El método de Tukey-Kramer utiliza

el cuantil 1−αde la distribución de rango studentizado con I y N−I

grados de libertad; esta cantidad se denota por q I , N−I , α. Los

mecanismos del método de Tukey-Kramer son los mismos que los del

método de DSM, excepto que se sustituye con

Algunas veces la cantidad

6 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

se denomina diferencia

honestamente significativa (DHS), en contraparte con la diferencia

significativa mínima de Fisher.

>

Análisis de residuales y verificación del modelo

Análisis Residual (Diferencia entre el valor observado y el estimado por el modelo)

A través de los residuos, podemos aplicar ciertas pruebas para comprobar los

supuestos, tales como.

• Normalidad (mediante Gráficos de Pr.Normal y Kolmogorof, Shaphiro Wilks)

• Igualdad de Varianzas (Diagrama de Dispersión de residuos contra los

promedios de tratamientos y prueba de homogeneidad de variancia de

Levene)

7 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

> Diseño de cuadrados latinos

Hemos estudiado en el apartado anterior que los diseños en bloques completos aleatorizados utilizan un factor de control o variable de bloque con objeto de eliminar su influencia en la variable respuesta y así reducir el error experimental. Los diseños en cuadrados latinos utilizan dos variables de bloque para reducir el error experimental.

Un inconveniente que presentan a veces los diseños es el de requerir excesivas unidades experimentales para su realización. Un diseño en bloques completos con un factor principal y dos factores de bloque, con K1, K2 y K3 niveles en cada uno de los factores, requiere K1×K2×K3 unidades experimentales. En un experimento puede haber diferentes causas, por ejemplo de índole económico, que no permitan emplear demasiadas unidades experimentales, ante esta situación se puede recurrir a un tipo especial de diseños en bloques incompletos aleatorizados. La idea básica de estos diseños es la de fracción es decir, seleccionar una parte del diseño completo de forma que, bajo ciertas hipótesis generales, permita estimar los efectos que interesan.

Uno de los diseños en bloques incompletos aleatorizados más importante con dos factores de control es el modelo en cuadrado latino, dicho modelo requiere el mismo número de niveles para los tres factores.

En general, para K niveles en cada uno de los factores, el diseño completo en bloques aleatorizados utiliza K² bloques, aplicándose en cada bloque los K niveles del factor principal, resultando un total de K³ unidades experimentales. Los diseños en cuadrado latino reducen el número de unidades experimentales a K² utilizando los K² bloques del experimento, pero aplicando sólo un tratamiento en cada bloque con una disposición especial. De esta forma, si K fuese 4, el diseño en bloques completos necesitaría 4³=64 observaciones, mientras que el diseño en cuadrado latino sólo necesitaría 4²=16 observaciones.

Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer que no existe interacción entre ninguna pareja de factores.

8 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K letras latinas, de tal forma que cada letra aparece una sola vez en cada fila y en cada columna.

En resumen, podemos decir que un diseño en cuadrado latino tiene las siguientes características:

Se controlan tres fuentes de variabilidad, un factor principal y dos factores de bloque.

Cada uno de los factores tiene el mismo número de niveles, K .

Cada nivel del factor principal aparece una vez en cada fila y una vez en cada columna.

No hay interacción entre los factores.

> Diseño de cuadrados greco-latinos

El modelo en cuadrado greco-latino se puede considerar como una extensión del cuadrado latino en el que se incluye una tercera variable de control o variable de bloque. En este modelo, como en el diseño en cuadrado latino, todos los factores deben tener el mismo número de niveles K y el número de observaciones necesarias sigue siendo K2. Este diseño es, por tanto, una fracción del diseño completo en bloques aleatorizados con un factor principal y 3 factores secundarios que requeriría K4 observaciones. Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el cuadrado resultante. En el Apéndice C se muestra una tabla de cuadrados latinos que dan lugar, por superposición de dos de ellos, a cuadrados greco-latinos. Notamos que no es posible formar cuadrados greco-latinos de orden 6. La Tabla 5-8 ilustra un cuadrado greco-latino para K = 4

PLANTEAMIENTO DEL MODELO

En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita por la siguiente ecuación

9 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

Donde µ es un efecto constante, común a todas las unidades.

τi es el efecto producido por el i-ésimo nivel del factor fila. Dichos efectos están sujetos a la restricción i τi = 0.

βj es el efecto producido por el j-ésimo nivel del factor columna. Dichos efectos están sujetos a la restricción j βj = 0.

γh es el efecto producido por el h-ésimo nivel del factor letra latina. Dichos efectos están sujetos a la restricción h γh = 0.

δp es el efecto producido por el p-ésimo nivel del factor letra griega. Dichos efectos están sujetos a la restricción p δp = 0.

ǫij(hp) son variables aleatorias independientes con distribución N(0, σ).

La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para un cuadrado greco-latino especificado. Es decir, los subíndices h y p toman valores que dependen de la celdilla (i, j).

Se utiliza la siguiente notación:

N = K2 es el número total de observaciones.

El total y el promedio de todas las observaciones

10 | P á g i n aJOSUE DANIEL CASTILLO MOO

INSTITUTO TECNOLOGICO DE CAMPECHE

11 | P á g i n aJOSUE DANIEL CASTILLO MOO