Upload
beth-cntnoh
View
257
Download
0
Embed Size (px)
Citation preview
INSTITUTO TECNOLÓGICO DE CAMPECHE
INGENIERÍA INDUSTRIAL
UNIDAD III.- DISEÑO DE BLOQUES
INVESTIGACION CONCEPTUAL
JOSUÉ DANIEL CASTILLO MOO
ESTADISTICA INFERENCIAL II
GRUPO. VI4
SAN FRANCISCO DE CAMPECHE A 21 DE ABRIL DEL 2015
INSTITUTO TECNOLOGICO DE CAMPECHE
UNIDAD III.- DISEÑO DE BLOQUES
Competencias específicas a desarrollar:
- Conocer y aplicar características particulares del diseño por bloques en el diseño de experimentos de sistemas logísticos e industriales.- Interpretar los resultados, comparar métodos y seleccionar la mejor opción en la toma de decisiones.
- TEMAS DE INVESTIGACIÓN CONCEPTUAL -
Contenido> Diseño de bloques completos aleatorizados.........................................................2
Diseño y análisis estadístico.................................................................................2
¿Cuándo es necesario hacer bloques?................................................................2
> Pruebas sobre medias de tratamientos individuales.............................................3
Método de la diferencia significativa mínima de Fisher........................................3
Otros métodos para pruebas sobre la diferencia d/medias d/2 tratamientos........5
> Análisis de residuales y verificación del modelo...................................................7
> Diseño de cuadrados latinos.................................................................................7
> Diseño de cuadrados greco-latinos.......................................................................8
1 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
> Diseño de bloques completos aleatorizados
Con este diseño se quiere estudiar la influencia de un factor tratamiento (T ) con I niveles en una variable de interés en presencia de una variable extraña, el factor bloque, B , que tiene J bloques.
Diseño y análisis estadístico
La formulación matemática del modelo de diseño en bloques completamente aleatorizados con un factor principal (factor tratamiento), T , con I niveles y un factor secundario (factor bloque), B , con J niveles o bloques es la siguiente:
Para cada i = 1,...,I; j = 1,...,J,
siendo,
* Y ij el resultado del tratamiento i-ésimo, i = 1,2,...,I de T al bloque j-ésimo, j = 1,2,...,ni.
* es la media de toda la población. Mide el nivel medio de todos los resultados.
* i es el efecto del tratamiento i-ésimo de T , i = 1,2,...,I. Mide el efecto incremental del tratamiento del nivel i de T sobre el efecto global. Se verifica que
i = 1I
i = 0,
* j es el efecto del bloque j-ésimo, j = 1,2,...,J, mide el efecto incremental del tratamiento del factor secundario (bloque) sobre el efecto global ( ). Se verifica que j = 1
Ji = 0,
* ij es el error experimental o perturbación, son variables aleatorias
independientes idénticamente distribuidas (i.i.d.) con distribución N .
¿Cuándo es necesario hacer bloques?
El motivo de la denominación de este modelo es la siguiente: se ha agrupan las unidades experimentales en J bloques, en función de , aleatorizado la forma de asignar los tratamientos dentro de cada bloque y es un diseño completo y equilibrado porque cada tratamiento se utiliza exactamente una vez dentro de cada bloque.
2 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
En este modelo, un bloque es un grupo de I unidades experimentales tan parecidas como sea posible con respecto a la variable , asignándose aleatoriamente cada tratamiento a una unidad dentro de cada bloque.
> Pruebas sobre medias de tratamientos individuales
Método de la diferencia significativa mínima de Fisher
Una vez que se rechazoH 0 en el ANOVA, el problema es probar la igualdad de
todos los posibles pares de medias con la hipótesis:
En un ANOVA de un sentido se utiliza una prueba F para probar la hipótesis nula
de que todas las medias de tratamiento son iguales. Si ésta es rechazada se
puede concluir que las medias de tratamiento no son todas iguales. Pero esta
prueba no indica cuáles son diferentes del resto. A veces un experimentador
considera dos tratamientos específicos, i y j, y quiere estudiar la diferencia μi−μ j.
En este caso el método de la diferencia significativa mínima de Fisher (DSM) es
adecuado y puede usarse para construir intervalos de confianza para μi−μ j o para
probar la hipótesis nula que μi−μ j=0. Otras veces, un experimentador tal vez
desee determinar todos los pares de medias que se pueda concluir que difieren de
otro. En este caso se debe utilizar otro tipo de procedimiento que se llama método
de comparaciones múltiples. Se analizarán dos métodos de comparaciones
múltiples, el de Bonferroni y el de Tukey-Kramer.
El método de la diferencia significativa mínima de Fisher
Se inicia mediante la decripción del método DSM de Fisher para construir
intervalos de confianza de Fisher. El intervalo de confianza para la diferencia μi−μ j
se centra en la diferencia de las medias muestrales X i−X j .Determinar qué tan
ancho hacer el intervalo de confianza requiere calcular la desviación estándar de
X i−X j Sean J iy J jlos tamaños de muestra en los niveles iy j, respectivamente.
Debido al supuesto de que todas las observaciones están distribuidas
3 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
normalmente con varianza σ 2, por lo que X i−X j. Está distribuido normalmente con
media μi−μ j y varianza σ2( 1
J i
+ 1J j
)La varianza σ 2 se estima con MSE, para las
razones que se explicaron previamente en el análisis de los intervalos de
confianza para las medias de tratamiento. Ahora la cantidad
tiene una distribución t de Student con N - 1 grados de libertad. (El valor N - 1 es el
número de grados de libertad usado para calcular MSE; La cantidad
se llama diferencia significativa mínima. Esta última
constituye la base para los intervalos de confianza y las pruebas de hipótesis.
La razón de que la cantidad se llame la diferencia
significativa mínima es que la hipótesis nula de las medias iguales se rechazó con
un nivel de α siempre que la diferencia en las medias muestrales |X i−X j| supere
este valor. Cuando el diseño es balanceado, con todos los tamaños muestral
4 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
iguales a J, la diferencia significativa mínima es igual a para
todos los pares de medias.
Otros métodos para pruebas sobre la diferencia d/medias d/2 tratamientos
El método de Bonferroni de comparaciones múltiples
El método de Bonferroni, es un método general, válido siempre que
algunos intervalos de confianza o pruebas sean considerados
simultáneamente. La aplicación del método es simple. Sea C el número
de pares de las diferencias que van a compararse.
Por ejemplo, si hay I tratamientos, y todos los pares de diferencias que
van a compararse, entonces C=I (I−1) /2. El método de Bonferroni es el
mismo que el método de DSM, excepto que α se sustituye con α /C.
5 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
El método de Tukey-Kramer de comparaciones múltiples
El método de Tukey-Kramer está basado en la distribución de rango
studentizado, en lugar de la distribución t de Student. Dicha
distribución tiene dos grados de libertad como valores, que para el
método de Tukey-Kramer son Iy N−I . (En comparación, la prueba F
utiliza I−1 y N−I grados de libertad.) El método de Tukey-Kramer utiliza
el cuantil 1−αde la distribución de rango studentizado con I y N−I
grados de libertad; esta cantidad se denota por q I , N−I , α. Los
mecanismos del método de Tukey-Kramer son los mismos que los del
método de DSM, excepto que se sustituye con
Algunas veces la cantidad
6 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
se denomina diferencia
honestamente significativa (DHS), en contraparte con la diferencia
significativa mínima de Fisher.
>
Análisis de residuales y verificación del modelo
Análisis Residual (Diferencia entre el valor observado y el estimado por el modelo)
A través de los residuos, podemos aplicar ciertas pruebas para comprobar los
supuestos, tales como.
• Normalidad (mediante Gráficos de Pr.Normal y Kolmogorof, Shaphiro Wilks)
• Igualdad de Varianzas (Diagrama de Dispersión de residuos contra los
promedios de tratamientos y prueba de homogeneidad de variancia de
Levene)
7 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
> Diseño de cuadrados latinos
Hemos estudiado en el apartado anterior que los diseños en bloques completos aleatorizados utilizan un factor de control o variable de bloque con objeto de eliminar su influencia en la variable respuesta y así reducir el error experimental. Los diseños en cuadrados latinos utilizan dos variables de bloque para reducir el error experimental.
Un inconveniente que presentan a veces los diseños es el de requerir excesivas unidades experimentales para su realización. Un diseño en bloques completos con un factor principal y dos factores de bloque, con K1, K2 y K3 niveles en cada uno de los factores, requiere K1×K2×K3 unidades experimentales. En un experimento puede haber diferentes causas, por ejemplo de índole económico, que no permitan emplear demasiadas unidades experimentales, ante esta situación se puede recurrir a un tipo especial de diseños en bloques incompletos aleatorizados. La idea básica de estos diseños es la de fracción es decir, seleccionar una parte del diseño completo de forma que, bajo ciertas hipótesis generales, permita estimar los efectos que interesan.
Uno de los diseños en bloques incompletos aleatorizados más importante con dos factores de control es el modelo en cuadrado latino, dicho modelo requiere el mismo número de niveles para los tres factores.
En general, para K niveles en cada uno de los factores, el diseño completo en bloques aleatorizados utiliza K² bloques, aplicándose en cada bloque los K niveles del factor principal, resultando un total de K³ unidades experimentales. Los diseños en cuadrado latino reducen el número de unidades experimentales a K² utilizando los K² bloques del experimento, pero aplicando sólo un tratamiento en cada bloque con una disposición especial. De esta forma, si K fuese 4, el diseño en bloques completos necesitaría 4³=64 observaciones, mientras que el diseño en cuadrado latino sólo necesitaría 4²=16 observaciones.
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer que no existe interacción entre ninguna pareja de factores.
8 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K letras latinas, de tal forma que cada letra aparece una sola vez en cada fila y en cada columna.
En resumen, podemos decir que un diseño en cuadrado latino tiene las siguientes características:
Se controlan tres fuentes de variabilidad, un factor principal y dos factores de bloque.
Cada uno de los factores tiene el mismo número de niveles, K .
Cada nivel del factor principal aparece una vez en cada fila y una vez en cada columna.
No hay interacción entre los factores.
> Diseño de cuadrados greco-latinos
El modelo en cuadrado greco-latino se puede considerar como una extensión del cuadrado latino en el que se incluye una tercera variable de control o variable de bloque. En este modelo, como en el diseño en cuadrado latino, todos los factores deben tener el mismo número de niveles K y el número de observaciones necesarias sigue siendo K2. Este diseño es, por tanto, una fracción del diseño completo en bloques aleatorizados con un factor principal y 3 factores secundarios que requeriría K4 observaciones. Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el cuadrado resultante. En el Apéndice C se muestra una tabla de cuadrados latinos que dan lugar, por superposición de dos de ellos, a cuadrados greco-latinos. Notamos que no es posible formar cuadrados greco-latinos de orden 6. La Tabla 5-8 ilustra un cuadrado greco-latino para K = 4
PLANTEAMIENTO DEL MODELO
En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita por la siguiente ecuación
9 | P á g i n aJOSUE DANIEL CASTILLO MOO
INSTITUTO TECNOLOGICO DE CAMPECHE
Donde µ es un efecto constante, común a todas las unidades.
τi es el efecto producido por el i-ésimo nivel del factor fila. Dichos efectos están sujetos a la restricción i τi = 0.
βj es el efecto producido por el j-ésimo nivel del factor columna. Dichos efectos están sujetos a la restricción j βj = 0.
γh es el efecto producido por el h-ésimo nivel del factor letra latina. Dichos efectos están sujetos a la restricción h γh = 0.
δp es el efecto producido por el p-ésimo nivel del factor letra griega. Dichos efectos están sujetos a la restricción p δp = 0.
ǫij(hp) son variables aleatorias independientes con distribución N(0, σ).
La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para un cuadrado greco-latino especificado. Es decir, los subíndices h y p toman valores que dependen de la celdilla (i, j).
Se utiliza la siguiente notación:
N = K2 es el número total de observaciones.
El total y el promedio de todas las observaciones
10 | P á g i n aJOSUE DANIEL CASTILLO MOO