Introducción - UNAMDiseño de experimentos – p. 13/65 Lineamientos para diseñar experimentos 5. Elección del diseño experimental. Un bloque es un grupo de u.e. más o menos homogéneas

Diseño de experimentos – p. 1/65

Introducción


Introducción

Historia

R.A. Fisher, en la década de los 20’s, fué el iniciador delDiseño de Experimentos, con experimentos en el área deagricultura en Inglaterra. De ahí se generalizaron al área deMedicina. En la década de los 80’s tuvieron un auge en laIndustria, cuando surgió la escuela de Taguchi de Control deCalidad de procesos industriales.

Montgomery define un experimento como una prueba, o seriede pruebas, en las cuales se hacen cambios controlados a lasvariables de entrada de un proceso o sistema, para observar eidentificar las razones de los cambios en la respuesta desalida.


Introducción

Los experimentos se realizan en muchas áreas deinvestigación:

Veterinaria. Se desea saber cuál de cuatro dietas diferentesA,B,C y D proporciona mayor ganancia de peso en cerdos.

Biología. Se desea saber cuál es el efecto en el crecimientode las plantas de centeno de la aplicación de ciertas dosis deradiación en presencia de uno de tres radioprotectores.

Agricultura. Se desea saber cuál es el mejor fertilizante de ungrupo de cinco, en cuanto a rendimiento de plantas de maiz.

Industria. Se desea comparar la eficiencia de tres máquinasde hilados. La eficiencia se mide como un índice entre eltiempo que tarda la máquina en hilar una tela de cierto tamañoentre el número de errores.


Introducción

Medicina. Se desea investigar el funcionamiento de ciertadroga para aliviar el dolor de cabeza.

Pedagogía. Se quiere investigar el efecto de la T.V. en niñosde 5 a 10 años comparando sus conocimientos de losprogramas de T.V. y algunos hechos históricos.

El experimento es un estudio comparativo, longitudinal,prospectivo y experimental.

El diseño estadístico de experimentos es el proceso de"planear" el experimento de tal manera que se puedananalizar por métodos estadísticos los datos recolectadosy que resulten en conclusiones objetivas y válidas.


Lineamientos para diseñar experimentos

1. Reconocimiento y establecimiento del problema.

Esto se hace preferentemente por un equipointerdisciplinario con un estadístico en él.

■ En el ejemplo de agricultura.

Cuál de los cinco fertilizantes produce mayor rendimientoen las plantas de maíz de cierto tipo definido?

Estos cinco fertilizantes modifican su acción según el tipode maíz?. Hay interacción?

Qué dosis de fertilizante es más efectiva para aumentarel rendimiento?



2. Definir factores, niveles. Equipo interdisciplinario.

■ Factor: es la característica cuyo efecto queremosestudiar.En el ejemplo, un solo factor: Fertilizante.

■ Nivel: es la categoría estudiada del factor.En el ejemplo, cinco niveles: fertilizante A, B, C, D y E.

■ Tratamiento: Combinación de niveles de los factoresestudiados. Otro ejemplo,

Factor fertilizante: A,B,C,D,E.

Factor Cantidad de agua: 1,2,3.

Tratamientos: A1, B1,...,E3.



Los tratamientos seleccionados deben ser de una naturalezatal que puedan ser reproducidos en gran escala.Por ejemplo, no tiene sentido práctico estudiar el tratamientoque es poner el fertilizante a mano en cada plantita de maiz.A esto se le llama practicabilidad de los tratamientos.

También es importante considerar un tratamiento que es norecibir ningún fertilizante o recibir el habitual, a éste se lellama:tratamiento testigo o control.



3. Definir la unidad experimental (u.e.)

La unidad experimental es la subdivisión menor delmaterial experimental que puede recibir un tratamiento enforma independiente.

Un aspecto importante es la representatividad de las u.e.Esto es, las u.e. deberán ser reproducciones decondiciones comerciales o de gran escala.

Así, una planta de maíz para comparar fertilizantes no esrepresentativa.



En un experimento médico, si se tienen en un cuarto cincopacientes con bronquitis y a cada uno de ellos se les dátratamiento diferente (cada paciente es una u.e.) y si untratamiento no es efectivo, dicho paciente es un foco deinfección para los demás, por lo que contaminaria todo elexperimento.

La solución es un grupo de pacientes por cuarto como u.e. oun paciente en cada cuarto como u.e.

Unidades experimentales grandes producen menosvariabilidad, sin embargo, el tamaño de las u.e. debeconsiderarse en forma simultánea con el tamaño de muestra yel costo.

Es más efectivo aumentar el tamaño de muestra que eltamaño de las u.e.

El tamaño de muestra es el número de u.e. que reciben elmismo tratamiento.



4. Definir la variable de respuesta.

La variable de respuesta es lo que se va a medir en cadaunidad experimental.

Se debe estar seguro que dé información útil acerca delfenómeno estudiado.

En el ejemplo, Kg. de maíz

No es raro que se mida más de una variable de interésprimario: kg. de maíz, kg. de hojas, etc. Esto se estudiacon técnicas de análisis multivariado.

Se debe tener cuidado en la toma de las mediciones paraeliminar sesgos introducidos por operaciones conscienteso inconscientes.

En medicina, se recomienda que ni los sujetos (u.e.) ni losmédicos que toman las mediciones conozcan lostratamientos asignados a cada u.e., a esto se le llamamétodo de doble ciego.



5. Elección del diseño experimental.

El diseño experimental es la forma de asignar lostratamientos a las unidades experimentales.

El diseño determina el modelo y el análisis estadístico aseguir.

Aleatorización. Introducida por Fisher, sirve para"controlar" factores de variación no incluída en el modeloen forma explícita. Se busca eliminar sesgos sistemáticos yjustificar la independencia de los errores.



Otro ejemplo en Agronomía:

Aleatorizamos dentro de cada bloque (una restricción a laaleatorización). Cada uno de los tratamientos los tenemos encada una de las dos condiciones de terreno.



5. Elección del diseño experimental.

Un bloque es un grupo de u.e. más o menos homogéneas.

El uso de bloques es la inclusión en el diseño (modelo) deun factor que, aunque no es de interés, se sabe que puedecausar una fuerte variación en la u.e.

En general, los factores de bloqueo más importantes sonlas posiciones en el tiempo y en el espacio.

El uso de bloques tiene como objetivo el control de factoresde variación en forma explícita en el modelo, disminuyendoasí la varianza de los errores.



6. Determinación del número de repeticiones.

Las repeticiones (réplicas) son el número de u.e. a las quese les aplica, en forma independiente , un tratamiento.

■ Dan una estimación de la varianza del error experimental■ Incrementan la precisión del experimento. A mayor

número de repeticiones menor la varianza de losestimadores.

7. Hacer el experimento y colectar datos.

El estadístico solo asesora.

8. Efectuar el análisis estadístico.

9. Obtención de conclusiones.

El estadístico auxilia.


Error experimental

El error experimental describe la variación entre u.e. idéntica eindependientemente tratadas.

Se origina por:

1. Variación natural entre u.e.

2. Variabilidad en la medición de la respuesta

3. Incapacidad de reproducir las condiciones de lostratamientos exactamente de una u.e. a otra

4. Interacción de tratamientos y u.e.

5. Cualquier otro factor externo que afecte las característicasmedidas

Lo que se busca es tener un diseño que minimice la varianzadel error experimental.


Repaso

El objetivo de la inferencia estadística es obtener conclusionesacerca de una población usando una muestra de esapoblación.

Muestra aleatoria. Sean n variables aleatorias x1, x2, . . . , xn

independientes conjuntamente, todas con la misma función dedensidad f(x). Se dice que x1, x2, . . . , xn es una muestraaleatoria de tamaño n de f(x). La densidad conjunta de las nvariables aleatorias es:

g(x1, x2, . . . , xn) = f(x1)f(x2) · · · f(xn)

Nota. x1, x2, . . . , xn son v.a.i.i.d. y forman unamuestra aleatoria de f(x)

Nota. En este curso, a diferencia del de Muestreo,supondremos que trabajamos con poblaciones infinitaso potencialmente infinitas, entonces la definición dem.a.s. no aplica.


Repaso

Estadística. Una función de la muestra que no contieneparámetros desconocidos.

Estimador. Es una estadística usada para estimar unparámetro desconocido de la población.

Estimación. Es un valor numérico particular de un estimador,calculado en una muestra.

Hay algunas características que se requieren para ser un buenestimador. Dos de las más importantes:

1. Insesgamiento. Un estimador es insesgado cuando suvalor esperado es el parámetro que está estimando.Aunque es deseable el insesgamiento, esta propiedad porsi sola no garantiza un buen estimador.

2. Varianza mínima. El estimador de varianza mínima tieneuna varianza que es menor que la de cualquier otroestimador del parámetro.


Repaso

Suponga y1, y2, . . . , yn una m.a. de fY (y) con E(yi) = µ yV (yi) = σ2.

Sean y =∑

ni=1

yi

n y S2 =∑

ni=1

(yi−y)2

n−1 dos estimadores.

E(y) = E

(∑ni=1 yi

n

)

=1

nE

(

n∑

i=1

yi

)

=1

n

n∑

i=1

E(yi)

=1

nnµ = µ

y es un estimador insesgado de µ.


Repaso

E(

S2)

= E

[

n∑

i=1

(yi − y)2

n − 1

]

=1

n − 1E

[

n∑

i=1

(yi − y)2

]

=1

n − 1E [SS]

donde SS =∑n

i=1(yi − y)2 es la Suma de Cuadradoscorregida de las observaciones.

E (SS) = E

[

n∑

i=1

(yi − y)2

]

= E

[

n∑

i=1

y2i − ny2

]

=

n∑

i=1

E(y2i ) − nE(y2)


Repaso

Por otro lado:

V (y) = E[

(y − E(y))2]

= E[

y2 − 2yE(y) + [E(y)]2]

= E[

y2]

− 2E(y)E(y) + [E(y)]2

= E[

y2]

− [E(y)]2

σ2 = E[

y2]

− µ2

por lo tanto

E(y2) = σ2 + µ2


Repaso

Y por otro:

V (y) = V

(

1

n

n∑

i=1

yi

)

=1

n2V

(

n∑

i=1

yi

)

=iid 1

n2

n∑

i=1

V (yi)

=1

n2nσ2 =

σ2

n.

Entonces,

V (y) = E(

y2)

− [E(y)]2

E(

y2)

= V (y) + [E(y)]2

= σ2/n + µ2.


Repaso

Regresando,

E (SS) =

n∑

i=1

E(y2i ) − nE(y2)

=

n∑

i=1

(µ2 + σ2) − n(µ2 + σ2/n)

= nµ2 + nσ2 − nµ2 − σ2

= (n − 1)σ2

Por lo tanto,

E(

S2)

=1

n − 1E (SS) =

1

n − 1(n − 1)σ2 = σ2

S2 es un estimador insesgado de σ2.


Repaso

Distribución muestral. Es la distribución de probabilidad deuna estadística.Se puede determinar la distribución muestral de unaestadística si conocemos la distribución de probabilidad de lapoblación de la que se extrajo la muestra.


Distribuciones (algunas)


Normal

Si y ∼ N(µ, σ2) entonces:

f(y) =1

σ√

2πe−

1

2σ2(y−µ)2 −∞ < y < ∞

−∞ < µ < ∞σ2 > 0

5 10 15 20

0.1

0.2

0.3

0.4

NH10,9L

NH10,4L

NH10,1L


Normal

Si y ∼ N(µ, σ2) entonces:

z =y − µ

σ∼ N(0, 1)

Muchas técnicas estadísticas suponen que la variablealeatoria en cuestión se distribuye normalmente. El TeoremaCentral del Límite es muchas veces una justificación parasuponer normalidad.

Teorema Central del Límite.

Sean x1, x2, . . . , xn v.a.i.i.d de una función de probabilidadfX(x) con media µ y varianza σ2.

Sea x = x1+x2+...+xn

n , para un tamaño de muestra grande n ,la distribución de x es aproximadamente:

x∼N(µ, σ2/n) ó√

n(x − µ)

σ∼N(0, 1)


Ji-cuadrada

Una distribución muestral que se puede definir a través de v.a.normales es la distribución Ji-cuadrada χ2

Si z1, z2, . . . , zk son v.a.i.i.d. N(0, 1) entonces:

x = z21 + z2

2 + . . . + z2k

tiene una distribución χ2k.

La densidad tiene la forma:

f(x) =1

2k/2Γ(k2 )

xk/2−1e−x/2 x > 0


Ji-cuadrada

5 10 15 20 25 30

0.025

0.05

0.075

0.1

0.125

0.15

ΧH15L

ΧH10L

ΧH5L


Ji-cuadrada

La distribución es asimétrica con µ = k y σ2 = 2k.

Un ejemplo de v.a. con distribución Ji-cuadrada es elsiguiente:

Suponga que y1, y2, . . . , yn es una m.a. de N(µ, σ2), entonces:

SS

σ2=

∑ni=1(yi − y)2

σ2∼ χ2

n−1


t-Student

Si z tiene distribución normal estándar y x tiene distribución χ2k

y z y x son independientes, entonces la v.a.

t =z

√

x/k∼ tk

La función de densidad tiene la forma:

f(t) =Γ[(k + 1)/2]√

kπΓ(k/2)

1

[(t2/k) + 1](k+1)/2

−∞ < t < ∞

La distribución es simétrica con µ = 0 y σ2 = k/(k − 2) parak > 2.


t-Student

-6 -4 -2 2 4 6

0.1

0.2

0.3

0.4

tH30L

tH2L

tH1L


t-Student

Un ejemplo de v.a. con distribución t es:

Si y1, y2, . . . , yn es una m.a. de N(µ, σ2) entonces:

t =y − µ

S/√

n∼ tn−1

donde,

S =

√

∑ni=1(yi − y)2

n − 1


Distribución F

Si χ2u y χ2

v son dos v.a. χ2 independientes con u y v g.l.respectivamente, entonces

F =χ2

u/u

χ2v/v

∼ Fu,v


Distribución F

Como ejemplo de una estadística que se distribuye como F ,suponga que tenemos dos poblaciones normalesindependientes con varianza común σ2, es decir,

y11, y12, . . . , y1n1es una m.a. de la primera población

y21, y22, . . . , y2n2es una m.a. de la segunda población

entonces,S2

1

S22

∼ Fn1−1,n2−1

donde

S21 =

∑n1

i=1(y1i − y1)2

n1 − 1y S2

2 =

∑n2

i=1(y2i − y2)2

n2 − 1


Distribución F

Sabemos que:

S21 =

SS1

n1 − 1y S2

2 =SS2

n2 − 1

ySS1

σ2=

(n1 − 1)S21

σ2∼ χ2

n1−1

SS2

σ2=

(n2 − 1)S22

σ2∼ χ2

n2−1

Por lo tanto:

(n1−1)S2

1

(n1−1)σ2

(n2−1)S2

2

(n2−1)σ2

∼ Fn1−1,n2−1


Pruebas de hipótesis


Primero un ejemplo

Un ingeniero desea comparar la resistencia de una fórmulamodificada de cemento a la cual se le agrega látex durante elmezclado. Se tienen diez observaciones de la resistencia parala fórmula modificada y otras diez para la fórmula usual.

mezcla modificada mezca sin modificarj kgf/cm2 (y1j) kgf/cm2 (y2j)

1 16.85 17.502 16.40 17.633 17.21 18.254 16.35 18.005 16.52 17.866 17.04 17.757 16.96 18.228 17.15 17.909 16.59 17.96

10 16.57 18.15


Primero un ejemplo

Factor: fórmula con dos niveles: modificada(1) y usual(2). Dostratamientos 10 repeticiones y1 = 16.76 y y2 = 17.92.


Primero un ejemplo

Los promedios de resistencia son diferentes entre estas dosmuestras, sin embargo, no es obvio que esta diferencia sea losuficientemente grande para que implique que las dosfórmulas son "realmente" diferentes.

Tal vez esta diferencia observada en los promedios deresistencia es el resultado de fluctuaciones muestrales y quelas dos fórmulas son realmente iguales. Posiblemente otrasdos muestras podrían dar resultados opuestos.

Para probar si las dos fórmulas son iguales o no, se utiliza unatécnica de estadística inferencial llamada Prueba de Hipótesis,la cual permite hacer la comparación de las dos fórmulas entérminos objetivos, con el conocimiento del riesgo asociado allegar a una conclusión errónea.


Prueba de hipótesis con un ejemplo

Primero, necesitamos establecer un modelo para los datos:

yij = µi + ǫij i = 1, 2 j = 1, . . . , 10

donde

yij es la j-ésima observación del i-ésimo tratamiento

µi es la media de la respuesta en el tratamiento i, i = 1, 2

ǫij es el error asociado a la ij-ésima observación.

Suponga que ǫij ∼ NID(0, σ2) i = 1, 2 j = 1, . . . , 10.

Esto implica que

yij ∼ NID(µi, σ2) i = 1, 2 j = 1, . . . , 10.



5 10 15 20 25 30

0.05

0.1

0.15

0.2

trat 2

trat 1



Lo que interesa probar es:

H0 : µ1 = µ2 hipótesis nula

vs.

Ha : µ1 6= µ2 hipótesis alternativa dos colas

µ1 < µ2 ó µ1 > µ2

Para probar una hipótesis necesitamos una estadística deprueba y especificar una región de rechazo o región crítica,que es el conjunto de valores de la estadística de prueba quellevan a rechazar la hipótesis nula.



Se pueden cometer dos tipos de error al probar una hipótesis:

situación real (desconocida)H0 es cierta H0 no es cierta

rechazar H0 error Tipo Iconclusiónestadística

no rechazar H0 error Tipo II

α = P (error tipo I) = P (rechazar H0 |H0 es cierta)

β = P (error tipo II) = P (no rechazar H0 |H0 no es cierta)



El procedimiento general en pruebas de hipótesis esespecificar un valor de α, llamado nivel de significancia de laprueba y diseñar el procedimiento de tal manera que β seapequeño.

Regresando al ejemplo.

y1 = 16.764 y2 = 17.992

S1 = 0.3164 S2 = 0.2479

S21 = 0.100 S2

2 = 0.061

n1 = 10 n2 = 10


Construcción de la estadística de prueba

Suponga, por el momento, que las varianzas de las dospoblaciones son iguales. Es decir,

y1j ∼ NID(µ1, σ2) y2j ∼ NID(µ2, σ

2) j = 1, . . . , 10

y1 ∼ N(µ1, σ2/n1) y2 ∼ N(µ2, σ

2/n2)

Si las dos poblaciones son independientes, entonces:

y1 − y2 ∼ N

(

µ1 − µ2, σ2

(

1

n1+

1

n2

))

Si σ2 es conocida y si H0 : µ1 = µ2 es cierta, entonces:

z0 =y1 − y2−(µ1 − µ2)

σ√

1n1

+ 1n2

∼ N (0, 1)


Construcción de la estadística de prueba

Si no conocemos σ2, entonces se utiliza la estadística deprueba:

t0 =y1 − y2

Sp

√

1n1

+ 1n2

∼ tn1+n2−2

donde,

S2p =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2(pooled)


Región de rechazo

Para determinar la región de rechazo, es decir, los valores dela estadística de prueba que llevan a rechazar H0, se fijaprimero el nivel de significancia α.


Región de rechazo

Se compara t0 con t1−α/2n1+n2−2 porcentil (1 − α/2) de la

distribución t con n1 + n2 − 2 g.l.

Si |t0| > t1−α/2n1+n2−2 se rechaza H0.

Esto es, si H0 es cierta entonces t0 ∼ tn1+n2−2 yesperaríamos que el 100(1 − α)% de los valores de t0 cayeranentre tα/2 y t1−α/2.

Si una muestra produce un valor de t0 fuera de estos límites,sería "extraño" si la hipótesis nula es cierta, por lo que esevidencia de que H0 se debe rechazar.


De vuelta al ejemplo

Haciendo los cálculos del ejemplo:

t0 =y1 − y2

Sp

√

1n1

+ 1n2

=16.76 − 17.92

0.284√

210

= −9.13

Si fijamos α = 0.05 entonces rechazamos H0 si

|t0| > t0.97518 = 2.101

Como 9.13 > 2.101 entonces, rechazamos H0 al 5% de nivelde significancia. Y concluímos que en promedio, la resistenciade las dos fórmulas es diferente.


p-value

Esta es una forma de reportar los resultados, es decir, lahipótesis nula se rechazó o no se rechazó a un nivel designificancia α especificado.

Sin embargo, esto no dá al investigador idea de si el valorcalculado de la estadística de prueba estaba en la frontera dela región crítica o si estaba muy adentro de ésta. Para eliminaresta deficiencia se utiliza el p-value.

El p-value (significancia observada) es la probabilidad, si lahipótesis nula es cierta, de que la estadística de pruebaresulte en un valor tan extremo como el observado o más.


Suposiciones de la prueba t

■ Ambas muestras provienen de poblaciones independientesy que pueden ser descritas por distribuciones normales.

■ Las varianzas de ambas poblaciones son iguales.■ Las observaciones son independientes.

Las suposiciones de independencia se pueden satisfacer através del diseño.

La suposición de normalidad se verifica a través de gráficas enpapel normal o la prueba de Kolmogorov-Smirnov, entre otras.


Intervalos de confianza

Aunque las pruebas de hipótesis son una herramienta muy útil,algunas veces no dan todo el panorama. A veces es preferibledar un intervalo en el que esperamos que esté el verdaderovalor del parámetro. O puede suceder que el investigador yasabe que las medias µ1 y µ2 son diferentes, pero quiere saberqué tan diferentes pueden ser.

Suponga que θ es un parámetro desconocido. Para construirun intervalo de confianza para θ necesitamos dos estadísticasL y U tales que:

P (L ≤ θ ≤ U) = 1 − α

El intervalo (L, U) es llamado intervalo del (1 − α)100% deconfianza para el parámetro θ.



La interpretación de este intervalo es:

Si en un número grande de muestreos repetidos se construyenintervalos de confianza para θ, entonces el (1 − α)100% deéstos contendrán al verdadero valor de θ.

L y U son los límites de confianza, inferior y superior.

1 − α es el coeficiente de confianza.

Los intervalos de confianza tienen una interpretaciónfrecuentista, esto es, no sabemos si la aseveración es ciertapara esta muestra específica, pero sabemos que el métodousado para calcular el intervalo de confianza produceaseveraciones correctas el (1 − α)100% de las veces.



Para el caso que estamos tratando de dos poblaciones normalesindependientes, el intervalo de confianza para µ1 − µ2 se construye de lasiguiente manera:

y1 − y2 − (µ1 − µ2)

Sp

√

1n1

+ 1n2

∼ tn1+n2−2

P

−t(1−α/2)n1+n2−2 ≤ y1 − y2 − (µ1 − µ2)

Sp

√

1n1

+ 1n2

≤ t(1−α/2)n1+n2−2

= 1 − α

P

(

y1 − y2 − t(1−α/2)n1+n2−2Sp

√

1

n1+

1

n2≤ µ1 − µ2

≤ y1 − y2 + t(1−α/2)n1+n2−2Sp

√

1

n1+

1

n2

)

= 1 − α



Un intervalo del (1 − α)100% de confianza para µ1 − µ2 es:[

(y1 − y2) − t(1−α/2)n1+n2−2Sp

√

1

n1+

1

n2, (y1 − y2) + t

(1−α/2)n1+n2−2Sp

√

1

n1+

1

n2

]

Regresando al ejemplo del problema del cemento:

y1 = 16.76 y2 = 17.92

Sp = 0.284 n1 = n2 = 10

t0.97518 = 2.101

El intervalo es: (−1.43,−0.89).

Note que si el valor 0 (cero) no está incluído en el intervaloimplica que los datos no sostienen la hipótesis de que µ1 = µ2

al 5% de nivel de significancia.


Prueba de hipótesis cuando σ2

1 6= σ2

2

Si estamos probando

H0 : µ1 = µ2 vs. Ha : µ1 6= µ2

y no podemos suponer que las varianzas σ21 y σ2

2 son iguales,la prueba t se modifica. La estadística de prueba es ahora:

t0 =y1 − y2

√

S2

1

n1

+S2

2

n2

.

Esta estadística no se distribuye exactamente como una t. Sinembargo, se aproxima muy bien a una t si usamos comogrados de libertad:

ν =

(

S2

1

n1

+S2

2

n2

)2

(S2

1/n1)

2

n1−1 +(S2

2/n2)

2

n2−1


Datos apareados

En algunos experimentos podemos mejorar grandemente laprecisión haciendo comparaciones con u.e. apareadas.

Ejemplo: Suponga que se tiene una máquina que prueba ladureza de un metal al presionar una varilla con una punta en elmetal, aplicando una fuerza conocida.

Se determina la dureza del metal midiendo la profundidad dela depresión causada por la punta.

Se tienen 2 puntas y se sospecha que las mediciones hechaspor las dos puntas producen lecturas diferentes, a pesar deque la precisión (variabilidad) de las mediciones pareceniguales.


Datos apareados

Se lleva a cabo primero el siguiente experimento:

Se seleccionan 20 especímenes de metal. Diez de ellos semedirán con la punta 1 y los otros 10 con la punta 2. Laasignación de los especímenes a las puntas es aleatorio.

Este es un diseño completamente al azar.

Punta 1 Punta 2

7,3,3,4,8, 6,3,5,3,8,3,2,9,5,4 2,4,9,4,5y1 = 4.80 y2 = 4.90

S21 = (2.39)2 S2

2 = (2.23)2


Datos apareados

S2p =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2= 5.3425

t0 =y1 − y2

Sp

√

1n1

+ 1n2

= −0.09674

Si |t0| > t1−α/218 rechazamos H0 : µ1 = µ2

t1−α/218 = 2.101 por lo tanto no rechazamos H0.

p-value=0.924.

En este ejemplo puede haber una desventaja al hacerlo conun diseño completamente al azar. Suponga que losespecímenes de metal fueron cortados de diferentes lotes quefueron producidos con diferentes temperaturas o que no sonhomogéneos en algun factor que puede afectar su dureza.

Esta falta de homogeneidad contribuirá a las mediciones dedureza y tenderá a aumentar el error experimental, haciendoque la verdadera diferencia entre las puntas sea difícil dedetectar.


Datos apareados

Para solventar este problema, considere un diseñoexperimental alternativo.

Suponga que cada especimen de metal es lo suficientementegrande para que se puedan hacer 2 determinaciones dedureza en él.

Este diseño consistirá en dividir cada especimen en dospartes, luego se asigna aleatoriamente una punta a una de lasmitades y la otra punta a la otra mitad. El orden en el cual seprueban las puntas es aleatorio también.


Datos apareados

Especimen Punta 1 Punta 2 dj

1 7 6 12 3 3 03 3 5 -24 4 3 15 8 8 06 3 2 17 2 4 -28 9 9 09 5 4 1

10 4 5 -1


Datos apareados

El modelo estadístico que describe los datos de experimentoes:

yij = µi + βj + ǫij i = 1, 2 j = 1, . . . , 10

donde

yij es la observación de dureza para la punta i en elespecimen j.

µi es la media verdadera de dureza de la punta i.

βj es el efecto del especimen j.

ǫij es el error experimental y suponemos que se distribuyeN(0, σ2)


Datos apareados

Sidj = y1j − y2j j = 1, . . . , 10

entonces

µd = E(dj) = E(y1j − y2j) = E(y1j) − E(y2j)

= µ1 + βj − (µ2 + βj)

= µ1 − µ2 (se cancela el efecto de βj)

Entonces, H0 : µ1 = µ2 vs. Ha : µ1 6= µ2 es equivalente aprobar

H0 : µd = 0 vs. Ha : µd 6= 0

De aquí surge la prueba t para datos apareados. Laestadística de prueba es:

t0 =d

Sd/√

n


Datos apareados

donde d = 1n

∑

j dj y S2d =

∑

(dj−d)2

n−1 .

Haciendo cálculos, tenemos

d = −0.10 Sd = 1.20 t0 = −0.26

Si |t0| > t1−α/2n−1 se rechaza H0.

t0.9759 = 2.262 p-value = 0.798

No se rechaza H0.


Comparación de los dos diseños

Completamente al azar Apareado (Bloques al azar)

18 g.l. 9 g.l.

Sp = 2.31 Sd = 1.20

µ1 − µ2 ∈ (−0.10 ± 2.18) µd ∈ (−0.10 ± 0.86)

Al hacer el experimento apareado se "perdieron" 9 g.l. lo queimplica que la prueba es menos sensible, sin embargo, seredujo la estimación de la variabilidad lo que implica intervalosde confianza más angostos, es decir, más precisión.

Documents

Introducción - UNAMDiseño de experimentos – p. 13/65 Lineamientos para diseñar experimentos 5. Elección del diseño experimental. Un bloque es un grupo de u.e. más o menos homogéneas