9
DESARROLLO DEL CAPITULO 3 1. Explique en qué consiste y cuándo se debe aplicar el diseño completamente al azar con un solo criterio de clasificación. SOLUCION Consiste en la asignación de los tratamientos en forma completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, jaulas, animales, insectos, etc.). Debido a su aleatorización irrestricta, es conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de igual tamaño, etc., de manera de disminuir la magnitud del error experimental, ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, conejos, cerdos, etc., es decir, situaciones experimentales como de las condiciones ambientales que rodean el experimento. Este diseño es el más utilizado en la experimentación con animales, asociándole la técnica del análisis de covarianza y arreglos de tratamiento de tipo factorial. 2. Supongamos que se desea probar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T de Student y al final tomar una decisión. Explique por qué esto aumenta el error tipo I. SOLUCION En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1- ) 10 = 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador. 3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento? SOLUCION

Estadistica Proyectos

Embed Size (px)

DESCRIPTION

resume de estadistica

Citation preview

Page 1: Estadistica Proyectos

DESARROLLO DEL CAPITULO 3

1. Explique en qué consiste y cuándo se debe aplicar el diseño completamente al azar con un solo criterio de clasificación.

SOLUCION

Consiste en la asignación de los tratamientos en forma completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, jaulas, animales, insectos, etc.). Debido a su aleatorización irrestricta, es conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de igual tamaño, etc., de manera de disminuir la magnitud del error experimental, ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, conejos, cerdos, etc., es decir, situaciones experimentales como de las condiciones ambientales que rodean el experimento. Este diseño es el más utilizado en la experimentación con animales, asociándole la técnica del análisis de covarianza y arreglos de tratamiento de tipo factorial.

2. Supongamos que se desea probar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T de Student y al final tomar una decisión. Explique por qué esto aumenta el error tipo I.

SOLUCION

En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1- ) 10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador.

3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?SOLUCION

Es un número real relacionado con la varianza, que mide la variación dentro de cada "factor", "tratamiento" o tipo de situación.

4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?

SOLUCION

Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos.

Page 2: Estadistica Proyectos

5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro réplicas cada uno.

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

Razón F calculada

Valor -p

TratamientoError Total

800400

a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.

SOLUCIONCompletamos el cuadro de ANOVA

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

Razón F calculada

Valor -p

TratamientoError Total

800400

1200

41519

20026.67 40 P(3.06>7.5)

b) Explique de manera esquemática cómo calcularía el valor-p o la significancia observada, para ver si hay diferencia entre tratamientos.

SOLUCION

Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el valor-p=P(F>F0)

c) ¿Con la información disponible se pueden hacer conjeturas sobre si hay diferencias significativas entre tratamientos? Argumente su respuesta.

SOLUCION

Para k=5 tratamientos se tienen en total k (k – 1)/2=10 pares de medias. Se tiene:

H0: uA = uB vs H0: uA ≠ uB

H0: uA = uC vs H0: uA ≠ uC

H0: uA = uD vs H0: uA ≠ uD

H0: uA = uE vs H0: uA ≠ uE

Page 3: Estadistica Proyectos

H0: uB = uC vs H0: uB ≠ uC

H0: uB = uD vs H0: uB ≠ uD

H0: uB = uE vs H0: uB ≠ uE

H0: uC = uD vs H0: uC ≠ uD

H0: uC = uE vs H0: uAC ≠ uE

H0: uD = uE vs H0: uD ≠ uE

Utilizando el método de LSD. En el ANOVA de la tabla propuesta se observa que los grados de libertad del error son N – k = 15, y que el cuadrado medio del error es CME = 26.67Si usamos una significancia predefinida de α = 0.05, de la tabla de la distribución T de Student con 12 grados de libertad, se obtiene que t0.025, 15 = 2.18. Como en cada tratamiento se hicieron n = 4 pruebas, entonces:

LSD=t α/2; n-k√2CME /n= 2.13√2×26.67/ 4= 7.77

Por lo tanto no se puede hacer conjeturas acerca de las diferencias significativas entre tratamientos ya que no conocemos las medias de cada tratamiento.

d) Anote el modelo estadístico y formule la hipótesis pertinente.

SOLUCION

El modelo sería el siguiente: Sea X una característica ene estudio medida en k grupos de modo que X- N (uj; ϭ2) en ala j-enésima población j=1, 2,3,…, k.Sea X1j, X2j, X3j,.., Xnj.j una muestra aleatoria seleccionada de la j-enésima población X - N (uj; ϭ2), j=1, 2,3,…, k. donde u1, u2, u3,.., uk y ϭ2 son desconocidas. El número de total de observaciones del experimento es las k muestras es

n=∑j=1

k

nj= n1+n2+…+ nk

Y supongamos que las n observaciones son independientes. En un experimento completamente aleatorizado el modelo apropiado es:

Xij=u+βj+eij , i=1; 2;…; nj , j=1; 2;…; kY la hipótesis sería la siguiente:H0: u1 = u2 =… = uk = uHA: ui ≠ uj para algún i ≠ j

Page 4: Estadistica Proyectos

6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un medio específico. Para ello se realiza un experimento, teniendo como punto de partida la misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿Estos datos son evidencia suficiente para afirmar que los niveles de pH donde se logra menor y mayor crecimiento son el 1, 3 y el 2, respectivamente? Explique su respuesta.

Nivel de pH Crecimiento promedio (en %)

123

8010575

SOLUCION

N° de experimento

Numero de replica 1 2 31 a a a234

total 3.20 4.20 3.00promedio 0.85 1.05 0.75

Por lo tanto según lo desarrollado se tiene que son más que suficiente los datos para afirmar que los niveles de pH donde se logra mayor y menor cantidad de microorganismos son el 3 y el 2.

7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en particular interesa investigar un rango de temperatura entre 60 y 120°C. Se tienen recursos para realizar 20 corridas experimentales.a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen cinco repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas.

SOLUCION

b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero las cinco del nivel bajo de temperatura, luego las cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta.

Page 5: Estadistica Proyectos

c) Para hacer el análisis estadístico se comparan, mediante una prueba T de Student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones.

¿Es adecuado tal análisis?, argumente, y en su caso proponga alternativas.

8. Describa en qué consiste cada uno de los supuestos del modelo en un análisis de varianza, y explique la forma típica en que estos supuestos se verifican.

9. ¿Qué son y cuándo se aplican las pruebas para comparar medias?

10. En una industria química se prueban diferentes mezclas para ver si difieren en cuanto al peso molecular final. Se prueban cuatro diferentes mezclas, con cinco repeticiones cada una. A continuación se muestra una parte de la tabla del análisis de varianza y los promedios obtenidos para cada mezcla.

a) ¿Las mezclas difieren de manera significativa en cuanto a su peso molecular?b) Con el análisis de varianza y de acuerdo al promedio, ¿se puede asegurar que con la mezcla B se logra un menor peso molecular? Argumente su respuesta.c) Si al verificar los supuestos de varianza constante (igual varianza entre las mezclas), éstos no se cumplen, ¿qué significa eso? ¿Se puede seguir apoyando la conclusión del inciso a)?

11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.

Marca de sprayN°de replica 1 2 3

1 72 55 642 65 59 743 67 68 614 75 70 585 62 53 516 63 50 69

a) Formule la hipótesis adecuada y el modelo estadístico.b) ¿Existe diferencia entre la efectividad promedio de los productos en

spray?c) ¿Hay algún spray mejor? Argumente su respuesta.d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.e) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.f) Verifique los supuestos de normalidad y de igual varianza entre las

marcas.

SOLUCION

Page 6: Estadistica Proyectos

Realizamos el cuadro de ANOVA para el análisis de varianza de un factor:

RESUMENGrupos Cuenta Suma Promedio Varianza

Columna 1

6 404 67.3333333

26.6666667

Columna 2

6 355 59.1666667

66.9666667

Columna 3

6 377 62.8333333

66.1666667

ANÁLISIS DE VARIANZAFuentes de las

variacionesSuma de

cuadradosGrados de

libertadPromedio

de los cuadrados

F Probabilidad

Valor crítico para

FEntre grupos 200.777778 2 100.388889 1.88464748 0.18613359 3.11232034Dentro de los grupos 799 15 53.2666667Total 999.777778 17        

a.H0: u0= u2 = u3 H1: no todos los promedios de la efectividad de los sprays son iguales

b.

Como α= 0.05 < p= 0.18, por lo tanto no se rechaza la hipótesis.Dado que F5%, 5, 12 = 3.11, como F0=1.88< F5%, 5, 12 = 3.11; entonces se acepta H0, con lo cual se concluye que no hay diferencia en la efectividad promedio de los productos de spray a un 5%.

c. No existe algún spray mejor ya que no hay diferencia alguna en los promedios, como se demostró anteriormente.

d.Intervalo de confianza para la efectividad promedio está dada por la siguiente ecuación:

I=<X j -tα/2(n-k).Sr

√nj  ; X j +tα/2(n-k).

Sr

√nj>, Si Sr=√ SCEn−k =√ 79915 =7.298

Si α= 0.05 entonces t0.025, 12=2.13

Para la marca 1: I=< 67.33-2.13.  7.298

√6  ;  67.33+2.13.  

7.298

√6  >  =  <  60.983; 

73.676>

Para la marca 2: I=< 59.167-2.13.  7.298

√6  ;  59.167+2.13.  

7.298

√6  >  = < 52.82; 

65.513>

Page 7: Estadistica Proyectos

Para la marca 3: I=< 62.833-2.13.  7.298

√6  ;  62.833+2.13.  

7.298

√6  > = <56.4869; 

69.179>e.