Upload
axl-malaver
View
673
Download
19
Embed Size (px)
DESCRIPTION
resume de estadistica
Citation preview
DESARROLLO DEL CAPITULO 3
1. Explique en qué consiste y cuándo se debe aplicar el diseño completamente al azar con un solo criterio de clasificación.
SOLUCION
Consiste en la asignación de los tratamientos en forma completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, jaulas, animales, insectos, etc.). Debido a su aleatorización irrestricta, es conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de igual tamaño, etc., de manera de disminuir la magnitud del error experimental, ocasionado por la variación intrínseca de las unidades experimentales. Este diseño es apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, conejos, cerdos, etc., es decir, situaciones experimentales como de las condiciones ambientales que rodean el experimento. Este diseño es el más utilizado en la experimentación con animales, asociándole la técnica del análisis de covarianza y arreglos de tratamiento de tipo factorial.
2. Supongamos que se desea probar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T de Student y al final tomar una decisión. Explique por qué esto aumenta el error tipo I.
SOLUCION
En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1- ) 10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador.
3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?SOLUCION
Es un número real relacionado con la varianza, que mide la variación dentro de cada "factor", "tratamiento" o tipo de situación.
4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?
SOLUCION
Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos.
5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro réplicas cada uno.
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F calculada
Valor -p
TratamientoError Total
800400
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.
SOLUCIONCompletamos el cuadro de ANOVA
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio
Razón F calculada
Valor -p
TratamientoError Total
800400
1200
41519
20026.67 40 P(3.06>7.5)
b) Explique de manera esquemática cómo calcularía el valor-p o la significancia observada, para ver si hay diferencia entre tratamientos.
SOLUCION
Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el valor-p=P(F>F0)
c) ¿Con la información disponible se pueden hacer conjeturas sobre si hay diferencias significativas entre tratamientos? Argumente su respuesta.
SOLUCION
Para k=5 tratamientos se tienen en total k (k – 1)/2=10 pares de medias. Se tiene:
H0: uA = uB vs H0: uA ≠ uB
H0: uA = uC vs H0: uA ≠ uC
H0: uA = uD vs H0: uA ≠ uD
H0: uA = uE vs H0: uA ≠ uE
H0: uB = uC vs H0: uB ≠ uC
H0: uB = uD vs H0: uB ≠ uD
H0: uB = uE vs H0: uB ≠ uE
H0: uC = uD vs H0: uC ≠ uD
H0: uC = uE vs H0: uAC ≠ uE
H0: uD = uE vs H0: uD ≠ uE
Utilizando el método de LSD. En el ANOVA de la tabla propuesta se observa que los grados de libertad del error son N – k = 15, y que el cuadrado medio del error es CME = 26.67Si usamos una significancia predefinida de α = 0.05, de la tabla de la distribución T de Student con 12 grados de libertad, se obtiene que t0.025, 15 = 2.18. Como en cada tratamiento se hicieron n = 4 pruebas, entonces:
LSD=t α/2; n-k√2CME /n= 2.13√2×26.67/ 4= 7.77
Por lo tanto no se puede hacer conjeturas acerca de las diferencias significativas entre tratamientos ya que no conocemos las medias de cada tratamiento.
d) Anote el modelo estadístico y formule la hipótesis pertinente.
SOLUCION
El modelo sería el siguiente: Sea X una característica ene estudio medida en k grupos de modo que X- N (uj; ϭ2) en ala j-enésima población j=1, 2,3,…, k.Sea X1j, X2j, X3j,.., Xnj.j una muestra aleatoria seleccionada de la j-enésima población X - N (uj; ϭ2), j=1, 2,3,…, k. donde u1, u2, u3,.., uk y ϭ2 son desconocidas. El número de total de observaciones del experimento es las k muestras es
n=∑j=1
k
nj= n1+n2+…+ nk
Y supongamos que las n observaciones son independientes. En un experimento completamente aleatorizado el modelo apropiado es:
Xij=u+βj+eij , i=1; 2;…; nj , j=1; 2;…; kY la hipótesis sería la siguiente:H0: u1 = u2 =… = uk = uHA: ui ≠ uj para algún i ≠ j
6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un medio específico. Para ello se realiza un experimento, teniendo como punto de partida la misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿Estos datos son evidencia suficiente para afirmar que los niveles de pH donde se logra menor y mayor crecimiento son el 1, 3 y el 2, respectivamente? Explique su respuesta.
Nivel de pH Crecimiento promedio (en %)
123
8010575
SOLUCION
N° de experimento
Numero de replica 1 2 31 a a a234
total 3.20 4.20 3.00promedio 0.85 1.05 0.75
Por lo tanto según lo desarrollado se tiene que son más que suficiente los datos para afirmar que los niveles de pH donde se logra mayor y menor cantidad de microorganismos son el 3 y el 2.
7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en particular interesa investigar un rango de temperatura entre 60 y 120°C. Se tienen recursos para realizar 20 corridas experimentales.a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen cinco repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas.
SOLUCION
b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero las cinco del nivel bajo de temperatura, luego las cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta.
c) Para hacer el análisis estadístico se comparan, mediante una prueba T de Student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones.
¿Es adecuado tal análisis?, argumente, y en su caso proponga alternativas.
8. Describa en qué consiste cada uno de los supuestos del modelo en un análisis de varianza, y explique la forma típica en que estos supuestos se verifican.
9. ¿Qué son y cuándo se aplican las pruebas para comparar medias?
10. En una industria química se prueban diferentes mezclas para ver si difieren en cuanto al peso molecular final. Se prueban cuatro diferentes mezclas, con cinco repeticiones cada una. A continuación se muestra una parte de la tabla del análisis de varianza y los promedios obtenidos para cada mezcla.
a) ¿Las mezclas difieren de manera significativa en cuanto a su peso molecular?b) Con el análisis de varianza y de acuerdo al promedio, ¿se puede asegurar que con la mezcla B se logra un menor peso molecular? Argumente su respuesta.c) Si al verificar los supuestos de varianza constante (igual varianza entre las mezclas), éstos no se cumplen, ¿qué significa eso? ¿Se puede seguir apoyando la conclusión del inciso a)?
11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.
Marca de sprayN°de replica 1 2 3
1 72 55 642 65 59 743 67 68 614 75 70 585 62 53 516 63 50 69
a) Formule la hipótesis adecuada y el modelo estadístico.b) ¿Existe diferencia entre la efectividad promedio de los productos en
spray?c) ¿Hay algún spray mejor? Argumente su respuesta.d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.e) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.f) Verifique los supuestos de normalidad y de igual varianza entre las
marcas.
SOLUCION
Realizamos el cuadro de ANOVA para el análisis de varianza de un factor:
RESUMENGrupos Cuenta Suma Promedio Varianza
Columna 1
6 404 67.3333333
26.6666667
Columna 2
6 355 59.1666667
66.9666667
Columna 3
6 377 62.8333333
66.1666667
ANÁLISIS DE VARIANZAFuentes de las
variacionesSuma de
cuadradosGrados de
libertadPromedio
de los cuadrados
F Probabilidad
Valor crítico para
FEntre grupos 200.777778 2 100.388889 1.88464748 0.18613359 3.11232034Dentro de los grupos 799 15 53.2666667Total 999.777778 17
a.H0: u0= u2 = u3 H1: no todos los promedios de la efectividad de los sprays son iguales
b.
Como α= 0.05 < p= 0.18, por lo tanto no se rechaza la hipótesis.Dado que F5%, 5, 12 = 3.11, como F0=1.88< F5%, 5, 12 = 3.11; entonces se acepta H0, con lo cual se concluye que no hay diferencia en la efectividad promedio de los productos de spray a un 5%.
c. No existe algún spray mejor ya que no hay diferencia alguna en los promedios, como se demostró anteriormente.
d.Intervalo de confianza para la efectividad promedio está dada por la siguiente ecuación:
I=<X j -tα/2(n-k).Sr
√nj ; X j +tα/2(n-k).
Sr
√nj>, Si Sr=√ SCEn−k =√ 79915 =7.298
Si α= 0.05 entonces t0.025, 12=2.13
Para la marca 1: I=< 67.33-2.13. 7.298
√6 ; 67.33+2.13.
7.298
√6 > = < 60.983;
73.676>
Para la marca 2: I=< 59.167-2.13. 7.298
√6 ; 59.167+2.13.
7.298
√6 > = < 52.82;
65.513>
Para la marca 3: I=< 62.833-2.13. 7.298
√6 ; 62.833+2.13.
7.298
√6 > = <56.4869;
69.179>e.