Upload
rosa-leon
View
539
Download
1
Embed Size (px)
Citation preview
PRCTICA DIRIGIDA DE ESTADISTICA II
TEMA: Estadstica no Paramtrica: Experimentos multinomiales: Bondad de ajuste. _____________________________________________________________________________________ Instructivo: Los ejercicios que se presentan a continuacin se usarn en clase tomando algunos de
ellos con fines de demostracin y los otros deben ser resueltos por los estudiantes y presentados en clase. Es necesario que impriman esta prctica para desarrollarla en clase.
11-2 DESTREZAS Y CONCEPTOS BSICOS
Conocimientos estadsticos y pensamiento crtico
1. Bondad de ajuste. A qu nos referimos cuando decimos que hacemos una prueba de la "bondad de
ajuste"?
2. Prueba de cola derecha. Por qu la prueba de hiptesis para la bondad de ajuste siempre es una
prueba de cola derecha?
3. Frecuencias observadas y esperadas. Qu es una frecuencia observada? Qu es una frecuencia
esperada?
4. Pesos de estudiantes. Un investigador rene los pesos de 20 estudiantes varones elegidos al azar
de cuatro clases diferentes, luego calcula el total de los pesos y los resume en la siguiente tabla
(segn datos del National Health Examination Survey). Se pueden utilizar los mtodos de esta
seccin para probar la aseveracin de que los pesos provienen de poblaciones con la misma media?
Por qu?
En los ejercicios 5 y 6, identifique los componentes de la prueba de hiptesis.
5. Prueba para categoras igualmente probables. Las siguientes son las frecuencias observadas de
tres categoras: 5,5, 20. Suponga que queremos utilizar un nivel de significancia de 0.05 para probar la
aseveracin de que las tres categoras son igualmente probables.
a. Cul es la hiptesis nula?
b. Cul es la frecuencia esperada para cada una de las tres categoras?
c. Cul es el valor del estadstico de prueba?
d. Cul es el valor crtico?
e. Qu concluye usted acerca de la aseveracin dada?
6. Prueba para categoras con proporciones diferentes. Las siguientes son las frecuencias
observadas para cuatro categoras: 5, 10, 10, 20. Suponga que queremos utilizar un nivel de
significancia de 0.05 para probar la aseveracin de que las cuatro categoras tienen proporciones de
0.20, 0.25, 0.25 y 0.30, respectivamente.
a. Cul es la hiptesis nula?
b. Cules son las frecuencias esperadas para las cuatro categoras?
c. Cul es el valor del estadstico de prueba?
d. Cul es el valor crtico?
e. Qu concluye usted acerca de la aseveracin dada?
7. Prueba de balance de rueda de ruleta. El autor observ 500 giros de una rueda de ruleta en el
Mirage Resort and Casino. (Para el sistema fiscal IRS: No es cierto que ahora un viaje a Las Vegas
es deducible de impuestos?). Para cada giro, la bola puede detenerse en cualquiera de 38 ranuras
diferentes que se supone son igualmente probables. Cuando se utiliz STATDISK para probar la
aseveracin de que las ranuras son de hecho igualmente probables, se obtuvo el estadstico de
prueba x2 = 38.232.
a. Calcule el valor crtico suponiendo que el nivel de significancia es 0.10.
b. STATDISK produjo un valor P de 0.41331, pero qu sabe usted acerca del valor P si slo debe
utilizar la tabla A-4 junto con el estadstico de prueba dado de 38.232, que resulta de los 500 giros?
c. Escriba una conclusin acerca de la aseveracin de que los 38 resultados son igualmente
probables.
8. Prueba de una mquina tragamonedas. El autor compr una mquina tragamonedas (Bally modelo
809) y la prob jugando 1197 veces. Al probar la aseveracin de que los resultados observados
coinciden con las frecuencias esperadas, se obtuvo el estadstico de prueba x2 = 8.185. Existen 10
categoras de resultados diferentes, incluyendo no ganar, ganar el premio mayor, ganar con tres
campanas, etctera.
a. Calcule el valor crtico suponiendo que el nivel de significancia es de 0.05.
b. Qu concluye usted acerca del valor P de la tabla A-4, si sabe que el estadstico de prueba es x2 =
8.185 y que existen 10 categoras?
c. Plantee una conclusin acerca de la aseveracin de que los resultados observados coinciden con
las frecuencias esperadas. Parece que la mquina tragamonedas del autor funciona
correctamente?
9. Dado cargado. El autor taladr un hoyo en un dado, lo rellen con plomo y procedi a lanzarlo 200
veces. Las siguientes son las frecuencias observadas para los resultados de 1,2, 3,4, 5 y 6,
respectivamente: 27, 31, 42, 40, 28 y 32. Utilice un nivel de significancia de 0.05 para probar la
aseveracin de que los resultados no son igualmente probables. Parece que el dado cargado se
comporta de forma diferente que un dado legal?
10. El neumtico desinflado y la clase perdida. Un cuento clsico se refiere a cuatro estudiantes que
van juntos en un automvil y no llegan a un examen; como excusa. Dijeron al profesor que un
neumtico se desinfl en el camino. En el examen de recuperacin, el profesor pidi a los estudiantes
que identificaran el neumtico en particular que se desinfl. Si en realidad no tuvieron un neumtico
desinflado, seran capaces de identificar el mismo neumtico? El autor pidi a otros 41 estudiantes
que identificaran el neumtico que ellos seleccionaran. Los resultados estn listados en la siguiente
tabla (excepto el de un estudiante que seleccion el neumtico de refaccin). Utilice un nivel de
significancia de 0.05 para probar la aseveracin del autor de que los resultados se ajustan a una
distribucin uniforme. Qu sugiere el resultado acerca de la capacidad de los cuatro estudiantes de
seleccionar el mismo neumtico cuando en realidad su excusa fue una mentira?
11. Muertes por choques de automviles. Se seleccionaron al azar muertes por choques de
automviles y los resultados se incluyen en la siguiente tabla (segn datos del Insurance Institute for
Highway Safety). Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las
muertes por choques de automviles ocurren con la misma frecuencia en los diferentes das de la
semana. Cmo se explicaran los resultados? Por qu parece haber un nmero excepcionalmente
grande de muertes por choques de automviles los sbados?
Segn datos del Insurance Institute for Highway Safety.
12. Nacimientos. Se obtuvieron registros de nacimientos elegidos al azar; los resultados se presentan en
la siguiente tabla (segn datos del National Vital Statistics Report, vol 49, nm. 1). Utilice un nivel de
significancia de 0.05 para probar la razonable aseveracin de que los nacimientos ocurren con la
misma frecuencia los diferentes das de la semana. Cmo se podran explicar las aparentes bajas
frecuencias del sbado y del domingo?
13. Muertes en motocicleta. Los datos de las muertes de conductores de motocicleta seleccionadas al
azar se resumen en la siguiente tabla (segn datos del Insurance Institute of Highway Safety). Utilice
un nivel de significancia de 0.05 para probar la aseveracin de que este tipo de decesos ocurren con
igual frecuencia durante los diferentes meses. Cmo se podran explicar los resultados?
14. Calificaciones y lugar para sentarse. Los estudiantes con calificacin "A" (o 10) tienden a sentarse
en una zona particular del saln de clases? El autor registr los lugares de los estudiantes que
recibieron calificaciones de "A", con estos resultados: 1" se sentaron al frente, 9 se sentaron en medio
y 5 se sentaron en la parte de atrs del saln. Existe suficiente evidencia para sustentar la
aseveracin de que los estudiantes de calificacin "A" no estn distribuidos de manera uniforme en la
totalidad del saln? Si esto fuera as, significa que usted puede aumentar su probabilidad de obtener
una A si se sienta al frente?
15. Actrices ganadoras del scar. El autor reuni datos del mes de nacimiento de actrices ganadoras
del scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las actrices
ganadoras del scar nacen en los distintos meses con la misma frecuencia. Existe alguna razn por
la que las actrices ganadoras del scar podran nacer con mayor frecuencia en ciertos meses que en
otros?
16. Actores ganadores del scar. El autor reuni datos del mes de nacimiento de actores ganadores del
scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que los actores
ganadores del scar nacen en los distintos meses con la misma frecuencia. Compare los resultados
con los del ejercicio 15.
17. Novia de junio. Un organizador de banquetes para bodas selecciona al azar clientes de los ltimos
aos y registra los meses en que se celebraron las recepciones. Los resultados se presentan abajo
(segn datos de The Amazing Almanac). Utilice un nivel de significancia de 0.05 para probar la
aseveracin de que las bodas se realizan en los diferentes meses con la misma frecuencia. Los
resultados sustentan o desmienten la creencia de que la mayora de las bodas se realizan en junio?
18. Experimento de color de ojos. Un investigador desarroll un modelo terico para predecir el color de
los ojos. Despus de examinar una muestra aleatoria de padres, predice el color de ojos de su primer
hijo. La siguiente tabla lista el color de ojos de descendientes. Con base en su teora, el investigador
predijo que el 87% de los descendientes tendran ojos cafs, que el 8% tendra ojos azules y que el
5% tendra ojos verdes. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las
frecuencias reales corresponden a la distribucin que predijo.
19. Juegos de la Serie Mundial. El encabezado de USA Today "La serie de siete juegos desafa las
probabilidades" se refera a la aseveracin de que una Serie Mundial de siete juegos ocurre con
mayor frecuencia de lo esperado por el azar. A continuacin se indican los nmeros de juegos de
series mundiales (se omiten dos que duraron ocho juegos) junto con la proporcin que se esperara si
los equipos tuvieran la misma capacidad. Utilice un nivel de significancia de 0.05 para probar la
aseveracin de que las frecuencias observadas coinciden con las proporciones tericas. Con base en
los resultados, al parecer existe evidencia que sustente la aseveracin de que una Serie Mundial de
siete juegos ocurre con mayor frecuencia de lo esperado?
20. Experimento de gentica. Con base en los genotipos de los padres, se espera que sus
descendientes tengan genotipos distribuidos de tal forma que el 25% tenga genotipos denotados por
AA, que el 50% tenga genotipos denotados por Aa, y que el 25% tenga genotipos denotados por aa.
Cuando se seleccionan 145 descendientes, se descubre que 20 de ellos tienen genotipos AA, 90
tienen genotipos Aa y 35 tienen genotipos aa. Ponga a prueba la aseveracin de que las frecuencias
observadas de los genotipos de los descendientes coinciden con la distribucin esperada del 25%
para AA, 50% para Aa y 25% para aa. Utilice un nivel de significancia de 0.05.
21. Dulces M&M. Mars Inc. asevera que sus dulces M&M clsicos se distribuyen con los siguientes
porcentajes de color: 16% verdes, 20% anaranjados, 14% amarillos, 24% azules, 13% rojos y 13%
cafs. Remtase al conjunto de datos 13 del apndice B y utilice los datos muestrales para probar la
aseveracin de que la distribucin de color es como lo afirma Mars Inc. Utilice un nivel de significancia
de 0.05.
22. Medicin del pulso. Un ejemplo de esta seccin se bas en el principio de que cuando se miden
ciertas cantidades, los ltimos dgitos tienden a estar distribuidos de manera uniforme, pero que si son
estimados o reportados, los ltimos dgitos tienden a tener desproporcionadamente ms ceros o
cincos. Remtase al conjunto de datos 1 del apndice B y utilice los ltimos dgitos de los pulsos de los
80 hombres y mujeres. Estos pulsos se obtuvieron como parte de la National Health Examination
Survey. Pruebe la aseveracin de que los ltimos dgitos de 0, 1, 2,..., 9 se presentan con la misma
frecuencia. Con base en los dgitos observados, qu se infiere acerca del procedimiento utilizado
para obtener los pulsos?
23. Participacin en pruebas clnicas segn la raza. Se realiz un estudio para investigar la disparidad
racial en pruebas clnicas de cncer. De los participantes seleccionados al azar, 644 eran caucsicos,
23 eran hispanos, 69 eran afroestadounidenses, 14 eran asiticos o de las islas del pacfico, y 2 eran
indgenas norteamericanos o nativos de Alaska. Las proporciones de estos grupos en la poblacin
estadounidense son 0.757, 0.091, 0.108, 0.038 y 0.007, respectivamente. (Segn datos de
"Participation in Clinical Trials", de Murthy, Krumholtz y Gross, Journal of the American Medical
Association, vol. 291, nm. 22). Utilice un nivel de significancia de 0.05 para probarla aseveracin de
que los participantes se ajustan a la distribucin de la poblacin estadounidense. Por qu es
importante tener una representacin proporcional en este tipo de pruebas clnicas?
24. Se ajustan los impactos de las bombas de la Segunda Guerra Mundial a una
distribucin de Poisson? En el anlisis de los impactos por bombas V-1 en la Segunda Guerra
Mundial, el sur de Londres se subdividi en regiones, cada una con una
rea de 0.25 km2. En la seccin 5-5 presentamos un ejemplo e incluimos una tabla de
frecuencias reales y las frecuencias esperadas de impactos con la distribucin de Poisson. Utilice los
valores que se listan aqu y pruebe la aseveracin de que las frecuencias reales se ajustan a una
distribucin de Poisson. Utilice un nivel de significancia de 0.05.
25. Montos de cheques del autor y la ley de Benford. La figura 11-6b) ilustra las frecuencias
observadas de los dgitos lderes de las cantidades de los ltimos 200 cheques que expidi el autor.
Las frecuencias observadas de estos dgitos lderes se listas abajo. Con un nivel de significancia de
0.05, pruebe la aseveracin de que provienen de una poblacin de dgitos lderes que cumple con la
ley de Benford. (Consulte los primeros dos renglones de la tabla 11-1, incluidos en el problema del
captulo).