Practica Dirigida Unidad 4- Bondad de Ajuste Doc

PRCTICA DIRIGIDA DE ESTADISTICA II

TEMA: Estadstica no Paramtrica: Experimentos multinomiales: Bondad de ajuste. _____________________________________________________________________________________ Instructivo: Los ejercicios que se presentan a continuacin se usarn en clase tomando algunos de

ellos con fines de demostracin y los otros deben ser resueltos por los estudiantes y presentados en clase. Es necesario que impriman esta prctica para desarrollarla en clase.

11-2 DESTREZAS Y CONCEPTOS BSICOS

Conocimientos estadsticos y pensamiento crtico

1. Bondad de ajuste. A qu nos referimos cuando decimos que hacemos una prueba de la "bondad de

ajuste"?

2. Prueba de cola derecha. Por qu la prueba de hiptesis para la bondad de ajuste siempre es una

prueba de cola derecha?

3. Frecuencias observadas y esperadas. Qu es una frecuencia observada? Qu es una frecuencia

esperada?

4. Pesos de estudiantes. Un investigador rene los pesos de 20 estudiantes varones elegidos al azar

de cuatro clases diferentes, luego calcula el total de los pesos y los resume en la siguiente tabla

(segn datos del National Health Examination Survey). Se pueden utilizar los mtodos de esta

seccin para probar la aseveracin de que los pesos provienen de poblaciones con la misma media?

Por qu?

En los ejercicios 5 y 6, identifique los componentes de la prueba de hiptesis.

5. Prueba para categoras igualmente probables. Las siguientes son las frecuencias observadas de

tres categoras: 5,5, 20. Suponga que queremos utilizar un nivel de significancia de 0.05 para probar la

aseveracin de que las tres categoras son igualmente probables.

a. Cul es la hiptesis nula?

b. Cul es la frecuencia esperada para cada una de las tres categoras?

c. Cul es el valor del estadstico de prueba?

d. Cul es el valor crtico?

e. Qu concluye usted acerca de la aseveracin dada?

6. Prueba para categoras con proporciones diferentes. Las siguientes son las frecuencias

observadas para cuatro categoras: 5, 10, 10, 20. Suponga que queremos utilizar un nivel de

significancia de 0.05 para probar la aseveracin de que las cuatro categoras tienen proporciones de

0.20, 0.25, 0.25 y 0.30, respectivamente.

a. Cul es la hiptesis nula?

b. Cules son las frecuencias esperadas para las cuatro categoras?

c. Cul es el valor del estadstico de prueba?

d. Cul es el valor crtico?

e. Qu concluye usted acerca de la aseveracin dada?

7. Prueba de balance de rueda de ruleta. El autor observ 500 giros de una rueda de ruleta en el

Mirage Resort and Casino. (Para el sistema fiscal IRS: No es cierto que ahora un viaje a Las Vegas

es deducible de impuestos?). Para cada giro, la bola puede detenerse en cualquiera de 38 ranuras

diferentes que se supone son igualmente probables. Cuando se utiliz STATDISK para probar la

aseveracin de que las ranuras son de hecho igualmente probables, se obtuvo el estadstico de

prueba x2 = 38.232.

a. Calcule el valor crtico suponiendo que el nivel de significancia es 0.10.

b. STATDISK produjo un valor P de 0.41331, pero qu sabe usted acerca del valor P si slo debe

utilizar la tabla A-4 junto con el estadstico de prueba dado de 38.232, que resulta de los 500 giros?

c. Escriba una conclusin acerca de la aseveracin de que los 38 resultados son igualmente

probables.

8. Prueba de una mquina tragamonedas. El autor compr una mquina tragamonedas (Bally modelo

809) y la prob jugando 1197 veces. Al probar la aseveracin de que los resultados observados

coinciden con las frecuencias esperadas, se obtuvo el estadstico de prueba x2 = 8.185. Existen 10

categoras de resultados diferentes, incluyendo no ganar, ganar el premio mayor, ganar con tres

campanas, etctera.

a. Calcule el valor crtico suponiendo que el nivel de significancia es de 0.05.

b. Qu concluye usted acerca del valor P de la tabla A-4, si sabe que el estadstico de prueba es x2 =

8.185 y que existen 10 categoras?

c. Plantee una conclusin acerca de la aseveracin de que los resultados observados coinciden con

las frecuencias esperadas. Parece que la mquina tragamonedas del autor funciona

correctamente?

9. Dado cargado. El autor taladr un hoyo en un dado, lo rellen con plomo y procedi a lanzarlo 200

veces. Las siguientes son las frecuencias observadas para los resultados de 1,2, 3,4, 5 y 6,

respectivamente: 27, 31, 42, 40, 28 y 32. Utilice un nivel de significancia de 0.05 para probar la

aseveracin de que los resultados no son igualmente probables. Parece que el dado cargado se

comporta de forma diferente que un dado legal?

10. El neumtico desinflado y la clase perdida. Un cuento clsico se refiere a cuatro estudiantes que

van juntos en un automvil y no llegan a un examen; como excusa. Dijeron al profesor que un

neumtico se desinfl en el camino. En el examen de recuperacin, el profesor pidi a los estudiantes

que identificaran el neumtico en particular que se desinfl. Si en realidad no tuvieron un neumtico

desinflado, seran capaces de identificar el mismo neumtico? El autor pidi a otros 41 estudiantes

que identificaran el neumtico que ellos seleccionaran. Los resultados estn listados en la siguiente

tabla (excepto el de un estudiante que seleccion el neumtico de refaccin). Utilice un nivel de

significancia de 0.05 para probar la aseveracin del autor de que los resultados se ajustan a una

distribucin uniforme. Qu sugiere el resultado acerca de la capacidad de los cuatro estudiantes de

seleccionar el mismo neumtico cuando en realidad su excusa fue una mentira?

11. Muertes por choques de automviles. Se seleccionaron al azar muertes por choques de

automviles y los resultados se incluyen en la siguiente tabla (segn datos del Insurance Institute for

Highway Safety). Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las

muertes por choques de automviles ocurren con la misma frecuencia en los diferentes das de la

semana. Cmo se explicaran los resultados? Por qu parece haber un nmero excepcionalmente

grande de muertes por choques de automviles los sbados?

Segn datos del Insurance Institute for Highway Safety.

12. Nacimientos. Se obtuvieron registros de nacimientos elegidos al azar; los resultados se presentan en

la siguiente tabla (segn datos del National Vital Statistics Report, vol 49, nm. 1). Utilice un nivel de

significancia de 0.05 para probar la razonable aseveracin de que los nacimientos ocurren con la

misma frecuencia los diferentes das de la semana. Cmo se podran explicar las aparentes bajas

frecuencias del sbado y del domingo?

13. Muertes en motocicleta. Los datos de las muertes de conductores de motocicleta seleccionadas al

azar se resumen en la siguiente tabla (segn datos del Insurance Institute of Highway Safety). Utilice

un nivel de significancia de 0.05 para probar la aseveracin de que este tipo de decesos ocurren con

igual frecuencia durante los diferentes meses. Cmo se podran explicar los resultados?

14. Calificaciones y lugar para sentarse. Los estudiantes con calificacin "A" (o 10) tienden a sentarse

en una zona particular del saln de clases? El autor registr los lugares de los estudiantes que

recibieron calificaciones de "A", con estos resultados: 1" se sentaron al frente, 9 se sentaron en medio

y 5 se sentaron en la parte de atrs del saln. Existe suficiente evidencia para sustentar la

aseveracin de que los estudiantes de calificacin "A" no estn distribuidos de manera uniforme en la

totalidad del saln? Si esto fuera as, significa que usted puede aumentar su probabilidad de obtener

una A si se sienta al frente?

15. Actrices ganadoras del scar. El autor reuni datos del mes de nacimiento de actrices ganadoras

del scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las actrices

ganadoras del scar nacen en los distintos meses con la misma frecuencia. Existe alguna razn por

la que las actrices ganadoras del scar podran nacer con mayor frecuencia en ciertos meses que en

otros?

16. Actores ganadores del scar. El autor reuni datos del mes de nacimiento de actores ganadores del

scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que los actores

ganadores del scar nacen en los distintos meses con la misma frecuencia. Compare los resultados

con los del ejercicio 15.

17. Novia de junio. Un organizador de banquetes para bodas selecciona al azar clientes de los ltimos

aos y registra los meses en que se celebraron las recepciones. Los resultados se presentan abajo

(segn datos de The Amazing Almanac). Utilice un nivel de significancia de 0.05 para probar la

aseveracin de que las bodas se realizan en los diferentes meses con la misma frecuencia. Los

resultados sustentan o desmienten la creencia de que la mayora de las bodas se realizan en junio?

18. Experimento de color de ojos. Un investigador desarroll un modelo terico para predecir el color de

los ojos. Despus de examinar una muestra aleatoria de padres, predice el color de ojos de su primer

hijo. La siguiente tabla lista el color de ojos de descendientes. Con base en su teora, el investigador

predijo que el 87% de los descendientes tendran ojos cafs, que el 8% tendra ojos azules y que el

5% tendra ojos verdes. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las

frecuencias reales corresponden a la distribucin que predijo.

19. Juegos de la Serie Mundial. El encabezado de USA Today "La serie de siete juegos desafa las

probabilidades" se refera a la aseveracin de que una Serie Mundial de siete juegos ocurre con

mayor frecuencia de lo esperado por el azar. A continuacin se indican los nmeros de juegos de

series mundiales (se omiten dos que duraron ocho juegos) junto con la proporcin que se esperara si

los equipos tuvieran la misma capacidad. Utilice un nivel de significancia de 0.05 para probar la

aseveracin de que las frecuencias observadas coinciden con las proporciones tericas. Con base en

los resultados, al parecer existe evidencia que sustente la aseveracin de que una Serie Mundial de

siete juegos ocurre con mayor frecuencia de lo esperado?

20. Experimento de gentica. Con base en los genotipos de los padres, se espera que sus

descendientes tengan genotipos distribuidos de tal forma que el 25% tenga genotipos denotados por

AA, que el 50% tenga genotipos denotados por Aa, y que el 25% tenga genotipos denotados por aa.

Cuando se seleccionan 145 descendientes, se descubre que 20 de ellos tienen genotipos AA, 90

tienen genotipos Aa y 35 tienen genotipos aa. Ponga a prueba la aseveracin de que las frecuencias

observadas de los genotipos de los descendientes coinciden con la distribucin esperada del 25%

para AA, 50% para Aa y 25% para aa. Utilice un nivel de significancia de 0.05.

21. Dulces M&M. Mars Inc. asevera que sus dulces M&M clsicos se distribuyen con los siguientes

porcentajes de color: 16% verdes, 20% anaranjados, 14% amarillos, 24% azules, 13% rojos y 13%

cafs. Remtase al conjunto de datos 13 del apndice B y utilice los datos muestrales para probar la

aseveracin de que la distribucin de color es como lo afirma Mars Inc. Utilice un nivel de significancia

de 0.05.

22. Medicin del pulso. Un ejemplo de esta seccin se bas en el principio de que cuando se miden

ciertas cantidades, los ltimos dgitos tienden a estar distribuidos de manera uniforme, pero que si son

estimados o reportados, los ltimos dgitos tienden a tener desproporcionadamente ms ceros o

cincos. Remtase al conjunto de datos 1 del apndice B y utilice los ltimos dgitos de los pulsos de los

80 hombres y mujeres. Estos pulsos se obtuvieron como parte de la National Health Examination

Survey. Pruebe la aseveracin de que los ltimos dgitos de 0, 1, 2,..., 9 se presentan con la misma

frecuencia. Con base en los dgitos observados, qu se infiere acerca del procedimiento utilizado

para obtener los pulsos?

23. Participacin en pruebas clnicas segn la raza. Se realiz un estudio para investigar la disparidad

racial en pruebas clnicas de cncer. De los participantes seleccionados al azar, 644 eran caucsicos,

23 eran hispanos, 69 eran afroestadounidenses, 14 eran asiticos o de las islas del pacfico, y 2 eran

indgenas norteamericanos o nativos de Alaska. Las proporciones de estos grupos en la poblacin

estadounidense son 0.757, 0.091, 0.108, 0.038 y 0.007, respectivamente. (Segn datos de

"Participation in Clinical Trials", de Murthy, Krumholtz y Gross, Journal of the American Medical

Association, vol. 291, nm. 22). Utilice un nivel de significancia de 0.05 para probarla aseveracin de

que los participantes se ajustan a la distribucin de la poblacin estadounidense. Por qu es

importante tener una representacin proporcional en este tipo de pruebas clnicas?

24. Se ajustan los impactos de las bombas de la Segunda Guerra Mundial a una

distribucin de Poisson? En el anlisis de los impactos por bombas V-1 en la Segunda Guerra

Mundial, el sur de Londres se subdividi en regiones, cada una con una

rea de 0.25 km2. En la seccin 5-5 presentamos un ejemplo e incluimos una tabla de

frecuencias reales y las frecuencias esperadas de impactos con la distribucin de Poisson. Utilice los

valores que se listan aqu y pruebe la aseveracin de que las frecuencias reales se ajustan a una

distribucin de Poisson. Utilice un nivel de significancia de 0.05.

25. Montos de cheques del autor y la ley de Benford. La figura 11-6b) ilustra las frecuencias

observadas de los dgitos lderes de las cantidades de los ltimos 200 cheques que expidi el autor.

Las frecuencias observadas de estos dgitos lderes se listas abajo. Con un nivel de significancia de

0.05, pruebe la aseveracin de que provienen de una poblacin de dgitos lderes que cumple con la

ley de Benford. (Consulte los primeros dos renglones de la tabla 11-1, incluidos en el problema del

captulo).

Documents

Practica Dirigida Unidad 4- Bondad de Ajuste Doc