14
1 Ejercicios sugeridos para inferencia estadística

Ejercicios Sugeridos Para Inferencia Estadística

Embed Size (px)

Citation preview

Page 1: Ejercicios Sugeridos Para Inferencia Estadística

1

Ejercicios sugeridos para inferencia estadística

Page 2: Ejercicios Sugeridos Para Inferencia Estadística

2

Construcción de qqplots o gráficos de normalidad

1) La gráfica de probabilidad normal adjunta se construyó con una muestra de 30 lecturas de tensión de pantallas de malla localizadas detrás de la superficie de tubos de visualización de video utilizadas en monitores de computadora. ¿Parece factible que la distribución de tensión sea normal?

2) Construya un qqplot para determinar gráficamente si el siguiente conjunto de estaturas de estudiantes proviene de una distribución normal: 171, 177, 169, 176, 170, 176, 175, 172, 168, 169, 165, 161, 171, 170, 170

3) Considere las siguientes diez observaciones de duración de cojinetes (en horas): 152.7, 172.0, 172.5, 173.3, 193.0, 204.7, 216.5, 234.9, 262.6 y 422.6. Construya una gráfica de probabilidad normal y comente sobre la factibilidad de la distribución normal como modelo de la duración de cojinetes (datos de “Modified Moment Estimation for the Three-Parameter Lognormal Distribution”, J. Quality Technology, 1985: 92-99).

Page 3: Ejercicios Sugeridos Para Inferencia Estadística

3

4) En cuáles de los siguientes qqplot no se cumple el supuesto de normalidad.

Page 4: Ejercicios Sugeridos Para Inferencia Estadística

4

Estimación puntual

1. Suponga que usted tiene una variable de interés, ¿cómo se sabe si se debe estimar una media o una proporción para esa variable?

2. A continuación se presenta una lista de variables, indique en cuáles de ellas el interés es estimar una

media (𝜇) y en cuales de ellas el interés es estimar una proporción (P). Indique su respuesta en la segunda columna de la siguiente tabla.

Variable Interés

Peso real de las bolsas de arroz etiquetadas con 500 gramos

Tasa de desempleo en un país

Duración de las baterías AAA de cierta marca

Conductores que conducen en estado de embriaguez durante la noche del sábado

Nivel (mg/Dl) de colesterol en la sangre para la población de un país

3. A continuación se presentan los datos adjuntos sobre resistencia a la flexión (MPa) de vigas de concreto.

Calcule una estimación puntual del valor medio de resistencia de la población conceptual de todas las vigas fabricadas de esta manera y diga qué estimador utilizó.

4. Una muestra de 20 estudiantes que recientemente tomaron un curso de estadística elemental arrojó la siguiente información sobre la marca de calculadora que poseían. (T: Texas Instruments, H: Hewlett Packard, C: Casio, S: Sharp):

Calcule una estimación puntual de los estudiantes que poseen una calculadora Texas Instruments.

Page 5: Ejercicios Sugeridos Para Inferencia Estadística

5

Sobre el Teorema del Límite Central

1) El diámetro interno de un anillo de pistón seleccionado al azar es una variable aleatoria con valor medio de 12 cm y desviación estándar de 0.04 cm.

a. Si �̅� es el diámetro medio en una muestra aleatoria de n=16 anillos, ¿dónde está centrada la distribución muestral de �̅� y cuál es la desviación estándar de la distribución �̅�?

b. Responda las preguntas planteadas en el inciso a) con un tamaño de muestra de n=64 anillos. c. ¿Con cuál de las dos muestras aleatorias, la del inciso a) o la del inciso b), es más probable que �̅� esté

dentro de 0.01 cm de 12 cm? Explique su razonamiento.

2) En la fabricación de una alfombra se utiliza una fibra sintética con una resistencia a la tensión que tiene una distribución normal con media 75.5 psi y desviación estándar 3.5 psi. Encuentre la probabilidad de que en una muestra aleatoria de n=6 especímenes de fibra, la media de la resistencia a la tensión en la muestra sea mayor que 75.75 psi.

3) Las latas de gaseosa de una marca reconocida tienen un promedio de 16.1 onzas con una desviación

estándar de 1.2 onzas. Si se toma una muestra de n=200, cuál es la probabilidad de que la media sea: a. ¿Menor de 16.27 onzas? b. ¿Por lo menos 15.93 onzas? c. ¿Entre 15.9 y 16.3 onzas?

4) La renta media de los habitantes de un país se distribuye uniformemente entre 4 millones de pesos y 10 millones de pesos. Calcular la probabilidad de que al seleccionar al azar a 100 personas la el promedio de sus rentas supere los 7.25 millones de pesos.

Page 6: Ejercicios Sugeridos Para Inferencia Estadística

6

Sobre intervalos de confianza para una muestra

1) Considere un IC para la media con varianza poblacional desconocida. ¿Qué sucede con el ancho del IC cuando:

− El tamaño de muestra n aumenta. − El nivel de confianza NC aumenta. − Disminuye la varianza muestral s.

2) En un proceso químico se fabrica cierto polímero. Normalmente, se hacen mediciones de viscosidad

después de cada corrida, y la experiencia acumulada indica que la variabilidad en el proceso es muy estable, con σ=20. Las siguientes son 15 mediciones de viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747, 742. Encuentre un intervalo de confianza bilateral del 90% para la viscosidad promedio del polímero.

3) Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma una muestra aleatoria de 15 varillas, se mide el diámetro (en mm) y se obtienen los siguientes resultados:

8.24, 8.23, 8.20, 8.21, 8.20, 8.28, 8.23, 8.26, 8.24, 8.25, 8.19, 8.25, 8.26, 8.23, 8.24

Suponiendo que el diámetro sigue una distribución normal,

a) Construya un intervalo de confianza del 99% para el diámetro promedio de la varilla. b) Construya un intervalo de confianza del 98% para varianza del diámetro de la varilla.

4) Un fabricante de una determinada marca de vehículos de lujo anuncia en la publicidad que el combustible medio necesario para hacer un recorrido de cien kilómetros es de 18.5 galones. Se selecciona una muestra aleatoria de 6 coches y se observa el consumo cada cien kilómetros obteniendo las siguientes observaciones: 19.2, 19.4, 18.4, 18.6, 20.5 y 20.8. Construya un IC del 95% para el combustible medio necesario para recorrer cien kilómetros. Basándose en los resultados del IC, ¿será cierta la afirmación del fabricante?

5) Se registró una muestra de 12 donaciones (en miles de dólares) por parte de comités de las campañas políticas del congreso y se encontraron los siguientes resultados:

12.1, 8.3, 15.7, 9.35, 14.3, 12.9, 13.2, 9.73, 16.9 ,15.5, 14.3, 12.8

Calcule el intervalo de confianza del 90% para estimar la donación promedio realizada a las campañas, asuma que las donaciones tienen distribución normal.

6) Las edades de una muestra aleatoria de cinco profesores universitarios son de 39, 54, 61, 72 y 59. Con esta información encuentre un intervalo de confianza de 99% para la desviación estándar de la población de las edades de los profesores de la universidad suponiendo que éstas tienen una distribución normal estándar.

Page 7: Ejercicios Sugeridos Para Inferencia Estadística

7

7) Un instrumento de precisión está garantizado para dar lecturas que no varían más de 2 unidades. Una muestra aleatoria de cuatro lecturas del instrumento en el mismo objeto dio las mediciones 353, 351, 351 y 355. Encuentre un IC del 90% para la desviación poblacional. ¿Qué suposiciones son necesarias? ¿Parece razonable la garantía?

8) The Wall Street Journal informó los esfuerzos realizados por Nestlé, la compañía de alimentos del mundo, para introducir un nuevo producto. La gerencia decidió utilizar el sector de Chicago como mercado de prueba. Si más del 30% de las personas expresaban un deseo por el producto, ellos considerarían comercializarlo en un sector más amplio. De las 820 personas a quienes se les practicó la prueba, 215 expresaron una reacción positiva. ¿Un IC del 90% para la proporción de todos los clientes quienes prefieren el producto hace que la gerencia continúe con sus planes de comercialización?

9) Al tomar al azar una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos hablaban inglés.

a) Halle, con un nivel de confianza del 90%, un intervalo de confianza para estimar la proporción de

estudiantes que hablan el idioma inglés entre los estudiantes de esa Universidad. b) Las directivas afirman que el verdadero porcentaje de estudiantes que hablan inglés es de 61%, ¿será

cierta la afirmación de las directivas según el IC?

Page 8: Ejercicios Sugeridos Para Inferencia Estadística

8

Sobre cálculo de tamaños de muestra

1) Suponga que usted necesita realizar un estudio de tiempos para determinar el tiempo necesario para ensamblar cierto producto con un nuevo método. Para esto, usted decide hacer un estudio preliminar con n0=15 productos y con el resultado de la varianza muestral recalcula nóptimo. ¿Qué debe hacer usted si:

− n0 < nóptimo − n0 > nóptimo

2) Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio

anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras? (Sol: 36 ciervos)

3) Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas.

a) ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté

dentro de 10 horas de la media real? (Sol: 68 focos) b) ¿En cuánto aumenta n si se restringe el error a 5 horas? (Sol: en 202 focos se aumenta n)

4) Suponga que en el ejercicio anterior se tiene una población de 300 focos cada día, y se desea saber de qué tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo con una confianza del 96%. (Sol: 56 focos)

5) En una muestra aleatoria de 500 familias que tienen televisores en la ciudad, se encuentra que 340 están suscritas a tv HD. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02? (Sol: 2090)

6) Un ingeniero de control de calidad quiere estimar la fracción de elementos defectuosos en un gran lote de lámparas. Por la experiencia, cree que la fracción real de defectuosos tendría que andar alrededor de 0.2. ¿Qué tan grande tendría que seleccionar la muestra si se quiere estimar la fracción real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%?

7) Una Institución de Salud tiene 6100 empleados y se quiere determinar cómo es el clima laboral en la organización. Para esto se va a tomar una muestra sin reemplazo considerando un nivel de confianza del 95%, un error admisible de 6%. Si se asume previamente que la proporción de empleados no satisfechos es del 30%, ¿cuál será el tamaño de la muestra apropiado?

Page 9: Ejercicios Sugeridos Para Inferencia Estadística

9

Sobre intervalos de confianza para dos muestras

1) Las siguientes son las calificaciones obtenidas en un examen de personalidad por 2 muestras de 9 mujeres casadas y 9 mujeres solteras:

Solteras 88 68 77 82 63 80 78 71 72

Casadas 73 77 67 74 74 64 71 71 72

Suponiendo que estos datos se pueden considerar como muestras aleatorias independientes tomadas de dos poblaciones normales, pruebe la afirmación de que la varianza de las calificaciones de las mujeres solteras es diferente de la varianza de las calificaciones de las mujeres casadas con 𝛼=0.05. 2) Existe un proceso industrial A para obtener el aceite esencial de cierto fruto. Un grupo de ingenieros ha

desarrollado un método B para el mismo fin, pero con costos de producción y mantenimiento menores. Se hizo un estudio para comparar el porcentaje de pureza del aceite esencial obtenido por ambos métodos, en lotes similares de fruto asignados completamente al azar y se recopiló la siguiente información:

Porcentaje de pureza del aceite esencial

Método A 82 80 83 85 79 82 81 84

Método B 80 79 82 82 81 80 79 78 83

En un inicio, por consideraciones teóricas, se pensaba que ambos procesos tendrían la misma variabilidad, pero de acuerdo con algunos resultados preliminares se cree ahora que el método B produce resultados menos variables. Con los datos de la tabla, ¿cuál es su conclusión con 𝛼=0.05? 3) Se quiere determinar si dos tipos de motores, un con gas y otro con gasolina normal, tienen el mismo

rendimiento en millas por galón de gasolina o su equivalente en gas. Para esto se tomaron un conjunto de autos y de cada tipo y se midió el rendimiento del combustible en un recorrido estándar, los resultados se presentan a continuación:

Gasolina: 34, 36, 39, 31, 33, 26, 45, 34, 39, 38, 37, 36 Gas: 33, 41, 39,32, 29, 28, 33, 34, 25, 28, 36, 33, 35, 35 Asumiendo que los rendimientos tienen una distribución normal:

a) Construya un IC del 96% para el cociente de varianzas para determinar si se asumen varianzas iguales o diferentes.

b) Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores a gasolina y a gas. Concluya cuál de los dos tipos de motor genera tiene mayor rendimiento del combustible.

4) La pintura para autopista se surte en dos colores: blanco y amarillo. El interés se centra en el tiempo de

secado de la pintura. Se sospecha que la pintura de color amarillo se seca más rápidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura, que dan los siguientes tiempos de secado, en minutos:

Blanca 120 132 123 122 140 110 120 107

Amarilla 126 124 116 125 109 130 125 117 129 120

Page 10: Ejercicios Sugeridos Para Inferencia Estadística

10

Encuentre un intervalo de confianza del 95% para la diferencia entre los tiempos de secados medios, suponiendo que las desviaciones estándar de éstos son iguales. ¿Existe alguna evidencia que indique que la pintura amarilla seca más rápidamente que la blanca? (Sol: [-9.008890, 8.308890])

5) Queremos estudiar la influencia que puede tener el tabaco en el peso de los niños al nacer. Para ello se

consideran dos grupos de mujeres embarazadas (unas que fuman un paquete al día y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:

En ambos grupos los pesos de los recién nacidos provienen de sendas distribuciones normales de medias desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las mismas. Construir un IC del 95% para la diferencia de los pesos medio de los niños. ¿Muestran los datos que los hijos de madres fumadoras tienen un peso menor que los de madres no fumadoras?

6) Un fabricante de insecticidas para moscas desea comparar dos nuevos tipos de insecticidas. Para el

experimento se colocan 1000 moscas en cada uno de dos cuartos del mismo tamaño. En uno de ellos se usa el insecticida I y en el otro el insecticida II. Un total de 825 y 760 moscas sucumbieron a los insecticidas I y II respectivamente. Estime la diferencia entre las tasas de mortalidad para los dos insecticidas con un 95% de confianza e interprete el resultado. (Sol: 0.03<P1-P2<0.10, como los dos límites son positivos, concluimos que P1 es significativamente mayor que P2)

7) Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige una muestra de 100 hombres de

más de 50 años y una muestra de 200 mujeres en las mismas condiciones. Se obtiene que 10 hombres y 40 mujeres con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza del 95%?

8) Se hizo un estudio para definir si los ejercicios aeróbicos reducen el ritmo cardiaco de una persona durante el descanso, y al examinar a diez voluntarios antes y después de seguir un programa de ese tipo durante seis meses, sus pulsaciones, en latidos por minuto, dieron los siguientes registros:

Voluntario 1 2 3 4 5 6 7 8 9 10

Antes 73 77 68 62 72 80 76 64 70 72

Después 68 72 64 60 71 77 74 60 64 68

Construya un IC del 95% para determinar si los ejercicios aeróbicos reducen el ritmo cardiaco durante el reposo.

9) Una empresa de software está investigando la utilidad de dos lenguajes diferentes para mejorar la rapidez de programación. A doce programadores, familiarizados con ambos lenguajes, se les pide que programen un cierto algoritmo en ambos lenguajes y se anota el tiempo que tardan. Los datos obtenidos en minutos se presentan a continuación:

Page 11: Ejercicios Sugeridos Para Inferencia Estadística

11

Lenguaje A 17 16 21 14 18 24 16 14 21 23 13 18

Lenguaje B 18 14 19 11 23 21 10 13 19 24 15 20

Con base en estos datos, calcular:

a) Un intervalo de confianza al 95% para la diferencia de medias en el tiempo de programación. b) ¿Puede considerarse que uno de los dos lenguajes es preferible al otro?

Page 12: Ejercicios Sugeridos Para Inferencia Estadística

12

Conceptos básicos de PH

1) Por cada una de las siguientes aseveraciones, exprese si es una hipótesis estadística legítima y por qué:

2) Para los siguientes pares de aseveraciones, indique cuáles no satisfacen las reglas de establecer hipótesis y por qué (los subíndices 1 y 2 diferencian las cantidades de dos poblaciones o muestras diferentes).

3) ¿Qué representa el valor-P en una prueba de hipótesis? 4) ¿Qué influencia tiene el sentido (<, >, ≠) de la Ha en el cálculo del valor-P? 5) ¿Cuál debe ser la relación entre 𝛼 y el valor-P para poder rechazar Ho?

Page 13: Ejercicios Sugeridos Para Inferencia Estadística

13

Prueba 𝜒2 para tablas de contingencia

1) El gerente de una planta industrial pretende determinar si el número de empleados que asisten al consultorio médico de la planta se encuentran distribuido en forma equitativa durante los 5 días de trabajo de la semana. Con base en una muestra aleatoria de 4 semanas completas de trabajo, se observó el siguiente número de consultas:

Lunes Martes Miércoles Jueves Viernes

49 35 32 39 45

Con 𝛼=0,05, ¿existe alguna razón para creer que el número de empleados que asisten al consultorio médico, no se encuentra distribuido de forma equitativa durante los días de la semana?

2) En un estudio se analiza la relación entre la dieta pobre en calcio y el desarrollo de osteoporosis. Se obtienen los siguientes resultados

Dieta Desarrolla osteoporosis

Si No

Pobre en calcio 58 62

Normal 22 258

Considerando un nivel de significancia del 5%, ¿Hay asociación entre el tipo de dieta (rica o pobre en calcio) y el desarrollo de osteoporosis? ¿Es la relación directa o inversa?

3) Una compañía evalúa una propuesta para fusionarse con una corporación. El consejo de directores desea muestrear la opinión de los accionistas para determinar si esta es independiente del número de acciones que posee cada uno. Una muestra aleatoria de 250 accionistas da los siguientes resultados:

Número de acciones

Opinión

A favor En

contra Indecisos Totales

Menos de 200 38 29 9 76

200 -1000 30 42 7 79

Más de 1000 32 59 4 95

Totales 100 130 20 250

Con base en esta información, ¿existe alguna razón para dudar de que la opinión con respecto a la propuesta es independiente del número de acciones que posee el accionista? Úsese 𝛼=0.1.

Page 14: Ejercicios Sugeridos Para Inferencia Estadística

14

Pruebas de bondad de ajuste

1) ¿Cuál conclusión sería apropiada para una prueba ji cuadrada de cola superior en cada una de las situaciones siguientes? 𝜒2 representa el valor del estadístico.

2) Se propone que el número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de defectos. Los resultados obtenidos son los siguientes:

Número de defectos

Frecuencia observada

0 32

1 15

2 9

3 ó más 4

¿Muestran estos datos suficiente evidencia para decir que provienen de una distribución Poisson? Haga la prueba de la bondad del ajuste con un 𝛼= 0.05.

3) Considere una gran población de familias en la que cada una tiene exactamente tres hijos. Si los géneros de los tres hijos de cualquier familia son independientes entre sí, el número de hijos hombres de una familia seleccionada al azar tendrá una distribución binomial basada en tres intentos. Suponga que una muestra aleatoria de 160 familias da los resultados siguientes. Pruebe las hipótesis relevantes a con un 𝛼=0.01.

N° de hijos hombre 0 1 2 3

Frecuencia 14 66 64 16

4) Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías dadas en la siguiente tabla se puede aproximar mediante una distribución normal con media 𝜇= 3.5 y desviación estándar 𝜎=0.7. Utilice un 𝛼=0.05.

Límites de clase

Frecuencias observadas

1.45 – 1.95 2

1.95 – 2.45 1

2.45 – 2.95 4

2.95 – 3.45 15

3.45 – 3.95 10

3.95 – 4.45 5

4.45 – 4.95 3

Sugerencia: consulte http://www.itch.edu.mx/academic/industrial/estadistica1/cap04b.html para ver cómo se puede aplicar la prueba de bondad de ajuste para el caso de la normal.