1
Programa de certificación
de Black Belts ASQ
7. Metodología Seis Sigma - Análisis
P. Reyes /Septiembre de 2007
2
Diagrama deIshikawa
Diagrama derelaciones
Diagramade Árbol
Análisis del Modo y Efecto deFalla (AMEF)
QFD
DiagramaCausa Efecto
CTQs = YsOperatividad
X's vitales
Diagramade Flujo
delproceso
Pruebasde
hipótesis
Causas raízvalidadas
¿CausaRaíz?
DefiniciónY=X1 + X2+. .Xn
X'sCausas
potenciales
Medición Y,X1, X2, Xn
FASE DE ANÁLISIS
SiNo
3
7. Metodología Seis Sigma - Análisis
C. AMEF y Herramientas de análisis
A. Análisis de datos exploratorio
B. Pruebas de hipótesis
4
7C1. Análisis del Modo yEfecto de Falla (FMEA)
5
¿ Qué es el FMEA?El Análisis de del Modo y Efectos de Falla es un grupo
sistematizado de actividades para:
Reconocer y evaluar fallas potenciales y sus efectos.
Identificar acciones que reduzcan o eliminen las probabilidades de falla.
Documentar los procesos con los hallazgos del análisis.
Existe el estándar MIL-STD-1629, Procedure for Performing a Failure Mode, Effects and Criticality Analysis
6
Propósitos del FMEA Mejorar la calidad, confiabilidad y seguridad de los
productos y procesos evaluados
Reducir el tiempo y costo de re-desarrollo del producto
Documenta y da seguimiento a acciones tomadas para reducir el riesgo
Soporta el desarrollo de planes de control robustos
7
Propósitos del FMEA Soporta el desarrollo de planes de verificación del
desarrollo de diseño robusto
Apoya a priorizar y enfocarse en eliminar/reducir problemas de proceso y producto y/o previene la ocurrencia de problemas
Mejora la satisfacción del cliente/consumidor
8
Tipos del FMEA AMEF de concepto (CFMEA)
A nivel de sistema, subsistema y componente
AMEF de diseño (DFMEA)
AMEF de Proceso (PFMEA)
AMEF de maquinaria (como aplicación del DFMEA)
9
Tipos de FMEAs FMEA de Diseño (AMEFD), su propósito es analizar
como afectan al sistema los modos de falla y minimizar los efectos de falla en el sistema. Se usan antes de la liberación de productos o servicios, para corregir las deficiencias de diseño.
FMEA de Proceso (AMEFP), su propósito es analizar como afectan al proceso los modos de falla y minimizar los efectos de falla en el proceso. Se usan durante la planeación de calidad y como apoyo durante la producción o prestación del servicio.
10
PFMEA o AMEF de Proceso
Fecha límite:
Concepto Prototipo Pre-producción /Producción
FMEAD
FMEAP
FMEAD FMEAP
Característica de Diseño Paso de ProcesoFalla Forma en que el Forma en que el proceso falla
producto o servicio falla al producir el requerimientoque se pretende
Controles Técnicas de Diseño de Controles de Proceso Verificación/Validación
11
Flujo del FMEA y su rol en evitar el Modo de Falla
12
Flujo del FMEA y su rol en evitar el Modo de Falla
Prevenir los errores y mejorar la robustes son dos esfuerzos distintos y complementarios para evitar los modos de falla
Diagrama de fronteras Define las fronteras / alcance y clarifica la
relación entre el sistema enfocado y sus sistemas de interfase
Matriz de interfases Identifica las interfases del sistema y ambos el
efecto de interfases al sistema enfocado y las interfases del sistema. Documenta los detalles de interfases del sistema
13
Flujo del FMEA y su rol en evitar el Modo de Falla
DFMEA Es un análisis detallado de los modos de falla
potenciales relacionados con las funciones primarias y de interfases del sistema.
Es el documento primario para demostrar que se han evitado errores e identifica los controles y acciones para reducir los riesgos asociados
14
Flujo del FMEA y su rol en evitar el Modo de Falla
REDPEPR (Robustness Engineering Design and Product Enhacement Process) P-Diagrama: Identifica y documenta las señales de
entrada, factores de ruido, factores de control y estados de error asociadas con las funciones ideales
Lista de verificación de Robustez (RCL): es un análisis profundo del impacto de factores de ruido en la función ideal y estados de error. Es una evaluación metódica de la efectividad de métodos de verificación de diseño (DVMs) en términos de cobertura de factores de ruido. Genera estrategias de gestión de factores de ruido.
15
Flujo del FMEA y su rol en evitar el Modo de Falla
REDPEPR (Robustness Engineering Design and Product Enhacement Process) Matriz de Demostración de Robustez (RDM) es
un enfoque de los datos para asegurar las pruebas de factores de ruido, y métricas de prueba medidas/cuantificadas para probar la robustez. Es una parte del plan de verificación de diseño (DVP).
El DFMEA e Ingeniería de Robustez son complementarios
16
Flujo del FMEA y su rol en evitar el Modo de Falla
Plan de Verificación de Diseño (DVP): Es un plan exhaustivo de verificación que
incluye entradas de ambos DFMEA y REDPEPR. Asegura que los factores de ruido sean incluidos en las pruebas y atiende las mediciones críticas para evaluar las funciones ideales y los modos de falla potenciales/anticipados durante y después de las pruebas
17
Flujo del FMEA y su rol en evitar el Modo de Falla
Fuentes de entrada al FMEA: Requerimientos (WCR, reglamentarios, etc.) SDS, QFDs, información de desempeño histórico Datos de Benchmarking, Datos previosde PD Diagrama P
Funciones ideales como funciones Estados de error como Modos o Efectos de Falla Factores de control
Diagrama de fronteras y Matriz de Interfases Salidas intencionadas como funciones Las interacciones pueden ayudar a identificar Causas
de Fallas
18
Flujo del FMEA y su rol en evitar el Modo de Falla
El FMEA sirve de entrada para: DVP Lista de verificación de Robustez Características críticas/significativas Especificaciones de diseño de Sistema /
Subsistema / Componente Criterios de validación Liberación de seguridad Planes de control
19
Beneficios de los tipos de FMEAFMEA de Concepto
Los beneficios de hacer un FMEA de concepto incluyen:
Ayuda a seleccionar las alternativas de concepto óptimas, o determina cambios a Especs. De Diseño de Sistema (SDS)
Identifica modos de falla potencial y causas debido a interacciones dentro del concepto
Incrementa la verosimilitud de todos los efectos potenciales de los modos de falla del concepto
20
Beneficios de los tipos de FMEAFMEA de Concepto
Ayuda a generar tasas de ocurrencia de causas que puede ser usada para estimar una meta de alternativa particular de concepto
Identifica requerimientos de prueba a nivel de sistema y subsistema
Ayuda a determinar si la redundancia del hardware del sistema puede ser requerido dentro de una propuesta de diseño
21
Beneficios de los tipos de FMEAFMEA de Concepto
Se enfoca a los modos de falla potencial asociados con las funciones propuestas de una propuesta de concepto causado por decisiones de diseño que introduce deficiencias (incluye el layout del proceso)
Incluye la interacción de sistemas múltiples y la interacción entre los elementos de un sistema en las etapas de concepto (incluye interacciones de operación en el proceso)
22
Beneficios de los tipos de FMEASalidas del FMEA de Concepto Una lista de Causas y Modos de falla potenciales
del concepto
Una lista de acciones de diseño para eliminar las causas de modos de falla para reducir su tasa de ocurrencia
Cambios recomendados a SDSs
Especificar parámetros de operación como especificaciones clave del diseño
23
Beneficios de los tipos de FMEASalidas del FMEA de Concepto Cambios a estándares o procesos de
manufactura globales
Nuevos métodos de prueba o recomendaciones para nuevas pruebas genéricas
Decisión sobre cual concepto seleccionar
24
Beneficios de los tipos de FMEAFMEA de Diseño
Soporta el proceso de diseño al reducir el riesgo de fallas (incluyendo las salidas no intencionadas) por:
Soporta la evaluación objetiva de diseño, incluyendo requerimientos funcionales y alternativas de diseño
Evaluar los diseños iniciales sobre requerimientos de manufactura, ensamble, servicio y reciclado
Incrementar la probabilidad de que los modos de falla potencial y sus efectos en el sistema y operación del producto se han considerado en el procesos de diseño/desarrollo
25
Beneficios de los tipos de FMEAFMEA de Diseño
Proporcionar información adicional como apoyo en la planeación exhaustiva de programas de diseño eficiente, desarrollo y validación
Desarrollo de una lista priorizada de modos de falla potenciales de acuerdo a su efecto en el “cliente” estableciendo un sistema de prioridades para mejoras al diseño, desarrollo, validación, prueba y análisis
Proporcionar un formato de problemas pendientes para recomendar y dar seguimiento de acciones que reduzcan el riesgo
26
Beneficios de los tipos de FMEAFMEA de Diseño
Proporcionar referencias futuras, vg. lecciones aprendidas, ayuda en análisis de problemas de campo, evaluar cambios de diseño y desarrollo de diseños avanzados
Ayuda a identificar características críticas potenciales y características significativas potenciales
Ayuda a validad el plan de verificación del diseño (DVP) y las especificaciones de diseño del sistema (SDSs)
27
Beneficios de los tipos de FMEASalidas del FMEA de Diseño
Se enfoca a modos de falla potenciales de productos causadas por deficiencias de diseño
Identifica características potenciales designadas o características especiales
Proporciona una lista de Modos y Causas de Modos de falla del producto
Una lista de características críticas potenciales y/o características significativas
28
Beneficios de los tipos de FMEASalidas del FMEA de Diseño
Una lista de acciones recomendadas para reducir severidad, eliminando las causas de los modos de falla del producto o reduciendo su tasa de ocurrencia o mejora de la detección
Para FMEAs de nivel de sistema, confirma las SDS o las actualiza
Confirmación del Plan de Verificación del Diseño (DVP)
Retrolalimentación de cambios de diseño a los comités
29
Beneficios de los tipos de FMEAFMEA de Proceso
Los beneficios de un FMEA de proceso incluyen: Identifica las funciones y requerimientos del proceso
Identifica modos de falla potenciales relacionados con el producto y proceso
Evalúa los efectos de las fallas potenciales con el cliente
Identifica las causas potenciales en el proceso de manufactura
Identifica las variables de proceso en las cuales hay que enfocarse para reducir las fallas muy lejanas
30
Beneficios de los tipos de FMEAFMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:
Identificar las variables del proceso centrandose en la ocurrencia
Reducción o detección de las condiciones de falla
Identificar variables del proceso a las cuales enfocar el control
Desarrollar una lista ordenada clasificada de modos de falla estandarizados para establecer un sistema de prioridades
31
Beneficios de los tipos de FMEAFMEA de Proceso
Sistema del prioridad del riesgo para consideraciones de acciones preventivas y correctivas
Documentar los resultados del proceso de manufactura o proceso de ensamble
Documenta los resultados del proceso de manufactura o ensamble
Identifica deficiencias del proceso para orientar a establecer controles para reducir la ocurrencia de productos no conformes o en métodos para mejorar su detección
32
Beneficios de los tipos de FMEAFMEA de Proceso
Identifica características críticas y/o significativas confirmadas
Apoya en el desarrollo de Planes de Control a través de todo el proceso de manufactura
Identifica aspectos de preocupación en relación con la seguridad del operador
Retroalimenta información sobre cambios de diseño requeridos y factibilidad de manufactura a las áreas de diseño
33
Beneficios de los tipos de FMEAFMEA de Proceso
Se enfoca a modos de falla potenciales del producto causados por deficiencias de manufactura o ensamble
Confirma la necesidad de controles especiales en manufactura y confirma las “Características Especiales” designadas en el DFMEA
Identifica modos de falla del proceso que pudieran violar las reglamentaciones del gobierno o comprometer la seguridad del personal, identificando otras “Características especiales” – de Seguridad del operador (OS) y con alto impacto (HI)
34
Salidas del FMEA de Proceso Una lista de modos potenciales de falla
Una lista de Caracteríticas críticas y/o significativas
Una lista de características relacionadas con la seguridad del operador y con alto impacto
Una lista de controles especiales recomendados para las Características Especiales designadas y consideradas en el Plan de control
35
Salidas del FMEA de Proceso Una lista de procesos o acciones de proceso
para reducir la Severidad, eliminar las causas de los modos de falla del producto o reducir su tasa de ocurrencia, y mejorar la tasa de Detección de defectos si no se puede mejorar la capacidad del proceso
Cambios recomendados a las hojas de proceso y dibujos de ensamble
36
Modos de fallas vsMecanismos de falla
El modo de falla es el síntoma real de la falla (altos costos del servicio; tiempo de entrega excedido).
Mecanismos de falla son las razones simples o diversas que causas el modo de falla (métodos no claros; cansancio; formatos ilegibles) o cualquier otra razón que cause el modo de falla
37
Definiciones
Modo de Falla - La forma en que un producto o proceso puede fallar para
cumplir con las especificaciones o requerimientos.
- Normalmente se asocia con un Defecto, falla o error.
Diseño ProcesoAlcance insuficiente OmisionesRecursos inadecuados Monto equivocadoServicio no adecuadoTiempo de respuesta excesivo
38
DefinicionesEfecto - El impacto en el Cliente cuando el Modo de Falla no se
previene ni corrige.
- El cliente o el siguiente proceso puede ser afectado.
Ejemplos: Diseño ProcesoServ. incompleto Servicio deficienteOperación errática Claridad insuficiente
Causa - Una deficiencia que genera el Modo de Falla. - Las causas son fuentes de Variabilidad asociada con
variables de Entrada Claves
Ejemplos: Diseño ProcesoMaterial incorrecto Error en servicioDemasiado esfuerzo No cumple
requerimientos
39
Preparación del AMEF Se recomienda que sea un equipo
multidisciplinario
El responsable del sistema, producto o proceso dirige el equipo, así como representantes de las áreas involucradas y otros expertos en la materia que sea conveniente.
40
Al diseñar los sistemas, productos y procesos nuevos. Al cambiar los diseños o procesos existentes o que serán
usados en aplicaciones o ambientes nuevos.
Después de completar la Solución de Problemas (con el fin de evitar la incidencia del problema).
El AMEF de diseño, después de definir las funciones del producto, antes de que el diseño sea aprobado y entregado para su manufactura o servicio.
El AMEF de proceso, cuando los documentos preliminares del producto y sus especificaciones están disponibles.
¿Cuando iniciar un FMEA?
41
FMEA de Diseño - DFMEA
42
AMEF de Diseño
El DFMEA es una técnica analítica utilizada por el equipo de diseño para asegurar que los modos de falla potenciales y sus causas/mecanismos asociados, se han considerado y atendido
43
AMEF de Diseño El proceso inicia con un listado de lo que se espera
del diseño (intención) y que no hará el diseño
Las necesidades y expectativas de los clientes de determinan de fuentes tales como el QFD, requerimientos de diseño del producto, y/o requerimientos de manufactura/ensamble/servicio.
Entre mejor se definan las características deseadas, será más fácil identificar Modos de de falla potenciales para toma de acciones correctivas / preventivas.
44
Entradas al FMEA de Diseño
45
Equipo de trabajo El equipo se divide en dos secciones:
El equipo central (“core”) que participa en todas las fases del FMEA y el equipo de soporte que apoya conforme es requerido
El apoyo de la alta dirección es crucial para el éxito
46
Alcance del DMEA El alcance se establece en el Diagrama de
límites (Boundary Diagram) por medio de consenso con el equipo de:
¿Qué se va incluir? ¿Qué se va a excluir?
Establecer los límites adecuados antes de hacer el DFMEA evitará entrar en áreas que no se están revisando o creando, para asegurar que el equipo adecuado realice el análisis
47
Alcance del DMEA Para determinar la amplitud del alcance, se deben hacer
las decisiones siguientes:
Determinar la estabilidad del diseño o desarrollo del proceso, a lo mejor primero se deben aclarar y resolver asuntos pendientes antes del DMFEA, ¿está finalizado o es un punto de control?
¿Cuántos atributos o características están todavía bajo discusión o la necesidad debe determinarse?
¿Qué tan avanzado va el diseño o proceso para su terminación? Tendrá cambios
48
Entradas al DFMEAHerramientas de robustez
Su propósito es reducir la probabilidad de campañas de calidad, mejorar la imagen, reducir reclamaciones de calidad e incrementar la satisfacción del cliente
Se generan del diagrama P que identifica los cinco factores de ruido, para ser atendidos a tiempo haciendo al diseño insensible al ruido
49
Entradas al DFMEADiagrama de límites
Un diagrama de límites es una ilustración gráfica de las relaciones entre subsistemas, ensambles, subensambles y componentes dentro del objeto, así como las interfases con los sistemas vecinos y el entorno
Al inicio del diseño, el diagrama de límites puede ser de algunos bloques representado las funciones principales y sus interrelaciones al nivel del sistema. Conforme madura el diseño, se pueden revisar o complementar para mostrar niveles inferiores de detalle, profundizando hasta el nivel de componente
50
Entradas al DFMEAMatriz de interfase
Ilustra las relaciones entre subsistemas, ensambles, subensambles, y componentes dentro del objeto así como las interfases con los sistemas vecinos y el entorno.
Documenta los detalles tales como tipos de interfases, fuerza/importancia de las interfases, efecto potencial de interfases, etc.
Si no se atienden las interacciones en este punto pueden generarse garantías potenciales y problemas de devoluciones
51
Entradas al DFMEADiagrama P
Se usa para identificar entradas intencionadas (señales) y salidas (funciones) para el objeto de estudio bajo una función específica.
Se identifican los estados de error. Los factores de ruido fuera del control del diseñador que puedan ocasionar estados de error se listan (de acuerdo a las cinco fuentes básicas de ruido) Variación pieza a pieza Cambios en el tiempo (desgaste) Uso del cliente Efectos del ambiente (tipo de camino, clima) Interacciones del sistema
Finalmente se identifican y ajustan los factores de control para minimizar el ruido
52
Entradas al DFMEADiagrama P
Dependiendo del nivel de detalle del Diagrama P, la información se alimenta a diversas columnas del FMEA. Se sugiere anexarlo
El Diagrama P: Describe los factores de ruido, factores de control,
funciones ideales y estados de error
Asisten en la identificación de: Causas potenciales de falla Modos de falla Efectos potenciales de la falla Controles actuales Acciones recomendadas
53
Entradas al DFMEADiagrama P
54
Entradas al DFMEADiagrama P
Los factores de control permiten hacer ajustes para que las funciones del producto sean más robustos
Un estado de error se puede clasificar en dos categorías:
1. Desviación de la función intencionada con modos de falla potenciales: No funciona Funciona parcialmente (incluye degradación en el
tiempo) Función intermitente Sobrefunción
55
Entradas al DFMEADiagrama P
2. Salida no intencionada del sistema (v. gr. Vibraciones) Los factores de ruido son interfases no
intencionadas, o condiciones e interacciones que pueden ocasionar falla de la función (v. gr. La vibración produce desgaste)
Las respuestas son salidas intencionadas de salida ideales (vg. Bajo consumo)
Los factores de señal son los que se activan para iniciar la función (v. gr. El usuario activa un switch)
56
Modelo DFMEA – Paso 1Funciones
Identificar todas las funciones en el alcance Identificar como cada una de las funciones puede fallar
(Modos de falla)
Identificar un grupo de efectos asociados para cada modo de falla
Identificar el rango de severidad para cada uno de los grupos de efectos que prioriza los modos de falla
Si es posible recomendar acciones para eliminar los modos de falla sin atender las “causas”
Completar pasos 2 y 3
57
Modelo DFMEA – Paso 1Funciones
La función da respuesta a ¿Qué se supone que hace este artículo?
Las funciones son intenciones del diseño o especs. de ing. y:
Se escriben en forma de verbo/nombre/caract. medible
La característica Medible o SDS: Puede ser verificada/validada; incluye parámetros adicionales o parámetros de diseño como especificaciones de servicio, condiciones especiales, peso, tamaño, localización y accesibilidad o requerimientos de estándares (v. gr. EMVSS)
58
Modelo DFMEA – Paso 1Funciones
Las funciones representan las expectativas, necesidades y requerimientos tanto explícitos como no explícitos de los clientes y sistemas
Las funciones no pueden “fallar” si no son medibles o especificadas
Ejemplos: Almacenar fluido, X litros sin fugas Controlar el flujo, X centímetros cúbicos por segundo Abrir con X fuerza Mantener la calidad del fluido durante X años bajo
condiciones de operación
59
Modelo DFMEA – Paso 1Modos de falla potenciales
Son las formas en las cuales un componente, subsistema o sistema pueden potencialmente no cumplir o proporcionar la función intencionada, pueden ser también las causas
El Modo de falla en un sistema mayor puede ser el efecto de un componente de menor nivel
Listar cada uno de los modos de falla potenciales asociados con el artículo en particular y con su función (revisar el historial de garantías y fallas o hacer tormenta de ideas
También se deben considerar modos de falla potenciales que pudieran ocurrir sólo bajo ciertas condiciones (vg. Calor, frío, humedad, polvo, etc)
60
Modelo DFMEA – Paso 1Tipos de Modos de falla
potenciales
No funciona Funciona parcialmente / sobre función /
degradación con el tiempo
Función intermitente A veces causado por los factores ambientales
Función no intencionada Los limpiadores operan sin haber actuado el switch El coche va hacia atrás aún con la palanca en Drive
61
Modelo DFMEA – Paso 1Preguntas para Modos Potenciales de falla
¿De que manera puede fallar este artículo para realizar su función intencionada?
¿Qué puede salir mal (go wrong), a pesar de que el artículo se fabrica de acuerdo al dibujo?
¿Cuándo se prueba la función, como se debería reconocer su modo de falla?
¿Dónde y cómo operará el diseño?
62
Modelo DFMEA – Paso 1Preguntas para Modos Potenciales de falla
¿Bajo que condiciones ambientales operará? ¿El artículo será usado en ensambles de más alto nivel? ¿Cómo interactúa/interfase con otros niveles del diseño?
No introducir modos de fallas triviales que no pueden o no ocurrirán
Asumiendo la función: Almacenar fluido, X litros, 0 fugas, durante 10 años
Sus modos de falla son: Almacenar < X, presenta fugas
63
Modelo DFMEA – Paso 1Efectos Potenciales de falla
Se definen como los efectos del modo de falla en la función percibida por el cliente. Qué puede notar o experimentar ya sea interno o final
Establecer claramente si la función podría impactar a la seguridad, o no cumplimiento de reglamentaciones
Los efectos se establecen en términos de sisemas específicos, subsistemas o componentes conforme sean analizados
La intención es analizar los efectos de falla al nivel de experiecia y conocimiento del equipo.
64
Modelo DFMEA – Paso 1Efectos Potenciales de falla
Describir las consecuencias de cada uno de los modos de falla identificados en: Partes o componentes Ensambles del siguiente nivel Sistemas Clientes Reglamentaciones
NOTA. Todos los estados de error del diagrama P deben ser incluidos en la columna de Modos de falla o efectos del DMFEA
65
Modelo DFMEA – Paso 1Ejemplos de Efectos Potenciales de
falla
Ruidos
Operación errática – no operable
Apariencia pobre – olores desagradables
Operación inestable
Operación intermitente
Fugas
Ruido de radiofrecuencia (EMC)
66
Modelo DFMEA – Paso 1Severidad
Es la evaluación asociada con el efecto más serio de la columna anterior. Habrá sólo una severidad para cada modo de falla
Para reducir la severidad es necesario hacer un cambio de diseño
La severidad se estima de la tabla siguiente
67
Rangos de Severidad (AMEFD)Efecto Rango Criterio .No 1 Sin efectoMuy poco 2 Cliente no molesto. Poco efecto en el desempeño del componente o servicio. Poco 3 Cliente algo molesto. Poco efecto en el desempeño del comp. o servicio.Menor 4 El cliente se siente un poco fastidiado. Efecto menor en el desempeño del componente o servicio.Moderado 5 El cliente se siente algo insatisfecho. Efecto moderado en el
desempeño del componente o servicio.
Significativo 6 El cliente se siente algo inconforme. El desempeño del comp. o servicio se ve afectado, pero es operable y está a salvo. Falla parcial, pero operable.Mayor 7 El cliente está insatisfecho. El desempeño del servicio se ve seriamente afectado, pero es funcional y está a salvo. Sistema afectado. Extremo 8 Cliente muy insatisfecho. Servicio inadecuado, pero a salvo. Sistema inoperable.Serio 9 Efecto de peligro potencial. Capaz de descontinuar el uso sin perder tiempo, dependiendo de la falla. Se cumple con el reglamento del gobierno en materia de riesgo.Peligro 10 Efecto peligroso. Seguridad relacionada - falla repentina.
Incumplimiento con reglamento del gobierno.
68
Rangos de Severidad (AMEFD)
69
Modelo DFMEA – Paso 1Clasificación
Cuando un modo de falla tiene un rango de severidad de 9 o 10, existe una característica crítica, se identifica como “YC” y se inicia un FMEA de proceso
Estas características del producto afectan su función segura y/o cumplimiento de reglamentaciones gubernamentales y pueden requerir condiciones especiales de manufactura, ensamble, abastecimiento, embarque, monitoreo y/o acciones de inspección o controles
70
Modelo DFMEA – Paso 1Acciones recomendadas
Eliminar el Modo de falla
Mitigar el efecto
Es necesario un énfasis especial en acciones posibles cuando la severidad es 9 o 10. Para valores menores también se pueden considerar acciones
Para eliminar el modo de falla considerar la acción: Cambiar el diseño (vg. Geometría, material) si está
relaionado a una característica del producto
71
Modelo DFMEA – Paso 2Identificar: Las Causas asociadas (primer nivel y raíz)
Su tasa de ocurrencia estimada
La designación de la característica adecuada (si existe) a ser indicada en la columna de clasificación
Acciones recomendadas para Severidad y Criticalidad alta (S x O)
72
Model DFMEA – Paso 2Causa potencial o mecanismo de
falla
La causa potencial de falla se define como un indicador de debilidad del diseño cuya consecuencia es el modo de falla
Listar como sea posible, cada causa de falla y/o mecanismo de falla para cada uno de los modos de falla. El detalle de la descripción permitirá enfocar los esfuerzos para atacar la causa pertinente
73
Model DFMEA – Paso 2Causa potencial o mecanismo de
falla
Se puede emplear un diagrama de Ishikawa o un Árbol de falla (FTA), preguntarse:
¿Qué circunstancia pudo causar que fallara el artículo para su fúnción?
¿Cómo podría fallar el artículo para cumplir con las especificaciones?
¿Cómo pueden ser incompatibles artículos que interactúan? ¿Qué información desarrollada en los diagramas P y Matriz de
Interfase pueden identificar causas potenciales? ¿Qué puede causar que el artículo no de la función
intencionada? ¿Qué información en el Diagrama de límites pudo haberse
pasado que pueda causar este modo de falla? ¿En que puede contribuir el historial de 8Ds y FMEAs a las
causas potenciales?
74
Model DFMEA – Paso 2Causa potencial o mecanismo de
falla
Supuesto 1: El artículo se fabricó de acuerdo a especificaciones, ejemplos de causas de falla:
La especificación de Porosidad del material es muy alta La dureza del material especificada es muy baja
El lubricante especificado es muy viscoso Torque especificado demasiado bajo
Supuesto de confiabilidad inadecuada Degradación de parámetro del Componente
Calor excesivo
75
Model DFMEA – Paso 2Causa potencial o mecanismo de
falla
Supuesto 2: El artículo puede incluir una deficiencia que causa variabilidad introducida en el proceso de ensamble o manufactura:
Especificar un diseño simétrico que permita que la parte se pueda instalar desde atrás o de arriba a abajo
Torque incorrecto debido a que el hoyo está diseñado fuera de posición
Cinturón equivocado debido a que el diseño es similar a otro que es estándar también en uso
76
Modelo DFMEA – Paso 2Causa potencial o mecanismo de
falla
Precauciones: El DFMA no confía en los controles del proceso para subsanar
debilidades del diseño, pero toma en cuenta sus limitaciones
El objetivo es identificar las deficiencias del diseño que peuden causar variación inaceptable en el proceso de manufactura o ensamble a través de un equipo multidisciplinario
Las causas de variación que no sean el resultado de directo de deficiencias de diseño pueden identificarse en el DFMEA y ser atendidas en el FMEA de Proceso
Otro objetivo es identificar las características que mejoren la robustez del diseño que pueda compensar variaciones en proceso
77
Modelo DFMEA – Paso 2Ocurrencia
Ocurrencia es la probabilidad de que una causa/mecanismo (listado en la columna previa) ocurra durante la vida del diseño
El rango de ocurrencia tiene un significado relativo más que sea absoluto
La prevención o control de las Causas / Mecanismos del modo de falla se realiza a través de cambios de diseño o cambios de diseño del proceso para reducir la ocurrencia
78
Modelo DFMEA – Paso 2Estimación de la Ocurrencia
¿Cuál es el historial de servicio y campo experimentado con artículos similares?
¿El artículo es similar al utilizado en niveles anteriores de subsistemas?
¿El componente es radicalmente diferente de los anteriores?
¿Ha cambiado la aplicación del componente?
¿Se han instalado controles preventivos en el proceso? ¿Cuáles son los cambios en el ambiente?
¿Se ha realizado un análisis análítico de la predicción de confiabilidad para estimar la tasa de ocurrencia?
Rangos de Ocurrencia (AMEFD)Ocurrencia CriteriosRemota Falla improbable. No existen fallas asociadas con este producto o con un producto / Servicio casi idénticoMuy Poca Sólo fallas aisladas asociadas con este producto / Servicio casi idénticoPoca Fallas aisladas asociadas con
productos / Servicios similaresModerada Este producto / Servicio ha
tenido fallas ocasionalesAlta Este producto / Servicio ha
fallado a menudoMuy alta La falla es casi inevitable
Probabilidad de FallaRango1 <1 en 1,500,000 Zlt > 5
2 1 en 150,000 Zlt > 4.5
3 1 en 30,000Zlt > 4
4 1 en 4,500Zlt > 3.5 5 1 en
800 Zlt > 3 61 en 150 Zlt >
2.57 1 en 50 Zlt > 2 8 1 en 15 Zlt > 1.59 1 en 6 Zlt > 1 10 >1 en 3 Zlt < 1
Nota: El criterio se basa en la probabilidad de ocurrencia de la causa/mecanismo. Se puede basar en el desempeño de un diseño similar en una aplicación similar.
80
Ocurrencia
81
Clasificación Cuando el Modo de falla/causa tien una
severidad de 5 a 8 y una ocurrencia de 4 o mayor, entonces se tiene una caracterítica significativa crítica potencial que se identifica con “YS” y se inicia el FMEA de proceso
Estas características del producto afectan la función del producto y/o son importantes para la satisfacción del cliente y pueden requerir condiciones especiales de manufactura, ensamble, embarque, monitoreo y/o inspección
82
Clasificación
83
Modelo DFMEAPaso 3
Si las causas no se pueden eliminar en paso 1 o 2, Identificar
Controles actuales de prevención usados para establecer la ocurrencia
Controles actuales de detección (vg. Pruebas) usadas para establecer la Detección
Determinar la efectividad de los controles de Detección en escala de 1 a 10
El RPN inicial (Risk Priority Number). Acciones Recomendadas (Prevenciónn and Detección). Cuando ya se hayan implementado las acciones
recomenddas, se revisa el formato DFMEA en relación a la Severidad, Ocurrencia, Detección y RPN
84
Modelo DFMEA – Paso 3Controles de diseño actuales
Listar las actividades terminadas para prevención, vaidación/verificación del diseño (DV), u otras actividades que aseguran la adecuación del diseño para el modo de falla y/o causa / mecanismo bajo consideración
Controles actuales (vg. Diseños falla/seguro como válvulas de alivio, revisiones de factibilidad, CAE, Confianilidad y robustez analítica) son los que han sido o estan usándose con los mismos diseños o similares.
El equipo siempre debe enfocarse a mejorar los controles de diseño, por ejemplo la creación de nuevos sistemas de prueba en el laboratorio, o la creación de muevos algoritmos de modelado, etc.
85
Modelo DFMEA – Paso 3Controles de diseño actuales
Hay dos tipos de controles de diseño: Prevención y detección
De prevención: Previenen la ocurrencia de la causa/mecanismo o
Modo de falla/efecto reduciendo la tasa de Ocurrencia
De detección: Detectan la causa/mecanismo o Modo de
falla/efecto ya sea por métodos analíticos o físicos antes que el artículo se libere para Poducción
Si solo se usa una columna indicarlos con P o D
86
Modelo DFMEA – Paso 3Controles de diseño actuales
Identificación de controles de diseño Si una causa potencial no fue analizada, el
producto con deficiencia de diseño pasará a Producción. Una forma de detectarlo es con su Modo de falla resultante. Se debe tomar acción correctiva
Identificar controles de diseño como sigue: 1. Identificar y listar los métodos que puedan ser
utilizados para detectar el modo de falla, como:1. FMEA anteriores, Planes de DV anteriores, Lista
de verificáción de robustez, Acciones de 8Ds
87
Modelo DFMEA – Paso 3Controles de diseño actuales
2. Listar todos los controles de diseño históricos que puedan ser suados para causas de primer nivel listadas. Revisar reportes históricos de pruebas
3. Identificar otros métodos posibles preguntando:¿De que manera puede la causa de este modo de falla ser reconocida?
¿Cómo puedo descubrir que esta causa ha ocurrido?
¿De que manera este modo de falla puede ser reconocido?¿Cómo puedo descubrir que este modo de falla ha ocurrido?
88
Modelo DFMEA – Paso 3Detección
Cuando se estima una tasa de Detección, considerar solo los controles que serán usados para detectar los Modos de Falla o sus Causas. Los controles intencionados para prevenir o reducir la Ocurrencia de una Causa o Modo de falla son considerados al estimar la tasa de Ocurrencia
Si los controles de prevención no detectan deben ser calificadas con 10
Solo se deben considerar los métodos que son usados antes de la liberación a Producción para estimar la tasa de Detección
Los programas de verificación de diseño deben basarse en la efectividad de los controles de diseño
89
Modelo DFMEA – Paso 3Detección
Para evaluar la efectividad de cada control de diseño considerar las siguientes categorías (de mayor a menor):
Métodos de análisis de diseño Modelado y simulación probada (vg. Análisis de
elementos finitos) Estudios de tolerancias (vg. Tolerancias deométricas
dimensionales) Estudios de compatibilidad de materiales (vg.
Expansión térmica, corrosión) Revisión de diseño subjetiva
Métodos de desarrollo de pruebas: Diseño de experimentos/ experimentos de peor caso
(vg. Ruido)
90
Modelo DFMEA – Paso 3Detección
Métodos de desarrollo de pruebas (cont…): Pruebas en muestras de pre-producción o prototipo Maquetas usando partes similares Pruebas de durabilidad (verificación de diseño)
Número de muestras a ser probadas Muestra significativa estadísticamente Cantidad pequeña, no significativa
estadísticamente Oportunidad de la aplicación de control de diseño
Desde la etapa de diseño del concepto (vg. Decisión del tema)
Al tener prototipos de ingeneiría Justo antes de liberarse a Producción
Rangos de Detección (AMEFD)• Rango de Probabilidad de Detección basado en la
efectividad del Sistema de Control Actual; basado en el cumplimiento oportuno con el Plazo Fijado
1 Detectado antes del prototipo o prueba piloto2 - 3 Detectado antes de entregar el diseño4 - 5 Detectado antes del lanzamiento del servicio 6 - 7 Detectado antes de la prestación del servicio8 Detectado antes de prestar el servicio9 Detectado en campo, pero antes de que ocurra la falla
o error10 No detectable hasta que ocurra la falla o error en
campo
Rangos de Detección (AMEFD)
93
DFMEA – Cálculo del riesgo El número de prioridad del rieso (RPN) es el producto de
Severidad (S), Ocurrencia (O) y Detección (D)
RPN = (S) x (O) x (D) con valores entre 1 y 1000
Puede usarse como en un Pareto para priorizar riesgos potenciales con efectos que tengan las tasas más altas de severidad
Atender los aspectos con Severidad 9 o 10 y después los efectos con Severidad alta; los de criticalidad alta (S x O) y al final los que tienen RPNs más altos
94
DFMEA – Acciones recomendadas
Considerar acciones como las siguientes: Revisión del diseño de la Geometría y/o tolerancias Revisión de especificación de materiales Diseños de experimentos (con múltiples causas
interactuando) u otras técnicas de solución de problemas Revisión de planes de prueba Sistemas redundantes – dispositivos de aviso – estados
de falla (ON y OFF)
El objetivo primario de las acciones recomendadas es reducir riesgos e incrementar la satisfacción del cliente al mejorar el diseño.
Para reducir la severidad es necesario un cambio de diseño
95
DFMEA – Acciones tomadas Se identifica la organización y persona responsable para
las acciones recomendadas y la fecha de terminación
Dar seguimiento: Desarrollar una lista de características especiales
parasu consideración en el DFMEA Dar seguimiento a todas las acciones recomendadas
y actualizar las acciones del DFMEA
Después de que se implementa una acción, anotar una descripción breve y la fecha de efectividad
96
DFMEA – Nivel de riesgo RPN Después de haber implementado las acciones
preventivas/correctivas, registrar la nueva Severidad, Ocurrencia y Detección
Calcular el nuevo RPN
Si no se tomaron acciones en algunos aspectos, dejarlos en blanco
97
DFMEA – Lista de verificación de robustez
Es una salida del proceso integrado de robustez: Resume los atributos de robustez clave y
controles de diseño
Enlaza el DFMEA y los 5 factores de ruido del diseño al Plan de verificación de diseño (DVP); vg., esta lista es una entrada al DVP
Debe ser un documento clave a revisar como parte del proceso de revisión de diseño
98
FMEA de Proceso - PFMEA
99
FMEA de Proceso
100
PFMEA Equipo
Se inicia por el Ing. responsable de la actividad, en conjunto con un equipo de personas expertas además de incluir personas de apoyo
Alcance Define que es incluido y que es excluido
101
Entradas al PFMEA Diagrama de flujo del proceso
El equipo debe desarrollar el flujo del proceso, preguntando ¿Qué se supone que hace el proceso?; ¿Cuál es su propósito?; ¿Cuál es su función?
El Diagrama P es una entrada opcional al PFMEA
102
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______
Funcióndel Producto/
Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño o Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
103
Modelo del PFMEA – Paso 1 Identificar todos los requerimientos funcionales dentro
del alcance
Identificar los modos de falla correspondientes
Identificar un conjunto de efectos asociados para cada modo de falla
Identificar la calificación de severidad para cada conjunto de efectos que de prioridad el modo de falla
De ser posible, tomar acciones para eliminar modos de falla sin atender las “causas”
104
Modelo de PFMEA – Paso 1
Requerimientos de la función del proceso Contiene características de ambos el producto y
el proceso
Ejemplos Operación No. 20: Hacer perforación de tamaño
X de cierta profundidad Operación No. 22: Realizar el subensamble X al
ensamble Y
105
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funciónde
Componente/Paso de proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
de los Mecanismosde falla
Occur
Controles del Diseño / Proceso Actual
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
Relacione lasfunciones del
diseño del componente
Pasos del procesoDel diagrama de flujo
106
Modelo de PFMEA – Paso 1
Modos de falla potenciales No funciona Funcionamiento parcial / Sobre función /
Degradación en el tiempo Funcionamiento intermitente Función no intencionada
Los modos de falla se pueden categorizar como sigue: Manufactura: Dimensional fuera de tolerancia Ensamble: Falta de componentes Recibo de materiales: Aceptar partes no conformes Inspección/Prueba: Aceptar partes equivocadas
107
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel
componente/ Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Div
Causa(s)Potencial(es)
de los Mecanismosde falla
Occur
Controles de Diseño / Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta
Datos incorrectos
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLAAMEF de Diseño / Proceso
Identificar modos de falla Tipo 1 inherentes al
diseño
108
Modelo de PFMEA – Paso 1
Efectos de las fallas potenciales (consecuencias en) Seguridad del operador Siguiente usuario Usuarios siguientes Máquinas / equipos Operación del producto final Cliente último Cumplimiento de reglamentaciones
gubernamentales
109
Modelo de PFMEA - Paso 1
Efectos de las fallas potenciales (en usuario final) Ruido Operación errática Inoperable Inestable Apariencia mala Fugas Excesivo esfuerzo Retrabajos / reparaciones Insatisfacción del cliente
110
Modelo de PFMEA –Paso 1
Efectos de las fallas potenciales (en siguiente operación) No se puede sujetar No se puede tapar No se puede montar Pone en riesgo al operador No se ajusta No conecta Daña al equipo Causa excesivo desgaste de herramentales
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel componente
/ Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Div
Causa(s)Potencial(es)oMecanismos
de falla
Occur
Controles de Diseño / Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos incorrectosLOCAL:Rehacerla factura
MAXIMO PROXIMOContabilidadequivocada
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño
Describir los efectos de modo de falla en:
LOCALEl mayor subsecuente
Y Usuario final
CTQs del QFD oMatriz de Causa Efecto
Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura / ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor
de las dos severidadesEfecto Efecto en el cliente Efecto en Manufactura /Ensamble Cali
f.Peligroso sin aviso
Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, sin aviso
Puede exponer al peligro al operador (máquina o ensamble) sin aviso 10
Peligroso con aviso
Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, con aviso
Puede exponer al peligro al operador (máquina o ensamble) sin aviso 9
Muy alto
El producto / item es inoperable ( pérdida de la función primaria)
El 100% del producto puede tener que ser desechado op reparado con un tiempo o costo infinitamente mayor
8Alto El producto / item es operable pero con un reducido
nivel de desempeño. Cliente muy insatisfechoEl producto tiene que ser seleccionado y un parte desechada o reparada en un tiempo y costo muy alto 7
Moderado
Producto / item operable, pero un item de confort/conveniencia es inoperable. Cliente insatisfecho
Una parte del producto puede tener que ser desechado sin selección o reparado con un tiempo y costo alto
6Bajo Producto / item operable, pero un item de
confort/conveniencia son operables a niveles de desempeño bajos
El 100% del producto puede tener que ser retrabajado o reparado fuera de línea pero no necesariamente va al àrea de retrabajo .
5Muy bajo
No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 75% de los clientes
El producto puede tener que ser seleccionado, sin desecho, y una parte retrabajada 4
Menor No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 50% de los clientes
El producto puede tener que ser retrabajada, sin desecho, en línea, pero fuera de la estación 3
Muy menor
No se cumple con el ajuste, acabado o presenta ruidos, y rechinidos. Defecto notado por clientes muy críticos (menos del 25%)
El producto puede tener que ser retrabajado, sin desecho en la línea, en la estación 2
Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin efecto 1
CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP
113
Modelo de PFMEA – Paso 1
Severidad La severidad es la seriedad de cada efecto,
poner la severidad del efecto más crítico para cada modo de falla
114
Modelo de PFMEA – Paso 1
Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura / ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor
de las dos severidadesEfecto Efecto en el cliente Efecto en Manufactura /Ensamble Cali
f.Peligroso sin aviso
Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, sin aviso
Puede exponer al peligro al operador (máquina o ensamble) sin aviso 10
Peligroso con aviso
Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, con aviso
Puede exponer al peligro al operador (máquina o ensamble) sin aviso 9
Muy alto
El producto / item es inoperable ( pérdida de la función primaria)
El 100% del producto puede tener que ser desechado op reparado con un tiempo o costo infinitamente mayor
8Alto El producto / item es operable pero con un reducido
nivel de desempeño. Cliente muy insatisfechoEl producto tiene que ser seleccionado y un parte desechada o reparada en un tiempo y costo muy alto 7
Moderado
Producto / item operable, pero un item de confort/conveniencia es inoperable. Cliente insatisfecho
Una parte del producto puede tener que ser desechado sin selección o reparado con un tiempo y costo alto
6Bajo Producto / item operable, pero un item de
confort/conveniencia son operables a niveles de desempeño bajos
El 100% del producto puede tener que ser retrabajado o reparado fuera de línea pero no necesariamente va al àrea de retrabajo .
5Muy bajo
No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 75% de los clientes
El producto puede tener que ser seleccionado, sin desecho, y una parte retrabajada 4
Menor No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 50% de los clientes
El producto puede tener que ser retrabajada, sin desecho, en línea, pero fuera de la estación 3
Muy menor
No se cumple con el ajuste, acabado o presenta ruidos, y rechinidos. Defecto notado por clientes muy críticos (menos del 25%)
El producto puede tener que ser retrabajado, sin desecho en la línea, en la estación 2
Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin efecto 1
CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA PFMEA
116
Modelo de PFMEA – Paso 2
Paso 2 identificar: Las causas asociadas (primer nivel y raíz)
Su tasa de ocurrencia
La designación apropiada de la característica indicada en ola columna de clasificación
Acciones recomendadas para alta severidad y criticalidad (S x O) así como la Seguridad del operador (OS) y errores de proceso de alto impacto (HI)
117
Modelo de PFMEA – Paso 2
Causa/Mecanismo potencial de falla Describe la forma de cómo puede ocurrir la falla,
descrito en términos de algo que puede ser corregido o controlado
Se debe dar priorioridad a rangos de prioridad de 9 o 10
Ejemplos, especificar claramente: Torque inadecuado (bajo o alto) Soldadura iandecuada (corriente, tiempo, presión) Lubricación inadecuada
118
Efecto(s) Potencial(es) de fallaEvaluar 3 (tres) niveles de Efectos del Modo de
Falla• Efectos Locales
– Efectos en el Área Local – Impactos Inmediatos
• Efectos Mayores Subsecuentes– Entre Efectos Locales y Usuario Final
• Efectos Finales– Efecto en el Usuario Final del producto o
Servicio
119
Modelo de PFMEA – Paso 2
Suposición 1: Los materiales para la operación son correctos Ajuste de herramentales a la profundidad
equivocada Desgaste de herramentales Temperatura del horno muy alta Tiempo de curado muy corto Presión de aire muy baja Velocidad del transportador no es constante Jets de lavadora desconectados
120
Modelo de PFMEA – Paso 2
Suposición 2: Los materiales para la operación tienen variación Material demasiado duro / suave / quebradizo La Dimensión no cumple especificaciones El acabado superficial de la operación 10 no
cumple especificaciones El localizador de perforación fuera de posición
correcta
121
Modelo de PFMEA – Paso 2
Ocurrencia: Es la probabilidad de que una causa/mecanismo
ocurra Se puede reducir o controlar solo a través de un
cambio de diseño Si la ocurrencia de la causa no puede ser
estimada, entonces estimar la tasa de falla posible
122
Modelo de PFMEA – Paso 2Ocurrencia
CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP
100 por mil piezas
Probabilidad Indices Posibles de falla
ppk Calif.
Muy alta: Fallas persistentes
< 0.55 10
50 por mil piezas
> 0.55 9
Alta: Fallas frecuentes 20 por mil piezas
> 0.78 8
10 por mil piezas
> 0.86 7
Moderada: Fallas ocasionales
5 por mil piezas
> 0.94 6
2 por mil piezas
> 1.00 5
1 por mil piezas
> 1.10 4
Baja : Relativamente pocas fallas
0.5 por mil piezas
> 1.20 3
0.1 por mil piezas
> 1.30 2
Remota: La falla es improbable
< 0.01 por mil piezas
> 1.67 1
124
Modelo de PFMEA – Paso 2
Clasificación de características especiales si: Afectan la función del producto final,
cumplimiento con reglamentaciones gubernamentales, seguridad de los operadores, o la satisfacción del cliente, y
Requieren controles especiales de manufactura, ensamble, proveedores, embarques, monitoreo y/o inspección o seguridad
125
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel componente
/ Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño / Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
La abertura delengrane propor La abertura no LOCAL:ciona una aber- es suficiente Daño a sensortura de aire entre de velocidad ydiente y diente engrane
MAXIMO PROXIMOFalla en eje 7
CON CLIENTEEquipo parado
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
Usar tabla para determinar severidad o
gravedad
126
Modelo de PFMEA – Paso 2
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel
Componente / Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño/ Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos LOCAL:equivocadso Rehacer la
factura
MAXIMO PROXIMOContabilidad 7 3erronea
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
Rango de probabilidades en que la causa identificada
ocurra
128
Modelo de PFMEA – Paso 3
En el paso 3 identificar: Controles actuales de prevención del proceso
(con acciones de diseño o proceso) usados para establecer la ocurrencia
Controles actuales de detección (vg. Inspección) usados para establecer la tasa de detección
Efectividad de los controles de detección del proceso en una escala de 1 a 10
El factor de riesgo RPN inicial Acciones recomendadas (Prevención y
Detección)
129
Identificar Causa(s) Potencial(es) de la Falla
• Causas relacionadas con el diseño - Características del servicio o Pasos del proceso– Diseño de formatos– Asignación de recursos– Equipos planeados
• Causas que no pueden ser Entradas de Diseño,tales como: – Ambiente, Clima, Fenómenos naturales
• Mecanismos de Falla– Rendimiento, tiempo de entrega, información
completa
130
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funciónde
Artículo
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
de los Mecanismosde falla
Occur
Controles de Diseño/Proces
o Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos incorrectosLOCAL: Rehacer la factura
MAXIMO PROXIMOContabilidad 7erronea
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño
Identificar causas de diseño, y
mecanismos de falla que pueden
ser señalados para los modos de falla
identificada.
Causas potencialesDe Diagrama de IshikawaDiagrama de árbol oDiagrama de relaciones
131
Modelo de PFMEA – Paso 3
Controles de proceso actuales: Son una descripción de los controles ya sea para
prevenir o para detectar la ocurrencia de los Modos/causas de falla
Consideraciones Incrementar la probabilidad de detección es costosa y
no efectiva A veces se requiere un cambio en el diseño para
apoyar la detección El incremento del control de calidad o frecuencia de
inspección sólo debe utilizarse como medida temporal Se debe hacer énfasis en la prevención de los
defectos
132
Identificar Controles de Diseño o de Proceso Actuales
• Verificación/ Validación de actividades de Diseño o control de proceso usadas para evitar la causa, detectar falla anticipadamente, y/o reducir impacto:
Cálculos, Análisis, Prototipo de Prueba, Pruebas piloto
Poka Yokes, planes de control, listas de verificación
• Primera Línea de Defensa - Evitar o eliminar causas de falla o error
• Segunda Línea de Defensa - Identificar o detectar fallas o errores Anticipadamente
• Tercera Línea de Defensa - Reducir impactos/consecuencias de falla o errores
133
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel
Componente / Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño / Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos correctos LOCAL:Rehacer lafactura
MAXIMO PROXIMOContabilidad 7 3erronea
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño
¿Cuál es el método de control actual que usa
ingeniería para evitar el modo de falla?
134
Modelo de PFMEA – Paso 3
Seleccionar un rango en la tabla de detecciónSi se usa inspección automática al 100% considerar:
La condición del gages La calibración del gage La variación del sistema de medición del gage Probabilidad de falla del gage Probabilidad de que el sistema del gage sea
punteadoSi se usa inspección visual al 100% considerar:
Es efectiva entre un 80 a 100% dependiendo del proc.
El número de personas que pueden observar el modo de falla potencialmente
La naturaleza del modo de falla - ¿es claro o confuso?
CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP Detecciò
nCriterio Tipos de
InspecciónMétodos de seguridad de Rangos
de DetecciónCalif
A B C Casi imposible
Certeza absoluta de no detección
X No se puede detectar o no es verificada
10Muy remota
Los controles probablemente no detectarán
X El control es logrado solamente con verificaciones indirectas o al azar
9Remota Los controles tienen poca
oportunidad de detección X El control es logrado solamente
con inspección visual8
Muy baja Los controles tienen poca oportunidad de detección
X El control es logrado solamente con doble inspección visual
7Baja Los controles pueden detectar X X El control es logrado con métodos
gráficos con el CEP 6Moderada
Los controles pueden detectar X El control se basa en mediciones por variables después de que las partes dejan la estación, o en dispositivos Pasa NO pasa realizado en el 100% de las partes después de que las partes han dejado la estación
5
Moderadamente Alta
Los controles tienen una buena oportunidad para detectar
X X Detección de error en operaciones subsiguientes, o medición realizada en el ajuste y verificación de primera pieza ( solo para causas de ajuste)
4Alta Los controles tienen una buena
oportunidad para detectarX X Detección del error en la estación o detección del error en
operaciones subsiguientes por filtros multiples de aceptación: suministro, instalación, verificación. No puede aceptar parte discrepante
3
Muy Alta Controles casi seguros para detectar
X X Detección del error en la estación (medición automática con dispositivo de paro automático). No puede pasar la parte discrepante
2Muy Alta Controles seguros para
detectarX No se pueden hacer partes discrepantes porque el
item ha pasado a prueba de errores dado el diseño del proceso/producto
1Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección
visual/manual
136
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel
Componente / Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño / Proceso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos incorrectosLOCAL: Rehacer la factura
MAXIMO PROXIMOContabilidad 7 3 5erronea
CON CLIENTEMolestia Insatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
¿Cuál es la probabilidad de detectar la causa de
falla?
137
Modelo de PFMEA – Paso 3
138
Modelo de PFMEA – Paso 3
139
Modelo de PFMEA – Paso 3
Número de prioridad de riesgo Se calcula como RPN = (S) x (O) x (D)
Acciones recomendadas Se deben dirigir primero a las de valores altos
de Severidad (9 o 10) o RPNs, después continuar con las demás
Las acciones se deben orientar a prevenir los defectos a través de la eliminación o reducción de las causas o modos de falla
140
Producto de Severidad, Ocurrencia, y Detección
RPN / Gravedad usada para identificar principales CTQs
Severidad mayor o igual a 8RPN mayor a 150
Calcular RPN (Número de Prioridad de Riesgo)
141
Planear Acciones
Requeridas para todos los CTQs
Listar todas las acciones sugeridas, qué persona es la responsable y fecha de terminación.
Describir la acción adoptada y sus resultados.
Recalcular número de prioridad de riesgo .
Reducir el riesgo general del diseño
142
Modelo de PFMEA – Paso 3
Acciones tomadas Identificar al responsable de las acciones
recomendadas y la fecha estimada de terminación Después de terminar una acción, dar una descripción
breve de la acción real y fecha de efectividad
Responsabilidad y fechas de terminación Desarrollar una lista de características especiales
proporcionándola al diseñador para modificar el DFMEA
Dar seguimiento a las acciones recomendadas y actualizar las últimas columnas del FMEA
143
Modelo de PFMEA – Paso 3
RPN resultante Después de implementadas las acciones
recomendadas, estimar de nuevo los rangos de Severidad, Ocurrencia y Detección y calcular el nuevo RPN. Si no se tomaron acciones dejarlo en blanco.
Salidas del PFMEA Hay una relación directa del PFMEA a el Plan de
Control del proceso
144
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funciónde
Artículo
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
de los Mecanismosde falla
Occur
Controles de Diseño Actual
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura Datos LOCAL:incorrecta incorrectos Rehacer
la factura
MAXIMO PROXIMOContabilidad 7 3 5 105erronea
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
Riesgo = Severidad x Ocurrencia x Detección
Causas probables a atacar primero
145
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______
Funcióndel componente
/ Paso del proceso
Modos de FallaPotenciales
Efecto (s)Potencial (es)
de falla
Sev.
Causa(s)Potencial(es)
o Mecanismosde falla
Occur
Controles de Diseño / Prcoeso Actuales
Detec
RPN
AcciónSugerida
Responsabley fecha límite
de Terminación
AcciónAdoptada
Sev
Occ
Det
RPN
Factura correcta Datos LOCAL:erroneos Rehacer la
factura
MAXIMO PROXIMOContabilidad 7 3 5 105erronea
CON CLIENTEMolestiaInsatisfacción
Resultados de Acción
ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso
Usar RPN para identificar acciones futuras. Una vez que
se lleva a cabo la acción, recalcular el RPN.
146
FMEA de Concepto - DFMEA
147
CDFMEA Entradas al FMEA de Concepto
El diagrama de flujo, diagrama de límites, Matriz de interfase y Diagrama P pueden ser menos detallados que para el DFMEA o PFMEA
La columna de clasificación no se utiliza
Causas potenciales / Mecanismo de falla Es importante analizar las interfases e interacciones
donde los modos de falla deben ser atendidos antes de aprobar el conceptp
Deben incluirse los factores humanos como fuentes de falla potenciales. El cliente puede interactuar con un elemento en el Diagrama de límites o en el Diagrama de flujo
Algunos modos de falla y causas se pueden eliminar con cambios como agregar redundancia al sistema propuesto
148
CDFMEA Ocurrencia
Frecuentemente se toma 10 ya que no se puede estimar en este tiempo. Una acción recomendada es necesaria para eliminar la causa. Lo mismo se aplica a las tasas de Ocurrencia altas
Controles actuales Si no se conocen poner “No identificado en este
momento” o “No se conoce la prevención o detección”
Ejemplos: Simulación, modelos matemáticos, pruebas de laboratorio en elementos, análisis de elementos finitos, etc.
149
CDFMEA Detección
Puede ser “Sin detección en este momento” con una estimación de 10. Se recomienda tomar una acción para identificar e implementar un método de detección
Nivel de riesgo = RPN = (S) x (O) x (D)
Acciones recomendadas para altos RPNs Modificar la propuesta para reducir la ocurrencia Agregar un sistema redundante para confiabilidad Agregar dispositivos de detección para que el cliente
tome acciones que prevengan modos de falla Especificar un cierto tipo de material
150
Herramientas para el FMEA
151
Herramientas Diagramas de límites Diagramas de flujo de proceso Matriz de características Tormenta de ideas Árboles de funciones Lista de efectos: FMEA de diseño Lista de efectos: FMEA de proceso Diagrama de Ishikawa Tecnica de preguntas
152
Herramientas Análisis de árbol de fallas (FTA) Análisis del modo de falla (FMA) Diseño de experimentos (DOE) Proceso de solución de problemas de 8Ds Planes de Control Planeación dinámica de control (DCP) Despliegue de la función de calidad (QFD) Análisis de valor/ Ingeniería del valor (VA/VE) REDPEPR FMEA Express FMEA del software
153
Diagrama de límites Diagramas de límites de funciones
Salida del análisis de funciones para la fase de concepto CFMEA, ilustran funciones en vez de partes
Diagramas de límites Hardware/funcional Dividen al sistema en elementos más pequeños
desde un punto de vista funcional. Muestran relaciones físicas, se usan en los DFMEAs.
154
Nombres de verbos útiles
155
Tormenta de ideas Seleccionar el problema a tratar. Pedir a todos los miembros del equipo generen ideas para la
solución del problema, las cuales se anotan en el pizarrón sin importar que tan buenas o malas sean estas.
Ninguna idea es evaluada o criticada antes de considerar todos los pensamientos concernientes al problema.
Aliente todo tipo de ideas, ya que al hacerlo pueden surgir cosas muy interesantes, que motivan a los participantes a generar más ideas.
Apruebe la naturalidad y el buen humor con informalidad, en este punto el objetivo es tener mayor cantidad de ideas
Se les otorga a los participantes la facultad de modificar o mejorar las sugerencias de otros.
Una vez que se tengan un gran número de ideas el facilitador procede a agrupar y seleccionar las mejores ideas por medio del consenso del grupo
Las mejores ideas son discutidas y analizadas con el fin del proponer una solución.
156
Herramientas para el FMEA Árbol de funciones
Ayuda a que los requerimientos del cliente no expresados explícitamente sobre el producto o proceso se cumplan
Es conveniente describir las funciones de un producto o proceso por un verbo – pronombre medible, por ejemplo:
Calentar el interior a XºC Enfriar a los ocupantes a XºC Eliminar la niebla del parabrisas en X segundos
157
Técnica de preguntas Hacer una oración con el modo de falla, causa y efecto y ver
si la oración tiene sentido. Un modo de falla es debido a una causa, el modo de falla podría resultar en efectos, por ejemplo: MODO DE FALLA: No ajustan los faros delanteros P: ¿Qué podría ocasionar esta falla? R: La luz desalineada -> Efecto P: ¿A que se puede deber esta falla? R: Cuerda grande en tornillo de ajuste -> CausaEl “No ajuste de faros delanteros” se debe a “Cuerda
grande en tornillo de ajuste”. El “desajuste de los faros” ocasiona “haces de luz desalineados”
158
Técnica de preguntasPaso 1Modo de falla Paso 2
¿Qué efecto tiene?Paso 3¿Qué lo causa?
159
Análisis de árbol de fallas (FTA)
Es una técnica analítica deductiva que usa un árbol para mostrar las relaciones causa efecto entre un evento indeseable (falla) y las diversas causas que contribuyen. Se usan símbolos lógicos para interconectar las ramas
Después de hacer el FTA e identificadas las causas raíz, se pueden determinar las acciones preventivas o los controles necesarios
Otra aplicación es determinar las probabilidades de las causas que contribuyen a la falla y propagarlas hacia adelante
160
Análisis del Modo de Falla (FMA)
Es un enfoque sistemático disciplinado para cuantificar el modo de falla, tasa de falla, y causa raíz de fallas o tasas de reparación conocidas (el FMEA para las desconocidas)
Se basa en información histórica de garantías, datos de campo, datos de servicios, y/o datos de procesos
Se usa para identificar la operación, modos de falla, tasas de falla y parámetros críticos de diseño de hardware o procesos. También permite identificar acciones correctivas para causas raíz actuales
161
Diseño de experimentos (DOE)
Es un método para definir los arreglos en cuales se puedas realizar experimentos, donde se cambian de manera controlada las variables independientes de acuerdo a un plan definido y se determinan los efectos
Para pruebas de confiabilidad el DOE usa un enfoque estadístico para diseñar pruebas para identificar los factores primarios que causas eventos indeseables
Se usan para identificar causas raíz de modos de falla, cuando varios factores pueden estar contribuyendo o cuando estos factores están interrelacionados y se desean conocer los efectos de sus interacciones
162
Método de 8 disciplinas (8Ds) Es un método de solución de problemas orientado a
equipos de trabajo, las disciplinas o pasos son: Preparar el proceso Establecer el equipo Describir el problema Desarrollar las acciones de contención o contingentes Diagnosticar el problema (definir y verificar causa
raíz) Seleccionar y verificar acciones correctivas
permanentes (PCAs) para causas raíz y puntos de escape
Implementar y validar PCAs Reconocer contribuciones del equipo y los miembros
163
Planes de control Es una descripción escrita del sistema para
controlar el proceso de producción
Lista todos los parámetros del proceso y características de las partes características de las partes que requiere acciones específicas de calidad
El plan de control contiene todaslas características críticas y significativas
Hay planes de control a nivel de manufactura de: Prototipos, producción piloto (capacidad de procesos) y de producción
164
Planeación dinámica de control (DCP)
Es un procesos que liga las herramientas de calidad para construir planes de control robustos a través de un equipo
1. Lanzamiento – definir los requerimientos de recursos
2. Estructura del equipo central y de soporte
3. Bitácora de preguntas
165
Planeación dinámica de control (DCP)
4. Información de soporte (ES, DFMEAs, DVP&R, PFMEA, etc.)
5. Diagrama de flujo y carácterísticas de enlace
6. Pre lanzamiento o controles preliminares
7. PFMEA
8. Plan de control
9. Desarrollar ilustraciones e instrucciones
10. Implementar y mantener
166
Despliegue de la función de calidad (QFD)
El QFD es un método estructurado en el cual los requerimientos del cliente son traducidos en requerimientos técnicos para cada una de las etapas del desarrollo del producto y producción
El QFD es entrada al FMEA de diseño o al FMEA de concepto. Los datos se anotan en el FMEA como medidas en la columna de función
La necesidad de obtener datos de QFD pueden ser también una salida del FMEA de concepto
167
Análisis del valor / Ingeniería del valor (VA/VE)
Son metodologías usadas comúnmente para despliegue del valor. La Ingeniería del valor se realiza antes de comprometer el herramental. El análisis del valor (VA) se realiza después del herramentado. Ambas técnicas usan la fórmula:
Valor = Función (primaria o secundaria) / Costo Los datos de VA/VE pueden ser entradas al FMEA de diseño o de
proceso en columna de Función como funciones primaria y secundaria. También pueden ser causas, controles o acciones recomendadas
La metodología VA debe ser incluida en la revisión de FMEAs actuales como apoyo para evaluar riesgos y beneficios cuando se analizan varias propuestas
168
REDPEPR (Robust Engineering Design Product Enhacement
Process)Es una herramienta que proporciona a los equipos de
Diseño: Un proceso paso a paso para aplicar el RED Las herramientas necesarias para completar el diagrama P,
listas de verificación de confiabilidad y robustez (RRCL) y la matriz de demostración de confiabilidad y robustez (RRDM)
Preguntas y tips para guiar al equipo en el proceso Capacidad para generar reportes en Excel Un proceso para mejorar la comunicación con el equipo de
ingeneiríaEl Web site donde se encuentra el software es
www.redpepr.ford.com
169
Aplicaciones del FMEA
ExpressAmbiental
De máquinas
170
FMEA ExpressEs un proceso que aplica técnicas de FMEA
simultaneamente tanto a los aspectos de diseño como a los de manufactura de un proyecto:
Consiste de cuatro fases: Preparación: Se forma un equipo directivo para
definir el alcance del proyecto, equipo de trabajo multidisciplinario, colección de información y documentos de modos de falla conocidos, causas, efectos y controles
171
FMEA Express Desarrollo del FMEA: El equipo de trabajo
multidisciplianrio completa el FMEA utilizando formatos y definiciones estándar
Posterior a la tarea: El facilitador y el equipo directivo generan un reporte final y un plan de seguimiento. El líder del equipo de FMEA es responsable de monitorear el avance
Auditoría de calidad: Después de una verificación de calidad, se proporciona un certificado de cumplimiento
Software para el FMEA: www.quality.ford.com/cpar/fmea/
172
E-FMEA ambiental
173
E-FMEA ambiental
174
Matriz de requerimientos ambientales con criterios
múltiples Para cada alternativa de diseño resumir la
siguiente información Uso de substancias prohibidas o de uso restringido Tipo y cantidad de residuos (refleja el nivel de
materiales utilizados) Consumo de energía por componente Consumo de agua por componente Otros objetivos ambientales
175
E-FMEAEjemplos de acciones recomendadas (hacer una
revisión previa de efectos secundarios en la vida del producto):
Sistemas de conexión alternos Reciclar
Rutas alternas de disposición de residuos Uso de materiales naturales
Revisar rutas de transporte Reducir trayectorias de proceso Optimizar el consumo de agua y energía
176
E-FMEASalidas del FMEA ambiental: Recomendaciones de materiales
Recomendaciones de diseño (vg. Tipo de enlace)
Recomendaciones de proceso (vg. Potencial de ahorro de energía)
Recomendación para rutas de disposición
177
MFMEA – FMEA de maquinaria
178
FMEA de maquinaria Su propósito es que a través de un equipo se asegure
que los modos de falla y sus causas/mecanismos asociados se hayan atendido
Soporta el proceso de diseño en: Apoyar en la evaluación objetiva de las funciones del
equipo, requerimientos de diseño y alternativas de diseño
Incrementar la probabilidad de que los modos de falla y sus efectos en la maquinaria se han considerado en el proceso de diseño y desarrollo
179
FMEA de maquinaria Proporcionar información adicional como apoyo a la
planeación de todos los programas de diseño, prueba y desarrollo
Desarrollar una lista de modos de falla potenciales en base a su efecto con el cliente, estableciendo prioridades para mejoras al diseño y desarrollo
Proporcionar documentación para referencia futura para el análisis de problemas de campo, evaluando cambios de diseño y desarrollo de maquinaria.
180
FMEA de maquinaria Ejemplos de descripción de funciones
Proceso de partes – 120 tareas / hora
Cabezal del índice – MTBF > 200 Hrs
Control del flujo hidráulico – 8p cl/seg.
Sistema de posición – Ángulo de rotación de 30º
Hacer un barreno – Rendimiento a la primera 99.9%
181
FMEA de maquinaria Efectos potenciales como consecuencias de falla de
subsistemas en relación a seguridad y “Las 7 grandes pérdidas” Falla – pérdidas resultado de una pérdida funcional
o reducción de la función sobre una parte del equipo requiriendo intervención de mantenimiento
Preparación y ajustes – pérdidas que son resultado de procedimientos de preparación tal como herramentado, cambio de modelo o cambio de molde. Los ajustes incluyen el tiempo muerto usado para ajustar el equipo para evitar defectos y bajo rendimiento, requiriendo intervención del operador o ajustador
182
FMEA de maquinaria Tiempo de espera y paros menores –
pérdidas resultado de interrupciones menores al flujo del proceso (como atoramiento de microswitch) requiriendo intervención del operador. El tiempo de espera sólo se puede resolver revisando el sistema / línea completa
Capacidad reducida – pérdidas que resultan de la diferencia entre el ciclo de tiempo ideal del equipo y su tiempo de ciclo real. El tiempo de ciclo ideal se determina por: a) velocidad original; b) condiciones óptimas y c) tiempo máximo de ciclo logrado con maquinaria similar
183
FMEA de maquinaria Pérdidas en el arranque – pérdidas que ocurren
durante los primeros pasos del proceso productivo después de paros largos (fines de semana, días de azueto, o entre turnos), resultando en rendimiento reducido o incremento de desperdicio y rechazos
Partes defectivas – pérdidas que resultan de la generación de defectos que producen retrabajo, reaparaciones, y/o partes no útiles
Herramentales – pérdidas que resultan de fallas en el herramental, rotura, deterioración o desgaste (vg. Herramientas de corte, tips de soldadura, etc.)
184
FMEA de maquinariaCriterios de Severidad
185
FMEA de maquinaria Causas potenciales, se asume que la maquinaria
se fabricó, instaló, usó, y se dispuso de acuerdo a sus especificaciones, preguntarse para identificar causas potenciales lo siguiente: ¿Cuáles son las circunstancias que pueden orientar
al componente, subsistema y sistema a no cumplir sus requerimientos funcionales / de desempeño?
¿A qué grado pueden los componentes, subsistemas y sistemas que interactúan ser compatibles?
¿Qué especificaciones garantizan compatibilidad?
186
FMEA de maquinariaCriterios de Ocurrencia
187
FMEA de maquinariaCriterios de Detección
188
Herramientas de la Fase de Análisis
Identificación de causas potencialesCartas Multivari y Análisis de RegresiónIntervalos de confianza y Pruebas de Hipótesis
189
7C2. Identificación de causas potenciales
Tormenta de ideasDiagrama de IshikawaDiagrama de RelacionesDiagrama de ÁrbolVerificación de causas raíz
190
Tormenta de ideas Técnica para generar ideas creativas cuando la mejor
solución no es obvia.
Reunir a un equipo de trabajo (4 a 10 miembros) en un lugar adecuado
El problema a analizar debe estar siempre visible
Generar y registrar en el diagrama de Ishikawa un gran número de ideas, sin juzgarlas, ni criticarlas
Motivar a que todos participen con la misma oportunidad
191
Tormenta de ideas Permite obtener ideas de los participantes
192
Diagrama de Ishikawa Anotar el problema en el cuadro de la derecha
Anotar en rotafolio las ideas sobre las posibles causas asignándolas a las ramas correspondientes a: Medio ambiente Mediciones Materia Prima Maquinaria Personal y Métodos o Las diferentes etapas del proceso de
manufactura o servicio
Diagrama de IshikawaMedio
ambiente Métodos Personal
¿Quéproducebajas ventasdeTortillinasTía Rosa?
Climahúmedo
Calidad delproducto
Tipo deexhibidor
Falta demotivación Ausentismo
Rotación depersonal
Maquinaría Materiales
Clientes conventas bajas
Malositinerarios
Descomposturadel camiónrepartidor
Distancia dela agencia alchangarro
Medición
Seguimientosemanal
Conocimientode losmínimos porruta
Frecuenciade visitas
Elaboraciónde pedidos
Posición deexhibidores
Falta desupervición
Programacióndeficiente
Capacidad instalada
desconocida
Marketing no tiene en cuenta
cap de p.Mala prog. De
ordenes de compra
Compras aprovecha
ofertas Falta de com..... Entre las dif. áreas de
la empresa
Duplicidad de funciones
Las un. Recibenordenes de dos
deptos diferentes
Altos inventarios
No hay controlde inv..... En proc.
Demasiados deptosde inv..... Y desarrollo
Falta de prog. Dela op. En base a
los pedidos
No hay com..... Entrelas UN y la oper.
Falta de coordinación al fincar
pedidos entre marketing y la op.
Falta de control deinventarios en
compras
Influencia de lasituación econ del
país
No hay com..... Entre comprascon la op. general
No hay coordinaciónentre la operación y las unidades
del negocio
Falta de coordinación entre el enlace de compras
de cada unidad con compras corporativo
Influencia directa demarketing sobre
compras
Compra de materialpara el desarrollo denuevos productos por
parte inv..... Y desarrollo’’’
No hay flujo efectivo de mat.
Por falta deprogramaciónde acuerdo a pedidos
Perdida de mercadodebido a la
competencia
Constantes cancelaciones
de pedidosde marketing
No hay coordinaciónentre marketing
operaciones
Falta de comunicaciónentre las unidades
del negocio
Diagrama de relaciones
Dancer
Taco generador del motor
Poleas guías
Presión deldancer
Mal guiado
Sensor de velocidadde línea
Sensorcircunferencial
Bandas detransmisión
Empaques de arrastre
Presión de aire de trabajo
Drive principal
Voltaje del motor
Ejes principales
Poleas de transmisión
¿Que nos puede provocar Variación de VelocidadDurante el ciclo de cambio en la sección del
Embobinadores?
Causas a validarCausas a validar
13/0
2/4
0/4
1/2
5/1
1/4
1/4
2/1
1/1
0/3
5/2
4/1
1/5
1/5
Entradas CausaSalidas Efecto
196
Diagrama de árbol o sistemático
Meta MedioMeta
MetaMedio
Medio
Meta u objetivo
Medioso planes
Medioso planes
Medios
Medios MediosPrimer nivel
Segundo nivel Tercer
nivelCuarto
nivel
Implantar el Sistema SMED
Producto DJ 2702
¿Objetivo?
Preparación para el SMED
Fase 1: Separación de la preparación interna de la externa
Fase 2: Conversión de preparación interna en externa
Fase 3: Refinamientode todos los aspectos de la preparación.
Filmar la preparación
Analizar el video
Describir las tareas
Separar las tareas
Elaborar lista de chequeo
Realizar chequeo de funciones
Analizar el transporte de herramientas y materiales
Analizar las funciones y propósito de c/operación
Convertir tareas de prepa-ración interna a externas
Realización de operacionesen paralelo.
Uso de sujeciones funcionales.
Eliminación de ajustes
5- 12 - Mar-04
10 y 17 –Mar-04
17- Mar-04
17- Mar-04
2- Mar-04
24- Mar-04
24- Mar-04
12 - Abr- 04
15 –Abr - 04
5 –May -04
19– May -04
12- May -04
¿Qué?
¿Cómo? ¿Cuándo?
Elaboramos un Diagrama de Arbol para poder analizar nuestro problema siguiendo el sistema SMED.
Diagrama de Arbol- Aplicación Sistema SMED
19
198
Verificación de posibles causas
Para cada causa probable , el equipo deberá por medio del diagrama 5Ws – 1H: Llevar a cabo una tormenta de ideas para
verificar la causa. Seleccionar la manera que:
represente la causa de forma efectiva, y sea fácil y rápida de aplicar.
199
Calendario de las actividadesCalendario de las actividades
¿qué? ¿qué? ¿por qué?¿por qué? ¿cómo?¿cómo? ¿cuánd¿cuándo?o?
¿dónd¿dónde?e?
¿quién¿quién??
1 Tacogenerador de motor embobinador
1.1 Por variación de voltaje durante el ciclo de cambio
1.1.1 Tomar dimensiones de ensamble entre coples.1.1.2 Verificar estado actual y especificaciones de escobillas.1.1.3 tomar valores de voltaje de salida durante el ciclo de cambio.
Abril ’04
1804 Embob
.
J. R.
2 Sensor circular y de velocidad de linea.
2.1 Por que nos genera una varión en la señal de referencia hacia el control de velocidad del motor embobinador
2.1.1 Tomar dimensiones de la distancia entre poleas y sensores.2.1.2 Tomar valores de voltaje de salida de los sensores.2.1.3 Verificar estado de rodamientos de poleas.
Abril ’04
1804Embob
.
U. P.
3 Ejes principales de transmisión.
3.1 Por vibración excesiva durante el ciclo de cambio
3.1.1 Tomar lecturas de vibración en alojamientos de rodamientos3.1.2 Comparar valores de vibraciones con lecturas anteriores.3.1.3 Analizar valor lecturas de vibración tomadas.
Abril’04 1804 Embob
.
F. F.
4 Poleas de transmisión de ejes embobinadores.
4.1 Puede generar vibración excesiva durante el ciclo de cambio.
4.1.1 Verificar alineación, entre poleas de ejes principales y polea de transmisión del motor.4.1.2 Tomar dimensiones de poleas(dientes de transmisión).4.1.3 Tomar dimensiones de bandas (dientes de transmisión)4.1.4 Verificar valor de tensión de bandas.
Abril’04 1804 Embob
.
J. R.U. P.
200
7A. Análisis exploratorio de datos
1. Estudios Multivari
2. Modelando relaciones entre variables
201
7A1. Análisis exploratorio de datos - Análisis Multivari
202
7A1. Análisis exploratorio de datos
- Estudios Multivari La carta multivari permite analizar la variación
dentro de la pieza, de pieza a pieza o de tiempo en tiempo
Permite investigar la estabilidad de un proceso consiste de líneas verticales u otro esquema en función del tiempo. La longitud de la línea o del esquema representa el rango de valores encontrados en cada conjunto de muestras
203
7A1. Análisis exploratorio de datos
- Estudios Multivari La variación dentro de las muestras (cinco
puntos en cada línea). La variación de muestra a muestra como posición vertical de las líneas.
ESPESOR
Número de subgrupo
204
7A1. Análisis exploratorio de datos
- Estudios Multivari Ejemplo de parte metálica
Centro más grueso
205
7A1. Análisis exploratorio de datos
- Estudios Multivari Procedimiento de muestreo:
Seleccionar el proceso y la característica a investigar
Seleccionar tamaño de muestra y frecuencia de muestreo
Registrar en una hoja la hora y valores para conjunto de partes
206
7A1. Estudios Multivari Procedimiento de muestreo:
Realizar la carta Multivari Unir los valores observados con una línea
Analizar la carta para variación dentro de la parte, de parte a parte y sobre el tiempo
Puede ser necesario realizar estudios adicionales alrededor del área de máxima variación aparente
Después de la acción de mejora comprobar con otro estudio Multivari
207
Su propósito fundamental es reducir el gran número de causas posibles de variación, a un conjunto pequeño de causas que realmente influyen en la variabilidad.
Sirven para identificar el patrón principal de variación de entre tres patrones principales:
Temporal: Variación de hora a hora; turno a turno; día a día; semana a semana; etc.
Cíclico: Variación entre unidades de un mismo proceso; variación entre grupos de unidades; variación de lote a lote.
7A1. Cartas Multivari
208
Posicional: Variaciones dentro de una misma unidad
(ejemplo: porosidad en un molde de metal) o a través de una sola unidad con múltiples partes (circuito impreso).
Variaciones por la localización dentro de un proceso que produce múltiples unidades al mismo tiempo. Por ejemplo las diferentes cavidades de un molde
Variaciones de máquina a máquina; operador a operador; ó planta a planta
7A1. Cartas Multivari
209
Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el proceso tres o más veces a cierto intervalo de tiempo, hasta que al menos el 80% de la variación en el proceso se ha capturado.
A
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD
7A1. Cartas Multivari
210
Ejemplo: (cont...)
B
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD
7A1. Cartas Multivari
211
Ejemplo: (cont...)
C
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59 VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO
7A1. Cartas Multivari
212
Ejemplo: Un proceso produce flecha cilíndricas, con un diámetro especificado de 0.0250” 0.001”. Sin embargo un estudio de capacidad muestra un Cp = 0.8 y una dispersión natural de 0.0025” (6 ) contra la permitida de 0.0002”. Se tiene pensado comprar un torno nuevo de US$70,000 para tolerancia de 0.0008”, i.e. Cpk = 1.25. Se sugirió un estudio Multi Vari previo.
Se tomaron cuatro lecturas en cada flecha, dos a cada lado. Estas muestran una disminución gradual desde el lado izquierdo al lado derecho de las flechas, además de excentricidad en cada lado de la flecha.
La variación cíclica, de una flecha a la siguiente, se muestra mediante las líneas que concentran las cuatro lecturas de cada flecha.
También se muestra la variación temporal.
7A1. Cartas Multivari
213
.0.2510”
0.2500”
0.2490”
Cartas Multivari
Máximo
Mínimo
Izquierda
Derecha
8 AM 9 AM 10 AM 11 AM 12 AM
214
Un análisis rápido revela que la mayor variación es temporal con un cambio mayor entre las 10 AM y las 11 AM.
A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM, con lecturas similares a las de las 8 AM. Conforme pasa el tiempo las lecturas tienden a decrecer más y más, hasta que se invierten a las 10 A.M. en forma drástica.
Se investigó y se encontró que la temperatura tenía influencia en la variación.
La variación en temperatura era causada por que la cantidad de refrigerante no era la adecuada, lo cual se notaba más cuando se paraba el equipo y se volvía a arrancar. Se adicionó, reduciendo la variación en 50% aproximadamente..
7A1. Cartas Multivari
215
También se encontró que el acabado cónico era causado por que la herramienta de corte estaba mal alineada. Se ajustó, contribuyendo a otra reducción del 10% de la variabilidad.
La excentricidad de las flechas se corrigió al cambiar un rodamiento excéntrico por desgaste en el torno. Se instaló un nuevo rodamiento eliminándose otro 30% de la variabilidad.
La tabla siguiente muestra un resumen de los resultados.
7A1. Cartas Multivari
216
Tipo de % var. Causas de Acción % de variación
Variación Total Variación Correctiva ReducidaTemporal 50 Bajo nivel de Adicionar Casi 50
Tiempo a tiempo Refrigerante refrigerante
Dentro de 10 Ajuste no Ajuste de la Casi 10
la flecha no paralelo herramienta de
corte
Dentro de 30 Rodamiento Nuevo Casi 30
la flecha gastado rodamiento
Flecha a 5 -??? - -
flecha
7A1. Cartas Multivari
217
Resultados: La variación total en la siguiente corrida de producción se redujo de 0.0025” a 0.0004”
El nuevo Cp fue de 0.002 / 0.0004 = 5.0
Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva máquina.
Se observa que antes de cambiar equipo o máquinas, es conveniente realizar un estudio de variabilidad para identificar las fuentes de variación y tratar de eliminarlas.
7A1. Cartas Multivari
218
Variación desist. medición
Variaciónde
proceso
Pieza apieza Lote a lote Dentro de
la piezaMáquina amáquina
Turno aturno
Tiempo atiempo
Diámetro de Flecha (0.150" +/- .002)
Programa Máquina Accesorios
Operador a operador
Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.
7A1. Cartas Multivari
219
Ejemplo (cont..):
• Al realizar la prueba de homogeneidad de varianza F, se encontró que había una diferencia significante entre los operadores.
Se Rechaza Ho: Oper1 =
Oper2 = Oper3
• Para probar si existe diferencia significativa entre medias de operadores se hacen las siguientes comparaciones
Ho: Oper1 = Oper2 Ho: Oper1 = Oper3
Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3
7A1. Cartas Multivari
220
Corrida en Minitab Se introducen los datos en varias columnas C1
a C3 incluyendo la respuesta (strenght) y los factores (time y Metal)
SinterTime MetalType Strength0.5 15 230.5 15 200.5 15 210.5 18 220.5 18 190.5 18 200.5 21 190.5 21 18
221
Corrida en Minitab Utilizar el achivo de ejemplo Sinter.mtw
Opción: Stat > Quality Tools > Multivari charts
Indicar la columna de respuesta y las columnas de los factores
En opciones se puede poner un título y conectar las líneas
222
Resultados
211815
23.5
22.5
21.5
20.5
19.5
18.5
17.5
MetalType
Stre
ngth
0.5
1.0
2.0
Multi-Vari Chart for Strength by SinterTime - MetalType
SinterTime
223
7A2a. Regresión lineal simple
224
DefinicionesCorrelación
Establece si existe una relación entre las variables y responde a la pregunta, ”¿Qué tan evidente es esta relación?"
RegresiónDescribe con más detalle la relación entre las variables.
Construye modelos de predicción a partir de información experimental u otra fuente disponible.
Regresión lineal simpleRegresión lineal múltipleRegresión no lineal cuadrática o cúbica
225
CorrelaciónPropósito: Estudiar la posible relación entre dos variables.
Acc
iden
tes
labo
rale
s
Numero de órdenes urgentes
Correlación positiva, posible
•••
•• •
•
•• •
•••
••
•
•• • •
•
• ••
• •••
•
El 1er. paso es realizar una gráfica de la información.
Correlación de la información (R ) de las X y las YCorrelación Positiva
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación NegativaEvidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónPositiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónNegativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlación
10
15
20
25
5 10 15 20 25
X
Y
0
5
0
R=1
R=>-1
R=-1
R=0
R=>1
Tabla de Correlación mínimaCorrelaciones (Pearson)
n 95% 99% de confianza de confianza 3 1.00 1.00 4 0.95 0.99 5 0.88 0.96 6 0.81 0.92 7 0.75 0.87 8 0.71 0.83 9 0.67 0.80 10 0.63 0.76 11 0.60 0.73 12 0.58 0.71 13 0.53 0.68 14 0.53 0.66
n 95% 99% de confianza de confianza15 0.51 0.6416 0.50 0.6117 0.48 0.6118 0.47 0.5919 0.46 0.5820 0.44 0.5622 0.42 0.5424 0.40 0.5226 0.39 0.5028 0.37 0.4830 0.36 0.46
Para un 95% de confianza, con una muestra de 10,el coeficiente (r) debe ser al menos .63
228
• La correlación puede usarse para información de atributos, variables normales y variables no normales.
• La correlación puede usarse con un “predictor” o más para una respuesta dada.
• La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada.
7A2. Correlación
229
El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.
Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”
• Múltiples predictores “X” y una sola “Y”
• Varios predictores “X” entre sí
7A2. Análisis de Regresión
230
Supuestos de la regresión lineal
Los principales supuestos que se hacen en el análisis de regresión lineal son los siguientes:
La relación entre las variables Y y X es lineal, o al menos bien aproximada por una línea recta.
El término de error tiene media cero.
El término de error tiene varianza constante 2.
Los errores no están correlacionados.
Los errores están normalmente distribuidos.
Xy 10
231
Modelo de regresión lineal Se aume que para cualquier valor de X el valor
observado de Y varia en forma aleatoria y tiene una distribución de probabilidad normal
El modelo general es: Y = Valor medio de Yi para Xi + error aleatorio
Xy 10
La línea de regresión se calcula por el método de mínimos cuadrados. Un residuo es la diferencia entre un punto de referencia en particular (xi, yi) y el modelo de predicción ( y = a + bx ). El modelo se define de tal manera que la suma de los cuadrados de los residuales es un mínimo. La suma residual de los cuadrados es llamada con frecuencia la suma de los cuadrados de los errores (SSE) acerca de la línea de regresión
•••
•• •
•
•• •
•••
••
•
•• • •
•
• ••
• •••
•
ei
xi
yi
SSE = ei2 = yi - yi2
y = b0 + b1x
Regresión Lineal Simple
a y b son Estimados de0 y 1
233
Gráfica de la Línea de AjusteRecta de regresión
Y=-.600.858+5738.89XR2 = .895
Altura del muelle
Ret
enci
ón
0.18 0.19 0.20
400
500
600
Regresión
95% Intervalode confianza
95% Intervalode predicción
234
Interpretación de los Resultados
El intervalo de predicción es el grado de certidumbre de la difusión de la Y estimada para puntos individuales X. En general, 95% de los puntos individuales (provenientes de la población sobre la que se basa la línea de regresión), se encontrarán dentro de la banda [Líneas azules]
La ecuación de regresión (Y = -600.858 + 5738.89X) describe la relación entre la variable predictora X y la respuesta de predicción Y.
R2 (coef. de determinación) es el porcentaje de variación explicado por la ecuación de regresión respecto a la variación total en el modelo
El intervalo de confianza es una banda con un 95% de confianza de encontrar la Y media estimada para cada valor de X [Líneas rojas]
Interpretación de los Resultados
• Los valores “p” de la constante (intersección en Y) y las variables de predicción, se leen igual que en la prueba de hipótesis.
Ho: El factor no es significativo en la predicción de la respuesta.Ha: El factor es significativo en la predicción de la respuesta.
• s es el “error estándar de la predicción” = desviación estándar del error con respecto a la línea de regresión.
• R2 (ajustada) es el porcentaje de variación explicado por la regresión, ajustado por el número de términos en el modelo y por el número de puntos de información.
• El valor “p” para la regresión se usa para ver si el modelo completo de regresión es significativo. Ho: El modelo no es significativo en la predicción de la respuesta. Ha: El modelo es significativo en la predicción de la respuesta.
236
Errores residuales Los errores se denominan frecuentemente residuales.
Podemos observar en la gráfica de regresión los errores indicados por segmentos verticales.
237
Errores residualesLos residuos pueden ser graficados para:
Checar normalidad. Checar el efecto del tiempo si su orden es conocido en los
datos. Checar la constancia de la varianza y la posible necesidad
de transformar los datos en Y. Checar la curvatura de más alto orden que ajusta en las
X’s.
A veces es preferible trabajar con residuos estandarizados o estudentizados:
niYYe iii ...,3,2,1,
^
nMSe
dE
ii ,.....,2,11,....
,)(11
2
XX
i
ii
SXX
nMSE
er
238
Errores residuales Análisis de los errores o residuales
¿Qué tan normales son los residuales?
¿Residuales individuales -tendencias; o separados?
Histograma -¿curva de campana?
Ignórese para grupos pequeños de información
(<30)
¿Aleatorio alrededor de
cero, sin tendencias?Buscar las inconsistencias
mayoresBuscar las inconsistencias
mayores
Diagnóstico del Modelo de ResidualesGráfica Normal de Residuales Tabla de Residuales
Histograma de Residuales Residuales vs. Ajustes
Marcador Normal Número de Observación
Ajuste
Frec
uenc
ia
151050-5-10-15-20-25
3
2
1
0
1050
50403020100
-10-20-30-40-50
X=0.000
3.0SL=43.26
-3.0SL=-43.26
550500450
20
10
0
-10
-20
210-1-2
20
10
0
-10
-20
151050-5-10-15-20-25
3
2
1
0
1050
50403020100
-10-20-30-40-50
X=0.000
3.0SL=43.26
-3.0SL=-43.26
550500450
20
10
0
-10
-20
210-1-2
20
10
0
-10
-20
Res
idua
lR
esid
ual
Res
idua
l
239
EjemploConsidere el problema de predecir las ventas mensuales en función del costo de publicidad. Calcular el coeficiente de correlación, el de determinación y la recta.
MES Publicidad Ventas
1 1.2 1012 0.8 923 1.0 1104 1.3 1205 0.7 906 0.8 827 1.0 938 0.6 759 0.9 9110 1.1 105
240
Cálculo manualCalcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2
Xi YiMES Publicidad Ventas Xi2 XiYi Yi21 1.2 101 1.44 121.2 102012 0.8 92 0.64 73.6 84643 1.0 110 1.00 110.0 121004 1.3 120 1.69 156 144005 0.7 90 0.49 63.0 81006 0.8 82 0.64 65.6 67247 1.0 93 1.00 93.0 86498 0.6 75 0.36 45.0 56259 0.9 91 0.81 81.9 828110 1.1 105 1.21 115.5 11025
SUMA 9.4 959 9.28 924.8 93,569
241
Método de mínimos cuadrados
Donde:Yest = Valor predicho de para un valor particular de x.b0 = Estimador puntual de .(ordenada al origen)b1= Estimador puntual de (pendiente)Para el cálculo de b0 y b1 se utilizamos las siguientes
fórmulas:
nx
xSS x
2
2
ny
ySS y
2
2
nyx
xySS xy
x
xy
SSSS
b 1
xbyb 10
242
Análisis de varianza en la regresión
La desviación estándar S corresponde a la raíz cuadrada del valor de MSE o cuadrado medio residual.
Los residuos son:
2212
n
SbSnSSS XYYYE
n
YYS
n
iin
iiYY
2
1
1
2
n
YXYXS
n
ii
n
iin
iiiXY
11
1
iii YYe^
)(__^__^YYYYYY iiii
Tabla de Análisis de Varianza . Fuente df SS MS = SS/df Fc Regresión 1 XYSbSSR 1 REGMS MSreg/s2
Residual n-2 XYYY SbSSSSE 1 S2 __________________________________________________________. Total corregido n-1 YYS
2^
2__^
2__
)()()( iiii YYYYYY
243
Análisis de varianza en la regresión
Las conclusiones son como sigue:
Intervalos de confianza para Beta 0 y Beta 1
El estadístico F se calcula como F = MSEREG / S2 y se compara con la F de
tablas con (1, n-2) grados de libertad y área en 100(1-)%, para determinar si
el parámetro 1 es significativo que es el caso de Fcalc. > Ftablas.
SXXn
XSX
nMSEbse
i
i
XX
2/1
2__
22__
0
)(
1)(
XXXX SS
SMSEbse )( 1
SXXn
Xntb
i
i
2/1
2__
2
0
)()
211,2(
2__1
)(
).211,2(
XX
Sntb
i
2__1
)(
).211,2(
XX
Sntb
i
244
Análisis de varianza en la regresión
El intervalo de confianza para la desviación estándar es:
Intervalos de confianza para la Y estimada promedio
Intervalo de predicción para un valor particular de Y estimado
2__1
)(
).211,2(
XX
Sntb
i
22,2/1
22
2,2/
)2()2(
nn
MSEnMSEn
XXna S
XXn
MSEtY2
__
02,2/
^
0)(1
XXn
XXn S
XXn
MSEtYYS
XXn
MSEtY2
__
02,2/00
2__
02,2/0
)(11ˆ)(11ˆ
245
Análisis de varianza en la regresión
Prueba de Hipótesis para Beta 1:Ho: 1 = 0 contra H1:1 0
Si el coeficiente Beta 1 es significativo
2__1
)(
).211,2(
XX
Sntb
i
XXSMSEbt 1
0
2,2/0 ntt
246
Análisis de varianza en la regresión
Coeficiente de correlación r:
Coeficiente de determinación: r2R2 mide la proporción de la variación total respecto a la
media que es explicada por la regresión. Se expresa en porcentaje.
2__1
)(
).211,2(
XX
Sntb
i
YYXX
XY
SSS
r
YYi
SSSE
YY
YYmedialaparacorregidoSSTotalbporregresiónladeSS
R
1
)(
)()....(
).....(2
__
2__^
02
247
Análisis de varianza en la regresión
Prueba de hipótesis para el Coeficiente de correlación r:H0: = 0 contra H1: 0
Si se rechaza la hipótesis Ho, indicando que existe una correlación significativa
2__1
)(
).211,2(
XX
Sntb
i
201
2r
nrt
2,2/0 ntt
248
Riesgos de la regresión Los modelos de regresión son válidos como ecuaciones
de interpolación sobre el rango de las variables utilizadas en el modelo. No pueden ser válidas para extrapolación fuera de este rango.
Mientras que todos los puntos tienen igual peso en la determinación de la recta, su pendiente está más influenciada por los valores extremos de X. 1. Y
*A * * * * * Sin A y B * * * * *B X
249
Riesgos de la regresión Los outliers u observaciones aberrantes pueden
distorsionar seriamente el ajuste de mínimos cuadrados.
Si se encuentra que dos variables están relacionadas fuertemente, no implica que la relación sea casual, se debe investigar la relación causa – efecto entre ellas. Por ejemplo el número de enfermos mentales vs. número de licencias recibidas.
Y *A * * * * * *
* * * ** * ** * * * ** * * X
250
Cálculo manual(cont..)
Cálculo de la recta de regresión lineal:
Sxx = 9.28 - (9.4)^2/10 = 0.444
Sxy = 924.8 - (9.4)(959) / 10 = 23.34
Ymedia = 959 / 10 = 95.9 Xmedia = 9.4 / 10 = 0.94
b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57
b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49
Yest. = 46.49 + 52.57* X
251
Ejemplo (cont..)Cálculo de S2 estimador de
S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx
Syy = 93,569 - (959)^2 / 10 = 1600.9
SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97
S2 = SSE / (n - 2) = 373.97 / 8 = 46.75
S = 6.84
El intervalo de confianza donde caerán el 95% de los puntos es el rango de 1.96S = 13.41 o sea a 13.41 de la línea.
252
Ejemplo (cont..)Inferencias respecto a la pendiente de la línea b1:
Se usa el estadístico t = b1 / (S / Sxx)
El término del denominador es el error estándar de la pendiente.
Para probar la hipótesis nula Ho: 1 = 0
En este caso tc = 52.57 / (6.84 / 0.444) = 5.12
El valor crítico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados de libertad es 2.306.
Como tc > tcrítico se rechaza la hipótesis de que b1 = 0 existiendo la regresión.
253
Ejemplo (cont..)
Estableciendo un 95% de confianza para la pendiente de la recta b1.
Usando la fórmula b1 t0.025 (S / Sxx) se tiene:
52.57 2.306 * 6.84 / 0.444 = 52.57 23.67.
Por tanto una unidad de incremento en publicidad, hará que el volumen de ventas se encuentre entre $28.9 a $76.2.
254
Ejemplo (cont..)Cálculo del coeficiente de Correlación: ________r = Sxy / (SxxSyy) ____________r = 23.34 / 0.444*1600.9 = 0.88
Como r es positivo, la pendiente de la recta apunta hacia arriba y a la derecha.
El coeficiente de determinación r^2 = 1 - SSE/Syy
r^2 = ( Syy - SSE ) / Syy = 0.774
255
1. Teclear los datos para Xi y Yi
2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, CORRELATION o CORRELACIÓN
3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los resultados) y obtener los resultados
Column 1 Column 2Column 1 1 0.875442Column 2 0.875442 1
El coeficiente de correlación r = 0.875442
7A2. Análisis de Regresión
256
Cálculo con Excel)4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, REGRESION o REGRESIÓN
3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X (rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE RESIDUALES y obtener una tabla de resultados como los que se muestran en las páginas siguientes.
NOTAS:
a) La gráfica de probabilidad normal debe mostrar puntos fácilmente aproximables por una línea recta, indicando normalidad.
B) La gráfica de residuos estandarizados se deben distribuir en forma aleatoria alrededor de la línea media igual a cero.
Resultados de ExcelSUMMARY OUTPUTRegression StatisticsMultiple R 0.875442 R Square 0.766398Adjusted R Square0.737198 Standard Error 6.83715Observations 10
ANOVAdf SS MS F Significance F
Regression 1 1226.927 1226.927 26.24633 0.000904Residual 8 373.973 46.74662Total 9 1600.9
Confidence 95% Coefficients Standard Error t Stat P-value Lower Upper
Intercept46.48649 9.884566 4.702936 0.001536 23.69262 69.28035
X Variable1 52.56757 10.26086 5.123117 0.000904 28.90597 76.22916
La ecuación de la recta es Yest = 46.48649 + 52.56757 XComo los valores p para los coeficientes son menores a 0.05, ambos son significativos
258
Gráfica normal de Excel
Normal Probability Plot
0
20
40
60
80
100
120
140
0 20 40 60 80 100
Sample Percentile
Y
259
Gráfica de Residuos vs. X de Excel
X Variable 1 Residual Plot
-10
0
10
20
0 0.5 1 1.5
X Variable 1
Res
idua
ls
260
Ejercicio
Calcular la recta de predicción con sus bandas de confianza, la correlación y la determinación para la respuesta de un Taxi, los datos se muestran a continuación:
Distancia Tiempo0.8 200 2.2 4001.0 1600.6 1201.0 3601.4 2802.2 5600.6 320
261
Relaciones no Lineales¿Qué pasa si existe una relación causal, no lineal?
El siguiente es un conjunto de datos experimentales codificados, sobre resistencia a la compresión de una aleación especial:
Resistencia aConcentración la Compresión x y 10.0 25.2 27.3 28.7 15.0 29.8 31.1 27.8 20.0 31.2 32.6 29.7 25.0 31.7 30.1 32.3 30.0 29.4 30.8 32.8
(ref. Walpole & Myers, 1985)
¿Cómo describiría esta relación?
262
Y = 19.0333 + 1.00857X - 2.04E-02X**2R2 = 0.614
Análisis de Variancia
FUENTE DF SS MS F pRegresión 2 38.9371 19.4686 9.54490 3.31E-03Error 12 24.4762 2.0397 Total 14 63.4133
FUENTE DF Seq SS F pLineal 1 28.0333 10.3005 6.84E-03Cuadrática 1 10.9038 5.34584 3.93E-02
Resultados del Análisis de Regresión - Modelo Cuadrático
263
Regresión cuadráticaObs X Y Fit SE Fit Residual St Resid 1 5.0 1.5820 1.3366 0.0519 0.2454 1.07 2 6.0 1.8220 1.5778 0.0473 0.2442 1.06 3 3.4 1.0570 0.9508 0.0703 0.1062 0.47 4 2.7 0.5000 0.7820 0.0806 -0.2820 -1.27 5 10.0 2.2360 2.5424 0.0875 -0.3064 -1.40 6 9.7 2.3860 2.4700 0.0828 -0.0840 -0.38 7 9.6 2.2940 2.4338 0.0804 -0.1398 -0.63 8 3.1 0.5580 0.8664 0.0753 -0.3084 -1.38 9 8.2 2.1660 2.0962 0.0609 0.0698 0.31 10 6.2 1.8660 1.6260 0.0472 0.2400 1.04 11 2.9 0.6530 0.8302 0.0776 -0.1772 -0.79 12 6.4 1.9300 1.6622 0.0474 0.2678 1.16 13 4.6 1.5620 1.2402 0.0555 0.3218 1.40 14 5.8 1.7370 1.5295 0.0476 0.2075 0.90 15 7.4 2.0880 1.9154 0.0530 0.1726 0.75 16 3.6 1.1370 0.9990 0.0675 0.1380 0.61 17 7.9 2.1790 2.0239 0.0574 0.1551 0.68 18 8.8 2.1120 2.2530 0.0694 -0.1410 -0.62 19 7.0 1.8000 1.8189 0.0500 -0.0189 -0.08 20 5.5 1.5010 1.4451 0.0490 0.0559 0.24 21 9.1 2.3030 2.3253 0.0737 -0.0223 -0.10 22 10.2 2.3100 2.5906 0.0907 -0.2806 -1.29 23 4.1 1.1940 1.1196 0.0611 0.0744 0.33 24 4.0 1.1440 1.0834 0.0629 0.0606 0.27 25 2.5 0.1230 0.7217 0.0845 -0.5987 -2.72R
264
Regresión cuadrática
Analysis of Variance Source DF SS MS F P Regression 1 8.9296 8.9296 160.26 0.000 Residual Error 23 1.2816 0.0557
Total 24 10.2112
265
Regresión cuadráticaLos residuosNo son normalesSe deben transformarLas variables
Otros Patrones No LinealesA veces es posible transformar una o ambas variables, para mostrar mejor la relación entre ambas. La meta es identificar la relación matemática entre las variables, para que con la variable transformada se obtenga una línea más recta. Algunas transformaciones comunes incluyen:
x’ = 1/xx’ = Raíz cuadrada de (x)
x’ = log xFunciones trigonométricas: x’ = Seno
de x
267
Trasformación de funciones
Ejemplo: sea se transforma como
Funciones linealizables y su forma lineal
correspondiente. Figura 3.13 Función Transformación Forma lineal
a,b 10
XY XXYY log',log' 'log' 10 XY
c,d XeY 10
YY log' XY 10ln'
e,f XY log10 XX log' '' 10 XY
g,h 10
XXY
XX
YY 1',1' '' 10 XY
XeY 10 lnlnln 10 XY
''' 10 XY
268
Transformación de variables del ejemplo de regresión cuadrática Transformando la variable X’ = 1/X se tiene, utilizando
Minitab The regression equation is Y = 2.98 - 6.93 1/X Predictor Coef SE Coef T P Constant 2.97886 0.04490 66.34 0.000 1/X -6.9345 0.2064 -33.59 0.000 S = 0.09417 R-Sq = 98.0% R-Sq(adj) = 97.9% Obs 1/X Y Fit SE Fit Residual St Resid 1 0.200 1.5820 1.5920 0.0188 -0.0100 -0.11 2 0.167 1.8220 1.8231 0.0199 -0.0011 -0.01 3 0.294 1.0570 0.9393 0.0274 0.1177 1.31 4 0.370 0.5000 0.4105 0.0404 0.0895 1.05 5 0.100 2.2360 2.2854 0.0276 -0.0494 -0.55 6 0.103 2.3860 2.2640 0.0271 0.1220 1.35
269
Transformación de variables del ejemplo de regresión cuadrática Transformando la variable X’ = 1/X se tiene, utilizando
Minitab
270
Transformación de variables del ejemplo de regresión cuadrática Los residuos ahora ya se muestran normales
271
Transformación para homoestacidad de la varianza
Algunas transformaciones para estabilizar la varianzaRelación de 2 a E(Y) Transformación
YYconstante '..............................2
YYYE '........................).........(2 Datos de Poisson
YsinYYEYE 12 '................)(1)( Proporciones binomiales
)ln('..............................)( 22 YYYE
2/132 '...........................)( YYYE
272
Transformación para homoestacidad de la varianza
Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía eléctrica utilizada (X) durante un cierto periodo de tiempoObs X Y Fit SE Fit Residual St Resid
1 679 0.790 1.649 0.351 -0.859 -0.61 2 292 0.440 0.308 0.490 0.132 0.10 3 1012 0.560 2.802 0.293 -2.242 -1.57 4 493 0.790 1.004 0.412 -0.214 -0.15 5 582 2.700 1.312 0.381 1.388 0.98 6 1156 3.640 3.301 0.297 0.339 0.24 7 997 4.730 2.750 0.294 1.980 1.38 8 2189 9.500 6.880 0.651 2.620 2.00R 9 1097 5.340 3.097 0.293 2.243 1.57 10 2078 6.850 6.495 0.600 0.355 0.27 11 1818 5.840 5.595 0.488 0.245 0.18 12 1700 5.210 5.186 0.441 0.024 0.02 13 747 3.250 1.884 0.333 1.366 0.96 14 2030 4.430 6.329 0.579 -1.899 -1.42 15 1643 3.160 4.988 0.420 -1.828 -1.31 16 414 0.500 0.730 0.441 -0.230 -0.17 17 354 0.170 0.523 0.465 -0.353 -0.25 18 1276 1.880 3.717 0.313 -1.837 -1.29 19 745 0.770 1.877 0.333 -1.107 -0.78 20 435 1.390 0.803 0.433 0.587 0.42 21 540 0.560 1.167 0.395 -0.607 -0.43 22 874 1.560 2.324 0.307 -0.764 -0.53 23 1543 5.280 4.642 0.384 0.638 0.45 24 1029 0.640 2.861 0.293 -2.221 -1.55 25 710 4.000 1.756 0.343 2.244 1.58
273
Transformación para homoestacidad de la varianza
Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía eléctrica utilizada (X) durante un cierto periodo de tiempo
The regression equation is Y = - 0.704 + 0.00346 X Predictor Coef SE Coef T P Constant -0.7038 0.6170 -1.14 0.266 X 0.0034645 0.0005139 6.74 0.000 S = 1.462 R-Sq = 66.4% R-Sq(adj) = 64.9% Analysis of Variance Source DF SS MS F P Regression 1 97.094 97.094 45.45 0.000 Residual Error 23 49.136 2.136 Total 24 146.231
274
Transformación para homoestacidad de la varianza
Se observa que la varianza se incrementa conforme aumenta X
275
Transformación para homoestacidad de la varianza
Se observa que la varianza se incrementa conforme aumenta X
276
Transformación para homoestacidad de la varianza
Transformando a X por su raíz cuadrada se tiene:Obs X SQR-Y Fit SE Fit Residual St Resid 1 679 0.8888 1.1694 0.1092 -0.2805 -0.64 2 292 0.6633 0.7717 0.1524 -0.1084 -0.25 3 1012 0.7483 1.5115 0.0912 -0.7632 -1.71 4 493 0.8888 0.9783 0.1280 -0.0894 -0.21 5 582 1.6432 1.0697 0.1184 0.5735 1.31 6 1156 1.9079 1.6595 0.0922 0.2484 0.56 7 997 2.1749 1.4961 0.0914 0.6788 1.52 8 2189 3.0822 2.7208 0.2024 0.3614 0.89 9 1097 2.3108 1.5989 0.0911 0.7120 1.60 10 2078 2.6173 2.6068 0.1867 0.0105 0.03 11 1818 2.4166 2.3397 0.1518 0.0770 0.18 12 1700 2.2825 2.2184 0.1371 0.0641 0.15 13 747 1.8028 1.2392 0.1035 0.5635 1.27 14 2030 2.1048 2.5575 0.1800 -0.4527 -1.09 15 1643 1.7776 2.1598 0.1304 -0.3822 -0.88 16 414 0.7071 0.8971 0.1372 -0.1900 -0.44 17 354 0.4123 0.8354 0.1445 -0.4231 -0.98 18 1276 1.3711 1.7828 0.0974 -0.4116 -0.93 19 745 0.8775 1.2372 0.1037 -0.3597 -0.81 20 435 1.1790 0.9187 0.1347 0.2603 0.60 21 540 0.7483 1.0265 0.1228 -0.2782 -0.64 22 874 1.2490 1.3697 0.0955 -0.1207 -0.27 23 1543 2.2978 2.0571 0.1195 0.2407 0.55 24 1029 0.8000 1.5290 0.0910 -0.7290 -1.64 25 710 2.0000 1.2012 0.1065 0.7988 1.81
277
Transformación para homoestacidad de la varianza
Transformando a X por su raíz cuadrada se tiene:Regression Analysis: SQR-Y versus X The regression equation is SQR-Y = 0.472 + 0.00103 X Predictor Coef SE Coef T P Constant 0.4717 0.1918 2.46 0.022 X 0.0010275 0.0001598 6.43 0.000 S = 0.4544 R-Sq = 64.3% R-Sq(adj) = 62.7%
278
Transformación para homoestacidad de la varianza
Transformando a X por su raíz cuadrada se tiene:
279
7A2b. Regresión lineal múltiple
280
Regresión múltiple Cuando se usa más de una variable independiente para
predecir los valores de una variable dependiente, el proceso se llama análisis de regresión múltiple, incluye el uso de ecuaciones lineales.
Se asume que los errores u tienen las características siguientes:
Tienen media cero y varianza común 2. Son estadísticamente independientes. Están distribuidos en forma normal.
uukkuuu XXXY .......22110
281
Regresión múltipleEstimación de los parámetros del modelo Se trata de minimizar los errores cuadráticos en:
El modelo de regresión múltiple en forma matricial es: Y = X + = [1 : D] + Y es un vector N x 1.X es una matriz de orden N x (k + 1), donde la 1ª. columna es 1’s. es un vector de orden (k + 1) x 1. es un vector de orden N x 1.D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k
N
uukuuuk XXYR
1
22211010 ).....(),...,,(
282
Regresión múltipleEstimación de los parámetros del modelo:
b = (X’X)-1 X’YEl vector de valores ajustados se puede expresar
como:
La varianza del modelo se estima como:
HyYXXXXXbY ')'(ˆ 1
XbY ˆ
eeeYYSSEn
iii ')ˆ(
1
22
XbXbYXbYYXbXbXbYYXbYYXbYXbYSSE ''''2''''''')()'(
YXbYYSSE ''' pNSSEMSEs
2
283
Tamaño de muestra Tomar 5 observaciones para cada una de las
variables independientes, si esta razón es menor de5 a 1, se tiene el riesgo de “sobreajustar” el modelo
Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente
284
Ejemplo de regresión múltiple
Un embotellador está analizando las rutas de servicio de máquinas dispensadoras, está interesado en predecir la cantidad de tiempo requerida por el chofer para surtir las máquinas en el local (Y).
La actividad de servicio incluye llenar la máquina con refrescos y un mantenimiento menor.
Se tienen como variables el número de envases con que llena la máquina (X1) y la distancia que tiene que caminar (X2).
285
Ejemplo de regresión múltiple
X2-Dist X1-CAS Y-TENT Fit SE Fit Residual St Resid Obs 16.68 7.0 16.680 21.708 1.040 -5.028 -1.63 1 11.50 3.0 11.500 10.354 0.867 1.146 0.36 2 12.03 3.0 12.030 12.080 1.024 -0.050 -0.02 3 14.88 4.0 14.880 9.956 0.952 4.924 1.58 4 13.75 6.0 13.750 14.194 0.893 -0.444 -0.14 5 18.11 7.0 18.110 18.400 0.675 -0.290 -0.09 6 08.00 2.0 8.000 7.155 0.932 0.845 0.27 7 17.83 7.0 17.830 16.673 0.823 1.157 0.37 8 79.24 30.0 79.240 71.820 2.301 7.420 3.21RX 9 21.50 5.0 21.500 19.124 1.444 2.376 0.81 10 40.33 16.0 40.330 38.093 0.957 2.237 0.72 11 21.00 10.0 21.000 21.593 1.099 -0.593 -0.19 12 13.50 4.0 13.500 12.473 0.806 1.027 0.33 13 19.75 6.0 19.750 18.682 0.912 1.068 0.34 14 24.00 9.0 24.000 23.329 0.661 0.671 0.21 15 29.00 10.0 29.000 29.663 1.328 -0.663 -0.22 16 15.35 6.0 15.350 14.914 0.795 0.436 0.14 17 19.00 7.0 19.000 15.551 1.011 3.449 1.11 18 09.50 3.0 9.500 7.707 1.012 1.793 0.58 19 35.10 17.0 35.100 40.888 1.039 -5.788 -1.87 20 17.90 10.0 17.900 20.514 1.325 -2.614 -0.88 21 52.32 26.0 52.320 56.007 2.040 -3.687 -1.45 22 18.75 9.0 18.750 23.358 0.662 -4.608 -1.44 23 19.83 8.0 19.830 24.403 1.132 -4.573 -1.50 24 10.75 4.0 10.750 10.963 0.841 -0.213 -0.07 25 R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. Durbin-Watson statistic = 1.17
286
Ejemplo de regresión múltipleSolución matricial
Matrix M5 = X' [ 1 1 1 1 1 1 1 1 1 1 1 1 1 7 3 3 4 6 7 2 7 30 5 16 10 4 560 220 340 80 150 330 110 210 1460 605 688 215 255 1 1 1 1 1 1 1 1 1 1 1 1 6 9 10 6 7 3 17 10 26 9 8 4 462 448 776 200 132 36 770 140 810 450 635 150 ] Matrix M6 = X'Y [ 25 219 10232 219 3055 133899 10232 133899 6725688 ] Matrix M7 = X'Y [ 560 7375 337072 ]
287
Ejemplo de regresión múltipleSolución matricial
Matrix M8 = INV(X'X) 0.113215 -0.004449 -0.000084 -0.004449 0.002744 -0.000048 -0.000084 -0.000048 0.000001 Matrix M9 = INV(X'X) X'Y 2.34123 1.61591 0.01438 The regression equation is Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DIST Predictor Coef SE Coef T P Constant 2.341 1.097 2.13 0.044 X1-CAS 1.6159 0.1707 9.46 0.000 X2-DIST 0.014385 0.003613 3.98 0.001 S = 3.259 R-Sq = 96.0% R-Sq(adj) = 95.6%
288
Ejemplo de regresión múltipleSolución matricial
Cálculo de la estimación de la varianza: Data Display Matrix M10 = Y' [ 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50 40.33 21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32 18.75 19.83 10.75 ] Matrix M11 = Y'Y = 18310.6 Matrix M12 = b' = [ 2.34123 1.61591 0.01438 ] Matrix M13 = b'X'Y = 18076.9 Matrix M14 = SSe = Y'Y - b'X'Y = 233.732
624.10325
732.2332
pN
SSS E
289
Ejemplo de regresión múltipleSolución matricial
Intervalo de confianza para Beta 1
Por tanto el intervalo de confianza para el 95% es:1.26181 1 1.97001
)()( 122,025.11122,025.1 bsetbbsetb
)17073.0)(074.2(6191.1)00274378.0)(6239.10()074.2(61591.1 1
290
Ejemplo de regresión múltipleSolución matricial
El embotellador desea construir un intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo:
X1 = 8 envases y cuya distancia es X2 = 275 pies.
La varianza de la Y0 estimada es (tomando M8=inv(X’X) :
27581
0X minutosbXY 22.1901438.061591.134123.2
275,8,1'ˆ00
56794.0)05346.0(6239.1027581
8275,8,16239.10)'(')ˆ( 01
02
0
MXXXXSYVar
291
Ejemplo de regresión múltipleSolución matricial
El intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo es para 95% de nivel de confianza:
Que se reduce a: 17.66 Y0 20.78
56794.0074.222.1956794.0074.222.19 0 Y
292
Ejemplo de regresión múltipleSolución matricial
El análisis de varianza es:
Analysis of Variance
SST = 18,310.629 - 25
)6.559( 2
= 5784.5426
SSR = 18,076.930 - 25
)6.559( 2
= 5,550.8166
SSE = SST – SSR = 233.7260
24.2616239.10
4083.27750
MSEMSRF
44.322,2,05.0 F
Como la F calculada es mayor que la F de tablas, se concluye que existe el modelo con alguno de sus coeficientes diferente de cero
Con el paquete Minitab se obtuvo lo siguiente: Source DF SS MS F P Regression 2 5550.8 2775.4 261.24 0.000 Residual Error 22 233.7 10.6 Total 24 5784.5
293
Ejemplo de regresión múltipleSolución matricial
El comportamiento de los residuos es como sigue:
294
Multicolinealidad La multicolinealidad implica una dependencia cercana
entre regresores (columnas de la matriz X ), de tal forma que si hay una dependencia lineal exacta hará que la matriz X’X sea singular.
La presencia de dependencias cercanamente lineales impactan dramáticamente en la habilidad para estimar los coeficientes de regresión.
La varianza de los coeficientes de la regresión son inflados debido a la multicolinealidad. Es evidente por los valores diferentes de cero que no están en la diagonal principal de X’X. Que son correlaciones simples entre los regresores.
295
Multicolinealidad Una prueba fácil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlación sea mayor a 0.7
Los elementos de la diagonal principal de la matriz X’X se denominan Factores de inflación de varianza (VIFs) y se usan como un diagnóstico importante de multicolinealidad. Para el componente j – ésimo se tiene:
Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad.
211
jj R
VIF
296
Análisis de los residuos Los residuos graficados vs la Y estimada, pueden mostrar
diferentes patrones indicando adecuación o no adecuación del modelo:
Gráfica de residuos aleatorios cuya suma es cero (null plot) indica modelo adecuado
Gráfica de residuos mostrando una no linealidad curvilínea indica necesidad de transformar las variables
Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar las variables. Se puede probar con la prueba de Levene de homogeneidad de varianzas
297
Escalamiento de residuos En algunos casos es difícil hacer comparaciones directas
entre los coeficientes de la regresión debido a que la magnitud de bj refleja las unidades de medición del regresor Xj. Por ejemplo:
Para facilitarla visualización de residuos ante grandes diferencias en los coeficientes, se sugiere estandarizar o estudentizar los residuos
21 10005ˆ XXY
298
Escalamiento de residuos Residuos estandarizados
Se obtienen dividiendo cada residuo entre la desviación estándar de los residuos
Después de la estandarización, los residuos tienen una media de 0 y desviación estándar de 1
Con más de 50 datos siguen a la distribución t, de manera que si exceden a 1.96 (límite para alfa 0.05) indica significancia estadística y son “outliers”
,MSEe
d ii
299
Escalamiento de residuos Residuos estudentizados
Son similares a los residuos donde se elimina una observación y se predice su valor, pero además se elimina la i-ésima observación en el cálculo de la desviación estándar usada para estandarizar la í-ésima observación
Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados
H = X (X’X)-1X’ es la matriz sombrero o “hat matriz”. ,
)1( ii
ii hMSE
er
300
Escalamiento de residuos El estadístico PRESS (Prediction Error Sum of Squares) es
una medida similar a la R2 en la regresión. Difiere en que se estiman n-1 modelos de regresión.
En cada modelo se omite una observación en la estimación del modelo de regresión y entonces se predice el valor de la observación omitida con el modelo estimado. El residuo iésimo será:
El residuo PRESS es la suma al cuadrado de los residuos individuales e indica una medida de la capacidad de predicción
)()( ˆiii YYe
2)(
1
2)(
ˆii
N
ii YYePRESS
YYedicción S
PRESSR 12Pr
301
Gráficas parciales de regresión
Para mostrar el impacto de casos individuales es más efectiva la gráfica de regresión parcial. Un caso “outlier” impacta en la pendiente de la ecuación de regresión (y su coeficiente).
Una comparación visual de la gráfica de regresión parcial con y sin la observación muestra la influencia de la observación
El coeficiente de correlación parcial es la correlación de la variable independiente Xi la variable dependiente Y cuando se han eliminado de ambos Xi y Y
La correlación semiparcial refleja la correlación entre las variables independiente y dependiente removiendo el efecto Xi
302
Matriz sombrero Los puntos de influencia son observaciones
substancialmente diferentes de las observaciones remanentes en una o más variables independientes
Contiene valores (sombrero en su diagonal) para cada observación que representa influencia. Representa los efectos combinados de todos las variables independientes para cada caso
303
Matriz sombrero Los valores en la diagonal de la matriz sombrero miden
dos aspectos: Para cada observación miden la distancia de la
observación al centro de la media de todas las observaciones de las variables independientes
Valores altos en la diagonal indica que la observación tiene mucho peso para la predicción del valor de la variable dependiente, minimizando su residuo
El rango de valores es de 0 a 1, con media p/n, p es el número de predictores y n es el tamaño de muestra. Valores límite se encuentran en 2p/n y 3p/n
304
Distancia de Mahalanobis D2 es una medida comparable a los valores sombrero
(hat values) que considera sólo la distancia de una observación del valor medio de las variables independientes.
Es otra forma de identificar “outliers”
La significancia estadística de la distancia de Malahanobis se puede hacer a partir de tablas del texto: Barnett, V., Outliers in Statistical Data, 2nd. Edition,
Nueva York, Wiley, 2984
305
Influencia en coeficientes individuales
El impacto de eliminar una observación simple en cada uno de los coeficientes de la regresión múltiple se muestra con la DFBETA y su versión estandarizada SDFBETA.
Se sugiere aplicar como límites ±1.0 o ±2 para tamaños de muestra pequeños y ±√n para muestras medias y grandes
La distancia de Cook (Di) captura el impacto de una observación: La dimensión del cambio en los valores pronosticados
cuando se omite la observación y la distancia de las otras observaciones, el límite es 1 o 4/(n-k-1)
306
Influencia en coeficientes individuales
La medida COVRATIO estima el efecto de la observación en la eficiencia del proceso, en sus errores estándar de los coeficientes de la regresión. Considera a todos los coeficientes colectivamente.
El límite puede ser establecido en 1 ±3p/n, los valores mayores al límite hacen el proceso más eficiente y los menores más ineficiente
La medida SDFFIT es el grado en que cambian los valores ajustados o pronosticados cuando el caso se elimina. El valor límite es 2*raíz((k+1)/(n-k-1))
307
Ejemplo de regresión múltiple
Solución con Excel y Minitab
Ejemplo de Regresión Múltiple Cat. (US News) GMAT Salario Inicial ($) % Aceptación
Stanford 1 711 82000 7.4Harvard 2 670 80000 12.8Penn (Wharton) 3 662 79000 14.7MIT (Sloan) 4 650 78000 15.1Chicago 5 680 65000 25.0Northwestern 6 660 70000 16.0Columbia 7 660 83000 14.8Dartmouth 8 670 70000 12.6Duke 9 646 67500 20.5Berkeley 10 653 70000 13.3Virginia 11 660 66000 18.9Michigan 12 645 65000 28.0NYU 13 646 70583 20.9Carnegie Mellon 14 640 67200 30.8Yale 15 675 65000 23.5U.N.C. 16 630 60000 19.8UCLA 17 651 65000 17.5Texas-Austin 18 630 60000 27.3Indiana 19 630 61500 44.7Cornell 20 637 64000 25.4Rochester 21 630 58500 36.0Ohio State 22 611 61000 23.2Emory 23 626 60000 33.0Purdue 24 603 63700 20.7Maryland 25 640 53000 18.9
Interpretación de Resultados de Excel- Regresión MultipleSUMMARY OUTPUTRegression StatisticsMultiple R 0.8749313 R Square 0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations 25ANOVA
df SS MS F Significance FRegression 3 1.12E+09 374977790.1 22.8513558.17E-07Residual 21 3.45E+08 16409433.67
Total 24 1.47E+09
Coefficients Standard t Stat P-value Lower 95% U pper 95% ErrorIntercept 122481.40 41473.13 2.953271081 0.007589 36233.29 208729.5
X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32-513.424
X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.65965.76118
X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.95769.49917
Resultados de Excel- Regresión sólo con sólo X1SUMMARY OUTPUT
Regression StatisticsMultiple R 0.855974R Square 0.732691Adjusted R Square 0.721069
Standard Error 4132.688Observations 25
ANOVAdf SS MS F Significance
FRegression 1 1.08E+09 1.08E+09 63.04264 4.88E-08Residual 23 3.93E+08 17079107
Total 24 1.47E+09
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 79230.32 1703.951 46.49801 2.98E-2475705.43405 82755.20595X Variable1 -910.077 114.6201 -7.93994 4.88E-08-1147.186411 -672.9674353
Con sólo X1, el Modelo se simplifica enormementepoca importancia práctica se pierde en R2 (ajustada)
La ecuación de regresión es:y = 79230 - 910 x
“Predictor” Coef Desv. Estándar T pConstante 79230 1704 46.50 0.000x -910.1 114.6 -7.94 0.000
S = 4133 R2 = 73.3% R2 (ajustada) = 72.1%
Análisis de Variancia
Fuente DF SS MS F p Regresión 1 1076712008 1076712008 63.04 0.000Error 23 392819470 17079107Total 24 1469531477
Reducción del ModeloVuelva a correr la regresión usando la categoríaUS News, como el único agente de predicción (“predictor”)
El Modelo se simplifica enormemente..…poca importancia práctica se pierde en R2 (ajustada)
312
Corrida en Minitab Se introducen los datos en varias columnas C1
a C5 incluyendo la respuesta Y (heatflux) y las variables predictoras X’s (North, South, East)HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66264.0 748.45 36.50 36.19 16.46238.8 684.45 34.66 37.31 17.66230.7 827.80 33.13 32.52 17.50251.6 860.45 35.75 33.71 16.40257.9 875.15 34.46 34.14 16.28
313
Corrida en Minitab Utilzar el archivo de ejemplo Exh_regr.mtw Opción: Stat > Regression > Regression Para regresión lineal indicar la columna de
respuesta Y (Score2) y X (Score1)
En Regresión lienal en opciones se puede poner un valor Xo para predecir la respuesta e intervalos. Las gráficas se obtienen Stat > Regression > Regression > Fitted line Plots
Para regresión múltiple Y (heatflux) y las columnas de los predictores (north, south, east)
314
Resultados de la regresión lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
315
Resultados de la regresión lineal
98765432
3.5
2.5
1.5
Score1
Sco
re2
S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %
Score2 = 1.11771 + 0.217670 Score1
95% PI
95% CI
Regression
Regression Plot
316
Resultados de la regresión Múltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
317
• La regresión sólo puede utilizarse con información de variables continuas.
• Los residuos deben distribuirse normalmente con media cero.
• Importancia práctica: (R2). Importancia estadística: (valores p)
• La regresión puede usarse con un “predictor” X o más, para una respuesta dada
• Reduzca el modelo de regresión cuando sea posible, sin perder mucha importancia práctica
7A2. Resumen de la Regresión
318
7.B Pruebas de hipótesis
319
7B. Pruebas de hipótesis1. Conceptos fundamentales2. Estimación puntual y por intervalo3. Pruebas para medias, varianzas y proporciones4. Pruebas comparativas para varianzas, medias y
prop.
5. Bondad de ajustes6. Análisis de varianza (ANOVA)7. Tablas de contingencia8. Pruebas no paramétricas
320
7B1. Conceptos fundamentales
321
Análisis Estadístico
En CADA prueba estadística, se comparan algunos valores observados a algunos esperados u otro valor observado comparando estimaciones de parámetros (media, desviación estándar, varianza)
Estas estimaciones de los VERDADEROS parámetros son obtenidos usando una muestra de datos y calculando los ESTADÏSTICOS...
La capacidad para detectar un diferencia entre lo que es observado y lo que es esperado depende del desarrollo de la muestra de datos
Incrementando el tamaño de la muestra mejora la estimación y tu confianza en las conclusiones estadísticas.
322
7B1. Conceptos fundamentales
Hipótesis nula Ho Es la hipótesis o afirmación a ser probada Puede ser por ejemplo , , , = 5 Sólo puede ser rechazada o no rechazada
Hipótesis alterna Ha Es la hipótesis que se acepta como verdadera cuando
se rechaza Ho, es su complemento Puede ser por ejemplo = 5 para prueba de dos colas < 5 para prueba de cola izquierda > 5 para prueba de cola derecha Esta hipótesis se acepta cuando se rechaza Ho
323
7B1. Conceptos fundamentales
Ejemplos: Se está investigando si una semilla modificada
proporciona una mayor rendimiento por hectárea, la hipótesis nula de dos colas asumirá que los rendimientos no cambian Ho: Ya = Yb
Se trata de probar si el promedio del proceso A es mayor que el promedio del proceso B. La hipótesis nula de cola derecha establecerá que el proceso A es <= Proceso B. O sea Ho: A <= B.
324
7B1. Conceptos fundamentales
Estadístico de prueba Para probar la hipótesis nula se calcula un estadístico
de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho
Error tipo I (alfa = nivel de significancia, normal=.05) Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor
Error tipo II (beta ) Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor
325
7B1. Conceptos fundamentales
Tipos de errores Se asume que un valor pequeño para es deseable, sin
embargo esto incrementa el riesgo . Para un mismo tamaño de muestra n ambos varían
inversamente Incrementando el tamaño de muestra se pueden reducir
ambos riesgos.Decisión realizada Ho en realidad es
VerdaderaHo en realidad es falsa
No hay evidencia para rechazar Ho
p = 1-Decisión correcta
p = Error tipo II
Rechazar Ho p = Error tipo I
p = 1 - Decisión correcta
326
7B1. Conceptos fundamentales
Pruebas de dos colas Si la Ho: , , , = cte. que un valor
poblacional, entonces el riesgo alfa se reparte en ambos extremos de la distribución. Por ejemplo si Ho = 10 se tiene:
P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2
327
7B1. Conceptos fundamentales
Pruebas de una cola Si la Ho: , , , >= Cte. que un valor
poblacional, entonces el riesgo alfa se coloca en la cola izquierda de la distribución. Por ejemplo si Ho: >= 10 y Ha: < 10 se tiene una prueba de cola izquierda:
P(Z <= - Zexcel ) = alfa
328
7B1. Conceptos fundamentales
Pruebas de una cola Si la Ho: , , , <= Cte. que un valor
poblacional, entonces el riesgo alfa se coloca en la cola derecha de la distribución. Por ejemplo si Ho: <= 10 y Ha: > 10 se tiene una prueba de cola derecha:
P(Z>= + Zexcel ) = alfa
329
7B1. Conceptos fundamentales
Tamaño de muestra requerido Normalmente se determina el error alfa y beta
deseado y después se calcula el tamaño de muestra necesario para obtener el intervalo de confianza.
El tamaño de muestra (n) necesario para la prueba de hipótesis depende de: El riesgo deseado tipo I alfa y tipo II Beta El valor mínimo a ser detectado entre las medias
de la población (Mu – Mu0) La variación en la característica que se mide (S o
sigma)
330
7B1. Conceptos fundamentales
El Tamaño de muestra requerido en función del error máximo E o Delta P intervalo proporcional esperado se determina como sigue:2 2
/ 22
2/ 2
2
( )(1 )( )
Zn
EZ p p
np
2
22/
2
222/
)()1)((
)(
pZ
n
XZ
n
331
7B1. Conceptos fundamentales
Ejemplo: ¿Cuál es el tamaño de muestra mínimo que al
95% de nivel de confianza (Z=1.96) confirma la significancia de una corrida en la media mayor a 4 toneladas/hora (E), si la desviación estándar (sigma) es de 20 toneladas?
n = (1.96^2)(20^2)/(4)^2 = 96
Obtener 96 valores de rendimiento por hora y determinar el promedio, si se desvía por más de 4 toneladas, ya ha ocurrido un cambio significativo al 95% de nivel de confianza
332
Efecto del tamaño de muestra
333
Efecto del tamaño de muestra
334
Efecto del tamaño de muestra
335
Efecto del tamaño de muestra
336
Potencia de la prueba La potencia de una prueba estadística es su
habilidad para detectar una diferencia crítica
Si Beta = 0.1 la potencia es del 90%
Delta se puede normalizar dividiéndolo entre la desviación estándar y se expresa en un cierto
número de (1 , 1.5 )
1Potencia
337
Potencia de la prueba La potencia de la prueba es la probabilidad de de
rechazar correctamente la hipótesis nula siendo que en realidad es falsa.
El análisis de potencia puede ayudar a contestar preguntas como:
¿Cuántas muestras se deben tomar para el análisis? ¿Es suficiente el tamaño de muestra? ¿Qué tan grande es la diferencia que la prueba
puede detectar? ¿Son realmente valiosos los resultados de la
prueba?
338
Potencia de la prueba Para estimar la potencia, Minitab requiere de
dos de los siguientes parámetros:
Tamaños de muestra Diferencias - un corrimiento significativo de la
media que se desea detectar Valores de potencia - La probabilidad deseada
de rechazar Ho cuando es falsa
339
Considerando la potencia de prueba
340
Estimación de riesgos
341
Pruebas de Minitab Permite hacer las siguientes pruebas:
Prueba z de una muestra Prueba t de una muestra Prueba t de dos muestras Prueba de 1 proporción Prueba de 2 proporciones
ANOVA Diseños factoriales de dos niveles Diseños de Packett Burman
342
Calculo manual
343
Calculo manual
344
Calculo manual de tamaño de muestra
345
Calculo manual de tamaño de muestra – Pruebas de una cola
346
Calculo manual de tamaño de muestra – Pruebas de una cola
347
Ejemplo con prueba de una media t
Ejemplo: Se tiene una población normal con media de 365 y límites de especificación de 360 y 370. Si la media se desplaza 2.5 gramos por arriba de la media, el número de defectos sería inaceptable, la desviación estándar histórica es de 2.403:
C1
Y-Da
ta
375370365360355
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
VariableOriginalCorridaLIE 360 LIE 370
Ho:Meta365
Ha: Corrida367.5
CORRIDA DE 2.5 GRS. EN PROMEDIO
348
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample tCompletar el diálogo como sigue:
349
Ejemplo con prueba de una media t
Los resultados se muestran a continuación:Power and Sample Size 1-Sample t TestTesting mean = null (versus not = null)Calculating power for mean = null + differenceAlpha = 0.05 Assumed standard deviation = 2.403
Sample Se tiene un 53.76% de Potencia para detectarDifference Size Power una diferencia de 2.5 si se usan 6 muestras 2.5 6 0.537662 O sea que hay una probabilidad del 46.24%
que no se rechaze Ho y se concluya que no hay diferencia significativa.
¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar el corrimiento, y para 85%, 90% y 95%?
350
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t
Se cambia este parámetro
Los resultados se muestran a continuación:
Sample TargetDifference Size Power Actual Power 2.5 10 0.80 0.832695 2.5 11 0.85 0.873928 2.5 12 0.90 0.905836 2.5 15 0.95 0.962487
Si la potencia es demasiado alta por decir 99% se pueden detectar diferenciasque realmente no son significativas.
351
Ejemplo con prueba de 2 medias t
Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectarrespecto a la desviación estándar, para una sigma poner 1 en diferencia y desviaciónestándar, con valores deseados de Potencia de 0.8 y 0.9.Stat > Power and Sample Size > 2 - Sample tPower and Sample Size 2-Sample t Test
Testing mean 1 = mean 2 (versus not =)Calculating power for mean 1 = mean 2 + differenceAlpha = 0.05 Assumed standard deviation = 1 Sample TargetDifference Size Power Actual Power 1 17 0.8 0.807037 1 23 0.9 0.912498Se requieren tamaños de muestra de entre 17 y 23
352
Ejemplo con prueba de 1 proporción
Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros:* Tamaños de muestra* La proporción - una proporción que se desea detectar con alta probabilidad* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsaSuponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de nivelesde Potencia:
Proporción que se desea detectar con altaprobabilidad (0.80, 0.90)
Es la proporción de la Hipótesis nula
353
Ejemplo con prueba de 1 proporción
Test for One ProportionTesting proportion = 0.02 (versus > 0.02)Alpha = 0.05Alternative Sample Target Proportion Size Power Actual Power 0.04 391 0.8 0.800388 0.04 580 0.9 0.900226Si se desea saber la Potencia si se utiliza un tamaño de muestra de 500 se tiene:Stat > Power and Sample Size > 2 - Sample tSample sizes = 500 Alternative values of p = 0.04Options: Greater ThanSignificance Level = 0.05
Test for One ProportionTesting proportion = 0.02 (versus > 0.02)Alpha = 0.05Alternative Sample Proportion Size Power 0.04 500 0.865861Por tanto con un tamaño de muestra de 500, la potencia de la prueba para detectarun corrimiento de 2% a 4% es del 86.6%
354
EjerciciosCalcular los tamaños de muestra necesarios para los siguientesescenarios (usar pruebas de dos colas):a. 1-muestra Z à a=0.05, b=0.1 y 0.2, d = 1.5sb. 1-muestra t à a=0.05, b=0.1 y 0.2, d = 1.5sc. 1-muestra t à a=0.01, b=0.05, d = 0.5s y 1.0sd. 2-muestras t à a=0.05, b=0.1, d = 1.5s y 2.0s2. Calcular la potencia de la prueba para los siguientes
escenarios(usar pruebas de dos colas):a. 1-muestra Z à a=0.05, d = 0.5s, n = 25, 35b. 1-muestra t à a=0.05, d = 1.0s, n = 10, 20c. 1-muestra t à a=0.01, d = 1.0s, n = 10, 25d. 2-muestras t à a=0.05, d = 0.5s, n = 10, 25, 50, 75, 100
355
EjerciciosCalcular el tamaño de muestra requerido para los siguientesescenarios (usar pruebas de dos colas):a. 1-proporción à a=0.05, b=0.1 & 0.2, P0 = 0.5, PA = 0.6b. 1-proporción à a=0.01, b=0.1 & 0.2, P0 = 0.8, PA = 0.9c. 2-proporción à a=0.05, b=0.1, P0 = 0.5, PA = 0.6, 0.8d. 2-proporciones à a=0.01, b=0.1, P0 = 0.8, PA = 0.85, 0.952. Calcular la potencia de la prueba para los siguientes
escenarios(usar pruebas de dos colas):a. 1-proporción à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350b. 1-proporción à a=0.01, P0 = 0.9, PA = 0.95, n = 400, 500c. 2-proporciones à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350d. 2-proporciones à a=0.01, P0 = 0.9, PA = 0.95, n = =400, 500
358
7B2. Estimación puntual y por intervalo
359
7B2. Estimación puntual y por intervalo
Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS.
¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa podríamos obtener como margen, algún tipo de error?
“Un Intervalo de Confianza”
360
Intervalo de confianza
P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2
Intervalo de confianza donde se encuentra el parámetro con un NC =1-
Error de estimación
361
7B2. Estimación puntual y por intervalo
¿Cómo obtenemos un intervalo de confianza?
Estimación puntual + error de estimación
¿De dónde viene el error de estimación?
Desv. estándar X multiplicador de nivel de confianza deseado Z/2
Por Ejemplo: Si la media de la muestra es 100 y la desviación estándar es 10, el intervalo de confianza al 95% donde se encuentra la media para una distribución normal es:
100 + (10) X 1.96 => (80.4, 119.6)1.96 = Z0.025
362
7B2. Estimación puntual y por intervalo
95% de Nivel de Confianza significa que sólo tenemos un 5% de oportunidad de obtener un punto fuera de ese intervalo.
Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos que para un área de 0.025, corresponde a una Z de 1.960. C. I. Multiplicador Z/2 99 2.57695 1.96090 1.64585 1.43980 1.282
Para tamaños de muestra >30, o conocida usar la distribución Normal
Para muestras de menor tamaño, o desconocida usar la distribución t
363
7B2. Estimación puntual y por intervalo
. 302
. 302
2 22
2 2
, 1 1 , 12 2
2
( 1) ( 1)
(1 )
para n
para n
n n
X Zn
X tn
n s n s
p pp Zn
; con n-1 gl.
364
Para n grande el IC es pequeño
365
Para n grande el IC es pequeño
366
Ejemplo Dadas las siguientes resistencias a la tensión:
28.7, 27.9, 29.2 y 26.5 psi
Estimar la media puntualX media = 28.08 con S = 1.02
Estimar el intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3 grados de libertad)Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)
367
Ejemplos para la media con Distribución normal Z
Z 1. El peso promedio de una muestra de 50 bultos de productos Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional). Alfa = 1 - NC2. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio oscila entre 0.93 y 1.73 onzas. ¿Cuál es el valor de Z?.3. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de confianza del 95%, las latas parecen estar llenas con 16 onzas?.4. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la solución si el peso promedio de todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de confianza?.
368
Ejemplos para la media y varianza con Distribución t
t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál es el intervalo donde se encuentra la media y varianza del lote para un 90% de nivel de confianza?. Grados libertad=20 -1 =19
6. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de confianza para la media y varianza a un nivel de confianza del 95 y del 98% del peso de productos del lote completo?.
7. Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% para estimar el peso promedio y la varianza de todos los paquetes. Los pesos de los paquetes se distribuyen normalmente.
369
Ejemplos para proporciones con Distribución Z
Z 8. De 814 encuestados 562 contestaron en forma afirmativa. ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza?
9. En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los empleados ¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el intervalo de confianza. ?
370
Instrucciones con MinitabIntervalo de confianza para la
media
Stat > Basic Statistics > 1-Sample Z, t
Variable -- Indicar la columna de los datos o Summarized Data
En caso de requerirse dar el valor de Sigma = dato
En Options:
Indicar el Confidence level -- 90, 95 o 99%
OK
371
Instrucciones con MinitabIntervalo de confianza para
proporción
Stat > Basic Statistics > 1-Proportion
Seleccionar Summarized Data
Number of trials = n tamaño de la muestraNumber of events = D éxitos encontrados en la muestra
En Options:Indicar el Confidence Interval -- 90, 95 o 99%
Seleccionar Use test and interval based in normal distribution
372
7B3. Pruebas de hipótesis para medias, varianzas y
proporciones
373
Elementos de una Prueba de Hipótesis
Prueba Estadística- Procedimiento para decidir no rechazar Ho aceptando Ha o rechazar Ho.
Hipótesis Nula (Ho) - Usualmente es una afirmación representando una situación “status quo”. Generalmente deseamos rechazar la hipótesis nula.
Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar la hipótesis nula. Ha es lo que queremos probar.
374
Elementos de una Prueba de Hipótesis
Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2 or F).
Región de Rechazo Indica los valores de la prueba estadística para que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada en un riesgo deseado, normalmente 0.05 o 5%.
375
Pasos en la Prueba de Hipótesis1. Definir el Problema - Problema Práctico
2. Señalar los Objetivos - Problema Estadístico
3. Determinar tipo de datos - Atributo o Variable
4. Si son datos Variables - Prueba de Normalidad
376
Pasos en la Prueba de Hipótesis5. Establecer las Hipótesis
- Hipótesis Nula (Ho) - Siempre tiene el signo =, ,
- Hipótesis Alterna (Ha) – Tiene signos , > o <.
El signo de la hipótesis alterna indica el tipo de prueba a usar
hipotesisladeparametroHo ,,,,: 2
hipotesisladeparametroHa ,,,,: 2
Elementos de una Prueba de HipótesisPruebas de Hipótesis de dos colas: Ho: a = bHa: a b
Pruebas de Hipótesis de cola derecha: Ho: a bHa: a > b
Pruebas de Hipótesis cola izquierda: Ho: a bHa: a < b
Z0-Z
Región de Rechazo
Región de Rechazo
Z0
Región de Rechazo
Z0-Z
Región de Rechazo
378
Pasos en la Prueba de Hipótesis6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el nivel de confianza NC = 1 - alfa
7. Establecer el tamaño de la muestra, >= 10.
8.Desarrollar el Plan de Muestreo
9.Seleccionar Muestras y Obtener Datos
10. Decidir la prueba estadística apropiada y calcular el estadístico de prueba (Z, t, X2 or F) a partir de los datos.
379
7B3 Estadísticos para medias, varianzas y
proporciones
21
1 222
1 2
1 2
2 21 1 2 2
11 2
; . ; 30;/
; . ; 30;/
; 1, 1; . .var
; . ; ' . .1 1/
( 1) ( 1) ;2
p
p
XZ Una media n conocidan
Xt Una media n desconocidaS nSF DF n n prueba dos ianzasS
X Xt dos medias s desconocidas peroS
n n
n s n sS DF nn n
2
1 22 21 2
1 2
2
; . ; ' .
.
n
X Xt dos medias s desconocidas diferentess sn n
DF formula especial
380
7B3 Estadísticos para medias, varianzas y
proporciones Para el caso de muestras pareadas se calculan
las diferencias d individuales como sigue:
22
2
22
; . . ; . . ./
( 1) ; ( 1); . . ar
( ) ; ( 1)( 1); .
id
dt Pares de medias d para cada parS n
n SX DF n prueba una v ianza
O EX DF r c bondad ajusteE
381
Pasos en la Prueba de Hipótesis11. Obtener el estadístico correspondiente de tablas o Excel.
12.Determinar la probabilidad de que el estadístico de prueba calculado ocurre al azar.
13.Comparar el estadístico calculado con el de tablas y ver si cae en la región de rechazo o ver si la probabilidad es menor a alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.
14.Con los resultados interprete una conclusión estadística para la solución práctica.
Prueba de HipótesisPruebas de Hipótesis de dos colas: Ho: a = bHa: a b
Pruebas de Hipótesis de cola derecha: Ho: a bHa: a > b
Pruebas de Hipótesis cola izquierda: Ho: a bHa: a < b
Z0-Z
Región de Rechazo
Región de Rechazo
Z0
Región de Rechazo
Z0-Z
Región de Rechazo
Estadístico Calculado conDatos de la muestra
383
Prueba de hipótesis para la varianza
Las varianzas de la población se ditribuyen de acuerdo a la distribución Chi Cuadrada. Por tanto las inferencias acerca de la varianza poblacional se basarán en este estadístico
La distribución Chi Cuadrada se utiliza en:Caso I. Comparación de varianzas cuando la
varianza de la población es conocida
Caso II. Comparando frecuencias observadas y esperadas de resultados de pruebas cuando no hay una varianza de la población definida (datos por atributos)
384
Prueba de hipótesis para la varianza
Las pruebas de hipótesis para comparar una varianza poblacional a un cierto valor constante 0, si la población sigue la distribución normal es:
Con el estadístico Chi Cuadrada con n-1 grados de libertad
385
Prueba de hipótesis para la varianza
Ejemplo: ¿El material muestra una variación (sigma) en la resistencia a la tensión menor o igual a 15 psi con 95% de confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.
X^2c =(7)(8)^2/(15)^2 = 1.99Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
rechazar la hipótesis nula. Si hay decremento en la resistencia
2.17
386
Prueba de hipótesis para atributos
Ejemplo: Un supervisor quiere evaluar la habilidad de 3 inspectores para detectar radios en el equipaje en un aeropuerto.
¿Hay diferencias significativas para un 95% de confianza?
Valores observados O
Inspector 1
Inspector 2
Inspector 3
Total por tratamiento
Radios detectados
27 25 22 74
Radios no detectados
3 5 8 16
Total de la muestra
30 30 30 90
387
Prueba de hipótesis para atributos
Ho: p1 = p2 = p3Ha: p1 p2 p3Grados de libertad = (No. de columnas -1)*(No. renglones -1)Las frecuencias esperadas son: (Total columna x Total renglón)
Valores esperados E
Inspector 1
Inspector 2
Inspector 3
Total por tratamiento
Radios detectados
24.67 24.67 24.67 74
Radios no detectados
5.33 5.33 5.33 16
Total de la muestra
30 30 30 90
388
Prueba de hipótesis para atributos
El estadístico Chi Cuadrado en este caso es:
El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de libertad es 5.99.El estadístico Chi Cuadrada calculada es menor que Chi de alfa, por lo que no se rechaza Ho y las habilidades son similares
5.99
Para una muestra grande (n>30)probar la hipótesis de una media u1.) Ho:
2.) Ha:
3.) Calcular el estadístico de prueba4.) Establecer la región de rechazo Las regiones de rechazo para prueba de 2 colas: -Z Z
sn
Zcalc=
Si el valor del estadístico de prueba cae en la región de rechazo rechazaremos Ho de otra manera no podemos rechazar Ho.
0
-Z
Región de Rechazo
Región de Rechazo
Ejemplo de Prueba de hipótesis para la media
390
Prueba de hipótesis de una población para muestras
grandes con Z¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?Probarlo a un 5% de nivel de significancia
DatosMinoristas n 64 media mu = 2100Precio prom. X 2251Desv. Estándar s 812 (Alfa = 0.05Paso 1. Establecimiento de hipótesis
Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula
Ha: uC <> 2100 Por tanto se trata de una prueba de dos colasPaso 2. Cálculo del estadístico de prueba Zc
151 = > Zc = 1.48768473
101.5 Error estándar
Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivoPaso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 )
ns
XZ NULAHIPOTESISc
.
391
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( #¡REF! ) Zexcel ( -0.025 )-1.95996398 1.959963985
Zc = 1.487684729Como Zc es menor que Zexcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para RECHAZAR Ho Se concluye que el precio promedio no es diferente de $2,100
O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor que el valor de Alfa / 2 = 0.025, también nos da el criterio para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)al nivel de confianza 1-Alfa
Error estándar 101.5Z alfa/2 1.95996398
Intervalo de confianza 2251 198.936344El intervalo de confianza incluye a la media de la hipótesispor tanto no se rechaza la Ho. 2052.064 <= <= ### )
P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2
nsZXestimarparaIC
2...
392
Prueba de hipótesis de una población para muestras
pequeñas con tSe piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitariaProbar esta afirmación a un nivel de significancia alfa de 1%
Se inicia con el planteamiento de la hipótesis AlternaDatos
Semanas n 15 media mu = 5775Ventas prom X 6012Desv. Estándar s 977 (Alfa = 0.01 (1-Alfa = 0.99
(Alfa/2 = 0.005 (1-Alfa/2 = 0.995Paso 1. Establecimiento de hipótesis
Ho: uC <= 5775
Ha: uV > 5775 Se trata de una prueba de cola derechaPaso 2. Cálculo del estadístico de prueba tc
237 = > tc = 0.93950568
252.2603153 Error estándarNOTA:En excel poner 2alfa para obtener t de alfa
Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivoPaso 3. Determinar la te de Excel o de tablas para Alfa 0.01
te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )
ns
Xt NULAHIPOTESISc
.
Gl=14;
393
Paso 4. Comparando los valores tc calculado contra t excel se tiene
texcel ( 0.02 gl. 14)2.62449406
tc = 0.939505684 Valor p para tc es igual aP(tc) = 0.368130427
Como tc es menor que texcel, no cae en el área de rechazo, p > Alfay por tanto no hay suficiente evidencia para rechazar Ho Se concluye que la publicidad no ha tenido efecto en las ventas
O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza HoPaso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)
Error estándar 252.260315Z alfa/2 2.62449406
Como el intervalo de confianza Intervalo de confianza 6012 662.0557002
contiene a la media Hipótesis no se rechaza Ho 5349.94 <= <= 6674.06 )
P(t >= + t excel ) = alfa
nstXestimarparaIC
2...
394
Prueba de hipótesis para una proporción con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hipótesis nulaDatos
Clientes n 50 Proporción media = 0.530 gastaron p 0.6menos de$10 (Alfa = 0.05 (1-Alfa = 0.95
(Alfa/2 = 0.025 (1-Alfa/2 = 0.975Paso 1. Establecimiento de hipótesis
Se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
0.1 = > Zc = 1.41421356
0.07071068 Error estándar
Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975
Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 )
n
pZ
NULAHIPNULAHIP
NULAHIPOTESISc )1( ..
.
5.0:5.0:
c
c
HaHo
395
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zexcel ( 0.025 ) Zexcel ( 0.975 )-1.95996398 1.95996398
Zc = 1.41421356 Valor p para Zc es igual aP(-Zc) = 0.07926984
Como Zc es menor que Zexcel, no cae en el área de rechazo, p > Alfa /2 y por tanto no hay suficiente evidencia para rechazar Ho y se concluyeque el porcentaje que compra menos de $10 no difiere del 50% de clientesO Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza HoPaso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)
Error estándar 0.07071068Z alfa/2 1.41421356
Intervalo de confianza 0.6 0.1Como la media de p = 0.6 se encuentradentro del intervalo, no se rechaza Ho ( 0.5 <= 0.7 )
P(Z <= - Zexcel ) = alfa/2 P(Z>= Zexcel ) = alfa/2
nppZpestimarparaIC )1(...
2
396
Instrucciones con Minitab para laprueba de hipótesis de una
media
Stat > Basic Statistics > 1-Sample Z, t
Variable -- Indicar la columna de los datos o Summarized Data
En caso de requerirse dar el valor de Sigma = dato
Proporcionar la Media de la hipótesis Test Mean
En Options:Indicar el Confidence Interval -- 90, 95 o 99%
Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than
OK
397
Instrucciones con Minitab para laprueba de hipótesis de una
proporción
Stat > Basic Statistics > 1-ProportionSeleccionar Summarized DataNumber of trials = n tamaño de la muestraNumber of events = D éxitos encontrados en la muestra
En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la Test Proportion Proporción de la hipótesisIndicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than
Seleccionar Use test and interval based in normal distributionOK
398
7B4. Pruebas de hipótesis para comparación de varianzas,
medias, y proporciones
Prueba de Hipótesis Supongamos que tenemos muestras de dos reactores
que producen el mismo artículo. Se desea ver si hay diferencia significativa en el rendimiento de “Reactor a Reactor”. Reactor A Reactor B
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5
Estadísticas Descriptivas
Variable Reactor N Media Desv.Std
Rendimiento A 10 84.24 2.90
B 10 85.54 3.65
400
Prueba de HipótesisPregunta Práctica: Existe diferencia entre los
reactores?Pregunta estadística ¿La media del Reactor B (85.54) es significativamente diferente de la media del Reactor A (84.24)? O, su diferencia se da por casualidad en una variación de día a día.
Ho: Ha:
a
a
b
b
Ho: Hipótesis Estadística: No existe diferencia entre los Reactores
Ha: Hipótesis Alterna: Las medias de los Reactores son diferentes.
Se busca demostrar que los valores observados al parecer no corresponden al mismo proceso, se trata de rechazar Ho.
401
Prueba de Hipótesis
Hipótesis Alterna: Cuando las medias de Reactores son diferentes. A esto se le llama Hipótesis Alterna (Ha)
Hipótesis Estadística: No existe diferencia entre los Reactores
Esto se llama Hipótesis Nula (Ho)
Debemos demostrar que los valores que observamos al parecer no corresponden al mismo proceso, que la Ho debe estar equivocada
402
¿Qué representa esto?
Reactor A Reactor B
80.0 82.5 85.0 87.5 90.0 92.5A AA AAAA A A
B B B B B BB B B B
¿Representan los reactores un proceso básico?
¿Representan los reactores dos procesos diferentes?
403
Prueba F de dos varianzas Si se toman dos muestras de dos poblaciones normales
con varianzas iguales, la razón de sus varianzas crea una distribución muestral F. Las hipótesis son las siguientes:
El estadístico F se muestra a continuación donde S1 se acostumbra tomar como la mayor
404
Prueba F de dos varianzas
Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de confianza se puede concluir que hay menor variación?
Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2
Grados de libertad para Var1 = 8 y para var 2 = 6
Falfa = F(0.05, 8, 6) = 4.15Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho. Hay evidencia suficiente para indicar que la variación ya se
ha reducido
405
Prueba de hipótesis de dos pob. comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .A un nivel de siginificancia del 5% ¿Qué se puede concluir?
Método 1 Método 2No. De CDs n1 15 n2 17 Alfa/2 0.025Desv. Estan. s1 5.4 X2 4.8Varianza s12 29.16 s22 23.04
Paso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba FcGrados de libertad
1.266 Numerador = n1 - 1 = 14Denominador = n2 - 1 = 16
Tomamos a s12 como el mayor para comparar Fc contra Fexcel (1- Alfa/2)
Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025
Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16)
22
21
22
21
:
:
Ha
Ho
22
21
ss
Fc
406
Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene
f(F)
Fe(0.025) = 2.81701784
Fc = 1.266 Valor p para Fc es igual aP(Fc) = 0.32259599
Como Fc es menor que Fexcel, no cae en el área de rechazo, p > Alfa / 2y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que la varianza de los dos métodos de ensamble no difierensignificativamente
P(F>= + 2.81 ) = alfa/2
407
Prueba de hipótesis de dos pob. Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacasLas varianzas poblacionales son desconocidasDeterminar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10
Vacas vacaciones Vacas normalesVacas n1 50 n2 50Peso promedio X1 112 X2 105.7Desv. Estándar s1 32.3 s2 28.7
Paso 1. Establecimiento de hipótesis
Como el planteamiento es que las vacas de vacaciones ganan más peso, se inicia planeando la Ha
Paso 2. Cálculo del estadístico de prueba Zc
6.3 = > Zc = 1.03099301
6.110613717
Tomamos a X1 como el mayor para comparar Zc contra Ze positiva
Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1
Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90)
21
32
21
21
ns
ns
XXZ c
VNVV
VNVV
HaHo
::
408
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene
Ze (0.90)= 1.28Zc = 1.03099301 Valor p para Zc es igual a
P(-Zc) = 0.149402368 p > Alfa
Como Zc es menor que Zexcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normalesPaso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
= Error estándar 6.11061372 Z (alfa/2) = 1.64485363
= Intervalo de confianza6.3 + - 10.05106514
La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )
P(Z>= + 1.28) = 0.90
21
22
21
21 ns
ns
XX
212/21 )( XXsZXX
409
Prueba de dos mediasmuestras pequeñas
Sigmas descono-cidas e iguales
Sigmas desconocidasy desiguales
410
Prueba de hipótesis de dos pob. Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendasLas varianzas de las dos poblaciones son iguales pero desconocidasDeterminar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)
Tienda 1 Tienda 2Semanas n1 12 n2 15Ventas promedio X1 125.4 X2 117.2Desv. Estandar s1 34.5 s2 21.5
Paso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba tc
19564.25 Sp2 = 782.57
25
8.2 = > tc = 0.75684444
10.8344589
Tomamos a X1 como el mayor para comparar tc contra te positiva Si se toma a X1 como la media menor se debe comparar Zc contra -Ze
Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005Se tienen n1 + n2 - 2 grados de libertad o sean 25te (0.01) = 2.78743581 DIST.T.INV (0.01, 25) Asi es para dos colas
221)12()11( 2
2212
nn
nsnss p
21
32
21
ns
ns
XXtpp
c
22
21
21
21
::
TT
TT
HaHo
411
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene
te(0.01,25) = -2.787 te(0.01, 25) = 2.787Valor p para tc es igual a
tc = 0.7568 P(tc) = 0.46025521 p > Alfa / 2
Como tc es menor que texcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales, con sigmas desconocidas es:
= Error estándar 10.8344589
= Intervalo de confianza (8.2 + - 2.787*10.83)
Se observa una diferencia positiva sin embargo el cero está incluido ( -21.98 <= u <= 38.38)
P(t>=2.787 ) = alfa/2P(t<=-2.787 ) = alfa/2
21)(
22
2/21ns
ns
tXX pp
21
22
ns
ns pp
412
Prueba de hipótesis de dos pob. Comparando datos pareados con
tLas muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.Paso 1. Establecimiento de Hipótesis
No. Pares de muestras n = 25Paso 2. Se calcula el estadístico tc: Diferencia media = 45.2
Desv. Estándar de difs. = 21.6Alfa 0.05
gl = 24= 10.462963
Paso 3. Se determina el valor crítico del estadístico t de Excel o tablas para Alfa / 2 0.025
t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas
21
21
::
HaHo
nsdtd
c
Grados de libertad = No. de pares - 1
413
Paso 4. Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:tc = 10.462963
te(0.025,24) = -2.063 te(0.025, 24) = 2.063Valor p para tc es igual aP(t > tc) = 0
p < Alfa / 2Como tc es mayor que t excel, si cae en el área de rechazo, y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Hase concluye que si hay diferencia significativa entre las medias
Paso 5. El intervalo de confianza para las diferencias en medias pareadas es t alfa/2 = 2.063Error estándar = 0.864Dif. Promedio = 45.2
45.2 + - 0.864
Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824
P(t>=2.063 ) = alfa/2P(t<=-2.063 ) = alfa/2
ns
tdparaCI dd 2/...
414
Prueba de hipótesis de dos pob. Comparando dos proporciones
con ZInvestigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los bonos de ingresos.Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
Convertibles IngresosBonos n1 312 n2 205 Alfa 0.1Sobrevalorad X1 202 X2 102 1-Alfa 0.9 7.8 p1 0.647 p2 0.498 Fracción de las muestrasPaso 1. Establecimiento de hipótesis
Por tanto se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba Zc0.150 = > Zc = 3.393046759
0.04417119
Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9
Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)
2)1(
1)1( 2211
21
npp
npp
ppZ c
2121
2121
:..........................0::.........0:
HaHaHoformaotraHo
415
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene
Zc = 3.39304676
Ze(0.9) = 1.281551566Valor p para Zc es igual aP(-Zc) = 0.00034946
p < AlfaComo Zc es mayo que Zexcel, si cae en el área de rechazo, y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales, con sigmas desconocidas es:
= Error estándar 0.044171193Zexcel (para alfa/2) 1.644853627
= Intervalo de confianza ( 0.150 0.07265515
Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223el cero no está incluido en el intervalo
P(Z>= + 1.28 ) = Alfa
2)1(
1)1( 2211
21 npp
npp
s pp
212/21 )( ppsZpp
416
Robustez Los procedimientos estadísticos se basan en
supuestos acerca de su comportamiento teórico. Cuando los estadísticos obtenidos no son afectados por desviaciones moderadas de su expectativa teórica, se dice que son robustos.
417
Resumen
418
Instrucciones con Minitab para lacomparación de dos varianzas
Stat > Basic Statistics > 2-variances
Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1Second- Indicar la columna de datos de la muestra 2
En Options:Indicar el Confidence Interval -- 90, 95 o 99%
OK
419
Instrucciones con Minitab para lacomparación de dos medias
Stat > Basic Statistics > 2-Sample t Seleccionar samples in different columns o Summarized dataFirst-- Indicar la columna de datos de la muestra 1Second- Indicar la columna de datos de la muestra 2Seleccionar o no seleccionar Assume equal variances de
acuerdo a los resultados de la prueba de igualdad de varianzas
En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la diferencia a probar Test Difference (normalmente 0)Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
420
Instrucciones con Minitab para lacomparación de dos medias
pareadas
Stat > Basic Statistics > Paired t Seleccionar samples in columns o Summarized dataFirst sample - Indicar la columna de datos de la muestra 1Second sample - Indicar la columna de datos de la muestra 2
En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la diferencia a probar Test Mean (normalmente 0)Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
421
Instrucciones con Minitab para laprueba de hipótesis de dos
proporciones
Stat > Basic Statistics > 2-ProportionsSeleccionar Summarized Data Trials:
Events:First: No. de elementos de la 1ª. Muestra y D1 éxitos
encontradosSecond: No. de elementos de la 2ª. Muestra y D2 éxitos
encontrados
En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la Test Difference Normalmente 0Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than
Seleccionar Use pooled estimate of p for testOK
422
7B5. Pruebas de bondad de ajuste
423
7B5. Bondad de ajustePRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribución particular planteada como hipótesisSi el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución planteada como hipótesis
Por ejemplo:
Ho: La distribución poblacional es uniforme Ha: La distribución poblacional no es uniforme
Se usa el estadístico Chi-Cuadrado
Oi = Frecuencia de los eventos observados en los datos muestrales
Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para cumplir con este requisito.K = Número de categorías o clases
K
i EiEiOi
1
22 )(
424
7B5. Bondad de ajusteEjemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran 12 botes / mes. La cantidad real que se vendió fue:
Ventas (Oi) Ventas (Ei)Tipo de bote observadas esperadas
A 15 12B 11 12C 10 12D 12 12
DISTR.CHI
Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020818
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se aceptala hipótesis nula
PRUEBA.CHI.INV
425
7B5. Prueba de Bondad de ajuste
para la distribución de Poisson1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. De PoissonHa: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi y calcular la media de ocurrencias
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar el tamaño de muestra con la prob. de Poisson para cada valor de la variable aleatoria. Si hay menos de 5 combinar las categorías
4. Calcular el estadístico de prueba
5. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel de significancia
n
i i
ii
eef
1
22 )(
22
426
Ejemplo:Distribución de Poisson =5
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribución de Poisson Ha: No se sigue una distribución de PoissonClientes Frec. observada f(x) de Poisson 128*f(x)
cantidad esperada
0 2 0.0067 0.85761 8 0.0337 4.31362 10 0.0842 10.77763 12 0.1404 17.97124 18 0.1755 22.46405 22 0.1755 22.46406 22 0.1462 18.71367 16 0.1044 13.36628 12 0.0653 8.35849 6 0.0363 4.6464
10 o más 0.0318 4.0704
427
Ejemplo:Distribución de Poisson =5
Combinando X=0,1 y X=9, 10 o más para que la frecuencia observada sea mayor a 5 y se pueda aplicar la distribución Chi Cuadrada se tieneClientes Frec.
Observada(fi)
f(x) de Poisson 128*f(x) frecuencia
esperada (ei)0 o 1 10 0.0067+0.0337 5.1712
2 10 0.0842 10.77763 12 0.1404 17.97124 18 0.1755 22.46405 22 0.1755 22.46406 22 0.1462 18.71367 16 0.1044 13.36628 12 0.0653 8.3584
9 o más 6 0.0363+0.0318 8.7168
428
Estadístico y conclusiónCon los datos anteriores se calcula el estadístico Chi cuadrada que
se compara con Chi Cuadrada de alfa para k-p-1 grados de libertad (K – categorías: 9, p – parámetros a estimar: 1 media).
Ho se rechaza si o si p es mayor que alfa.
El valor de Chi Cuadrada calculado es de 10.9766 y el valor Chi Cuadrada de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y se concluye que los datos siguen una distribución de Poisson
n
i i
ii
eef
1
22 )(
22
429
7B5. Prueba de Bondad de ajuste
para la distribución Normal1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. NormalHa: Caso contrario
2. Tomar una muestra aleatoria, calcular la media y la desviación estándar
3. Definir K intervalos de valores de forma que la frecuencia esperada sea 5 cuando menos para cada uno (intervalos de igual probabilidad). Anotar la frecuencia observada de los valores de datos fi, en cada intervalo
430
7B5. Prueba de Bondad de ajuste
para la distribución Normal4. Calcular el número de ocurrencias esperado ei, para
cada intervalo de valores. Multiplicar el tamaño de muestra por la probabilidad de que una variable aleatoria esté en el intervalo.
5. Calcular el estadístico de prueba
6. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel de significancia
n
i i
ii
eef
1
22 )(
22
431
7B5. Prueba de Bondad de ajuste
para la distribución Normal Ejemplo: datos de calificaciones: Media = 68.42; S =
10.41Calificaciones
71 66 61 65 54 9360 86 70 70 73 7355 63 56 62 76 5482 79 76 68 53 5885 80 56 61 61 6465 62 90 69 76 7977 54 64 74 65 6561 56 63 80 56 7179 84
432
7B5. Prueba de Bondad de ajuste
para la distribución NormalHo: la población tiene una distribución normal con media
68.42 y S=10.41 Ha: Caso contrario
Para una muestra de 50 con una frecuencia mínima esperada de 5 se tiene el 10% al menos por cada celda
La primera celda correspondiente al 10% está en Z = -1.28 con
X = (Media - Z*S) = 55.10
Para el área del 20%, Z = -0.84 y X = 59.68y así sucesivamente
433
7B5. Prueba de Bondad de ajuste
para la distribución NormalIntervalo Frecuencia
observada (fi)
Frecuencia esperada (ei)
Menos de 55.10
5 5
55.10 a 59.68
5 5
59.68 a 63.01
9 5
63.01 a 65.82
6 5
65.82 a 68.42
2 5
68.42 a 71.02
5 5
71.02 a 73.83
2 5
73.83 a 77.16
5 5
77.16 a 81.74
5 5
81.74 o más 6 550 50
Se registran las frecuencias de los datostomados de las calificaciones
434
7B5. Prueba de Bondad de ajuste
para la distribución Normal Se determina el estadístico Chi Cuadrado = 7.2
El Valor de Chi Cuadrado de alfa = 0.10 para k – p – 1 grados de libertad. K = 10 categorías, p = 2 parámetros. Gl = 7. Chi Cuadrado es 12.017
Como no se puede rechazar la hipótesis nula de normalidad de las calificaciones
n
i i
ii
eef
1
22 )(
22
435
7B5. Prueba de Bondad de ajuste
para la distribución Multinomial1. Enunciar la hipótesis nula y alternativa
Ho: La población sigue una distribución de probabilidad multinomial con probabilidades especificadas para cada una de las K categorías Ha: Caso contrario
2. Tomar una muestra aleatoria y anotar las frecuencias observadas fi para cada categoría
3. Suponiendo que Ho es cierta, determinar la frecuencia esperada ei, en cada categoría multiplicando la probabilidad de la categoría por el tamaño de muestra
436
7B5. Prueba de Bondad de ajuste
para la distribución Multinomial4. Se determina el estadístico Chi Cuadrado de prueba
5. Regla de rechazo:
Si no se puede rechazar la hipótesis nula
Rechazar si el valor p es menor a alfa
Con alfa nivel de significancia y los grados de libertad son k-1
n
i i
ii
eef
1
22 )(
22
437
7B5. Prueba de Bondad de ajuste
para la distribución MultinomialEjemplo: El año pasado la participación de mercado para la
empresa A fue del 30%, 50% para la empresa B y 20% para la empresa C. La empresa C hace una prueba con un nuevo producto para estimar su impacto en las preferencias del mercado.
Se tomó una muestra de 200 clientes resultando preferencias de compra de: 48 para A, 98 para B y 54 para C.
De acuerdo a las probabilidades esperadas, en los 200 clientes las preferencias esperadas son: A=200*0.3=60, B=200*0.5=100, C=200*0.2=40
438
7B5. Prueba de Bondad de ajuste
para la distribución MultinomialDatos para calcular el estadístico de prueba Chi Cuadrado
Categoría Proporción hipotética
Frecuencia observada
Frecuencia esperada
Empresa A 0.3 48 60Empresa B 0.5 98 100
Empresa C 0.2 54 40
439
7B5. Prueba de Bondad de ajuste
para la distribución MultinomialChi Cuadrado calculado = 7.34
Chi cuadrado de alfa = 0.05 con k – 1 = 2 grados de libertad = 2 es de 5.99. El valor p correspondiente es de 0.025.
Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfa de 0.05 se rechaza la hipótesis nula Ho y se concluye que el nuevo producto modificará las preferencias del mercado actuales
La participación de la empresa C aumenta con el nuevo producto
440
7B5. Prueba de Bondad de ajuste en Minitab
La columna C1 – Observadas contiene las frecuencias observadas y la C2 – esperadas las frecuencias esperadas
Calc > Calculator > Store result in variable ChiCuadradaTeclear en el cuadro de expresión sum((Observadas-
Esperadas)**2/Esperadas)
Calc > Probability distributions > Chi SquareSeleccionar Cummulative probabilityDegrees of freedom 2Input column ChiCuadrada; Optional Storage CumProb
OKCalc > Calculator > Store results in variable p
En el cuadro Expression teclear 1-CumProb OK
441
7B5. Prueba de Bondad de ajuste en Minitab
Ejemplo: investigación de mercado
Observadas Esperadas ChiCuadrada CumProb p48 60 7.34 0.974524 0.025476598 100
54 40
442
7B5. Prueba de Bondad de ajuste en Excel
Ejemplo: investigación de mercado
1. Calcular el estadístico Chi Cuadrada con =(A2-B2)^2/B2 y SumaChi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)
3. El estadístico Chi Cuadrada de alfa es:=prueba.chi.inv(0.05,2) = 5.99
4. Como p es menor a alfa de 0.05 se rechaza la Ho
443
7B6. ANOVA para un factor principal y una o más variables de bloqueo
444
Introducción Cuando es necesario comparar 2 o más medias
poblacionales al mismo tiempo, para lo cual se usa ANOVA.
El método ANOVA tiene los siguientes supuestos: La varianza es la misma para todos los tratamientos
del factor en todos sus niveles Las mediciones indiviudales dentro de cada
tratamiento se distribuyen normalmente El término de error tiene un efecto distribuido
normalmente e independiente
445
Contenido ANOVA de un factor o dirección
ANOVA de un factor y una variable de bloqueo
ANOVA de un factor y dos variables de bloqueo – CUADRADO LATINO
ANOVA de un factor y tres variables de bloqueo – CUADRADO GRECOLATINO
446
ANOVA de un factor o dirección
447
Introducción Con el ANOVA las variaciones en la respuesta se
dividen en componentes que reflejan los efectos de una o más variables independientes
La variabilidad se representa como la suma de cuadrados total que es la suma de cuadrados de las desviaciones de mediciones individuales respecto a la gran media, se divide en: Suma de cuadrados de las medias de los
tratamientos Suma de cuadrados del residuo o error experimental
448
ANOVA – Prueba de hipótesis para probar la igualdad de
medias de varias poblaciones para un factor
diferentessonsunasAHaHo a
..'.lg:.........: 321
Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variando Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)
449
ANOVA - Condiciones Todas las poblaciones son normales
Todas las poblaciones tiene la misma varianza
Los errores son independientes con distribución normal de media cero
La varianza se mantiene constante para todos los niveles del factor
450
ANOVA – Ejemplo de datosNiveles del Factor Peso % de algodón y Resistencia de tela
Peso porc. Respuestade algodón Resistencia de la tela
15 7 7 15 11 920 12 17 12 18 1825 14 18 18 19 1930 19 25 22 19 2335 7 10 11 15 11
451
ANOVA – Suma de cuadrados total
Xij
Xij
Gran media
2
11
)(
b
j
a
i
XXijSCT
452
ANOVA – Suma de cuadrados de renglones (a)-
tratamientos
Gran media
Media Trat. 1 Media Trat. a
Media trat. 2
a renglones
a
ii XXbSCTr
1
2)(
453
ANOVA – Suma de cuadrados
del error
Media X1.
X1jX3jX2j
Media X2. Media X3.
Muestra 1 Muestra 2 Muestra 3
2
11
)( i
b
jij
a
i
XXSCE
454
ANOVA – Suma de cuadrados
del error
Media X1.
X1jX3jX2j
Media X2. Media X3.
Muestra 1 Muestra 2 Muestra 3
SCTrSCTSCE
455
ANOVA – Grados de libertad: Totales, Tratamientos, Error
ananSCEglaSCTrglnSCTgl
)1()1(.1.
1.
456
ANOVA – Cuadrados medios: Total, Tratamiento y Error
)/()1/(
)1/(
anSCEMCEaSCTrMCTr
nSCTMCT
457
ANOVA – Cálculo del estadístico Fc y Fexcel
SCEglSCTrglALFAFINVFexcelMCEMCTrFc
.,.,
458
Tabla final de ANOVATABLA DE ANOVA
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Dentro de muestras (error) SCE n-a CME
Variación total SCT n-1 CMT
Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfao si el valor p correspondiente a la Fc es menor al valor de alfa especificado
459
ANOVA – Toma de decisión
Fexcel
Fc
Alfa
Zona de rechazoDe Ho o aceptar Ha
Zona de no rechazo de HoO de no aceptar Ha
Distribución F
460
ANOVA – Toma de decisión
Si Fc es mayor que Fexcel se rechaza HoAceptando Ha donde las medias son diferentes
O si el valor de p correspondiente a Fc es menor de Alfa se rechaza Ho
461
ANOVA – Identificar las medias diferentes por Prueba
de Tukey T
Para diseños balanceado (mismo número de columnas en los tratamientos) el valor de q se determina por medio de la tabla en el libro de texto
bCMEqT ana ,,
462
ANOVA – Identificar las medias diferentes por Prueba
de Tukey TSe calcula la diferencia Di entre cada par de Medias Xi’s:
D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.
Cada una de las diferencias Di se comparan con elvalor de T, si lo exceden entonces la diferencia es Significativa de otra forma se considera que las mediasSon iguales
463
ANOVA – Identificar las medias diferentes por Prueba de
Diferencia Mínima Significativa DMS
Para diseños balanceados (los tratamientos tienen igual no. De columnas), se calcula un factor DMS contra el que se comparan las diferencias Xi – Xi’. Significativas si lo exceden
bFCME
DMS an ,1,)(2
464
Prueba DMS para Diseños no balanceados
anakj
kj FCMEbb
DMS
,1,, )(11
Para diseños no balanceados (los tratamientos tienen diferente no. De columnas), se calcula un factor DMSPara cada una de las diferencias Xi – Xi’
465
Ejemplo: Considerar un experimento de un factor
(máquina) con tres niveles (máquinas A, B, C). Los datos se muestran a continuación y debe verificarse si existe diferencia significativa a un alfa = 0.05
Máquinas
Datos Suma
Prom.
466
Ejemplo:
Como el valor calculado de F(33.2) excede el valor crítico de F, se rechaza la Hipótesis nula Ho
La tabla completa de ANOVA es la siguientes:FuentesDe variación
Máquinas
Cuadrado medio
467
Ejemplo: Con Minitab: Stat>ANOVA>One way unstacked Responses (in separate columns) A B C Interpretar los resultados
A B C
5 2 1
7 0 0
6 1 -2
7 -2 -3
6 2 0
468
Ejemplo:One-way ANOVA: A, B, C
Source DF SS MS F P
Factor 2 137.20 68.60 33.19 0.000 Rechazo HoError 12 24.80 2.07
Total 14 162.00
S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ---------+---------+---------+---------+
A 5 6.200 0.837 (-----*----)
B 5 0.600 1.673 (----*-----)
C 5 -0.800 1.643 (-----*----)
---------+---------+---------+---------+
0.0 2.5 5.0 7.5
Pooled StDev = 1.438
469
Corrida en Minitab Se introducen las respuestas en una columna
C1 Se introducen los subíndices de los renglones
en una columna C2Durability Carpet
18.95 112.62 111.94 114.42 110.06 27.19 27.03 214.66 2
470
Corrida en Minitab Opción: stat>ANOVA – One Way (usar archivo
Exh_aov) En Response indicar la col. De Respuesta
(Durability)
En factors indicar la columna de subíndices (carpet) En comparisons (Tukey)
Pedir gráfica de Box Plot of data y residuales Normal Plot y vs fits y orden
Si los datos estan en columnas pedir ANOVA – One Way (unstacked)
471
Resultados Results for: Exh_aov.MTW
One-way ANOVA: Durability versus Carpet
Analysis of Variance for Durabili
Source DF SS MS F P
Carpet 3 111.6 37.2 2.60 0.101
Error 12 172.0 14.3
Total 15 283.6
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---------+---------+---------+-------
1 4 14.483 3.157 (-------*-------)
2 4 9.735 3.566 (-------*--------)
3 4 12.808 1.506 (--------*-------)
4 4 17.005 5.691 (-------*-------)
---------+---------+---------+-------
Pooled StDev = 3.786 10.0 15.0 20.0
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.0117
Critical value = 4.20
472
ANOVA de dos vías un factor principal y una variable de bloqueo
473
ANOVA de 2 vías Este es un procedimiento extensión de los
patrones del ANOVA de una vía con tres fuentes de variación: Tratamiento del factor A (columnas), Tratamiento del factor B (renglones) y Error experimental.
kijijjiijk AxBEfBEfAEfX ...
474
ANOVA – Prueba de hipótesis para probar la igualdad de
medias de varias poblaciones con dos vías
Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variandoLos niveles de ese factor (Temp.1, Temp.2, etc.) POR RENGLONY Considerando los niveles de otro factor que se piensaQue tiene influencia en la prueba – FACTOR DE BLOQUEOPOR COLUMNA
475
ANOVA – 2 vías
diferentessonsunasAHaHo a
..'.lg:.........: 321
diferentessonsunasAHaHo a
..'.lg:'.........''': 321
Para el tratamiento – en renglones
Para el factor de bloqueo – en columnas
476
ANOVA 2 vías - Ejemplo
Experiencia en años de los operadoresMaquinas 1 2 3 4 5
Maq 1 27 31 42 38 45Maq 2 21 33 39 41 46Maq 3 25 35 39 37 45
477
ANOVA – Dos vías o direcciones
La SCT y SCTr (renlgones) se determina de la misma forma que para la ANOVA de una dirección o factor
En forma adicional se determina la suma de cuadrados del factor de bloqueo (columnas) de forma similar a la de los renglones
La SCE = SCT – SCTr - SCBl
478
ANOVA de 2 vías
)1/(1.
)( 2
1
bSCBlCMBlbSCBlgl
XXaSCBl j
b
j
479
ANOVA de 2 vías
))(/())((.
bnanSCBlCMEbnanSCEglSCBlSCTrSCTSCE
480
ANOVA –Estadístico Fc y Fexcel
SCEglSCTrglALFAFINVFexcelMCEMCTrFc
.,.,
481
ANOVA – Estadístico Fb
SCEglSCBlglALFAFINVFexcelMCEMCBlFc
.,.,
482
Tabla final ANOVA 2 víasFUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Entre Bloques (Factor Bl) SCBl b-1 CMBL CMBL/CME
Dentro de muestras (error) SCE (a-1)(b-1) CME
Variación total SCT n-1 CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
483
ANOVA – 2 vías: Toma de decisión
Fexcel
FcTr o Bl
Alfa
Zona de rechazoDe Ho o aceptar Ha
Zona de no rechazo de HoO de no aceptar Ha
Distribución F
484
ANOVA – 2 vías: Toma de decisión
Si Fc (Tr o Bl) es mayor que Fexcel se rechaza Ho Aceptando Ha donde las medias son diferentes
O si el valor de p correspondiente a Fc (Tr o Bl) es menor de Alfa se rechaza Ho
485
Cálculo de los residuales
.
.
*
ˆ
ˆ
.,,05.0
....
i
i
yMSEglkk
y
ijijij
jiij
srRb
MSEs
yye
yyyy
Y estimada
Error o residuo
Error estándar
Factor de comparación
Si la diferencia de medias excede a Rk es significativa
486
Adecuación del modelo Los residuales deben seguir una recta en la
gráfica normal
Deben mostrar patrones aleatorios en las gráficas de los residuos contra el orden de las Yij, contra los valores estimados y contra los valores reales Yij
487
Corrida en Minitab Se introducen las respuestas en una columna C3 y los
subíndices de renglones en columna C4 y de columnas en C5
Plantas Suplemento Lago
34 1 Rose
43 1 Rose
57 1 Dennison
40 1 Dennison
85 2 Rose
68 2 Rose
67 2 Dennison
53 2 Dennison
41 3 Rose
24 3 Rose
42 3 Dennison
52 3 Dennison
488
Corrida en Minitab Opción: stat>ANOVA – Two Way (usar archivo
Exh_aov)
En Response indicar la col. De Respuesta (Plantas)
En Row factor y Column Factor indicar las columnas de subíndices de renglones y columnas (suplemento y lago) y Display Means para ambos casos
Pedir gráfica residuales Normal Plot y vs fits y orden
489
Resultados
Two-way ANOVA: Zooplankton versus Supplement, Lake
Analysis of Variance for Zooplank
Source DF SS MS F P
Suppleme 2 1919 959 9.25 0.015
Lake 1 21 21 0.21 0.666
Interaction 2 561 281 2.71 0.145
Error 6 622 104
Total 11 3123
Individual 95% CI
Suppleme Mean --+---------+---------+---------+---------
1 43.5 (-------*-------)
2 68.3 (--------*-------)
3 39.8 (--------*-------)
--+---------+---------+---------+---------
30.0 45.0 60.0 75.0
Individual 95% CI
Lake Mean ------+---------+---------+---------+-----
Dennison 51.8 (----------------*----------------)
Rose 49.2 (----------------*----------------)
------+---------+---------+---------+-----
42.0 48.0 54.0 60.0
490
ANOVA de un factor y dos o tres variables de
bloqueo
CUADRADO LATINO Y GRECOLATINO
491
ANOVA – 3 y 4 factores El diseño de Cuadrado latino utiliza dos
factores de bloqueo adicionales al de Tratamiento
EL diseño de Cuadrado Grecolatino utiliza tres factores adicionales al del Tratamiento
El cálculo de suma de cuadrados para renglones y para columnas es similar al de ANOVA de un factor principal y otro de bloqueo
492
Cuadrado LatinoAños exp. TurnoEmpleado Mañana Tarde Noche
1 B=15 A=18 C=11
2 C=12 B=20 A=9
3 A=17 C=19 B=10A, B, C = Máquinas 1, 2 y 3
493
ANOVA – Cuadrado Latino: Factor principal (A,B,C,D)
)1/(11.
)( 2
1
bSCTrCMTrbaSCTrgl
XXaSCTr Tr
b
j
494
ANOVA – Cuadrado Latino: Cálculo del error
)1)(2/()1)(2(.
Re
aaSCECMEaaSCEgl
SCTrngSCSCTcolSCTSCE
495
ANOVA – Cálculo del estadístico Fc y Fexcel
SCEglSCTrglALFAFINVFexcelMCEMCTrFc
.,.,
496
ANOVA – Cuadrado Latino Reng / Col
SCEglSCBlglALFAFINVFexcelMCEMCColsFcols
MCEngMCFcreng
.,.,
Re
497
Tabla final ANOVA 2 FactoresFUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO
Renglores SCRen a-1 CMRen CMRen/CME
Columnas SCCol b-1 CMCol CMCol/CME
Tratamiento SCTr a-1 CMTr CMTr/CME
Dentro de muestras (error) SCE (a-2)(a-1) CME
Variación total SCT n-1 CMT
498
Cuadrado latino en Minitab Se introducen las respuestas en una columna C1
Se introducen los subíndices de los renglones en una columna C2
Se introducen los subíndices de las columnas en una columna C3
Se introducen las letras mayúsculas que indican el nivel del factor (A, B, C, D, etc.) correspondientes a cada respuesta en la columna C4
499
Cuadrado latino en Minitab Opción: stat> ANOVA – General linear model
En Response indicar la col. De Respuesta,
En Model indicar las columnas de los factores y
En Random factors indicar los factores adicionales al del efecto principal a probar (A, B, C, D). Se pueden pedir interacciones entre factores x – y con Cx*Cy
Pedir gráfica de residuales Normal y vs fits y orden
500
Cuadrado Greco LatinoExperiencia de los operadores
Lotes MP 1 2 3 4 5
1 Aa=-1 Bc=-5 Ce=-6 Db=-1 Ed=-1
2 Bb=-8 Cd=-1 Da=5 Ec=2 Ae=11
3 Cc=-7 De=13 Eb=1 Ad=2 Ba=-4
4 Dd=1 Ea=6 Ac=1 Be=-2 Cb=-3
5 Ee=-3 Ab=5 Bd=-5 Ca=4 Dc=6
a, b, c y d son 5 diferentes tipos de montaje A, B, C, D y E son las 5 formulaciones a probar
501
Cuadrado Greco latino en Minitab
Se introducen las respuestas en una columna C1 Se introducen los subíndices de los renglones en
una columna C2
Se introducen los subíndices de las columnas en una columna C3
Introducir los subíndices del factor adicional de letras griegas con letras latinas minúsculas (a,b,c,d,e) en C4
Se introducen las letras mayúsculas que indican el nivel del factor (A, B, C, D, etc.) correspondientes a cada respuesta en la columna C5
502
Cuadrado Greco latino en Minitab
Opción: ANOVA – General linear model
En Response indicar la col. De Respuesta,
En Model indicar las columnas de los factores y
En Random factors indicar los factores adicionales al del efecto principal a probar (A, B, C, D). También se pueden indicar interacciones entre factores x-y con Cx * Cy
Pedir gráfica de residuales Normal y vs fits y orden
503
ANOVA – Cuadrado Grecolatino
)1/(1.
)( 2
1
bSCGCMGbSCGgl
XXaSCG m
b
m
504
ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado
medio para el error
)1)(3/()1)(3(.
Re
aaSCECMEaaSCEgl
SCColnSCSCGSCTrSCTSCE
505
ANOVA – Cálculo del estadístico Fc y Fexcel
SCEglSCTrglALFAFINVFexcelMCEMCGFc
.,.,
506
ANOVA – Cuadrado Grecolatino
SCEglSCBlglALFAFINVFexcelMCEMCTrFc
.,.,
507
Tabla final ANOVA 2 FactoresFUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO
Renglores SCRen a-1 CMRen CMRen/CME
Columnas SCCol b-1 CMCol CMCol/CMELetras griegas SCG a-1 CMG CMG/CMETratamiento SCTr a-1 CMTr CMTr/CME
Dentro de muestras (error) SCE (a-3)(a-1) CME
Variación total SCT n-1 CMT
508
ANOVA para diseño factorial AxB
En un experimento factorial involucrando el factor A con (a) niveles y un factor B con (b) niveles, la suma de cuadrados se puede dividir en:SST = SS(A) + SS(B) + SS(AB) + SSE
509
7B7. Tablas de contingencia
510
7B7. Tablas de contingencia
Prueba Chi2 (2)
511
¿Para qué se utiliza?
1. Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la información.
2. Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).
2
Ho: No hay diferencia
Ha: Hay diferencia
Para todos los casos,
512
Ho: La moneda es buena
Ha: La moneda “está cargada”
Se lanza una moneda al aire 100 veces y que obtenemos 63 águilas y 37 soles.
¿La proporción de águilas y soles sucede por casualidad? O, se concluye que la moneda está “cargada”?
Ejemplo 1: Chi Cuadrada( 2 )
513
2 c= j = 1
gEstadístico Chi Cuadrada
Observada Esperada
Aguilas 63 50 3.38
Soles 37 50 3.38 2 = 3.38 + 3.38 2 = 6.76
(fo - fe)2
fe( fo ) ( fe )
Ejemplo 1: Chi Cuadrada( 2 )
fe
(fo - fe)2
514
Función de Distribución Acumulada Chi2 con 1 grado de libertad (d.f)
Ho: La moneda es buena. Ha: La moneda está “cargada”.
Para un 95% de confianza antes de concluir que la moneda “está cargada”, se requiere que X2
c > X2Crítica o que el valor de p sea
0.05.
Como p 0.05, se puede concluir -con un 95% de confianza - que la moneda “está cargada”.
2c P(2c > x)6.7600 p = 1 - 0.9907 = 0.0093
De tablas X2Crítica, (0.05, 1) = 3.8414
Ejemplo 1: Chi cuadrada
515
1. Posicionarse en una celda vacía
2. Accesar el menú de funciones con Fx
3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.
4. Dar valores de probabilidad (0.05) y grados de libertad, normalmente (n - 1) para un parámetro o (# de renglones -1) * (# de columnas - 1) para el caso de tablas de proporciones.
Cálculo en Excel del estadístico Chi cuadrada
516
Tabla de Valores Críticos Seleccionados de Chi2
df .250 .100 .050 .025 .010 .005 .0011 1.323 2.706 3.841 5.024 6.635 7.879 10.8282 2.773 4.605 5.991 7.378 9.210 10.597 13.8163 4.108 6.251 7.815 9.348 11.345 12.838 16.2664 5.385 7.779 9.488 11.143 13.277 14.860 18.4675 6.626 9.236 11.070 12.832 15.086 16.750 20.515
6 7.841 10.645 12.592 14.449 16.812 18.548 22.4587 9.037 12.017 14.067 16.013 18.475 20.278 24.3228 10.219 13.362 15.507 17.535 20.090 21.955 26.1259 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588
11 13.701 17.275 19.675 21.920 24.725 26.757 31.26412 14.845 18.549 21.026 23.337 26.217 28.300 32.90913 15.984 19.812 22.362 24.736 27.688 29.819 34.52814 17.117 21.064 23.685 26.119 29.141 31.319 36.12315 18.245 22.307 24.996 27.488 30.578 32.801 37.697
16 19.369 23.542 26.296 28.845 32.000 34.267 39.25217 20.489 24.769 27.587 30.191 33.409 35.718 40.79018 21.605 25.989 28.869 31.526 34.805 37.156 43.31219 22.718 27.204 30.144 32.852 36.191 38.582 43.82020 23.828 28.412 31.410 34.170 37.566 39.997 45.315
21 24.935 29.615 32.671 35.479 38.932 41.401 46.79722 26.039 30.813 33.924 36.781 40.289 42.796 48.26823 27.141 32.007 35.172 38.076 41.638 44.181 49.72824 28.241 33.196 36.415 39.364 42.980 45.558 51.17925 29.339 34.382 37.652 40.646 44.314 46.928 52.620
26 30.434 35.563 38.885 41.923 45.642 48.290 54.05227 31.528 36.741 40.113 43.194 46.963 49.645 55.47628 32.620 37.916 41.337 44.461 48.278 50.993 56.89229 33.711 39.087 42.557 45.722 49.588 52.336 58.30230 34.800 40.256 43.773 46.979 50.892 53.672 59.703
40 45.616 51.805 55.758 59.342 63.691 66.766 73.40250 56.334 63.167 67.505 71.420 76.154 79.490 86.66160 66.981 74.397 79.082 83.298 88.379 91.952 99.607
70 77.577 85.527 90.531 95.023 100.425 104.215 112.31780 88.130 96.578 101.879 106.629 112.329 116.321 124.83990 98.650 107.565 113.145 118.136 124.116 128.299 137.208100 109.141 118.498 124.342 129.561 135.807 140.169 149.449
517
Tabla de contingencia Una tabla de clasificación de dos vías (filas y columnas)
que contiene frecuencias originales, se puede analizar para determinar si las dos variables (clasificaciones) son independientes o tienen una asociación significativa.
La prueba Chi Cuadrada probará si hay dependencia entre las dos clasificaciones.
Además se puede calcular el coeficiente de contingencia (correlación) que en todo caso muestra la fuerza de la dependencia
518
Tabla de contingencia Para esta prueba se usa la prueba Chi Cuadrada donde:
Entre mayor sea su valor, mayor será la diferencia de la discrepancia entre frecuencias observadas y teóricas. Esta prueba es similar a la de bondad de ajuste.
519
Tabla de contingencia Ejemplo: Cada una de las 15 celdas hace una
contribución al estadístico Chi Cuadrado (una celda)
Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-Cuadrado de alfa = 20.09
Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de igualdad de resultados entre negocios
Los valores observados (fo) son los siguientes:
Ho: No existen diferencias en los índices de defectos de las dos máquinas.Ha: Existen diferencias en los índices de defectos de las dos máquinas.
Total 751 28
El índice de defectos totales es 28 / 779 = 3.6%
máquina 1 fo = 517 fo = 17 Total = 534
Partes buenas
máquina 2 fo = 234 fo = 11 Total = 245
779
Partes defectuosas
Ejemplo 2: Chi2 Para comparación de dos grupos; ¿son las mismas proporciones?)
Cálculo de los valores esperados
Basados en este índice, los valores esperados (fe) serían:
máquina 1 fo = 751*534/779 fo = 28*534/779 Total = 534
Partes buenas
máquina 2 fo = 751*245/779 fo = 28*245/779 Total = 245
779
Partes defectuosas
máquina 1 530.53 3.47
Partes buenas
máquina 2 233.47 1.53
Partes defectuosas
Ejemplo 2: Chi2 Para comparación de dos grupos; ¿son las mismas proporciones?)
Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en 20% de celdas.Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi2.
Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo renglones y/o columnas, las categorías pueden ser de utilidad.
Prueba de chi cuadrada:
Los conteos esperados están debajo de los conteos observados Partes buenas Partes Defectuosas Total1 532 2 534 530.53 3.47
2 232 3 235 233.47 1.53Total 764 5 769
Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056DF= 1; valor de p = 0.152
2 celdas con conteos esperados menores a 5.0
Tabla de ChiTabla de Chi22
Tabla de valores críticos seleccionados para Chi2
DF .250 .100 .050 .025 .010 .005 .001
1 1.323 2.706 3.841 5.024 6.635 7.879 10.8282 2.773 4.605 5.991 7.378 9.210 10.597 13.8163 4.108 6.251 7.815 9.348 11.345 12.838 16.2664 5.385 7.779 9.488 11.143 13.277 14.860 18.4675 6.626 9.236 11.070 12.832 15.086 16.750 20.515
6 7.841 10.645 12.592 14.449 16.812 18.548 22.4587 9.037 12.017 14.067 16.013 18.475 20.278 24.3228 10.219 13.362 15.507 17.535 20.090 21.955 26.1259 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588
11 13.701 17.275 19.675 21.920 24.725 26.757 31.26412 14.845 18.549 21.026 23.337 26.217 28.300 32.90913 15.984 19.812 22.362 24.736 27.688 29.819 34.52814 17.117 21.064 23.685 26.119 29.141 31.319 36.12315 18.245 22.307 24.996 27.488 30.578 32.801 37.697
16 19.369 23.542 26.296 28.845 32.000 34.267 39.25217 20.489 24.769 27.587 30.191 33.409 35.718 40.79018 21.605 25.989 28.869 31.526 34.805 37.156 43.31219 22.718 27.204 30.144 32.852 36.191 38.582 43.82020 23.828 28.412 31.410 34.170 37.566 39.997 45.315
.
Problema: Fugas Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reducción de tiempo de ciclo.
Variación en familias a probarOperador a operadorHo: No existe diferencia en los índices de defecto de los diferentes
operadoresHa: Existe diferencia en los índices de defecto de los diferentes
operadores
Máquina a máquinaHo: No existe diferencia en los índices de defecto de las diferentes
máquinasHa: Existe diferencia en los índices de defecto de las diferentes
máquinas
Tamaño de la muestra:5000 + total de oportunidades (172 piezas)
Los conteos esperados están colocados debajo de los conteos observadosCon fugas Sin fugas Total
1 30 610 640 32.11 607.89
2 235 4217 4452 223.38 4228.62
3 3 253 25612.84 243.16
4 18 334 352 17.66 334.34
Total 286 5414 5700
Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 + 0.000 = 8.734DF= (4-1)(2-1) = 3; valor P = 0.033
Prueba de chi2 (máquina a máquina)
Los conteos esperados están colocados debajo de los conteos observados.Con gotera Sin gotera Total
1 6 122 128 6.61 121.39
2 1 127 128 6.61 121.39
3 200 3836 4036 208.55 3827.45
4 54 202 256 13.23 242.77
5 5 699 704 36.38 667.62
6 12 116 128 6.61 121.39Total 278 5102 5380
Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475 + 4.386 + 0.239 = 171.132DF= 5; valor P = 0.000
Prueba de chi2 (operador a operador)
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?(en este caso, operador a operador y máquina a máquina)
Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave para determinar qué grupo de variación debe investigarse primero.
Coeficiente de Contingencia
x 100Chi Cuadrada
N Chi2 N CC
Máquina 8.734 5700 0.15
Operador 171.132 5380 3.18Controlador Mayor
SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N, probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la estadística Chi2.
Sin embargo, si N tiene una variación considerable, dependiendo del grupo de variación que se investiga, el coeficiente de contingencia puede ser una herramienta valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.
Con gotera Sin gotera Total 1 6 122 128 6.61 121.39
2 1 127 128 6.61 121.39
3 200 3836 4036 208.55 3827.45
4 54 202 256 13.23 242.77
5 5 699 704 36.38 667.62
6 12 116 128 6.61 121.39
Mucho peor que lo esperado
Mucho mejor que lo esperado
Ahora que la información nos ha llevado a investigar a los grupos de operador a operador. ¿Qué debemos hacer ahora?Encontremos cuál de los operadores estaban fuera del estándar. ¿Era alguno de ellos notablemente peor (o mejor) que el resto?
(Estos mismos operadores fueron quienestuvieron los números más grandes de chi2)
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?(en este caso, operador a operador y máquina a máquina)
Operador a operador: = 0.000 Rechace Ho y acepte Ha
(Existe una diferencia significativa entre los operadores)
Los operadores 4 y 5 están fuera del estándar:El operador 4 es notablemente peor que el resto,El operador 5 es notablemente mejor que los demás
¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias pueden existen en sus técnicas.
El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a soldar este producto en particular.
El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que requerían los operadores para “acostumbrarse” a trabajar en esta forma)
Ejercicios
1. Se quiere evaluar la habilidad de tres inspectores de rayos X en un aeropuerto para detectar artículos clave. Como prueba se pusieron radios de transistores en 90 maletas, cada inspector fue expuesto a 30 maletas conteniendo radios mezcladas entre otras que nos los contenían. Los resultados se resumen a continuación:
Inspectores1 2 3
Radios detectados 27 25 22Radios no detectados 3 5 8
¿Con un 95% de confianza, existe una diferencia entre los inspectores?
Ho: p1 = p2 = p3; Ha: al menos una es diferenteGrados de libertad = (columnas - 1) ( filas -1)
Ejercicios
1. Se quiere evaluar si hay preferencia por manejar en un carril de una autopista dependiendo de la hora del día. Los datos se resumen a continuación:
Hora del díaCarril 1:00 3:00 5:00Izquierdo 44 37 18Central 28 50 72Derecho 8 13 30
¿Con un 95% de confianza, existe una diferencia entre las preferencias de los automovilistas dependiendo de la hora?
Ho: P1 = P2 = P3; Ha: al menos una es diferenteGrados de libertad = (columnas - 1) ( filas -1)
532
Coeficiente de Contingencia Coeficiente de contingencia es el grado de relación o
dependencia de las clasificaciones en la tabla de contingencias es:
Donde N es la frecuencia total y X es el estadístico Chi Cuadrado calculado
22
2
NXXC
533
Coeficiente de Contingencia Para los datos del ejemplo anterior se tiene:
El valor máximo de C se obtiene de:
38.039322.66
22.662
2
22
2
2
NX
XC
866.08
282
kkCMax
534
Correlación de atributos Para tablas de orden k * k, el coeficiente de correlación,
r, es :
Donde 0<= r <= 1
)1(
2
kNXr
535
7B8 – Pruebas de Hipótesis no paramétricas
536
Pruebas no paramétricas Las pruebas paramétricas asumen una distribución para
la población, tal como la Normal
Las pruebas no paramétricas no asumen una distribución específica de la población
Bajo los mismos tamaños de muestra la Potencia o probabilidad de rechazar Ho cuando es falsa es mayor en las pruebas paramétricas que en las no paramétricas
Una ventaja de las pruebas no paramétricas es que los resultados de la prueba son más robustos contra violación de los supuestos
Prueba de Hipótesis
Variable Atributo
Tablas deContingencia de
Correlación
No Normal
Normal
Varianza Medianas
Variancia Medias
Prueba-F
Homogeneidadde la Variaciónde Levene
Homogeneidadde la Variaciónde Bartlett
Correlación
Prueba de signos
Wilcoxon
Mann-Whitney
Kurskal-Wallis
Prueba de Mood
Friedman
Pruebas de t
ANOVA
CorrelaciónRegresión
Muestra-1Muestra-2
Una víaDos vías
Residuosdistribuidosnormalmente
538
Pruebas de VarianzasHomogeneidad de la varianza de
Levene : Compara dos o más varianzas de muestras de la misma población.
Pruebas de Variancias
X2 : Compara la variancia de una muestra con una variancia de un universo conocido.
Prueba F : Compara dos varianzas de muestras.
Homogeneidad de la variancia de Bartlett: Compara dos o más varianzas muestras de la misma población.
Datos Normales Datos No NormalesResumen de pruebas de Hipótesis
539
Pruebas de la Mediana
Prueba de signos o Prueba Wilcoxon : Prueba si la mediana de la muestra es igual a un valor conocido o a un valor a alcanzar.
Prueba Mann-Whitney : Prueba si dos medianas de muestras son iguales.
Prueba Kruskal-Wallis: Prueba si más de dos medianas de muestras son iguales. Asume que todas las distribuciones tienen la misma forma.
Prueba de la mediana de Mood : Otra prueba para más de dos medianas. Prueba más firme para los valores atípicos contenidos en la información.
Prueba Friedman : Prueba si las medianas de las muestras, clasificadas bajo dos categorías, son iguales.
Correlación : Prueba la relación lineal entre dos variables.
Pruebas de los Promedios
Prueba t de 1 muestra : Prueba si el promedio de la muestra es igual a un promedio conocido o meta conocida.
Prueba t de 2 muestras : Prueba si los dos promedios de las muestras son iguales.
ANOVA de un factor: Prueba si más de dos promedios de las muestras son iguales.
ANOVA de dos factores : Prueba si los promedios de las muestras clasificadas bajo dos categorías, son iguales.
Correlación : Prueba la relación lineal entre dos variables.
Regresión : Define la relación lineal entre una variable dependiente y una independiente. (Aquí la "normalidad" se aplica al valor residual de la regresión)
Datos Normales Datos No NormalesResumen de pruebas de Hipótesis
Revise y asegúrese de que los datos no siguen una distribución normal.
• Desarrollar una Prueba de normalidad (para verificar realmente lo anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)
• Desarrollar una Prueba de Corridas (para verificar que no existen sucesos no aleatorios que puedan haber distorsionado la información)
• Revisar la información para detectar errores (tipográficos, etc.). Investiguar los valores atípicos.
• Una muestra pequeña (n < 30) proveniente de un universo normal, se mostrará algunas veces como anormal.
Intentar transformar los datos. Las transformaciones comunes incluyen:
- Raíz cuadrada de todos los datos- Logaritmo de todos los datos- Cuadrado de todos los datos
• Si la información es todavía anormal, entonces usar las herramientas no paramétricas.
Acciones a tomar con datos No Normales
Promedio : Es la media aritmética de la información. Es la suma de todos los datos, dividida entre el número de datos de referencia.
Mediana: Valor del punto medio de los datos, cuando se ordenan en forma ascendente (en caso de datos pares, obtener promedio).
Moda : Valor que se repite con más frecuencia sobre el conjunto de datos. Ejemplo:
Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se muestran más adelante. ¿Cuáles son el promedio y la mediana para esta muestra?
30, 37, 25, 35, 42, 35, 35, 47, 45, 6039, 45, 30, 38, 35, 40, 44, 55, 47, 43
7B8. Definiciones
Un dibujo dice más que mil palabras
El promedio puede estar influenciado considerablemente por los valores atípicos porque, cuando se calcula un promedio, se incluyen los valores reales de estos valores.
La mediana, por otra parte, asigna la misma importancia a todas las observaciones, independientemente de los valores reales de los valores atípicos, ya que es la que sencuentra en la posición media de los valores ordenados.
Promedio = 40.35 Mediana = 39.5
-------+---------+---------+---------+---------+---------+------ C1
PromedioMediana
28.0 35.0 42.0 49.0 56.0 63.0
Pruebas Alternativas comúnmente usadas
Pruebas para datos No normales
• Prueba de Corridas : Calcula la probabilidad de que un X número de puntos de referencia, esté por encima o por debajo del promedio aleatoriamente.
• Prueba de signos, de 1 muestra : Prueba la probabilidad de que la mediana de la muestra, sea igual al valor hipotético.
• Prueba Mann-Whitney : Comprueba el rango de dos muestras, por la diferencia entre dos medianas del universo.
• Prueba de la Mediana de Mood : Prueba para más de dos medianas del universo. Más robusta para los valores atípicos o para los errores en la información.
Analogía con datos normales
• Prueba de Corridas (la mismaprueba para ambos tipos deinformación)
• Prueba t de una muestra
• Prueba t de 2 muestras
• ANOVA de un factor
Considere los siguientes datos (que se muestran aquí en orden cronológico):325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80
Es importante tener los datos registrados en orden cronológico.
Una representación gráfica de los datos se asemeja a esto:
0
100
200
300
400
500
600
PromedioPrimera "corrida"
Segunda ”racha"
Número total de Rachas: 12Número total de puntos > al promedio: 11Número total de puntos < al promedio: 18
Racha: Un punto o una serie consecutiva de puntos que caen en un lado del promedio.
Prueba de Rachas
Prueba de RachasPromedio K = 184.4483
Número de rachas observado = 12
Número de rachas esperado = 14.6552=> No se rechaza Ho11 observaciones por encima de K; 18 por debajoLa prueba es significativa en p= 0.2860No se puede rechazar Ho con valor alfa = 0.05
Este es el valor p de las Prueba de
Corridas
Prueba de RachasHo: Los datos son aleatorios Ha:Los datos NO so aleatorios
Ya que p > 0.05, no podemos rechazar la hipótesis nula.Los datos son aceptados, siendo aleatorios.
Promedio
Cálculos de la Prueba de RachasEl estadístico Z cuando n > 20 se calcula como:
Z = (G - MediaG) / DesvStG
Con MediaG = 1 + (2n1*n2) / (n1 + n2) DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)
Del ejemplo anterior G = 12; n1 = 11 n2 = 18
MediaG = 14.655 DesStG = 2.4843
Z1 = (12 - 14.655) / 2.4843 = -1.0687P(Z1) = 0.1430 y para dos colas se tiene
P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho
Si las n1 y n2 son menores a 21, entonces se consulta la tabla de valores críticos para el número de Rachas G
547
Corrida con Minitab Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean
P > 0.05No rechazar Ho
Runs Test: C1 Runs test for C1Runs above and below K = 184.448The observed number of runs = 12The expected number of runs = 14.655211 observations above K, 18 belowP-value = 0.285
Prueba de Signos de la Mediana
Ho : La mediana de la muestra es igual a la mediana de la hipótesisHa : Las medianas son diferentes
Ejemplo (usando los datos del ejemplo anterior):
Ho: Valor de la mediana = 115.0 Ha: Valor de la mediana diferente de 115.0
N DEBAJO IGUAL ENCIMA VALOR P MEDIANA 29 12 0 17 0.4576 144.0
Ya que p >0.05, no se puede rechazar la hipótesis nula.No se puede probar que la mediana real y la mediana hipotética son diferentes.
En las páginas siguientes se muestra el detalle del cálculo.
Cálculos de la Prueba de Signos de la Mediana
Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a mayor se tiene: n = 29, Mediana de Ho = 115
No. Valor Signo No. Valor Signo No. Valor Signo1 0 - 11 110 - 21 220 +2 50 - 12 110 - 22 240 +3 56 - 13 120 + 23 290 +4 72 - 14 140 + 24 309 +5 80 - 15 144 + 25 320 +6 80 - 16 145 + 26 325 +7 80 - 17 150 + 27 400 +8 99 - 18 180 + 28 500 +9 101 - 19 201 + 29 507 +10 110 - 20 210 +
Con la mediana en 144. Si el valor contra el cual se desea probar es 115, entonces hay 12 valores por debajo de el (-) y 17 valores por arriba (+).
Cálculos de la Prueba de Signos de la Mediana
El estadístico X es el el número de veces que ocurre el signo menos frecuente, en este caso el 12 (-).
Cómo n 25, se calcula el estadístico Z para la prueba de signos con:
Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5 n
En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierdaen forma similar P(Z2) 0-2288 para la cola derecha, por lo que la probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.
Si n hubiera sido < 25 entonces se hubiera consultado la tabla de valores críticos para la prueba de signo.
Prueba de Signos de la Mediana
Bueno, veamos una gráfica de la información
100 200 300 4000 500
¿Es esto correcto?¿144 podría ser igual a 115?
115 144
Después de todo, tal vez esto SEA lo correcto.
552
Corrida en Minitab Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal
Como P > 0.05 no se rechaza Ho y la mediana es 115
Sign Test for Median: Signos Sign test of median = 115.0 versus not = 115.0
N Below Equal Above P MedianSignos 29 12 0 17 0.4583 144.0
553
Prueba de Signos de la MedianaPara observaciones pareadas
Calificaciones de amas de casa a dos limpiadores de ventanas:
Ho: p = 0.5 no hay preferencia de A sobre B Ha: p<>0.5Ama Limpiad
or BCasa A
1 10 72 7 53 8 74 5 25 7 66 9 6
¿Hay evidencia que indiquecierta preferencia de las amasde casa por lo limpiadores?
554
Prueba de Signos de la MedianaProducto B
Familia
A
1 - +2 - +3 + -4 - +5 0 06 - +7 - +8 + -9 - +10 - +11 - +
¿Hay evidencia que indiquecierta preferencia por un Producto A o B?
Media = 0.5*nDesv. Estand.= 0.5*raiz(n)
Zc = (Y – media) / Desv. Estánd.Rechazar Ho si Zc ><Zalfa/2
555
Prueba de Signos de la Mediana
Como Zc < Zexcel no se rechaza Ho oComo p value = 0.067 > 0.025No hay evidencia suficiente de que losConsumidores prefieran al producto B
Media = 0.5*11 = 5.5Desv. Estand.= 0.5*raiz(n) = 1.67
Para Zc = (8 – 5.5) / 1.67 = 1.497
Zexcel = 1.96 para alfa/2 = 0.025
556
Prueba rango con signo de Wilconox
Es la alternativa no paramétrica de la prueba paramétrica de muestras pareadas
Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario
Trabajador
Método 1
Método 2
Diferencias
Abs(diferen.) Rango
Rango c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0 Eliminar
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T = 44
557
Prueba rango con signo de Wilconox
Distribución muestral T para poblaciones idénticasSe aproxima a la distribución normal para n >= 10
En este caso n = pares eliminando las que son iguales con dif. = 0 para el trabajador 8.
= raiz(10 x 11 x 21/6) = 19.62 Z = (T – )/ = 44/19.62 = 2.24
Z alfa/2 = Z0.025 = 1.96
Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes
0T6
)12)(1(
nnnT
558
Prueba en Minitab para prueba de mediana con Wilconox
File> Open worksheet > Exh_Stat Stat > Nonparametrics > 1-Sample Wilconox
Variables C1 Test Median 77 Altenative Not equal
Achievement
77
88
85
74
75
62
80
70
83
Wilcoxon Signed Rank Test: Achievement Test of median = 77.00 versus median not = 77.00for Wilcoxon Estimated for Wilcoxon Estimated N Test Statistic P MedianAchievement 9 8 19.5 0.889 77.50
Ho: Mediana = 77 Ha: Mediana <> 77Como P de 0.889 >> alfa de 0.05 no se rechaza Ho
Prueba de Mann-Whitney
Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos grupos de personas de edades diferentes, después de diez minutos de ejercicios aeróbicos.
Los datos resultantes se muestran a continuación.
Edad 40-44C1140135150140144154160144136148
Edad 16-20C2130166128126140136132128124
¿Tuvieron diferenciassignificativas las frecuencias de pulso de ambos grupos?
Prueba de Mann-Whitney
Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales):
Edad 40-44C1
(7) 135(8.5) 136(11) 140(11) 140
(13.5) 144(13.5) 144(15) 148(16) 150(17) 154(18) 160
n1 = 10Ta = 130.5
Edad 16-20C2
(1) 124(2) 126
(3.5) 128(3.5) 128(5) 130(6) 132
(8.5) 136(11)140(15)166
n2 = 9Tb = 55.5
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son igualesHa: Las distribuciones de frecuencias relativas poblacionales no son idénticasHo: 1 = 2 Ha: 1 2 1, 2 = Medianas de las poblacionesOrdenando los datos y asignándoles su posición relativa se tiene:Ua = n1*n2 + (n1) * (n1 + 1) /2 - TaUb = n1*n2 + (n2) * (n2 + 1) /2 - TbUa + Ub = n1 * n2
Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5El menor de los dos es Ua.Para alfa = 0.05 el valor de Uo = 25 Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.
Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son igualesHa: Las distribuciones de frecuencias relativas poblacionales no son idénticas
Ua = 14.5 Ub = 79.5Utilizando el estadístico Z y la distribución normal se tiene:
45 12.24Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)Con Ua y Ub se tiene:Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anteriorZb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor = 0.05El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.
Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney40
-44
años
de
edad
16-20 años de edad
Diferencias entre los encabezados de los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada "punto estimado". Este punto estimado es una aproximación de la diferencia entre las medianas de los dos grupos (ETA1 y ETA2).
Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de información), Minitab usa este punto estimado para calcular el valor p.
130 166 128 126 140 136 132 128 124140 10 -26 12 14 0 4 8 12 16135 5 -31 7 9 -5 -1 3 7 11150 20 -16 22 24 10 14 18 22 26140 10 -26 12 14 0 4 8 12 16144 14 -22 16 18 4 8 12 16 20154 24 -12 26 28 14 18 22 26 30160 30 -6 32 34 20 24 28 32 36144 14 -22 16 18 4 8 12 16 20136 6 -30 8 10 -4 0 4 8 12148 18 -18 20 22 8 12 16 20 24
564
Corrida en Minitab Stat > Nonparametrics > Mann Whitney First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal
Mann-Whitney Test and CI: C1, C2 N Median P>0.05C1 10 144.00 Se rechaza Ho C2 9 130.00Point estimate for ETA1-ETA2 is 12.0095.5 Percent CI for ETA1-ETA2 is (4.01,20.00)W = 130.5Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143The test is significant at 0.0140 (adjusted for ties)
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales):
Zona 1(15.5) 147(17.5) 17.5
(9) 128(19) 162(12) 135(10) 132(22) 181(13) 138
n1 = 8Ta = 118
Zona 2(17.5) 160(14) 140(21) 173(4) 113(1) 85
(7) 120(25) 285(5) 117
(11) 133(6) 119
n2 = 10Tb = 111.5
Zona 3(24) 215(8) 127(2) 98
(15.5) 127(23) 184(3) 109
(20) 169
n3 = 7Tc = 95.5
N = n1 + n2 + n3 = 25
Prueba de Kruskal Wallis
Ho: Las poblaciones A, B y C son igualesHa: Las poblaciones no son igualesHo: 1 = 2 = 3 Ha: 1 2 3 ; 1, 2, 3 = Medianas de las poblaciones
Calculando el valor del estadístico H se tiene:H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] - 3 * ( N +1 )H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138
Se compara con el estadístico 2 para = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)2 crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)
Como H < 2 crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay diferencia entre las poblaciones
567
Corrida en Minitab Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK
Kruskal-Wallis Test: Datos versus Factor Kruskal-Wallis Test on DatosFactor N Median Ave Rank ZZona 1 7 138.0 14.7 0.98Zona 2 10 126.5 11.1 -0.82Zona 3 7 127.0 12.3 -0.10Overall 24 12.5 P > 0.05H = 1.08 DF = 2 P = 0.581 No se rechaza HoH = 1.09 DF = 2 P = 0.581 (adjusted for ties)
568
Prueba de Medianas de Mood Realiza prueba de hipótesis de igualdad de medias en un diseño
de una vía. La prueba es robusta contra Outliers y errores en datos y es adecuada para análisis preliminares
Determina si K grupos independientes han sido extraidas de la misma población con medianas iguales o poblaciones con formas similares
Con base en la gran mediana, anotar un signo positivo si la observación excede la mediana o un signo menos si es menor. Los valores que coincidan se reparten en los grupos
Hacer una tabla de contingencia K x 2 con las frecuencias de signos más y menos en cada grupo K
569
Prueba de Medianas de Mood Se determina el estadístico Chi Cuadrada con:
Probar Ho: Todas las medianas son iguales Ha: Al menos una mediana es diferente
Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para 0.05 y (reng – 1)*(Col – 1) grados de libertad
EEO 2
2 )(
570
Corrida con MinitabSe les da a 179 participantes una conferencia
con dibujos para ilustrar el tema. Después se les da la prueba OTIS que mide la habilidad intelectual. Los participantes se clasificaron por nivel educativo 0-No prof., 1-Prof., 2-Prepa
Ho: h1 = h2 = h3 Ha: no todas las medianas son iguales
File > Open Worksheet > Cartoon.mtw Stat > Nonparametrics > Mood’s Median Test
Response Otis Factor ED Ok
571
Corrida con MinitabMood Median Test: Otis versus ED Mood median test for OtisP>0.05Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho Individual 95.0% CIsED N<= N> Median Q3-Q1 ----+---------+---------+---------+--0 47 9 97.5 17.3 (-----*-----)1 29 24 106.0 21.5 (------*------)2 15 55 116.5 16.3 (----*----) ----+---------+---------+---------+-- 96.0 104.0 112.0 120.0Overall median = 107.0
572
Diseños factoriales aleatorias bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vías, es una generalización de las pruebas pareadas con signo. La aditividad es requerida para para estimar los efectos de los tratamientos
Ho: Los tratamientos no tienen un efecto significativo
Ha: Algunos tratamientos tienen efecto significativo
573
Diseños factoriales aleatorias bloqueados de Friedman
Resultados de salida: Se muestra el estadístico de prueba con
distribución Chi Cuadrada aproximada con gl = Tratamientos – 1.
Si hay observaciones parecidas en uno o más bloques, se usa el rango promedio y se muestra el estadístico corregido
La mediana estimada es la gran mediana más el efecto del tratamiento
574
Diseños factoriales aleatorias bloqueados de Friedman
Ejemplo: Se evalúa el efecto del tratamiento de una
droga en la actividad enzimática con tres niveles, probado en cuatro animales
Open the worksheet EXH_STAT.MTW. Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.En Treatment, seleccionar Therapy. En Blocks, seleccionar Litter. Click OK.
575
Diseños factoriales aleatorias bloqueados de Friedman
Datos: EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4
576
Diseños factoriales aleatorias bloqueados de Friedman
Resultados: Friedman Test: EnzymeActivity versus Therapy blocked by Litter S = 2.38 DF = 2 P = 0.305 No rechazar HoS = 3.80 DF = 2 P = 0.150 (adjusted for ties) Sum ofTherapy N Est Median Ranks1 4 0.2450 6.52 4 0.3117 7.03 4 0.5783 10.5Grand median = 0.3783
577
Diseños factoriales aleatorias bloqueados de Friedman
Resultados: El estadístico de prueba S tiene un valor P de 0.305 sin
ajustar para observaciones en cero y 0.150 para el valor ajustado.
Por tanto no hay evidencia suficiente para rechazar Ho
Las medianas estimadas asociadas con los tratamientos son la gran mediana más los efectos estimados de los tratamientos.
El estadístico de prueba se determina con base a los rangos en cada bloque y totales
578
Diseños factoriales aleatorias bloqueados de Friedman
Resultados:
579
Diseños factoriales aleatorias bloqueados de Friedman
Resultados:
580
Diseños factoriales aleatorias bloqueados de Friedman
Resultados:
581
Prueba de igualdad de varianzas de Levene
Se usa para probar la hipótesis nula de que las varianzas de k múltiples poblacionales son iguales
Las igualdad de varianzas en las muestras se denomina homogeneidad de varianzas
La prueba de Levene es menos sensible que la prueba de Bartlett o la prueba F cuando se apartan de la normalidad
La prueba de Bartlett tiene un mejor desempeño para la distribución normal o aproximadamente normal
582
Prueba de igualdad de varianzas de Levene
Para dos muestras el procedimiento es como sigue:
Determinar la media
Calcular la desviación de cada observación respecto a la media
Z es el cuadrado de las desviaciones respecto a la media
Aplicar la prueba t a las dos medias de los datos
583
Prueba de igualdad de Varianzas-MinitabSe estudian tamaños de papa
inyectando con bacterias y sujetas a diferentes temperaturas. Antes del ANOVA se verifica la igualdad de varianzas
Stat > ANOVA > Test for equal variancesResponse RotFactors Temp OxigenConfidence level 95%
Rot Temp Oxygen
13 10 2
11 10 2
3 10 2
10 10 6
4 10 6
7 10 6
15 10 10
2 10 10
7 10 10
26 16 2
19 16 2
24 16 2
15 16 6
22 16 6
18 16 6
20 16 10
24 16 10
8 16 10
584
Resultados
585
ResultadosTest for Equal Variances: Rot versus Temp, Oxygen 95% Bonferroni confidence intervals for standard deviationsTemp Oxygen N Lower StDev Upper 10 2 3 2.26029 5.29150 81.890 10 6 3 1.28146 3.00000 46.427 10 10 3 2.80104 6.55744 101.481 16 2 3 1.54013 3.60555 55.799 16 6 3 1.50012 3.51188 54.349 16 10 3 3.55677 8.32666 128.862Bartlett's Test (normal distribution)Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar HoLevene's Test (any continuous distribution)Test statistic = 0.37, p-value = 0.858
586
Prueba de la concordancia del Coeficiente de Kendall
El coeficiente expresa el grado de asociación entre las calificaciones múltiples realizadas por un evaluador
Ho: Las variables son independientesHa: Las variables están asociadas
Kendall usa la información relacionada con las calificaciones relativas y es sensible a la seriedad de mala clasificación
Por ejemplo para K = jueces N = Muestras = 10
Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9Chi Cuadrada crítica = X2 0.01,9 = 21.67
587
Prueba de la concordancia del Coeficiente de Kendall
El Estadístico Chi Cuadrada calculado es:
Como Chi Cuadrada de alfa es menor que la calculada, los cuatro jueces están asociados significativamente. Constituyen un panel uniforme. No quiere decir que estén en lo correcto, solo que responden de manera uniforme a los estímulos
588
El coeficiente de correlación de rangos de Spearman (rs)
El coeficiente de correlación es una medida de la asociación que requiere que ambas variables sean medidas en al menos una escala ordinal de manera que las muestras u observaciones a ser analizadas pueden ser clasificadas en rangos en dos series ordenadas
Ho: Las variables son independientesHa: Las variables están asociadas
Para el ejemplo anterior si N = 10, el coeficiente es:
NNd
rs
3
261
97.003.01990
)5.5(61 sr
589
Coeficiente de correlación de rangos para monotonía
de preferencias Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes
Preferencia Precio (rango)
Fab.
1 7 449.50 (1)2 4 525.00 (5)3 2 479.95 (3)4 6 499.95 (4)5 1 580.00 (8)6 3 549.95 (7)7 8 469.95 (2)8 5 532.50 (6)
Di cuadrada
RangoDi
6 36-1 1-1 12 4-7 49-4 166 36-1 1
590
Coeficiente de correlación de rangos para monotonía
de preferencias Ho: No existe asociación entre los rangosHa: Existe asociación entre los rangos o es positiva o negativa
El coeficiente de correlación de rangos de Spearman es:
Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))
En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714
R0 se determina de la tabla de Valores críticos del coeficiente de correlación del coeficiente de correlación de rangos de Spearman
Rt = 0.686
Por tanto si hay asociación significativa en las preferencias
591
Tabla de constantesn Alfa=0.05 Alfa = 0.0255 0.900 -6 0.829 0.8867 0.714 0.7868 0.643 0.7389 0.600 0.683
10 0.564 0.64811 0.523 0.62312 0.497 0.59113 0.475 0.56614 0.457 0.54515 0.441 0.52516 0.425 0.50717 0.412 0.49018 0.388 0.47619 0.377 0.46220 0.368 0.45021 0.359 0.43822 0.351 0.42823 0.343 0.41824 0.336 0.40925 0.329 0.40026 0.329 0.39227 0.323 0.38528 0.317 0.37729 0.311 0.37030 0.305 0.364
592
Corrida con MinitabPara la corrida en Minitab
primero se deben determinar los rangos en forma manual para las variables X y Y.
Stat > Basic statistics > Correlation Variables Preferencia Precio
Fabricante
Prefe-rencia Precio
Precio
1 7 1 449
2 4 5 525
3 2 3 479
4 6 4 499
5 1 8 580
6 3 7 549
7 8 2 469
8 5 6 532
Correlations: Preferencia, Precio Pearson correlation of Preferencia and Precio = -0.714P-Value = 0.047
593
Ejemplo con MinitabSe estudia la relación entre
colágeno y Proline en pacientes con cirrosis
Stat > Basic statistics > Correlation Variables Colágeno Proline
Paciente Colágeno Proline
1 7.1 2.8
2 7.1 2.9
3 7.2 2.8
4 8.3 2.6
5 9.4 3.5
6 10.5 4.6
7 11.4 5
Correlations: Colageno, Proline Pearson correlation of Colageno and Proline = 0.935P-Value = 0.002
594
Resumen de pruebas no paramétricas
Prueba de signos de 1 muestra: Prueba la igualdad de la mediana a un valor y determina el intervalo de confianza
Prueba de Wilconox de 1 muestra: Prueba la igualdad de la mediana a un valor con rangos con signo y determina el intervalo de confianza
Comparación de dos medianas poblacionales de Mann Whitney: Prueba la igualdad de las medianas y determina el intervalo de confianza
595
Resumen de pruebas no paramétricas
Comparación de igualdad de medianas poblacionales de Kruskal Wallis: Prueba la igualdad de las medianas en un diseño de una vía y determina el intervalo de confianza
Comparación de medianas poblacionales de Mood: Prueba la igualdad de medianas con un diseño de una vía
596
597
598
Salidas de la Fase de Análisis Causas raíz validadas
Guía de oportunidades de mejora
Causa RaízResultadosCausas
# de Causa
SI ES CAUSA RAIZ
SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
NO ES CAUSA RAIZ
SI ES CAUSA RAIZ
SI ES CAUSA RAIZ
NO ES CAUSA RAIZ
Ensamble de ojillos, bloques y contrapesos no adecuados en aspas.Amortiguadores dañados.Desgaste de bujes en los carretes.Fabricación y reemplazo de ejes y poleas no adecuados en ensamble de aspas.Desalineamiento de poleas y bandas de transmisión de aspas.Método de Balanceo no adecuado.Desalineación de pinolas en cuna.
1
2 3
4
5
67
Resumen de la validación de las causas
X
X
X
X
Preguntas ejemplo1. En un sentido amplio, cuantas de las siguientes causas
de variación en estudios multi vari pueden incluir elementos de proceso relacionados con el tiempo:
I. PosicionalII. CilíndricaIII. Temporala. I y II c. II y IIIb. I y III d. I, II y III
2. En un estudio de análisis de regresión con dos variables, ¿que representa el término Beta 1?:
a. La pendiente de la líneab. La interacción de la mediciónc. La intersección en el eje Xd. La intersección en el eje Y3. Se hace un estudio entre la velocidad de coches y su
consumo de gasolina. El coeficiente de correlación es de 0.35. Después se encontró que el velocímetro está equivocado y debió haber marcado 5 km. De más. Se recalcula el coeficiente de correlación, que debe dar:
a. 0.30 b. 0.35c. 0.40 d. -0.35
Preguntas ejemplo4. La siguiente ecuación es: a. La covarianza de X y Yb. El coeficiente de correlación de X y Yc. El coeficiente de determinación de X y Yd. La varianza del producto de X y Y
5. Según la figura, ¿Cuál de las afirmaciones siguientes es falsa?
I. El coeficiente de correlación es negativoII. El coeficiente de determinación es positivoIII. El coeficiente de determinación es menor que el
coeficiente de correlacióna. Sólo I c. Sólo IIIb. Sólo II d. II y III
Preguntas ejemplo6. Un problema de correlación:a. Se resuelve estimado el valor de la variable
dependiente para varios valores de la variable independiente
b. Considera la variación conjunta de las dos mediciones, ninguna de las cuales es restringida por el experimentador
c. Es un caso donde la distribución relevante debe ser geométrica
d. Se resuelve al asumir que las variables son normales e independientemente distribuidas con media cero y varianza “s”
Preguntas ejemplo7. Una muestra aleatoria de tamaño n se toma de una gran
población con desviación estándar de 1.0”. El tamaño de muestra se determina de manera que haya un 0.05 de probabilidad de riesgo de exceder 0.1” de error de tolerancia al usar la media de la muestra para estimar la Mu. ¿Cuál de los siguientes valores es el más cercano al tamaño de muestra requerido?
a. 365 b. 40 c. 200 d. 100
8. La diferencia entre poner alfa de 0.05 y alfa igual a 0.01 en una prueba de hipótesis es:
a. Con alfa de 0.05 se tiene mayor tendencia a cometer un error tipo I
b. Con alfa de 0.05 se tiene más posibilidad de riesgo de cometer un error tipo II
c. Con alfa de 0.05 es una prueba más “conservadora” de la hipótesis nula Ho
d. Con alfa de 0.05 se tiene menos posibilidad de cometer un error tipo I
9. Si un tamaño de muestra de 16 tiene un promedio de 12 y una desviación estándar de 3, estimar el intervalo de confianza para un nivel de confianza del 95% para la población (asumir una distribución normal)
Preguntas ejemplo10. En una muestra aleatoria de 900 vehículos, 80% tienen
frenos ABS. ¿Cuál es el intervalo del 95% para el porcentaje de vehículos con frenos ABS?a. 0.778 – 0.821 c. 0.639 – 0.964 b. 0.771 – 0.829 d. 0.774 – 0.826
11. Determinar si los siguientes dos tipos de misiles tienen diferencias significativas en sus varianzas a un nivel del 5%:
Misil A: 61 lecturas Varianza = 1.347 km2.Misil B: 31 lecturas Varianza = 2.237 km2.a. Hay diferencia significativa ya que Fcalc < Ftablasb. No hay diferencia significativa por que Fcalc < Ftablasc. Hay diferencia significativa por que Fcalc > Ftablasd. No hay diferencia significativa pro que Facla > Ftablas
12. El valor crítico para t, cuando se hace una prueba t de dos colas, con muestras de 13 y alfa de 0.05 es:a. 1.782 c. 2.064b. 2.179 d. 1.711
Preguntas ejemplo13. Tres personas en entrenamiento se les proporciona el mismo
lote de 50 piezas y se les pide que las clasifiquen como buenas o defectuosas, con los resultados siguientes:
Persona
Para determinar si hay o no hay diferencia en la habilidad de las tres personas para clasificar adecuadamente las partes, ¿cuál de los siguiente es (son) verdadero?
I. El valor calculado de Chi cuadrada es de 6.9II. Para un nivel de significancia de 0.05, el valor crítico de Chi
cuadrada es de 5.99III. Como el valor calaculado de Chi cuadrada en mayor a 5.99, se
rechaza la hipótesis nulaa. Sólo I c. Sólo IIb. I y II d. I, II y III
14. Un análisis de varianza de dos vías tiene r niveles para una variable y c niveles para la otra, con dos obseraciones por celda. Los grados de libertad para la interacción son:
a. 2 (r ) (c ) b. (r-1) (c-1) c. rc – 1 d. 2 (r -1) (c – 1)
A B C Total Defectivos 17 30 25 72 Buenos 33 20 25 78 Total 50 50 50 150
Preguntas ejemplo15. Los supuestos básicos del análisis de varianza oncluyen:I. Las observaciones vienen de poblaciones normalesII. Las observaciones vienen de poblaciones con vaianzas
igualesIII. Las observaciones vienen de poblaciones con medias
igualesa. I y II c. II y IIIb. I y III d. I, II y III
16. El valor teórico esperado para una celda en la tabla de contingencia se calcula como:
Preguntas ejemplo17. ¿Cuál de las siguientes afirmaciones son verdaderas en
relación a las pruebas no paramétricas?I. Tienen mayor eficiencia que sus equivalentes pruebas
paramétricasII. Pueden ser aplicadas a estudios de correlaciónIII. Requieren supuestos acerca de la forma oi naturaleza de
las poblaciones involucradasIV. Requieren cálculos que son más difíciles que sus
equivalentes pruebas paramétricasa. Sólo II c. II y IVb. I y III d. I, II y III