280
1 Programa de certificación de Green Belts IV. Seis Sigma - Análisis P. Reyes / Octubre de 2007

Programa de certificación de Green Belts

Embed Size (px)

DESCRIPTION

Seis Sigma. Programa de certificación de Green Belts. IV. Seis Sigma - Análisis P. Reyes / Octubre de 2007. Llenar columnas del FMEA Hasta sol. Propuesta y comprobar causas con Pruebas de Hipótesis. Seis Sigma - Análisis. FMEA Identificación de causas potenciales - PowerPoint PPT Presentation

Citation preview

1

Programa de certificación de Green Belts

IV. Seis Sigma - Análisis

P. Reyes / Octubre de 2007

2

Diagrama deIshikawa

Diagrama derelaciones

Diagramade Árbol

Análisis del Modo y Efecto deFalla (AMEF)

QFD

DiagramaCausa Efecto

CTQs = YsOperatividad

X's vitales

Diagramade Flujo

delproceso

Pruebasde

hipótesis

Causas raízvalidadas

¿CausaRaíz?

DefiniciónY=X1 + X2+. .Xn

X'sCausas

potenciales

Medición Y,X1, X2, Xn

FASE DE ANÁLISIS

SiNo

Llenar columnas del FMEAHasta sol. Propuesta ycomprobar causas conPruebas de Hipótesis

3

Seis Sigma - Análisis

FMEA

Identificación de causas potenciales

A. Análisis exploratorio de datos

B. Pruebas de hipótesis

4

¿ Qué es el FMEA?El Análisis de del Modo y Efectos de Falla es un grupo

sistematizado de actividades para:

Reconocer y evaluar fallas potenciales y sus efectos.

Identificar acciones que reduzcan o eliminen las probabilidades de falla.

Documentar los procesos con los hallazgos del análisis.

Existe el estándar MIL-STD-1629, Procedure for Performing a Failure Mode, Effects and Criticality Analysis

5

Tipos del FMEA AMEF de concepto (CFMEA)

A nivel de sistema, subsistema y componente

AMEF de diseño (DFMEA)

AMEF de Proceso (PFMEA)

AMEF de maquinaria (como aplicación del DFMEA)

6

Tipos de FMEAs FMEA de Diseño (AMEFD), su propósito es analizar

como afectan al sistema los modos de falla y minimizar los efectos de falla en el sistema. Se usan antes de la liberación de productos o servicios, para corregir las deficiencias de diseño.

FMEA de Proceso (AMEFP), su propósito es analizar como afectan al proceso los modos de falla y minimizar los efectos de falla en el proceso. Se usan durante la planeación de calidad y como apoyo durante la producción o prestación del servicio.

7

Salidas del FMEA de Proceso Una lista de modos potenciales de falla

Una lista de Caracteríticas críticas y/o significativas

Una lista de características relacionadas con la seguridad del operador y con alto impacto

Una lista de controles especiales recomendados para las Características Especiales designadas y consideradas en el Plan de control

8

Salidas del FMEA de Proceso Una lista de procesos o acciones de proceso

para reducir la Severidad, eliminar las causas de los modos de falla del producto o reducir su tasa de ocurrencia, y mejorar la tasa de Detección de defectos si no se puede mejorar la capacidad del proceso

Cambios recomendados a las hojas de proceso y dibujos de ensamble

9

FMEA de Proceso - PFMEA

Componente ______________________ Responsable del Diseño ____________AMEF Número _________________

Ensamble ________________ Preparó _______________ Pagina _______de _______

Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______

Funcióndel Producto/

Paso del proceso

Modos de FallaPotenciales

Efecto (s)Potencial (es)

de falla

Sev.

Causa(s)Potencial(es)

o Mecanismosde falla

Occur

Controles de Diseño o Proceso Actuales

Detec

RPN

AcciónSugerida

Responsabley fecha límite

de Terminación

AcciónAdoptada

Sev

Occ

Det

RPN

Resultados de Acción

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso

11

Modelo del PFMEA – Paso 1 Identificar todos los requerimientos funcionales dentro

del alcance

Identificar los modos de falla correspondientes

Identificar un conjunto de efectos asociados para cada modo de falla

Identificar la calificación de severidad para cada conjunto de efectos que de prioridad el modo de falla

De ser posible, tomar acciones para eliminar modos de falla sin atender las “causas”

12

Modelo de PFMEA – Paso 1

Modos de falla potenciales No funciona Funcionamiento parcial / Sobre función /

Degradación en el tiempo Funcionamiento intermitente Función no intencionada

Los modos de falla se pueden categorizar como sigue: Manufactura: Dimensional fuera de tolerancia Ensamble: Falta de componentes Recibo de materiales: Aceptar partes no conformes Inspección/Prueba: Aceptar partes equivocadas

13

Modelo de PFMEA - Paso 1

Efectos de las fallas potenciales (en usuario final) Ruido Operación errática Inoperable Inestable Apariencia mala Fugas Excesivo esfuerzo Retrabajos / reparaciones Insatisfacción del cliente

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura / ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor

de las dos severidadesEfecto Efecto en el cliente Efecto en Manufactura /Ensamble Cali

f.Peligroso sin aviso

Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, sin aviso

Puede exponer al peligro al operador (máquina o ensamble) sin aviso 10

Peligroso con aviso

Calificación de severidad muy alta cuando un modo potencial de falla afecta la operación segura del producto y/o involucra un no cumplimiento con alguna regulación gubernamental, con aviso

Puede exponer al peligro al operador (máquina o ensamble) sin aviso 9

Muy alto

El producto / item es inoperable ( pérdida de la función primaria)

El 100% del producto puede tener que ser desechado op reparado con un tiempo o costo infinitamente mayor

8

Alto El producto / item es operable pero con un reducido nivel de desempeño. Cliente muy insatisfecho

El producto tiene que ser seleccionado y un parte desechada o reparada en un tiempo y costo muy alto 7

Moderado

Producto / item operable, pero un item de confort/conveniencia es inoperable. Cliente insatisfecho

Una parte del producto puede tener que ser desechado sin selección o reparado con un tiempo y costo alto

6

Bajo Producto / item operable, pero un item de confort/conveniencia son operables a niveles de desempeño bajos

El 100% del producto puede tener que ser retrabajado o reparado fuera de línea pero no necesariamente va al àrea de retrabajo .

5

Muy bajo

No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 75% de los clientes

El producto puede tener que ser seleccionado, sin desecho, y una parte retrabajada 4

Menor No se cumple con el ajuste, acabado o presenta ruidos y rechinidos. Defecto notado por el 50% de los clientes

El producto puede tener que ser retrabajada, sin desecho, en línea, pero fuera de la estación 3

Muy menor

No se cumple con el ajuste, acabado o presenta ruidos, y rechinidos. Defecto notado por clientes muy críticos (menos del 25%)

El producto puede tener que ser retrabajado, sin desecho en la línea, en la estación 2

Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin efecto 1

CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP

15

Modelo de PFMEA – Paso 2

Paso 2 identificar: Las causas asociadas (primer nivel y raíz)

Su tasa de ocurrencia

La designación apropiada de la característica indicada en ola columna de clasificación

Acciones recomendadas para alta severidad y criticalidad (S x O) así como la Seguridad del operador (OS) y errores de proceso de alto impacto (HI)

16

Modelo de PFMEA – Paso 2

Causa/Mecanismo potencial de falla Describe la forma de cómo puede ocurrir la

falla, descrito en términos de algo que puede ser corregido o controlado

Se debe dar priorioridad a rangos de prioridad de 9 o 10

17

Efecto(s) Potencial(es) de falla

Evaluar 3 (tres) niveles de Efectos del Modo de Falla

• Efectos Locales– Efectos en el Área Local – Impactos Inmediatos

• Efectos Mayores Subsecuentes– Entre Efectos Locales y Usuario Final

• Efectos Finales– Efecto en el Usuario Final del producto o

Servicio

CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP 

100 por mil piezas

Probabilidad Indices Posibles de falla

ppk Calif.

Muy alta: Fallas persistentes

< 0.55 10

50 por mil piezas

> 0.55 9

Alta: Fallas frecuentes 20 por mil piezas

> 0.78 8

10 por mil piezas

> 0.86 7

Moderada: Fallas ocasionales

5 por mil piezas

> 0.94 6

2 por mil piezas

> 1.00 5

1 por mil piezas

> 1.10 4

Baja : Relativamente pocas fallas

0.5 por mil piezas

> 1.20 3

0.1 por mil piezas

> 1.30 2

Remota: La falla es improbable

< 0.01 por mil piezas

> 1.67 1

CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP 

Detecciòn

Criterio Tipos de Inspección

Métodos de seguridad de Rangos de Detección

Calif

    A B C    Casi imposible

Certeza absoluta de no detección

    X No se puede detectar o no es verificada

10

Muy remota

Los controles probablemente no detectarán

    X El control es logrado solamente con verificaciones indirectas o al azar

9

Remota Los controles tienen poca oportunidad de detección

    X El control es logrado solamente con inspección visual

8

Muy baja Los controles tienen poca oportunidad de detección

    X El control es logrado solamente con doble inspección visual

7

Baja Los controles pueden detectar   X X El control es logrado con métodos gráficos con el CEP

6Moderada

Los controles pueden detectar   X   El control se basa en mediciones por variables después de que las partes dejan la estación, o en dispositivos Pasa NO pasa realizado en el 100% de las partes después de que las partes han dejado la estación

5

Moderadamente Alta

Los controles tienen una buena oportunidad para detectar

X X   Detección de error en operaciones subsiguientes, o medición realizada en el ajuste y verificación de primera pieza ( solo para causas de ajuste)

4

Alta Los controles tienen una buena oportunidad para detectar

X X   Detección del error en la estación o detección del error en operaciones subsiguientes por filtros multiples de aceptación: suministro, instalación, verificación. No puede aceptar parte discrepante

3

Muy Alta Controles casi seguros para detectar

X X   Detección del error en la estación (medición automática con dispositivo de paro automático). No puede pasar la parte discrepante

2

Muy Alta Controles seguros para detectar

X     No se pueden hacer partes discrepantes porque el item ha pasado a prueba de errores dado el diseño del proceso/producto

1

Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección visual/manual

 

20

Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________

Ensamble ________________ Preparó _______________ Pagina _______de _______

Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Funciónde

Artículo

Modos de FallaPotenciales

Efecto (s)Potencial (es)

de falla

Sev.

Causa(s)Potencial(es)

de los Mecanismosde falla

Occur

Controles de Diseño Actual

Detec

RPN

AcciónSugerida

Responsabley fecha límite

de Terminación

AcciónAdoptada

Sev

Occ

Det

RPN

Factura Datos LOCAL:incorrecta incorrectos Rehacer

la factura

MAXIMO PROXIMO

Contabilidad 7 3 5 105erronea

CON CLIENTEMolestiaInsatisfacción

Resultados de Acción

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso

Riesgo = Severidad x Ocurrencia x Detección

Causas probables a atacar primero

21

Producto de Severidad, Ocurrencia, y Detección

RPN / Gravedad usada para identificar principales CTQs

Severidad mayor o igual a 8RPN mayor a 150

Calcular RPN (Número de Prioridad de Riesgo)

Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________

Ensamble ________________ Preparó _______________ Pagina _______de _______

Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Funciónde

Artículo

Modos de FallaPotenciales

Efecto (s)Potencial (es)

de falla

Sev.

Causa(s)Potencial(es)

de los Mecanismosde falla

Occur

Controles de Diseño Actual

Detec

RPN

AcciónSugerida

Responsabley fecha límite

de Terminación

AcciónAdoptada

Sev

Occ

Det

RPN

Factura Datos LOCAL:incorrecta incorrectos Rehacer

la factura

MAXIMO PROXIMO

Contabilidad 7 3 5 105erronea

CON CLIENTEMolestiaInsatisfacción

Resultados de Acción

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso

Riesgo = Severidad x Ocurrencia x Detección

Causas probables a atacar primero

23

Planear Acciones

Requeridas para todos los CTQs

Listar todas las acciones sugeridas, qué persona es la responsable y fecha de terminación.

Describir la acción adoptada y sus resultados.

Recalcular número de prioridad de riesgo .

Reducir el riesgo general del diseño

24

Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________

Ensamble ________________ Preparó _______________ Pagina _______de _______

Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Funcióndel componente

/ Paso del proceso

Modos de FallaPotenciales

Efecto (s)Potencial (es)

de falla

Sev.

Causa(s)Potencial(es)

o Mecanismosde falla

Occur

Controles de Diseño / Prcoeso Actuales

Detec

RPN

AcciónSugerida

Responsabley fecha límite

de Terminación

AcciónAdoptada

Sev

Occ

Det

RPN

Factura correcta Datos LOCAL:erroneos Rehacer la

factura

MAXIMO PROXIMO

Contabilidad 7 3 5 105erronea

CON CLIENTEMolestiaInsatisfacción

Resultados de Acción

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso

Usar RPN para identificar acciones futuras. Una vez que

se lleva a cabo la acción, recalcular el RPN.

25

Ejemplo de AMEFP

26

Identificación de causas potenciales

Tormenta de ideasDiagrama de IshikawaDiagrama de RelacionesDiagrama de ÁrbolVerificación de causas raíz

27

Tormenta de ideas

Técnica para generar ideas creativas cuando la mejor solución no es obvia.

Reunir a un equipo de trabajo (4 a 10 miembros) en un lugar adecuado

El problema a analizar debe estar siempre visible

Generar y registrar en el diagrama de Ishikawa un gran número de ideas, sin juzgarlas, ni criticarlas

Motivar a que todos participen con la misma oportunidad

28

Tormenta de ideas Permite obtener ideas de los participantes

29

Diagrama de Ishikawa Anotar el problema en el cuadro de la derecha

Anotar en rotafolio las ideas sobre las posibles causas asignándolas a las ramas correspondientes a:

Medio ambiente Mediciones Materia Prima Maquinaria Personal y Métodos o Las diferentes etapas del proceso de

manufactura o servicio

30

Diagrama de causa efecto Divide los problemas en partes más pequeñas

Muestra las causas potenciales de manera gráfica

También se llama diagrama de ishikawa o de las 4 o 6 M’s.

Muestra como interactúan las diversas causas Sigue las reglas de la tormenta de ideas al

generarlas

Diagrama de IshikawaMedio

ambiente Métodos Personal

¿Quéproducebajas ventasdeTortillinasTía Rosa?

Climahúmedo

Calidad delproducto

Tipo deexhibidor

Falta demotivación

Ausentismo

Rotación depersonal

Maquinaría Materiales

Clientes conventas bajas

Malositinerarios

Descomposturadel camiónrepartidor

Distancia dela agencia alchangarro

Medición

Seguimientosemanal

Conocimientode losmínimos porruta

Frecuenciade visitas

Elaboraciónde pedidos

Posición deexhibidores

Falta desupervición

Programacióndeficiente

Capacidad instalada

desconocida

Marketing no tiene en cuenta

cap de p.Mala prog. De

ordenes de compra

Compras aprovecha

ofertasFalta de com..... Entre

las dif. áreas dela empresa

Duplicidad de funciones

Las un. Recibenordenes de dos

deptos diferentes

Altos inventarios

No hay controlde inv..... En proc.

Demasiados deptosde inv..... Y desarrollo

Falta de prog. Dela op. En base a

los pedidos

No hay com..... Entrelas UN y la oper.

Falta de coordinación al fincar

pedidos entre marketing y la op.

Falta de control deinventarios en

compras

Influencia de lasituación econ del

país

No hay com..... Entre comprascon la op. general

No hay coordinaciónentre la operación y las unidades

del negocio

Falta de coordinación entre el enlace de compras

de cada unidad con compras corporativo

Influencia directa demarketing sobre

compras

Compra de materialpara el desarrollo denuevos productos por

parte inv..... Y desarrollo’’’

No hay flujo efectivo de mat.

Por falta deprogramaciónde acuerdo a pedidos

Perdida de mercadodebido a la

competencia

Constantes cancelaciones

de pedidosde marketing

No hay coordinaciónentre marketing

operaciones

Falta de comunicaciónentre las unidades

del negocio

Diagrama de relaciones

Dancer

Taco generador del motor

Poleas guías

Presión deldancer

Mal guiado

Sensor de velocidadde línea

Sensorcircunferencial

Bandas detransmisión

Empaques de arrastre

Presión de aire de trabajo

Drive principal

Voltaje del motor

Ejes principales

Poleas de transmisión

¿Que nos puede provocar Variación de VelocidadDurante el ciclo de cambio en la sección del

Embobinadores?

Causas a validarCausas a validar

13/0

2/4

0/4

1/2

5/1

1/4

1/4

2/1

1/1

0/3

5/2

4/1

1/5

1/5

Entradas CausaSalidas Efecto

Diagrama de InterrrelacionesDiagrama de Interrrelaciones Permite al equipo identificar y clasificar las relaciones

de causa y efecto que existe entre las variables

Communica-tion issueswithin the

group

Externalfactors impact

implemen-tation

Means notclearlydefined

Plan notintegrated

Fast newproduct

introductionsstretch

resources

Lack oftime andresources

No strongcommitmentto the group

Driver

Driver

Planningapproach not

standardized

Outcome

Capacitymay not

meet needs

In = 1 Out = 3

In = 3 Out = 2

In = 2 Out = 4

In = 1 Out = 2

In = 2 Out = 0

In = 0 Out = 5

In = 5 Out = 1

In = 0 Out = 2In = 5 Out = 0

¿Qué datos son necesarios para identificar las cuasas raíz?

35

Diagrama de árbol o sistemático

Meta Medio

Meta

Meta

MedioMedio

Meta u objetivo

Medioso planes

Medioso planes

Medios

MediosMedios

Primer nivel

Segundo nivel

Tercer nivel

Cuarto nivel

Implantar el Sistema SMED

Producto DJ 2702

¿Objetivo?

Preparación para el SMED

Fase 1: Separación de la preparación interna de la externa

Fase 2: Conversión de preparación interna en externa

Fase 3: Refinamientode todos los aspectos de la preparación.

Filmar la preparación

Analizar el video

Describir las tareas

Separar las tareas

Elaborar lista de chequeo

Realizar chequeo de funciones

Analizar el transporte de herramientas y materiales

Analizar las funciones y propósito de c/operación

Convertir tareas de prepa-ración interna a externas

Realización de operacionesen paralelo.

Uso de sujeciones funcionales.

Eliminación de ajustes

5- 12 - Mar-04

10 y 17 –Mar-04

17- Mar-04

17- Mar-04

2- Mar-04

24- Mar-04

24- Mar-04

12 - Abr- 04

15 –Abr - 04

5 –May -04

19– May -04

12- May -04

¿Qué?

¿Cómo? ¿Cuándo?

Elaboramos un Diagrama de Arbol para poder analizar nuestro problema siguiendo el sistema SMED.

Diagrama de Arbol- Aplicación Sistema SMED

19

37

Selección de posibles causas El equipo discute la lista de

causas de alta prioridad y decide cuáles son las más importantes (5 a 7).

El equipo se cuestiona lo siguiente:

¿Es una causa? (¿no una solución?)

¿Podemos hacer algo respecto a la causa?

¿Estamos seguros que ésta cambiará el efecto?

¿Estamos de acuerdo?

Causas

1. ________

2. ________

3. ________

4. ________

5. ________

38

Verificación de posibles causas

Para cada causa probable , el equipo deberá por medio del diagrama 5Ws – 1H:

Llevar a cabo una tormenta de ideas para verificar la causa.

Seleccionar la manera que:

represente la causa de forma efectiva, y

sea fácil y rápida de aplicar.

39

Calendario de las actividadesCalendario de las actividades

¿qué? ¿qué? ¿por qué?¿por qué? ¿cómo?¿cómo? ¿cuánd¿cuándo?o?

¿dónd¿dónde?e?

¿quién¿quién??

1 Tacogenerador de motor embobinador

1.1 Por variación de voltaje durante el ciclo de cambio

1.1.1 Tomar dimensiones de ensamble entre coples.1.1.2 Verificar estado actual y especificaciones de escobillas.1.1.3 tomar valores de voltaje de salida durante el ciclo de cambio.

Abril ’04

1804 Embob

.

J. R.

2 Sensor circular y de velocidad de linea.

2.1 Por que nos genera una varión en la señal de referencia hacia el control de velocidad del motor embobinador

2.1.1 Tomar dimensiones de la distancia entre poleas y sensores.2.1.2 Tomar valores de voltaje de salida de los sensores.2.1.3 Verificar estado de rodamientos de poleas.

Abril ’04

1804Embob

.

U. P.

3 Ejes principales de transmisión.

3.1 Por vibración excesiva durante el ciclo de cambio

3.1.1 Tomar lecturas de vibración en alojamientos de rodamientos3.1.2 Comparar valores de vibraciones con lecturas anteriores.3.1.3 Analizar valor lecturas de vibración tomadas.

Abril’04 1804 Embob

.

F. F.

4 Poleas de transmisión de ejes embobinadores.

4.1 Puede generar vibración excesiva durante el ciclo de cambio.

4.1.1 Verificar alineación, entre poleas de ejes principales y polea de transmisión del motor.4.1.2 Tomar dimensiones de poleas(dientes de transmisión).4.1.3 Tomar dimensiones de bandas (dientes de transmisión)4.1.4 Verificar valor de tensión de bandas.

Abril’04 1804 Embob

.

J. R.U. P.

40

Verificación de posibles causas

Antes de invertir tiempo y dinero en la implementación de una mejora para “contrarrestar” una causa, asegurarse que la causa sea real.

Estar completamente convencido que la causa es la verdadera culpable del efecto indeseable.

41

IV A 1. Estudios Multivari

42

Estudios Multivari La carta multivari permite analizar la variación

dentro de la pieza, de pieza a pieza o de tiempo en tiempo

Permite investigar la estabilidad de un proceso consiste de líneas verticales u otro esquema en función del tiempo. La longitud de la línea o del esquema representa el rango de valores encontrados en cada conjunto de muestras

43

Estudios Multivari La variación dentro de las muestras (cinco

puntos en cada línea). La variación de muestra a muestra como posición vertical de las líneas.

ESPESOR

Número de subgrupo

44

Estudios Multivari Ejemplo de parte metálica

Centro más grueso

45

Estudios Multivari Procedimiento de muestreo:

Seleccionar el proceso y la característica a investigar

Seleccionar tamaño de muestra y frecuencia de muestreo

Registrar en una hoja la hora y valores para conjunto de partes

46

Estudios Multivari Procedimiento de muestreo:

Realizar la carta Multivari Unir los valores observados con una línea

Analizar la carta para variación dentro de la parte, de parte a parte y sobre el tiempo

Puede ser necesario realizar estudios adicionales alrededor del área de máxima variación aparente

Después de la acción de mejora comprobar con otro estudio Multivari

47

Su propósito fundamental es reducir el gran número de causas posibles de variación, a un conjunto pequeño de causas que realmente influyen en la variabilidad.

Sirven para identificar el patrón principal de variación de entre tres patrones principales:

Temporal: Variación de hora a hora; turno a turno; día a día; semana a semana; etc.

Cíclico: Variación entre unidades de un mismo proceso; variación entre grupos de unidades; variación de lote a lote.

Cartas Multivari

48

Posicional: Variaciones dentro de una misma unidad

(ejemplo: porosidad en un molde de metal) o a través de una sola unidad con múltiples partes (circuito impreso).

Variaciones por la localización dentro de un proceso que produce múltiples unidades al mismo tiempo. Por ejemplo las diferentes cavidades de un molde

Variaciones de máquina a máquina; operador a operador; ó planta a planta

7A1. Cartas Multivari

49

Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el proceso tres o más veces a cierto intervalo de tiempo, hasta que al menos el 80% de la variación en el proceso se ha capturado.

A

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD

Cartas Multivari

50

Ejemplo: (cont...)

B

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD

Cartas Multivari

51

Ejemplo: (cont...)

C

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO

Cartas Multivari

52

Ejemplo: Un proceso produce flecha cilíndricas, con un diámetro especificado de 0.0250” 0.001”.

Sin embargo un estudio de capacidad muestra un Cp = 0.8 y una dispersión natural de 0.0025” (6 ) contra la permitida de 0.0002”.

Se tiene pensado comprar un torno nuevo de US$70,000 para tolerancia de 0.0008”, i.e. Cpk = 1.25. Se sugirió un estudio Multi Vari previo.

Cartas Multivari

53

Se tomaron cuatro lecturas en cada flecha, dos a cada lado. Estas muestran una disminución gradual desde el lado izquierdo al lado derecho de las flechas, además de excentricidad en cada lado de la flecha.

La variación cíclica, de una flecha a la siguiente, se muestra mediante las líneas que concentran las cuatro lecturas de cada flecha.

También se muestra la variación temporal.

Cartas Multivari

.0.2510”

0.2500”

0.2490”

Cartas Multivari

Máximo

Mínimo

Izquierda

Derecha

8 AM 9 AM 10 AM 11 AM 12 AM

55

Un análisis rápido revela que la mayor variación es temporal con un cambio mayor entre las 10 AM y las 11 AM.

A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM, con lecturas similares a las de las 8 AM. Conforme pasa el tiempo las lecturas tienden a decrecer más y más, hasta que se invierten a las 10 A.M. en forma drástica.

Se investigó y se encontró que la temperatura tenía influencia en la variación.

La variación en temperatura era causada por que la cantidad de refrigerante no era la adecuada, lo cual se notaba más cuando se paraba el equipo y se volvía a arrancar. Se adicionó, reduciendo la variación en 50% aproximadamente..

Cartas Multivari

56

También se encontró que el acabado cónico era causado por que la herramienta de corte estaba mal alineada. Se ajustó, contribuyendo a otra reducción del 10% de la variabilidad.

La excentricidad de las flechas se corrigió al cambiar un rodamiento excéntrico por desgaste en el torno. Se instaló un nuevo rodamiento eliminándose otro 30% de la variabilidad.

La tabla siguiente muestra un resumen de los resultados.

Cartas Multivari

57

Tipo de % var. Causas de Acción % de variación

Variación Total Variación Correctiva Reducida

Temporal 50 Bajo nivel de Adicionar Casi 50

Tiempo a tiempo Refrigerante refrigerante

Dentro de 10 Ajuste no Ajuste de la Casi 10

la flecha no paralelo herramienta de

corte

Dentro de 30 Rodamiento Nuevo Casi 30

la flecha gastado rodamiento

Flecha a 5 -??? - -

flecha

Cartas Multivari

58

Resultados: La variación total en la siguiente corrida de producción se redujo de 0.0025” a 0.0004”

El nuevo Cp fue de 0.002 / 0.0004 = 5.0

Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva máquina.

Se observa que antes de cambiar equipo o máquinas, es conveniente realizar un estudio de variabilidad para identificar las fuentes de variación y tratar de eliminarlas.

Cartas Multivari

59

Variación desist. medición

Variaciónde

proceso

Pieza apieza

Lote a loteDentro dela pieza

Máquina amáquina

Turno aturno

Tiempo atiempo

Diámetro de Flecha (0.150" +/- .002)

Programa Máquina Accesorios

Operador a operador

Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.

Cartas Multivari

60

Ejemplo (cont..):

• Al realizar la prueba de homogeneidad de varianza F, se encontró que había una diferencia significante entre los operadores.

Se Rechaza Ho: Oper1 =

Oper2 = Oper3

• Para probar si existe diferencia significativa entre medias de operadores se hacen las siguientes comparaciones

Ho: Oper1 = Oper2 Ho: Oper1 = Oper3

Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3

Cartas Multivari

61

Corrida en Minitab Se introducen los datos en varias columnas C1

a C3 incluyendo la respuesta (strenght) y los factores (time y Metal)

SinterTime MetalType Strength

0.5 15 23

0.5 15 20

0.5 15 21

0.5 18 22

0.5 18 19

0.5 18 20

0.5 21 19

0.5 21 18

62

Corrida en Minitab Utilizar el achivo de ejemplo Sinter.mtw

Opción: Stat > Quality Tools > Multivari charts

Indicar la columna de respuesta y las columnas de los factores

En opciones se puede poner un título y conectar las líneas

63

Resultados

211815

23.5

22.5

21.5

20.5

19.5

18.5

17.5

MetalType

Str

engt

h

0.5

1.0

2.0

Multi-Vari Chart for Strength by SinterTime - MetalType

SinterTime

64

IV.A.2 Regresión lineal simple

65

DefinicionesCorrelación

Establece si existe una relación entre las variables y responde a la pregunta, ”¿Qué tan evidente es esta relación?"

Regresión

Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información experimental u otra fuente disponible.

Regresión lineal simpleRegresión lineal múltipleRegresión no lineal cuadrática o cúbica

66

CorrelaciónPropósito: Estudiar la posible relación entre dos variables.

Propósito: Estudiar la posible relación entre dos variables.

Acc

iden

tes

labo

rale

s

Numero de órdenes urgentes

Correlación positiva, posible

•••

•• •

•• •

•••

••

•• • •

••

• •••

El 1er. paso es realizar una gráfica de la información.

Correlación de la información (R ) de las X y las Y

Correlación PositivaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Correlación NegativaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónPositiva

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónNegativa

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Sin Correlación

10

15

20

25

5 10 15 20 25

X

Y

0

5

0

R=1

R=>-1

R=-1

R=0

R=>1

Tabla de Correlación mínimaCorrelaciones (Pearson)

n 95% 99% de confianza de confianza 3 1.00 1.00 4 0.95 0.99 5 0.88 0.96 6 0.81 0.92 7 0.75 0.87 8 0.71 0.83 9 0.67 0.80 10 0.63 0.76 11 0.60 0.73 12 0.58 0.71 13 0.53 0.68 14 0.53 0.66

n 95% 99% de confianza de confianza15 0.51 0.6416 0.50 0.6117 0.48 0.6118 0.47 0.5919 0.46 0.5820 0.44 0.5622 0.42 0.5424 0.40 0.5226 0.39 0.5028 0.37 0.4830 0.36 0.46

Para un 95% de confianza, con una muestra de 10,el coeficiente (r) debe ser al menos .63

69

• La correlación puede usarse para información de atributos, variables normales y variables no normales.

• La correlación puede usarse con un “predictor” o más para una respuesta dada.

• La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada.

Correlación

70

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

Análisis de Regresión

71

Supuestos de la regresión lineal

Los principales supuestos que se hacen en el análisis de regresión lineal son los siguientes:

La relación entre las variables Y y X es lineal, o al menos bien aproximada por una línea recta.

El término de error tiene media cero.

El término de error tiene varianza constante 2.

Los errores no están correlacionados.

Los errores están normalmente distribuidos.

Xy 10

72

Modelo de regresión lineal Se aume que para cualquier valor de X el valor

observado de Y varia en forma aleatoria y tiene una distribución de probabilidad normal

El modelo general es: Y = Valor medio de Yi para Xi + error aleatorio

Xy 10

La línea de regresión se calcula por el método de mínimos cuadrados. Un residuo es la diferencia entre un punto de referencia en particular (xi, yi) y el modelo de predicción ( y = a + bx ). El modelo se define de tal manera que la suma de los cuadrados de los residuales es un mínimo. La suma residual de los cuadrados es llamada con frecuencia la suma de los cuadrados de los errores (SSE) acerca de la línea de regresión

•••

•• •

•• •

•••

••

•• • •

••

• •••

ei

xi

yi

SSE = ei2 = yi - yi

2

y = b0 + b1x

Regresión Lineal Simple

a y b son Estimados de0 y 1

74

Gráfica de la Línea de Ajuste

Recta de regresión

Y=-.600.858+5738.89XR2 = .895

Altura del muelle

Re

ten

ció

n

0.18 0.19 0.20

400

500

600

Regresión

95% Intervalode confianza

95% Intervalode predicción

75

Interpretación de los Resultados

El intervalo de predicción es el grado de certidumbre de la difusión de la Y estimada para puntos individuales X. En general, 95% de los puntos individuales (provenientes de la población sobre la que se basa la línea de regresión), se encontrarán dentro de la banda [Líneas azules]

La ecuación de regresión (Y = -600.858 + 5738.89X) describe la relación entre la variable predictora X y la respuesta de predicción Y.

R2 (coef. de determinación) es el porcentaje de variación explicado por la ecuación de regresión respecto a la variación total en el modelo

R2 (coef. de determinación) es el porcentaje de variación explicado por la ecuación de regresión respecto a la variación total en el modelo

El intervalo de confianza es una banda con un 95% de confianza de encontrar la Y media estimada para cada valor de X [Líneas rojas]

Interpretación de los Resultados

• Los valores “p” de la constante (intersección en Y) y las variables de predicción, se leen igual que en la prueba de hipótesis.

Ho: El factor no es significativo en la predicción de la respuesta.Ha: El factor es significativo en la predicción de la respuesta.

• s es el “error estándar de la predicción” = desviación estándar del error con respecto a la línea de regresión.

• R2 (ajustada) es el porcentaje de variación explicado por la regresión, ajustado por el número de términos en el modelo y por el número de puntos de información.

• El valor “p” para la regresión se usa para ver si el modelo completo de regresión es significativo. Ho: El modelo no es significativo en la predicción de la respuesta. Ha: El modelo es significativo en la predicción de la respuesta.

77

Errores residuales Los errores se denominan frecuentemente residuales.

Podemos observar en la gráfica de regresión los errores indicados por segmentos verticales.

78

Ejemplo

Considere el problema de predecir las ventas mensuales en función del costo de publicidad. Calcular el coeficiente de correlación, el de determinación y la recta.

MES Publicidad Ventas

1 1.2 1012 0.8 923 1.0 1104 1.3 1205 0.7 906 0.8 827 1.0 938 0.6 759 0.9 9110 1.1 105

79

Riesgos de la regresión Los modelos de regresión son válidos como ecuaciones

de interpolación sobre el rango de las variables utilizadas en el modelo. No pueden ser válidas para extrapolación fuera de este rango.

Mientras que todos los puntos tienen igual peso en la determinación de la recta, su pendiente está más influenciada por los valores extremos de X. 1.

Y *A

* * * * * Sin A y B * * * * *B X

80

Riesgos de la regresión Los outliers u observaciones aberrantes pueden

distorsionar seriamente el ajuste de mínimos cuadrados.

Si se encuentra que dos variables están relacionadas fuertemente, no implica que la relación sea casual, se debe investigar la relación causa – efecto entre ellas. Por ejemplo el número de enfermos mentales vs. número de licencias recibidas.

Y *A * * * * * *

* * * ** * ** * * * ** * *

X

81

Ejercicio

Calcular la recta de predicción con sus bandas de confianza, la correlación y la determinación para la respuesta de un Taxi, los datos se muestran a continuación:

Distancia Tiempo0.8 200 2.2 4001.0 1600.6 1201.0 3601.4 2802.2 5600.6 320

82

Regresión lineal múltiple

83

Regresión múltiple Cuando se usa más de una variable independiente para

predecir los valores de una variable dependiente, el proceso se llama análisis de regresión múltiple, incluye el uso de ecuaciones lineales.

Se asume que los errores u tienen las características siguientes:

Tienen media cero y varianza común 2. Son estadísticamente independientes. Están distribuidos en forma normal.

uukkuuu XXXY .......22110

84

Multicolinealidad Una prueba fácil de probar si hay multicolinealidad entre dos

variables es que su coeficiente de correlación sea mayor a 0.7

Los elementos de la diagonal principal de la matriz X’X se denominan Factores de inflación de varianza (VIFs) y se usan como un diagnóstico importante de multicolinealidad. Para el componente j – ésimo se tiene:

Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad.

21

1

jj R

VIF

85

Corrida en Minitab Se introducen los datos en varias columnas C1

a C5 incluyendo la respuesta Y (heatflux) y las variables predictoras X’s (North, South, East)

HeatFlux Insolation East South North

271.8 783.35 33.53 40.55 16.66

264.0 748.45 36.50 36.19 16.46

238.8 684.45 34.66 37.31 17.66

230.7 827.80 33.13 32.52 17.50

251.6 860.45 35.75 33.71 16.40

257.9 875.15 34.46 34.14 16.28

86

Corrida en Minitab Utilzar el archivo de ejemplo Exh_regr.mtw Opción: Stat > Regression > Regression Para regresión lineal indicar la columna de

respuesta Y (Score2) y X (Score1)

En Regresión lienal en opciones se puede poner un valor Xo para predecir la respuesta e intervalos. Las gráficas se obtienen Stat > Regression > Regression > Fitted line Plots

Para regresión múltiple Y (heatflux) y las columnas de los predictores (north, south, east)

87

Resultados de la regresión lineal

The regression equation is

Score2 = 1.12 + 0.218 Score1

Predictor Coef SE Coef T P

Constant 1.1177 0.1093 10.23 0.000

Score1 0.21767 0.01740 12.51 0.000

S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%

Analysis of Variance

Source DF SS MS F P

Regression 1 2.5419 2.5419 156.56 0.000

Residual Error 7 0.1136 0.0162

Total 8 2.6556

Predicted Values for New Observations

New Obs Fit SE Fit 95.0% CI 95.0% PI

1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)

New Obs Score1

1 7.00

88

Resultados de la regresión lineal

98765432

3.5

2.5

1.5

Score1

Sco

re2

S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %

Score2 = 1.11771 + 0.217670 Score1

95% PI

95% CI

Regression

Regression Plot

89

Resultados de la regresión Múltiple

The regression equation is

HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East

Predictor Coef SE Coef T P

Constant 389.17 66.09 5.89 0.000

North -24.132 1.869 -12.92 0.000

South 5.3185 0.9629 5.52 0.000

East 2.125 1.214 1.75 0.092

S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%

Analysis of Variance

Source DF SS MS F P

Regression 3 12833.9 4278.0 57.87 0.000

Residual Error 25 1848.1 73.9

Total 28 14681.9

Source DF Seq SS

North 1 10578.7

South 1 2028.9

East 1 226.3

90

• La regresión sólo puede utilizarse con información de variables continuas.

• Los residuos deben distribuirse normalmente con media cero.

• Importancia práctica: (R2). Importancia estadística: (valores p)

• La regresión puede usarse con un “predictor” X o más, para una respuesta dada

• Reduzca el modelo de regresión cuando sea posible, sin perder mucha importancia práctica

Resumen de la Regresión

91

IV.B Pruebas de hipótesis

92

IV.B. Pruebas de hipótesis

1. Conceptos fundamentales2. Pruebas para medias, varianzas y

proporciones

3. Pruebas pareadas de medias4. Análisis de varianza (ANOVA)

5. Tablas de contingencia6. Pruebas no paramétricas

93

IV.B.1 Conceptos fundamentales

94

Análisis Estadístico

En CADA prueba estadística, se comparan algunos valores observados a algunos esperados u otro valor observado comparando estimaciones de parámetros (media, desviación estándar, varianza)

Estas estimaciones de los VERDADEROS parámetros son obtenidos usando una muestra de datos y calculando los ESTADÏSTICOS...

La capacidad para detectar un diferencia entre lo que es observado y lo que es esperado depende del desarrollo de la muestra de datos

Incrementando el tamaño de la muestra mejora la estimación y tu confianza en las conclusiones estadísticas.

95

Conceptos fundamentales Hipótesis nula Ho

Es la hipótesis o afirmación a ser probada Puede ser por ejemplo , , , = 5 Sólo puede ser rechazada o no rechazada

Hipótesis alterna Ha Es la hipótesis que se acepta como verdadera cuando

se rechaza Ho, es su complemento Puede ser por ejemplo = 5 para prueba de dos colas < 5 para prueba de cola izquierda > 5 para prueba de cola derecha Esta hipótesis se acepta cuando se rechaza Ho

96

Conceptos fundamentales Ejemplos:

Se está investigando si una semilla modificada proporciona una mayor rendimiento por hectárea, la hipótesis nula de dos colas asumirá que los rendimientos no cambian Ho: Ya = Yb

Se trata de probar si el promedio del proceso A es mayor que el promedio del proceso B. La hipótesis nula de cola derecha establecerá que el proceso A es <= Proceso B. O sea Ho: A <= B.

97

Conceptos fundamentales Estadístico de prueba

Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho

Error tipo I (alfa = nivel de significancia, normal=.05)

Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor

Error tipo II (beta ) Se comete cuando no se rechaza la hipótesis nula

siendo en realidad falsa. Es el riesgo del consumidor

98

Conceptos fundamentales Tipos de errores

Se asume que un valor pequeño para es deseable, sin embargo esto incrementa el riesgo .

Para un mismo tamaño de muestra n ambos varían inversamente

Incrementando el tamaño de muestra se pueden reducir ambos riesgos.

Decisión realizada Ho en realidad es Verdadera

Ho en realidad es falsa

No hay evidencia para rechazar Ho

p = 1-Decisión correcta

p = Error tipo II

Rechazar Ho p = Error tipo I

p = 1 - Decisión correcta

99

Conceptos fundamentales Pruebas de dos colas

Si la Ho: , , , = cte. que un valor poblacional, entonces el riesgo alfa se reparte en ambos extremos de la distribución. Por ejemplo si Ho = 10 se tiene:

P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2

100

Conceptos fundamentales Pruebas de una cola

Si la Ho: , , , >= Cte. que un valor poblacional, entonces el riesgo alfa se coloca en la cola izquierda de la distribución. Por ejemplo si Ho: >= 10 y Ha: < 10 se tiene una prueba de cola izquierda:

P(Z <= - Zexcel ) = alfa

101

Conceptos fundamentales Pruebas de una cola

Si la Ho: , , , <= Cte. que un valor poblacional, entonces el riesgo alfa se coloca en la cola derecha de la distribución. Por ejemplo si Ho: <= 10 y Ha: > 10 se tiene una prueba de cola derecha:

P(Z>= + Zexcel ) = alfa

102

Conceptos fundamentales Tamaño de muestra requerido

Normalmente se determina el error alfa y beta deseado y después se calcula el tamaño de muestra necesario para obtener el intervalo de confianza.

El tamaño de muestra (n) necesario para la prueba de hipótesis depende de:

El riesgo deseado tipo I alfa y tipo II Beta El valor mínimo a ser detectado entre las

medias de la población (Mu – Mu0) La variación en la característica que se mide (S

o sigma)

103

Conceptos fundamentales El Tamaño de muestra requerido en función

del error máximo E o Delta P intervalo proporcional esperado se determina como sigue:

2 2/ 22

2/ 2

2

( )(1 )

( )

Zn

E

Z p pn

p

2

22/

2

222/

)(

)1)((

)(

p

Zn

X

Zn

104

Conceptos fundamentales Ejemplo:

¿Cuál es el tamaño de muestra mínimo que al 95% de nivel de confianza (Z=1.96) confirma la significancia de una corrida en la media mayor a 4 toneladas/hora (E), si la desviación estándar (sigma) es de 20 toneladas?

n = (1.96^2)(20^2)/(4)^2 = 96

Obtener 96 valores de rendimiento por hora y determinar el promedio, si se desvía por más de 4 toneladas, ya ha ocurrido un cambio significativo al 95% de nivel de confianza

105

Pruebas de Minitab Permite hacer las siguientes pruebas:

Prueba z de una muestra Prueba t de una muestra Prueba t de dos muestras Prueba de 1 proporción Prueba de 2 proporciones

ANOVA Diseños factoriales de dos niveles Diseños de Packett Burman

106

Estimación puntual y por intervalo

107

7B2. Estimación puntual y por intervalo

Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS.

¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa podríamos obtener como margen, algún tipo de error?

“Un Intervalo de Confianza”

108

Intervalo de confianza

P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2

Intervalo de confianza donde se encuentra el parámetro con un NC =1-

Error de estimación

109

Estimación puntual y por intervalo

¿Cómo obtenemos un intervalo de confianza?

Estimación puntual + error de estimación

¿De dónde viene el error de estimación?

Desv. estándar X multiplicador de nivel de confianza deseado Z/2

Por Ejemplo: Si la media de la muestra es 100 y la desviación estándar es 10, el intervalo de confianza al 95% donde se encuentra la media para una distribución normal es:

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z0.025

110

Estimación puntual y por intervalo

95% de Nivel de Confianza significa que sólo tenemos un 5% de oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos que para un área de 0.025, corresponde a una Z de 1.960.

C. I. Multiplicador Z/2 99 2.576

95 1.960

90 1.64585 1.43980 1.282

Para tamaños de muestra >30, o conocida usar la distribución Normal

Para muestras de menor tamaño, o desconocida usar la distribución t

111

Estimación puntual y por intervalo

. 30

2

. 30

2

2 22

2 2

, 1 1 , 12 2

2

( 1) ( 1)

(1 )

para n

para n

n n

X Zn

X tn

n s n s

p pp Z

n

; con n-1 gl.

112

Instrucciones con MinitabIntervalo de confianza para la

media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

Indicar el Confidence level -- 90, 95 o 99%

OK

113

Instrucciones con MinitabIntervalo de confianza para

proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamaño de la muestraNumber of events = D éxitos encontrados en la muestra

En Options:Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution

114

Para n grande el IC es pequeño

115

Ejemplo Dadas las siguientes resistencias a la tensión:

28.7, 27.9, 29.2 y 26.5 psi

Estimar la media puntualX media = 28.08 con S = 1.02

Estimar el intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3 grados de libertad)Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)

116

Ejemplos para la media con Distribución normal Z

Z 1. El peso promedio de una muestra de 50 bultos de productos Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional). Alfa = 1 - NC2. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio oscila entre 0.93 y 1.73 onzas. ¿Cuál es el valor de Z?.3. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de confianza del 95%, las latas parecen estar llenas con 16 onzas?.4. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la solución si el peso promedio de todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de confianza?.

117

Ejemplos para la media y varianza con Distribución t

t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál es el intervalo donde se encuentra la media y varianza del lote para un 90% de nivel de confianza?. Grados libertad=20 -1 =19

6. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de confianza para la media y varianza a un nivel de confianza del 95 y del 98% del peso de productos del lote completo?.

7. Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% paraestimar el peso promedio y la varianza de todos los paquetes. Los pesos de los paquetes se distribuyen normalmente.

118

Ejemplos para proporciones con Distribución Z

Z 8. De 814 encuestados 562 contestaron en forma afirmativa. ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los empleados ¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el intervalo de confianza. ?

119

IV.B.2b Pruebas de hipótesis para media, varianza y

proporción

120

Elementos de una Prueba de Hipótesis

Prueba Estadística- Procedimiento para decidir no rechazar Ho aceptando Ha o rechazar Ho.

Hipótesis Nula (Ho) - Usualmente es una afirmación representando una situación “status quo”. Generalmente deseamos rechazar la hipótesis nula.

Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar la hipótesis nula. Ha es lo que queremos probar.

121

Elementos de una Prueba de Hipótesis

Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2 or F).

Región de Rechazo Indica los valores de la prueba estadística para que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada en un riesgo deseado, normalmente 0.05 o 5%.

122

Pasos en la Prueba de Hipótesis

1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

123

Pasos en la Prueba de Hipótesis

5. Establecer las Hipótesis

- Hipótesis Nula (Ho) - Siempre tiene el signo =, ,

- Hipótesis Alterna (Ha) – Tiene signos , > o <.

El signo de la hipótesis alterna indica el tipo de prueba a usar

hipotesisladeparametroHo ,,,,: 2

hipotesisladeparametroHa ,,,,: 2

124

Pasos en la Prueba de Hipótesis

6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el nivel de confianza NC = 1 - alfa

7. Establecer el tamaño de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadística apropiada y calcular el estadístico de prueba (Z, t, X2 or F) a partir de los datos.

125

Estadísticos para medias, varianzas y proporciones

21

1 222

1 2

1 2

2 21 1 2 2

11 2

; . ; 30;/

; . ; 30;/

; 1, 1; . .var

; . ; ' . .1 1

/

( 1) ( 1);

2

p

p

XZ Una media n conocida

n

Xt Una media n desconocida

S n

SF DF n n prueba dos ianzas

S

X Xt dos medias s desconocidas pero

Sn n

n s n sS DF n

n n

2

1 2

2 21 2

1 2

2

; . ; ' .

.

n

X Xt dos medias s desconocidas diferentes

s s

n n

DF formula especial

126

Estadísticos para medias, varianzas y proporciones

Para el caso de muestras pareadas se calculan las diferencias d individuales como sigue:

22

2

22

; . . ; . . ./

( 1); ( 1); . . ar

( ); ( 1)( 1); .

i

d

dt Pares de medias d para cada par

S n

n SX DF n prueba una v ianza

O EX DF r c bondad ajuste

E

127

Pasos en la Prueba de Hipótesis

11. Obtener el estadístico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadístico de prueba calculado ocurre al azar.

13.Comparar el estadístico calculado con el de tablas y ver si cae en la región de rechazo o ver si la probabilidad es menor a alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusión estadística para la solución práctica.

Prueba de Hipótesis

Pruebas de Hipótesis de dos colas: Ho: a = bHa: a b

Pruebas de Hipótesis de cola derecha: Ho: a bHa: a > b

Pruebas de Hipótesis cola izquierda: Ho: a bHa: a < b

Z0-Z

Región de Rechazo

Región de Rechazo

Z0

Región de Rechazo

Z0-Z

Región de Rechazo

Estadístico Calculado conDatos de la muestra

129

Prueba de hipótesis para la varianza

Las varianzas de la población se ditribuyen de acuerdo a la distribución Chi Cuadrada. Por tanto las inferencias acerca de la varianza poblacional se basarán en este estadístico

La distribución Chi Cuadrada se utiliza en:Caso I. Comparación de varianzas cuando la

varianza de la población es conocida

Caso II. Comparando frecuencias observadas y esperadas de resultados de pruebas cuando no hay una varianza de la población definida (datos por atributos)

130

Prueba de hipótesis para la varianza

Las pruebas de hipótesis para comparar una varianza poblacional a un cierto valor constante 0, si la población sigue la distribución normal es:

Con el estadístico Chi Cuadrada con n-1 grados de libertad

131

Prueba de hipótesis para la varianza

Ejemplo: ¿El material muestra una variación (sigma) en la resistencia a la tensión menor o igual a 15 psi con 95% de confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe

rechazar la hipótesis nula. Si hay decremento en la resistencia

2.17

132

Prueba de hipótesis para atributos

Ejemplo: Un supervisor quiere evaluar la habilidad de 3 inspectores para detectar radios en el equipaje en un aeropuerto.

¿Hay diferencias significativas para un 95% de confianza?

Valores observados O

Inspector 1

Inspector 2

Inspector 3

Total por tratamiento

Radios detectados

27 25 22 74

Radios no detectados

3 5 8 16

Total de la muestra

30 30 30 90

133

Prueba de hipótesis para atributos

Ho: p1 = p2 = p3Ha: p1 p2 p3Grados de libertad = (No. de columnas -1)*(No. renglones -1)Las frecuencias esperadas son: (Total columna x Total renglón)

Valores esperados E

Inspector 1

Inspector 2

Inspector 3

Total por tratamiento

Radios detectados

24.67 24.67 24.67 74

Radios no detectados

5.33 5.33 5.33 16

Total de la muestra

30 30 30 90

134

Prueba de hipótesis para atributos

El estadístico Chi Cuadrado en este caso es:

El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de libertad es 5.99.El estadístico Chi Cuadrada calculada es menor que Chi de alfa, por lo que no se rechaza Ho y las habilidades son similares

5.99

Para una muestra grande (n>30)probar la hipótesis de una media u1.) Ho:

2.) Ha:

3.) Calcular el estadístico de prueba4.) Establecer la región de rechazo Las regiones de rechazo para prueba de 2 colas: -Z Z

sn

Zcalc=

Si el valor del estadístico de prueba cae en la región de rechazo rechazaremos Ho de otra manera no podemos rechazar Ho.

0

-Z

Región de Rechazo

Región de Rechazo

Ejemplo de Prueba de hipótesis para la media

136

Prueba de hipótesis de una población para muestras

grandes con Z¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?Probarlo a un 5% de nivel de significancia

DatosMinoristas n 64 media mu = 2100Precio prom. X 2251Desv. Estándar s 812 (Alfa = 0.05Paso 1. Establecimiento de hipótesis

Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula

Ha: uC <> 2100 Por tanto se trata de una prueba de dos colasPaso 2. Cálculo del estadístico de prueba Zc

151 = > Zc = 1.48768473

101.5 Error estándar

Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivoPaso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):

Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 )

n

sX

Z NULAHIPOTESISc

.

137

Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

Zexcel ( #¡REF! ) Zexcel ( -0.025 )-1.95996398 1.959963985

Zc = 1.487684729

Como Zc es menor que Zexcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para RECHAZAR Ho

Se concluye que el precio promedio no es diferente de $2,100O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor

que el valor de Alfa / 2 = 0.025, también nos da el criterio para NO RECHAZAR la Ho

Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)al nivel de confianza 1-Alfa

Error estándar 101.5Z alfa/2 1.95996398

Intervalo de confianza 2251 198.936344

El intervalo de confianza incluye a la media de la hipótesis

por tanto no se rechaza la Ho. 2052.064 <= <= ### )

P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2

n

sZXestimarparaIC

2...

138

Prueba de hipótesis de una población para muestras

pequeñas con t

Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitariaProbar esta afirmación a un nivel de significancia alfa de 1%

Se inicia con el planteamiento de la hipótesis AlternaDatos

Semanas n 15 media mu = 5775Ventas prom X 6012Desv. Estándar s 977 (Alfa = 0.01 (1-Alfa = 0.99

(Alfa/2 = 0.005 (1-Alfa/2 = 0.995Paso 1. Establecimiento de hipótesis

Ho: uC <= 5775

Ha: uV > 5775 Se trata de una prueba de cola derechaPaso 2. Cálculo del estadístico de prueba tc

237 = > tc = 0.93950568

252.2603153 Error estándarNOTA:En excel poner 2alfa para obtener t de alfa

Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivoPaso 3. Determinar la te de Excel o de tablas para Alfa 0.01

te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )

n

sX

t NULAHIPOTESISc

.

Gl=14;

139

Paso 4. Comparando los valores tc calculado contra t excel se tiene

texcel ( 0.02 gl. 14)2.62449406

tc = 0.939505684 Valor p para tc es igual aP(tc) = 0.368130427

Como tc es menor que texcel, no cae en el área de rechazo, p > Alfa

y por tanto no hay suficiente evidencia para rechazar Ho

Se concluye que la publicidad no ha tenido efecto en las ventas O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza HoPaso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)

Error estándar 252.260315Z alfa/2 2.62449406

Como el intervalo de confianza Intervalo de confianza 6012 662.0557002

contiene a la media Hipótesis no se rechaza Ho 5349.94 <= <= 6674.06 )

P(t >= + t excel ) = alfa

n

stXestimarparaIC

2...

140

Instrucciones con Minitab para laprueba de hipótesis de una

media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hipótesis Test Mean

En Options:Indicar el Confidence Interval -- 90, 95 o 99%

Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than

OK

141

Prueba de hipótesis para una proporción con Z

El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?

Se inicia con el planteamiento de la hipótesis nulaDatos

Clientes n 50 Proporción media = 0.530 gastaron p 0.6menos de$10 (Alfa = 0.05 (1-Alfa = 0.95

(Alfa/2 = 0.025 (1-Alfa/2 = 0.975Paso 1. Establecimiento de hipótesis

Se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba Zc

0.1 = > Zc = 1.41421356

0.07071068 Error estándar

Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo

Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975

Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 )

n

pZ

NULAHIPNULAHIP

NULAHIPOTESISc

)1( ..

.

5.0:

5.0:

c

c

Ha

Ho

142

Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

Zexcel ( 0.025 ) Zexcel ( 0.975 )-1.95996398 1.95996398

Zc = 1.41421356 Valor p para Zc es igual aP(-Zc) = 0.07926984

Como Zc es menor que Zexcel, no cae en el área de rechazo, p > Alfa /2

y por tanto no hay suficiente evidencia para rechazar Ho y se concluyeque el porcentaje que compra menos de $10 no difiere del 50% de clientesO Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza HoPaso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)

Error estándar 0.07071068Z alfa/2 1.41421356

Intervalo de confianza 0.6 0.1

Como la media de p = 0.6 se encuentra

dentro del intervalo, no se rechaza Ho ( 0.5 <= 0.7 )

P(Z <= - Zexcel ) = alfa/2 P(Z>= Zexcel ) = alfa/2

n

ppZpestimarparaIC

)1(...

2

143

Instrucciones con Minitab para laprueba de hipótesis de una

proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamaño de la muestraNumber of events = D éxitos encontrados en la muestra

En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la Test Proportion Proporción de la hipótesisIndicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than

Seleccionar Use test and interval based in normal distribution

OK

144

IV.B.2b Pruebas de hipótesis para comparación de varianzas,

medias, y proporciones

Prueba de Hipótesis Supongamos que tenemos muestras de dos reactores

que producen el mismo artículo. Se desea ver si hay diferencia significativa en el rendimiento de “Reactor a Reactor”. Reactor A Reactor B

89.7 84.7

81.4 86.1

84.5 83.2

84.8 91.9

87.3 86.3

79.7 79.3

85.1 82.6

81.7 89.1

83.7 83.7

84.5 88.5

Estadísticas Descriptivas

Variable Reactor N Media Desv.Std

Rendimiento A 10 84.24 2.90

B 10 85.54 3.65

146

Prueba de HipótesisPregunta Práctica: Existe diferencia entre los

reactores?

Pregunta estadística ¿La media del Reactor B (85.54) es significativamente diferente de la media del Reactor A (84.24)? O, su diferencia se da por casualidad en una variación de día a día.

Ho:

Ha: a

a

b

b

Ho: Hipótesis Estadística: No existe diferencia entre los Reactores

Ha: Hipótesis Alterna: Las medias de los Reactores son diferentes.

Se busca demostrar que los valores observados al parecer no corresponden al mismo proceso, se trata de rechazar Ho.

147

Prueba de Hipótesis

Hipótesis Alterna: Cuando las medias de Reactores son diferentes. A esto se le llama Hipótesis Alterna (Ha)

Hipótesis Estadística: No existe diferencia entre los Reactores

Esto se llama Hipótesis Nula (Ho)

Debemos demostrar que los valores que observamos al parecer no corresponden al mismo proceso, que la Ho debe estar equivocada

148

¿Qué representa esto?

Reactor A Reactor B

80.0 82.5 85.0 87.5 90.0 92.5

A AA AAAA A AB B B B B BB B B B

¿Representan los reactores un proceso básico?

¿Representan los reactores dos procesos diferentes?

149

Prueba F de dos varianzas Si se toman dos muestras de dos poblaciones normales

con varianzas iguales, la razón de sus varianzas crea una distribución muestral F. Las hipótesis son las siguientes:

El estadístico F se muestra a continuación donde S1 se acostumbra tomar como la mayor

150

Prueba F de dos varianzas

Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de confianza se puede concluir que hay menor variación?

Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2

Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza

Ho. Hay evidencia suficiente para indicar que la variación ya se

ha reducido

151

Prueba de hipótesis de dos pob. comparando varianzas con F

Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .A un nivel de siginificancia del 5% ¿Qué se puede concluir?

Método 1 Método 2No. De CDs n1 15 n2 17 Alfa/2 0.025Desv. Estan. s1 5.4 X2 4.8Varianza s12 29.16 s22 23.04

Paso 1. Establecimiento de hipótesis

Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba FcGrados de libertad

1.266 Numerador = n1 - 1 = 14Denominador = n2 - 1 = 16

Tomamos a s12 como el mayor para comparar Fc contra Fexcel (1- Alfa/2)

Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025

Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16)

22

21

22

21

:

:

Ha

Ho

22

21

s

sFc

152

Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene

f(F)

Fe(0.025) = 2.81701784

Fc = 1.266 Valor p para Fc es igual aP(Fc) = 0.32259599

Como Fc es menor que Fexcel, no cae en el área de rechazo, p > Alfa / 2

y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que la varianza de los dos métodos de ensamble no difierensignificativamente

P(F>= + 2.81 ) = alfa/2

153

Instrucciones con Minitab para lacomparación de dos varianzas

Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data

First-- Indicar la columna de datos de la muestra 1Second- Indicar la columna de datos de la muestra 2

En Options:Indicar el Confidence Interval -- 90, 95 o 99%

OK

154

Prueba de hipótesis de dos pob. Comparando dos medias con Z

Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacasLas varianzas poblacionales son desconocidasDeterminar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10

Vacas vacaciones Vacas normalesVacas n1 50 n2 50Peso promedio X1 112 X2 105.7Desv. Estándar s1 32.3 s2 28.7

Paso 1. Establecimiento de hipótesis

Como el planteamiento es que las vacas de vacaciones ganan más peso, se inicia planeando la Ha

Paso 2. Cálculo del estadístico de prueba Zc

6.3 = > Zc = 1.03099301

6.110613717

Tomamos a X1 como el mayor para comparar Zc contra Ze positiva

Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1

Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90)

21

32

21

21

n

s

n

s

XXZ c

VNVV

VNVV

Ha

Ho

:

:

155

Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene

Ze (0.90)= 1.28Zc = 1.03099301 Valor p para Zc es igual a

P(-Zc) = 0.149402368 p > Alfa

Como Zc es menor que Zexcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para rechazar Ho

Se concluye que no hay diferencia entre vacas de vacaciones y normalesPaso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,

con sigmas desconocidas es:

= Error estándar 6.11061372 Z (alfa/2) = 1.64485363

= Intervalo de confianza6.3 + - 10.05106514

La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )

P(Z>= + 1.28) = 0.90

21

22

21

21 n

s

n

sXX

212/21 )( XXsZXX

156

Prueba de dos mediasmuestras pequeñas

Sigmas descono-cidas e iguales

Sigmas desconocidasy desiguales

157

Prueba de hipótesis de dos pob. Comparando dos medias con t

Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendasLas varianzas de las dos poblaciones son iguales pero desconocidasDeterminar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)

Tienda 1 Tienda 2Semanas n1 12 n2 15Ventas promedio X1 125.4 X2 117.2Desv. Estandar s1 34.5 s2 21.5

Paso 1. Establecimiento de hipótesis

Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba tc

19564.25 Sp2 = 782.57

25

8.2 = > tc = 0.75684444

10.8344589

Tomamos a X1 como el mayor para comparar tc contra te positiva Si se toma a X1 como la media menor se debe comparar Zc contra -Ze

Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005Se tienen n1 + n2 - 2 grados de libertad o sean 25te (0.01) = 2.78743581 DIST.T.INV (0.01, 25) Asi es para dos colas

221

)12()11( 22

212

nn

nsnss p

21

32

21

n

s

n

s

XXt

pp

c

22

21

21

21

:

:

TT

TT

Ha

Ho

158

Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene

te(0.01,25) = -2.787 te(0.01, 25) = 2.787Valor p para tc es igual a

tc = 0.7568 P(tc) = 0.46025521 p > Alfa / 2

Como tc es menor que texcel, no cae en el área de rechazo, y por tanto no hay suficiente evidencia para rechazar Ho Se concluye que no hay diferencia sig. En las ventas de las dos tiendas

Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales, con sigmas desconocidas es:

= Error estándar 10.8344589

= Intervalo de confianza (8.2 + - 2.787*10.83)

Se observa una diferencia positiva sin embargo el cero está incluido ( -21.98 <= u <= 38.38)

P(t>=2.787 ) = alfa/2P(t<=-2.787 ) = alfa/2

21)(

22

2/21n

s

n

stXX pp

21

22

n

s

n

s pp

159

Instrucciones con Minitab para lacomparación de dos medias

Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized dataFirst-- Indicar la columna de datos de la muestra 1Second- Indicar la columna de datos de la muestra 2Seleccionar o no seleccionar Assume equal variances de acuerdo

a los resultados de la prueba de igualdad de varianzas

En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la diferencia a probar Test Difference (normalmente 0)Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than

En graphs seleccionar las graficas Boxplot e Individual value plotOK

160

Prueba de hipótesis de dos pob. Comparando dos proporciones

con ZInvestigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los bonos de ingresos.Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.

Convertibles IngresosBonos n1 312 n2 205 Alfa 0.1Sobrevalorad X1 202 X2 102 1-Alfa 0.9 7.8 p1 0.647 p2 0.498 Fracción de las muestrasPaso 1. Establecimiento de hipótesis

Por tanto se trata de una prueba de cola derecha

Paso 2. Cálculo del estadístico de prueba Zc0.150 = > Zc = 3.393046759

0.04417119

Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9

Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)

2

)1(

1

)1( 2211

21

n

pp

n

pp

ppZ c

2121

2121

:..........................0:

:.........0:

HaHa

HoformaotraHo

161

Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene

Zc = 3.39304676

Ze(0.9) = 1.281551566Valor p para Zc es igual aP(-Zc) = 0.00034946

p < Alfa

Como Zc es mayo que Zexcel, si cae en el área de rechazo, y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha Se concluye que la diferencia en conv. entre los bonos es significativa

Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales, con sigmas desconocidas es:

= Error estándar 0.044171193Zexcel (para alfa/2) 1.644853627

= Intervalo de confianza ( 0.150 0.07265515

Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223el cero no está incluido en el intervalo

P(Z>= + 1.28 ) = Alfa

2

)1(

1

)1( 221121 n

pp

n

pps pp

212/21 )( ppsZpp

162

Instrucciones con Minitab para laprueba de hipótesis de dos

proporciones

Stat > Basic Statistics > 2-ProportionsSeleccionar Summarized Data

Trials: Events:First: No. de elementos de la 1ª. Muestra y D1 éxitos

encontradosSecond: No. de elementos de la 2ª. Muestra y D2 éxitos

encontrados

En Options:Indicar el Confidence Interval -- 90, 95 o 99%Indicar la Test Difference Normalmente 0Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than

Seleccionar Use pooled estimate of p for testOK

163

IV.B.3 Prueba de datos pareados

164

Prueba de hipótesis de dos pob. Comparando datos pareados con

tLas muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.Paso 1. Establecimiento de Hipótesis

No. Pares de muestras n = 25Paso 2. Se calcula el estadístico tc: Diferencia media = 45.2

Desv. Estándar de difs. = 21.6Alfa 0.05

gl = 24= 10.462963

Paso 3. Se determina el valor crítico del estadístico t de Excel o tablas para Alfa / 2 0.025

t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas

21

21

:

:

Ha

Ho

n

sd

td

c

Grados de libertad = No. de pares - 1

165

Paso 4. Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:tc = 10.462963

te(0.025,24) = -2.063 te(0.025, 24) = 2.063Valor p para tc es igual aP(t > tc) = 0

p < Alfa / 2

Como tc es mayor que t excel, si cae en el área de rechazo, y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Hase concluye que si hay diferencia significativa entre las medias

Paso 5. El intervalo de confianza para las diferencias en medias pareadas es t alfa/2 = 2.063Error estándar = 0.864Dif. Promedio = 45.2

45.2 + - 0.864

Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824

P(t>=2.063 ) = alfa/2P(t<=-2.063 ) = alfa/2

n

stdparaCI d

d 2/...

166

Instrucciones con Minitab para lacomparación de dos medias

pareadas

Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized dataFirst sample - Indicar la columna de datos de la muestra 1Second sample - Indicar la columna de datos de la muestra

2En Options:

Indicar el Confidence Interval -- 90, 95 o 99%Indicar la diferencia a probar Test Mean (normalmente 0)Indicar el signo de la hipótesis alterna: Less Than, Not equal, Greater than

En graphs seleccionar las graficas Boxplot e Individual value plot

OK

167

Robustez Los procedimientos estadísticos se basan en

supuestos acerca de su comportamiento teórico. Cuando los estadísticos obtenidos no son afectados por desviaciones moderadas de su expectativa teórica, se dice que son robustos.

168

Resumen

169

IV.B:4 ANOVA para un factor

170

Introducción Cuando es necesario comparar 2 o más medias

poblacionales al mismo tiempo, para lo cual se usa ANOVA.

El método ANOVA tiene los siguientes supuestos: La varianza es la misma para todos los tratamientos

del factor en todos sus niveles Las mediciones indiviudales dentro de cada

tratamiento se distribuyen normalmente El término de error tiene un efecto distribuido

normalmente e independiente

171

Introducción Con el ANOVA las variaciones en la respuesta se

dividen en componentes que reflejan los efectos de una o más variables independientes

La variabilidad se representa como la suma de cuadrados total que es la suma de cuadrados de las desviaciones de mediciones individuales respecto a la gran media, se divide en:

Suma de cuadrados de las medias de los tratamientos

Suma de cuadrados del residuo o error experimental

172

ANOVA – Prueba de hipótesis para probar la igualdad de

medias de varias poblaciones para un factor

diferentessonsunasAHa

Ho a

..'.lg:

.........: 321

Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un proceso o sistema es Significativo, al realizar experimentos variando Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)

173

ANOVA - Condiciones Todas las poblaciones son normales

Todas las poblaciones tiene la misma varianza

Los errores son independientes con distribución normal de media cero

La varianza se mantiene constante para todos los niveles del factor

174

ANOVA – Ejemplo de datos

Niveles del Factor Peso % de algodón y Resistencia de tela

Peso porc. Respuestade algodón Resistencia de la tela

15 7 7 15 11 920 12 17 12 18 1825 14 18 18 19 1930 19 25 22 19 2335 7 10 11 15 11

175

ANOVA – Suma de cuadrados total

Xij

Xij

Gran media

2

11

)(

b

j

a

i

XXijSCT

176

ANOVA – Suma de cuadrados de renglones (a)-

tratamientos

Gran media

Media Trat. 1 Media Trat. a

Media trat. 2

a renglones

a

i

i XXbSCTr1

2)(

177

ANOVA – Suma de cuadrados

del error

Media X1.

X1jX3jX2j

Media X2.Media X3.

Muestra 1 Muestra 2 Muestra 3

2

11

)( i

b

jij

a

i

XXSCE

178

ANOVA – Suma de cuadrados

del error

Media X1.

X1jX3jX2j

Media X2.Media X3.

Muestra 1 Muestra 2 Muestra 3

SCTrSCTSCE

179

ANOVA – Grados de libertad: Totales, Tratamientos, Error

ananSCEgl

aSCTrgl

nSCTgl

)1()1(.

1.

1.

180

ANOVA – Cuadrados medios: Total, Tratamiento y Error

)/(

)1/(

)1/(

anSCEMCE

aSCTrMCTr

nSCTMCT

181

ANOVA – Cálculo del estadístico Fc y Fexcel

SCEglSCTrglALFAFINVFexcelMCEMCTr

Fc

.,.,

182

Tabla final de ANOVATABLA DE ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME

Dentro de muestras (error) SCE n-a CME

Variación total SCT n-1 CMT

Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfao si el valor p correspondiente a la Fc es menor al valor de alfa especificado

183

ANOVA – Toma de decisión

Fexcel

Fc

Alfa

Zona de rechazoDe Ho o aceptar Ha

Zona de no rechazo de HoO de no aceptar Ha

Distribución F

184

ANOVA – Toma de decisión

Si Fc es mayor que Fexcel se rechaza HoAceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es menor de Alfa se rechaza Ho

185

ANOVA – Identificar las medias diferentes por Prueba

de Tukey T

Para diseños balanceado (mismo número de columnas en los tratamientos) el valor de q se determina por medio de la tabla en el libro de texto

bCME

qT ana ,,

186

ANOVA – Identificar las medias diferentes por Prueba

de Tukey T

Se calcula la diferencia Di entre cada par de Medias Xi’s:

D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.

Cada una de las diferencias Di se comparan con elvalor de T, si lo exceden entonces la diferencia es Significativa de otra forma se considera que las mediasSon iguales

187

ANOVA – Identificar las medias diferentes por Prueba de

Diferencia Mínima Significativa DMS

Para diseños balanceados (los tratamientos tienen igual no. De columnas), se calcula un factor DMS contra el que se comparan las diferencias Xi – Xi’. Significativas si lo exceden

b

FCMEDMS an ,1,)(2

188

Prueba DMS para Diseños no balanceados

anakj

kj FCMEbb

DMS

,1,, )(

11

Para diseños no balanceados (los tratamientos tienen diferente no. De columnas), se calcula un factor DMSPara cada una de las diferencias Xi – Xi’

189

Ejemplo: Considerar un experimento de un factor

(máquina) con tres niveles (máquinas A, B, C). Los datos se muestran a continuación y debe verificarse si existe diferencia significativa a un alfa = 0.05

Máquinas

Datos Suma

Prom.

190

Ejemplo:

Como el valor calculado de F(33.2) excede el valor crítico de F, se rechaza la Hipótesis nula Ho

La tabla completa de ANOVA es la siguientes:

FuentesDe variación

Máquinas

Cuadrado medio

191

Ejemplo: Con Minitab: Stat>ANOVA>One way unstacked Responses (in separate columns) A B C Interpretar los resultados

A B C

5 2 1

7 0 0

6 1 -2

7 -2 -3

6 2 0

192

Ejemplo:

One-way ANOVA: A, B, C

Source DF SS MS F P

Factor 2 137.20 68.60 33.19 0.000 Rechazo Ho

Error 12 24.80 2.07

Total 14 162.00

S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%

Individual 95% CIs For Mean Based on

Pooled StDev

Level N Mean StDev ---------+---------+---------+---------+

A 5 6.200 0.837 (-----*----)

B 5 0.600 1.673 (----*-----)

C 5 -0.800 1.643 (-----*----)

---------+---------+---------+---------+

0.0 2.5 5.0 7.5

Pooled StDev = 1.438

193

Corrida en Minitab Se introducen las respuestas en una columna

C1 Se introducen los subíndices de los renglones

en una columna C2Durability Carpet

18.95 1

12.62 1

11.94 1

14.42 1

10.06 2

7.19 2

7.03 2

14.66 2

194

Corrida en Minitab Opción: stat>ANOVA – One Way (usar archivo

Exh_aov) En Response indicar la col. De Respuesta

(Durability)

En factors indicar la columna de subíndices (carpet)

En comparisons (Tukey)

Pedir gráfica de Box Plot of data y residuales Normal Plot y vs fits y orden

Si los datos estan en columnas pedir ANOVA – One Way (unstacked)

195

Resultados One-way ANOVA: Durability versus Carpet Source DF SS MS F PCarpet 1 45.1 45.1 3.97 0.093 -> No hay diferencia entre las mediasError 6 68.1 11.3Total 7 113.1S = 3.368 R-Sq = 39.85% R-Sq(adj) = 29.82% Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev ----+---------+---------+---------+-----1 4 14.483 3.157 (----------*-----------)2 4 9.735 3.566 (-----------*-----------) ----+---------+---------+---------+----- 7.0 10.5 14.0 17.5Pooled StDev = 3.368Tukey 95% Simultaneous Confidence IntervalsAll Pairwise Comparisons among Levels of CarpetIndividual confidence level = 95.00%Carpet = 1 subtracted from:Carpet Lower Center Upper -+---------+---------+---------+--------2 -10.574 -4.748 1.079 (-----------*----------) -+---------+---------+---------+-------- -10.0 -5.0 0.0 5.0

196

IV.B.5 Uso de Prueba Chi2 (2)

197

¿Para qué se utiliza?

1. Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la información.

2. Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).

2

Ho: No hay diferencia

Ha: Hay diferencia

Para todos los casos,

198

Ho: La moneda es buena

Ha: La moneda “está cargada”

Se lanza una moneda al aire 100 veces y que obtenemos 63 águilas y 37 soles.

¿La proporción de águilas y soles sucede por casualidad? O, se concluye que la moneda está “cargada”?

Ejemplo 1: Chi Cuadrada( 2 )

199

2 c= j = 1

gEstadístico Chi Cuadrada

Observada Esperada

Aguilas 63 50 3.38

Soles 37 50 3.38

2 = 3.38 + 3.38 2 = 6.76

(fo - fe)2

fe( fo ) ( fe )

Ejemplo 1: Chi Cuadrada( 2 )

fe

(fo - fe)2

200

Función de Distribución Acumulada Chi2 con 1 grado de libertad (d.f)

Ho: La moneda es buena.

Ha: La moneda está “cargada”.

Para un 95% de confianza antes de concluir que la moneda “está cargada”, se requiere que X2

c > X2Crítica o que el valor de p sea

0.05.

Como p 0.05, se puede concluir -con un 95% de confianza - que la moneda “está cargada”.

2c P(2c > x)6.7600 p = 1 - 0.9907 = 0.0093

De tablas X2Crítica, (0.05, 1) = 3.8414

Ejemplo 1: Chi cuadrada

201

1. Posicionarse en una celda vacía

2. Accesar el menú de funciones con Fx

3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad, normalmente (n - 1) para un parámetro o (# de renglones -1) * (# de columnas - 1) para el caso de tablas de proporciones.

Cálculo en Excel del estadístico Chi cuadrada

202

Tabla de contingencia Una tabla de clasificación de dos vías (filas y columnas)

que contiene frecuencias originales, se puede analizar para determinar si las dos variables (clasificaciones) son independientes o tienen una asociación significativa.

La prueba Chi Cuadrada probará si hay dependencia entre las dos clasificaciones.

Además se puede calcular el coeficiente de contingencia (correlación) que en todo caso muestra la fuerza de la dependencia

203

Tabla de contingencia Para esta prueba se usa la prueba Chi Cuadrada donde:

Entre mayor sea su valor, mayor será la diferencia de la discrepancia entre frecuencias observadas y teóricas. Esta prueba es similar a la de bondad de ajuste.

204

Tabla de contingencia Ejemplo: Cada una de las 15 celdas hace una

contribución al estadístico Chi Cuadrado (una celda)

Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-Cuadrado de alfa = 20.09

Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de igualdad de resultados entre negocios

Los valores observados (fo) son los siguientes:

Ho: No existen diferencias en los índices de defectos de las dos máquinas.

Ha: Existen diferencias en los índices de defectos de las dos máquinas.

Total 751 28

El índice de defectos totales es 28 / 779 = 3.6%

máquina 1 fo = 517 fo = 17 Total = 534

Partes buenas

máquina 2 fo = 234 fo = 11 Total = 245

779

Partes defectuosas

Ejemplo 2: Chi2 Para comparación de dos grupos; ¿son las mismas proporciones?)

Cálculo de los valores esperados

Basados en este índice, los valores esperados (fe) serían:

máquina 1 fo = 751*534/779 fo = 28*534/779 Total = 534

Partes buenas

máquina 2 fo = 751*245/779 fo = 28*245/779 Total = 245

779

Partes defectuosas

máquina 1 530.53 3.47

Partes buenas

máquina 2 233.47 1.53

Partes defectuosas

Ejemplo 2: Chi2 Para comparación de dos grupos; ¿son las mismas proporciones?)

Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en 20% de celdas.Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi2.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo renglones y/o columnas, las categorías pueden ser de utilidad.

Prueba de chi cuadrada:

Los conteos esperados están debajo de los conteos observados Partes buenas Partes Defectuosas Total1 532 2 534 530.53 3.47

2 232 3 235 233.47 1.53Total 764 5 769

Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0

Problema: Fugas Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la

reducción de tiempo de ciclo.

Variación en familias a probarOperador a operadorHo: No existe diferencia en los índices de defecto de los diferentes

operadoresHa: Existe diferencia en los índices de defecto de los diferentes

operadores

Máquina a máquinaHo: No existe diferencia en los índices de defecto de las diferentes

máquinasHa: Existe diferencia en los índices de defecto de las diferentes

máquinas

Tamaño de la muestra:5000 + total de oportunidades (172 piezas)

Los conteos esperados están colocados debajo de los conteos observadosCon fugas Sin fugas Total

1 30 610 640 32.11 607.89

2 235 4217 4452 223.38 4228.62

3 3 253 25612.84 243.16

4 18 334 352 17.66 334.34

Total 286 5414 5700

Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 + 0.000 = 8.734DF= (4-1)(2-1) = 3; valor P = 0.033

Prueba de chi2 (máquina a máquina)

Los conteos esperados están colocados debajo de los conteos observados.Con gotera Sin gotera Total

1 6 122 128 6.61 121.39

2 1 127 128 6.61 121.39

3 200 3836 4036 208.55 3827.45

4 54 202 256 13.23 242.77

5 5 699 704 36.38 667.62

6 12 116 128 6.61 121.39Total 278 5102 5380

Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475 + 4.386 + 0.239 = 171.132

DF= 5; valor P = 0.000

Prueba de chi2 (operador a operador)

¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?(en este caso, operador a operador y máquina a máquina)

Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave para determinar qué grupo de variación debe investigarse primero.

Coeficiente de Contingencia

x 100Chi Cuadrada

N

Chi2 N CC Máquina 8.734 5700 0.15

Operador 171.132 5380 3.18Controlador Mayor

SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N, probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la estadística Chi2.

Sin embargo, si N tiene una variación considerable, dependiendo del grupo de variación que se investiga, el coeficiente de contingencia puede ser una herramienta valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.

Con gotera Sin gotera Total 1 6 122 128 6.61 121.39

2 1 127 128 6.61 121.39

3 200 3836 4036 208.55 3827.45

4 54 202 256 13.23 242.77

5 5 699 704 36.38 667.62

6 12 116 128 6.61 121.39

Mucho peor que lo esperado

Mucho mejor que lo esperado

Ahora que la información nos ha llevado a investigar a los grupos de operador a operador. ¿Qué debemos hacer ahora?Encontremos cuál de los operadores estaban fuera del estándar. ¿Era alguno de ellos notablemente peor (o mejor) que el resto?

(Estos mismos operadores fueron quienestuvieron los números más grandes de chi2)

¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?(en este caso, operador a operador y máquina a máquina)

Operador a operador: = 0.000 Rechace Ho y acepte Ha

(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 están fuera del estándar:El operador 4 es notablemente peor que el resto,El operador 5 es notablemente mejor que los demás

¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias pueden existen en sus técnicas.

El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a soldar este producto en particular.

El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que requerían los operadores para “acostumbrarse” a trabajar en esta forma)

Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos X en un aeropuerto para detectar artículos clave. Como prueba se pusieron radios de transistores en 90 maletas, cada inspector fue expuesto a 30 maletas conteniendo radios mezcladas entre otras que nos los contenían. Los resultados se resumen a continuación:

Inspectores1 2 3

Radios detectados 27 25 22Radios no detectados 3 5 8

¿Con un 95% de confianza, existe una diferencia entre los inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferenteGrados de libertad = (columnas - 1) ( filas -1)

Ejercicios

2. Se quiere evaluar si hay preferencia por manejar en un carril de una autopista dependiendo de la hora del día. Los datos se resumen a continuación:

Hora del díaCarril 1:00 3:00 5:00Izquierdo 44 37 18Central 28 50 72Derecho 8 13 30

¿Con un 95% de confianza, existe una diferencia entre las preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferenteGrados de libertad = (columnas - 1) ( filas -1)

216

IV.B.6 Pruebas de Hipótesis no paramétricas

217

Pruebas no paramétricas Las pruebas paramétricas asumen una distribución para

la población, tal como la Normal

Las pruebas no paramétricas no asumen una distribución específica de la población

Bajo los mismos tamaños de muestra la Potencia o probabilidad de rechazar Ho cuando es falsa es mayor en las pruebas paramétricas que en las no paramétricas

Una ventaja de las pruebas no paramétricas es que los resultados de la prueba son más robustos contra violación de los supuestos

Prueba de Hipótesis

Variable Atributo

Tablas deContingencia de

Correlación

No Normal

Normal

Varianza Medianas

Variancia Medias

Prueba-F

Homogeneidadde la Variaciónde Levene

Homogeneidadde la Variaciónde Bartlett

Correlación

Prueba de signos

Wilcoxon

Mann-Whitney

Kurskal-Wallis

Prueba de Mood

Friedman

Pruebas de t

ANOVA

CorrelaciónRegresión

Muestra-1Muestra-2

Una víaDos vías

Residuosdistribuidosnormalmente

219

Pruebas de VarianzasHomogeneidad de la varianza de

Levene : Compara dos o más varianzas de muestras de la misma población.

Pruebas de Variancias

X2 : Compara la variancia de una muestra con una variancia de un universo conocido.

Prueba F : Compara dos varianzas de muestras.

Homogeneidad de la variancia de Bartlett: Compara dos o más varianzas muestras de la misma población.

Datos Normales Datos No Normales

Resumen de pruebas de Hipótesis

220

Pruebas de la Mediana

Prueba de signos o Prueba Wilcoxon : Prueba si la mediana de la muestra es igual a un valor conocido o a un valor a alcanzar.

Prueba Mann-Whitney : Prueba si dos medianas de muestras son iguales.

Prueba Kruskal-Wallis: Prueba si más de dos medianas de muestras son iguales. Asume que todas las distribuciones tienen la misma forma.

Prueba de la mediana de Mood : Otra prueba para más de dos medianas. Prueba más firme para los valores atípicos contenidos en la información.

Prueba Friedman : Prueba si las medianas de las muestras, clasificadas bajo dos categorías, son iguales.

Correlación : Prueba la relación lineal entre dos variables.

Pruebas de los Promedios

Prueba t de 1 muestra : Prueba si el promedio de la muestra es igual a un promedio conocido o meta conocida.

Prueba t de 2 muestras : Prueba si los dos promedios de las muestras son iguales.

ANOVA de un factor: Prueba si más de dos promedios de las muestras son iguales.

ANOVA de dos factores : Prueba si los promedios de las muestras clasificadas bajo dos categorías, son iguales.

Correlación : Prueba la relación lineal entre dos variables.

Regresión : Define la relación lineal entre una variable dependiente y una independiente. (Aquí la "normalidad" se aplica al valor residual de la regresión)

Datos Normales Datos No Normales

Resumen de pruebas de Hipótesis

Revise y asegúrese de que los datos no siguen una distribución normal.

• Desarrollar una Prueba de normalidad (para verificar realmente lo anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

• Desarrollar una Prueba de Corridas (para verificar que no existen sucesos no aleatorios que puedan haber distorsionado la información)

• Revisar la información para detectar errores (tipográficos, etc.). Investiguar los valores atípicos.

• Una muestra pequeña (n < 30) proveniente de un universo normal, se mostrará algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:

- Raíz cuadrada de todos los datos- Logaritmo de todos los datos- Cuadrado de todos los datos

• Si la información es todavía anormal, entonces usar las herramientas no paramétricas.

Acciones a tomar con datos No Normales

Promedio : Es la media aritmética de la información. Es la suma de todos los datos, dividida entre el número de datos de referencia.

Mediana: Valor del punto medio de los datos, cuando se ordenan en forma ascendente (en caso de datos pares, obtener promedio).

Moda : Valor que se repite con más frecuencia sobre el conjunto de datos.

Ejemplo:

Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se muestran más adelante. ¿Cuáles son el promedio y la mediana para esta muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60

39, 45, 30, 38, 35, 40, 44, 55, 47, 43

Definiciones

Un dibujo dice más que mil palabras

El promedio puede estar influenciado considerablemente por los valores atípicos porque, cuando se calcula un promedio, se incluyen los valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las observaciones, independientemente de los valores reales de los valores atípicos, ya que es la que sencuentra en la posición media de los valores ordenados.

Promedio = 40.35 Mediana = 39.5

-------+---------+---------+---------+---------+---------+------ C1

PromedioMediana

28.0 35.0 42.0 49.0 56.0 63.0

Pruebas Alternativas comúnmente usadas

Pruebas para datos No normales

• Prueba de Corridas : Calcula la probabilidad de que un X número de puntos de referencia, esté por encima o por debajo del promedio aleatoriamente.

• Prueba de signos, de 1 muestra : Prueba la probabilidad de que la mediana de la muestra, sea igual al valor hipotético.

• Prueba Mann-Whitney : Comprueba el rango de dos muestras, por la diferencia entre dos medianas del universo.

• Prueba de la Mediana de Mood : Prueba para más de dos medianas del universo. Más robusta para los valores atípicos o para los errores en la información.

Analogía con datos normales

• Prueba de Corridas (la mismaprueba para ambos tipos deinformación)

• Prueba t de una muestra

• Prueba t de 2 muestras

• ANOVA de un factor

Considere los siguientes datos (que se muestran aquí en orden cronológico):325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronológico.

Una representación gráfica de los datos se asemeja a esto:

0

100

200

300

400

500

600

PromedioPrimera

"corrida"

Segunda ”racha"

Número total de Rachas: 12Número total de puntos > al promedio: 11Número total de puntos < al promedio: 18

Racha: Un punto o una serie consecutiva de puntos que caen en un lado del promedio.

Prueba de Rachas

Prueba de Rachas

Promedio K = 184.4483

Número de rachas observado = 12

Número de rachas esperado = 14.6552

=> No se rechaza Ho

11 observaciones por encima de K; 18 por debajo

La prueba es significativa en p= 0.2860

No se puede rechazar Ho con valor alfa = 0.05

Este es el valor p de las Prueba de

Corridas

Prueba de RachasHo: Los datos son aleatorios

Ha:Los datos NO so aleatorios

Ya que p > 0.05, no podemos rechazar la hipótesis nula.Los datos son aceptados, siendo aleatorios.

Promedio

Cálculos de la Prueba de Rachas

El estadístico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2) DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11 n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de valores críticos para el número de Rachas G

228

Corrida con Minitab Stat > Nonparametrics > Runs Test

Variable C1, Above and below the mean

P > 0.05No rechazar Ho

Runs Test: C1 Runs test for C1Runs above and below K = 184.448The observed number of runs = 12The expected number of runs = 14.655211 observations above K, 18 belowP-value = 0.285

Prueba de Signos de la Mediana

Ho : La mediana de la muestra es igual a la mediana de la hipótesis

Ha : Las medianas son diferentes

Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0 Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA

29 12 0 17 0.4576 144.0

Ya que p >0.05, no se puede rechazar la hipótesis nula.No se puede probar que la mediana real y la mediana hipotética son

diferentes.

En las páginas siguientes se muestra el detalle del cálculo.

Cálculos de la Prueba de Signos de la Mediana

Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo1 0 - 11 110 - 21 220 +2 50 - 12 110 - 22 240 +3 56 - 13 120 + 23 290 +4 72 - 14 140 + 24 309 +5 80 - 15 144 + 25 320 +6 80 - 16 145 + 26 325 +7 80 - 17 150 + 27 400 +8 99 - 18 180 + 28 500 +9 101 - 19 201 + 29 507 +

10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea probar es 115, entonces hay 12 valores por debajo de el (-) y 17 valores por arriba (+).

Cálculos de la Prueba de Signos de la Mediana

El estadístico X es el el número de veces que ocurre el signo menos frecuente, en este caso el 12 (-).

Cómo n 25, se calcula el estadístico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5 n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierdaen forma similar P(Z2) 0-2288 para la cola derecha, por lo que la

probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de valores críticos para la prueba de signo.

Prueba de Signos de la Mediana

Bueno, veamos una gráfica de la información

100 200 300 4000 500

¿Es esto correcto?¿144 podría ser igual a 115?

115 144

Después de todo, tal vez esto SEA lo correcto.

233

Corrida en Minitab Stat > Nonparametrics > 1-Sample sign Variable C1

Confidence interval 95% Test Median 115 Alternative Not equal

Como P > 0.05 no se rechaza Ho y la mediana es 115

Sign Test for Median: Signos Sign test of median = 115.0 versus not = 115.0

N Below Equal Above P MedianSignos 29 12 0 17 0.4583 144.0

234

Prueba de Signos de la MedianaPara observaciones pareadas

Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B Ha: p<>0.5

Ama Limpiador B

Casa A

1 10 7

2 7 5

3 8 7

4 5 2

5 7 6

6 9 6

¿Hay evidencia que indiquecierta preferencia de las amasde casa por lo limpiadores?

235

Prueba de Signos de la Mediana

Producto B

Familia

A

1 - +

2 - +

3 + -

4 - +

5 0 0

6 - +

7 - +

8 + -

9 - +

10 - +

11 - +

¿Hay evidencia que indiquecierta preferencia por un Producto A o B?

Media = 0.5*nDesv. Estand.= 0.5*raiz(n)

Zc = (Y – media) / Desv. Estánd.Rechazar Ho si Zc ><Zalfa/2

236

Prueba de Signos de la Mediana

Como Zc < Zexcel no se rechaza Ho oComo p value = 0.067 > 0.025No hay evidencia suficiente de que losConsumidores prefieran al producto B

Media = 0.5*11 = 5.5Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 – 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

237

Prueba rango con signo de Wilconox

Es la alternativa no paramétrica de la prueba paramétrica de muestras pareadas

Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario

Trabajador

Método 1

Método 2

Diferencias

Abs(diferen.) Rango

Rango c/signo

1 10.2 9.5 0.7 0.7 8 8

2 9.6 9.8 -0.2 0.2 2 -2

3 9.2 8.8 0.4 0.4 3.5 3.5

4 10.6 10.1 0.5 0.5 5.5 5.5

5 9.9 10.3 -0.4 0.4 3.5 -3.5

6 10.2 9.3 0.9 0.9 10 10

7 10.6 10.5 0.1 0.1 1 1

8 10 10 0 0  Eliminar  

9 11.2 10.6 0.6 0.6 7 7

10 10.7 10.2 0.5 0.5 5.5 5.5

11 10.6 9.8 0.8 0.8 9 9

T = 44

238

Prueba rango con signo de Wilconox

Distribución muestral T para poblaciones idénticasSe aproxima a la distribución normal para n >= 10

En este caso n = pares eliminando las que son iguales con dif. = 0 para el trabajador 8.

= raiz(10 x 11 x 21/6) = 19.62 Z = (T – )/ = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes

0T6

)12)(1(

nnnT

239

Prueba en Minitab para prueba de mediana con Wilconox

File> Open worksheet > Exh_Stat Stat > Nonparametrics > 1-Sample Wilconox

Variables C1 Test Median 77 Altenative Not equal

Achievement

77

88

85

74

75

62

80

70

83

Wilcoxon Signed Rank Test: Achievement Test of median = 77.00 versus median not = 77.00for Wilcoxon Estimated for Wilcoxon Estimated N Test Statistic P MedianAchievement 9 8 19.5 0.889 77.50

Ho: Mediana = 77 Ha: Mediana <> 77Como P de 0.889 >> alfa de 0.05 no se rechaza Ho

Prueba de Mann-Whitney

Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos grupos de personas de edades diferentes, después de diez minutos de ejercicios aeróbicos.

Los datos resultantes se muestran a continuación.

Edad 40-44C1140135150140144154160144136148

Edad 16-20C2130166128126140136132128124

¿Tuvieron diferenciassignificativas las frecuencias de pulso de ambos grupos?

Prueba de Mann-Whitney

Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales):

Edad 40-44C1

(7) 135(8.5) 136(11) 140(11) 140

(13.5) 144(13.5) 144(15) 148(16) 150(17) 154(18) 160

n1 = 10Ta = 130.5

Edad 16-20C2

(1) 124(2) 126

(3.5) 128(3.5) 128(5) 130(6) 132

(8.5) 136(11)140(15)166

n2 = 9Tb = 55.5

Prueba de Mann-Whitney

Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son igualesHa: Las distribuciones de frecuencias relativas poblacionales no son idénticasHo: 1 = 2 Ha: 1 2 1, 2 = Medianas de las poblaciones

Ordenando los datos y asignándoles su posición relativa se tiene:Ua = n1*n2 + (n1) * (n1 + 1) /2 - TaUb = n1*n2 + (n2) * (n2 + 1) /2 - TbUa + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5El menor de los dos es Ua.Para alfa = 0.05 el valor de Uo = 25 Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.

Prueba de Mann-Whitney

Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son igualesHa: Las distribuciones de frecuencias relativas poblacionales no son idénticas

Ua = 14.5 Ub = 79.5Utilizando el estadístico Z y la distribución normal se tiene:

45 12.24Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)Con Ua y Ub se tiene:Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anteriorZb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor = 0.05El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente existe una diferencia significativa entre los dos grupos de edad.

Prueba de Mann-Whitney40

-44

año

s d

e ed

ad16-20 años de edad

Diferencias entre los encabezados de los renglones y las columnas

De esta manera, se calcula la mediana de todas estas diferencias, denominada "punto estimado". Este punto estimado es una aproximación de la diferencia entre las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de información), Minitab usa este punto estimado para calcular el valor p.

130 166 128 126 140 136 132 128 124140 10 -26 12 14 0 4 8 12 16135 5 -31 7 9 -5 -1 3 7 11150 20 -16 22 24 10 14 18 22 26140 10 -26 12 14 0 4 8 12 16144 14 -22 16 18 4 8 12 16 20154 24 -12 26 28 14 18 22 26 30160 30 -6 32 34 20 24 28 32 36144 14 -22 16 18 4 8 12 16 20136 6 -30 8 10 -4 0 4 8 12148 18 -18 20 22 8 12 16 20 24

245

Corrida en Minitab Stat > Nonparametrics > Mann Whitney First Sample C1 Second Sample C2 Conf. Level 95%

Alternative Not equal

Mann-Whitney Test and CI: C1, C2 N Median P>0.05C1 10 144.00 Se rechaza Ho C2 9 130.00Point estimate for ETA1-ETA2 is 12.0095.5 Percent CI for ETA1-ETA2 is (4.01,20.00)W = 130.5Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143The test is significant at 0.0140 (adjusted for ties)

Prueba de Kruskal Wallis

Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene (promediando posiciones para el caso de que sean iguales):

Zona 1(15.5) 147(17.5) 17.5

(9) 128(19) 162(12) 135(10) 132(22) 181(13) 138

n1 = 8Ta = 118

Zona 2(17.5) 160(14) 140(21) 173(4) 113(1) 85

(7) 120(25) 285(5) 117

(11) 133(6) 119

n2 = 10Tb = 111.5

Zona 3(24) 215(8) 127(2) 98

(15.5) 127(23) 184(3) 109

(20) 169

n3 = 7Tc = 95.5

N = n1 + n2 + n3 = 25

Prueba de Kruskal Wallis

Ho: Las poblaciones A, B y C son igualesHa: Las poblaciones no son igualesHo: 1 = 2 = 3 Ha: 1 2 3 ; 1, 2, 3 = Medianas de las poblaciones

Calculando el valor del estadístico H se tiene:H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] - 3 * ( N +1 )H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadístico 2 para = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)2 crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)

Como H < 2 crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay diferencia entre las poblaciones

248

Corrida en Minitab Stat > Nonparametrics > Kruskal Wallis

Response C1 Factor C2 OK

Kruskal-Wallis Test: Datos versus Factor Kruskal-Wallis Test on DatosFactor N Median Ave Rank ZZona 1 7 138.0 14.7 0.98Zona 2 10 126.5 11.1 -0.82Zona 3 7 127.0 12.3 -0.10Overall 24 12.5 P > 0.05H = 1.08 DF = 2 P = 0.581 No se rechaza HoH = 1.09 DF = 2 P = 0.581 (adjusted for ties)

249

Prueba de Medianas de Mood Realiza prueba de hipótesis de igualdad de medias en un

diseño de una vía. La prueba es robusta contra Outliers y errores en datos y es adecuada para análisis preliminares

Determina si K grupos independientes han sido extraidas de la misma población con medianas iguales o poblaciones con formas similares

Con base en la gran mediana, anotar un signo positivo si la observación excede la mediana o un signo menos si es menor. Los valores que coincidan se reparten en los grupos

Hacer una tabla de contingencia K x 2 con las frecuencias de signos más y menos en cada grupo K

250

Prueba de Medianas de Mood Se determina el estadístico Chi Cuadrada con:

Probar Ho: Todas las medianas son iguales Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para 0.05 y (reng – 1)*(Col – 1) grados de libertad

EEO 2

2 )(

251

Corrida con Minitab

Se les da a 179 participantes una conferencia con dibujos para ilustrar el tema. Después se les da la prueba OTIS que mide la habilidad intelectual. Los participantes se clasificaron por nivel educativo 0-No prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son iguales

File > Open Worksheet > Cartoon.mtw Stat > Nonparametrics > Mood’s Median Test

Response Otis Factor ED Ok

252

Corrida con Minitab

Mood Median Test: Otis versus ED

Mood median test for OtisP>0.05

Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho

Individual 95.0% CIs

ED N<= N> Median Q3-Q1 ----+---------+---------+---------+--

0 47 9 97.5 17.3 (-----*-----)

1 29 24 106.0 21.5 (------*------)

2 15 55 116.5 16.3 (----*----)

----+---------+---------+---------+--

96.0 104.0 112.0 120.0

Overall median = 107.0

253

Diseños factoriales aleatorias bloqueados de Friedman

Esta prueba es una alternativa al ANOVA de dos vías, es una generalización de las pruebas pareadas con signo. La aditividad es requerida para para estimar los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo

Ha: Algunos tratamientos tienen efecto significativo

254

Diseños factoriales aleatorias bloqueados de Friedman

Resultados de salida: Se muestra el estadístico de prueba con

distribución Chi Cuadrada aproximada con gl = Tratamientos – 1.

Si hay observaciones parecidas en uno o más bloques, se usa el rango promedio y se muestra el estadístico corregido

La mediana estimada es la gran mediana más el efecto del tratamiento

255

Diseños factoriales aleatorias bloqueados de Friedman

Ejemplo: Se evalúa el efecto del tratamiento de una

droga en la actividad enzimática con tres niveles, probado en cuatro animales

Open the worksheet EXH_STAT.MTW. Stat > Nonparametrics > Friedman.

Response, seleccionar EnzymeActivity.En Treatment, seleccionar Therapy. En Blocks, seleccionar Litter. Click OK.

256

Diseños factoriales aleatorias bloqueados de Friedman

Datos: EnzymeActivity Therapy Litter

0.15 1 1

0.26 1 2

0.23 1 3

0.99 1 4

0.55 2 1

0.26 2 2

-0.22 2 3

0.99 2 4

0.55 3 1

0.66 3 2

0.77 3 3

0.99 3 4

257

Diseños factoriales aleatorias bloqueados de Friedman

Resultados: Friedman Test: EnzymeActivity versus Therapy blocked by Litter

S = 2.38 DF = 2 P = 0.305 No rechazar Ho

S = 3.80 DF = 2 P = 0.150 (adjusted for ties)

Sum

of

Therapy N Est Median Ranks

1 4 0.2450 6.5

2 4 0.3117 7.0

3 4 0.5783 10.5

Grand median = 0.3783

258

Diseños factoriales aleatorias bloqueados de Friedman

Resultados: El estadístico de prueba S tiene un valor P de 0.305 sin

ajustar para observaciones en cero y 0.150 para el valor ajustado.

Por tanto no hay evidencia suficiente para rechazar Ho

Las medianas estimadas asociadas con los tratamientos son la gran mediana más los efectos estimados de los tratamientos.

El estadístico de prueba se determina con base a los rangos en cada bloque y totales

259

Diseños factoriales aleatorias bloqueados de Friedman

Resultados:

260

Diseños factoriales aleatorias bloqueados de Friedman

Resultados:

261

Diseños factoriales aleatorias bloqueados de Friedman

Resultados:

262

Prueba de igualdad de varianzas de Levene

Se usa para probar la hipótesis nula de que las varianzas de k múltiples poblacionales son iguales

Las igualdad de varianzas en las muestras se denomina homogeneidad de varianzas

La prueba de Levene es menos sensible que la prueba de Bartlett o la prueba F cuando se apartan de la normalidad

La prueba de Bartlett tiene un mejor desempeño para la distribución normal o aproximadamente normal

263

Prueba de igualdad de varianzas de Levene

Para dos muestras el procedimiento es como sigue:

Determinar la media

Calcular la desviación de cada observación respecto a la media

Z es el cuadrado de las desviaciones respecto a la media

Aplicar la prueba t a las dos medias de los datos

264

Prueba de igualdad de Varianzas-Minitab

Se estudian tamaños de papa inyectando con bacterias y sujetas a diferentes temperaturas. Antes del ANOVA se verifica la igualdad de varianzas

Stat > ANOVA > Test for equal variancesResponse RotFactors Temp OxigenConfidence level 95%

Rot Temp Oxygen

13 10 2

11 10 2

3 10 2

10 10 6

4 10 6

7 10 6

15 10 10

2 10 10

7 10 10

26 16 2

19 16 2

24 16 2

15 16 6

22 16 6

18 16 6

20 16 10

24 16 10

8 16 10

265

Resultados

266

Resultados

Test for Equal Variances: Rot versus Temp, Oxygen

95% Bonferroni confidence intervals for standard deviations

Temp Oxygen N Lower StDev Upper

10 2 3 2.26029 5.29150 81.890

10 6 3 1.28146 3.00000 46.427

10 10 3 2.80104 6.55744 101.481

16 2 3 1.54013 3.60555 55.799

16 6 3 1.50012 3.51188 54.349

16 10 3 3.55677 8.32666 128.862

Bartlett's Test (normal distribution)

Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho

Levene's Test (any continuous distribution)

Test statistic = 0.37, p-value = 0.858

267

Prueba de la concordancia del Coeficiente de Kendall

El coeficiente expresa el grado de asociación entre las calificaciones múltiples realizadas por un evaluador

Ho: Las variables son independientesHa: Las variables están asociadas

Kendall usa la información relacionada con las calificaciones relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9Chi Cuadrada crítica = X2 0.01,9 = 21.67

268

Prueba de la concordancia del Coeficiente de Kendall

El Estadístico Chi Cuadrada calculado es:

Como Chi Cuadrada de alfa es menor que la calculada, los cuatro jueces están asociados significativamente. Constituyen un panel uniforme. No quiere decir que estén en lo correcto, solo que responden de manera uniforme a los estímulos

269

El coeficiente de correlación de rangos de Spearman (rs)

El coeficiente de correlación es una medida de la asociación que requiere que ambas variables sean medidas en al menos una escala ordinal de manera que las muestras u observaciones a ser analizadas pueden ser clasificadas en rangos en dos series ordenadas

Ho: Las variables son independientesHa: Las variables están asociadas

Para el ejemplo anterior si N = 10, el coeficiente es:

NN

drs

3

261

97.003.01990

)5.5(61 sr

270

Coeficiente de correlación de rangos para monotonía

de preferencias Una persona interesada en adquirir un TV asigna

rangos a modelos de cada uno de 8 fabricantes

Preferencia Precio (rango)

Fab.

1 7 449.50 (1)

2 4 525.00 (5)

3 2 479.95 (3)

4 6 499.95 (4)

5 1 580.00 (8)

6 3 549.95 (7)

7 8 469.95 (2)

8 5 532.50 (6)

Di cuadrada

RangoDi

6 36

-1 1

-1 1

2 4

-7 49

-4 16

6 36

-1 1

271

Coeficiente de correlación de rangos para monotonía

de preferencias

Ho: No existe asociación entre los rangosHa: Existe asociación entre los rangos o es positiva o negativa

El coeficiente de correlación de rangos de Spearman es:

Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))

En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores críticos del coeficiente de correlación del coeficiente de correlación de rangos de Spearman

Rt = 0.686

Por tanto si hay asociación significativa en las preferencias

272

Tabla de constantesn Alfa=0.05 Alfa = 0.0255 0.900 -6 0.829 0.8867 0.714 0.7868 0.643 0.7389 0.600 0.683

10 0.564 0.64811 0.523 0.62312 0.497 0.59113 0.475 0.56614 0.457 0.54515 0.441 0.52516 0.425 0.50717 0.412 0.49018 0.388 0.47619 0.377 0.46220 0.368 0.45021 0.359 0.43822 0.351 0.42823 0.343 0.41824 0.336 0.40925 0.329 0.40026 0.329 0.39227 0.323 0.38528 0.317 0.37729 0.311 0.37030 0.305 0.364

273

Corrida con MinitabPara la corrida en Minitab

primero se deben determinar los rangos en forma manual para las variables X y Y.

Stat > Basic statistics > Correlation Variables Preferencia Precio

Fabricante

Prefe-rencia Precio

Precio

1 7 1 449

2 4 5 525

3 2 3 479

4 6 4 499

5 1 8 580

6 3 7 549

7 8 2 469

8 5 6 532

Correlations: Preferencia, Precio

Pearson correlation of Preferencia and Precio = -0.714

P-Value = 0.047

274

Ejemplo con MinitabSe estudia la relación entre

colágeno y Proline en pacientes con cirrosis

Stat > Basic statistics > Correlation Variables Colágeno Proline

Paciente Colágeno Proline

1 7.1 2.8

2 7.1 2.9

3 7.2 2.8

4 8.3 2.6

5 9.4 3.5

6 10.5 4.6

7 11.4 5

Correlations: Colageno, Proline

Pearson correlation of Colageno and Proline = 0.935

P-Value = 0.002

275

Resumen de pruebas no paramétricas

Prueba de signos de 1 muestra: Prueba la igualdad de la mediana a un valor y determina el intervalo de confianza

Prueba de Wilconox de 1 muestra: Prueba la igualdad de la mediana a un valor con rangos con signo y determina el intervalo de confianza

Comparación de dos medianas poblacionales de Mann Whitney: Prueba la igualdad de las medianas y determina el intervalo de confianza

276

Resumen de pruebas no paramétricas

Comparación de igualdad de medianas poblacionales de Kruskal Wallis: Prueba la igualdad de las medianas en un diseño de una vía y determina el intervalo de confianza

Comparación de medianas poblacionales de Mood: Prueba la igualdad de medianas con un diseño de una vía

277

278

279

Salidas de la Fase de Análisis Causas raíz validadas

Guía de oportunidades de mejora

Causa Raíz

ResultadosCausas# de

Causa

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ

NO ES CAUSA RAIZ

NO ES CAUSA RAIZ

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ

NO ES CAUSA RAIZ

Ensamble de ojillos, bloques y contrapesos no adecuados en aspas.

Amortiguadores dañados.

Desgaste de bujes en los carretes.Fabricación y reemplazo de ejes y poleas no adecuados en ensamble de aspas.Desalineamiento de poleas y bandas de transmisión de aspas.

Método de Balanceo no adecuado.

Desalineación de pinolas en cuna.

1

2 3

4

5

6

7

Resumen de la validación de las causas

X

X

X

X