[PPT]Presentación de PowerPoint - icicm.com · Web viewPrograma de certificación de Black Belts ASQ VI. Seis Sigma - Análisis P. Reyes / Noviembre de 2007

  • Upload
    voanh

  • View
    226

  • Download
    8

Embed Size (px)

Citation preview

  • Programa de certificacin de Black Belts ASQ

    VI. Seis Sigma - Anlisis

    P. Reyes / Noviembre de 2007

  • Fase de Anlisis

    Propsitos: Establecer hiptesis sobre las posibles Causas RazRefinar, rechazar, o confirmar la Causa RazSeleccionar las Causas Raz ms importantes:Las pocas Xs vitales

    Salidas:Causas raz validadasFactores de variabilidad identificados

  • Llenar columnas del FMEA

    Hasta sol. Propuesta y

    comprobar causas con

    Pruebas de Hiptesis

  • VI. Anlisis

    A. Medicin y modelaje de relacin entre variables

    B: Pruebas de hiptesis

    C. Anlisis del modo y efecto de falla (AMEF)

    D. Mtodos adicionales de anlisis

  • A. Medicin y modelaje de relacin entre variables

  • A. Medicin y modelaje de relacin entre variables

    1. Coeficiente de correlacin

    2. Regresin

    3. Herramientas Multivariadas

    4. Estudios Multivari

    5. Anlisis de datos por atributos

  • VI.A.1 Coeficiente de correlacin

  • Definiciones

    Correlacin

    Regresin

  • Correlacin

    Propsito:Estudiar la posible relacin entre dos variables.

    Accidentes laborales

    Numero de rdenes urgentes

    Correlacin

    positiva,

    posible

    El 1er. paso es realizar una grfica de la informacin.

    Graphs are used to visualize relationships or associations between variables. Linear relationships between (primarily) continuous variables can be quantified using the Pearson product moment correlation coefficient (correlation for short) and regression.

    When might you use regression and correlation?

    To determine if a less expensive (or faster) procedure can be substituted for a procedure currently in use.

    As a first step in determining key input variables in a process (correlating input and out put variables).

  • Coeficiente de correlacin (r )

    Mide la fuerza de la relacin lineal entre las variables X y Y en una muestra.

    El coeficiente de correlacin muestral de Pearson rx,y con valores entre -1 y +1 es:

  • Correlacin de la informacin (R ) de las X y las Y

    Correlacin Positiva

    Evidente

    0

    5

    10

    15

    20

    25

    0

    5

    10

    15

    20

    25

    X

    Y

    Correlacin Negativa

    Evidente

    0

    5

    10

    15

    20

    25

    0

    5

    10

    15

    20

    25

    X

    Y

    Correlacin

    Positiva

    0

    5

    10

    15

    20

    25

    0

    5

    10

    15

    20

    25

    X

    Y

    Correlacin

    Negativa

    0

    5

    10

    15

    20

    25

    0

    5

    10

    15

    20

    25

    X

    Y

    Sin Correlacin

    10

    15

    20

    25

    5

    10

    15

    20

    25

    X

    Y

    0

    5

    0

    R=1

    R=>-1

    R=-1

    R=0

    R=>1

  • Coeficiente de correlacin

    El coeficiente de correlacin r asume el mismo signo de la pendiente de la recta 1 siendo cero cuando

    1 =0

    Un valor positivo de r implica que la pendiente de la lnea es ascendente hacia la derechaUn valor negativo de r implica que la pendiente de la lnea es descendente hacia la derechaSi r=0 no hay correlacin lineal, aunque puede haber correlacin curvilnea

  • Coeficiente de correlacin

    Coeficiente de correlacin

    0.8 < r < 1.0

    0.3 < r < 0.8

    -0.3 < r < 0.3

    -0.8 < r < -0.3

    -1.0 < r < -0.8

    Relacin

    Fuerte, positiva

    Dbil, positiva

    No existe

    Dbil, negativa

    Fuerte, negativa

    Reglas empricas

  • Tabla de Correlacin mnima

    Correlaciones (Pearson)

    n 95% 99%

    de confianza de confianza

    3 1.00 1.00

    4 0.95 0.99

    5 0.88 0.96

    6 0.81 0.92

    7 0.75 0.87

    8 0.71 0.83

    9 0.67 0.80

    10 0.63 0.76

    11 0.60 0.73

    12 0.58 0.71

    13 0.53 0.68

    14 0.53 0.66

    n 95% 99%

    de confianza de confianza

    15 0.51 0.64

    16 0.50 0.61

    17 0.48 0.61

    18 0.47 0.59

    19 0.46 0.58

    20 0.44 0.56

    22 0.42 0.54

    24 0.40 0.52

    26 0.39 0.50

    28 0.37 0.48

    30 0.36 0.46

    Para un 95% de confianza, con una muestra de 10,

    el coeficiente (r) debe ser al menos .63

  • La correlacin puede usarse para informacin de atributos, variables normales y variables no normales.

    La correlacin puede usarse con un predictor o ms para una respuesta dada.

    La correlacin es una prueba fcil y rpida para eliminar factores que no influyen en la prediccin, para una respuesta dada.

    Correlacin

  • Para determinar que tanto se acercan los datos predichos por el modelo a los datos observados aplicando el coeficiente de correlacin de Pearson (ver tabla anterior para identificar la significancia)

    Coeficiente de Correlacin

  • Otra forma para no consultar la tabla de coeficiente de correlacin de Pearson es la r ajustada

    Coeficiente de Correlacin ajustado

    R2(Adj) = 1 (1 r2)

    (n-1)

    (n-p)

    Donde :

    R2(Adj) = Coeficiente de correlacin ajustado

    r = Coeficiente de correlacin de Pearson

    n = Nmero de datos

    p = Nm. trminos en el modelo

    (Incluyendo la constante)

    Criterios en funcin a la R2(Adj)

    > 90% = Correlacin Fuerte

    80% - 90% = Buena correlacin

    60% - 80% = Correlacin media

    40% - 60% = Correlacin dbil

    < 40% = No existe correlacin

  • Coeficiente de Determinacin (R2)

    El coeficiente de determinacin es la proporcin de la variacin total explicada por la regresin, R2 se encuentra en el rango de valores de 0 a 1.

  • Correlacin vs causacin

    Tener cuidado de no tener variables colineales, por ejemplo peso de un coche y peso de las personas que transporta, o que no la relacin no tenga sentido, como si lavo mi coche, llueve.

  • VI.A.2 Regresin

  • Anlisis de Regresin

    El anlisis de regresin es un mtodo estandarizado para localizar la correlacin entre dos grupos de datos, y, quiz ms importante, crear un modelo de prediccin.

    Puede ser usado para analizar las relaciones entre:

    Una sola X predictora y una sola Y

    Mltiples predictores X y una sola Y

    Varios predictores X entre s

  • Supuestos de la regresin lineal

    Los principales supuestos que se hacen en el anlisis de regresin lineal son los siguientes:

    La relacin entre las variables Y y X es lineal, o al menos bien aproximada por una lnea recta.

    El trmino de error tiene media cero.

    El trmino de error tiene varianza constante 2.

    Los errores no estn correlacionados.

    Los errores estn normalmente distribuidos.

  • Modelo de regresin lineal

    Se aume que para cualquier valor de X el valor observado de Y varia en forma aleatoria y tiene una distribucin de probabilidad normal

    El modelo general es:

    Y = Valor medio de Yi para Xi + error aleatorio

  • La lnea de regresin se calcula por el mtodo de mnimos cuadrados.

    Un residuo es la diferencia entre un punto de referencia en particular (xi, yi) y el modelo de prediccin ( y = a + bx ). El modelo se define de tal manera que la suma de los cuadrados de los residuales es un mnimo. La suma residual de los cuadrados es llamada con frecuencia la suma de los cuadrados de los errores (SSE) acerca de la lnea de regresin

    ei

    xi

    yi

    SSE = ei2 = yi - yi2

    y = b0 + b1x

    Regresin Lineal Simple

    a y b son

    Estimados de

    0 y 1

  • Grfica de la Lnea de Ajuste

    Recta de regresin

    Y=-.600.858+5738.89X

    R2 = .895

    Altura del muelle

    Retencin

    0.18

    0.19

    0.20

    400

    500

    600

  • Interpretacin de los Resultados

    El intervalo de prediccin es el grado de certidumbre de la difusin de la Y estimada para puntos individuales X. En general, 95% de los puntos individuales (provenientes de la poblacin sobre la que se basa la lnea de regresin), se encontrarn dentro de la banda [Lneas azules]

    La ecuacin de regresin (Y = -600.858 + 5738.89X) describe la relacin entre la variable predictora X y la respuesta de prediccin Y.

    R2 (coef. de determinacin) es el porcentaje de variacin explicado por la ecuacin de regresin respecto a la variacin total en el modelo

    El intervalo de confianza es una banda con un 95% de confianza de encontrar la Y media estimada para cada valor de X [Lneas rojas]

  • Interpretacin de los Resultados

    Los valores p de la constante (interseccin en Y) y las variables de prediccin, se leen igual que en la prueba de hiptesis.

    Ho: El factor no es significativo en la prediccin de la respuesta.

    Ha: El factor es significativo en la prediccin de la respuesta.

    s es el error estndar de la prediccin = desviacin estndar del

    error con respecto a la lnea de regresin.

    R2 (ajustada) es el porcentaje de variacin explicado por la regresin, ajustado por el nmero de trminos en el modelo y por

    el nmero de puntos de informacin.

    El valor p para la regresin se usa para ver si el modelo completo de regresin es significativo.

    Ho: El modelo no es significativo en la prediccin de la respuesta.

    Ha: El modelo es significativo en la prediccin de la respuesta.

  • Errores residuales

    Los errores se denominan frecuentemente residuales. Podemos observar en la grfica de regresin los errores indicados por segmentos verticales.

  • Errores residuales

    Los residuos pueden ser graficados para:

    Checar normalidad.Checar el efecto del tiempo si su orden es conocido en los datos.Checar la constancia de la varianza y la posible necesidad de transformar los datos en Y.Checar la curvatura de ms alto orden que ajusta en las Xs.

    A veces es preferible trabajar con residuos estandarizados o estudentizados:

  • Errores residuales

    Anlisis de los errores o residuales

  • Ejemplo

    Considere el problema de predecir las ventas mensuales en funcin del costo de publicidad. Calcular el coeficiente de correlacin, el de determinacin y la recta.

    MESPublicidadVentas

    11.2101

    20.892

    31.0110

    41.3120

    50.790

    60.882

    71.093

    80.675

    90.991

    101.1105

  • Clculo manual

    Calcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2

    XiYi

    MESPublicidadVentas Xi2XiYiYi2

    11.21011.44121.210201

    20.8920.6473.68464

    31.01101.00110.012100

    41.31201.6915614400

    50.7900.4963.08100

    60.8820.6465.66724

    71.0931.0093.08649

    80.6750.3645.05625

    90.9910.8181.98281

    101.11051.21115.511025

    SUMA9.49599.28924.893,569

  • Mtodo de mnimos cuadrados

    Donde:

    Yest = Valor predicho de para un valor particular de x.

    b0 =Estimador puntual de .(ordenada al origen)

    b1=Estimador puntual de (pendiente)

    Para el clculo de b0 y b1 se utilizamos las siguientes frmulas:

  • Anlisis de varianza en la regresin

    La desviacin estndar S corresponde a la raz cuadrada del valor de MSE o cuadrado medio residual.

    Los residuos son:

  • Anlisis de varianza en la regresin

    Las conclusiones son como sigue:

    Intervalos de confianza para Beta 0 y Beta 1

  • Anlisis de varianza en la regresin

    El intervalo de confianza para la desviacin estndar es:

    Intervalos de confianza para la Y estimada promedio

    Intervalo de prediccin para un valor particular de Y estimado

  • Anlisis de varianza en la regresin

    Prueba de Hiptesis para Beta 1:

    Ho: 1 = 0 contra H1:1 0

    Si el coeficiente Beta 1 es significativo

  • Anlisis de varianza en la regresin

    Coeficiente de correlacin r:

    Coeficiente de determinacin: r2

    R2 mide la proporcin de la variacin total respecto a la media que es explicada por la regresin. Se expresa en porcentaje.

  • Anlisis de varianza en la regresin

    Prueba de hiptesis para el Coeficiente de correlacin r:

    H0: = 0 contra H1: 0

    Si se rechaza la hiptesis Ho, indicando que existe una correlacin significativa

  • Riesgos de la regresin

    Los modelos de regresin son vlidos como ecuaciones de interpolacin sobre el rango de las variables utilizadas en el modelo. No pueden ser vlidas para extrapolacin fuera de este rango.

    Mientras que todos los puntos tienen igual peso en la determinacin de la recta, su pendiente est ms influenciada por los valores extremos de X.

  • Riesgos de la regresin

    Los outliers u observaciones aberrantes pueden distorsionar seriamente el ajuste de mnimos cuadrados.

    Si se encuentra que dos variables estn relacionadas fuertemente, no implica que la relacin sea casual, se debe investigar la relacin causa efecto entre ellas. Por ejemplo el nmero de enfermos mentales vs. nmero de licencias recibidas.

  • Clculo manual (cont..)

    Clculo de la recta de regresin lineal:

    Sxx = 9.28 - (9.4)^2/10 = 0.444

    Sxy = 924.8 - (9.4)(959) / 10 = 23.34

    Ymedia = 959 / 10 = 95.9Xmedia = 9.4 / 10 = 0.94

    b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57

    b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49

    Yest. = 46.49 + 52.57* X

  • Ejemplo (cont..)

    Clculo de S2 estimador de

    S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx

    Syy = 93,569 - (959)^2 / 10 = 1600.9

    SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97

    S2 = SSE / (n - 2) = 373.97 / 8 = 46.75

    S = 6.84

    El intervalo de confianza donde caern el 95% de los puntos es el rango de 1.96S = 13.41 o sea a 13.41 de la lnea.

  • Ejemplo (cont..)

    Inferencias respecto a la pendiente de la lnea b1:

    Se usa el estadstico t = b1 / (S / Sxx)

    El trmino del denominador es el error estndar de la pendiente.

    Para probar la hiptesis nula Ho: 1 = 0

    En este caso tc = 52.57 / (6.84 / 0.444) = 5.12

    El valor crtico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados de libertad es 2.306.

    Como tc > tcrtico se rechaza la hiptesis de que b1 = 0 existiendo la regresin.

  • Ejemplo (cont..)

    Estableciendo un 95% de confianza para la pendiente de la recta b1.

    Usando la frmula b1 t0.025 (S / Sxx) se tiene:

    52.57 2.306 * 6.84 / 0.444 = 52.57 23.67.

    Por tanto una unidad de incremento en publicidad, har que el volumen de ventas se encuentre entre $28.9 a $76.2.

  • Ejemplo (cont..)

    Clculo del coeficiente de Correlacin:

    ________

    r = Sxy / (SxxSyy)

    ____________

    r = 23.34 / 0.444*1600.9 = 0.88

    Como r es positivo, la pendiente de la recta apunta hacia arriba y a la derecha.

    El coeficiente de determinacin r^2 = 1 - SSE/Syy

    r^2 = ( Syy - SSE ) / Syy = 0.774

  • 1. Teclear los datos para Xi y Yi

    2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, CORRELATION o CORRELACIN

    3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los resultados) y obtener los resultados

    Column 1Column 2

    Column 11 0.875442

    Column 20.8754421

    El coeficiente de correlacin r = 0.875442

    Anlisis de Regresin

  • Clculo con Excel)

    4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, REGRESION o REGRESIN

    3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X (rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE RESIDUALES y obtener una tabla de resultados como los que se muestran en las pginas siguientes.

    NOTAS:

    a) La grfica de probabilidad normal debe mostrar puntos fcilmente aproximables por una lnea recta, indicando normalidad.

    B) La grfica de residuos estandarizados se deben distribuir en forma aleatoria alrededor de la lnea media igual a cero.

  • Resultados de Excel

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R0.875442 R Square0.766398

    Adjusted R Square0.737198 Standard Error6.83715

    Observations10

    ANOVA

    dfSSMSFSignificance F

    Regression1 1226.927 1226.927 26.246330.000904

    Residual8 373.973 46.74662

    Total9 1600.9

    Confidence 95% Coefficients Standard Errort Stat P-value Lower Upper

    Intercept46.48649 9.884566 4.702936 0.001536 23.69262 69.28035

    X Variable1 52.56757 10.26086 5.123117 0.000904 28.90597 76.22916

    La ecuacin de la recta es Yest = 46.48649 + 52.56757 X

    Como los valores p para los coeficientes son menores a 0.05, ambos son significativos

  • Grfica normal de Excel

    Chart1

    75

    82

    90

    91

    92

    93

    101

    105

    110

    120

    Sample Percentile

    Y

    Normal Probability Plot

    Sheet1

    11.2101SUMMARY OUTPUT

    20.892

    31110Regression Statistics

    41.3120Multiple R0.8754417701

    50.790R Square0.7663982929

    60.882Adjusted R Square0.7371980795

    7193Standard Error6.8371501096

    80.675Observations10

    90.991

    101.1105ANOVA

    dfSSMSFSignificance F

    Column 1Column 2Regression11226.9270270271226.92702702726.24632507050.0009037134

    Column 11Residual8373.97297297346.7466216216

    Column 20.87544177011Total91600.9

    CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Lower 95.0%Upper 95.0%

    Intercept46.48648648659.88456628274.70293639170.001535622323.692621023669.280351949423.692621023669.2803519494

    X Variable 152.567567567610.26085687615.1231167340.000903713428.90597387976.229161256128.90597387976.2291612561

    PROBABILITY OUTPUT

    PercentileY

    575

    1582

    2590

    3591

    4592

    5593

    65101

    75105

    85110

    95120

    Sheet1

    Sample Percentile

    Y

    Normal Probability Plot

    Sheet2

    Sheet3

  • Grfica de Residuos vs. X de Excel

    Chart2

    -8.5675675676

    3.4594594595

    10.9459459459

    5.1756756757

    6.7162162162

    -6.5405405405

    -6.0540540541

    -3.027027027

    -2.7972972973

    0.6891891892

    X Variable 1

    Residuals

    X Variable 1 Residual Plot

    Sheet1

    11.2101SUMMARY OUTPUT

    20.892

    31110Regression Statistics

    41.3120Multiple R0.8754417701

    50.790R Square0.7663982929

    60.882Adjusted R Square0.7371980795

    7193Standard Error6.8371501096

    80.675Observations10

    90.991

    101.1105ANOVA

    dfSSMSFSignificance F

    Column 1Column 2Regression11226.9270270271226.92702702726.24632507050.0009037134

    Column 11Residual8373.97297297346.7466216216

    Column 20.87544177011Total91600.9

    CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Lower 95.0%Upper 95.0%

    Intercept46.48648648659.88456628274.70293639170.001535622323.692621023669.280351949423.692621023669.2803519494

    X Variable 152.567567567610.26085687615.1231167340.000903713428.90597387976.229161256128.90597387976.2291612561

    RESIDUAL OUTPUTPROBABILITY OUTPUT

    ObservationPredicted YResidualsPercentileY

    1109.5675675676-8.5675675676575

    288.54054054053.45945945951582

    399.054054054110.94594594592590

    4114.82432432435.17567567573591

    583.28378378386.71621621624592

    688.5405405405-6.54054054055593

    799.0540540541-6.054054054165101

    878.027027027-3.02702702775105

    993.7972972973-2.797297297385110

    10104.31081081080.689189189295120

    Sheet1

    X Variable 1

    Residuals

    X Variable 1 Residual Plot

    Sheet2

    Sample Percentile

    Y

    Normal Probability Plot

    Sheet3

  • Ejercicio

    Calcular la recta de prediccin con sus bandas de confianza, la correlacin y la determinacin para la respuesta de un Taxi, los datos se muestran a continuacin:

    DistanciaTiempo

    0.8200

    2.2400

    1.0160

    0.6120

    1.0360

    1.4280

    2.2560

    0.6320

  • Relaciones no Lineales

    Qu pasa si existe una relacin causal, no lineal?

    El siguiente es un conjunto de datos experimentales codificados, sobre resistencia a la compresin de una aleacin especial:

    Resistencia a

    Concentracin la Compresin

    x y

    10.025.2 27.3 28.7

    15.029.8 31.1 27.8

    20.031.2 32.6 29.7

    25.031.7 30.1 32.3

    30.029.4 30.8 32.8

    (ref. Walpole & Myers, 1985)

  • Y = 19.0333 + 1.00857X - 2.04E-02X**2

    R2 = 0.614

    Anlisis de Variancia

    FUENTE DF SS MS F p

    Regresin 2 38.9371 19.4686 9.54490 3.31E-03

    Error 12 24.4762 2.0397

    Total 14 63.4133

    FUENTE DF Seq SS F p

    Lineal 1 28.0333 10.3005 6.84E-03

    Cuadrtica 1 10.9038 5.34584 3.93E-02

    Resultados del Anlisis de Regresin - Modelo Cuadrtico

  • Regresin cuadrtica

  • Regresin cuadrtica

  • Regresin cuadrtica

    Los residuos

    No son normales

    Se deben transformar

    Las variables

  • Otros Patrones No Lineales

    A veces es posible transformar una o ambas variables, para mostrar mejor la relacin entre ambas. La meta es identificar la relacin matemtica entre las variables, para que con la variable transformada se obtenga una lnea ms recta. Algunas transformaciones comunes incluyen:

    x = 1/x

    x = Raz cuadrada de (x)

    x = log x

    Funciones trigonomtricas: x = Seno

    de x

  • Trasformacin de funciones

    Ejemplo: sea se transforma como

  • Transformacin de variables del ejemplo de regresin cuadrtica

    Transformando la variable X = 1/X se tiene, utilizando Minitab

  • Transformacin de variables del ejemplo de regresin cuadrtica

    Transformando la variable X = 1/X se tiene, utilizando Minitab

  • Transformacin de variables del ejemplo de regresin cuadrtica

    Los residuos ahora ya se muestran normales

  • Transformacin para homoestacidad de la varianza

    Algunas transformaciones para estabilizar la varianza

  • Transformacin para homoestacidad de la varianza

    Ejemplo: Se hizo un estudio entre la demanda (Y) y la energa elctrica utilizada (X) durante un cierto periodo de tiempo

  • Transformacin para homoestacidad de la varianza

    Ejemplo: Se hizo un estudio entre la demanda (Y) y la energa elctrica utilizada (X) durante un cierto periodo de tiempo

  • Transformacin para homoestacidad de la varianza

    Se observa que la varianza se incrementa conforme aumenta X

  • Transformacin para homoestacidad de la varianza

    Se observa que la varianza se incrementa conforme aumenta X

  • Transformacin para homoestacidad de la varianza

    Transformando a X por su raz cuadrada se tiene:

  • Transformacin para homoestacidad de la varianza

    Transformando a X por su raz cuadrada se tiene:

  • Transformacin para homoestacidad de la varianza

    Transformando a X por su raz cuadrada se tiene:

  • Regresin lineal mltiple

  • Regresin mltiple

    Cuando se usa ms de una variable independiente para predecir los valores de una variable dependiente, el proceso se llama anlisis de regresin mltiple, incluye el uso de ecuaciones lineales.

    Se asume que los errores u tienen las caractersticas siguientes:

    Tienen media cero y varianza comn 2.Son estadsticamente independientes.Estn distribuidos en forma normal.

  • Regresin mltiple

    Estimacin de los parmetros del modelo

    Se trata de minimizar los errores cuadrticos en:

    El modelo de regresin mltiple en forma matricial es:

    Y = X + = [1 : D] +

    Y es un vector N x 1.

    X es una matriz de orden N x (k + 1), donde la 1. columna es 1s.

    es un vector de orden (k + 1) x 1.

    es un vector de orden N x 1.

    D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k

  • Regresin mltiple

    Estimacin de los parmetros del modelo:

    b = (XX)-1 XY

    El vector de valores ajustados se puede expresar como:

    La varianza del modelo se estima como:

  • Tamao de muestra

    Tomar 5 observaciones para cada una de las variables independientes, si esta razn es menor de5 a 1, se tiene el riesgo de sobreajustar el modelo

    Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente

  • Ejemplo de regresin mltiple

    Un embotellador est analizando las rutas de servicio de mquinas dispensadoras, est interesado en predecir la cantidad de tiempo requerida por el chofer para surtir las mquinas en el local (Y).

    La actividad de servicio incluye llenar la mquina con refrescos y un mantenimiento menor.

    Se tienen como variables el nmero de envases con que llena la mquina (X1) y la distancia que tiene que caminar (X2).

  • Ejemplo de regresin mltiple

  • Ejemplo de regresin mltipleSolucin matricial

  • Ejemplo de regresin mltipleSolucin matricial

  • Ejemplo de regresin mltipleSolucin matricial

  • Ejemplo de regresin mltipleSolucin matricial

    Intervalo de confianza para Beta 1

    Por tanto el intervalo de confianza para el 95% es:

    1.26181 1 1.97001

  • Ejemplo de regresin mltipleSolucin matricial

    El embotellador desea construir un intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo:

    X1 = 8 envases y cuya distancia es X2 = 275 pies.

    La varianza de la Y0 estimada es (tomando M8=inv(XX) :

  • Ejemplo de regresin mltipleSolucin matricial

    El intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo es para 95% de nivel de confianza:

    Que se reduce a: 17.66 Y0 20.78

  • Ejemplo de regresin mltipleSolucin matricial

    El anlisis de varianza es:

  • Ejemplo de regresin mltipleSolucin matricial

    El comportamiento de los residuos es como sigue:

  • Multicolinealidad

    La multicolinealidad implica una dependencia cercana entre regresores (columnas de la matriz X ), de tal forma que si hay una dependencia lineal exacta har que la matriz XX sea singular.

    La presencia de dependencias cercanamente lineales impactan dramticamente en la habilidad para estimar los coeficientes de regresin.

    La varianza de los coeficientes de la regresin son inflados debido a la multicolinealidad. Es evidente por los valores diferentes de cero que no estn en la diagonal principal de XX. Que son correlaciones simples entre los regresores.

  • Multicolinealidad

    Una prueba fcil de probar si hay multicolinealidad entre dos variables es que su coeficiente de correlacin sea mayor a 0.7

    Los elementos de la diagonal principal de la matriz XX se denominan Factores de inflacin de varianza (VIFs) y se usan como un diagnstico importante de multicolinealidad. Para el componente j simo se tiene:

    Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad.

  • Anlisis de los residuos

    Los residuos graficados vs la Y estimada, pueden mostrar diferentes patrones indicando adecuacin o no adecuacin del modelo:

    Grfica de residuos aleatorios cuya suma es cero (null plot) indica modelo adecuado

    Grfica de residuos mostrando una no linealidad curvilnea indica necesidad de transformar las variables

    Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar las variables. Se puede probar con la prueba de Levene de homogeneidad de varianzas

  • Escalamiento de residuos

    En algunos casos es difcil hacer comparaciones directas entre los coeficientes de la regresin debido a que la magnitud de bj refleja las unidades de medicin del regresor Xj. Por ejemplo:

    Para facilitarla visualizacin de residuos ante grandes diferencias en los coeficientes, se sugiere estandarizar o estudentizar los residuos

  • Escalamiento de residuos

    Residuos estandarizadosSe obtienen dividiendo cada residuo entre la desviacin estndar de los residuos

    Despus de la estandarizacin, los residuos tienen una media de 0 y desviacin estndar de 1

    Con ms de 50 datos siguen a la distribucin t, de manera que si exceden a 1.96 (lmite para alfa 0.05) indica significancia estadstica y son outliers

  • Escalamiento de residuos

    Residuos estudentizadosSon similares a los residuos donde se elimina una observacin y se predice su valor, pero adems se elimina la i-sima observacin en el clculo de la desviacin estndar usada para estandarizar la -sima observacin

    Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados

    H = X (XX)-1X es la matriz sombrero o hat matriz.

  • Escalamiento de residuos

    El estadstico PRESS (Prediction Error Sum of Squares) es una medida similar a la R2 en la regresin. Difiere en que se estiman n-1 modelos de regresin.

    En cada modelo se omite una observacin en la estimacin del modelo de regresin y entonces se predice el valor de la observacin omitida con el modelo estimado. El residuo isimo ser:

    El residuo PRESS es la suma al cuadrado de los residuos individuales e indica una medida de la capacidad de prediccin

  • Grficas parciales de regresin

    Para mostrar el impacto de casos individuales es ms efectiva la grfica de regresin parcial. Un caso outlier impacta en la pendiente de la ecuacin de regresin (y su coeficiente).

    Una comparacin visual de la grfica de regresin parcial con y sin la observacin muestra la influencia de la observacin

    El coeficiente de correlacin parcial es la correlacin de la variable independiente Xi la variable dependiente Y cuando se han eliminado de ambos Xi y Y

    La correlacin semiparcial refleja la correlacin entre las variables independiente y dependiente removiendo el efecto Xi

  • Matriz sombrero

    Los puntos de influencia son observaciones substancialmente diferentes de las observaciones remanentes en una o ms variables independientes

    Contiene valores (sombrero en su diagonal) para cada observacin que representa influencia. Representa los efectos combinados de todos las variables independientes para cada caso

  • Matriz sombrero

    Los valores en la diagonal de la matriz sombrero miden dos aspectos:Para cada observacin miden la distancia de la observacin al centro de la media de todas las observaciones de las variables independientes

    Valores altos en la diagonal indica que la observacin tiene mucho peso para la prediccin del valor de la variable dependiente, minimizando su residuoEl rango de valores es de 0 a 1, con media p/n, p es el nmero de predictores y n es el tamao de muestra. Valores lmite se encuentran en 2p/n y 3p/n

  • Distancia de Mahalanobis

    D2 es una medida comparable a los valores sombrero (hat values) que considera slo la distancia de una observacin del valor medio de las variables independientes.

    Es otra forma de identificar outliers

    La significancia estadstica de la distancia de Malahanobis se puede hacer a partir de tablas del texto:Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva York, Wiley, 2984

  • Influencia en coeficientes individuales

    El impacto de eliminar una observacin simple en cada uno de los coeficientes de la regresin mltiple se muestra con la DFBETA y su versin estandarizada SDFBETA.

    Se sugiere aplicar como lmites 1.0 o 2 para tamaos de muestra pequeos y n para muestras medias y grandes

    La distancia de Cook (Di) captura el impacto de una observacin:La dimensin del cambio en los valores pronosticados cuando se omite la observacin y la distancia de las otras observaciones, el lmite es 1 o 4/(n-k-1)

  • Influencia en coeficientes individuales

    La medida COVRATIO estima el efecto de la observacin en la eficiencia del proceso, en sus errores estndar de los coeficientes de la regresin. Considera a todos los coeficientes colectivamente.

    El lmite puede ser establecido en 1 3p/n, los valores mayores al lmite hacen el proceso ms eficiente y los menores ms ineficiente

    La medida SDFFIT es el grado en que cambian los valores ajustados o pronosticados cuando el caso se elimina. El valor lmite es 2*raz((k+1)/(n-k-1))

  • Ejemplo de regresin mltipleSolucin con Excel y Minitab

  • Ejemplo de Regresin Mltiple

    Cat. (US News) GMAT Salario Inicial ($) % Aceptacin

    Stanford1711820007.4

    Harvard26708000012.8

    Penn (Wharton)36627900014.7

    MIT (Sloan)46507800015.1

    Chicago56806500025.0

    Northwestern66607000016.0

    Columbia76608300014.8

    Dartmouth86707000012.6

    Duke96466750020.5

    Berkeley106537000013.3

    Virginia116606600018.9

    Michigan126456500028.0

    NYU136467058320.9

    Carnegie Mellon146406720030.8

    Yale156756500023.5

    U.N.C.166306000019.8

    UCLA176516500017.5

    Texas-Austin186306000027.3

    Indiana196306150044.7

    Cornell206376400025.4

    Rochester216305850036.0

    Ohio State226116100023.2

    Emory236266000033.0

    Purdue246036370020.7

    Maryland256405300018.9

  • Interpretacin de Resultados de Excel- Regresin Multiple

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R0.8749313 R Square0.76550478

    Adjusted R Square0.732005463 Standard Error4050.855918 Observations25

    ANOVA

    dfSS MS F Significance F

    Regression31.12E+09 374977790.122.8513558.17E-07

    Residual213.45E+08 16409433.67

    Total241.47E+09

    Coefficients Standard t Stat P-value Lower 95% U pper 95%

    Error

    Intercept 122481.40 41473.13 2.9532710810.007589 36233.29208729.5

    X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32-513.424

    X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.65965.76118

    X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.95769.49917

  • Resultados de Excel- Regresin slo con slo X1

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R0.855974

    R Square0.732691

    Adjusted R Square0.721069

    Standard Error4132.688

    Observations25

    ANOVA

    dfSSMS F Significance F

    Regression11.08E+091.08E+09 63.042644.88E-08

    Residual233.93E+0817079107

    Total241.47E+09

    Coefficients Standard Errort StatP-valueLower 95% Upper 95%

    Intercept79230.32 1703.95146.498012.98E-2475705.43405 82755.20595

    X Variable1 -910.077 114.6201-7.939944.88E-08-1147.186411 -672.9674353

    Con slo X1, el Modelo se simplifica enormemente

    poca importancia prctica se pierde en R2 (ajustada)

  • La ecuacin de regresin es:

    y = 79230 - 910 x

    Predictor Coef Desv. EstndarTp

    Constante 792301704 46.500.000

    x -910.1114.6-7.940.000

    S = 4133 R2 = 73.3% R2 (ajustada) = 72.1%

    Anlisis de Variancia

    Fuente DFSS MS F p

    Regresin11076712008 1076712008 63.04 0.000

    Error 23392819470 17079107

    Total 241469531477

    Reduccin del Modelo

    Vuelva a correr la regresin usando la categora

    US News, como el nico agente de prediccin (predictor)

    El Modelo se simplifica enormemente..poca

    importancia prctica se pierde en R2 (ajustada)

  • Corrida en Minitab

    Se introducen los datos en varias columnas C1 a C5 incluyendo la respuesta Y (heatflux) y las variables predictoras Xs (North, South, East)

    HeatFluxInsolationEastSouthNorth

    271.8783.3533.5340.5516.66

    264.0748.4536.5036.1916.46

    238.8684.4534.6637.3117.66

    230.7827.8033.1332.5217.50

    251.6860.4535.7533.7116.40

    257.9875.1534.4634.1416.28

  • Corrida en Minitab

    Utilzar el archivo de ejemplo Exh_regr.mtwOpcin: Stat > Regression > RegressionPara regresin lineal indicar la columna de respuesta Y (Score2) y X (Score1)

    En Regresin lienal en opciones se puede poner un valor Xo para predecir la respuesta e intervalos. Las grficas se obtienen Stat > Regression > Regression > Fitted line Plots

    Para regresin mltiple Y (heatflux) y las columnas de los predictores (north, south, east)

  • Resultados de la regresin lineal

    The regression equation is

    Score2 = 1.12 + 0.218 Score1

    Predictor Coef SE Coef T P

    Constant 1.1177 0.1093 10.23 0.000

    Score1 0.21767 0.01740 12.51 0.000

    S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%

    Analysis of Variance

    Source DF SS MS F P

    Regression 1 2.5419 2.5419 156.56 0.000

    Residual Error 7 0.1136 0.0162

    Total 8 2.6556

    Predicted Values for New Observations

    New Obs Fit SE Fit 95.0% CI 95.0% PI

    1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)

    New Obs Score1

    1 7.00

  • Resultados de la regresin lineal

    3044.txt

    Fitted Line Plot: Score2 versus Score1NCNFitted Line Plot: Score2 versus Score1;; HMF V1.24 TEXT;; (Microsoft Win32 Intel 386) HOOPS 5.00-17 I.M. 3.00-17(Selectability "windows=off,geometry=on")(Visibility "on")(Color_By_Index "Geometry,Face Contrast" 1)(Color_By_Index "Window" 0)(Window_Frame "off")(Window -1 1 -1 1)(Camera (0 0 -5) (0 0 0) (0 1 0) 2 2 "Stretched")

    ;; (Driver_Options "no backing storeno borderno control areadisable input,no do;; uble-bufferingno double bufferingno force black-and-whiteno force black and ;; whiteno gamma correctionsubscreen=(-0.999902,-0.476464,-0.99987,-0.301952),n;; o subscreen creatingno subscreen movingno subscreen resizingno subscreen str;; etchingno update interrupts,use window id=1049426")(Edge_Pattern "---")(Edge_Weight 1)(Face_Pattern "solid")(Heuristics "no related selection limit")(Line_Pattern "---")(Line_Weight 1)(Marker_Size 0.421875)(Marker_Symbol ".")(Text_Font "name=arial-gdi-vector,no transforms,rotation=follow path")(User_Options "mtb aspect ratio=0.675953,graphicsversion=6,worksheettitle=\"Exh_regr.MTW\",optiplot=0,builtin=0,statguideid=2151,toplayer=0,angle=0,arrowdir=0,arrowstyle=0,polygon=0,isdata=0,textfollowpath=1,ldfill=0,solidfill=0,3d=0,usebitmap=0,canbrush=0,brushrows=9,light scaling=0.00000,sessionline=-1")(Segment "include" ())(Front ((Segment "figure1" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.649967 -0.59997 0) (0.499975 -0.59997 0) (0.499975 0.59997 0) (-0.649967 0.59997 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text 0.458822 -0.669966 0 "9"))) (Segment "" ( (Text 0.303281 -0.669966 0 "8"))) (Segment "" ( (Text 0.147739 -0.669966 0 "7"))) (Segment "" ( (Text -7.8023e-3 -0.669966 0 "6"))) (Segment "" ( (Text -0.163344 -0.669966 0 "5"))) (Segment "" ( (Text -0.318885 -0.669966 0 "4"))) (Segment "" ( (Text -0.474427 -0.669966 0 "3"))) (Segment "" ( (Text -0.629968 -0.669966 0 "2"))) (Segment "major" ( (Segment "" ((Polyline ((0.458822 -0.59997 0) (0.458822 -0.639968 0) )))) (Segment "" ((Polyline ((0.303281 -0.59997 0) (0.303281 -0.639968 0) )))) (Segment "" ((Polyline ((0.147739 -0.59997 0) (0.147739 -0.639968 0) )))) (Segment "" ((Polyline ((-7.8023e-3 -0.59997 0) (-7.8023e-3 -0.639968 0))))) (Segment "" ((Polyline ((-0.163344 -0.59997 0) (-0.163344 -0.639968 0))))) (Segment "" ((Polyline ((-0.318885 -0.59997 0) (-0.318885 -0.639968 0))))) (Segment "" ((Polyline ((-0.474427 -0.59997 0) (-0.474427 -0.639968 0))))) (Segment "" ((Polyline ((-0.629968 -0.59997 0) (-0.629968 -0.639968 0))))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text -0.719964 0.579971 0 "3.5"))) (Segment "" ( (Text -0.719964 0.075074 0 "2.5"))) (Segment "" ( (Text -0.719964 -0.429823 0 "1.5"))) (Segment "major" ( (Segment "" ((Polyline ((-0.649967 0.579971 0) (-0.689965 0.579971 0 ))))) (Segment "" ((Polyline ((-0.649967 0.075074 0) (-0.689965 0.075074 0 ))))) (Segment "" ((Polyline ((-0.649967 -0.429823 0) (-0.689965 -0.429823 0))))))))))))) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Segment "" ( (Text -0.0749962 -0.734996 0 "Score1"))) (Segment "" ( (Polyline ((-0.629968 -0.59997 0) (0.479976 -0.59997 0))) )))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Text_Path 6.12303e-17 1 0) (Segment "" ( (Selectability "polygons=on!,text=off") (Visibility "polygons=off") (Text_Alignment "v>") (Text_Path 0 1 0) (User_Options "angle=90,polygon=3,linect=1,charct=6") (Polygon ((-0.873407 -0.143496 0) (-0.873407 0.128338 0) (-0.780317 0.128338 0) (-0.780317 -0.143496 0))) (Renumber (Text -0.803589 -0.143496 0 "Score2") 1 "L") (Segment "raw" ((Visibility "off")(Renumber (Text 0 0 0 "Score2") 1 "L"))))) (Segment "" ( (Polyline ((-0.649967 -0.579971 0) (-0.649967 0.579971 0))))))))))))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.63 0.48 -0.58 0.58) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (User_Options "canbrush=1,brushsetup=0,grouping=0") (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 9) (Marker 0.541453 0.129438 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 8) (Marker 0.68158 0.390592 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 7) (Marker 0.961835 0.738796 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 6) (Marker -0.411414 -0.218767 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 5) (Marker 0.821708 0.564694 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 4) (Marker 0.12107 0.129438 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 3) (Marker -0.803771 -0.566972 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 2) (Marker -0.943899 -0.741074 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 1) (Marker -0.411414 -0.218767 0))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "line1" ( (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 2) (Line_Pattern "---") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.381059 0) (-0.556553 -0.351166 0) (-0.514246 -0.321272 0) (-0.471938 -0.291379 0) (-0.429631 -0.261486 0) (-0.387324 -0.231593 0) (-0.345016 -0.2017 0) (-0.302709 -0.171807 0) (-0.260402 -0.141914 0) (-0.218094 -0.112021 0) (-0.175787 -0.0821275 0) (-0.13348 -0.0522344 0) (-0.0911726 -0.0223413 0) (-0.0488653 7.55185e-3 0) (-6.55797e-3 0.037445 0) (0.0357493 0.0673381 0) (0.0780566 0.0972312 0) (0.120364 0.127124 0) (0.162671 0.157017 0) (0.204979 0.186911 0) (0.247286 0.216804 0) (0.289593 0.246697 0) (0.3319 0.27659 0) (0.374208 0.306483 0) (0.416515 0.336376 0) (0.458822 0.366269 0))))))) (Segment "line2" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.290846 0) (-0.556553 -0.265568 0) (-0.514246 -0.240158 0) (-0.471938 -0.214594 0) (-0.429631 -0.188847 0) (-0.387324 -0.162886 0) (-0.345016 -0.13667 0) (-0.302709 -0.110154 0) (-0.260402 -0.083287 0) (-0.218094 -0.0560112 0) (-0.175787 -0.0282673 0) (-0.13348 2.67253e-6 0)(-0.0911726 0.0288487 0) (-0.0488653 0.0583064 0) (-6.55797e-3 0.0883915 0) (0.0357493 0.119097 0) (0.0780566 0.150395 0) (0.120364 0.182239 0) (0.162671 0.214574 0) (0.204979 0.247342 0) (0.247286 0.280482 0) (0.289593 0.313941 0) (0.3319 0.347672 0) (0.374208 0.381632 0) (0.416515 0.415787 0) (0.458822 0.450107 0))))))) (Segment "line3" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.471271 0) (-0.556553 -0.436763 0) (-0.514246 -0.402387 0) (-0.471938 -0.368165 0) (-0.429631 -0.334125 0) (-0.387324 -0.3003 0) (-0.345016 -0.26673 0) (-0.302709 -0.233459 0) (-0.260402 -0.20054 0) (-0.218094 -0.16803 0) (-0.175787 -0.135988 0) (-0.13348 -0.104471 0) (-0.0911726 -0.0735312 0) (-0.0488653 -0.0432027 0) (-6.55797e-3 -0.0135016 0) (0.0357493 0.015579 0) (0.0780566 0.0440677 0) (0.120364 0.0720096 0) (0.162671 0.0994604 0) (0.204979 0.126479 0) (0.247286 0.153125 0) (0.289593 0.179452 0) (0.3319 0.205508 0) (0.374208 0.231333 0) (0.416515 0.256965 0) (0.458822 0.282432 0))))))) (Segment "line4" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.204108 0) (-0.556553 -0.176522 0) (-0.514246 -0.148782 0) (-0.471938 -0.120882 0) (-0.429631 -0.0928156 0) (-0.387324 -0.0645779 0) (-0.345016 -0.0361636 0 ) (-0.302709 -7.56797e-3 0) (-0.260402 0.0212134 0) (-0.218094 0.0501842 0) (-0.175787 0.0793478 0) (-0.13348 0.108707 0) (-0.0911726 0.138263 0) (-0.0488653 0.168018 0) (-6.55797e-3 0.197972 0) (0.0357493 0.228125 0) (0.0780566 0.258475 0) (0.120364 0.289022 0) (0.162671 0.319763 0) (0.204979 0.350695 0) (0.247286 0.381814 0) (0.289593 0.413116 0) (0.3319 0.444596 0) (0.374208 0.47625 0) (0.416515 0.508072 0) (0.458822 0.540057 0))))))) (Segment "line5" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.55801 0) (-0.556553 -0.525809 0) (-0.514246 -0.493763 0) (-0.471938 -0.461877 0) (-0.429631 -0.430157 0) (-0.387324 -0.398608 0) (-0.345016 -0.367236 0) ( -0.302709 -0.336046 0) (-0.260402 -0.305041 0) (-0.218094 -0.274225 0) (-0.175787 -0.243603 0) (-0.13348 -0.213176 0) (-0.0911726 -0.182946 0) (-0.0488653 -0.152914 0) (-6.55797e-3 -0.123082 0) (0.0357493 -0.0934486 0) (0.0780566 -0.0640131 0)(0.120364 -0.0347738 0) (0.162671 -5.7283e-3 0) (0.204979 0.0231263 0) (0.247286 0.0517937 0) (0.289593 0.080278 0) (0.3319 0.108584 0) (0.374208 0.136716 0) (0.416515 0.16468 0)(0.458822 0.192482 0))))))))))))))) (Segment "figure2" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.299985 0.559972 0) (0.299985 0.559972 0) (0.299985 0.839958 0) (-0.299985 0.839958 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.28 0.28 0.58 0.82) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "symbol1" ( (Text_Alignment "v*") (Text_Font "size=0.02539 sru") (User_Options "isdata=0") (Segment "" ( (Text 0 0.668966 0 "S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %"))) (Segment "" ( (Text 0 0.780961 0 "Score2 = 1.11771 + 0.217670 Score1"))))))))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure3" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.499975 -0.79996 0) (0.99995 -0.79996 0) (0.99995 0 0 ) (0.499975 0 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window 0.52 0.98 -0.78 -0.02) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()) (Segment "" ()))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "symbol1" ( (Text_Alignment "v*") (Text_Font "size=0.02539 sru") (User_Options "isdata=0") (Segment "" ( (Text 0.80746 -0.564972 0 "95% PI"))) (Segment "" ( (Text 0.80746 -0.469977 0 "95% CI"))) (Segment "" ( (Text 0.813209 -0.374981 0 "Regression"))))))))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure4" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.499975 -0.79996 0) (0.99995 -0.79996 0) (0.99995 0 0 ) (0.499975 0 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1"))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window 0.52 0.98 -0.78 -0.02) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()))))) (Segment "connect1" ((Color_By_Index "Face Contrast,Line,Edge" 1)(Edge_Pattern "---")(Edge_Weight 1)(Line_Pattern "---")(Line_Weight 1)(Front ((Segment "group1" ( (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 2) (Line_Pattern "---") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 0.124994 0) (-0.299985 0.124994 0))) )))) (Segment "group2" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 -0.124994 0) (-0.299985 -0.124994 0))))))) (Segment "group3" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 -0.374981 0) (-0.299985 -0.374981 0))))))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "annotation" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "toplayer=1") (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "^*")(Text_Font "name=arial-gdi-vector,size=0.05078 sru")(Segment "" ( (Text 0 0.979951 0 "Regression Plot")))))))))))w_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "annotation" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "toplayer=1") (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "^*")(Text_Font "name=arial-gdi-vector,size=0.05078 sru")(Segment "" ( (Text 0 0.979951 0 "Regression Plot")))))))))))

  • Resultados de la regresin Mltiple

    The regression equation is

    HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East

    Predictor Coef SE Coef T P

    Constant 389.17 66.09 5.89 0.000

    North -24.132 1.869 -12.92 0.000

    South 5.3185 0.9629 5.52 0.000

    East 2.125 1.214 1.75 0.092

    S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%

    Analysis of Variance

    Source DF SS MS F P

    Regression 3 12833.9 4278.0 57.87 0.000

    Residual Error 25 1848.1 73.9

    Total 28 14681.9

    Source DF Seq SS

    North 1 10578.7

    South 1 2028.9

    East 1 226.3

  • Resumen de la Regresin

    La regresin slo puede utilizarse con informacin de variables continuas.

    Los residuos deben distribuirse normalmente con media cero.

    Importancia prctica: (R2). Importancia estadstica: (valores p)

    La regresin puede usarse con un predictor X o ms,

    para una respuesta dada

    Reduzca el modelo de regresin cuando sea posible,

    sin perder mucha importancia prctica

  • VI.A.4 Herramientas multivariadas

  • Herramientas multivariadas

    1. Introduccin

    2. Anlisis de componentes principales

    3. Anlisis factorial

    4. Anlisis discriminante

    5. MANOVA

  • Introduccin

    En el anlisis multivariado se incluyen dos o ms variables dependientes Y1, Y2, etc. Consideradas simultneamente para las variables independientes X1, X2, ., Xn

    Normalmente se resuelven con herramientas computacionales tales como Minitab y SPSS.

    Entre las herramientas principales se encuentran:Componentes principales, anlisis factorial, anlisis discriminante, anlisis de conglomerados, anlisis cannico, MANOVA

  • Anlisis de componentes principales

    El anlisis (PCA) y el anlisis factorial (FA) se usan para encontrar patrones de correlacin entre muchas variables posibles y subconjuntos de datos

    Busca reducirlas a un menor nmero de componentes o factores que representen la mayor parte de la varianza.

    Normalmente se requieren al menos cinco observaciones por variable

  • Anlisis de componentes principales

    Pasos de anlisis en MinitabSe usa una matriz de correlacin para determinar la relacin entre componentesLas matrices definen cantidades como eigenvalores y eigenvectoresSe suman los eigenvalores y se calculan las proporciones de cada componenteSe identifican los PC1, PC2, que explican la mayor parte de la varianzaSe puede hacer un diagrama de Pareto como apoyo

  • Ejemplo: Alimentos en Europa

  • Corrida en Minitab

    2Stat > Multivariate > Principal components

    3En Variables, X1, X2, X3, X4, X6, X7, X8, X9

    4En Number of factors to extract, 3. Seleccionar Correlation Matrix

    5Click Graphs y seleccionar Scree Plot, Score plot for first 2 components Loading plot for first 2 components

    8 Click Storage e indicar las columnas donde se guarden los coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2

    9. Click OK en cada uno de los cuadros de dilogo

  • Ejemplo: Alimentos en Europa

    Dos componentes exceden

    El eigenvalor de ref. de 1

  • Ejemplo: Alimentos en Europa

  • Anlisis factorial

    Es una tcnica de reduccin de variables para identificar factores que expliquen la variacin, aunque se reiere un juicio subjetivo.

    Las variables de salida estn relacionadas linealmente con las variables de entrada.

    Las variables deben ser medibles y simtricas. Debe haber cuatro o ms factores de entrada para cada variable independiente

  • Anlisis factorial

    Se especifican un cierto nmero de factores comunes

    El anlisis factorial se hace en dos etapas:Extraccin de factores, para identificar los factores principales para un estudio posteriorRotacin de factores, para hacerlos ms significativos

  • Corrida con Minitab

    2Stat > Multivariate > Factor Analysis.

    3En Variables, X1, X2, X3, X4, X6, X7, X8, X9

    4En Number of factors to extract, 4.

    En Method of Extraction, seleccionar Principal components

    6En Type of Rotation, seleccionar Varimax.

    7Click Graphs y seleccionar Loading plot for first 2 factors y Scree Plot.

    Click Results y seleccionar Sort loadings.

    Seleccionar Storage e indicar columnas para ponderaciones, coeficientes, Zs, eigenvalores, etc.

    Click OK en cada uno de los cuadros de d

  • Ejemplo

  • Ejemplo:

  • Anlisis discriminante

    Si se tiene una muestra con grupos conocidos, el anlisis discriminante clasifica las observaciones o atributos en dos o ms grupos

    Puede utilizarse como herramienta predictiva o descriptiva

    Las variables deben ser multivariadamente normales, con la misma varianza y covarianza poblacional entre variables dependientes, y las muestras exhiben independencia

  • Ejemplo de actividades en pases

  • Corrida con Minitab

    2Stat > Multivariate > Discriminant Analysis.

    3En Groups, poner SalmonOrigin.

    4 En Predictors, poner Freshwater Marine. Click OK.

  • Corrida con Minitab

  • Anlisis de conglomerados

  • Anlisis de conglomerados

    Se usa para determinar agrupaciones o clasificaciones de un conjunto de datos

    Las personas se pueden agrupar por IQ, padres, hbitos de estudio, etc.

    Se trata de dar sentido a grandes cantidades de datos de cuestionarios, ecnuestas, etc.

  • Ejemplo

    Suponer que un estudio de mercado trata de determinar segmentos de mercado en base a los patrones de lealtad de marcas (V1) y tiendas (V2), medidas del 0 al 10 en 7 personas (A-G).

    VariablesV1V2A32B45C47D27E66F77G64

  • Corrida en Minitab

    Stat > Multivariate Anlisis > Cluster Observations Distance Measured Euclidean Seleccionar Show Dendogram OK

  • Anlisis de correlacin cannico

    Prueba la hiptesis de que los efectos pueden tener causas mltiples y de que las causas pueden tener efectos mltiples (Hotelling 1935)

    Es como una regresin mltiple para determinar la correlacin entre dos conjuntos de combinaciones lieneales, cada conjunto puede tener varias variables relacionadas.La relacin de un conjunto de variables dependientes a un conjunto de variables independientes forma combinaciones lineales

  • Anlisis de correlacin cannico

    Se usan los ms altos valores de correlacin para los conjuntos. Los pares de combinaciones lineales se denominan variates cannicas con correlaciones cannicas (Rc con valor mayor a 0.3)

    Por ejemplo se quiere determinar si hay una correlacin entre las caractersticas de un ingeniero industrial y las habilidades requeridas en la descripcin de puesto del mismo ingeniero.

  • MANOVA (Anlisis de varianza mltiple)

    Es un modelo para analizar la relacin entre una o ms variables independientes y dos o ms variables dependientes

    Prueba si hay diferencias significativas en las medias de grupos de una combinancin de respuestas Y.

    Los datos deben ser normales, con covarianza homogenea y observaciones independientes

  • MANOVA (Anlisis de varianza mltiple)

  • Diferencias de ANOVA y MANOVA

  • Ejemplo: Extrusin de pelcula plstica

    Se realiza un estudio para determinar las condiciones ptimas para extruir pelcula plstica.

    Se miden tres respuestas Tear, gloss y opacity cinco veces en cada combinacin de dos factores tasa de extrusin y cantidad de aditivo cada grupo se pone en niveles bajos y altos.

    Se utiliza el MANOVA balanceado para probar la igualdad de las medias.

  • Ejemplo: Extrusin de pelcula plstica

  • Ejemplo: Extrusin de pelcula plstica

    1Abrir el archivo EXH_MVAR.MTW.

    2Seleccionar Stat > ANOVA > Balanced MANOVA.

    3En Responses, poner Tear Gloss Opacity.

    4En Model, poner Extrusion | Additive.

    5Click Results. En Display of Results, seleccionar Matrices (hypothesis, error, partial correlations) y Eigen analysis.

    6 Click OK en cada cuadro de dilogo.

  • Ejemplo

  • Ejemplo: Extrusin de pelcula plstica

    Las matrices SSCP evalan la contribucin a la variabilidad de manera similar a la suma de cuadrados en la ANOVA univariada.

    Las correlaciones parciales entre Tear y Gloss son pequeas. Como la estructura de las correlaciones es dbil, se pueden realizar anlisis univariados de ANOVA para cada una de las respuestas.

  • VI.A.4 Estudios Multivari

  • Estudios Multivari

    La carta multivari permite analizar la variacin dentro de la pieza, de pieza a pieza o de tiempo en tiempo

    Permite investigar la estabilidad de un proceso consiste de lneas verticales u otro esquema en funcin del tiempo. La longitud de la lnea o del esquema representa el rango de valores encontrados en cada conjunto de muestras

  • Estudios Multivari

    La variacin dentro de las muestras (cinco puntos en cada lnea). La variacin de muestra a muestra como posicin vertical de las lneas.

    E

    S

    P

    E

    S

    O

    R

    Nmero de subgrupo

  • Estudios Multivari

    Ejemplo de parte metlica

    Centro ms grueso

  • Estudios Multivari

    Procedimiento de muestreo:Seleccionar el proceso y la caracterstica a investigar

    Seleccionar tamao de muestra y frecuencia de muestreo

    Registrar en una hoja la hora y valores para conjunto de partes

  • Estudios Multivari

    Procedimiento de muestreo:Realizar la carta MultivariUnir los valores observados con una lnea

    Analizar la carta para variacin dentro de la parte, de parte a parte y sobre el tiempo

    Puede ser necesario realizar estudios adicionales alrededor del rea de mxima variacin aparenteDespus de la accin de mejora comprobar con otro estudio Multivari

  • Cartas Multivari

    Su propsito fundamental es reducir el gran nmero de causas posibles de variacin, a un conjunto pequeo de causas que realmente influyen en la variabilidad.

    Sirven para identificar el patrn principal de variacin de entre tres patrones principales:

    Temporal: Variacin de hora a hora; turno a turno; da a da; semana a semana; etc.

    Cclico: Variacin entre unidades de un mismo proceso; variacin entre grupos de unidades; variacin de lote a lote.

  • Cartas Multivari

    Posicional:

    Variaciones dentro de una misma unidad (ejemplo: porosidad en un molde de metal) o a travs de una sola unidad con mltiples partes (circuito impreso).

    Variaciones por la localizacin dentro de un proceso que produce mltiples unidades al mismo tiempo. Por ejemplo las diferentes cavidades de un molde

    Variaciones de mquina a mquina; operador a operador; planta a planta

  • Cartas Multivari

    Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el proceso tres o ms veces a cierto intervalo de tiempo, hasta que al menos el 80% de la variacin en el proceso se ha capturado.

    A

    1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

    VARIACIN POSICIONAL DENTRO DE LA UNIDAD

  • Cartas Multivari

    Ejemplo: (cont...)

    B

    1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

    VARIACIN CCLICA DE UNIDAD A UNIDAD

  • Cartas Multivari

    Ejemplo: (cont...)

    C

    1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

    VARIACIN TEMPORAL DE TIEMPO A TIEMPO

  • Cartas Multivari

    Ejemplo: Un proceso produce flecha cilndricas, con un dimetro especificado de 0.0250 0.001.

    Sin embargo un estudio de capacidad muestra un Cp = 0.8 y una dispersin natural de 0.0025 (6 ) contra la permitida de 0.0002.

    Se tiene pensado comprar un torno nuevo de US$70,000 para tolerancia de 0.0008, i.e. Cpk = 1.25. Se sugiri un estudio Multi Vari previo.

  • Cartas Multivari

    Se tomaron cuatro lecturas en cada flecha, dos a cada lado. Estas muestran una disminucin gradual desde el lado izquierdo al lado derecho de las flechas, adems de excentricidad en cada lado de la flecha.

    La variacin cclica, de una flecha a la siguiente, se muestra mediante las lneas que concentran las cuatro lecturas de cada flecha.

    Tambin se muestra la variacin temporal.

  • Cartas Multivari

    .0.2510

    0.2500

    0.2490

    Mximo

    Mnimo

    Izquierda

    Derecha

    8 AM 9 AM 10 AM 11 AM 12 AM

  • Cartas Multivari

    Un anlisis rpido revela que la mayor variacin es temporal con un cambio mayor entre las 10 AM y las 11 AM.

    A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM, con lecturas similares a las de las 8 AM. Conforme pasa el tiempo las lecturas tienden a decrecer ms y ms, hasta que se invierten a las 10 A.M. en forma drstica.

    Se investig y se encontr que la temperatura tena influencia en la variacin.

    La variacin en temperatura era causada por que la cantidad de refrigerante no era la adecuada, lo cual se notaba ms cuando se paraba el equipo y se volva a arrancar. Se adicion, reduciendo la variacin en 50% aproximadamente..

  • Cartas Multivari

    Tambin se encontr que el acabado cnico era causado por que la herramienta de corte estaba mal alineada. Se ajust, contribuyendo a otra reduccin del 10% de la variabilidad.

    La excentricidad de las flechas se corrigi al cambiar un rodamiento excntrico por desgaste en el torno. Se instal un nuevo rodamiento eliminndose otro 30% de la variabilidad.

    La tabla siguiente muestra un resumen de los resultados.

  • Cartas Multivari

    Tipo de % var.Causas deAccin % de variacin

    VariacinTotalVariacinCorrectivaReducida

    Temporal50Bajo nivel de Adicionar Casi 50

    Tiempo a tiempoRefrigeranterefrigerante

    Dentro de10Ajuste no Ajuste de laCasi 10

    la flechano paraleloherramienta de

    corte

    Dentro de30 RodamientoNuevo Casi 30

    la flechagastadorodamiento

    Flecha a 5-???--

    flecha

  • Cartas Multivari

    Resultados: La variacin total en la siguiente corrida de produccin se redujo de 0.0025 a 0.0004

    El nuevo Cp fue de 0.002 / 0.0004 = 5.0

    Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva mquina.

    Se observa que antes de cambiar equipo o mquinas, es conveniente realizar un estudio de variabilidad para identificar las fuentes de variacin y tratar de eliminarlas.

  • Dimetro de Flecha

    (0.150" +/- .002)

    Programa

    Mquina

    Accesorios

    Operador a operador

    Ejemplo: Bsqueda de fuentes de variacin con el diagrama sistemtico.

    Cartas Multivari

  • Ejemplo (cont..):

    Al realizar la prueba de homogeneidad de varianza F, se encontr que haba una diferencia significante entre los operadores.

    Se Rechaza Ho: Oper1 = Oper2 = Oper3

    Para probar si existe diferencia significativa entre medias de operadores se hacen las siguientes comparaciones

    Ho: Oper1 = Oper2Ho: Oper1 = Oper3

    Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3

    Cartas Multivari

  • Corrida en Minitab

    Se introducen los datos en varias columnas C1 a C3 incluyendo la respuesta (strenght) y los factores (time y Metal)

    SinterTimeMetalTypeStrength

    0.51523

    0.51520

    0.51521

    0.51822

    0.51819

    0.51820

    0.52119

    0.52118

  • Corrida en Minitab

    Utilizar el achivo de ejemplo Sinter.mtw

    Opcin: Stat > Quality Tools > Multivari charts

    Indicar la columna de respuesta y las columnas de los factores

    En opciones se puede poner un ttulo y conectar las lneas

  • Resultados

    3046.txt

    Multi-Vari Chart for Strength by SinterTime - MetalType6KJMulti-Vari Chart for Strength by SinterTime - MetalType;; HMF V1.24 TEXT;; (Microsoft Win32 Intel 386) HOOPS 5.00-17 I.M. 3.00-17(Selectability "windows=off,geometry=on")(Visibility "on")(Color_By_Index "Geometry,Face Contrast" 1)(Color_By_Index "Window" 0)(Window_Frame "off")(Window -1 1 -1 1)(Camera (0 0 -5) (0 0 0) (0 1 0) 2 2 "Stretched")

    ;; (Driver_Options "no backing storeno borderno control areadisable input,no do;; uble-bufferingno double bufferingno force black-and-whiteno force black and ;; whiteno gamma correctionsubscreen=(-0.999902,-0.476464,-0.99987,-0.301952),n;; o subscreen creatingno subscreen movingno subscreen resizingno subscreen str;; etchingno update interrupts,use window id=197438")(Edge_Pattern "---")(Edge_Weight 1)(Face_Pattern "solid")(Heuristics "no related selection limit")(Line_Pattern "---")(Line_Weight 1)(Marker_Size 0.421875)(Marker_Symbol ".")(Text_Font "name=arial-gdi-vector,no transforms,rotation=follow path")(User_Options "mtb aspect ratio=0.675953,graphicsversion=6,worksheettitle=\"Sinter.MTW\",optiplot=0,builtin=0,statguideid=10151,toplayer=0,angle=0,arrowdir=0,arrowstyle=0,polygon=0,isdata=0,textfollowpath=1,ldfill=0,solidfill=0,3d=0,usebitmap=0,canbrush=0,brushrows=27,light scaling=0.00000,sessionline=-1")(Segment "include" ())(Front ((Segment "figure1" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.699965 -0.699965 0) (0.59997 -0.699965 0) (0.59997 0.59997 0) (-0.699965 0.59997 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1"))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text 0.427251 -0.729963 0 "21"))) (Segment "" ( (Text -0.0499975 -0.729963 0 "18"))) (Segment "" ( (Text -0.527246 -0.729963 0 "15"))) (Segment "major" ( (Segment "" ((Polyline ((0.427251 -0.699965 0) (0.427251 -0.699965 0 ))))) (Segment "" ((Polyline ((-0.0499975 -0.699965 0) (-0.0499975 -0.699965 0))))) (Segment "" ((Polyline ((-0.527246 -0.699965 0) (-0.527246 -0.699965 0))))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text -0.769961 0.492559 0 "23.5"))) (Segment "" ( (Text -0.769961 0.311707 0 "22.5"))) (Segment "" ( (Text -0.769961 0.130855 0 "21.5"))) (Segment "" ( (Text -0.769961 -0.0499975 0 "20.5"))) (Segment "" ( (Text -0.769961 -0.23085 0 "19.5"))) (Segment "" ( (Text -0.769961 -0.411702 0 "18.5"))) (Segment "" ( (Text -0.769961 -0.592554 0 "17.5"))) (Segment "major" ( (Segment "" ((Polyline ((-0.699965 0.492559 0) (-0.739963 0.492559 0 ))))) (Segment "" ((Polyline ((-0.699965 0.311707 0) (-0.739963 0.311707 0 ))))) (Segment "" ((Polyline ((-0.699965 0.130855 0) (-0.739963 0.130855 0 ))))) (Segment "" ((Polyline ((-0.699965 -0.0499975 0) (-0.739963 -0.0499975 0))))) (Segment "" ((Polyline ((-0.699965 -0.23085 0) (-0.739963 -0.23085 0 ))))) (Segment "" ((Polyline ((-0.699965 -0.411702 0) (-0.739963 -0.411702 0))))) (Segment "" ((Polyline ((-0.699965 -0.592554 0) (-0.739963 -0.592554 0))))))))))))) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Segment "" ( (Text -0.0499975 -0.794993 0 "MetalType"))) (Segment "" ( (Polyline ((-0.679966 -0.699965 0) (0.579971 -0.699965 0))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.03385 sru") (Text_Path 6.12303e-17 1 0) (Segment "" ( (Selectability "polygons=on!,text=off") (Visibility "polygons=off") (Text_Alignment "v>") (Text_Path 0 1 0) (User_Options "angle=90,polygon=3,linect=1,charct=8") (Polygon ((-0.924467 -0.176635 0) (-0.924467 0.0646314 0)(-0.850721 0.0646314 0) (-0.850721 -0.176635 0))) (Renumber (Text -0.869157 -0.176635 0 "Strength") 1 "L") (Segment "raw" ((Visibility "off")(Renumber (Text 0 0 0 "Strength") 1 "L"))))) (Segment "" ( (Polyline ((-0.699965 -0.679966 0) (-0.699965 0.579971 0))))))))))))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.68 0.58 -0.68 0.58) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (User_Options "canbrush=1,brushsetup=0,grouping=1") (Front ((Segment "group1" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "o") (Segment "" ((User_Value 9)(Marker 0.60603 0.143534 0))) (Segment "" ((User_Value 8)(Marker 0.60603 -0.717667 0))) (Segment "" ((User_Value 7)(Marker 0.60603 -0.4306 0))) (Segment "" ((User_Value 6)(Marker -0.151508 -0.143534 0))) (Segment "" ((User_Value 5)(Marker -0.151508 -0.4306 0))) (Segment "" ((User_Value 4)(Marker -0.151508 0.4306 0))) (Segment "" ((User_Value 3)(Marker -0.909045 0.143534 0))) (Segment "" ((User_Value 2)(Marker -0.909045 -0.143534 0))) (Segment "" ((User_Value 1)(Marker -0.909045 0.717667 0))))) (Segment "group2" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "(+)") (Segment "" ((User_Value 18)(Marker 0.757538 0.4306 0))) (Segment "" ((User_Value 17)(Marker 0.757538 -0.4306 0))) (Segment "" ((User_Value 16)(Marker 0.757538 -0.143534 0))) (Segment "" ((User_Value 15)(Marker -2.22033e-16 0.4306 0))) (Segment "" ((User_Value 12)(Marker -0.757538 -0.4306 0))) (Segment "" ((User_Value 11)(Marker -0.757538 -0.143534 0))) (Segment "" ((User_Value 10)(Marker -0.757538 0.4306 0))))) (Segment "group3" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "(x)") (Segment "" ((User_Value 26)(Marker 0.909045 0.4306 0))) (Segment "" ((User_Value 25)(Marker 0.909045 -0.143534 0))) (Segment "" ((User_Value 24)(Marker 0.151508 -0.143534 0))) (Segment "" ((User_Value 23)(Marker 0.151508 0.717667 0))) (Segment "" ((User_Value 22)(Marker 0.151508 0.143534 0))) (Segment "" ((User_Value 20)(Marker -0.60603 -0.717667 0))) (Segment "" ((User_Value 19)(Marker -0.60603 -0.717667 0))))))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure2" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.699965 -0.699965 0) (0.59997 -0.699965 0) (0.59997 0.59997 0) (-0.699965 0.59997 0))))))) (Segment "legend box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.639968 0.59997 0) (0.859942 0.59997 0) (0.859942 0.314351 0) (0.639968 0.314351 0))))))) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ((Front ((Segment "group1" ( (Color_By_Index "Text" 1) (Color_By_Index "Marker" 2) (Marker_Size 0.527344) (Marker_Symbol "o") (Text_Font "name=arial-gdi-vector,size=0.03385 sru") (Marker 0.689965 0.549034 0) (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "*

  • VI.A.5 Anlisis de datos por atributos

  • Anlisis de datos por atributos

    Si los CTQs son variables continuas, se usa la regresin, dependiendo de la naturaleza de la caracterstica crtica para el cliente (CTSs) como ste la expresa:

    CTS HERRAMIENTA

    Nominal (Verde, Rojo, azul) Regresin Logstica Nominal

    Atributo (Pasa/No pasa) Regresin Logstica Binaria

    Ordinal (1, 2, 3, 4, 5) Regresin Logstica Ordinal

  • Anlisis de datos por atributos

    El anlisis de datos por atributos se organiza en valores, categoras o grupos dicotmicos

    Las decisiones incluyen: si / no, pasa / no pasa, bueno / malo, pobre/justo/bueno/superior/excelente, etc.

    Entre los modelos no lineales de regresin usados se tienen: regresin logstica, regresin logit y regresin probit

  • Anlisis de datos por atributos

    Regresin logsticaRelaciona variables independientes categricas a una variable dependiente (Y). Minitab incluye los modelos binario, ordinal y nominal

    Regresin logitEs subconjunto del modelo log-lineal. Tiene solo una variable dependiente, usa determinaciones de probabilidad o tasa de probabilidad

  • Anlisis de datos por atributos

    Regresin probitEs similar a la prueba de vida acelerada, la unidad se somete a esfuerzo con la respuesta pasa/falla, bueno o malo. Es una respuesta binaria en un tiempo de falla futuro

  • Regresin logstica o binaria

    En caso de informacin cualitativa es necesario traducir las preferencias del cliente expresadas como atributos a un intervalo de valores aceptables de variables (Especificaciones).

  • Regresin logstica o binaria

    Es similar a la regresin mltiple excepto que la respuesta es binaria (si/no, bueno/malo, etc.) Sus coeficientes se determinan por el mtodo de mxima verosimilitud

    Su funcin tiene forma de S, con valores mximos de Cero y Uno.

    Yi = 0, 1

  • Regresin logstica o binaria

    La probabilidad de que el resultado est en cierta categora es:

    El mtodo de clculo del coeficiente b es diferente que en la regresin lineal

    Los coeficientes se determinan con la relacin sig.:

  • Regresin logstica

    Condiciones:Hay solo dos resultados posiblesHay solo un resultado por eventoLos resultados son independientes estadsticamenteTodos los predictores relevantes estn en el modeloEs mutuamente exclusivo y colectivamente exhaustivoLos tamaos de muestra son mayores que para la regresin mltiple

    Los efectos positivos se obtienen con b1>1 y los negativos con b1 e 0 a 1

  • Regresin logstica

    Relacin con ajuste pobre

    Relacin con buen ajuste

  • Regresin logstica - Procedimiento

    Definir el atributo a traducir (y)Definir la variable apropiada para el atributo (x)Definir el modelo matemtico a probarDeterminar los defectos que est dispuesto a aceptarRecolecte informacin de x vs y. Asigne 1 si falla y 0 si es aceptable.Analice la informacin mediante Regresin Logstica Binaria

  • Regresin logstica- Procedimiento

  • Regresin logstica - Procedimiento

    Observe el P-Value de Deviance en la Sesin, debe de ser grande (P >0.10)Obtenga los coeficientes del modelo (De la Sesin)

  • Regresin logstica - Procedimiento

    Construya el modelo de regresin para la probabilidad de falla estar dado por :

    Identifique el(los) valor(es) de x que le generarn como mximo la cantidad de defectos que usted est dispuesto a aceptar [4]

  • Ejemplo de riesgo de paro cardiaco

    Para Fuma, el coeficiente negativo de -1.193 y la tasa de posibilidades de 0.30, indica que quien fuma, tiende a tener una tasa de pulso ms alta que los sujetos que no fuman. Si los sujetos tienen el mismo peso, las posibilidades de que los fumadores tengan un pulso bajo sea slo del 30% de las posibilidades de que los no fumadores tengan un pulso bajo.

  • Regresin logstica ordinal

    Cuando la respuesta CTS es de tipo ordinal (Varias categoras de respuesta como totalmente de acuerdo, de acuerdo, en desacuerdo y totalmente en desacuerdo) y el Factor CTQ es de naturaleza continua, entonces, para definir Especificaciones, la herramienta a utilizar es la Regresin Logstica Ordinal.

  • Regresin logstica ordinal - Procedimiento

    Defina la variable de respuesta a traducir (y CTS)Defina el CTQ (x) variable a relacionar con el CTS Defina el modelo matemtico a probarDetermine los defectos que est dispuesto a aceptar en la categora de intersRecolecte informacin de x vs yAnalice la informacin mediante Regresin Logstica Ordinal

  • Regresin logstica ordinal - Procedimiento

    Stat > Regression > Ordinal Logistic RegressionSeleccione la respuesta (y)Seleccione los trminos que estima tiene el modelo [3]

  • Regresin logstica ordinal - Procedimiento

    Observe el P-Value de Deviance en la Sesin, debe de ser grande (P >0.10)

    Obtenga las constantes y coeficientes del modelo (De la Sesin)

    Construya los modelos de regresin para la probabilidad acumulada por categora

  • Regresin logstica ordinal - Procedimiento

    Identifique el(los) valor(es) de x que le generarn como mximo la

    cantidad de defectos que usted est dispuesto a aceptar en la

    categora de inters [4]

  • Regresin logstica ordinal - Procedimiento

    Una vez que se tienen establecidos los CTQs con los que se medir el desempeo del producto, es necesario indicar las Especificaciones de los mismos