12
Asignatura MODELOS ESTADÍSTICOS MULTIVARIANTES Profesor Valentín González de Garibay Rafael González- Iglesias

Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

Asignatura MODELOS ESTADÍSTICOS MULTIVARIANTES Profesor Valentín González de Garibay

Rafael González- Iglesias

Page 2: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

1

Rafael González- Iglesias Universidad de Valladolid

CONTENIDO

Contenido ........................................................................................................................................ 1

1. DESCRIPCIÓN ............................................................................................................................... 2

2. HIPOTESIS DEL MODELO ............................................................................................................. 4

2.1 No efecto del factor ............................................................................................................ 4

2.2 Efecto de interacción en robo y asalto(AC) ......................................................................... 6

3. CONTRASTES SIN COLUMBIA ...................................................................................................... 8

3.1 contraste sobre la pena de muerte ................................................................................... 10

4. Conclusión ................................................................................................................................. 10

BIBLIOGRAFÍA .................................................................................................................................... 11

Page 3: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

2

Rafael González- Iglesias Universidad de Valladolid

PROBLEMA 3

1. DESCRIPCIÓN Se quiere estudiar la influencia en los índices de criminalidad en Estados Unidos en función de dos factores, la costa y la pena de muerte. Para ello se tiene un conjunto de datos [1], del que se extrajeron tres índices de criminalidad para el año 2009 y que posteriormente fueron transformados en función del tamaño de la población de los estados. Los datos se subdividieron en los dos factores mencionados:

Con o Sin Costa (C1 C0)

Con o Sin Pena de muerte (PM1 PM0) Las tres variables respuesta que se tienen para los 50 estados disponibles son:

Tasa de Asesinatos (Ases)

Tasa de Robos (Robo)

Tasa de Asaltos con Agravantes (Arma desconocida) (AsAD)

Tasa de Asaltos con Agravantes (Arma propia) (AsAP)

* Todas las tasas son relativas al número de incidentes por 10.000 habitantes Se trata de un problema de análisis de la varianza multivariante con un diseño no balanceado, en el que se tienen cuatro respuestas, dos de ellas pertenecientes a la misma condición (Asalto), y dos factores con dos niveles cada factor. La clasificación de los estados se realizó de acuerdo a la información obtenida en [2] y en [3].

, filas de U~Np(0,Σ) independientes

i: Cada una de las variables respuesta j: Cada nivel del factor costa k: Cada nivel del factor Pena de muerte l: índice de cada individuo del grupo i,j,k (1… njk)

( 4.1)

Antes de comenzar con los contrastes se realiza una descripción visual rápida de los datos del modelo. En la gráfica(1.1) se puede observar que la escala de los crímenes menos violentos impiden una comprensión de la variabilidad de la tasa de asesinatos, que aparece prácticamente horizontal. Por otro lado se aprecian comportamientos similares entre los índices de agresión, siendo los perfiles casi paralelos, salvo por el incremento que se produce en los estados con pena capital.

Page 4: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

3

Rafael González- Iglesias Universidad de Valladolid

También se distingue un mayor índice de asaltos en los estados de interior, sin costa. En general se aprecia que las tasas de criminalidad son menores en los estados sin pena capital con costa que en el resto. No se aprecia claramente que la pena capital sea disuasoria, aunque en este análisis no se tiene en cuenta la tasa de aplicación de dicha sentencia que en estados como Kansas y New Hampshire no se ha aplicado desde 1976 hasta la fecha de obtención de los datos [4].

GRÁFICA ( 1.1 ) INDICES DE CRIMINALIDAD EN LOS 2 NIVELES DE CADA FACTOR

Para tener en cuenta esta marcada diferencia que hace que algunos estados acumulen centenares de ejecutados, mientras que otros la aplican de forma prácticamente simbólica, se añade un tercer nivel al factor pena de muerte, en el que se diferencia entre aquellos estados que ejecutaron en los últimos 20 años a más de 20 sentenciados a muerte, y los que ejecutaron a menos de 12 (hay un salto desde 20 hasta 12 en las sentencias ejecutadas). De esta forma nos queda el gráfico (1.2) se aprecia una mayor variabilidad en los datos, de forma que se muestra que los índices de criminalidad son sensiblemente mayores en los estados que más población ejecutan, mientras que parece que la existencia y no aplicación de la ley, actúa de forma disuasoria, ya que los menores niveles de las tres tasas se encuentran en PM=1 (menos de 12 ejecutados en los últimos 20 años).

0

2

4

6

8

10

12

14

16

18

%Asesinato

%Robos

%Agresion(AD)

%Agresion(AC)

Page 5: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

4

Rafael González- Iglesias Universidad de Valladolid

GRÁFICA ( 1.2 ) INDICES DE CRIMINALIDAD EN LOS NIVELES DE CADA FACTOR

2. HIPOTESIS DEL MODELO

2.1 NO EFECTO DEL FACTOR

Se realiza un primer contraste para evaluar que los efectos de los factores sean significativos. Al ser un modelo no balanceado primero se realiza el contraste sobre cada factor individualmente.

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall costa Effect

H = Type III SSCP Matrix for costa

E = Error SSCP Matrix

S=1 M=1 N=21.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.98592393 0.16 4 45 0.9571

Pillai's Trace 0.01407607 0.16 4 45 0.9571

Hotelling-Lawley Trace 0.01427703 0.16 4 45 0.9571

Roy's Greatest Root 0.01427703 0.16 4 45 0.9571

El contraste para el factor costa revela que no tiene efecto. MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall PenaM Effect

H = Type III SSCP Matrix for PenaM

E = Error SSCP Matrix

S=2 M=0.5 N=21

0

5

10

15

20

25

%Asesinato

%Robos

%Agresion(AD)

%Agresion(AC)

Page 6: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

5

Rafael González- Iglesias Universidad de Valladolid

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.78374199 1.43 8 88 0.1972

Pillai's Trace 0.22894261 1.45 8 90 0.1853

Hotelling-Lawley Trace 0.25974544 1.41 8 60.579 0.2107

Roy's Greatest Root 0.15599281 1.75 4 45 0.1547

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

NOTE: F Statistic for Wilks' Lambda is exact.

De nuevo el factor no tiene efecto. De forma conjunta ninguno de los factores ni la interacción superan el contraste de hipótesis. Contraste para Costa: MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall costa Effect

H = Type III SSCP Matrix for costa

E = Error SSCP Matrix

S=1 M=1 N=19.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.97015588 0.32 4 41 0.8661

Pillai's Trace 0.02984412 0.32 4 41 0.8661

Hotelling-Lawley Trace 0.03076219 0.32 4 41 0.8661

Roy's Greatest Root 0.03076219 0.32 4 41 0.8661

Contraste del factor Pena de muerte: MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall PenaM Effect

H = Type III SSCP Matrix for PenaM

E = Error SSCP Matrix

S=2 M=0.5 N=19.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.80567003 1.17 8 82 0.3276

Pillai's Trace 0.20242363 1.18 8 84 0.3194

Hotelling-Lawley Trace 0.23115706 1.17 8 56.297 0.3343

Roy's Greatest Root 0.17313312 1.82 4 42 0.1434

Contraste para la interacción de los dos factores: Test Criteria and F Approximations for the Hypothesis of No Overall PenaM*costa Effect

H = Type III SSCP Matrix for PenaM*costa

E = Error SSCP Matrix

S=2 M=0.5 N=19.5

Statistic Value F Value Num DF Den DF Pr > F

Page 7: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

6

Rafael González- Iglesias Universidad de Valladolid

Wilks' Lambda 0.76584541 1.46 8 82 0.1837

Pillai's Trace 0.24724663 1.48 8 84 0.1763

Hotelling-Lawley Trace 0.28865166 1.46 8 56.297 0.1930

Roy's Greatest Root 0.20544094 2.16 4 42 0.0905

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

NOTE: F Statistic for Wilks' Lambda is exact.

El contraste sobre la variable pena de muerte ha empeorado y el de costa sigue teniendo un p-valor muy elevado. Puesto que se trata de un ejercicio didáctico se prosigue con los posibles análisis, a pesar de que los anteriores resultados indicarían que este no es un buen camino a seguir. Ni la pena capital ni la situación geográfica en zonas de costas son factores significativos a la hora de explicar la variabilidad de estos índices de criminalidad.

2.2 EFECTO DE INTERACCIÓN EN ROBO Y ASALTO(AC)

A través de la visión de los gráficos(2.2), se puede plantear la hipótesis de que existe un efecto de interacción entre los factores para el asalto y robo con arma propia. Se trata de un contraste de paralelismo de perfiles.

- constante sobre el factor costa en presencia del factor pena de muerte

(

)

Se contrasta que la diferencia entre estados sin costa y con costa es constante: (SinC-ConC)PM=0 =(SinC-ConC)PM=1

(SinC-ConC)PM=0 =(SinC-ConC)PM=2

….

(

)

En el código SAS cada condición se escribe como una fila, por lo que quedaría:

M=(0 1 0 0,

0 0 0 1)

Page 8: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

7

Rafael González- Iglesias Universidad de Valladolid

GRÁFICA ( 4.1 ) REPRESENTACIÓN DE LA VARIACIÓN DE LOS ÍNDICES DE CRIMINALIDAD EN FUNCIÓN DEL

FACTOR COSTA PARA CADA NIVEL DEL FACTOR PENA DE MUERTE MANOVA Test Criteria and F Approximations for the

Hypothesis of No Overall MUi para PA-Med Effect

on the Variables Defined by the M Matrix Transformation

H = Contrast SSCP Matrix for MUi para PA-Med

E = Error SSCP Matrix

S=2 M=-0.5 N=20.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.92121412 0.90 4 86 0.4674

Pillai's Trace 0.07880913 0.90 4 88 0.4662

Hotelling-Lawley Trace 0.08549873 0.91 4 50.578 0.4639

Roy's Greatest Root 0.08520250 1.87 2 44 0.1655

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

NOTE: F Statistic for Wilks' Lambda is exact.

No se supera el contraste de nuevo. A la vista de unos resultados tan negativos se realizó una búsqueda de observaciones que pudiesen estar empeorando el análisis de modelo.

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

0.65

Asesinato

%AsesinatosinCosta

%AsesinatoconCosta

10

12

14

16

18

20

22

Asalto (AD)

%Asalto(AD)sinCosta

%Asalto(AD)conCosta

4

5

6

7

8

9

10

11

12

13

14

Robo

%Robo sinCosta

%Robo conCosta

4

4.5

5

5.5

6

6.5

7

7.5

8

8.5

Asalto (AC)

%Asalto(AC)sinCosta

%Asalto(AC)conCosta

Page 9: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

8

Rafael González- Iglesias Universidad de Valladolid

Se encontró que el estado del Distrito de Columbia es un punto demasiado alejado de cualquier otro comportamiento de las demás 49 observaciones, con índices de asesinato y robo que duplican y triplican los índices de los demás estados, siendo también el estado con mayor tasa de agresión.

3. CONTRASTES SIN COLUMBIA Al repetir el análisis cambian los contrastes sin este Outlier. Las gráficas también cambian, por lo que se repiten los pasos.

GRÁFICA ( 3.1 ) INDICES DE CRIMINALIDAD EN LOS NIVELES DE CADA FACTOR

Al repetir los contrastes se observa que en esta ocasión la pena de muerte sí es significativa: MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall PenaM Effect

H = Type III SSCP Matrix for PenaM

E = Error SSCP Matrix

S=2 M=0.5 N=20.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.59953995 3.13 8 86 0.0037

Pillai's Trace 0.42559356 2.97 8 88 0.0054

Hotelling-Lawley Trace 0.62602423 3.32 8 59.152 0.0034

Roy's Greatest Root 0.54977202 6.05 4 44 0.0006

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

NOTE: F Statistic for Wilks' Lambda is exact.

0

5

10

15

20

25

%Asesinato

%Robos

%Agresion(AD)

%Agresion(AC)

Page 10: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

9

Rafael González- Iglesias Universidad de Valladolid

GRÁFICA ( 3.2 ) REPRESENTACIÓN DE LA VARIACIÓN DE LOS ÍNDICES DE CRIMINALIDAD EN FUNCIÓN DEL

FACTOR COSTA PARA CADA NIVEL DEL FACTOR PENA DE MUERTE La única condición para la que sería razonable plantear la hipótesis de interacción entre los dos factores sería en robo ya que en asalto(AC) la escala es muy pequeña. El resultado es el siguiente: MANOVA Test Criteria and Exact F Statistics for the

Hypothesis of No Overall MUi para PA-Med Effect

on the Variables Defined by the M Matrix Transformation

H = Contrast SSCP Matrix for MUi para PA-Med

E = Error SSCP Matrix

S=1 M=0 N=20.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.92244447 1.81 2 43 0.1763

Pillai's Trace 0.07755553 1.81 2 43 0.1763

Hotelling-Lawley Trace 0.08407610 1.81 2 43 0.1763

Roy's Greatest Root 0.08407610 1.81 2 43 0.1763

De nuevo no se supera el contraste, por lo que la variación no es producto de una interacción entre los factores.

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

0.65

Asesinato

%AsesinatosinCosta

%AsesinatoconCosta

10

12

14

16

18

20

22

Asalto (AD)

%Asalto(AD)sinCosta

%Asalto(AD)conCosta

4

5

6

7

8

9

10

11

12

13

14

Robo

%Robo sinCosta

%Robo conCosta

4

4.5

5

5.5

6

6.5

7

7.5

8

8.5

Asalto (AC)

%Asalto(AC)sinCosta

%Asalto(AC)conCosta

Page 11: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

10

Rafael González- Iglesias Universidad de Valladolid

3.1 CONTRASTE SOBRE LA PENA DE MUERTE

Puede plantearse la hipótesis de que los niveles 1 y 2 de la pena de muerte son iguales, es decir se observa el mismo comportamiento tanto si hay pena de muerte pero no se aplica, como si no hay pena de muerte. Puesto que el factor Costa no superaba los contrastes no se tendrá en cuenta en el modelo.

(

)

( )

MANOVA Test Criteria and Exact F Statistics for the

Hypothesis of No Overall MUi para PA-Med Effect

H = Contrast SSCP Matrix for MUi para PA-Med

E = Error SSCP Matrix

S=1 M=1 N=20.5

Statistic Value F Value Num DF Den DF Pr > F

Wilks' Lambda 0.92438603 0.88 4 43 0.4843

Pillai's Trace 0.07561397 0.88 4 43 0.4843

Hotelling-Lawley Trace 0.08179913 0.88 4 43 0.4843

Roy's Greatest Root 0.08179913 0.88 4 43 0.4843

El p-valor es mayor que 0.05, por lo que podemos considerar que no tener pena de muerte y tenerla pero no aplicarla causan el mismo efecto sobre los índices de criminalidad.

4. Conclusión Se ha hecho un ejercicio de desarrollo para el planteamiento “Es significativo en los índices de criminalidad la ley de la pena de muerte, y la localización geográfica basada en diferenciar entre los estados de costa”. A lo largo del ejercicio se han planteado diferentes problemas. Primero se desarrolló una tercera clasificación para el factor pena de muerte. Inicialmente el no haber hecho un análisis previo de puntos Outlier causó que los resultados obtenidos no fuesen concluyentes. Posteriormente se realizó la detección encontrando que el estado de Distrito de Columbia tenía unos índices de criminalidad muy superiores a los del resto de estados. Al eliminar el Outlier se contrastó que la pena de muerte sí es significativa en los índices de criminalidad mientras que el factor Costa no lo era. Por último se contrastó que se consigue lo mismo no teniendo ley capital que teniéndola y no aplicándola. Como visión final se obtiene que en los estados sin pena capital o que no la practican hay índices de criminalidad significativamente inferiores a los del resto de estados.

Page 12: Rafael González- Iglesiasvalentin/mem/2015/trabajos_alumnos_14-15/...3 Rafael González- Iglesias Universidad de Valladolid También se distingue un mayor índice de asaltos en los

11

Rafael González- Iglesias Universidad de Valladolid

BIBLIOGRAFÍA

[1] FBI, 2011. [En línea]. Available: http://www.theguardian.com/news/datablog/interactive/2013/jan/14/all-our-datasets-index.

[2] Wikipedia, «Wikipedia,» 11 11 2014. [En línea]. Available: http://www.deathpenaltyinfo.org/states-and-without-death-penalty.

[3] DeathPenaltyInformationCenter, «deathpenaltyinfo,» 2015. [En línea]. Available: http://www.deathpenaltyinfo.org/states-and-without-death-penalty.

[4] D. P. Center, «deathpenaltyinfo,» 2015. [En línea]. Available: http://www.deathpenaltyinfo.org/state-execution-rates?scid=8&did=477.