16
SEDE BOGOTA FACULTAD DE CIENCIAS DEPARTAMENTO DE ESTADISITCA ESTADISTICA DESCRIPTIVA Y EXPLORATORIA MARTHA PATRICIA BOHORQUEZ NOMBRES: DENNIS PETER RODRIGUEZ CANTOR Cod: 201312 NICOLAS CASTAÑEDA OLARTE Cod: 97060413006 1. = = ∑� 1()2 ()∑�1 ()2 ∑�2()2 = 12 ()( ) �∑ 1 2 () 2 �∑ 2 2 () 2 = 12 ()( ) 1 2 () 2 2 2 () 2 = 12 ()( ) 1�∑() 2 2�∑() 2 = ()( ) �∑() 2 �∑() 2 A través del ejercicio vemos que el coeficiente de correlación, sin importar las constantes que se tomen para modificar cada variable no afectara el coeficiente de correlación, este será el mismo que el de las variables sin modificar. 2. Los resultados obtenidos para cada conjunto de datos son a. 1ra muestra de datos.

Taller 2 Estadistica Descriptiva.pdf

Embed Size (px)

DESCRIPTION

Algunos ejemplos de varianza, covarianza, coeficiente de correlación de Pearson, diagramas de dispersion y otras herramientas estadísticas aplicadas a algunos ejemplos.

Citation preview

  • SEDE BOGOTA

    FACULTAD DE CIENCIAS DEPARTAMENTO DE ESTADISITCA

    ESTADISTICA DESCRIPTIVA Y EXPLORATORIA MARTHA PATRICIA BOHORQUEZ

    NOMBRES: DENNIS PETER RODRIGUEZ CANTOR Cod: 201312 NICOLAS CASTAEDA OLARTE Cod: 97060413006

    1. =

    = 1( ) 2 ( )1 ( )2 2( )2

    = 12( )( )12( )2 22( )2

    = 12( )( )12 ( )2 22 ( )2

    = 12( )( )1( )2 2( )2

    = ( )( )( )2 ( )2

    A travs del ejercicio vemos que el coeficiente de correlacin, sin importar las constantes que se tomen para modificar cada variable no afectara el coeficiente de correlacin, este ser el mismo que el de las variables sin modificar. 2. Los resultados obtenidos para cada conjunto de datos son

    a. 1ra muestra de datos.

  • # Individuos X Z n1 n2 Promedio(x1) Promedio(x2) 2n1n2(x1-x2)/n^2 Pearson Covarianza

    6

    3,2 -1

    3 3 5,3 4,6 0,35 0,21 0,35

    4,1 1 5,3 -1 3,6 1 8,2 1 5,3 -1

    Tabla 1: verificacin de Pearson a travs de una nueva frmula.

    b. 2da Muestra de datos

    # Individuos X Z n1 n2 Promedio(x1) Promedio(x2) 2n1n2(x1-x2)/n^2 Pearson Covarianza

    6

    4,4 -1

    3 3 8,34 5,67 1,34 0,46 1,34

    3,5 1 7,2 -1

    10,33 1 11,2 1 5,4 -1

    Tabla 2: verificacin de Pearson a travs de una nueva frmula.

    c. 3ra Muestra de datos.

    # Individuos X Z n1 n2 Promedio(x1) Promedio(x2) 2n1n2(x1-x2)/n^2 Pearson Covarianza

    6

    100,1 -1

    3 3 73,93 65 4,47 0,16 4,47

    72,5 1 83,6 -1 74,5 1 74,8 1 11,3 -1

    Tabla 3: verificacin de Pearson a travs de una nueva frmula.

    Como se puede observar en los conjuntos de datos tomados, el coeficiente de correlacin de Pearson no es obtenido a travs de la formula dada, sin embargo como vemos, el valor obtenido para los tres casos dados es el mismo al de la covarianza.

    3. Conjuntos de Datos:

    a. = () () ()2()2 = 1

    ( ) ( ) = ( )2 ( )2 = ( ) ( ) = ( )2 ( )2

  • ( )2 = ( )4 ( )2 = ( )2 Por tanto para que el coeficiente de correlacin de Pearson sea 1 tenemos que tener dos conjuntos de datos con los mismos valores Como ejemplo podemos mostrar:

    x 5,2 3,5 6,8 4,2 6,7 PEARSON 1

    y 5,2 3,5 6,8 4,2 6,7 Tabla 41

    : coeficiente de correlacin igual a 1

    b. = () () ()2()2 = 1

    ( ) ( ) = ( )2 ( )2

    = ( ) ( + ) = ( )2 ( + )2

    ( ) ( ) = ( )2 ( )2

    ( )2 = ( )2 ( )2

    ( )2 = ( )4

    ( )2 = ( )2

    Por tanto para obtener un coeficiente de correlacin igual a -1 se debe tener dos conjuntos de datos iguales pero de signo opuesto. Como ejemplo se muestra:

    x 5,2 3,5 6,8 4,2 6,7 PEARSON -1

    y -5,2 -3,5 -6,8 -4,2 -6,7 Tabla 51: coeficiente de correlacin igual a -1

    1 Para el clculo se realizo la deduccin matemtica.

  • c. Como ejemplo de correlacin de Pearson igual a 0 se obtiene.

    x -2 -1 0 1 2 PEARSON 0 y 2 1 0 1 2

    Tabla 62

    : coeficiente de correlacin igual a 0

    d. Los valores obtenidos para Pearson 0 < rxy < 0.5 son:

    x 1 2 3 4 5 PEARSON 0,10300524 y 3,6 4,2 3,3 4,8 3,5

    Tabla 72: coeficiente de correlacin 0 < rxy < 0.5

    e. Los valores obtenidos para Pearson 0.5 < rxy < 0.9 son:

    x 1 2 3 4 5 PEARSON 0,70710678

    y 1 1 1 1 2 Tabla 82: coeficiente de correlacin 0.5 < rxy < 0.9

    f. Los valores obtenidos para Pearson -0.5 < rxy < 0 son:

    x 1 2 3 4 5 PEARSON

    -0,16799736 y -0,4 -1,3 -4,2 4,2 -5,1

    Tabla 92: coeficiente de correlacin -0.5 < rxy < 0

    g. Los valores obtenidos para Pearson -0.9 < rxy

  • b. Matriz de diagramas de dispersion

    Imagen 2: Matriz de diagramas de dispersin fig 1.

    Las parejas de datos presentes en la matriz presentan, en su mayora, relaciones lineales positivas, que difieren notablemente de las aconsejadas transformaciones para los mismos datos que ha proporcionado el software. Se presentan parejas de datos que tienen relaciones lineales negativas y aquellas que poseen una representacin de su relacin con una lnea horizontal; pero estas dos ltimas se presentan en menor nmero de parejas. Por lo tanto, la gran parte de los datos presentan relacin lineal, positiva en su mayora.

  • c. Grficos de Chernoff

    Imagen 3: Caras de Chernoff fig 1.

    "Height of face" "ID" "width of face" "EST" "structure of face" "ESTSEN" "Height of mouth "BRAZO" "width of mouth" "ANTEB" "smiling" "MANO" "Height of eyes "MUSLO" "width of eyes" "PIERNA" "height of hair " "PIE" "Width of hair" "BRACH" "style of hair" "TIBIO" "height of nose" "ID" "Width of nose" "EST" "width of ear" "ESTSEN" "height of ear " "BRAZO"

    Las caras parece que estn ordenadas ascendentemente; primero las caras con rasgos pequeos, despus aquellas que tiene los rasgos ms grandes y pronunciados. Una alteracin de este orden se ve en las caras 17,18, 19 y 20; donde los rasgos son menores y sus tamaos tambin. Una cara representativa de todos los datos es la nmero 21, cuyas facciones son equilibradas y representan a la gran parte de todo el conjunto. Por lo tanto, el conjunto de datos es muy variado, pero se encuentra una clase de proporcin y semejanza, lo que permite un crecimiento gradual interrumpido por aquellas caras ya mencionadas.

    d. Graficos de Estrellas.

  • Imagen 4: Grafico de estrellas fig 1.

    El conjunto de datos graficado presenta un aumento progresivo en los valores de las observaciones hasta cierto punto y luego decrece tambin de forma gradual. Tambin, se presenta una variacin considerable por la presencia de observaciones tan grandes como las de las estrellas 14 y 25, y tan pequeas como las estrellas 17 y 18. Podra presentarse una agrupacin de aquellas observaciones de valores grandes, y otra de aquellos valores menores.

  • e. Grficos en R3.

    Imagen 4-1: Perspectiva 1 Grafico en R3 de ANTEBR, BRAZO Y MANO.

    Imagen 4-2: Perspectiva 2 Grafico en R3 de ANTEBR, BRAZO Y MANO.

  • f. Para el clculo de la varianza total se tomaron todos los valores de las varianzas individuales y se sumaron.

    EST ESTSEN BRAZO ANTEB MANO MUSLO PIERNA PIE BRACH TIBIO

    TOTAL

    165,8 88,7 31,8 28,1 18,7 40,3 38,9 6,7 88,36 96,53

    169,8 90 32,4 29,1 18,3 43,3 42,7 6,4 89,81 98,61

    170,7 87,7 33,6 29,5 20,7 43,7 41,1 7,2 87,8 94,05

    170,9 87,1 31 28,2 18,6 43,7 40,6 6,7 90,97 92,91

    157,5 81,3 32,1 27,3 17,5 38,1 39,6 6,6 85,05 103,94

    165,9 88,2 31,8 29 18,6 42 40,6 6,5 91,19 96,67

    158,7 86,1 30,6 27,8 18,4 40 37 5,9 90,85 92,5

    166 88,7 30,2 26,9 17,5 41,6 39 5,9 89,07 93,75

    158,7 83,7 31,1 27,1 18,3 38,9 37,5 6,1 87,14 96,4

    161,5 81,2 32,3 27,8 19,1 42,8 40,1 6,2 86,07 93,69

    167,3 88,6 34,8 27,3 18,3 43,1 41,8 7,3 78,45 96,98

    167,4 83,2 34,3 30,1 19,2 43,4 42,2 6,8 87,76 97,24

    159,2 81,5 31 27,3 17,5 39,8 39,6 4,9 88,06 99,5

    170 87,9 34,2 30,9 19,4 43,1 43,7 6,3 90,35 101,39

    166,3 88,3 30,6 28,8 18,3 41,8 41 5,9 94,12 98,09

    169 85,6 32,6 28,8 19,1 42,7 42 6 88,34 98,36

    156,2 81,6 31 25,6 17 44,2 39 5,1 82,58 88,24

    159,6 86,6 32,7 25,4 17,7 42 37,5 5 77,68 89,29

    155 82 30,3 26,6 17,3 37,9 36,1 5,2 87,79 95,25

    161,1 84,1 29,5 26,6 17,8 38,6 38,2 5,9 90,17 98,96

    170,3 88,1 34 29,3 18,2 43,2 41,4 5,9 86,18 95,83

    167,8 83,9 32,5 28,6 20,2 43,3 42,9 7,2 88 99,08

    163,1 88,1 31,7 26,9 18,1 40,1 39 5,9 84,86 97,26

    165,8 87 33,2 26,3 19,5 43,2 40,7 5,9 79,22 94,21

    175,4 89,6 35,2 30,1 19,1 45,1 44,5 6,3 85,51 98,67

    159,8 85,6 31,5 27,1 19,2 42,3 39 5,7 86,03 92,2

    166 84,9 30,5 28,1 17,8 41,2 43 6,1 92,13 104,37

    161,2 84,1 32,8 29,2 18,4 42,6 41,1 5,9 89,02 96,48

    160,4 84,3 30,5 27,8 16,8 41 39,8 6 91,15 97,07

    164,3 85 35 27,8 19 47,2 42,4 5 79,43 89,83

    165,5 82,6 36,2 28,6 20,2 45 42,3 5,6 79,01 94

    167,2 85 33,6 27,1 19,8 46 41,6 5,6 80,65 90,43

    167,2 83,4 33,5 29,7 19,4 45,2 44 5,2 88,66 97,35

    23,94 6,95 2,82 1,74 0,90 5,06 4,39 0,41 18,82 14,29 79,30 Tabla 11: varianza total fig 1.

    g. El conjunto de datos presenta atpicos, los cuales se han presentado en las diferentes dimensiones de las estrellas y las caras. En estos grficos, se ha presentado una gran diferencia de tamaos y dimensiones que ha sido muy

  • notoria; lo cual, sin importar si el crecimiento o decrecimiento fue gradual, perfectamente puede notarse la variacin en las observaciones. En el grfico de R3 se nota perfectamente aquellos dos datos que influyeron en las dimensiones de estrellas y caras, uno por encima del plano y el otro debajo del mismo, los que pueden considerarse como los atpicos de la base usada. Estos dos datos mencionados son los que han influido mayormente en la formacin del diagrama de dispersin, generando el plano visto de acuerdo a sus valores alejados a la relacin lineal de los datos.

    5. Valores de las variables restadas de su media aritmtica.

    EST ESTSEN BRAZO ANTEB MANO MUSLO PIERNA PIE BRACH TIBIO 1,24 3,13 -0,57 0,08 0,12 -2,02 -1,70 0,67 1,65 0,50 5,24 4,43 0,03 1,08 -0,28 0,98 2,10 0,37 3,10 2,58 6,14 2,13 1,23 1,48 2,12 1,38 0,50 1,17 1,09 -1,98 6,34 1,53 -1,37 0,18 0,02 1,38 0,00 0,67 4,26 -3,12

    -7,06 -4,27 -0,27 -0,72 -1,08 -4,22 -1,00 0,57 -1,66 7,91 1,34 2,63 -0,57 0,98 0,02 -0,32 0,00 0,47 4,48 0,64

    -5,86 0,53 -1,77 -0,22 -0,18 -2,32 -3,60 -0,13 4,14 -3,53 1,44 3,13 -2,17 -1,12 -1,08 -0,72 -1,60 -0,13 2,36 -2,28

    -5,86 -1,87 -1,27 -0,92 -0,28 -3,42 -3,10 0,07 0,43 0,37 -3,06 -4,37 -0,07 -0,22 0,52 0,48 -0,50 0,17 -0,64 -2,34 2,74 3,03 2,43 -0,72 -0,28 0,78 1,20 1,27 -8,26 0,95 2,84 -2,37 1,93 2,08 0,62 1,08 1,60 0,77 1,05 1,21

    -5,36 -4,07 -1,37 -0,72 -1,08 -2,52 -1,00 -1,13 1,35 3,47 5,44 2,33 1,83 2,88 0,82 0,78 3,10 0,27 3,64 5,36 1,74 2,73 -1,77 0,78 -0,28 -0,52 0,40 -0,13 7,41 2,06 4,44 0,03 0,23 0,78 0,52 0,38 1,40 -0,03 1,63 2,33

    -8,36 -3,97 -1,37 -2,42 -1,58 1,88 -1,60 -0,93 -4,13 -7,79 -4,96 1,03 0,33 -2,62 -0,88 -0,32 -3,10 -1,03 -9,03 -6,74 -9,56 -3,57 -2,07 -1,42 -1,28 -4,42 -4,50 -0,83 1,08 -0,78 -3,46 -1,47 -2,87 -1,42 -0,78 -3,72 -2,40 -0,13 3,46 2,93 5,74 2,53 1,63 1,28 -0,38 0,88 0,80 -0,13 -0,53 -0,20 3,24 -1,67 0,13 0,58 1,62 0,98 2,30 1,17 1,29 3,05

    -1,46 2,53 -0,67 -1,12 -0,48 -2,22 -1,60 -0,13 -1,85 1,23 1,24 1,43 0,83 -1,72 0,92 0,88 0,10 -0,13 -7,49 -1,82

    10,84 4,03 2,83 2,08 0,52 2,78 3,90 0,27 -1,20 2,64 -4,76 0,03 -0,87 -0,92 0,62 -0,02 -1,60 -0,33 -0,68 -3,83 1,44 -0,67 -1,87 0,08 -0,78 -1,12 2,40 0,07 5,42 8,34

    -3,36 -1,47 0,43 1,18 -0,18 0,28 0,50 -0,13 2,31 0,45 -4,16 -1,27 -1,87 -0,22 -1,78 -1,32 -0,80 -0,03 4,44 1,04 -0,26 -0,57 2,63 -0,22 0,42 4,88 1,80 -1,03 -7,28 -6,20 0,94 -2,97 3,83 0,58 1,62 2,68 1,70 -0,43 -7,70 -2,03 2,64 -0,57 1,23 -0,92 1,22 3,68 1,00 -0,43 -6,06 -5,60

    Tabla 12: valores de las variables restadas de su media aritmtica de la fig 1.

  • a. Matriz de Covarianza

    Imagen 5: matriz de Covarianza de los nuevos datos.

    b. Matriz de Correlacin

    Imagen 6: matriz de Correlacin de los nuevos datos.

    Restando la media de los valores vemos respecto a la matriz de covarianza vemos que en general las caractersticas no tienen gran variacin una respecto a otra como ejemplo vemos Muslo Antebrazo Muslo Pie, con excepcin de algunas que si tienen una variacin mayor como la Pierna Est y Tibia Brach. Tambin podemos observar a travs de la matriz de correlacin que en general las variables no tienen tendencia lineal una respecto a la otra esto quiere decir que los comportamientos en cuanto a los tamaos no tienen parecido entre si, no tienen una relacin fuerte entre ellos.

    6. Valores de las variables restadas de su media aritmtica y dividida su desviacin estndar.

    EST ESTSEN BRAZO ANTEB MANO MUSLO PIERNA PIE BRACH TIBIO

    0,25 1,19 -0,34 0,06 0,13 -0,90 -0,81 1,06 0,38 0,13

    1,07 1,68 0,02 0,82 -0,29 0,44 1,00 0,59 0,71 0,68

    1,25 0,81 0,73 1,12 2,24 0,62 0,24 1,84 0,25 -0,52

    1,30 0,58 -0,81 0,13 0,03 0,62 0,00 1,06 0,98 -0,83

    -1,44 -1,62 -0,16 -0,55 -1,14 -1,87 -0,48 0,90 -0,38 2,09

    0,27 1,00 -0,34 0,74 0,03 -0,14 0,00 0,74 1,03 0,17

    -1,20 0,20 -1,05 -0,17 -0,19 -1,03 -1,72 -0,20 0,95 -0,93

    0,29 1,19 -1,29 -0,85 -1,14 -0,32 -0,77 -0,20 0,54 -0,60

    -1,20 -0,71 -0,75 -0,70 -0,29 -1,52 -1,48 0,11 0,10 0,10

    -0,63 -1,66 -0,04 -0,17 0,55 0,22 -0,24 0,27 -0,15 -0,62

    0,56 1,15 1,45 -0,55 -0,29 0,35 0,57 2,00 -1,90 0,25

    0,58 -0,90 1,15 1,58 0,66 0,48 0,76 1,21 0,24 0,32

    -1,10 -1,54 -0,81 -0,55 -1,14 -1,12 -0,48 -1,77 0,31 0,92

  • 1,11 0,89 1,09 2,18 0,87 0,35 1,48 0,43 0,84 1,42

    0,35 1,04 -1,05 0,59 -0,29 -0,23 0,19 -0,20 1,71 0,54

    0,91 0,01 0,14 0,59 0,55 0,17 0,67 -0,04 0,38 0,62

    -1,71 -1,50 -0,81 -1,84 -1,66 0,84 -0,77 -1,46 -0,95 -2,06

    -1,01 0,39 0,20 -1,99 -0,92 -0,14 -1,48 -1,61 -2,08 -1,78

    -1,95 -1,35 -1,23 -1,08 -1,35 -1,96 -2,15 -1,30 0,25 -0,21

    -0,71 -0,56 -1,71 -1,08 -0,82 -1,65 -1,15 -0,20 0,80 0,77

    1,17 0,96 0,97 0,97 -0,40 0,39 0,38 -0,20 -0,12 -0,05

    0,66 -0,63 0,08 0,44 1,71 0,44 1,10 1,84 0,30 0,81

    -0,30 0,96 -0,40 -0,85 -0,50 -0,99 -0,77 -0,20 -0,43 0,32

    0,25 0,54 0,50 -1,31 0,98 0,39 0,05 -0,20 -1,73 -0,48

    2,21 1,53 1,69 1,58 0,55 1,24 1,86 0,43 -0,28 0,70

    -0,97 0,01 -0,52 -0,70 0,66 -0,01 -0,77 -0,51 -0,16 -1,01

    0,29 -0,25 -1,11 0,06 -0,82 -0,50 1,14 0,11 1,25 2,21

    -0,69 -0,56 0,26 0,89 -0,19 0,13 0,24 -0,20 0,53 0,12

    -0,85 -0,48 -1,11 -0,17 -1,87 -0,58 -0,38 -0,04 1,02 0,27

    -0,05 -0,21 1,57 -0,17 0,45 2,17 0,86 -1,61 -1,68 -1,64

    0,19 -1,13 2,28 0,44 1,71 1,19 0,81 -0,67 -1,78 -0,54

    0,54 -0,21 0,73 -0,70 1,29 1,64 0,48 -0,67 -1,40 -1,48 Tabla 13: valores de las variables restadas de su media aritmtica y dividida su desviacin estndar de la fig 1

    a. Matriz de Covarianza

    Imagen 7: matriz de Covarianza de los nuevos datos

    b. Matriz de Correlacin

    Imagen 8: matriz de Covarianza de los nuevos datos

    Al aplicar la resta y la divisin por la desviacin estndar vemos que se genera una especie de transformacin haciendo que de igual manera los valores de covarianza y correlacin respecto a los valores mximos (cada variable con ella misma), los valores son altos en la mayora de las variables, podramos llegar a la conclusin que los comportamientos aun estando transformados tienden a comportarse de igual manera que en el punto anterior.

  • 7. En Bogot se recolecta la informacin de los contaminantes de origen antropogenico y natural y como se comportan las variables meteorolgicas que determinan el comportamiento de estos compuestos en la atmosfera de Bogot, se cuenta con 13 estaciones que recolectan informacin y datos que se analizan y se validan en una estacin central para en caso de ser necesario tomar medidas de control. Dichas estaciones siendo mviles realizan monitoreo continuo de material particulado, gases contaminantes, variables meteorolgicas de precipitacin entre otras caractersticas relacionadas con la calidad de aire en Bogot, la metodologa se rige por la EPA estadounidense.

    8.

  • Como vemos en cada grafico la medida inicial 0 en todas las variables tiende a llegar hasta uno, teniendo sentido ya que estamos relacionando la variable con ella misma en el tiempo 0 que sera ella misma (la correlacin de una variable con ella misma es 1) y vemos que a travs del tiempo en general tienden a tener un comportamiento decadente, lo que implica que cada variable en el tiempo no tiende a parecerse a ella misma inicialmente en cada medida de 1 - 7, en algunos casos se observa que llega a ser negativa representado una relacin inversa con ella misma en el tiempo.

  • PUNTO 11 TALLER NUMERO 2

    1.

    2.

    0

    5

    10

    15

    20

    1 2 3 4 5 6 7 8

    VARI

    ANZA

    REZAGO

    VARIANZA

    VARIANZA

    0

    0,5

    1

    1,5

    2

    2,5

    1 2 3 4 5 6 7 8 9 10 11

    VARI

    ANZA

    REZAGO

    VARIANZA

    VARIANZA

    REZAGO VARIANZA 1 1,457571429

    2 3,073230769 3 3,402156863 4 4,319347826 5 7,078285714 6 6,940434783 7 9,362727273 8 16,555

    REZAGO VARIANZA 1 1,295529412 2 1,578873239 3 1,428970588 4 1,104745763 5 1,0274 6 1,882195122 7 2,097575758 8 1,6 9 0,902222222

    10 1,4475 11 1,77

  • 3.

    4.

    ANALISIS.

    Solamente los variogramas 1 y 3 tienen comportamientos muy similares. Los variogramas 2 y 4 presentan cierta similitud, pero es mucho menor a comparacin de la pareja mencionada anteriormente.3

    UNIVERSIDAD NACIONAL DE COLOMBIA 2015

    0

    2

    4

    6

    8

    10

    12

    14

    16

    1 2 3 4 5 6 7 8

    VARI

    ANZA

    REZAGO

    VARIANZA

    VARIANZA

    0

    1

    2

    3

    4

    5

    6

    7

    1 2 3 4 5 6 7 8 9 10 11

    VARI

    ANZA

    REZAGO

    VARIANZA

    VARIANZA

    REZAGO VARIANZA 1 1,564782609 2 3,363478261 3 3,62 4 4,687462687 5 6,941219512 6 7,176153846 7 7,86 8 15,128

    REZAGO VARIANZA 1 1,46105802 2 2,783505976 3 2,83902439 4 3,36005814 5 4,632539683 6 4,704222222 7 4,759464286 8 5,971388889 9 0,902222222

    10 1,4475 11 1,77