ANÁLISIS DESCRIPTIVO DE DATOS.pdf

Embed Size (px)

Text of ANÁLISIS DESCRIPTIVO DE DATOS.pdf

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    1/54

    ANALISIS DESCRIPTIVODE DATOS

    Un motivo para hacer sospecharque la Estadística es más un arteque una ciencia, gira en torno a la

    ambigüedad con que se usa eltérmino “ promedio”. 

    29/04/2016

    CURSO: ESTADÍSTICA GENERAL

    DOCENTE: Mag. Denís Leonor Mendoza

    Rivas

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    2/54

    2

    METODOS PARA EL ANÁLISISDESCRIPTIVO DE DATOS CUANTITATIVOS

    Los cuadros estadísticos, los

    distintos gráficos, que se han

    estudiado hasta ahora son diversas

    maneras de resumir un conjunto de

    datos a pocas cifras, pero se

    requieren medidas más exactas.

    29/04/2016 SEMESTRE 2016 - I

    Las cifras descriptivas o estadística de resumen que se obtienen de un conjunto

    de datos llamado muestra (que es un subconjunto de la población), se llaman

    estadígrafos o estadísticos. 

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    3/54

    3

    Medidas:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    4/54

    4

    (A) Las medidas de posición

    Se refieren al punto medio de una distribución dedatos

    Ejemplo:  A partir del gráfico siguiente, se observa

    que la posición central de la curva B está a laderecha de la posición central de las curvas A y C.Obsérvese que la posición central de la curva A es lamisma que la curva C.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    5/54

    5

    3.1. Las medidas de posición

    En general se denominan promedios.1. Medidas de tendencia central: Los más importantesson la media, la mediana y la moda.

     Aritmética

    Media GeométricaMedidas de Mediana Armónica

    tendencia central Moda

    2. Medidas de localización: cuantiles Cuartiles

    Deciles

    Percentiles

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    6/54

    6

    La Media

    (A) La media aritmética ( )

    a) Obtención: Se obtiene sumando los valoresregistrados y dividiéndolos entre el número

    de datos.

     x

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    7/54

    7

    ál ulos a partir de datos no agrupados, seutilizan las siguientes formulas.Para una muestra 

    donde: : media muestral: suma de todos los datos

    : número de datos (muestra)n

    n

    i  i

     x   1X

     

    Para una población

    donde: : media poblacional: suma de todos los datos

    : número de datos (población)

    iX x

    n

    iX

     N 

     N 

    i  i1X

    N

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    8/54

    8

    Mediaaritmetica

    Se puede calcular la media aritmética utilizando Excel.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    9/54

    9

    Cálculo a partir de datos agrupados. 

    El cálculo de la media aritmética, cuando losdatos disponibles se encuentran en tablas dedistribución de frecuencias, se realiza utilizandola formula siguiente

    donde: :media muestral:frecuencia absoluta de la clase i  :marca de la clase i

    ii

    ii

    i

    ii   nh

    n

    n  f  

    n  f  

    n  f  

    i

    i

    i

    i x   XXX

    1

    1

    1

    1

     x

    i  f  

    iX

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    10/54

    10

     Al tabular las calificaciones de un examen seobtuvieron las siguientes notas: 07, 08, 09,10, 11, 12, 13, 14, 15, 16, 17 y lasfrecuencias del numero de alumnosrespectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2.¿Cuánto es la media, la mediana y la moda

    de las notas?, ¿qué valor escogería como elpromedio?.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    11/54

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    12/54

    12

    Ejemplo

    Cien estudiantes divididos en cuatro grupos A, B, C y Ddan un examen y obtienen un promedio general de 72(calificación centesimal). Los puntajes medios de losgrupos A, B, C son 75, 62 , 80, respectivamente. Losregistros del grupo D se extraviaron; pero se sabe queen el grupo A están el 40% del total de alumnos, en elgrupo B un cuarto del total, en el grupo C habían 15alumnos más que en el grupo D. Determinar el promedio

    del grupo D.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    13/54

    13

    Ejercicio

    En una empresa el sueldo promedio portrabajador es de 360 dólares mensuales,los trabajadores manuales constituyen el40% del total y reciben el ¼ del montodela planilla, ¿cuánto recibe en promediocada trabajador manual?.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    14/54

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    15/54

    15

    La media aritmética ponderada ( ) 

    donde:

    = factor de ponderación

    = datos

    n

    i

    i

    n

    i

    ii

    w

    w

     p x1

    1

    X

     p x

    iw

    iX

    Media Aritmética Ponderada

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    16/54

    16

    Ventajas y desventajas de la media aritmética

    Ventajas: Concepto familiar para muchas personasEs única para cada conjunto de datosEs posible comparar medias de diferentes

    muestrasDesventajas 

    Se ve afectada por los datos extremosSi la muestra es grande y los datos no estánagrupados, su cálculo es tediosoSi los datos están agrupados en clases conextremos abiertos, no es posible calcular lamedia.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    17/54

    17

    (B) La media geométrica ( ) 

    Se utiliza para promediar:

    razones (a/b), índices (a/b en

    %), proporciones (a/(a+b)),

    tasa de cambio (a-b)/b, que

    varían con el tiempo. 

    29/04/2016

    SEMESTRE 2016 - I

     g  x

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    18/54

    18

    (B) La media geométrica ( )Se utiliza para calcular tasas medias de variación,

    como la tasa media de crecimiento poblacional, latasa media de inflación mensual, la tasa media demortalidad, entre otros.

    a) Obtención Se obtiene extrayendo la raíz enésimadel producto de los n valores de una serie.

    Para datos no agrupados:

    Para datos no agrupados:

     g  x

    n g  n x  XXXX   .........

    321

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    19/54

    19

    Ejemplo

    Años Tarifa (S/.)

    2005 2502006 400

    2007 600

    2008 1000

    2009 2000

    •Determinar la tasa promedio de variación del pasajeinterprovincial de Huaraz a Loreto en los últimos años: 

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    20/54

    20

    Ejemplo

    En una empresa, la producción haexperimentado un crecimiento del 25% delprimer al segundo año, del 40% delsegundo al tercero. Determine la tasa promedio de crecimiento

    del primer año al tercero

    Estimar la producción del cuarto año.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    21/54

    21

    Ejemplo

    Suponga que se depositaron $100inicialmente y que se acumulan losintereses a tasas variables de 7, 8, 10, 12y 10% anual, durante 5 años. Hallar elfactor de crecimiento promedio.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    22/54

    22

    (C) La media armónica ( )

    Se utiliza para calcular el tiempo medio, velocidady aceleración media, como por ejemplo, el tiempomedio para realizar determinada cirugía.

    a) Obtención:  se obtiene calculando el inverso dela media aritmética de los inversos de una serie.

    h x

    n

    n

    i i

    h x

    1X

    1

    1

    29/04/2016SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    23/54

    23

    Se utiliza para obtener

     promedios de valores que estánen relación inversa como la

    velocidad y el tiempo. 

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    24/54

    24

    Ejemplo

    Un automovilista recorre un circuito de formacuadrada aplicando en cada ladorespectivamente una velocidad de 20 m/s, 30

    m/s, 40 m/s y u m/s. si la velocidad promedioes 32 m/s, halle u.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    25/54

    25

    Ejemplo

    Un automóvil recorre los 10 primeros Km. a

    razón 30 Km./h y los 10 Km. siguientes a

    razón de 60 Km./h. Determinar la velocidad

    media durante todo el trayecto.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    26/54

    26

    Ejemplo

    Si un restaurante compra S/. 7200 demantequilla a S/. 60 el Kg., S/. 7200 de a S/.72 el Kg. y S/. 7200 de a S/. 90 el Kg.

    Calcular el precio promedio por Kilogramo.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    27/54

    27

    Ejemplo

    La media aritmética entre dos números es100 y su media geométrica 20. Calcule lamedia armónica.

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    28/54

    28

    Ejemplo

    Una ama de casa ha ido comprando durante cuatroaños arroz a distintos precios, el primer año a S/1,2 elkg, el segundo a S/1,4 kg, el tercer año a S/1.6 el kg y elcuarto a S/1.7 el kg. Hallar el costo medio del Kg dearroz durante los 4 años, suponiendo.

    Que el numero de kg consumidos al año es constante

    Que la cantidad de dinero gastado al año sea constante

    Determine la tasa promedio de crecimiento del primeraño al cuarto

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    29/54

    29

    (C) La Mediana

    Es la medida que divide en dos subconjuntosiguales a datos, de tal manera que 50% de losdatos es menor a la mediana y el otro 50% esmayor a la mediana.

    a) Obtención:  Se obtiene ordenando la serie dedatos (en forma ascendente o descendente) y

    ubicando el dato central.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    30/54

    30

    Ejemplo:

    Los siguientes datos se refieren al número detrabajadores que llegaron al trabajo, después de lahora programada durante los últimos 11 días en sucentro de trabajo. Calcule e interprete la mediana.

    12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

    Primero se ordenan lo datos:5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

    5 datos menores 5 datos mayores

    mediana

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    31/54

    31

    Ejemplo:  8, 10, 14, 18, 23, 24, 32, 34

    5.202

    2318mediana

    2º Si la serie es par, la mediana se obtiene de lasemisuma de los dos valores centrales de la seriepreviamente ordenada.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    32/54

    32

    d) Cálculo a partir de datos agrupados.

    donde:: mediana: limite real (o frontera) inferior de la clasemediana.

    : número total de datos.: suma de todas las frecuencias hasta, pero

    sin incluir, la clase mediana.: frecuencia de la clase mediana: amplitud de clase

    c Md   f  

     F n

     Md i

    1i

    2L1

     Md 

    1L

    i

    n

    1i F 

     Md  f  

    c

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    33/54

    33

    e) Ventajas y desventajas Ventajas: 

    Los valores extremos no afectan a la medianacomo en el caso de la media aritmética.Es fácil de calcular, interpretar y entender.Se puede determinar para datos cualitativos,

    registrados bajo una escala ordinal.Desventajas: 

    Como valor central, se debe ordenar primero laserie de datos.

    Para una serie amplia de datos no agrupados, elproceso de ordenamiento de los datos demandatiempo y usualmente provoca equivocaciones.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    34/54

    34

    ( D ) La Moda

    La moda es el valor que más se repite dentro de un

    conjunto de datos.a) Obtención: se obtiene organizando la serie dedatos y seleccionando el o los datos que más serepiten.

    4, 5, 7, 8, 8 , 10, 12, 15

    4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

    7, 12, 15, 18, 25, 30, 31, 38

    Ejemplo : 

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    35/54

    35

    b) Cálculo a partir de datos agrupados

    donde:

    : moda: limite real (o frontera) inferior de la clasemodal (la de mayor frecuencia)

    : frecuencia de la clase modal menos lafrecuencia de la clase anterior

    : frecuencia de la clase modal menos lafrecuencia de la clase siguiente

    : amplitud de clase

    ci

    21

    1LoM

    oM

    iL

    1

    2

    c

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    36/54

    36

    Las clases mediana y modal pueden coincidir peroconceptualmente son diferentes.

    Ejemplo:   La tabla siguiente muestra los errores defacturación durante un mes, en una EMPRESA. Calcule einterprete la moda.

    Interpretación: Durante un mes, el número más frecuente

    de errores de facturación en esta EMPRESA es 6.

    Errores de

    facturación Días

     0 - 4 6

     4 - 8 12Clase

    Modal

      8 - 12 8

      12 - 16 3

      16 - 20 1

    Total 30

    Clase moda : (4 - 7)

    Mo = 6,4

    61

    42

    46

    64 Mo

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    37/54

    37

    e) Ventajas y desventajas de la moda.Ventajas:

    Se puede utilizar tanto para datos cualitativoscomo cuantitativos.No se ve afectada por los valores extremos.Se puede calcular, a pesar de que existan una o

    más clases abiertas.Desventajas:No tiene un uso tan frecuente como la media.Muchas veces no existe moda (distribución

    amodal).En otros casos la distribución tiene variasmodas, lo que dificulta su interpretación.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    38/54

    38

     A continuación se presenta una distribución simétricareferente a los ingresos diarios (S/.), de 100 trabajadoresde una empresa, y en la que se conoce:

    H6-H2=0.72, H5-H3=0.45, H4+H6=1.57,X’5-X’2 = (k-4)A, Mo=19; X’1=12.

    Reconstruya el cuadro de distribución de frecuencias.

    Si la gerencia fija un sueldo mínimo de S/.15 ¿Qué

    porcentaje de trabajadores se beneficiaran con estamedida?

    Hallar el ingreso mínimo del 20% de los de mayoringreso

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    39/54

    39

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    40/54

    40

    Cuantiles

    Son valores que dejan por debajo deél una cierta fracción de los datos

    ordenados en forma creciente y elresto por encima. Cuando la fracciónes la mitad, se trata de la mediana.

    Los más comunes son: Loscuartiles, los deciles, y lospercentiles.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    41/54

    41

    Cuartiles

    Dividen a la distribución de datos en cuatropartes iguales.•Q1= Valor de la variable que deja a la izquierda

    el 25% de la distribución.•Q2= Valor de la variable que deja a la izquierdael 50% de la distribución = mediana.

    •Q3= Valor de la variable que deja a la izquierdael 75% de la distribución.Se presentan dos casos:

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    42/54

    42

    Para datos no agrupados: 

    Para datos agrupados: 

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    43/54

    43

    Deciles

    Dividen a la distribución de datos en 10 partes iguales.

    D1, D2,...,D9, correspondientes a 10%, 20%,...,90%.

    •D1= Valor de la variable que deja a la izquierda el 10%de la distribución.

    •D4= Valor de la variable que deja a la izquierda el 40%

    de la distribución = mediana.

    •D9= Valor de la variable que deja a la izquierda el 90%de la distribución.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    44/54

    44

    Para datos no agrupados: 

    Para datos agrupados: 

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    45/54

    45

    Percentiles

    Dividen a la distribución de datos en 100 partes iguales.P1,...,P99, correspondientes a 1%,...,99%.

    •P1= Valor de la variable que deja a la izquierda el 1% de

    la distribución.•P20= Valor de la variable que deja a la izquierda el 20%de la distribución = mediana.

    •P87= Valor de la variable que deja a la izquierda el 87%de la distribución.

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    46/54

    46

    Para datos no agrupados: 

    Para datos agrupados: 

    29/04/2016

    SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    47/54

    47

    Ejemplo:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    48/54

    48

    Ejemplo:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    49/54

    49

    Ejemplo:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    50/54

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    51/54

    51

    Ejercicio:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    52/54

    52

    Ejercicio:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    53/54

    53

    Ejercicio:

    29/04/2016 SEMESTRE 2016 - I

  • 8/16/2019 ANÁLISIS DESCRIPTIVO DE DATOS.pdf

    54/54

    54