27
Análisis de Datos

Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Embed Size (px)

Citation preview

Page 1: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Análisis de DatosAnálisis de Datos

Page 2: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación.

Síntesis DescriptivaSíntesis Descriptiva

Distribuciones de frecuencia

Medidas de dispersiónMedidas de

tendencia central

Distribución de porcentajes

Page 3: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información.

Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.

Medidas de tendencia central vs. Medidas de dispersión.

Page 4: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Medidas de DispersiónMedidas de Dispersión

Se utilizan para conocer la distancia de los valores de la variable a un cierto valor central. Permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable.

Varianza, Desviación Estándar, y el Rango.

Page 5: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Desviación estándar y Varianza

• La varianza: es la desviación cuadrada de la media. Nunca puede ser negativa.• La desviación estándar es la raíz cuadrada de la varianza.

Se utilizan para hacer generalizaciones estadísticas a partir de la muestra y aplicarlas a la población de donde se extrajeron.

Page 6: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica.

• La desviación estándar es siempre un valor no negativo S será siempre > 0 por definición. Cuando S = 0 è X = xi (para todo i).

• Es la medida de dispersión óptima por ser la más pequeña.

• La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable .

Desviación Estandar (S)

Page 7: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución.

Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética.

• Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza.

• Cuando más cerca estén las Xi a su media menos es la varianza.

• S siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando Xi= X

• La varianza es la medida de dispersión cuadrática

óptima por ser la menor de todas.

Varianza (S2)

Page 8: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Desviación Estándar (S)

Mayor valor del coeficiente Mayor dispersión de los datos del desvío estándar con respecto a su media

Menor valor del coeficiente Menor dispersión de los datos del desvío estándar (Mayor Homogeneidad)

Page 9: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Desviación Estándar (S)

Para Datos Aislados Para Datos Agrupados

1

)( 2_

n

XXS

1

)( 2_

n

XXfS

Page 10: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Desviación Estándar (S)

Para Datos Aislados

1

)( 2_

n

XXS

Edades de 7 personas encuestadas

X X – X (X - X)

10 10 -15,7= - 5,7 32,49

14 14-15,7= -1,7 2,89

15 15 -15,7= -0,7 0,49

16 16 -15,7= 0,3 0,09

18 18 -15,7= 2,3 5,29

18 18 -15,7= 2,3 5,29

19 19 -15,7= 3,3 10,89

Total 57,43

2

09,317

43,57

S

S = 9,572

Page 11: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Desviación Estándar (S)

Calificaciones de 23 personas encuestadas

X F X – X (X - X) f (X - X)

17 2 17 -14= 3 9 18

16 3 16 -14= 2 4 12

15 4 15 -14= 1 1 4

14 5 14 -14= 0 0 0

13 4 13 -14= -1 1 4

12 3 12 -14= -2 4 12

11 2 11 -14= 3 9 18

Total 23 68

2

Para Datos Agrupados1

)( 2_

n

XXfS

2

76,1123

68

S S = 3,1

2

Page 12: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Rango: Es la más elemental de las medidas, consiste simplemente en la distancia entre los dos valores extremos.

Es la diferencia entre el dato mayor y el dato menor.

R = X máx. - X mín.

Rango (R)Rango (R)

Page 13: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Por Ejemplo:

1. Un estudio sobre las marcas de afeitadoras arrojó que en un individuo

logró apenas 6 afeitadas con una marca, mientras que otro logró afeitarse 14

veces con otra marca, así el intervalo es de 14 - 6 con una diferencia de 8

afeitadas que representa el rango.

2. Numero de Comerciales de refrescos que recuerdan los estudiantes de

Mercadeo II son:

1 2 3 4 5 6 7 8 R=?

Rango (R)

R = 7

Page 14: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Resumen de fórmulas

                                                                                                                 

Page 15: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Plan de tabulaciónPlan de tabulación: Disposición ordenada de datos en una tabla u otro formato resumido.

Tabulación y Gráficas

Síntesis GráficaSíntesis Gráfica: Resumir los resultados de la investigación en una forma gráfica.

Page 16: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

• Enumérelas en secuencia

• No use numerales romanos

• El título debe indicar el contenido

• Etiquete las filas y las columnas claramente

• Use formatos estándares y convencionales

Diseñando las tablas de reporte

Page 17: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

• Evite llenar demasiado las tablas

• Haga cada una auto explicativa

• Asegúrese que es limpia, simple y ordenada

• Prueba las tablas en algunas personas para asegurarse de que sean claras

• Inclúyalas después del texto de referencia

Diseñando las tablas de reporte

Page 18: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

• Enumérelos en secuencia

• Cree y use un formato estándar para figura similares

• Los títulos deben indicar que representan las barras y líneas

• Añada etiquetas de valor si las cantidades no se muestran localizadas

Creando Gráficos

Page 19: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

• Haga cada figura lo mas explicativa posible

• Incluya profundidad, sombras y color solo si esto no distrae

• Haga que alguien las revises para saber si son claras

• Incluya las figuras después del texto de ser posible

Creando Gráficos

Page 20: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Síntesis Gráfica

Los tres tipos más comunes son: Diagramas de sectores (Tortas), Diagrama de barras o histogramas.

Page 21: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Diagrama de Sectores (Tortas)

Grafico 1. Sexo de la muestra analizada

Masculino

Femenino

72%

28% Femenino

Masculino

Universitaria

TSU

Secundaria

Postgrado

59%

9%23%9%

Grafico 5. Nivel de Instrucción

Se evidencia la contribución de cada parte a un total.

Page 22: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Diagrama de Barras (Histogramas)Grafico 7. Lugar donde prefieren tomar whisky

Grafico 9. Activos/ Servicios que posee

Sirve para comparar datos entre diferentes

segmentos.

0

5

10

15

20

25

Cafés Fiestas Laborales P laya Casa Disco Casino Concierto Club

18%

23%

12%%

18%

9%

4%

11%%

4%1%

0 20 40 60 80 100 120

73%

99%

73%

90%

Internet

Celular

Telf. fijo

Computadora

Lavaplatos

Microonda

DVD

16%

92%

85%

77%

56%

100%

Secadora

VHS

TV

Page 23: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato.

Ejemplo: Vacunas aplicadas a una población de reses en el Edo. Apure.

Diagrama de Barras (Histogramas)

Page 24: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

El polígono de frecuencias es una representación gráfica de la distribución de frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las bases superiores de los rectángulos del histograma.

Polígonos de Frecuencia

Page 25: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Polígonos de Frecuencia Acumuladas u Ojiva

La misma idea de unir los centros de las bases superiores de los rectángulos de la distribución del histograma de frecuencias acumuladas, da lugar al polígono de frecuencias acumuladas u ojiva.

Page 26: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

Diagrama Línea

Por lo general se usan para mostrar un mismo tipo de dato y su evolución (valor de la acción y el tiempo, número de ventas y precio).

Page 27: Análisis de Datos. Se refiere a la transformación de los datos en bruto en una forma muy resumida que facilitará su comprensión e interpretación. Síntesis

EjercicioEjercicio

Hallar la Media, Mediana, Moda, Rango, Desviación Estándar y la Varianza de la

siguiente serie de datos, que representan las edades de un subgrupo de 13 estudiantes de la

clase de Mercadeo II de UNITEC Guacara. 

23, 19, 18, 23, 20, 22, 21, 20, 25, 23, 24, 22, 18

MEDIDAS DESCRIPTIVAS

    

TENDENCIA CENTRAL (Media, Mediana, Moda).

DISPERSION (Rango, Desviacion Estandar, Varianza)

Desviación Estándar Varianza.

Es el cuadrado de la desviación estándar =  S2

1

)( 2_

n

XXS