65
1 José Antonio Robles Flores © 2014 Análisis de Datos para la Gerencia CURSO: Análisis de Datos para la Gerencia José Antonio Robles Flores Sistemas de Información y Métodos Cuantitativos ESAN Graduate School of Business Lima - Peru Basado en: Levine; Krehbiel & Berenson 2014. Estadística para Administración 6ta Edición. Pearson.

MBATPg3 201408 AnalisisDatos S04 MedidasNumericasDescriptivas

Embed Size (px)

DESCRIPTION

Medidas numéricas descriptivas - Análisis de datos

Citation preview

1 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

CURSO: Análisis de Datos para la Gerencia

José Antonio Robles Flores

Sistemas de Información y Métodos Cuantitativos

ESAN Graduate School of Business

Lima - Peru

Basado en: Levine; Krehbiel & Berenson 2014.

Estadística para Administración 6ta Edición.

Pearson.

2 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

CURSO: Análisis Cuantitativo para la Gerencia

SESSION 04: Medidas Numéricas Descriptivas

(Capítulo 03)

Basado en: Levine; Krehbiel & Berenson 2014. Estadística para

Administración 6ta Edición. Pearson.

3 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Medidas numéricas

• Medidas de posición (o localización)

– Media

– Mediana

– Moda

– Percentiles

– Cuartiles

• Medidas de Variabilidad

– Rango

– Rango intercuartiles (intercuartílico)

– Varianza

– Desviación Estándar

– Coeficiente de Variación

• Forma

– Sesgo

4 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Medidas de Resumen

Media Aritmética

Mediana

Moda

Descripción Numérica de la Data

Varianza

Desviación Estándar

Coeficiente de Variación

Rango

Rango Intercuartiles

Sesgo

Tendencia Central Variabilidad Forma Percentiles

Cuartiles

5 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Media Aritmética

• La media aritmética (media de la muestra) es la

medida de tendencia central más común

– Para una muestra de tamaño n: (para la población: µ

Tamaño de la muestra

n

XXX

n

X

X n21

n

1i

i

Valores observados

6 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

La Media Aritmética (continuación)

• La medida de tendencia central más común

• Media = suma de valores dividido entre el número de

valores

• Se ve afectada por los valores extremos (outliers)

0 1 2 3 4 5 6 7 8 9 10

Media = 3

0 1 2 3 4 5 6 7 8 9 10

Media = 4

35

15

5

54321

4

5

20

5

104321

7 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Mediana

• En un arreglo ordenado, la mediana es el número

en el “medio” (50% por arriba, 50% por debajo)

• No se ve afectada por los valores extremos

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

8 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Hallando la Mediana

• La localización de la mediana:

– Si el número de valores es impar, la mediana es el número en el

medio

– Si el número de valores es par, la mediana es el promedio de los dos

números del medio

• Note que no es el valor de la mediana, solo la posición

de la mediana en la data ordenada

ordenadadatalaenposiciónn

MedianaladePosición2

1

2

1n

9 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Una medida de tendencia central

• El valor que ocurre más frecuentemente

• No está afectado por los valores extremos

• Se utiliza tanto para datos numéricos como

categóricos (nominales)

• Es posible que no haya una moda

• Pueden haber varias modas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

No hay Moda

Moda

10 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Cinco casas de playa en una loma

$2,000 K

$500 K

$300 K

$100 K

$100 K

Precios de la

Casas:

$2,000,000

500,000

300,000

100,000

100,000

Ejemplo de Repaso

11 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Media: ($3,000,000/5)

= $600,000

• Mediana: valor medio de datos

ordenados

= $300,000

• Moda: el valor más frecuente

= $100,000

Precios de las

casas:

$2,000,000

500,000

300,000

100,000

100,000

Suma $3,000,000

Ejemplo de Repaso: Estadísticas de Resumen

12 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• La media es la que generalmente se utiliza a menos que hallan valores extremos (outliers).

• Luego, la mediana es la más utilizada, puesto que la mediana no es sensible a los valores extremos. – Ejemplo: La mediana de los precios de las

casas es un valor que se puede reportar para una región – es menos sensible a los valores extremos

¿Qué medida de ubicación es la “mejor”?

13 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Percentiles

• Un percentil proporciona información sobre la

distribución de los datos en el intervalo de los datos

(del valor menor al valor mayor).

• Por ejemplo, los resultados del GMAT (o del

examen de admisión a ESAN) se reportan en

términos de percentiles.

• El p-ésimo percentil es un valor tal que por lo menos

p por ciento de las observaciones es menor o igual

a este valor y por lo menos (100-p) es mayor o igual

a ese valor.

14 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Ordenar los datos en orden ascendente.

Computar el índice i, la posición del p-ésimo percentil

i = (p/100)n

Si i no es un entero, redondear. El p-ésimo percentil es el valor en la i-ésima posición.

Si i es un entero, el p-ésimo percentil es el promedio de los valores en las posiciones i e i +1.

Percentiles

15 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Ejemplo para el percentil 80

i = (p/100)n = (80/100)70 = 56

Promediando los valores de los datos 56avo y 57avo:

Percentil 80 = (535 + 549)/2 = 542

Nota: Los datos están en orden ascendente.

Ejemplo: Alquiler de Departamentos

425 430 430 435 435 435 435 435 440 440

440 440 440 445 445 445 445 445 450 450

450 450 450 450 450 460 460 460 465 465

465 470 470 472 475 475 475 480 480 480

480 485 490 490 490 500 500 500 500 510

510 515 525 525 525 535 549 550 570 570

575 575 580 590 600 600 600 600 615 615

16 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Ejemplo para el percentil 80

Ejemplo: Alquiler de Departamentos

425 430 430 435 435 435 435 435 440 440

440 440 440 445 445 445 445 445 450 450

450 450 450 450 450 460 460 460 465 465

465 470 470 472 475 475 475 480 480 480

480 485 490 490 490 500 500 500 500 510

510 515 525 525 525 535 549 550 570 570

575 575 580 590 600 600 600 600 615 615

Por lo menos el 80% de los ítems toman un valor de 542 o menos

56/70 = .8 or 80% 14/70 = .2 or 20%

Por lo menos el 20% de los ítems toman un valor de 542 o más

17 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Cuartiles

• Los cuartiles dividen la data ordenada en 4 segmentos con igual número de valores por segmento

25% 25% 25% 25%

• El primer cuartil, Q1, es el valor para el cual 25% de las observaciones son más pequeñas y 75% más grandes

• Q2 es igual a la mediana (50% más pequeñas, 50% más grandes)

• Sólo 25% de las observaciones son más grandes que el tercer cuartil

Q1 Q2 Q3

18 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Encontrar un cuartil determinando el valor en la posición

apropiada en la data ordenada, donde

Posición del primer cuartil: Q1 = (n+1)/4

Posición del segundo cuartil: Q2 = (n+1)/2 (posición de la mediana)

Posición del tercer cuartil: Q3 = 3(n+1)/4

donde n es el número de valores observados

Fórmulas para los cuartiles

19 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

(n = 9)

Q1 está en la posición (9+1)/4 = 2.5 de la data ordenada,

entonces, utilizar el valor en medio del 2do y 3er valor,

entonces Q1 = 12.5

Cuartiles

Sample Data in Ordered Array: 11 12 13 16 16 17 18 21 22

• Ejemplo: Encuentre el primer cuartil

Q1 y Q3 son medidas de ubicación no-central

Q2 = mediana, una medida de tendencia central

20 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

(n = 9)

Q1 está en la posición (9+1)/4 = 2.5 de la data ordenada,

entonces Q1 = 12.5

Q2 está en la posición (9+1)/2 = 5th de la data ordenada,

entonces Q2 = mediana = 16

Q3 está en la posición 3(9+1)/4 = 7.5 de la data ordenada,

entonces Q3 = 19.5

Cuartiles (continuación)

Data muestral en arreglo ordenado: 11 12 13 16 16 17 18 21 22

• Ejemplo:

21 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Mismo centro,

diferente variación

Medidas de Variación (o Variabilidad)

Variación

Varianza Desviación

Estándar

Coeficiente

de Variación

Rango Rango

Intercuartil

• Las medidas de variación

brindan información

respecto a la dispersión o

variabilidad de los valores

de la data

22 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Rango

• La medida de variación más simple

• La diferencia entre los valores más grande y

más pequeño en un conjunto de datos:

Rango = Xmás grande – Xmás pequeño

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rango = 14 - 1 = 13

Ejemplo:

23 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Ignora la forma en que la data está distribuida

• Sensible a los valores extremos

7 8 9 10 11 12

Rango = 12 - 7 = 5

7 8 9 10 11 12

Rango = 12 - 7 = 5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Rango = 5 - 1 = 4

Rango = 120 - 1 = 119

Desventajas del Rango

24 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Puede eliminar algunos problemas de valores extremos utilizando el rango intercuartil

• Eliminar algunas observaciones grandes y pequeñas y calcular el rango de los valores que quedan

• Rango Intercuartil = 3er cuartil – 1er cuartil

= Q3 – Q1

Rango Intercuartil

25 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Mediana

(Q2) X

máximo X mínimo Q1 Q3

Ejemplo:

25% 25% 25% 25%

12 30 45 57 70

Rango Intercuartil

= 57 – 30 = 27

Rango Intercuartil

26 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Promedio (aproximadamente) del cuadrado de las

desviaciones de los valores desde la media

– Varianza de la muestra:

Varianza

1-n

)X(X

S

n

1i

2

i2

Donde = media

n = tamaño de la muestra

Xi = iésimo valor de la variable X

X

27 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Desviación Estándar

• La medida de variabilidad más utilizada

• Muestra la variación sobre la media

• Es la raíz cuadrada de la varianza

• Tiene las mismas unidades que la data original

– Desviación estándar

de la muestra:

1-n

)X(X

S

n

1i

2

i

28 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Data de la

Muestra (Xi) : 10 12 14 15 17 18 18 24

n = 8 Media = X = 16

4.30957

130

18

16)(2416)(1416)(1216)(10

1n

)X(24)X(14)X(12)X(10S

2222

2222

Medida de la dispersión “promedio”

alrededor de la media

Ejemplo de cálculo:

Desviación estándar de la muestra

29 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Desviación estándar pequeña

Desviación estándar grande

Midiendo la variabilidad

30 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Comparando Desviaciones Estándar

Media = 15.5

S = 3.338 11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Data B

Data A

Media = 15.5

S = 0.926

11 12 13 14 15 16 17 18 19 20 21

Media = 15.5

S = 4.567

Data C

31 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Todos los valores en el conjunto de datos se utilizan

en el cálculo

• Los valores distantes de la media tienen un peso

extra

(porque las desviaciones de la media están elevadas al

cuadrado)

Ventajas de la Varianza y la Desviación Estándar

32 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Coeficiente de Variación

• Mide la variación relativa

• Siempre en porcentajes (%)

• Muestra la variación relativa a la media

• Puede utilizarse para comparar dos o más

conjuntos de datos medidos en diferentes unidades

100%X

SCV

33 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Acción A:

– Precio promedio el año pasado = $50

– Desviación estándar = $5

• Acción B:

– Precio promedio el año pasado = $100

– Desviación estándar = $5

Ambas

acciones tienen

la misma

desviación

estándar, pero

la acción B es

menos variable

en relación a su

precio

10%100%$50

$5100%

X

SCVA

5%100%$100

$5100%

X

SCVB

Comparando coeficientes de variación

34 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Medidas de Distribución

• Forma de la distribución

• Valores (o puntuaciones) z

• El Teorema de Chebyshev

• La Regla Empírica

• Detección de valores extremos (atípicos)

35 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Forma de la Distribución

• Describe cómo está distribuida la data

• Medidas de la forma

– Simétrica o sesgada

Media = Mediana Media < Mediana Mediana < Media

Sesgada a la

Derecha

Sesgada a la

Izquierda

Simétrica

36 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Forma de la Distribución: Sesgo

Una medida importante de la forma de una distribución es llamada sesgo.

La fórmula para el sesgo de una muestra de datos es:

El sesgo es computado por un paquete estadístico.

3

21 s

xx

))(n(n

nSesgo i

37 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Simétrica (no hay sesgo) F

recu

enci

a R

elat

iva

.05

.10

.15

.20

.25

.30

.35

0

Sesgo = 0

Sesgo es cero.

La media y la mediana son iguales.

Forma de la Distribución: Sesgo

38 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Fre

cuen

cia

Rel

ativ

a

.05

.10

.15

.20

.25

.30

.35

0

Moderadamente sesgada a la izquierda

Sesgo = .31

Sesgo es negativo.

La media será usualmente menos que la mediana.

Forma de la Distribución: Sesgo

39 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Moderadamente sesgada a la derecha F

recu

enci

a R

elat

iva

.05

.10

.15

.20

.25

.30

.35

0

Sesgo = .31

Sesgo es positivo

La media usualmente será más que la mediana.

Forma de la Distribución: Sesgo

40 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Altamente sesgada a la derecha

Fre

cuen

cia

Rel

ativ

a

.05

.10

.15

.20

.25

.30

.35

0

Sesgo = 1.25

El sesgo es positivo (usualmente mayor a 1.0).

La media usualmente será más que la mediana.

Forma de la Distribución: Sesgo

41 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Setenta departamentos fueron aleatoriamente muestreados. El precio de alquiler mensual para los departamentos aparece abajo en orden ascendente.

Forma de la Distribución: Sesgo

Ejemplo: Alquiler de Departamentos

425 430 430 435 435 435 435 435 440 440

440 440 440 445 445 445 445 445 450 450

450 450 450 450 450 460 460 460 465 465

465 470 470 472 475 475 475 480 480 480

480 485 490 490 490 500 500 500 500 510

510 515 525 525 525 535 549 550 570 570

575 575 580 590 600 600 600 600 615 615

42 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Fre

cuen

cia

Rel

ativ

a

.05

.10

.15

.20

.25

.30

.35

0

Sesgo = .92

Ejemplo: Alquiler de Departamentos

Forma de la Distribución: Sesgo

43 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Valores Z

• Una medida de la distancia hacia la media (por ejemplo, un

valor Z de 2.0 significa que un valor está a 2.0 desviaciones

estándar de la media)

• La diferencia entre un valor y la media, dividida entre la

desviación estándar

• Un valor Z por encima de 3.0 o por debajo de -3.0 se

considera un valor extremo (outlier)

S

XXZ

44 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Valores Z (continuación)

Ejemplo:

• Si la media es 14.0 y la desviación estándar es 3.0,

cuál es el valor Z para el valor 18.5?

• El valor 18.5 está 1.5 desviaciones estándar por

encima de la media

• (un valor Z negativo significa que un valor es menor

que la media)

1.53.0

14.018.5

S

XXZ

45 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Independientemente de cómo está distribuida la

data, al menos (1 - 1/z2) x 100% de los valores

estarán dentro de z desviaciones estándar de la

media (para z > 1)

– Ejemplos:

(1 - 1/12) x 100% = 0% ……..... z=1 (μ ± 1σ)

(1 - 1/22) x 100% = 75% …........ z=2 (μ ± 2σ)

(1 - 1/32) x 100% = 89% ………. z=3 (μ ± 3σ)

El Teorema (la regla) de Chebyshev

dentro de Al menos

46 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Si la distribución de la data tiene

aproximadamente la forma de campana,

entonces el intervalo:

• contiene aproximadamente el 68% de los

valores en la población o la muestra

La Regla Empírica

1σμ

μ

68%

1σμ

47 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• contiene aproximadamente el 95% de los valores en la población o la muestra

• contiene aproximadamente el 99.7% de

los valores en la población o la muestra

La Regla Empírica

2σμ

3σμ

3σμ

99.7% 95%

2σμ

48 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Análisis Exploratorio de la Data

• Gráfico de Caja y Bigote: Una representación visual de la data utilizando el resumen de 5 números:

Mínimo -- Q1 -- Mediana -- Q3 -- Máximo

Ejemplo:

Minimum 1st Median 3rd Maximum Quartile Quartile

Minimum 1st Median 3rd Maximum Quartile Quartile

25% 25% 25% 25%

3er

Cuartil

Mediana 1er

Cuartil

Mínimo Máximo

49 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Forma del Diagrama (Gráfico) de Caja

• La Caja y la línea central están centradas entre los puntos finales si la data es simétrica alrededor de la mediana

• Un gráfico de caja puede mostrarse tanto en el formato vertical como en el horizontal

Min Q1 Mediana Q3 Max

50 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Sesgo a la

Derecha

Sesgo a la

Izquierda Simétrica

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

La Forma de la Distribución y

el Gráfico de Caja y Bigote

51 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Gráfico de caja para la siguiente data:

0 2 2 2 3 3 4 5 5 10 27

• La data está sesgada a la derecha, como lo

muestra el gráfico

0 2 3 5 270 2 3 5 27

Min Q1 Q2 Q3 Max

Ejemplo de un gráfico de caja y bigote

52 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Diagrama de Caja (comparación entre grupos)

53 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Medidas de Asociación entre dos variables

• Hasta ahora hemos utilizado métodos numéricos

para una sola variable

• Pero usualmente estamos interesados en conocer

la relación entre dos variables para tomar

decisiones

• Dos medidas de descripción de las relaciones entre

dos variables son la covarianza y el coeficiente de

correlación.

54 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

La Covarianza de la Muestra

• La covarianza de la muestra mide el grado de relación

lineal entre dos variables (llamado data bivariada)

• La covarianza de la muestra:

– Sólo se preocupa por el grado de relación

– No se implica un efecto causal (relación causal)

1n

)YY)(XX(

)Y,X(cov

n

1i

ii

55 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Covarianza entre dos variables aleatorias:

cov(X,Y) > 0 X e Y tienden a moverse en la misma

dirección

cov(X,Y) < 0 X e Y tienden a moverse en direcciones

opuestas

cov(X,Y) = 0 X e Y son independientes

Interpretando la Covarianza

56 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Coeficiente de Correlación

• Mide el grado relativo de relación lineal entre

dos variables

• Coeficiente de correlación de la muestra:

donde

YXSS

Y),(Xcovr

1n

)X(X

S

n

1i

2

i

X

1n

)Y)(YX(X

Y),(Xcov

n

1i

ii

1n

)Y(Y

S

n

1i

2

i

Y

57 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Características del

Coeficiente de Correlación, r

• No tiene unidades

• El rango está entre –1 y 1

• A medida que se acerca a –1, más fuerte la relación

lineal negativa

• A medida que se acerca a 1, más fuerte la relación

lineal positiva

• A medida que se acerca a 0, más débil la relación lineal

58 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Diagramas de Dispersión de Data con

Varios Coeficientes de Correlación

Y

X

Y

X

Y

X

Y

X

Y

X

r = -1 r = -.6 r = 0

r = +.3 r = +1

Y

X r = 0

59 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Seleccione Herramientas

/ Análisis de Datos

• Elegir Correlación del

menú de selección

• Clic Aceptar . . .

Utilizando Excel para encontrar

el Coeficiente de Correlación

60 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

• Ingresar el rango de datos y

seleccionar la opción

correspondiente

• Clic Aceptar para obtener el

resultado

Utilizando Excel para encontrar

el Coeficiente de Correlación (continuación)

61 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Interpretando el Resultado

• r = .733

• Hay una relativa relación lineal fuerte entre el puntaje del examen #1 y el puntaje del examen #2

• Los estudiantes que lograron un puntaje alto en el primer examen tienden a obtener un puntaje alto en el segundo y los estudiantes que obtuvieron un puntaje bajo en el primer examen tienden a obtener puntajes bajos en el segundo examen

Diagrama de Dispersión de los

Puntajes de Examen

70

75

80

85

90

95

100

70 75 80 85 90 95 100

Puntaje Examen #1

Pu

nta

je E

xa

me

n #

2

62 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Trampas y peligros en las

Medidas Numéricas de Descripción

• El análisis de datos es objetivo

– Se debe reportar el resumen de medidas que mejor

describe los supuestos sobre el conjunto de datos

• La interpretación de la data es subjetiva

– Debe realizarse de manera justa, neutral y clara

63 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Consideraciones Éticas

Las medidas numéricas de descripción:

• Deben documentar resultados tanto buenos como

malos

• Deben presentarse de manera justa, objetiva y

neutral

• No debe utilizarse medidas de resumen

inapropiadas que distorsionen los hechos

64 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Resumen del Capítulo

• Se describió las medidas de tendencia central

– Media, mediana, moda, media geométrica

• Se discutió el concepto de cuartiles

• Se describió las medidas de variabilidad

– Rango, rango intercuartil, varianza y desviación estándar, coeficiente de

variación, valores Z

• Se ilustró las formas de la distribución

– Simétrica, sesgada, gráficos de caja y bigotes

• Se discutió la covarianza y el coeficiente de correlación

• Se trataron las trampas y peligros en el uso de medidas numéricas de

descripción y algunas consideraciones éticas

65 José Antonio Robles Flores © 2014

Análisis de Datos para la Gerencia

Referencias

• Levine; Krehbiel & Berenson 2014. Estadística para

Administración 6ta Edición. Pearson.