192
www.upv.es Departamento de Estadística e Investigación Operativa Aplicadas y Calidad UD 2 – Parte 1 Estadística Descriptiva Unidimensional Grado en Ingeniería Informática

Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

www.upv.es

Departamento de Estadística e Investigación Operativa Aplicadas y Calidad

UD 2 – Parte 1Estadística Descriptiva

Unidimensional

Grado en Ingeniería Informática

Page 2: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Nota importante• Estas transparencias son un extracto de la Unidad Didáctica 2 publicada en

PoliformaT, y a los capítulos 1, 2 y 7 (apartado 7.7) y 11 (apartado 11.1) del libro Métodos Estadísticos para Ingenieros y sirven sólo como material complementario.• Además, los contenidos de esta UD se trabajarán en la primera y segunda Práctica

Informática que se llevará a cabo en el laboratorio B del DEIOAC.

Page 3: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Contenido

1. Introducción. Conceptos básicos (población, Muestra, v.a. …)

2. Estadística Descriptiva Unidimensional

3. Estadística Descriptiva Bidimensional

Resumen

Mapa mental

Glosario

Ejercicios

Práctica Statgraphics

Page 4: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Contenido • Introducción• Definición, objetivos, aplicaciones,…

• Conceptos básicos• Población y muestra

• Tipos• Estadística descriptiva e Inferencia• Característica aleatoria y variable aleatoria

• Tipos• Dimensiones

• Datos

• Estadística descriptiva unidimensional• Tablas de Frecuencias• Gráficos: Diagramas de Barras, de Sectores, Histogramas, Box & Whisker…. • Parámetros:

• Posición• Dispersión• Forma:

• Asimetría• Curtosis

• Estadística Descriptiva Bidimensional• Tablas de frecuencias cruzadas.• Distribuciones marginales y condicionales• Diagramas de dispersión• Covarianza y Coeficiente de Correlación

Page 5: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Conceptos básicos

Page 6: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Estadística: una definición

"LA ESTADÍSTICA ES LA CIENCIA CUYO OBJETO ES LA OBTENCIÓN Y EL ANÁLISIS DE DATOS MEDIANTE EL RECURSO A MODELOS MATEMÁTICOS Y A HERRAMIENTAS INFORMÁTICAS"

• DATOS• HERRAMIENTAS INFORMÁTICAS• MODELOS MATEMÁTICOS

Page 7: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Proceso de un estudio estadístico

Page 8: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Objetivos Estadística

Generar o recopilar datos Analizar

Descriptivo

Resumir y organizar

Inferencia

Extrapolar conclusiones

Interpretar

Page 9: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Algunas aplicaciones de la Estadística

• Control de Calidad• Evaluación de prestaciones• Robótica• Comparación de algoritmos• Fiabilidad• Big Data• e.t.c.

Page 10: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Esquema

PoblaciónEstadística descriptiva

gráficosparámetrostablas

muestreo

Inferencia estadística

Muestra

Conclusiones válidas con razonable seguridad Probabilidad

UD2

UD5

UD4

UD3

Variables aleatorias

Page 11: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Conceptos básicos

Page 12: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Muestra

Población y muestra

Población Estadística descriptiva� Gráficos� Parámetros, números� Tablas

muestreo

Inferencia estadística

extrapolar los resultados

Page 13: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Análisis Descriptivo datos

Primer paso de cualquier análisis

• Tratamiento descriptivo o exploratorio

• Poner de manifiesto características y regularidades de los datos:

1. Sintetizarlas en parámetros

2. Representaciones gráficas adecuadas

¡¡No se extrapolan todavía conclusiones de los datos a la población!!

Page 14: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Poblaciones. Concepto

conjunto de todos los individuos o entes que constituyen el objeto de un determinado estudio y

sobre los que se desea obtener ciertas conclusiones

Población

Existencia física real

Abstracta

Page 15: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Poblaciones. Tipos y Ejemplos

• Existencia física real previa a la realización del estudio:

• Estudio intención de voto: todo español con derecho a voto

• Estudio rendimiento en universidades españolas: todos los alumnos de la ETSINF

• Control de calidad componentes informáticos: Todos los ventiladores de una partida

• ........

• Número finito, aunque posiblemente muy elevado, de individuos.

• No es lo más frecuente

Page 16: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Poblaciones. Tipos y Ejemplos• De carácter abstracto

• Estudio dado trucado o no: todos los lanzamiento de un dado • Estudio sobre la eficiencia de diversos algoritmos de

encaminamiento de mensajes entre nodos en una red de procesadores: todos los mensajes que se generan en la red de procesadores

• ........

Los individuos se van generando mediante un proceso àExperimento aleatorio

Page 17: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias

• La vida útil de varios componentes electrónicos idénticos no es la misma.

• El número de asignaturas en las que se matricula un alumno también varía

• El número de puntos que sale al lanzar un dado puede ser distinto según la tirada.

• El troughput de un sistema cambia según tecnología• El retardo de los mensajes es diferente según la topología de la

red...

Característica Aleatoria: cualquiera que puede constatarse en cada individuo de la población

¡Toda población tiene VARIABILIDAD en sus características!

Page 18: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Características aleatorias

• Tipos

§ Expresables numéricamente:§ Tiempo hasta el fallo de un tipo de monitor§ Número obtenido al lanzar un dado§ Número de asignaturas matriculadas§ Retardo de un mensaje§ Velocidad de E de un HDD

§ De tipo cualitativo:§ Partido votado§ Aprobada una determinada asignatura (s/n)§ Destino correcto del mensaje (s/n)§ Categoría laboral

Page 19: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Características aleatorias Variables

característica aleatoria numérica o cualitativa

codificada

No tiene ningún sentido realizar operaciones matemáticas con variables aleatorias que son codificaciones de una característica aleatoria de tipo cualitativo

Page 20: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias

variables

cuantitativas o numéricas

Discretas (Z)

Continuas (R)

Cualitativas o categóricas

Nominales

Ordinales

Discretizar

• Naturaleza• Cualitativas• Cuantitativas

• Número de características• Unidimensionales• K-dimensionales

• Conjunto de valores• Discretas• Continuas

Page 21: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplos de variables y tiposSEXO EDAD MES ESTATURA PESOvarón 20 Enero 18,32 76varón 21 Junio 18,54 72varón 22 Octubre 16,57 75varón 22 Abril 17,45 70varón 22 Julio 17,58mujer 20 Noviembre 17,59 70varón 22 Julio 17,43 65mujer 23 Octubre 15,91 54

SEXO: categórica nominal

EDAD: cuantitativa discreta

MES: categórica ordinal

ESTATURA: cuantitativa continua

Dato faltante

Page 22: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio de variables y tipos

1. Provincia con mayor índice de paro 2. Temperatura de un frigorífico3. Número de anuncios emitidos por una cadena de TV en un intermedio

publicitario4. Tiempo necesario para fabricar una pieza5. Peso neto de una botella estándar de aceite6. Nivel cultural dominante entre los lectores de una revista7. Pulsaciones por minuto de una operadora de datos8. Categoría de un hotel

Page 23: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias• Importante diferencia entre:

• una variable aleatoria K-dimensional, en la que las Kvariables se miden sobre los individuos de una únicapoblación

• y un conjunto de K variables aleatoriasunidimensionales, definidas sobre K poblaciones distintas.

Page 24: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias• Ejemplo 1:

• Población: Todos los archivos “mp3” que se pueden bajar deuna web

• Variable aleatoria de dimensión 4:(tiempo_bajada, tamaño_archivo, nº_fuentes, nombre_tema)

Las componentes cualitativas se suelen usar para subdividir laPoblación en subpoblaciones

Page 25: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias

• Ejemplo 2:

¿Variable bidimensional o 2 var. Unidimensionales?

• Rendimiento de dos modelos de portátil• 2 var. Unidimensionales

• Rendimiento y modelo de un portátil• Variable bidimensional

Page 26: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Muestras. Datos estadísticos• Normalmente no se trabaja con toda la población:

• Imposible porque es infinita• Porque se destruye a los individuos• Por razones técnicas• Por razones económicas

• Se analiza sólo una parte:

Muestra: subconjunto de individuos de la población sobre los que se recogen los datos a estudiar

Page 27: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Muestra

Muestras. Datos estadísticos

Población Estadística descriptiva� Gráficos� Parámetros, números� Tablas

muestreo

Inferencia estadística

extrapolar los resultados

Page 28: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Muestras. Datos estadísticos• Mediante Técnicas de Muestreo se consigue que la muestra sea

representativa para poder inferir las conclusiones a la población a la que pertenece

Ejemplo de un pésimo muestreo

La muestra debe ser representativa

Page 29: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Esquema

PoblaciónEstadística descriptiva

gráficosparámetrostablas

muestreo

Inferencia estadística

Muestra

Conclusiones válidas con razonable seguridad Probabilidad

UD2

UD5

UD4

UD3

Variables aleatorias

Page 30: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Esquema

PoblaciónEstadística descriptiva

gráficosparámetrostablas

muestreo

Inferencia estadística

Muestra

Conclusiones válidas con razonable seguridad Probabilidad

UD2

UD5

UD4

UD3

Page 31: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Datos estadísticos: características coches

Individuo muestra

Variable

Page 32: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Datos estadísticos

¿Qué información podemos sacar de estos datos?

¿Qué podemos decir acerca del PESO de los coches?

ü Hace falta sintetizar y simplificar la presentación de los datos antes de su análisis.

ü Es necesario disponer los valores observados de forma clara y útil para su interpretación.

Tablas, herramientas gráficas y parámetros

Page 33: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Contenido

0. Introducción

1. Estadística Descriptiva Unidimensional

1.1 Conceptos básicos (población, Muestra, v.a. …)

1.2 Tablas de Frecuencias

1.3 Diagramas: Barras, Sectores

1.4 Histogramas.

1.5 Parámetros de Posición

1.6 Parámetros de Dispersión

1.7 Parámetros de Asimetría y Curtosis

1.8 Diagrama Box & Whisker

Page 34: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Contenido

2. Estadística Descriptiva Bidimensional

2.1 Tablas de frecuencias cruzadas

2.2 Distribuciones marginales y condicionales

2.3 Diagramas de dispersión

2.4 Covarianza y Coeficiente de CorrelaciónLo veremos en la UD 5

Índice

Page 35: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.2 – Tablas de frecuenciasv.a. Cualitativas y Cuantitativas

Page 36: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variable cualitativa o cuantitativa con pocos valores

Nº de procesadores

Nº de robots % robots Nº de robots

acumulado% robots

acumulado

0 10 6,25% 10 6,25%

1 35 21,88% 45 28,13%

2 60 37,50% 105 65,63%

3 55 34,37% 160 100%

Total 160 100%

Page 37: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cualitativas Variable cualitativa o cuantitativa con pocos valores

Valores variable

Frecuencia absoluta

Frecuencia relativa %

Frecuencia absoluta

acumulada

Frecuencia relativaacumulada %

x1 f1 fr1= f1/N*100 F1 = f1 Fr1 = fr1

X2 f2 fr2= f2/N*100 F2 = F1 + f2 Fr2 = Fr1 + fr2

X3 f3 Fr2 = f3/N*100 F3 = F2 + f3 Fr3 = Fr2 + fr3

... ... ... N 100%

Total N 100%

Page 38: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cualitativas Variable Cualitativa o cuantitativa con pocos valores

xi ni fiLínea telefónica convencional 1.789.513 0,20

Banda Ancha (ADSL, RDSI, Red Cable) 3.491.449 0,38Línea ADSL 2.814.462 0,31Línea RDSI 53.808 0,01Red de cable 691.324 0,08Telefonía móvil 212.785 0,02Otras formas de conexión 68.105 0,01

Otro Ejemplo: Acceso1 a Internet de las Viviendas - 2º semestre 2005 Copyright INE 2007

Sni =9.121.446 Sfi =11 Acceso más utilizado

Page 39: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo: nº de ordenadores en casaVariable cuantitativa discreta con pocos valores

Valores posibles

Frecuencia absoluta

Frecuencia relativa %

F absoluta acumulada

F relativa acumulada %

0

1

2

3

Page 40: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo: SO móvilVariable cualitativa

Valores posibles

Frecuencia absoluta

Frecuencia relativa %

F absoluta acumulada

F relativa acumulada %

Page 41: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cuantitativa• Podríamos emplear el mismo procedimiento

• La probabilidad de encontrar valores repetidos es muy baja

• Obtendríamos una tabla tan difícil de interpretar como los datosoriginales

Solución

Agrupar los datos en tramos o intervalos

Page 42: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cuantitativa

• Resistencia de carcasas plásticas de procesadores (Nw/mm2)

------------------------------------------------------------------------------------------------------------------------------------Lower Upper Relative Cumulative Cum. Rel.

Class Limit Limit Midpoint Frequency Frequency Frequency Frequency------------------------------------------------------------------------------------------------------------------------------------

at or below 10.00 0 .00000 0 .000001 10.00 15.00 12.50 0 .00000 0 .000002 15.00 20.00 17.50 1 .00610 1 .006103 20.00 25.00 22.50 9 .05488 10 .060984 25.00 30.00 27.50 18 .10976 28 .170735 30.00 35.00 32.50 26 .15854 54 .329276 35.00 40.00 37.50 38 .23171 92 .560987 40.00 45.00 42.50 34 .20732 126 .768298 45.00 50.00 47.50 20 .12195 146 .890249 50.00 55.00 52.50 9 .05488 155 .94512

10 55.00 60.00 57.50 5 .03049 160 .9756111 60.00 65.00 62.50 0 .00000 160 .9756112 65.00 70.00 67.50 3 .01829 163 .9939013 70.00 75.00 72.50 1 .00610 164 1.00000

-------------------------------------------------------------------------------------------------------------------------------------Mean = 39.3288 Standard Deviation = 9.46009 Median = 39.1

Page 43: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

------------------------------------------------------------------------------------------------------------------------------------Lower Upper Relative Cumulative Cum. Rel.

Class Limit Limit Midpoint Frequency Frequency Frequency Frequency------------------------------------------------------------------------------------------------------------------------------------

at or below 10.00 0 .00000 0 .000001 10.00 15.00 12.50 0 .00000 0 .000002 15.00 20.00 17.50 1 .00610 1 .006103 20.00 25.00 22.50 9 .05488 10 .060984 25.00 30.00 27.50 18 .10976 28 .170735 30.00 35.00 32.50 26 .15854 54 .329276 35.00 40.00 37.50 38 .23171 92 .560987 40.00 45.00 42.50 34 .20732 126 .768298 45.00 50.00 47.50 20 .12195 146 .890249 50.00 55.00 52.50 9 .05488 155 .94512

10 55.00 60.00 57.50 5 .03049 160 .9756111 60.00 65.00 62.50 0 .00000 160 .9756112 65.00 70.00 67.50 3 .01829 163 .9939013 70.00 75.00 72.50 1 .00610 164 1.00000

-------------------------------------------------------------------------------------------------------------------------------------Mean = 39.3288 Standard Deviation = 9.46009 Median = 39.1

Variables cuantitativa

Hay 18 carcasas cuya resistencia está entre 25 y 30 Nw/mm2

Representan el 10,976% de las 164 carcasas estudiadas

Nº de intervalo

Límite inferior

Límite superior

Valor central

Page 44: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cuantitativa• Se divide el campo de variabilidad en un conjunto de K intervalos

de igual longitud, teniendo en cuenta:

• Límites de cada intervalo ( [, ], ≤, ≥)

• Valor central del intervalo

• Número de observaciones por intervalo

Problema: ¿Amplitud Óptima?

¿Número de intervalos?

Page 45: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables cuantitativa• Número de intervalos grande

è Tabla difícil de interpretar

• Número de intervalos pequeño

è Se puede perder información importante

Recomendable:

¡¡ Entre 5 y 15 intervalos !!

(dependiendo del número de observaciones de la muestra)

Page 46: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Frequency Tabulation for ESTATURA

-------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel.Class Limit Limit Midpoint Frequency Frequency Frequency Frequency-------------------------------------------------------------------------------- at or below 140,0 0 0,0000 0 0,0000 1 140,0 142,963 141,481 0 0,0000 0 0,0000 2 142,963 145,926 144,444 0 0,0000 0 0,0000 3 145,926 148,889 147,407 0 0,0000 0 0,0000 4 148,889 151,852 150,37 0 0,0000 0 0,0000 5 151,852 154,815 153,333 1 0,0076 1 0,0076 6 154,815 157,778 156,296 3 0,0229 4 0,0305 7 157,778 160,741 159,259 8 0,0611 12 0,0916 8 160,741 163,704 162,222 12 0,0916 24 0,1832 9 163,704 166,667 165,185 11 0,0840 35 0,2672 10 166,667 169,63 168,148 10 0,0763 45 0,3435 11 169,63 172,593 171,111 14 0,1069 59 0,4504 12 172,593 175,556 174,074 28 0,2137 87 0,6641 13 175,556 178,519 177,037 9 0,0687 96 0,7328 14 178,519 181,481 180,0 14 0,1069 110 0,8397 15 181,481 184,444 182,963 6 0,0458 116 0,8855 16 184,444 187,407 185,926 9 0,0687 125 0,9542 17 187,407 190,37 188,889 1 0,0076 126 0,9618 18 190,37 193,333 191,852 2 0,0153 128 0,9771 19 193,333 196,296 194,815 2 0,0153 130 0,9924 20 196,296 199,259 197,778 1 0,0076 131 1,0000 21 199,259 202,222 200,741 0 0,0000 131 1,0000 22 202,222 205,185 203,704 0 0,0000 131 1,0000 23 205,185 208,148 206,667 0 0,0000 131 1,0000 24 208,148 211,111 209,63 0 0,0000 131 1,0000 25 211,111 214,074 212,593 0 0,0000 131 1,0000 26 214,074 217,037 215,556 0 0,0000 131 1,0000 27 217,037 220,0 218,519 0 0,0000 131 1,0000above 220,0 0 0,0000 131 1,0000--------------------------------------------------------------------------------Mean = 172,855 Standard deviation = 9,07585

Otro ejemplo Estatura: 27 intervalos

Muchos intervalos:

Difícil de interpretar

Page 47: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Frequency Tabulation for ESTATURA

-------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel.Class Limit Limit Midpoint Frequency Frequency Frequency Frequency-------------------------------------------------------------------------------- at or below 150,0 0 0,0000 0 0,0000 1 150,0 155,0 152,5 3 0,0229 3 0,0229 2 155,0 160,0 157,5 9 0,0687 12 0,0916 3 160,0 165,0 162,5 22 0,1679 34 0,2595 4 165,0 170,0 167,5 16 0,1221 50 0,3817 5 170,0 175,0 172,5 37 0,2824 87 0,6641 6 175,0 180,0 177,5 22 0,1679 109 0,8321 7 180,0 185,0 182,5 14 0,1069 123 0,9389 8 185,0 190,0 187,5 3 0,0229 126 0,9618 9 190,0 195,0 192,5 3 0,0229 129 0,9847 10 195,0 200,0 197,5 2 0,0153 131 1,0000above 200,0 0 0,0000 131 1,0000--------------------------------------------------------------------------------Mean = 172,855 Standard deviation = 9,07585

Otro ejemplo Estatura: 10 intervalos

OK

Page 48: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Var. Cualitativas: Tablas de contingencia

n Objetivo del análisis: describir la relación existente entre las dos componentes de la v.a. bidimensional

n Herramienta: Tabla de Contingencia

§ variables discretas:

§ naturaleza cualitativa (codificadas)

§ cuantitativas con pocos valores

Page 49: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Ejemplo Tablas de contingencia

n En una empresa se realiza una encuesta relativa a diferentes

características de sus empleados con el fin de llevar a cabo

un estudio.

n Una de las cuestiones a estudiar es la posible relación entre

el SEXO y la CATEGORÍA LABORAL de sus empleados.

n Para ello, en primer lugar se construye una TABLA DE

CONTINGENCIA

Page 50: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frecuencias conjuntas

Administrativo Seguridad Directivo

Hombre 157 27 74

Mujer 206 0 10

4741 - Nº de empleados encuestados

Tamaño de la muestra (N)

2 - Nº de mujeres que ocupan cargo

de directivo

Page 51: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frecuencias marginales (absolutas y relativas)

Administrativo Seguridad DirectivoFrecuencias MarginalesDe SEXO

Hombre157 27 74 258

54,4%

Mujer206 0 10 216

45,6%

Frecuencias Marginales

De CATEGORÍA

363

76,6%

27

5,7%

84

17,7%474

3 - % de empleados administrativos(363 /474*100)

4 - Nº de mujeres encuestadas(206 + 0 + 10)

Page 52: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frec. Relativas condicionales de CATEGORÍA en función de SEXO

Administrativo Seguridad DirectivoFrecuencias MarginalesDe SEXO

Hombre157

60,9%

27

10,5%

74

28,7%

258

54,4%

Mujer206

95,4%

0

0%

10

4,6%

216

45,6%

Frecuencias Marginales

De CATEGORÍA

363

76,6%

27

5,7%

84

17,7%474

5 - % de las mujeres que son directivas(10/ 216*100)

Frecuencias relativas a los totales de las filas (SEXO)

Page 53: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frec. Relativas condicionales de SEXO en función de CATEGORÍA

Administrativo Seguridad DirectivoFrecuencias MarginalesDe SEXO

Hombre157

43,3%

27

100%

74

88,1%

258

54,4%

Mujer206

56,7%

0

0%

10

11,9%

216

45,6%

Frecuencias Marginales

De CATEGORÍA

363

76,6%

27

5,7%

84

17,7%474

6 - % de las administrativos que son hombres

(157/ 363 *100)

Frec. relativas a los totales de las columnas (CATEGORÍA)

Page 54: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frecuencias relativas condicionales

n La frecuencia relativa condicional a calcular depende del objetivo de nuestro estudio.

n EJEMPLO: Si queremos estudiar si la proporción de mujeres (u hombres) es igual o diferente para los diferentes cargos:

§ ¿Frecuencia relativa condicional de CATEGORÍA en función de SEXO?

ó§ ¿Frecuencia relativa condicional de SEXO en función de

CATEGORÍA?

Page 55: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frec. Relativas condicionales de SEXO en función de CATEGORÍA

Administrativo Seguridad DirectivoFrecuencias MarginalesDe SEXO

Hombre157

43,3%

27

100%

74

88,1%

258

54,4%

Mujer206

56,7%

0

0%

10

11,9%

216

45,6%

Frecuencias Marginales

De CATEGORÍA

363

76,6%

27

5,7%

84

17,7%474

NO se puede deducir que en el grupo de directivos hay más hombres que mujeres, ya que en el total de la muestra hay más hombres (258 hombres frente a 216 mujeres)

Page 56: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Frec. Relativas condicionales de CATEGORÍA en función de SEXO

Ahora SÍ se puede deducir que en el grupo de mujeres hay más o menos directivos, ya que las frecuencias están relativizadas con respecto a los totales de mujeres y hombres para que éstos no influyan. De las mujeres un 4,6% son directivos frente al 28,7% de los hombres que son directivos.

Administrativo Seguridad DirectivoFrecuencias MarginalesDe SEXO

Hombre157

60,9%

27

10,5%

74

28,7%

258

54,4%

Mujer206

95,4%

0

0%

10

4,6%

216

45,6%

Frecuencias Marginales

De CATEGORÍA

363

76,6%

27

5,7%

84

17,7%474

Page 57: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional
Page 58: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Var. Cuantitativas: Tablas de frecuencias cruzadas

n Todo lo dicho respecto al cálculo e interpretación de las frecuencias de la Tabla de Contingencia es aplicable al caso de las v.a. cuantitativas.

n La única diferencia, como en el caso de las v.a. unidimensionales, es que previamente a la representación de la Tabla es necesario agrupar los valores de las variables en intervalos.

Page 59: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Ejemplo

Frecuencia conjunta: peso y estaturaFrecuencia marginal absoluta: peso y estaturaFrecuencia marginal relativa: peso y estatura

Frecuencia relativa de peso condicionada a estatura

Var. Cuantitativas: Tablas de frecuencias cruzadas

ESTATURA PESO

145 155

155 165

165 175

175 185

185 195

Row Total

40 - 55 9 17 0 0 0 55 - 70 3 18 31 5 0 70 - 85 0 3 24 12 3 85 - 99 0 0 3 0 2 Column Total

Page 60: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

Ejemplo

Frecuencia conjunta: peso y estaturaFrecuencia marginal absoluta: peso y estaturaFrecuencia marginal relativa: peso y estatura

Frecuencia relativa de peso condicionada a estatura

ESTATURAPESO

145155

155165

165175

175185

185195

RowTotal

40 55 975.0

1744.7

0.0

0.0

0.0

2620.0

55 70 325.0

1847.4

3153.4

529.4

0.0

5743.8

70 85 0.0

37.9

2441.4

1270.6

360.0

4232.3

85 99 0.0

0.0

35.2

0.0

240.0

53.8

ColumnTotal

129.2

3829.2

5844.6

1713.1

53.8

130100

Var. Cuantitativas: Tablas de frecuencias cruzadas

Page 61: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.3 – Diagramas de Barras Y Sectores

• v.a. Cualitativas• V.a. Cuantitativas discretas con pocos

valores distintos• Forma gráfica de la Tabla de

frecuencias

Page 62: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Diagrama de Barras• A cada alternativa de la característica cualitativa se le hace corresponder

un barra (horizontal o vertical) cuya altura es proporcional a la frecuencia observada (absoluta, relativa, acumulada) en la muestra para ese “valor” de la característica estudiada.

Barchart for Nº de cilindros

frequ

ency

0102030405060708090

100110120

3 4 5 6 8

Page 63: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Diagrama de Barras

Equipamiento de las viviendas productos TIC ( % hogares)

Page 64: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Diagrama de sectores o tarta

• La superficie total de un círculo se reparte en sectores cuyas áreas son proporcionales a las frecuencias observadas en la muestra para cada “valor” de la característica estudiada.• Frecuencias absolutas o relativas

Page 65: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Infogramas o pictogramasAnalytics

Page 66: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.4 – Histogramasv.a. Cuantitativas:• Continuas• Discretas con muchos

valores distintos

Page 67: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

n Es un diagrama de barras para variables cuantitativas continuas o discretas con muchos valores

n Es una representación gráfica de un conjunto de datos (mínimo 40-50 datos)

n Para cada valor o intervalo de valores de la variable (eje de abscisas) se levanta una barra de altura proporcional a la frecuencia con que aparece dicha variable los valores del intervalo (absoluta o relativa)

n Nº de intervalosn regla empírica: entero cercano a n en general entre 15-20 intervalos

Histograma ¿Qué es?

n

Page 68: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo

Histogram

Tiempo (ms)

frequ

ency

0 5 10 15 20 25 300

5

10

15

20

25

30

v.a.: Tiempo de ejecución (ms) de 100 programas

Frecuencias absolutas (número de programas)

27

14 16,3

27 programas cuyo tiempo de ejecución ha estado entre 14 y 16,3 ms. (aprox.)

Page 69: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo

Histogram

Tiempo (ms)

perc

enta

ge

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 300

102030405060708090

100

v.a.:Tiempo de ejecución (ms) de 100 programas

Frecuencias relativas acumuladas (% de programas)

0% de los programas cuyo tejecución está en el intervalo [5,7’5] ms

5 7,5

Page 70: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo

Histogram

Tiempo (ms)

perc

enta

ge

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 300

102030405060708090

100

v.a.:Tiempo de ejecución (ms) de 100 programas

Frecuencias relativas acumuladas (% de programas)

6% de los programas cuyo t ejecución está en los intervalos ]5,7’5] y ]7’5,9’5] ms

7,5 9,5

6

5

El 6% de los programas tienen tiempo de ejecución menor o igual a 9,5 ms. (aprox.)

Page 71: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

n Podemos detectar rápidamente:

n Existencia de datos anómalos

n Mezclas de poblaciones distintas

n Datos artificialmente modificados

n No normalidad de los datos

Utilidad

Page 72: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogramas tipo: mezcla de poblaciones

Tiempo de ejecución (ms) de 200 programas

T ejec

frequ

ency

0 2 4 6 8 100

4

8

12

16

20

24

Page 73: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Mezcla de dos poblaciones próximas

Histogramas tipo : mezcla de poblaciones

T ejec

frequ

ency

0 2 4 6 80

5

10

15

20

25

30

T ejec

frequ

ency

4,2 6,2 8,2 10,2 12,20

5

10

15

20

25

El histograma anterior es la superposición de

estos dos

Page 74: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogramas tipo: mezcla de poblaciones

Page 75: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogramas tipo: “Normal”

T ejec

frequ

ency

-2,8 -1,8 -0,8 0,2 1,2 2,2 3,20

4

8

12

16

20

24

v.a. : desviaciones (mm) sobre el nominal del F de una pieza

Page 76: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogramas tipo: datos anómalos

T ejec

frequ

ency

0 2 4 6 8 10 120

10

20

30

40

Hay 1 valor, el 10, que se separa de la mayoría de los datos.Es un dato anómalo y puede deberse a un error.¿debe considerarse en el análisis?

Page 77: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Datos modificados artificialmente

Histogramas tipo “acantilado”

T ejec

frequ

ency

2,8 3,8 4,8 5,8 6,8 7,80

4

8

12

16

20

24 Los datos menores que 3,5 (aprox.) se han eliminado deliberadamente àCorte del histograma por la izquierda: acantilado.

Page 78: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Se puede representar un histograma a partir de las frecuenciasacumuladas para los diferentes tramos de la variable. Si las abscisasse levantan sobre el límite de cada tramo y se unen los puntos, seobtiene una gráfica con una línea quebrada no decreciente

Histogram

ESTATURAfrequency

150 160 170 180 190 2000

30

60

90

120

150

Histogram

ESTATURA

frequency

150 160 170 180 190 2000

30

60

90

120

150

Histogramas de frecuencias acumuladas

Page 79: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogram

ESTATURA

frequency

150 160 170 180 190 2000

30

60

90

120

150

Histogram

ESTATURA

percentage

150 160 170 180 190 2000

20

40

60

80

100

} ¿Qué % de los alumnos miden más de 170 cm?} ¿Qué estatura es superada por un 5% de los alumnos?} ¿Cuántos alumnos tienen una estatura menor que 165 cm?

Polígono de frecuencias

Page 80: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros muestrales• Posición• Dispersión• Forma

Page 81: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros• La pauta de variabilidad de una variable aleatoria unidimensional se

caracteriza por tres tipos de parámetros que deben definir:

• La Posición de las observaciones

• La Dispersión de las observaciones

• La Forma de las observaciones

Page 82: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Posición y Dispersión

- ¥ + ¥

Puntos alrededor de -200: posición 1

Puntos alrededor del 0: posición 2

Puntos alrededor de 300: posición 3

- ¥ + ¥

Puntos alrededor del 0: posición 2, pero los puntos (valores) están más alejados unos de otros: distinta dispersión

Page 83: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.5 – Parámetros de Posición

• Media artimética• Mediana• Moda• Cuantiles (cuartiles, percentiles)• …

Page 84: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros de posición• Permiten cuantificar, mediante un número, la posición de las

observaciones

• con un número nos indican “alrededor” de qué valor están las observaciones.

• Parámetros más relevantes:

n median medianan cuartilesn moda

¿Cuál es el más adecuado?

Page 85: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Media• Es el parámetro de posición más utilizado

• Media aritmética de los datos

• Recoge la información existente en la totalidad de los datos:

• La media sintetiza la información existente en la totalidad de los datos en un número que da una idea clara sobre la posición de los mismos

i

N

i 1 xMedia xN

== =å

Page 86: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 5 UD2)

Con el objeto de determinar la calidad de cierto componente electrónico, se ha tomado una muestra de 11 componentes, midiéndose sus tiempos de funcionamiento sin averías (horas).

Los resultados en horas son los siguientes:

v.a. X = {50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52}

El tiempo medio sin averías: 48,1818 h=X

Page 87: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

• Se suele utilizar cuando aparecen cambios porcentuales en series de números positivos (economía, administración….)

• Recomendable cuando la variable tenga carácter acumulativo. No utilizar cuando la variable pueda tomar valores negativos o nulos

• Se calcula por la raíz N-ésima del producto de los N datos

• El valor de la media geométrica es siempre menor o igual al valor de la media aritmética

= = N1 2 3 NMedia geométrica G x .x .x ...x

Media geométrica

Page 88: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

èEjemplo: Se pretende determinar la tasa de crecimiento medio de los ingresos de cierta compañía desde 2002 a 2006:

Año Ingreso2002 500002003 550002004 660002005 600002006 78000

Media geométrica

Page 89: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

è¿Qué porcentaje representan los ingresos de cada año respecto a los ingresos del año anterior?

èPor ejemplo, los ingresos de 2003 son 110% de los ingresos del año anterior à supone un incremento del 10%

Año Ingreso (euros)

Porcentaje respecto al año anterior

2002 50000 --------2003 55000 55000/50000=1,102004 66000 66/55=1,202005 60000 60/66=0,912006 78000 78/60=1,30

Media geométrica

Page 90: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

èMedia geométrica:

en el periodo de 2002 a 2006 se ha producido un incremento promedio de 11,79%

= =4G (1,10).(1,20).(0,91).(1,30) 1,1179

Media geométrica

Page 91: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

è¿Y si hubiéramos calculado la media aritmética en lugar de la media geométrica?

èMedia aritmética

en el periodo de 2002 a 2006 se ha producido un incremento promedio de 12,75%

Y……. ????

+ + + = = =

1,10 1,20 0,91 1,30Media aritmética x 1,12754

Media geométrica

Page 92: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

èAplicando un incremento de 12,75% (media aritmética)

50000x1,1275=56375

56375x1,1275=63563

63563x1,1275=71667

71667x1,1275=80805

L El incremento medio estimado del 12,75% supera el ingreso obtenido de

78000 euros en 2006

Media geométrica

Page 93: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

èAplicando un incremento de 11,79% (media geométrica)

50000x1,1179=55895

56375x1,1179=62485

63563x1,1179=69852

71667x1,1179=78088

J El incremento medio estimado del 11,79% está más próximo del ingreso

real de 78000 euros obtenido en 2006

Media geométrica

Page 94: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Robustez

• En ocasiones la media no es un buen parámetro de posición.

• Cuando tenemos unos pocos valores extremos que pueden influir excesivamente en la media (medida engañosa)

EJERCICIO (Ejercicio 6 UD2): Al preguntar un viajero a un botones de unhotel que propina le daban normalmente, éste respondió que lamedia de aquel día había sido 10 €. En efecto de los 10 viajeros deaquel día 9 le habían dado 1 € y uno 100 €. La media no eraevidentemente en este caso una medida adecuada de la posición delos datos. ¿Cuál considera el alumno que era una medida adecuadade la posición de los datos mencionados?

Page 95: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Robustez• Ejemplo: Suponiendo que uno de los componentes hubiera tenido un

TFSA de 150 en lugar de 62 horas (X´), ¿qué valor tendría ahora le

media? ¿es representativo?

X´ = {50, 38, 45, 30, 47, 50, 48, 150, 55, 53, 52}

Page 96: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Robustez

• En ocasiones la media no es un buen parámetro de posición.

• Cuando tenemos unos pocos valores extremos que pueden influir excesivamente en la media (medida engañosa)

• Ejemplo: Suponiendo que uno de los componentes hubiera tenido un TFSA de 150 en lugar de 62 horas (X´), ¿qué valor tendría ahora le media? ¿es representativo? NO

X´ = {50, 38, 45, 30, 47, 50, 48, 150, 55, 53, 52}

´ 56,1818 h=X

Page 97: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Mediana (Me o C2)

• Es un indicador robusto de posición:

• si se trabaja con datos muy asimétricos o con algunos valores

extremos

• medida de posición alternativa a la media en estos casos.

n Es el valor que :

§ deja a su izquierda el 50% de los datos

§ deja a su derecha el 50% de los datos

Page 98: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Mediana: Cálculo

1. Se ordenan las observaciones de menor a mayor.

2. La mediana es el valor que:

è Ocupe la posición (N+1)/2 , si N es impar

è Media entre los valores que ocupan las posiciones N/2 y (N/2)+1, si N es par

Page 99: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 7 UD2)

• Siguiendo con el ejercicio del tiempo de funcionamiento sin averías (TFSA):

X = {50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52}

• Calcular la mediana

Page 100: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Tiempo 30 38 45 47 48 50 50 52 53 55 62Nº orden 1 2 3 4 5 6 7 8 9 10 11

N es impar

(N+1)/2 = (11+1)/2=6

mediana

50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52

Ejercicio (cont.)

Mediana = Me = 50 horas

Page 101: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (cont.)

• Suponiendo que uno de los componentes hubiera tenido un TFSA de 150 en lugar de 62 horas (X´), ¿qué valor tendría ahora le media? ¿y la mediana?

X = {50, 38, 45, 30, 47, 50, 48, 150, 55, 53, 52}

Page 102: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Tiempo 30 38 45 47 48 50 50 52 53 55 150

Nº orden 1 2 3 4 5 6 7 8 9 10 11

N es impar

(N+1)/2 = (11+1)/2=6

mediana

50, 38, 45, 30, 47, 50, 48, 150, 55, 53, 52

Ejercicio (cont.)

Mediana = Me = 50 horas ¡La misma que antes!

Page 103: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (cont.)

• Si se hubiera tomado una muestra de 10 componentes para medir el TFSA, obteniendo los siguientes resultados:

38, 45, 30, 47, 48, 50, 62, 55, 53, 52

• ¿qué valor tendría ahora la mediana?

Page 104: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Tiempo 30 38 45 47 48 50 52 53 55 62Nº orden 1 2 3 4 5 6 7 8 9 10

N es par

(N/2) +1 = (10/2) +1 = 6

Ejercicio (cont.)

50, 38, 45, 30, 47, 48, 62, 55, 53, 52

Mediana = Me = 49 horas

N es par

N/2 = 10/2=5

Media = (48+50)/2= 49

Page 105: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Otro ejemplo

Summary Statistics

EDAD ESTATURA PESO TIEMPO ----------------------------------------------------------------------------------------------------Count 131 131 131 131 Average 21,0458 172,855 66,2137 26,1221 Median 21,0 174,0 66,0 20,0 Variance 2,7825 82,3711 113,569 278,031 Standard deviation 1,66808 9,07585 10,6569 16,6743 Minimum 19,0 152,0 45,0 4,0 Maximum 32,0 198,0 90,0 90,0 Range 13,0 46,0 45,0 86,0 Lower quartile 20,0 165,0 57,0 15,0 Upper quartile 22,0 179,0 74,0 35,0 Stnd. skewness 14,0474 0,916174 0,303203 5,90912 Stnd. kurtosis 34,6426 -0,194872 -1,47758 3,31496 ----------------------------------------------------------------------------------------------------

Page 106: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Propiedades de la Mediana• Ventaja: no se ve alterada si una parte de las observaciones contiene

errores grandes de medida o transcripción

• Inconveniente: utiliza menos información de los datos que la media

• Conclusión: se recomienda hallar los valores de ambas medidas, ambas difieren bastante si la distribución es muy asimétrica, lo que sugiere heterogeneidad en los datos.

Page 107: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Cuartiles: C1, C2, C3• Caso particular del cuantil• Curtiles:• Primer cuartil (C1): el 25% de los datos son menores o iguales a éste.

• Tercer cuartil (C3): el 75% de los datos son menores o iguales a éste.

• El segundo cuartil (C2) es la mediana.

• Entre el Primer (C1)y el Tercer cuartil (C3) se encuentra comprendido el 50% central de los datos

25% 25% 25% 25%

C1 C2 C3

Page 108: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 11 UD2)

• Siguiendo con el ejercicio del tiempo de funcionamiento sin averías:

50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52

• Calcular los cuartiles:

Page 109: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Tiempo 30 38 45 47 48 50 50 52 53 55 62(ms)

Nº orden 1 2 3 4 5 6 7 8 9 10 11

C1

25% de 11 datos (3) ≤ C1

Ejercicio (cont.)

1er cuartil = C1 = 45 horas

75% de 11 datos (9) ≥ C1

Page 110: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Tiempo 30 38 45 47 48 50 50 52 53 55 62(ms)

Nº orden 1 2 3 4 5 6 7 8 9 10 11

C3

75% de 11 datos (9) ≤ C3

Ejercicio (cont.)

3er cuartil = C3 = 53 horas

25% de 11 datos (3) ≥ C3

Page 111: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Percentiles• Procedimiento a seguir para el cálculo del percentil 85

1) 3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

2) Calcular el índice i

p: percentil deseadon: nº de observaciones

3a) Como i no es un nº entero, habrá que redondearlo por exceso

è i denota la posición del percentilè posición 11

El percentil 85 es el dato de la posición 11è 3730

¿Qué interpretación tiene este valor?

æ ö æ ö= = =ç ÷ ç ÷è ø è ø

p 85i n 12 10,2100 100

Page 112: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.6 – Parámetros de Dispersión

• Rango o Recorrido• Rango o Recorrido Intercuartílico• Varianza• Desviación típica• Coeficiente de Variación• …

Page 113: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros de dispersión• Permiten cuantificar, mediante un número, la dispersión de las

observaciones

• Con un número nos indican lo cerca o lejos que están unas observaciones de otras.

• Parámetros más relevantes:

n Recorrido o Rangon Varianza y Desviación típican Coeficiente de Variaciónn Recorrido intercuartílico

Page 114: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

7.- Parámetros de Dispersión

• Para describir un conjunto de datos estadísticos no es suficiente con disponer de una medida de su posición è es preciso también cuantificar el grado de dispersión que hay en ellos.

Ejercicio (Ejercicio 13 UD2): Para una persona que no sabenadar es suficiente saber que la profundidad media de un lagoes 1,40 m para lanzarse al baño en el mismo? Por cierto, ¿cuálsería la población y cuál la variable aleatoria en este caso?¿aclararía mucho la decisión el conocer además la profundidadmediana del lago?

Page 115: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Recorrido o Rango

• Idea intuitiva de dispersión

• Máximo valor- Mínimo valor

• Útil en muestras pequeñas (N£10)

• Control estadístico de procesos (n=5)

• Ignora gran parte de los datos

Page 116: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicios 14 y 15 UD2)

X = {30, 38, 45, 47, 48, 50, 50, 52, 62}

R = Max – Min = 62 – 30 = 32 horas

X´ = {30, 38, 45, 47, 48, 50, 50, 52, 150}

R = Max – Min = 150 – 30 = 120 horas

Representativo

NO Representativo

Page 117: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Varianza (S2)• Dado que la media es, en general un buen parámetro de posición,

parece lógico tomar como parámetro de dispersión alguno que esté relacionado con ella:

N2

i2 i 1

(x x)Varianza S

N 1=

-= =

-

å

Nota: Teóricamente, al dividir por (N-1) lo que obtenemos es la cuasivarianza muestral.

Suma de cuadrados

Page 118: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Varianza (S2)Tiempo Diferencias Cuadrados

50 1,82 3,3138 -10,18 103,6745 -3,18 10,1230 -18,18 330,5847 -1,18 1,4050 1,82 3,3148 -0,18 0,0362 13,82 190,9455 6,82 46,4953 4,82 23,2152 3,82 14,58

Media 48,18 727,64 S. de cuadradosN 11 72,76 Varianza

Page 119: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 16 UD2)

Siguiendo con el ejemplo de los tiempos de funcionamiento con y sin averías, la varianza del tiempo sin averías ( ) es:2

XS

Sx2 = ((50-48,18)2 + (38-48,18) 2 + (45-48,18) 2 + (30-48,18) 2 +

+ (47-48,18) 2 + (50-48,18) 2 + (48-48,18) 2 + (62-48,18) 2 +

+ (55-48,18) 2 + (53-48,18) 2 + (52-48,18) 2) / (11-1) = 72,76 h2

¡OJO! Las unidades de la varianza están al cuadrado

Page 120: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Desviación Típica o Estándar (S)

• El más utilizado

• La raíz cuadrada de la varianza

• Más fácil de interpretar puesto que viene expresada en las mismas unidades que los datos originales

2S = S

Page 121: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 16 UD2 cont.)

Siguiendo con el ejemplo de los tiempos de funcionamiento con y sin averías, calcular:

• la desviación típica del tiempo sin averías ( ) XS

horas538 72,76SX ,==

Page 122: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Coeficiente de Variación

• Indicador de dispersión adimensional

• Permite comparar la variabilidad (S, S2) de variables de naturaleza diferente

=SCVX

Page 123: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Coeficiente de Variación

Ejemplo:X = {Tamaño ficheros (Kb)} » (mediaX=20 Kb; SX=10 Kb)Y = {Tiempo ejecución (seg)} » (mediaY =180 seg; SY=36 seg)

¿ Qué variable tiene mayor VARIABILIDAD ?

(SY=36 seg) >>(SX=10 Kb) ¡No se deben comparar!

[CVY=36/180=0,2 ] << [CVX=10/20=0,5] Mayor dispersión

Page 124: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Intervalo Intercuartílico (II)

• Se calcula como la diferencia entre el 3er y 1er cuartil:

= -3 1II C C

n En distribuciones asimétricas o con datos extremos, la S2 no es un buen indicador de la dispersión de los datos à

n Necesitamos un indicador robusto de dispersión à II

Page 125: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (Ejercicio 17 UD2)

X = { 50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52}

IIX = C3 -C1 = 53 -45 = 8 h

X´ = { 50, 38, 45, 30, 47, 50, 48, 150, 55, 53, 52}

IIX’ = C3 -C1 = 53 - 45 = 8 h

=X 8 S ,53 h

=X' 3 S 1,94 h

»

<<X X'S S =X X' II II

Page 126: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros más adecuados• Del mismo modo que preferimos la mediana a la media cuando los

datos son asimétricos o presentan valores anómalos, el Recorrido Intercuartílico es más adecuado que las desviación típica en esas mismas situaciones.

Datos simétricos y sin valores anómalos

Datos asimétricos o con valores anómalos

Posición Media Mediana

Dispersión Desviación típica Recorrido intercuartílico

¡¡Cuidado con las unidades!!!

Page 127: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejemplo: ESTATURA de los alumnos de la UPV

Summary Statistics for ESTATURA

Count = 42Average = 159,681Median = 163,0Mode = Variance = 656,157Standard deviation = 25,6156Lower quartile = 160,0Upper quartile = 165,0Interquartile range = 5,0

Summary Statistics for ESTATURA

Count = 42Average = 163,429Median = 163,0Mode = Variance = 32,2021Standard deviation = 5,67469Lower quartile = 160,0Upper quartile = 165,0Interquartile range = 5,0

Valores en cm Dato en metros

Page 128: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.7 – Parámetros de forma

• Asimetría • Curtosis

Page 129: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Pautas de comportamiento que se alejan sensiblemente de la Normal exigen:

§ la revisión y corrección de datos anómalos, si procede§ recurrir a modelos o tratamientos estadísticos especiales.

7 - Introducción• Los coeficientes de Asimetría y Curtosis son parámetros de forma.• Los dos permiten comprobar si nuestros datos se asemejan suficientemente a una “campana de Gauss” (distribución Normal)

Mediante los parámetros de Asimetría y Curtosis podemos detectar la “no normalidad” de los datos y obrar en consecuencia

Page 130: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

3i

3

(X - X) /(N-1)CA =

Coeficiente de Asimetría (Skewness)

• Cálculo:

CAE Î [-2, 2] à Datos simétricos.CAE > 2 à Asimetría positiva (cola por la derecha)CAE < -2 à Asimetría negativa (cola por la izquierda)

§ En contextos inferenciales se utiliza el Coeficiente de Asimetría Estandarizado (CAE)

Page 131: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Coeficiente de Asimetría (Skewness)

CAE Î [-2, +2]CAE < -2 CAE > +2

Page 132: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Coeficiente de Curtosis• El coeficiente de curtosis mide como de “puntiaguda” o “aplatanada” es la forma de la distribución.• La referencia es la “campana de Gauss”.• Según este coeficiente podemos tener una idea sobre los datos:

Xx1 xi xn

Datos Normales

Muchos datos extremos y/o anómalos

Datos censurados artificialmente

Page 133: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

4i

4

(X - X) /(N-1)CC=

Coeficiente de Curtosis (Kurtosis)

• Cálculo:

CCE Î [-2, 2] à Datos “normales”.CCE > 2 à más “apuntados” de lo normalCCE < -2 à datos “aplanados”

§ En contextos inferenciales se utiliza el Coeficiente de Curtosis Estandarizado (CCE)

Page 134: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Normalidad• Desde un punto de vista meramente descriptivo, podemos comprobar

si nuestros datos se asemejan suficientemente a una “campana de

Gauss” (distribución Normal) cuando

• Son simétricos à CA = 0 ó Std. Skewness Î [-2, 2]

y• Son mesocúrticos à CC = 3 ó CC = 0 ó Std. Kurtosis Î [-2, 2]

• Además podemos estudiar el histograma o el diagrama Box & Whisker

y comparar los parámetros de posición y dispersión.

Page 135: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

CA = 0,878671CA-estandarizado = 3,38412CC = 0,979509CC-estandarizado = 1,88624

Asimetría positivaDatos normales

No Distribución Normal

Histogram

160 170 180 190 200

ESTATURA

0

10

20

30

40

frequency

chicos

EJERCICIO (Ejercicio 19 UD2): Calcular los coeficientes de asimetría y curtosis de la ESTATURA en chicos y chicas y comparar los resultados obtenidos.

Obtener también dichos coeficientes para la variable TIEMPO.

CA-estandarizado > 2CC-estandarizadoÎ [-2, 2]

Page 136: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

CA = 1,29119CA-estandarizado = 3,41616CC = 4,30461CC-estandarizado = 5,69446

CA-estandarizado > 2 Asimetría positiva

CC-estandarizado > 2 Datos anómalos

Histogram

150 160 170 180 190

ESTATURA

0

4

8

12

16

20

frequency

chicas

No Distribución Normal

EJERCICIO (Cont.): Estatura Chicas

Page 137: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Histogram

-10 10 30 50 70 90 110

TIEMPO

0

10

20

30

40

50

60

frequency

CA = 1,26463CA-estandarizado = 5,90912CC = 1,41889CC-estandarizado = 3,31496

CA-estandarizado > 2 Asimetría positiva

CC-estandarizado > 2 Datos extremos

No Distribución Normal

EJERCICIO (Cont.): Tiempo en llegar UPV

Page 138: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

CA = 0,143977CA-estandarizado = 0,587782CC = -0,193152CC-estandarizado = -0,39427

CA-estandarizado Î [-2, 2] Simetría

CC-estandarizado Î [-2, 2] Datos normales

Distribución Normal

Histogram

t ejec

frequ

ency

0 2 4 6 80

5

10

15

20

25

30

EJERCICIO (Cont.): Tiempo de ejecución

Page 139: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

1.8 – DiagramaBox & Whisker

O Diagrama de Caja y Bigotes

Page 140: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

9.- Diagramas Box-Whisker

• No exige un número elevado de datos para su construcción como el Histograma

• Muy útil para comparar 2 grupos de datos y observar de forma gráfica si hay o no diferencias entre ellos.

• La “caja” comprende el 50% de los valores centrales de los datos y se extiende entre el 1º y 3º cuartil

Page 141: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Diagrama Box-Whisker

MedianaQ2

Q3Q1

II

1,5 II1,5 II

X

media

Page 142: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box-and-Whisker Plot

Peso chicas45 50 55 60 65 70 75

C3C1C2

mediana

media

Menor valorconsiderado normal Mayor valor

considerado normal

Datos anómalo“outlier”

50% de los datos centrales

Dato anómalo (“outlier”): Valores extremos que difieren del cuartil más próximo en más de 1,5 veces el intervalo intercuartílico (C3-C1)

Interpretación

Page 143: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio (UD2)

• Siguiendo con el ejercicio del tiempo de funcionamiento sin averías: X = {50, 38, 45, 30, 47, 50, 48, 62, 55, 53, 52}

Gráfico de Caja y Bigotes

X

30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70

Page 144: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Otro ejemplo: datos anómalos

Box-and-Whisker Plot

T ejec0 2 4 6 8 10

2 datos anómalos

Page 145: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box-and-Whisker Plot

Vida útil (meses)0 3 6 9 12 15 18

Otro ejemplo: asimetría positiva

La caja está dividida en 2 mitades desiguales, la de la izquierda, al igual que el bigote, es más pequeña que la de la derecha àasimetría positiva

Page 146: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box-and-Whisker Plot

ESTATURA

SEXOCHICO

CHICA

150155160165170175180185190195200

Ejercicio 20 UD2

Page 147: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box&Whisker e Hitogramas

Histogram

160 170 180 190 200

ESTATURA

0

10

20

30

40

frequency

chicos

Histogram

150 160 170 180 190

ESTATURA

0

4

8

12

16

20

frequency

chicas

Box-and-Whisker Plot

ESTATURA160 170 180 190 200

Box-and-Whisker Plot

ESTATURA150 160 170 180 190

Page 148: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box&Whisker e Hitogramas

Histogram

-10 10 30 50 70 90 110

TIEMPO

0

10

20

30

40

50

60

frequency

Histogram

t ejec

frequ

ency

0 2 4 6 80

5

10

15

20

25

30

Box-and-Whisker Plot

0 2 4 6 8

t ejec

Box-and-Whisker Plot

TIEMPO0 20 40 60 80 100

Page 149: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicios

Page 150: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 1 (Ejercicio 1 UD)Indica si las siguientes características constituyen una variable aleatoria bidimensional:

a) El peso y el modelo de un Tablet PC

b) El número de líneas de código y el número de errores en los programas

preparados por una empresa de software

c) El contenido de leucocitos en la sangre de individuos alcohólicos y no

alcohólicos

d) Las estaturas del marido y de la mujer en los matrimonios jóvenes de

un país

Page 151: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 2 (Ejercicio 2 UD)Si el objetivo del estudio estudiar la relación que existe entre la estatura y el peso en la juventud española:

• El conjunto de los alumnos matriculados en Estadística en 1º del Grado en Ingeniería Informática de Valencia ¿puede considerarse una muestra representativa de la población a efectos del estudio en cuestión?

• Dicho conjunto ¿puede considerarse una muestra representativa para estudiar las tendencias políticas en la juventud española?

• ¿Y para estudiar el nivel cultural?

• ¿Y para estudiar la característica aleatoria color de los ojos?

Page 152: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 3En un control de inspección (Control de Calidad) se analizan 21 cajas (o lotes) de tarjetas de memoria Micro SD, anotándose para cada caja el número de éstas que están defectuosas:

0, 0, 3, 3, 1, 1, 1, 0, 3, 1, 1, 0, 1, 1, 2, 3, 0, 0, 2, 3, 1

Representa los datos mediante una Tabla de frecuencias, indicando la frecuencia absoluta y relativa y las correspondientes acumuladas y contesta a las siguientes cuestiones:

a) ¿Cuál es la población de estudio?

b) ¿Cuál es la muestra y qué tamaño tiene?

c) ¿Cuál es la variable aleatoria implicada?

d) ¿De qué tipo es la variable aleatoria estudiada?

e) ¿Cuántas cajas no tienen ninguna tarjeta de memoria defectuosa?

f) ¿Qué porcentaje de cajas tienen menos de tres tarjetas defectuosas?

Page 153: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 3Frecuencias

Clase o Intervalo Valor v.a. Absoluta Relativa

AbsolutaAcumulada

RelativaAcumulada

1 0 6 29% 6 29%2 1 8 38% 14 67%3 2 2 10% 16 76%4 3 5 24% 21 100%

Page 154: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 4En una distribución de frecuencias, la proporción de observaciones con valores comprendidos entre los límites de un intervalo concreto se conoce con el nombre de:

a) Frecuencia absoluta

b) Frecuencia relativa

c) Frecuencia acumulada

d) Frecuencia total

Page 155: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 5 (Ejercicio 3 UD 2)1) Lee y piensa sobre la siguiente afirmación:“si la variable es continua y el sistema de medida es suficientemente preciso la probabilidad de encontrar dos valores repetidos es nula”

¿Qué opinas?

2) ¿Por qué se pierde mucha información en la tabulación si el número de intervalos considerado es muy pequeño?

Page 156: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 6El siguiente polígono de frecuencias absolutas acumuladas corresponde a la distribución de frecuencias de la variable "Duración en minutos de una consulta al servicio telefónico de la agencia tributaria".

Page 157: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 6A la vista del polígono indica cuál de las siguientes afirmaciones es cierta:

a) 150 consultas han durado entre 20 y 25 minutos.

b) El 42,86% de las consultas han durado entre 20 y 25 minutos.

c) El 57,14% de las consultas han durado como máximo 30 minutos.

d) 200 consultas han durado exactamente 27,5 minutos.

Page 158: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 7El siguiente histograma recoge la distribución del “precio de un determinado artículo” observado en una muestra de 500 establecimientos:

Page 159: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 71) ¿Cuántos establecimientos han fijado un precio entre 7 y 9 Euros?

a) 39 establecimientos

b) 20%

c) 195 establecimientos

d) 56 establecimientos

1) ¿Podríamos haber usado un diagrama de barras en vez de un histograma en este caso? ¿Por qué?

Page 160: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 8 (Ejercicio 4 UD 2)1) Dibujar los histogramas de frecuencias (o unas curvas continuas que

los aproximen) aproximadamente para la variable ESTATURA en los jóvenes españoles, diferenciando el relativo a los chicos del de las chicas.

2) Dibujar también ambos histogramas hipotéticos para la variable COEFICIENTE INTELECTUAL.

Page 161: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 9Tú ya sabes que depende de para qué puede resultar más representativa la mediana que la media. Pero no es fácil verlo en los medios de comunicación en los que, a veces, se sacan conclusiones a partir de referencias engañosas.Sin embargo, durante un programa de análisis político que se emite en La Sexta los sábados por la noche (La Sexta Noche) mostraban unos datos sobre sueldos en España frente a los cuales el economista José Carlos Díez comentaba que era más conveniente utilizar el salario mediano en vez del salario medio. Es decir, la mediana en vez de la media. Visualiza la parte del programa en el siguiente link: http://youtu.be/sH1mhOpwZkI y, a continuación, describe dos situaciones: una relativa a datos en los que fuera más representativo usar la media como parámetro de posición y otra en la que la mediana fuera el parámetro más adecuado para describir el conjunto de datos. Y no te olvides de justificar la elección.

Page 162: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 10Todos los martes a las 7:00 pm quedas con dos amigos (Amparo y Rubén) para ir a tomar una cerveza. Como la vida sin la Estadística ya no tiene sentido para ti, has ido apuntando la hora a la que ha llegado cada uno al sitio de encuentro durante cada martes y has calculado la media y la desviación típica:

Sin más que estos parámetros como datos ¿a quién calificarías de más puntual y por qué?

Amparo RubénHora media de llegada 7 7,25Desviación típica de la hora de llegada 0,5 0,25

Page 163: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 11Indica de qué tipo es cada uno de los siguientes parámetros:

Parámetro TipoAsimetría o SesgoCoeficiente de VariaciónCuartil InferiorCuartil SuperiorCurtosisDesviación EstándarMáximoMedianaMínimoModaPromedio o mediaRangoRango Intercuartílico

Page 164: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 12Resumen parámetros descriptivos

Fichero: CURS8990.sf3 EDAD ESTATURA PESO TIEMPO

Recuento 131 131 131 131Promedio 21,0458 172,855 66,2137 26,1221Mediana 21 174 66 20Moda 20 70 15Desviación Estándar 1,66808 9,07585 10,6569 16,6743Coeficiente de Variación 7,93% 5,25% 16,09% 63,83%Mínimo 19 152 45 4Máximo 32 198 90 90Rango 13 46 45 86Cuartil Inferior 20 165 57 15Cuartil Superior 22 179 74 35Rango Intercuartílico 2 14 17 20Sesgo Estandarizado (asimetría) 14,0474 0,91617 0,3032 5,90912Curtosis Estandarizada 34,6426 -0,19487 -1,47758 3,31496

Page 165: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 121) (Ejercicio 9 UD 2) Calcular las medianas de las variables EDAD,

ESTATURA, PESO y TIEMPO con los datos de la encuesta y compararlos con las medias respectivas.

2) ¿Qué variable tiene mayor dispersión?

3) ¿cómo describirías el comportamiento de cada variable?

4) Dibuja aproximadamente el histograma que crees que correspondería a cada variable.

Page 166: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 13 (Ejercicio 18 UD 2)En los datos de ESTATURA de las chicas modificar un dato poniéndolo en metros en vez de en centímetros. Calcular la media, desviación típica, mediana e intervalo intecuartílico de los nuevos datos de ESTATURA de las chicas y compararlos con los valores que se obtienen tras corregir el dato erróneo. ¿Qué se observa?

Resumen Estadístico para ESTATURA de las CHICASParámetro Datos originales Dato cambiado (160 por 1,6)Recuento 42 42Promedio 163,429 159,657Mediana 163 163Desviación Estándar 5,67 25,6142Rango 33 183,4Rango Intercuartílico 5 5

Page 167: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 14 (Ejercicio 19 UD 2)Calcular los coeficientes de asimetría y curtosis de la ESTATURA en chicos y chicas y comparar los resultados obtenidos. Obtener también dichos coeficientes para la variable TIEMPO.

Resumen parámetros descriptivos

Fichero: CURS8990.sf3EDAD ESTATURA PESO TIEMPO

Sesgo Estandarizado (asimetría) 14,0474 0,91617 0,3032 5,90912

Curtosis Estandarizada 34,6426 -0,19487 -1,47758 3,31496

Page 168: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 15Los siguientes datos expresados en miles de millones de euros representan el volumen mensual de facturación de una serie de empresas del sector cerámico de la Comunidad Valenciana: 7, 8, 3, 5, 2, 1, 12, 10, 21, 40. A partir de estos valores se ha representado el diagrama Box-Whisker:

Box-and-Whisker Plot

0 10 20 30 40

FactMensual

Page 169: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 15

a) ¿Es en este caso la media un buen parámetro de posición o sería más conveniente utilizar otro parámetro? Justifica la respuesta.

b) Calcula un parámetro de dispersión adecuado para los datos anteriores. Justifica por qué se ha elegido dicho parámetro.

Page 170: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Box-and-Whisker Plot

T0 10 20 30 40

Ejercicio 16Se ha registrado el tiempo requerido en la impresión de ciertos ficheros (expresado en segundos) generados por una aplicación gráfica utilizada en una agencia de publicidad. El presente gráfico muestra la información proporcionada para una muestra de 20 de tales ficheros:

Page 171: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 16a) ¿Cuál es la variable implicada en el análisis?

b) ¿Sobre qué población está definida?

A partir de la información proporcionada por el gráfico anterior:

c) ¿Qué se puede decir sobre la distribución de la variableanalizada?

d) ¿Qué parámetro nos aportaría información fiable sobre laposición de los datos analizados?. Justifica tu respuesta y calcula,si es posible, su valor.

e) ¿Qué parámetro nos aportaría información fiable sobre ladispersión de los datos analizados?. Justifica tu respuesta ycalcula, si es posible, su valor.

Page 172: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 17Una empresa de diseño web desea conocer los perfiles de las personas que navegan en una página en concreto en función del tipo de visita que realicen. Una visita es directa si el usuario escribe la dirección web del sitio que desea visitar o accede a través de sus marcadores de favoritos en el navegador, mientras que una visita indirecta procede de motores de búsqueda (Google, MSN Search, Yahoo!) o enlaces externos de otros sitios web. El diagrama Box and Whisker de los datos es:

Directa

Indirecta

Gráfico Caja y Bigotes

0 20 40 60 80 100Tiempo en el sitio

Tipo

de

Vis

ita

Page 173: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 17

Directa

Indirecta

Gráfico Caja y Bigotes

0 20 40 60 80 100Tiempo en el sitio

Tipo

de

Vis

ita

Page 174: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 17A la vista del gráfico obtenido, responde a las siguientes preguntas:

a) ¿Cuáles serían los parámetros de posición y dispersión másadecuados para caracterizar la variable tiempo según el tipo devisita?

b) Desde el punto de vista descriptivo, ¿se detectan diferencias encuanto a la dispersión del tiempo según el tipo de visita delusuario?

c) ¿Existen indicios de asimetría en los tiempos registrados segúnun tipo u otro de visita?

Page 175: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 17d) Estimar si es posible el número de datos que se han tomado pararepresentar el gráfico.

e) Indicar si es correcta la siguiente afirmación: “Aproximadamenteel 50% de las personas que acceden por visita indirecta pasanmenos de 15 minutos en la página mientras que este porcentaje sereduce al 25% para los que acceden por visita directa.

Page 176: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 18En la siguiente figura se muestran los datos relativos a las horas/semana durante las cuales permanecen abiertas las bibliotecas públicas españolas.

¿De qué tipo de gráfico se trata?

A la vista del mismo indica si los datos son o no simétricos y qué parámetros de posición y dispersión serían los más representativos. Justifica la respuesta.

Nº Horas

freq

uenc

y

5 20 35 50 65 80 95 1100

10

20

30

40

50

Page 177: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Ejercicio 19Los gráficos siguientes corresponden a los histogramas y los diagramas Box&Whisker de tres variables diferentes de un conjunto de datos.

Histograma A

Histograma B

Histograma C

Diagrama de caja 1

Diagrama de caja 2

Diagrama de caja 3

Asocia el histograma y diagrama de caja que correspondería a cada una de las tres variables. Da un valor aproximado (o un intervalo) del coeficiente estándar de asimetría de cada caso.

Page 178: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Resumen

Page 179: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Objetivos Estadística

Generar o recopilar datos Analizar

Descriptivo

Resumir y organizar

Inferencia

Extrapolar conclusiones

Interpretar

Page 180: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Población y muestra

Page 181: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Datos estadísticos

Individuo muestra

Variable

Page 182: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Variables aleatorias

variables

cuantitativas o numéricas

Discretas (Z)

Continuas (R)

Cualitativas o categóricas

Nominales

Ordinales

• Naturaleza• Cualitativas• Cuantitativas

• Número de características• Unidimensionales• K-dimensionales

• Conjunto de valores• Discretas• Continuas

Page 183: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Estadística descriptiva

Objetivos

Resumir

Explorar

Regularidades

Page 184: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Unidimensional

Bidimensional

K dimensional

Análisis descriptivo

• Barras• Histograma• Sectores• Boxplot• …

Frecuencias cruzadas:• Marginales• condicionales

Frecuencias:• Absolutas• Relativas• Acumuladas

• Posición• Dispersión• Forma• Relación

Page 185: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Técnicas básicas de estadística descriptiva unidimensional

Tipo Subtipo

Cualitativa/Discreta/Categórica Nominal Frecuencias Diagrama de barrasDiagrama de sectores

Cualitativa/Discreta/Categórica OrdinalFrecuenciasModa, medianaRango, cuartiles

Diagrama de barrasBox-plot

Cuantitativa/Continua

Media, mediana, modaVarianza, desviación típicaCoeficiente de variaciónPercentiles…

HistogramaBox-plot

Variable Estadísticos Gráficos

Page 186: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Parámetros más adecuados• Del mismo modo que preferimos la mediana a la media cuando los

datos son asimétricos o presentan valores anómalos, el Recorrido Intercuartílico es más adecuado que las desviación típica en esas mismas situaciones.

Datos simétricos y sin valores anómalos

Datos asimétricos o con valores anómalos

Posición Media Mediana

Dispersión Desviación típica Recorrido intercuartílico

¡¡Cuidado con las unidades!!!

Page 187: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Herramientas estadística descriptiva

Tablas

ParámetrosGráficos

• ¿Cuál es el objetivo del estudio?

• ¿Qué tipo de variables tengo?

1. ¿Qué herramientas son adecuadas?

2. ¿Qué relación hay entre ellas?

Page 188: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

¿Por dónde vamos?

PoblaciónEstadística descriptiva

gráficosparámetrostablas

muestreo

Inferencia estadística

Muestra

Conclusiones válidas con razonable seguridad Probabilidad

UD2

UD5

UD4

UD3

Page 189: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Mapa mental

Page 190: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Mapa mental

Page 191: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Glosario UD 1 y 2

Apuntamiento Frecuencia acumulada Parámetro muestral PosiciónBox & Whisker Frecuencia relativa Individuo Recorrido o RangoCaja y Bigotes Histograma Inferencia Recorrido o Rango

IntercuartílicoCampana de Gauss Desviación típica Media SimetríaCaracterística aleatoria Diagrama de barras Mediana Tabla de frecuenciasCoeficiente de asimetría Diagrama de sectores o

tartaModa Tabla de frecuencias

cruzadasCoeficiente de curtosis Dispersión Muestra v.a. ContinuaCoeficiente de Variación Distribución Normal Muestreo v.a. CualitativaCuartil Estadística Normalidad v.a. CuantitativaDato anómalo Experimento aleatorio Parámetro de

dispersiónv.a. Discreta

Dato o valor extremo Frecuencia absoluta Parámetro poblacional VariabilidadDatos estadísticos Parámetro de forma Percentil Variable aleatoria (v.a.)Descriptiva, Estadística Parámetro de posición Población Varianza

Page 192: Grado en Ingeniería Informática · 2018-01-30 · • Característica aleatoria y variable aleatoria • Tipos • Dimensiones • Datos • Estadística descriptiva unidimensional

DEIOAC – Estadística – Prof. E. Vázquez UD-2 Estadística Descriptiva

Fin

Fuentes: Romero y Zúnica: “Métodos Estadísticos en Ingeniería” | Instituto Nacional de Estadística (INE) | Material docente de R. Alcover (DEIOAC -UPV) | Material docente de V. Giner (DEIOAC - UPV) | Material docente de S. Vidal (DEIOAC - UPV) | Material docente de A. Calduch (DEIOAC - UPV) |

Elaborado por E. Vázquez (DEIOAC - UPV)

Estas transparencias NO son unos apuntes, son solo un guión de las explicaciones hechas en clase y algunos ejemplos adicionales.

Esta obra está bajo una licencia Reconocimiento-No comercial-Compartir bajo la misma licencia 2.5 España de Creative Commons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-sa/2.5/es/