53
Probabilidades y Estadística I TEMA 1 El análisis estadístico de datos

Tema1 (1ª parte)

Embed Size (px)

Citation preview

Probabilidades y Estadística I

TEMA 1

El análisis estadístico de datos

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

1. Introducción

Seis objetivos de la Estadística Descriptiva

A. Recoger y organizar datos (observaciones)

x1, x2,..., xn

Calificaciones de “Probabilidades y Estadística” en 20 alumnos

5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5

(x1, y1), (x2, y2),…,(xn,, yn) (5.12, 2), (7, 1), (8.62, 2), (6, 3), (2.88, 2),(7.33, 2), (6, 3), (2.75, 4) (5.25, 2), (5, 1),(6.88, 5) (5.83, 1), (5, 4), (3.38,4), (6.25, 3), (6.12, 1), (6, 2), (4.62, 3), (6.62, 2), (8.5, 1)

Calificaciones de “Probabilidades y Estadística” y nº de convocatorias utilizadas hasta ahora

(1/6)

Probabilidades y Estadística I

1. Introducción (2/6)

B. Técnicas de visualización para datos multivariantes (visualización)

Seis objetivos de la Estadística Descriptiva

Probabilidades y Estadística I

1. Introducción

C. Esquematizar el comportamiento de los datos mediante tablas, gráficos o dibujos (patrones)

Seis objetivos de la Estadística Descriptiva

(3/6)

Probabilidades y Estadística I

1. Introducción

D. Resumir la información en unos pocos datos representativos (síntesis)

Seis objetivos de la Estadística Descriptiva

(4/6)

Probabilidades y Estadística I

1. Introducción

E. Analizar la relación de dependencia entre las componentes de datos multidimensionales (correlación)

Seis objetivos de la Estadística Descriptiva

(5/6)

Probabilidades y Estadística I

1. Introducción

F. Interpretar la información obtenida (aprendizaje)

Seis objetivos de la Estadística Descriptiva

(6/6)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Enunciados genéricos

(1/12)

Sea x1, x2,….., xn un conjunto de n valores numéricos

Sea (x1, y1), (x2, y2),….., (xn, yn)

Sea 1 1 1 2 2 21 2 1 2 1 2( , ,..., ), ( , ,..., ),......, ( , ,..., )n n n

m m mx x x x x x x x x

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

(5/12)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

Probabilidades y Estadística I

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Enunciado

(6/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el número deconvocatorias que necesitaron para aprobar dicha asignatura

PoblaciónMuestra

Carácter a estudio

MODALIDADES: {1,2,3,......} (carácter cuantitativo)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Otro enunciado

(7/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su nota en laAsignatura.

Carácter a estudio

MODALIDADES: [5,10] (carácter cuantitativo)

Probabilidades y Estadística I

Discreto

Continuo

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Un nuevo enunciado

(8/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su color deojos.

Carácter a estudio

MODALIDADES: {negros, marrones, azules, otros} (carácter cualitativo)1 2 3 4

MEDIDA NOMINAL

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Tipos de caracteres

(9/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el nivelde estudio de su padre .

Carácter a estudio

MODALIDADES: {SE, EGB, BUP, Universitario} (carácter cualitativo)1 2 3 4

MEDIDA ORDINALEl penúltimo enunciado

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

El último

(10/12)

Se lanza 20 veces una moneda y se observan los resultados.

MODALIDADES: {C, X} (carácter cualitativo)

Población: Lanzar una moneda (experimento aleatorio)

Muestra: 20 lanzamientos

MEDIDA NOMINAL

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

NOTACIÓN

(11/12)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

P

M P

C

C1, C2,…., Ck

Xx’1, x’2,…., x’k k valores

diferentes

Probabilidades y Estadística I

Ejemplo del Lego

NOTACIÓN

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

Piezas del lego

Subconjunto de 10 piezas

Color

rojo, azul, verde

X1, 2, 3 3 valores

diferentes

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Cuantificación Medida nominal

Medida ordinal

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Medida de intervalo

Medida de razón

Probabilidades y Estadística I

Medida Operacionesposibles

Requisitos Ejemplo.

Nominal Verificar la igualdadde dos modalidades.

Posibilidad depermutar

modalidades

Estado civil, Sexo,nacionalidad.

Ordinal Verificar si unamodalidad es mayor

que otra.

Mantenimiento delorden

Gravedad de unalesión.

De intervalo Comparar lasdiferencias entre dos

modalidades.

Unidad constante Temperatura.

De razónEstablecer razonesentre modalidades Existencia de cero

absolutoPeso, altura...

2. Variables y datos. Tipos de datos

Caracterescualitativos

Caracterescuantitativos

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

MEDIDANOMINAL

Relaciones entre medidas

MEDIDAORDINAL

MEDIDADE INTERVALO

MEDIDADE RAZÓN

Probabilidades y Estadística I

Pregunta de test

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas (caso unidimensional)

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (1/8)

SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3

SERIE 2 2, 4, 6, 8, 10, 12

SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4

PATRONES NUMÉRICOS

SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1

Cte = 3

Xn = 2n n = 1,2,3....

n veces el número “n”

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (2/8)

PATRONES NUMÉRICOS

SERIE 4 Seis “1”Tres “2”Un “3”

REPETICIONES(Tablas)

REPETICIONES(Gráficos)

Probabilidades y Estadística I

Modalidad Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

x’1 n1 N1=n1 f1 = n1/n F1 = f1

x’2 n2 N2=n1 + n2 f2 = n2/n F2= f1 + f2... ... ... ... ...

x’i ni Ni = n jj

i

1f1 = ni/n Fi= f j

j

i

1

... ... ... ... ...

x’k nk Nk =

k

jjn

1fk = nk/n Fk= f j

j

n

1= 1

TOTALES n 1

3. Descripción de datos mediante tablas (3/8)

DATOS UNIDIMENSIONALES

Probabilidades y Estadística I

Modalidad Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

1 6 6 6/10 = 0.60 0.60

2 3 9 0.30 0.90

3 1 10 0.10 1

TOTALES 10 1

SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1

Probabilidades y Estadística I

MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística”aprobada

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X nº de convocatorias

RANGO: Rg X = {1,2,3,......}

SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1

SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5

3. Descripción de datos mediante tablas (4/8)

EJEMPLO 1

Probabilidades y Estadística I

Nº deconvocatorias

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

1 9 9 9/20 = 0.45 0.45

2 4 13 0.20 0.65

3 3 16 0.15 0.80

4 1 17 0.05 0.85

5 3 20 0.15 1

TOTALES 20 1

3. Descripción de datos mediante tablas (5/8)

EJEMPLO 1

Probabilidades y Estadística I

MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura “Probabilidades y Estadística”

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X calificación en “P y E”

RANGO: Rg X = [0,10]

SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5

SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6,6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62

3. Descripción de datos mediante tablas (6/8)

EJEMPLO 2

Probabilidades y Estadística I

Calificaciones(clases)

Marcas declase

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

[ 0, 1 ] 0.5 0 0 0 0

( 1, 2 ] 1.5 0 0 0 0

( 2, 3 ] 2.5 3 3 0.15 0.15

( 3, 4 ] 3.5 1 4 0.05 0.20

( 4, 5 ] 4.5 3 7 0.15 0.35

( 5, 6 ] 5.5 5 12 0.25 0.60

( 6, 7 ] 6.5 5 17 0.25 0.85

( 7, 8 ] 7.5 1 18 0.05 0.90

( 8, 9 ] 8.5 2 20 0.10 1

( 9, 10 ] 9.5 0 20 0 1

TOTALES 20 1

3. Descripción de datos mediante tablas (7/8)

EJEMPLO 2

MODALIDADESx’i

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (8/8)

AGRUPAMIENTO EN CLASES

Probabilidades y Estadística I

Pregunta de test

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos (caso unidimensional)

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

No presentadosAprobadosSuspensos

34,09%

48,86%

17,05%

4. Descripción de datos mediante gráficos (1/13)

Medidas nominales. Datos categóricos

1. Diagrama de sectores

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Frec

uenc

ias A

bsol

utas

Continentes

0

10

20

30

40

50

Europa América Asia Africa Oceanía

4. Descripción de datos mediante gráficos (2/13)

Medidas nominales. Datos categóricos

2. Diagrama de rectángulos

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I 0 10 20 30 40 50

España

Francia

Italia

Bélgica

3. Pictogramas

4. Descripción de datos mediante gráficos (3/13)

Medidas nominales. Datos categóricos

3. Pictogramas

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

1. Diagrama de barras

4. Descripción de datos mediante gráficos (4/13)

Representacióndiferencial

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

2. Función de distribución escalonada

4. Descripción de datos mediante gráficos (5/13)

Representaciónintegral

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (6/13)

Medidas intervalar/razón

1. Histogramas (polígono de frecuencias)

VARIABLE ESTADÍSTICA

CONTÍNUA

Representacióndiferencial

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (7/13)

Medidas intervalar/razón

2. Diagrama tallo-hoja

44, 45, 46, 46, 47, 48, 49, 50, 50, 50, 52, 52, 52, 52, 53, 53, 53, 54, 54, 54, 55, 55, 55, 55, 56, 56, 56, 57, 60, 60, 60, 60 ,60, 61, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 66, 67, 68, 68, 68, 70, 70, 70, 70, 71, 72, 72, 74, 75, 80, 93.

Análisis Exploratorio de Datos

Probabilidades y Estadística I

Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0

10 0|1222333344 (9) 0|555556779 5 1| 5 1|5

HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)

VALORES ATÍPICOS POR EXCESO

FRECUENCIAS ABSOLUTAS ACUMULADAS

4. Descripción de datos mediante gráficos (8/13)

Probabilidades y Estadística I

Probabilidades y Estadística I

IPC

Frec

. Abs

ol

0 4 8 12 160

2

4

6

8

10

4. Descripción de datos mediante gráficos (9/13)

Histograma vs. Tallo-hoja

Probabilidades y Estadística I

0 1 2 3 40

0,2

0,40,6

0,81

1,2

4. Descripción de datos mediante gráficos (10/13)

Catálogo de perfiles

Perfil de datos sin tratar

Probabilidades y Estadística I

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

Forma de campana

4. Descripción de datos mediante gráficos (11/13)

Catálogo de perfiles

Probabilidades y Estadística I

0 10 20 30 40 50 600

0,02

0,04

0,06

0,08

0,1

Asimétrico desplazado a la dcha

0 1 2 3 40

0,2

0,4

0,6

0,8

1

1,2

4. Descripción de datos mediante gráficos (12/13)

Catálogo de perfiles

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (13/13)

Medidas intervalar/razón

3. Función de distribución (polígono acumulativo)

VARIABLE ESTADÍSTICA

CONTÍNUA