Upload
jacinto-gonzalez-pachon
View
312
Download
3
Embed Size (px)
Citation preview
Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
1. Introducción
Seis objetivos de la Estadística Descriptiva
A. Recoger y organizar datos (observaciones)
x1, x2,..., xn
Calificaciones de “Probabilidades y Estadística” en 20 alumnos
5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5
(x1, y1), (x2, y2),…,(xn,, yn) (5.12, 2), (7, 1), (8.62, 2), (6, 3), (2.88, 2),(7.33, 2), (6, 3), (2.75, 4) (5.25, 2), (5, 1),(6.88, 5) (5.83, 1), (5, 4), (3.38,4), (6.25, 3), (6.12, 1), (6, 2), (4.62, 3), (6.62, 2), (8.5, 1)
Calificaciones de “Probabilidades y Estadística” y nº de convocatorias utilizadas hasta ahora
(1/6)
Probabilidades y Estadística I
1. Introducción (2/6)
B. Técnicas de visualización para datos multivariantes (visualización)
Seis objetivos de la Estadística Descriptiva
Probabilidades y Estadística I
1. Introducción
C. Esquematizar el comportamiento de los datos mediante tablas, gráficos o dibujos (patrones)
Seis objetivos de la Estadística Descriptiva
(3/6)
Probabilidades y Estadística I
1. Introducción
D. Resumir la información en unos pocos datos representativos (síntesis)
Seis objetivos de la Estadística Descriptiva
(4/6)
Probabilidades y Estadística I
1. Introducción
E. Analizar la relación de dependencia entre las componentes de datos multidimensionales (correlación)
Seis objetivos de la Estadística Descriptiva
(5/6)
Probabilidades y Estadística I
1. Introducción
F. Interpretar la información obtenida (aprendizaje)
Seis objetivos de la Estadística Descriptiva
(6/6)
Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Enunciados genéricos
(1/12)
Sea x1, x2,….., xn un conjunto de n valores numéricos
Sea (x1, y1), (x2, y2),….., (xn, yn)
Sea 1 1 1 2 2 21 2 1 2 1 2( , ,..., ), ( , ,..., ),......, ( , ,..., )n n n
m m mx x x x x x x x x
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(5/12)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Enunciado
(6/12)
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el número deconvocatorias que necesitaron para aprobar dicha asignatura
PoblaciónMuestra
Carácter a estudio
MODALIDADES: {1,2,3,......} (carácter cuantitativo)
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Otro enunciado
(7/12)
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su nota en laAsignatura.
Carácter a estudio
MODALIDADES: [5,10] (carácter cuantitativo)
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Un nuevo enunciado
(8/12)
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su color deojos.
Carácter a estudio
MODALIDADES: {negros, marrones, azules, otros} (carácter cualitativo)1 2 3 4
MEDIDA NOMINAL
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Tipos de caracteres
(9/12)
Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el nivelde estudio de su padre .
Carácter a estudio
MODALIDADES: {SE, EGB, BUP, Universitario} (carácter cualitativo)1 2 3 4
MEDIDA ORDINALEl penúltimo enunciado
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
El último
(10/12)
Se lanza 20 veces una moneda y se observan los resultados.
MODALIDADES: {C, X} (carácter cualitativo)
Población: Lanzar una moneda (experimento aleatorio)
Muestra: 20 lanzamientos
MEDIDA NOMINAL
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
NOTACIÓN
(11/12)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
P
M P
C
C1, C2,…., Ck
Xx’1, x’2,…., x’k k valores
diferentes
Probabilidades y Estadística I
Ejemplo del Lego
NOTACIÓN
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
Piezas del lego
Subconjunto de 10 piezas
Color
rojo, azul, verde
X1, 2, 3 3 valores
diferentes
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. CarácterCualitativo
Cuantitativo
Discreta
ContinuaModalidades = Rango
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. CarácterCualitativo
Cuantitativo
Discreta
ContinuaModalidades = Rango
Cuantificación Medida nominal
Medida ordinal
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. CarácterCualitativo
Cuantitativo
Discreta
ContinuaModalidades = Rango
Medida de intervalo
Medida de razón
Probabilidades y Estadística I
Medida Operacionesposibles
Requisitos Ejemplo.
Nominal Verificar la igualdadde dos modalidades.
Posibilidad depermutar
modalidades
Estado civil, Sexo,nacionalidad.
Ordinal Verificar si unamodalidad es mayor
que otra.
Mantenimiento delorden
Gravedad de unalesión.
De intervalo Comparar lasdiferencias entre dos
modalidades.
Unidad constante Temperatura.
De razónEstablecer razonesentre modalidades Existencia de cero
absolutoPeso, altura...
2. Variables y datos. Tipos de datos
Caracterescualitativos
Caracterescuantitativos
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
MEDIDANOMINAL
Relaciones entre medidas
MEDIDAORDINAL
MEDIDADE INTERVALO
MEDIDADE RAZÓN
Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas (caso unidimensional)
4. Descripción de datos mediante gráficos.
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
3. Descripción de datos mediante tablas (1/8)
SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3
SERIE 2 2, 4, 6, 8, 10, 12
SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4
PATRONES NUMÉRICOS
SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1
Cte = 3
Xn = 2n n = 1,2,3....
n veces el número “n”
Probabilidades y Estadística I
3. Descripción de datos mediante tablas (2/8)
PATRONES NUMÉRICOS
SERIE 4 Seis “1”Tres “2”Un “3”
REPETICIONES(Tablas)
REPETICIONES(Gráficos)
Probabilidades y Estadística I
Modalidad Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
x’1 n1 N1=n1 f1 = n1/n F1 = f1
x’2 n2 N2=n1 + n2 f2 = n2/n F2= f1 + f2... ... ... ... ...
x’i ni Ni = n jj
i
1f1 = ni/n Fi= f j
j
i
1
... ... ... ... ...
x’k nk Nk =
k
jjn
1fk = nk/n Fk= f j
j
n
1= 1
TOTALES n 1
3. Descripción de datos mediante tablas (3/8)
DATOS UNIDIMENSIONALES
Probabilidades y Estadística I
Modalidad Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
1 6 6 6/10 = 0.60 0.60
2 3 9 0.30 0.90
3 1 10 0.10 1
TOTALES 10 1
SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1
Probabilidades y Estadística I
MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística”aprobada
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X nº de convocatorias
RANGO: Rg X = {1,2,3,......}
SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1
SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5
3. Descripción de datos mediante tablas (4/8)
EJEMPLO 1
Probabilidades y Estadística I
Nº deconvocatorias
Frecuenciaabsoluta
Frecuencia absolutaacumulada
Frecuenciarelativa
Frecuencia relativaacumulada
1 9 9 9/20 = 0.45 0.45
2 4 13 0.20 0.65
3 3 16 0.15 0.80
4 1 17 0.05 0.85
5 3 20 0.15 1
TOTALES 20 1
3. Descripción de datos mediante tablas (5/8)
EJEMPLO 1
Probabilidades y Estadística I
MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura “Probabilidades y Estadística”
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X calificación en “P y E”
RANGO: Rg X = [0,10]
SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5
SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6,6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62
3. Descripción de datos mediante tablas (6/8)
EJEMPLO 2
Probabilidades y Estadística I
Calificaciones(clases)
Marcas declase
Frecuenciaabsoluta
Frecuencia absolutaacumulada
Frecuenciarelativa
Frecuencia relativaacumulada
[ 0, 1 ] 0.5 0 0 0 0
( 1, 2 ] 1.5 0 0 0 0
( 2, 3 ] 2.5 3 3 0.15 0.15
( 3, 4 ] 3.5 1 4 0.05 0.20
( 4, 5 ] 4.5 3 7 0.15 0.35
( 5, 6 ] 5.5 5 12 0.25 0.60
( 6, 7 ] 6.5 5 17 0.25 0.85
( 7, 8 ] 7.5 1 18 0.05 0.90
( 8, 9 ] 8.5 2 20 0.10 1
( 9, 10 ] 9.5 0 20 0 1
TOTALES 20 1
3. Descripción de datos mediante tablas (7/8)
EJEMPLO 2
MODALIDADESx’i
Probabilidades y Estadística I
Esquema inicial
1. Introducción.
2. Variables y datos. Tipos de datos.
3. Descripción de datos mediante tablas.
4. Descripción de datos mediante gráficos (caso unidimensional)
5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
No presentadosAprobadosSuspensos
34,09%
48,86%
17,05%
4. Descripción de datos mediante gráficos (1/13)
Medidas nominales. Datos categóricos
1. Diagrama de sectores
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Frec
uenc
ias A
bsol
utas
Continentes
0
10
20
30
40
50
Europa América Asia Africa Oceanía
4. Descripción de datos mediante gráficos (2/13)
Medidas nominales. Datos categóricos
2. Diagrama de rectángulos
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I 0 10 20 30 40 50
España
Francia
Italia
Bélgica
3. Pictogramas
4. Descripción de datos mediante gráficos (3/13)
Medidas nominales. Datos categóricos
3. Pictogramas
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
1. Diagrama de barras
4. Descripción de datos mediante gráficos (4/13)
Representacióndiferencial
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
2. Función de distribución escalonada
4. Descripción de datos mediante gráficos (5/13)
Representaciónintegral
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (6/13)
Medidas intervalar/razón
1. Histogramas (polígono de frecuencias)
VARIABLE ESTADÍSTICA
CONTÍNUA
Representacióndiferencial
Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (7/13)
Medidas intervalar/razón
2. Diagrama tallo-hoja
44, 45, 46, 46, 47, 48, 49, 50, 50, 50, 52, 52, 52, 52, 53, 53, 53, 54, 54, 54, 55, 55, 55, 55, 56, 56, 56, 57, 60, 60, 60, 60 ,60, 61, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 66, 67, 68, 68, 68, 70, 70, 70, 70, 71, 72, 72, 74, 75, 80, 93.
Análisis Exploratorio de Datos
Probabilidades y Estadística I
Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0
10 0|1222333344 (9) 0|555556779 5 1| 5 1|5
HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)
VALORES ATÍPICOS POR EXCESO
FRECUENCIAS ABSOLUTAS ACUMULADAS
4. Descripción de datos mediante gráficos (8/13)
Probabilidades y Estadística I
IPC
Frec
. Abs
ol
0 4 8 12 160
2
4
6
8
10
4. Descripción de datos mediante gráficos (9/13)
Histograma vs. Tallo-hoja
Probabilidades y Estadística I
0 1 2 3 40
0,2
0,40,6
0,81
1,2
4. Descripción de datos mediante gráficos (10/13)
Catálogo de perfiles
Perfil de datos sin tratar
Probabilidades y Estadística I
-5 -3 -1 1 3 50
0,1
0,2
0,3
0,4
Forma de campana
4. Descripción de datos mediante gráficos (11/13)
Catálogo de perfiles
Probabilidades y Estadística I
0 10 20 30 40 50 600
0,02
0,04
0,06
0,08
0,1
Asimétrico desplazado a la dcha
0 1 2 3 40
0,2
0,4
0,6
0,8
1
1,2
4. Descripción de datos mediante gráficos (12/13)
Catálogo de perfiles