View
266
Download
4
Embed Size (px)
Citation preview
Estadística y probabilidad
Santiago de Chile 2013
Profesor Rubén Rodríguez A. Física y Matemáticas
Repaso:
Tendencia central: punto medio de una distribución.
Dispersión: separación de los datos en una distribución.
Sesgo: Las curvas representan los datos puntuales de un conjunto de datos que pueden ser simétricas o sesgadas.
Curtosis: Cuando se mide la curtosis de una distribución, se mide qué tan puntiaguda es.
Sueldos mensuales iniciales en una muestra de 12 recién egresados de la carrera de administración
Egresado Sueldo mensual inicial
Egresado Sueldo mensual inicial ($)
1 1690500 7 1710100
2 1739500 8 1827700
3 1788500 9 1734600
4 1705200 10 1923250
5 1643950 11 1724800
6 1621900 12 1705200
𝑥 = 𝑥𝑖
𝑘𝑖=1
𝑛=𝑥1+𝑥2+⋯𝑥12
12=
1690500 +1739500 +⋯+1705200 12
=
1734600
Para la media poblacional es lo mismo excepto la notación:
𝜇 = 𝑥𝑖
𝑁
En una empresa en la que hay 80 empleados, 60 ganan 4900 pesos chilenos por hora y 20 ganan 6370 por hora.
a) Determinar el sueldo medio por hora
𝑋 = 𝑓𝑋
𝑛=
60 4900 +(20)(6370)
60+20=
Las desviaciones de los números dados respecto al 9 son -4, -1, 2, 0, 3, -3, 5 y 1. Calcule la media aritmética para datos agrupados.
𝑋 = 𝐴 + 𝑑
𝑁=9 +
3
8=
Mediana para los sueldos… 1621900 1643950 1690500 1705200 1705200 1710100 1724800 1734600 1739500 1827700 1788500 1923250
Los valores de en medio
La mediana es el promedio de estos dos valores
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =1710100 + 1724800
2= 1717450
A partir de los datos de la siguiente la mediana es un peso tal que la mitad del total de las frecuencias (40/2=20) quede por encima de él y la mitad del total de las frecuencias quede por debajo de él.
Peso (lb) Frecuencias
118-126 3
127-135 5
136-144 9
145-153 12
154-162 5
163-171 4
172-180 2
Total 40
-- la suma de las tres primeras frecuencias de clases es 3+5+9=17. Por tanto, para dar la frecuencia 20, que es la buscada, se necesitan tres más de los 12 casos que pertenecen a la cuarta clase.
-- como el cuarto intervalo de clase, 145-153, en realidad corresponde a los pesos desde 144.5 hasta 153.5, la mediana debe encontrase a 3/12 entre 144.5 y 153.5.
L1=frontera inferior de clase de la clase mediana =144.5
N=número de datos=40
𝑓1 = 3 + 5 + 9 suma de todas las frecuencias de todas las clases anteriores a la clase mediana.
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =frecuencia de la clase mediana=12
C=amplitud del intervalo de la clase mediana=9
Mediana=𝐿1 + (𝑁
2 − 𝑓 1
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎)𝑐
La moda en los sueldos es lámina 6 es:
El valor que se presenta con mayor frecuencia: 1705200
Emplear la fórmula empírica media-moda=3(media-mediana) para hallar el salario modal de los 65 empleados de la empresa P&R sabiendo que la media es =131130.70 pesos chilenos y mediana =136710.66.
Encontrar: a) la media geométrica y b) la media aritmética de los números 3,5,6,6,7,10 y 12. Se supone que los números son exactos.
Cuartiles, deciles y percentiles
Aporta información acerca de la dispersión de los datos en el intervalo que va del menor al mayor valor de los datos.
Por ejemplo la mediana divide en dos partes iguales a los datos.
-- Sean 𝑄1, 𝑄2 𝑦 𝑄3 el primer, segundo y tercer cuartil (dividen los datos en cuatro partes iguales); 𝑄2 coincide con la mediana.
-- Los deciles dividen al conjunto de datos en diez partes iguales 𝐷1,𝐷2, … , 𝐷𝑔.
-- Los valores que dividen al conjunto en 100 partes iguales son los percentiles 𝑃1, 𝑃2 , …, 𝑃𝑔𝑔
Calculo de los cuartiles para datos no agrupados:
𝑘 𝑛 + 1
4, 𝑘 = 1,2,3 𝑦 4
Donde:
n= número de observaciones
K=cuartil
Cálculo de cuartiles para datos agrupados
𝑄𝑘 = 𝐿𝑖 +𝐿𝑓 − 𝐿𝑖
4, 𝑐𝑜𝑛 𝐾 = 1,2,3 𝑦 4
Donde:
𝑄𝑘=cuartil k,
𝐿𝑖=límite inferior,
𝐿𝑓=límite superior.
Ejercicio:
Considere las siguientes temperaturas (en grados Celcius) reportadas en un experimento:
25 28 25 26 28 28
35 32 31 31 32 27
25 29 26 28 27 28
30 30 31 31 30 31
Calcular :
a) La posición del primer cuartil,
b) La posición del segundo cuartil,
c) La posición del tercer cuartil.
Nota: Puedes interpolar para encontrar el valor correcto a la posición de los cuartiles.
Cálculo de Deciles
En primer lugar se busca donde se encuentra 𝑘𝑁
10, 𝑝𝑎𝑟𝑎 𝑘 = 1,2,3,4, … 9, en la tabla de
frecuencias acumuladas.
𝐷𝑘 = 𝐿𝑘 +
𝑘𝑁10
− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)
𝑓𝑖𝑐
Para datos no agrupados
Donde:
𝐿𝑘=límite inferior de la clase del decil k
N= número de datos
𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)=Frecuencia acumulada de la
clase que antecede a la clase del decil k.
𝑓𝑘=frecuencia de la clase del decil k
c=longitud del intervalo de la clase del decil k.
Ejercicio: Calcular los deciles de la distribución siguiente:
f
[50,60) 8
[60,70) 10
[70,80) 16
[80,90) 14
[90,100) 10
[100,110) 5
[110,120) 2
Cálculo de percentiles
Para datos agrupados:
𝑃𝑘 = 𝐿𝑘 +𝑘
𝑛100
− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)
𝑓𝑘𝑐
Para datos no agrupados:
𝑘𝑛
100
Ejercicio:
Determinar el primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla de salarios:
Salarios Número de empleados
200000-299000 85
300000-299000 90
400000-499000 120
500000-599000 70
600000-699000 62
700000-800000 36
Desviación media 𝐷𝑚
Es la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número de total de datos:
𝐷𝑚 = 𝑋𝑖 − 𝑋 𝑛
𝑖=1
𝑛
**Este indicador muestra que tan disperso se encuentran un
conjunto de datos a un punto de concentración.
Ejercicio:
Halar la desviación media en la siguiente distribución de frecuencias:
Clases f
8-10 3
11-13 6
14-16 9
17-19 11
20-22 5
Desviación Estándar 𝜎
La desviación estándar es la raíz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media:
𝜎 = 𝑋𝑖−𝑋 2𝑛
𝑖=1
𝑛
**Mide la dispersión de un grupo o población (indica si la población esta muy dispersa respecto de la media) una desviación estándar pequeña indica que la población está muy compacta alrededor de la media.
Varianza 𝜎2
Mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Se define como el cuadrado de la desviación estándar: v=𝜎2
Ejercicio:
Hallar la desviación estándar y la varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7.
Ejercicio:
Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.
clases f
10-15 2
16-21 8
22-27 13
28-33 10
34-39 6
Próxima clase:
Contenidos:
-- Coeficiente de variación
-- Diagramas de dispersión
-- Covarianza
-- Correlación
-- Regresión lineal por covarianza
-- Regresión lineal por mínimos cuadrados
-- Sesgos, momentos y curtosis