Upload
anonymous-k2avui
View
4
Download
1
Embed Size (px)
DESCRIPTION
BUEN MATERIAL
Citation preview
Proporcionar al cursante, los conocimientos básicos de Estadística,
por medio de ejemplificaciones concretas, con la finalidad que
dichos conocimientos adquiridos puedan ser aplicados en el campo
preventivo-investigativo.
OBJETIVO GENERAL:
Definición de Estadística
Se refiere a un conjunto de métodos para manejar la obtención,
presentación y análisis de observaciones numéricas
• FASES DEL ESTUDIO ESTADÍSTICO
Recopilación de
datos.
Organización y
representación de
datos.
Análisis de
datos.
Obtención de
conclusiones.
• CLASIFICACIÓN DE LA ESTADÍSTICA
Estadística
Descriptiva.
Conjunto de métodos y técnicas que
son usados para recolectar, organizar
y presentar en forma de tablas y
gráficas información numérica.
• CLASIFICACIÓN DE LA ESTADÍSTICA
Estadística
Inferencial.
Conjunto de métodos y técnicas que
son usados para sacar conclusiones
generales acerca de una población
usando datos de una muestra tomada
de ella.
• CLASIFICACIÓN DE LA ESTADÍSTICA
Estadística Aplicada Es una combinación de las anteriores
Persigue ordenar la información y
obtener conclusiones para todo el
universo a partir de una muestra
Se aplica en una variedad de campos
Industria
Medicina
Biología
Psicología
CONCEPTOS DE ESTADÍSTICA
Población Es el conjunto de todos los elementos a los que se
somete a un estudio estadístico.
Individuo Un individuo o unidad estadística es cada
uno de los elementos que componen la
población.
Muestra Una muestra es un conjunto representativo de la
población de referencia, el número de individuos de
una muestra es menor que el de la población
Muestreo El muestreo es la reunión de datos que se desea
estudiar, obtenidos de una proporción reducida y
representativa de la población.
Valor Un valor es cada uno de los distintos resultados que se
pueden obtener en un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos dos
valores: cara y cruz
Dato Un dato es cada uno de los valores que se ha obtenido
al realizar un estudio estadístico. Si lanzamos una
moneda al aire 5 veces obtenemos 5 datos: cara,
cara, cruz, cara, cruz.
Variables estadísticas Una variable estadística es cada una de las
características o cualidades que poseen los
individuos de una población.
DISTRIBUCIÓN DE FRECUENCIAS.
Distribución de frecuencias o tabla de frecuencia es una ordenación
en forma de tabla de los datos estadísticos, asignando a cada dato su
frecuencia correspondiente.
TIPOS DE FRECFUENCIAS.
Frecuencia Absoluta.
Número de veces que
aparece dicho valor de
la variable,
representada por 𝒇𝒊.
Frecuencia Relativa.
Es el cociente entre la
frecuencia absoluta y el
tamaño de la muestra,
representada por f r.
Los siguientes datos corresponden al número de inasistencias a clase
de 50 alumnos durante el año escolar
N=
Frecuencia Relativa
Acumulada.
Es la sumatoria de las
frecuencias relativas,
se representa por fra.
Frecuencia Acumulada.
Es la suma de las
frecuencias absolutas
de todos los valores
inferiores o iguales al
valor considerado, se
representa con fa
Frecuencia Acumulada Frecuencia Relativa
Acumulada.
DISTRIBUCIÓN DE FRECUENCIAS
AGRUPADAS.
Se emplea si las variables toman un número grande de valores o la
variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud
denominados “clases”.
Límite de Clase. Cada clase está delimitada por el límite
inferior de la clase y el límite superior de la
clase.
Amplitud de Clase. La amplitud de la clase es la diferencia
entre el límite superior e inferior de la
Clase.
Marca de Clase. La marca de clase es el punto medio de cada
intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos
parámetros.
DISTRIBUCIÓN DE FRECUENCIAS
AGRUPADAS
Límite inferior: 2,8
Límite superior: 7,0
1
Rango: 7,0 – 2,8 = 4,2
2 3
44= 6,63
k = n
Número de intervalos.
Amplitud del intervalo
4
4,2÷6
= 6
=0,7
Primer Intervalo de clase: 2,8 + 0,7 = 3,50
Segundo Intervalo de clase: 3,6 + 0,7 = 4,30; etc.
NOTAS Marca de clase fi fr fa fra
2,8 3,5 3,15 7
0,159 7 0,159
3,6 4,3 3,95 7
0,159 14 0,318
4,4 5,1 4,75 8
0,182 22 0,500
5,2 5,9 5,55 6
0,136 28 0,636
6 6,7 6,35 11
0,250 39 0,886
6,8 7,5 7,15 5
0,114 44 1,000
n 44
OPERACIONES DE COMPARACIÓN Y NORMALIZACIÓN.
Porcentaje Es una proporción que ha sido multiplicada por 100.
Esta transformación lineal de los valores no altera
sustantivamente la distribución
Proporción Es un cociente que resulta de la división de un número
para otro en el que el numerador está incluido en el
denominador.
Ejemplo:
4000 eventos de robo a personas.
800 se cometieron en la provincia del Guayas
La proporción de los eventos de robo a personas
es:
800/4000 = 0,2
El 20 % expresada en porcentaje
El valor de una
proporción puede
variar así de 0 a 1.
Suele expresarse
como un
porcentaje, que
varía entre 1 y 100.
Razón Una razón es la comparación por cociente entre
dos cifras de diferente o similar naturaleza.
En la provincia de Pichincha han ocurrido 350 eventos de robos a
personas.
En la provincia de Pichincha la policía a ha detenido a 70 personas
por cometer eventos de robo a personas.
Razón de eventos de robo a personas por detenidos
350/70 =5
Por cada 5 eventos de robos a personas se detiene a 1 persona
Tasa Es similar al de una proporción, con la diferencia
de que las tasas llevan incorporado el concepto
de tiempo.
Las tasas incorporan el concepto de tiempo y lugar, o sea que
numerador y denominador deben estar referidos, al mismo
tiempo y lugar.
En el Ecuador en el año 2012 se cometieron 1924 Homicidios.
La población del año 2012 del Ecuador es 15.520.973 de
habitantes.
La tasa de Homicidios por cada 100.000 Habitantes sería:
TASA=1924
15.520.973 x 100.000
REPRESENTACIÓN DE LOS DATOS
Diagrama de sectores
Se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta
correspondiente.
Se representan sobre unos ejes de coordenadas, en el eje de
abscisas se colocan los valores de la variable, y sobre el eje de
ordenadas las frecuencias absolutas o relativas o acumuladas.
Diagrama de barras
Ejemplo:
Un estudio hecho al conjunto de los 200 DELITOS del 2013 para
determinar su zona de ocurrencia ha dado el siguiente resultado:
Histograma
En el eje abscisas se construyen unos rectángulos que tienen por base
la amplitud del intervalo, y por altura, la frecuencia absoluta de cada
intervalo.
Polígono de frecuencia
Para construir el polígono de frecuencia se toma la marca de clase
que coincide con el punto medio de cada rectángulo.
Histograma y polígono de frecuencias acumuladas
Si se representan las frecuencias acumuladas de una tabla de datos
agrupados se obtiene el histograma de frecuencias acumuladas o su
correspondiente polígono.
Media Aritmética.
Media aritmética simple.- Se le conoce como promedio, es el valor
obtenido al sumar todos los datos y dividir el resultado entre el número
total de datos.
X =8,25 + 7,13 + 9,55 + 5,85 + 6,75 + 7,70
6 X =
45,23
6
X = 7,53
Media aritmética para datos agrupados.- Para obtener la media
aritmética, se multiplica la marca de clase o punto medio por la
frecuencia respectiva, luego se obtiene la suma de todos estos productos y
luego a este valor se lo divide para el número de elementos (n).
X = 𝑋𝑚 ∗ 𝑓𝑖𝑛𝑖=1
𝑁
Dónde:
𝑋𝑚= marca de clase
𝑓𝑖= frecuencia
MEDIDAS DE TENDENCIA CENTRAL.
Ejemplo: En un test realizado a un grupo de 42 aspirantes se han obtenido
las puntuaciones que muestra la tabla. Calcular la puntuación media.
X =1.820
42= 43.33
Mediana.
Valor central de un conjunto de valores ordenados en forma
creciente o decreciente. Si el número de valores es par, la mediana
será el promedio de los valores centrales. Si el número de valores es
impar, la mediana será el valor central.
En el caso de tener una serie de datos impar como se ha
mencionado anteriormente, la mediana será el valor central de la
serie.
Mediana para datos agrupados
𝑀𝑑 = 𝐿𝑖 +
𝑁2 − 𝐹𝑎−1
𝑓𝑖∗ 𝑎𝑖
Fórmula Dónde:
𝐿𝑖 = es el límite inferior de la
clase, donde se encuentra la
mediana. 𝑁
2 = es la semisuma de las
frecuencias absolutas.
𝐹𝑎−1= es la frecuencia acumulada
anterior a la clase mediana.
𝑓𝑖 = es la frecuencia
𝑎𝑖 = es la amplitud de clase
𝑀𝑑 = 66 +50 − 23
42∗ 3 = 67,93
Moda.
Moda simple.- Es el valor que más se repite en un conjunto de
datos, si en un conjunto de valores, no se repite ningún valor,
entonces no hay moda
Moda para datos agrupados.- todos los intervalos deben tener la
misma amplitud.
𝑀𝑜
= 𝐿𝑖 +(𝑓𝑖−𝑓𝑖−1)
(𝑓𝑖−𝑓𝑖−1) + (𝑓𝑖−𝑓𝑖+1). 𝑎𝑖
𝐿𝑖 = límite inferior de la clase modal
𝑓𝑖 = es la frecuencia absoluta de la clase
modal
𝑓𝑖−1= es la frecuencia absoluta
inmediatamente inferior a la clase modal
𝑓𝑖+1 = es la frecuencia absoluta
inmediatamente posterior a la clase
modal
𝑎𝑖 = es la amplitud de la clase
𝑀𝑜 = 66 +(42 − 18)
(42 − 18) + (42 − 27). 3
𝑀𝑜 = 67.846
MEDIDAS DE POSICIÓN
Cuartiles: Permiten dividir un conjunto de datos en cuatro partes
iguales. Deciles: Dividen al conjunto de datos en 10 partes iguales
Percentiles: También se lo conoce como centil y permite dividir un conjunto
de datos en 100 partes iguales
Rango.- Es la diferencia entre el valor máximo y el mínimo en
nuestros datos
Ejemplo: Supóngase que en el Hospital de la Policía el pulso de cada
paciente se mide tres veces al día y que cierto día los registros de los
pacientes muestran:
Paciente 1: 73 77 74 Para el paciente 1:
R =77 – 73 = 4
Desviación media.
Desviación media simple.- La desviación media es la media aritmética
de los valores absolutos de las desviaciones respecto a la media, se
representa con la letra DM
𝐷𝑀 = 𝑋 − 𝑋
𝑁
Ejemplo: Se tiene la siguiente serie de datos:
9 3 8 8 9 8 9 18
X =9 + 3 + 8 + 8 + 9 + 8 + 9 + 18
8 X = 9
𝑀𝑑 =9 − 9 + 3 − 9 + 8 − 9 + 8 − 9 + 9 − 9 + 8 − 9 + 9 − 9 + 18 − 9
8
𝑀𝑑 = 2.25
Desviación media para datos agrupados
𝐷𝑀 = 𝑋 − 𝑋 ∗ 𝑓𝑖
𝑁
Varianza.
Varianza simple.
𝜎2 =𝑋1 − 𝑋 2 + 𝑋2 − 𝑋 2 + 𝑋3 − 𝑋 2 +⋯+ 𝑋𝑛 − 𝑋 2
𝑁
𝜎2 = 𝑋𝑖 − 𝑋 2𝑛𝑖=1
𝑁
Varianza datos agrupados
𝜎2 =𝑥1 − 𝑥 2 ∗ 𝑓1 + 𝑥2 − 𝑥 2 ∗ 𝑓2 + 𝑥3 − 𝑥 2 ∗ 𝑓3…+ 𝑥𝑛 − 𝑥 2 ∗ 𝑓𝑛
𝑁
𝜎2= 𝑋𝑚 − 𝑋 2 ∗ 𝑓𝑖𝑛𝑖=1
𝑁
Desviación típica.
Desviación típica o estándar.- es la raíz cuadrada de la
varianza, se representa a través de la siguiente expresión:
𝜎 𝑜 𝑆
𝜎 𝑜 𝑆 =𝑋1 − 𝑋 2 + 𝑋2 − 𝑋 2 + 𝑋3 − 𝑋 2 +⋯+ 𝑋𝑛 − 𝑋 2
𝑁
𝜎 𝑜 𝑆 = 𝑋𝑖 − 𝑋 2𝑛𝑖=1
𝑁
Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el
nivel de dispersión de las, cuando más apegado a 0 los datos son
más idénticos.
𝐶𝑉 =𝜎
X
𝐶𝑉 =14.7868
43.33 CV= 0,3412
Desviación estándar
Media Aritmética
Variaciones porcentuales.- Porcentaje de cambio.
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑎𝑐𝑡𝑢𝑎𝑙 − 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟∗ 100
260 − 250
250∗ 100 VP=
VP= 4% La variación porcentual de los robos a personas del
año 2013 comparado al año 2012 es de un 4% de
aumento
Evolutivo
Sacamos la
mediana
Sacamos la
desviación
estándar
Sacamos el
límite superior
Sacamos el
límite inferior
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.
Fórmula para el cálculo de la regresión lineal simple.
Aplicación de la Fórmula de regresión lineal simple.
PROMEDIO= 105 PROMEDIO= 7.25
N:- de Denuncias de delitos contra
la propiedad N:- de Detenidos Meses X Y X*Y X2
enero 120 10 1200 14400
febrero 100 9 900 10000
marzo 90 4 360 8100
abril 110 6 660 12100
Totales 420 29 3120 44600
Numero de meses=4
Gráfico de regresión lineal simple.