Upload
emop13
View
2
Download
0
Embed Size (px)
DESCRIPTION
hola
Citation preview
1
Organizacin de datos numricos
Estadstica
2
ARREGLO ORDENADO
Una vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la informacin y ordenarla.
Por cada variable se hace un ordenamiento simple.
El determinar cual es el dato que tiene menor valor y cual el de mayor valor es informacin vital para empezar a trabajar con variables cuantitativas.
3
Suponga que decide llevar a cabo un estudio
del costo de una comida en un restaurante de
una gran ciudad. A 50 restaurantes citadinos
se les consult sobre el precio promedio de sus
platos y se obtuvieron los siguientes resultados.
4
Precio del plato en 50 restaurantes citadinos
50 38 43 56 51 36 25 33 41 44
34 39 49 37 40 50 50 35 22 45
44 38 14 44 51 27 44 39 50 35
31 34 48 48 30 42 26 35 32 63
36 38 53 23 39 45 37 31 39 53
5
Precio de plato en 50 restaurantes de la ciudad
14 22 23 25 26 27 30 31 31 32
33 34 34 35 35 35 36 36 37 37
38 38 38 39 39 39 39 40 41 42
43 44 44 44 44 45 45 48 48 49
50 50 50 50 51 51 53 53 56 63
6
Rango Calcular el rango es determinar la longitud numrica que existe entre el primer dato y el ltimo.
Restar el dato menor del dato mayor de la muestra y se obtiene el rango.
Rango = DatoMayor - DatoMenor
7
La pregunta que estamos analizando ya tiene
sus datos ordenados, ahora determinar a
simple vista cuales son los datos mayor y
menor respectivamente:
Dato Mayor $ 63.00
Dato Menor $ 14.00
8
Clculo del rango.
Muestra de restaurantes citadinos
49
1463
Rango
Rango
DatoMenorDatoMayorRango
9
DISTRIBUCIN DE FRECUENCIAS
Sin importar si los datos estn o no ordenados, siempre es
posible crear una distribucin de frecuencias para los datos
de una variable en una muestra.
La distribucin de frecuencias es una tabla de resumen en
la que los datos estn organizados en clases o grupos
numricamente ordenados.
10
DISTRIBUCIN DE FRECUENCIAS
Se organiza en filas y columnas para resumir la
informacin y poder realizar interpretaciones de
manera rpida y efectiva.
Seleccionar el nmero apropiado de agrupaciones o
clases para la tabla, determinando una amplitud
conveniente de las clases y estableciendo los lmites
de cada una para evitar traslape.
11
Amplitud de intervalo o clase
La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el nmero de intervalos elegidos.
Se ha convenido que todos los intervalos tengan la misma amplitud.
elegidosIntervalosdeNumero
RangoAmplitud
12
Amplitud de un Intervalo o clase
La mayora de las veces la amplitud de un intervalo es mejor
trabajarla con una anchura que sea un nmero entero (aplican
restricciones).
Si el resultado de la divisin es decimal, se redondea el
resultado de la siguiente manera.
Si el resulta es menor de 0.5 se elimina la parte decimal.
En caso contrario se pasa al prximo entero.
13
Clculo de la amplitud
Muestra de restaurantes citadinos
7
7/49
7
49
1463
Amplitud
Amplitud
Intervalos
Rango
Rango
DatoMenorDatoMayorRango
14
DISTRIBUCIN DE FRECUENCIAS
Se organiza en filas y 2 columnas:
Columna 1: El nombre de la variable que se est analizando.
Columna 2: Las veces que se repiten los datos con las mismas caractersticas de la variable y se le llama frecuencia.
Variable Frecuencia
15
DISTRIBUCIN DE FRECUENCIAS
Cuando la variable es numrica, se trata
de valores y si stos son ms de 10 datos
diferentes, es conveniente hacer grupos
para administrarlos con eficiencia. A cada
grupo de datos se le llama Intervalo o
clase.
Intervalos Frecuencia
16
DISTRIBUCIN DE FRECUENCIAS
Un intervalo es como un rango, tiene un
dato mayor y un dato menor y el estilo
de representacin puede ser de varias
maneras; la ms generalizada es:
Intervalos Frecuencia
DatoMenor pero menos que DatoMayor o
17
DISTRIBUCIN DE FRECUENCIAS
La informacin en cada intervalo debe ser
nica.
Para determinar el nmero de intervalos para
una distribucin, se calcula con la
informacin del valor del Rango.
Intervalos Frecuencia
18
DISTRIBUCIN DE FRECUENCIAS
Se sugiere que una distribucin de
frecuencias no debe tener menos de 5
intervalos, ni ms de 15.
Si no se sigue esta convencin, la
interpretacin de los datos puede ser
demasiado condensada o muy dispersa y en
ambos casos los resultados aunque estn
bien, no son objetivos. Y puede afectar la
toma de decisiones.
Intervalos Frecuen
cia
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
19
DISTRIBUCIN DE FRECUENCIAS
Los datos por ser numricos, pueden ir de 100
a 1000, o se pueden extender a 10,000, etc.
Un intervalo es similar al rango, el cual tiene un
dato mayor y un dato menor, solo que la
distancia entre ellos recibe el nombre de
Amplitud
Intervalos Frecuencia
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
20
DISTRIBUCIN DE FRECUENCIAS
Determinar el nmero de intervalos que
sirva a una muestra se basa en la
experiencia o sentido comn de la
persona que va a generar la distribucin
de frecuencias.
Intervalos Frecuencia
Intervalo 1 Frec. 1
Intervalo 2 Frec. 2
Intervalo 3 Frec. 3
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
21
Calcular el rango.
Elegir el nmero de intervalos
Calcular la anchura de cada intervalo
Generar los intervalos de clases (no deben menos de 5 ni
ms de 15)
Determinar la frecuencia para cada intervalo.
Procedimiento para generar una distribucin de frecuencias
22
Calcular las frecuencias de la distribucin para los 50
restaurantes citadinos
Precio de plato
14 22 23 25 26 27 30 31 31 32
33 34 34 35 35 35 36 36 37 37
38 38 38 39 39 39 39 40 41 42
43 44 44 44 44 45 45 48 48 49
50 50 50 50 51 51 53 53 56 63
23
Muestra de restaurantes citadinos
7
7/49
7
49
1463
Amplitud
Amplitud
Intervalos
Rango
Rango
DatoMenorDatoMayorRango
24
En este caso, se iniciar el primer intervalo con el dato menor de la muestra = 14
A 14 se le suma la amplitud que es 7 y es = 21
El primer intervalo ser el siguiente:
14 pero menos de 21
25
Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28.
El segundo intervalo resulta ser:
De 21 a menos de 28
Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35
El tercer intervalo ser:
De 28 a menos de 35
26
En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 =
42.
El cuarto intervalo resulta ser:
De 35 a menos de 42
En el quinto intervalo, al dato menor 42 se le suma 7 = 49
El quinto intervalo es:
De 42 a menos de 49
27
PRECIO DE PLATO Frecuencia
14 pero menos de 21
21 pero menos de 28
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
Intervalos o clases
28
Calcular la frecuencia de cada intervalo.
El primer intervalo de 14 pero menos de 21, se cuenta el nmero de datos que tienen esa caracterstica y solo es 14. Al contar los nmeros resulta que es 1 dato
El segundo intervalo de de 21 pero menos de
28 se cuenta 22, 23, 25, 26 y 27 que son 5
29
PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
30
El tercer intervalo de 28 pero menos de 35, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7.
El cuarto intervalo de 35 pero menos de
42 se cuentan 35, 35, 35, 36, 36, 37, 37,
38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan
16
31
PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
32
El quinto intervalo de 42 pero menos de 49, est formado por se cuenta con 42, 43, 44, 44, 44, 44, 45, 45, 48, 48 ; la
frecuencia es 10.
El sexto intervalo de 49 pero menos de
56 se cuentan 49, 50, 50, 50, 50, 51, 51,
53, 53 y resultan 9
33
PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49 10
49 pero menos de 56 9
56 pero menos de 63
63 pero menos de 70
34
El sptimo intervalo de 56 pero menos de 63, est formado por se cuenta con 56 y la
frecuencia es 1.
El sexto intervalo de 63 pero menos de 70
se cuentan 63 y resulta 1.
35
Los intervalos quedan de la siguiente manera: PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49 10
49 pero menos de 56 9
56 pero menos de 63 1
63 pero menos de 70 1
36
Fronteras de clase
Las fronteras de clase o lmites de clase, son los
extremos numricos de una clase.
Un intervalo tiene la forma a b, contiene los
nmeros que empiezan en a y que casi terminan de
b
37
Intervalo 14 pero menos de 21
La frontera inferior es 14
La frontera superior se acerca a 21
Intervalo 21 pero menos de 28
La frontera inferior es 21
La frontera superior se acerca a 28
38
Frontera real de clase
Numricamente, antes de A no es un nmero.
Se establece un lmite de acuerdo a la formulacin de los datos.
Si los datos se ministran con dos decimales, se busca el nmero que est exactamente antes de la frontera superior.
Intervalo normal Fronteras reales
21 pero menos de 28 21 y 27.9
21 pero menos de 28 21 y 27.99
39
Intervalo o clase Frontera
inferior
Frontera
Superior
14 pero menos de 21 14 21
21 pero menos de 28 21 28
28 pero menos de 35 28 35
35 pero menos de 42 35 42
42 pero menos de 49 42 49
49 pero menos de 56 49 56
Calcular las fronteras reales de la siguiente
distribucin:
40
Marca de Clase
Es el punto medio de un intervalo de clase, se calcula
sumando sus fronteras y dividiendo el resultado entre
dos. El intervalo es dividido a la mitad
41
Intervalo o clase Marca de clase
14 pero menos de 21 (14+21)/2 = 17.5
21 pero menos de 28 (21+28)/2 = 24.5
28 pero menos de 35 (28+35)/2 = 31.5
35 pero menos de 42 (35+42)/2 =38.5
42 pero menos de 49 (42+49)/2 = 45.5
49 pero menos de 56 (49+56)/2 = 52.5
Calcular las marcas de clase de la siguiente distribucin:
42
Frecuencia Relativa
La frecuencia relativa es la proporcin de frecuencia que
corresponde un intervalo con relacin al tamao de la
muestra.
43
Clculo de la frecuencia relativa
Se suman todas las frecuencias
Se divide la frecuencia de cada intervalo entre el total de
frecuencias.
Todas las frecuencias son valores entre 0.0 y 1.0
La suma de todas las frecuencias relativas debe ser igual a
uno (1)
44
Frecuencia Relativa
PRECIO POR PLATO Frecuencia Frecuencia Relativa
14 pero menos de 21 1 1/50 = 0.02
21 pero menos de 28 5 5/50 = 0.10
28 pero menos de 35 7 7/50 = 0.14
35 pero menos de 42 16 16/50 = 0.32
42 pero menos de 49 10 10/50 = 0.20
49 pero menos de 56 9 9/50 = 0.18
56 pero menos de 63 1 1/50 = 0.02
63 pero menos de 70 1 1/50 = 0.02
45
Frecuencia Acumulada
La frecuencia acumulada es la suma parcial para cada
intervalo, permite hacer observaciones sobre los
intervalos que estn por debajo de l.
46
Clculo de la frecuencia acumulada
Se suman todas las frecuencias
Se suma la frecuencia del intervalo con todas las frecuencias anteriores.
La frecuencia acumulada de cada intervalo nunca es menor que el valor del intervalo anterior.
El ltimo intervalo debe tener como resultado la suma de todas las frecuencias (tamao de la muestra)
47
PRECIO POR PLATO Frecuencia Frecuencia Acumulada
14 pero menos de 21 1 1
21 pero menos de 28 5 6
28 pero menos de 35 7 13
35 pero menos de 42 16 29
42 pero menos de 49 10 39
49 pero menos de 56 9 48
56 pero menos de 63 1 49
63 pero menos de 70 1 50
Frecuencia Acumulada
48
Frecuencia Porcentual
La frecuencia porcentual es la misma frecuencia
relativa pero en formato de % (porcentaje). El total
de la muestra siempre resulta ser 100%
49
Frecuencia Porcentual
La frecuencia porcentual se puede calcular
para las frecuencias absolutas o las acumuladas
50
PRECIO POR PLATO Frecuencia Frecuencia Porcentual
14 pero menos de 21 1 0.02*100 = 2
21 pero menos de 28 5 0.10 *100 = 10
28 pero menos de 35 7 0.14*100 = 14
35 pero menos de 42 16 0.32*100 = 32
42 pero menos de 49 10 0.20*100 = 20
49 pero menos de 56 9 0.18*100 = 18
56 pero menos de 63 1 0.02*100 = 2
63 pero menos de 70 1 0.02*100 = 2