31
ESTADÍSTICA ESTADÍSTICA DESCRIPTIVA DESCRIPTIVA Lic. Tatiana Rettis Lic. Tatiana Rettis Salazar Salazar

2 Distribución Frecuencias

Embed Size (px)

DESCRIPTION

ESTADÍSTICA DESCRIPTIVA

Citation preview

Page 1: 2 Distribución Frecuencias

ESTADÍSTICA ESTADÍSTICA DESCRIPTIVADESCRIPTIVA

Lic. Tatiana Rettis SalazarLic. Tatiana Rettis Salazar

Page 2: 2 Distribución Frecuencias

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

►RECOPILACIÓN RECOPILACIÓN ►CLASIFICACIÓN CLASIFICACIÓN ►PRESENTACIÓNPRESENTACIÓN►DESCRIPCIÓNDESCRIPCIÓN

Page 3: 2 Distribución Frecuencias

CLASIFICACIÓNCLASIFICACIÓN

Los datos recolectados suelen ser Los datos recolectados suelen ser registrados en el orden que se registrados en el orden que se presentan, para facilitar su presentan, para facilitar su interpretación y análisis, es necesario se interpretación y análisis, es necesario se ordenen o clasifiquen de forma ordenen o clasifiquen de forma sistemática de acuerdo a su magnitud, y sistemática de acuerdo a su magnitud, y a sus características en grupos o sub a sus características en grupos o sub grupos llamadas Distribución de grupos llamadas Distribución de Frecuencias.Frecuencias.

Page 4: 2 Distribución Frecuencias

CLASIFICACIÓNCLASIFICACIÓN

Distribución de Frecuencias, es un Distribución de Frecuencias, es un agrupamiento de datos en categorías agrupamiento de datos en categorías mutuamente excluyentes obteniendo el mutuamente excluyentes obteniendo el número de observaciones de cada número de observaciones de cada categoría.categoría.

Page 5: 2 Distribución Frecuencias

CLASIFICACIÓNCLASIFICACIÓN

Distribución de Frecuencias para Distribución de Frecuencias para Variables CategóricasVariables Categóricas

Ejemplo: Un asistente social de una comunidad esta Ejemplo: Un asistente social de una comunidad esta interesado en conocer la calidad alimenticia de los interesado en conocer la calidad alimenticia de los niños, para ello interrogo a 50 de ellos obteniendo las niños, para ello interrogo a 50 de ellos obteniendo las siguientes respuestas.siguientes respuestas.Variable: Calidad Alimenticia:Variable: Calidad Alimenticia:

►Muy DeficienteMuy Deficiente MDMD►DeficienteDeficiente DD►RegularRegular RR►BuenaBuena BB►Muy Buena Muy Buena MBMB

Page 6: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

CategóricasCategóricasBB RR RR DD MDMD

RR BB DD BB BB

RR DD MDMD DD DD

DD RR RR RR RR

MDMD RR DD MDMD DD

RR DD BB DD MDMD

DD MBMB DD RR RR

BB DD RR MBMB DD

MDMD DD MDMD DD MDMD

RR BB DD RR BB

Page 7: 2 Distribución Frecuencias

Distribución de Frecuencias para Distribución de Frecuencias para Variables CategóricasVariables Categóricas

Variable: Calidad Variable: Calidad Alimenticia:Alimenticia: ConteoConteo

FrecuenciFrecuenciaa

Frecuencia Frecuencia RelativaRelativa

Frecuencia Frecuencia PorcentualPorcentual

Muy DeficienteMuy Deficiente MDMD IIII IIIIIII III     88 0.160.16 16.00%16.00%

DeficienteDeficiente D D    1717 0.340.34 34.00%34.00%

RegularRegular R R IIII IIII IIII IIII IIII IIII  1515 0.30.3 30.00%30.00%

BuenaBuena BB IIII IIIIIII III 88 0.160.16 16.00%16.00%

Muy BuenaMuy Buena MB MB I I I I  22 0.040.04 4.00%4.00%

5050 11 100.00%100.00%

Page 8: 2 Distribución Frecuencias

MÉTODOS GRÁFICOSMÉTODOS GRÁFICOS

►VARIABLES CUALITATIVAS:VARIABLES CUALITATIVAS: Diagrama de barrasDiagrama de barras Diagrama de sectores angularesDiagrama de sectores angulares

Page 9: 2 Distribución Frecuencias

Métodos Gráficos para variables Métodos Gráficos para variables CategóricasCategóricas

0

5

10

15

20

Nº de Casos

MD D R B MB

Variable Calidad Alimenticia

Calidad Alimenticia en la Comunidad Rural Calidad Alimenticia

MD16%

D34%

R30%

B16%

MB4%

MD D R B MB

Diagrama de barras: Diagrama de barras:     Se utilizan rectángulos Se utilizan rectángulos separados, que tienen como base a cada uno de las separados, que tienen como base a cada uno de las categorías y como altura la frecuencia de ese dato.categorías y como altura la frecuencia de ese dato.

Gráfica de Torta: Gráfica de Torta:     Se forma al dividir un círculo en Se forma al dividir un círculo en sectores circulares de manera que: a) cada sector sectores circulares de manera que: a) cada sector circular equivale al porcentaje correspondiente a la circular equivale al porcentaje correspondiente a la categoría o grupo que representa; y b)  la unión de los categoría o grupo que representa; y b)  la unión de los sectores circulares forma el círculo y la suma de sus sectores circulares forma el círculo y la suma de sus porcentajes es 100%.porcentajes es 100%.    

Page 10: 2 Distribución Frecuencias

TEMPORARY .SELECT IF (h12>25 AND h12<45) .FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS .

Métodos Gráficos para Métodos Gráficos para variables Categóricasvariables Categóricas

►Variable nominalVariable nominal

Statistics

PEA5907235

0

1,00

Valid

Missing

N

Mode

PEA

4699861 79,6 79,6 79,6

1207374 20,4 20,4 100,0

5907235 100,0 100,0

Activo

Inactivo

Total

ValidFrequency Percent

ValidPercent

Cumulative Percent

PEA

Cases weighted by PONDERA

PEA

InactivoActivo

Fre

quen

cy

5000000

4000000

3000000

2000000

1000000

0

Page 11: 2 Distribución Frecuencias

CLASIFICACIÓNCLASIFICACIÓN

Distribución de Frecuencias para Distribución de Frecuencias para Variables NuméricasVariables Numéricas

Ejemplo:Ejemplo:Los datos obtenidos por una trabajadora Los datos obtenidos por una trabajadora Social a quien le interesa conocer el Social a quien le interesa conocer el número de hijos por familias de una número de hijos por familias de una comunidad para llevar a cabo un estudio comunidad para llevar a cabo un estudio socio económico de estos datos.socio económico de estos datos.

Page 12: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

NuméricasNuméricas88 44 77 44 55

1010 33 55 22 44

22 99 44 66 22

55 66 88 33 66

00 1111 66 77 44

66 44 44 55 00

33 22 33 44 88

88 55 99 77 55

44 33 55 1010 33

77 99 88 66 99

Page 13: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

NuméricasNuméricasVariable: Variable:

Numero de Numero de Hijos: Hijos:

FrecuenciFrecuenciaa Frecuencia RelativaFrecuencia Relativa

Frecuencia Frecuencia PorcentualPorcentual

00 22 0.040.04 4.00%4.00%

11 00 0.000.00 0.00%0.00%

22 44 0.080.08 8.00%8.00%

33 66 0.120.12 12.00%12.00%

44 99 0.180.18 18.00%18.00%

55 77 0.140.14 14.00%14.00%

66 66 0.120.12 12.00%12.00%

77 44 0.080.08 8.00%8.00%

88 55 0.100.10 10.00%10.00%

99 44 0.080.08 8.00%8.00%

1010 22 0.040.04 4.00%4.00%

1111 11 0.020.02 2.00%2.00%

5050 100.00%100.00% 100.00%100.00%

Page 14: 2 Distribución Frecuencias

Consideraciones que se deben tomar en Consideraciones que se deben tomar en cuenta en la construcción de cuadros de cuenta en la construcción de cuadros de frecuencias para datos cuantitativosfrecuencias para datos cuantitativos

► Los intervalos deben ser mutuamente excluyentes Los intervalos deben ser mutuamente excluyentes o no traslapados.o no traslapados.

► Se recomienda tener entre 5 y 15 intervalos.Se recomienda tener entre 5 y 15 intervalos.► Se debe tener en cuenta la naturaleza de la Se debe tener en cuenta la naturaleza de la

variable de interés, el número de datos y la variable de interés, el número de datos y la amplitud del conjunto de datos.amplitud del conjunto de datos.

► Es recomendable que los intervalos tengan igual Es recomendable que los intervalos tengan igual tamaño cuando se desea hacer comparaciones tamaño cuando se desea hacer comparaciones entre ellos. Además, usualmente, los intervalos son entre ellos. Además, usualmente, los intervalos son cerrados a la izquierda y abiertos a la derecha; cerrados a la izquierda y abiertos a la derecha; excepto el último intervalo que es cerrado en excepto el último intervalo que es cerrado en ambos lados.ambos lados.

► Cuando se desea comparar el cuadro a construir Cuando se desea comparar el cuadro a construir con un cuadro ya construido, los intervalos del con un cuadro ya construido, los intervalos del cuadro ya construido deben servir de base para la cuadro ya construido deben servir de base para la construcción de los intervalos del cuadro a construcción de los intervalos del cuadro a construir.construir.

Page 15: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

NuméricasNuméricasElementos que se debe tener en cuenta Elementos que se debe tener en cuenta para construir una tabla de distribución para construir una tabla de distribución de frecuencias por intervalos.de frecuencias por intervalos.►Alcance (A)Alcance (A)►Rango (R)Rango (R)►Intervalo de clase (Ii)Intervalo de clase (Ii)►Limite clase (Li)Limite clase (Li)►Ancho de clase (Ci)Ancho de clase (Ci)

Page 16: 2 Distribución Frecuencias

Procedimiento de construcción de un cuadro de Procedimiento de construcción de un cuadro de frecuencias para datos continuos, con intervalos de frecuencias para datos continuos, con intervalos de igual tamaño, y aplicando la regla de Sturgesigual tamaño, y aplicando la regla de Sturges

Determinar el rango o amplitud de los datos. Rango = (Obsv. mayor valor) - (Obsv. Menor valor).

Establecer el número de intervalos mediante la regla de Sturges.

K 1 + 3.3 Log n Determinar el tamaño de intervalo de clase

común.Ci Rango / K

Establecer los límites de cada uno de los intervalos. LI1=Xmin LS1=LI1+ Ci

LIj=LSj-1 LSj=LIj + Ci

Verificar si el intervalo K contiene a la Obsv. Mayor valor.

Determinar las marcas de clase, las frecuencias absolutas, frecuencias relativas y porcentajes.

Page 17: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

NuméricasNuméricas► Definiremos como Definiremos como frecuenciafrecuencia de un dato el número de veces que este de un dato el número de veces que este aparece en el colectivoaparece en el colectivo. Siendo . Siendo nn la suma de las respectivas frecuencias de la suma de las respectivas frecuencias de cada dato cada dato ((n=ΣXin=ΣXi)). Este . Este nn será denominado como será denominado como frecuencia total. frecuencia total. A A efectos prácticos, asumiremos las siguientes definiciones de frecuencias: efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

► a) frecuencias absolutas : a) frecuencias absolutas : es el número de datos contenidos en cada clase y es el número de datos contenidos en cada clase y se representa por nse representa por nii..

► b) frecuencias relativas: b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por htamaño de la muestra. La denotaremos por hii

► c) frecuencias absoluta acumulada: c) frecuencias absoluta acumulada: es el número de veces que ha es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variableaparecido en la muestra un valor menor o igual que el de la variable, , se puede se puede acumular, en la tabla estadística en orden ascendente (Ni↑) o descendente acumular, en la tabla estadística en orden ascendente (Ni↑) o descendente (Ni↓)(Ni↓)

► d) frecuencia relativa acumulada: d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (Hi)de la muestra (Hi)..

► e) e) Marca de ClaseMarca de Clase, son los puntos medios de los intervalos de clase. (Xi)., son los puntos medios de los intervalos de clase. (Xi).

Page 18: 2 Distribución Frecuencias

Distribución de Distribución de Frecuencias para Variables Frecuencias para Variables

NuméricasNuméricas

Variable: Variable: Numero de Numero de

Hijos: Hijos:

FrecueFrecuenciancia

MarcMarca de a de ClasClas

ee

FrecuenFrecuencia cia

RelativaRelativa

FrecuenFrecuencia cia PorcentPorcentualual

Frecuencia Frecuencia Absoluta Absoluta AcumuladaAcumulada

Frecuencia Frecuencia Relativa Relativa AcumuladaAcumulada

Frecuencia Frecuencia Porcentula Porcentula AcumuladaAcumulada

LiLi LsLs nini XiXi hihi hi %hi % NiNi Hi Hi Hi %Hi %

00 22 22 0.040.04 4.00%4.00%         

22 44 1010 0.20.2 20.00%20.00%         

44 66 1616 0.320.32 32.00%32.00%         

66 88 1010 0.20.2 20.00%20.00%         

88 1010 99 0.180.18 18.00%18.00%         

1010 1212 33 0.060.06 6.00%6.00%         

5050 11100.00100.00

%%

Page 19: 2 Distribución Frecuencias

MÉTODOS GRÁFICOSMÉTODOS GRÁFICOS

►VARIABLES CUANTITATIVASVARIABLES CUANTITATIVAS:: Diagrama de bastones Diagrama de bastones HistogramaHistograma Polígono de frecuenciasPolígono de frecuencias Diagrama de sectoresDiagrama de sectores

Page 20: 2 Distribución Frecuencias

Diagrama de bastonesDiagrama de bastones

Numero de Familias según el numero de Hijos

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10 11 12

Numero de Hijos

Fre

cuen

cia

Page 21: 2 Distribución Frecuencias

HistogramaHistograma

0

5

10

15

20

Fre

cuen

cia

Numero de Familias según el numero de Hijos

[0 - 2>

[2 - 4>

[4 - 6>

[6 - 8>

[8 - 10>

[10 - 12>

Page 22: 2 Distribución Frecuencias

Polígono de frecuenciasPolígono de frecuencias

POLIGONO DE FRECUENCIAS

1, 2

2, 10

3, 16

4, 105, 9

6, 3

0

2

4

6

8

10

12

14

16

18

1 2 3 4 5 6

Marcas de Clase

Fre

cuen

cia

Page 23: 2 Distribución Frecuencias

OJIVA

0

10

20

30

40

50

60

Numero de Hijos

Fre

cuen

cia

[0 - 2>

[2 - 4>

[4 - 6>

[6 - 8>

[8 - 10>

[10 - 12>

Page 24: 2 Distribución Frecuencias

Diagrama de sectores Diagrama de sectores AngularesAngulares

Familias por Numero de Hijos

4%20%

32%20%

18%6% [0 - 2>

[2 - 4>

[4 - 6>

[6 - 8>

[8 - 10>

[10 -12>

Page 25: 2 Distribución Frecuencias
Page 26: 2 Distribución Frecuencias

La técnica tallo-hojaLa técnica tallo-hoja1. Ordenación de los datos, en forma ascendente.

Datos InicialesX1, X2, X3, ..., Xn

Datos Ordenados en forma ascendenteY1, Y2, Y3, ..., Yn

Page 27: 2 Distribución Frecuencias

La técnica tallo-hojaLa técnica tallo-hoja

Observación

Parte 1

Parte 2

Conformado por cifras más notables(usualmente es la primera cifra)

Conformado por cifras menos notables

2. Formación del tallo. Para formarlo se debe considerar que en cada observación se puede considerar dos partes: una parte más notable (que usualmente es la primera cifra) y la otra parte menos notable constituida por las otras cifras.

Page 28: 2 Distribución Frecuencias

La técnica tallo-hojaLa técnica tallo-hoja

En una columna se colocan, en forma ordenada y ascendente y a distancias iguales, desde el valor más bajo hasta el valor más alto correspondiente a la parte 1 o troncal, se hallen presentes o no dentro del conjunto de datos.

3. Formación de las hojas. Una hoja es el conjunto de dígitos que se encuentran a la derecha de un valor troncal. Cada uno de los valores troncales tiene cero, una o más hojas . Estas hojas se colocan, en forma ordenada y ascendente, con espaciamientos iguales, a la derecha del valor troncal correspondiente.

Page 29: 2 Distribución Frecuencias

La técnica tallo-hojaLa técnica tallo-hoja

96 93 88 117 127 95 113 96 108

139 142 94 107 125 155 155 103 112

112 135 132 111 125 104 106 139 134

118 136 125 143 120 103 113 124 138

94 127 119 148 117 97 156 120 89

Page 30: 2 Distribución Frecuencias

La técnica tallo-hojaLa técnica tallo-hojaTallo Hojas

8 8 9

9 6 3 5 6 4 4 7

10 8 7 3 4 6 3

11 7 3 2 7 2 1 9 8 3

12 7 5 7 0 5 5 0 4

13 9 5 2 9 4 6 8

14 8 2 3

15 6 5 5

Tallo Hojas

8 8 9

9 3 4 4 5 6 6 7

10 3 3 4 6 7 8

11 1 2 2 3 3 7 7 8 9

12 0 0 4 5 5 5 7 7

13 2 4 5 6 8 9 9

14 2 3 8

15 5 5 6

Page 31: 2 Distribución Frecuencias

MÉTODOS ANALÍTICOSMÉTODOS ANALÍTICOSMEDIDAS DE TENDENCIA CENTRAL• Moda• Media• Mediana • Cuantiles: cuartiles, deciles y percentiles

MEDIDAS DE DISPERSIÓN

• Rango o recorrido• Recorrido intercuartílico• Varianza y desviación típica• Desviación media• Coeficientes de variación

MEDIDAS DE FORMA

• Coeficientes de asimetría