Clase 05.- Organización Tabular de Datos.pdf

Embed Size (px)

Citation preview

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    1/80

    Estadística

    Clase 04:

    Tables organization of dataOrganización Tabular de Datos

    Universidad Nacional de Huancavelica

    Facultad de Ciencias de Ingeniería

    Departamento Académico de Ciencias Básicas

    Escuela Académico Profesional de Ingeniería Ambiental Sanitaria

     Ing. Jorge Luis Huere PeñaMaster in Informátics and Computer Science

    e-mail : [email protected]

    http://images.google.com.pe/imgres?imgurl=http://chispis.blogia.com/upload/20060619143602-foto-estadistica-blog.jpeg.bmp&imgrefurl=http://chispis.blogia.com/2006/junio.php&h=225&w=220&sz=146&hl=es&start=17&tbnid=T3aEvO7aRj1gLM:&tbnh=108&tbnw=106&prev=/images?q=estadistica&gbv=2&svnum=10&hl=es&sa=G

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    2/80

    2

    Si los datos no están organizados son depoca utilidad en una investigación o para una toma dedecisiones.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    3/80

    3

    Los datos deben organizarse, para entendermejor su naturaleza fundamentalmente utilizandodos métodos : el método tabular  y el método gráfico.

    The importance of data organization

    a importancia de la organización de los datos

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    4/80

    4

    La organización tabular de datos pueden

    realizarse bajo tres formas:

    1.  Clasificación ordenada de datos.

    2.  Diagrama de tallos y hojas

    3.  Tablas de distribución de frecuencias.

    Tables organization of data

    Organización Tabular de datos

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    5/80

    5

    Orderly classification dataClasificación ordenada de datos

    Si ordenamos los datos sin procesar, de laobservación más pequeña a la más grande, la

    secuencia ordenada obtenida, se denomina

    clasificación ordenada.

    Ejemplo:  en un estudio sobre coeficienteintelectual de estudiantes de ingeniería de una

    universidad peruana, se obtuvieron estas

    observaciones:

    33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1

    35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3

    35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    6/80

    6

    Ordenando los datos de manera ascendente,

    tenemos:

    33.1 33.7 33.9 34.2 34.2 34.3 34.6 34.7 34.9 35.2 35.6 36.1

    33.4 33.7 34.0 34.2 34.2 34.5 34.6 34.7 35.1 35.2 35.8 36.5

    33.6 33.8 34.1 34.2 34.3 34.5 34.6 34.8 35.1 35.3 36.0

    ¿Cuáles son las principales propiedades que se

    observa en este conjunto de datos?

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    7/80

    7

    Las principales propiedades que se observan en esteconjunto de datos son:

     El número de datos es de 35.

     La menor observación es de 33,1.

     La mayor observación es de 36,5 .

     El rango de los valores observados es de:

    3,5 = (36,5 – 33,1)+ 0,1

     El 51,43% (18 trabajadores) de los datos están alrededorde 34 . (18/35)*100.

     Son muy pocos frecuentes (8,57%) los trabajadores concoeficiente intelectual mayor a 36 . (sólo 3 trabajadores).

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    8/80

    8

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    9/80

    9

    Mientras mayor sea el número de observaciones presentesen una serie de datos, mas laborioso es realizar la

    clasificación ordenada de los datos.

    Whi le the greater the number of observat ions present

    in a data set, is more labo riou s make the orderly

    classi f icat ion of d ata.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    10/80

    10

    Un diagrama de tallo y hojas consiste en una serie de

    hileras horizontales de números. El número utilizado

    para designar una hilera es  un tallo,  el resto denúmeros de la hilera se denominan hojas.

    Stem and leaf iagram

    Diagrama de tallo y hojas

    Esta técnica funciona bien,cuando el conjunto de datos

    no tiene una gran dispersión

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    11/80

    11

    Elija algunos números adecuados que puedanservir de tallo. Se requieren como mínimo 5tallos. Los tallos elegidos generalmente son elprimer o los dos primeros dígitos de los datos.

    Nombre las hileras mediante los tallos elegidos.Organice gráficamente los datos registrando eldígito, siguiendo el tallo.

    Trazar una curva a lo largo de la parte superior

    del diagrama.

    Determinar las principales características.

    Se pueden considerar el siguiente proceso:

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    12/80

    12

    Ejemplo: Con los datos anteriores sobre el coeficiente intelectual de los

    trabajadores, construir un diagrama tallo-hoja.

    33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1

    35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3

    35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

    Dato menor: 33,1 Dato mayor: 36,5

    Tallos posibles: 33, 34, 35 y 36 

    Sólo existen 4 tallos, debiendo ser el mínimo 5 tallos,entonces los tallos propuestos se desdoblan, de lasiguiente manera:

    33 (del 33,0 al 33,4)

    33 (del 33,5 al 33,9)

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    13/80

    1

    3

    34 (del 34,0 al 34,4)

    34 (del 34,5 al 34,9)

    35 (del 35,0 al 35,4)

    35 (del 35,5 al 35,9)

    36 (del 36,0 al 36,4)

    36 (del 36,5 al 36,9)

    Luego clasificamos los datos en función al valor deldecimal.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    14/80

    14

    ¿Qué características se observan?.

    Finalmente, se traza una línea por el borde, a fin dedelimitar la forma de la distribución.

    33

    33

    34

    34

    35

    35

    36

    36

    1  4 

    7  7  9  8  6 

    2  2  2  3  2  2  1  3  0 

    6  6  8  7  6  7  5  5  9 

    2  2  1  1  3 

    6  8 

    0  1 

    25 datos

    10 datos

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    15/80

    15

    Son 35 casos.

    La menor observación es de 33,1 .La mayor observación es de 36,5 .

    El rango  de los valores observados es de 3.5  .(36,5 – 33,1 + 0.1 .)

    El 51,43% (18 casos) de los datos están alrededorde los 34 .

    Son muy poco frecuentes los casos mayores a 36(3 casos) y menores a 33,5 (2 casos).

    La distribución de datos está sesgada a la derecha(sesgo positivo), es decir, hay una mayorconcentración de datos a la izquierda.

    Las principales propiedades de los datos :

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    16/80

    16

    Se realiza un estudio para ayudar a comprender el

    efecto de fumar en los patrones de sueño. La

    variable es el tiempo que tarda en quedarse dormido.

    La muestras de fumadores y no fumadores producen

    estas observaciones :

    17,2  19,7  18,1  15,1  18,3  17,6 

    16,2  19,9  19,8  23,6  24,9  20,1 

    19,8  22,9  20,0  24,1  25,0  21,4 

    21,2  18,9  22,1  20,6  23,3  20,2 

    21,1  16,9  23,0  20,1  17,5  21,3 

    21,8  22,1  21,0  20,5  20,4  20,7 

    19,5  18,8  19,2  22,4  19,3  17,4 

    Ejercicio

    FUMADORES15,1  20,5  17,7  21,3  16,0  24,8 

    16,8  21,2  18,1  22,1  15,9  25,2 

    22,8  22,4  19,4  25,2  18,3  25,0 

    25,8  24,1  15,0  24,1  21,6  16,3 

    24,3  25,7  15,2  18,0  23,8  17,9 

    23,2  25,1  16,1  17,2  24,9  19,9 

    15,7  15,3  19,9  23,1  23,0  15,1 

    NO FUMADORES

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    17/80

    17

    Construya un diagrama tallo-hoja para cada uno

    de estos conjuntos de datos. Utilice los valores

    enteros del 15 al 25 (inclusive) como tallos.

    ¿Se sorprendería si alguien le dijera que no existe

    diferencia en la distribución de esta variable en los

    dos grupos?. Explique.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    18/80

    18

    Frequency Table

    Tabla de frecuencias

    Consiste en una presentación resumidade la información usando tablas o cuadros 

    Ejemplo: Supongamos que en una entrevista a usuariosdel lo que se busca evaluar son 2 aspectos:

    -La opinión sobre la calidad de una construcción

    -Nivel de instrucción de los usuarios.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    19/80

    19

    Como son dos variables categóricas, lapresentación de los datos podría realizarse enuna tabla cruzada:

    NIVEL  OPINIÓN TOTAL 

    EDUCATIVO  Favorable  Desfavorable  Analfabeto 8 2 10 

    Primaria 15 5 20 

    Secundaria 23 7 30 

    Superior 12 3 15 

    TOTAL  58  17  75 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    20/80

    20

    Ventajas- Se pueden apreciar propiedades de los datos.

    - Permite establecer asociaciones entre variables- Se ahorra espacio en un informe escrito.

    Elementos:

    A. El Título: enunciado breve e informativo acercadel contenido de la tabla (indicar el número). Un buen título

    debe responder a las siguientes interrogantes:

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    21/80

    21

    1. ¿Qué contiene la tabla?Ej.: La opinión de 75 usuarios sobre calidad

    de la construcción

    2. ¿Cómo estamos presentando el contenido?

    Ej.: Por nivel educativo de los usuarios3. ¿De dónde se obtuvieron los datos?

    Ej.: Del servicio de Información de la Municipalidad

    4. ¿Cuándo se obtuvo la información?Ej.: (fecha de la recolección de los datos) 

    What, How, Where, When

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    22/80

    22

    Tabla N° 1.- Opinión de 75 usuarios por nivel educativosobre la calidad de la construcción en la Provincia de

    Huancavelica. enero del 2010.

    Un buen título podría ser:

    B. La Matriz: Está constituido por el primerrenglón y la primera columna, en donde se

    describen los nombres de las categorías(en datos categóricos) o los intervalos de

    clases  (en datos cuantitativos), tan concisocomo sea posible.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    23/80

    23

    Para datoscategóricos

    NIVEL DE  OPINIÓN TOTAL 

    INSTRUCCIÓN  Favorable  Desfavorable 

     Analfabeta

    Primaria

    Secundaria

    Superior

    TOTAL 

    EDAD  N° de pacientes  Tasa porcentual :% 

    (en años)  (f i)  (hi) 

    39 - 46

    47 - 54

    55 - 6263 - 70

    71 - 78

    Total

    Para datoscuantitativos

    Ejemplo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    24/80

    24

    C. El cuerpo: Está conformado por espacios yconstituyen intersecciones de filas y columnas,

    que a veces se denominan celdas , y donde se

    anotan las frecuencias absolutas y relativasobtenidas en la tabulación, incluyendo totales y

    subtotales.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    25/80

    25

    NIVEL  OPINIÓN TOTAL 

    EDUCATIVO  Favorable  Desfavorable 

     Analfabeta 8 2 10 

    Primaria 15 5 20 

    Secundaria 23 7 30 

    Superior 12 3 15 TOTAL  58  17  75 

    Por ejemplo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    26/80

    26

    D. Notas aclaratorias: Están constituidas por todaaquella información adicional que es necesaria

    para describir e interpretar adecuadamente elcontenido de la tabla o cuadro.

    Es muy importante cuando se trata de datos

    proveniente de fuente secundaria.

    Es un aspecto ético precisar de donde provienenlos datos, a la vez que nos liberamos de la

    responsabilidad de responder por su calidad.

    Se escribe con letra más pequeña. 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    27/80

    27

    NIVEL  OPINIÓN TOTAL 

    EDUCATIVO  Favorable  Desfavorable 

     Analfabeta 8 2 10 Primaria 15 5 20 

    Secundaria 23 7 30 

    Superior 12 3 15 

    TOTAL  58  17  75 

    Tabla 1: Opinión de 75 usuarios por nivel educativo sobre la

    calidad de la construcción en la ciudad de Huancavelica,enero del 2010.

    Fuente: Hospital San Rosa. Dirección de Procesos. Enero 2010.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    28/80

    28

    3. Presentan por lo menos dos columnas: categoría oclase y el número de datos o frecuencia de clase.

    4. Puede incluirse una columna de tasa porcentual.

    1. Se utilizan para presentar una sola variable.2. Pueden representar datos cualitativos o

    cuantitativos.

    A) Tablas simples

    Pueden ser simples o cruzadas

    Table Types

    Tipos de tablas

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    29/80

    1.- TABLAS SIMPLES O UNIDIMENSIONALES

    TABLA Nº #

    EL TITULO DEBE SER CLARO. DELIMITAR EL ESPACIO Y TIEMPO

    VARIABLE FRECUENCIA PORCENTAJE

    C1C2

    ...

    Cn

    f 1f 2

    ...

    f k

    f 1%f 2 %

    ...

    f k %

    TOTAL n 100

    Fuente: debe indicar la procedencia de los datos, espacio y tiempo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    30/80

    Ejm. De una variable dicotómica

    Género Estudiantes PorcentajeMasculino

    Femenino

    35

    48

    42.2

    57.8

    Total 83 100.0

    TABLA Nº 01 Género de los estudiantes de la EAP de Ingeniería Civil de la

    Universidad de Hvca. Junio del 2010

    Fuente: Dirección Universitaria de Servicios Académicos de la UNH. Junio

    del 2010

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    31/80

    Ejm. De una variable Politómica

    TABLA Nº 02Estado Civil de los estudiantes de la EAP Ingeniería Civil de

    la Universidad de Hvca. Junio del 2010

    Estado Civil Estudiantes Porcentaje

    Soltero

    CasadoViudo

    Divorciado

    Conviviente

    42

    132

    3

    23

    50.6

    15.72.4

    3.6

    27.7

    Total 83 100.0Fuente: Dirección Universitaria de Servicios Académicos de la UNH. Junio

    del 2010

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    32/80

    32

    Para datos cualitativos  se siguen los pasossiguientes:

    (1º) Identificar diferentes categorías.(2º) Realizar un conteo.

    (3º) Elaborar la tabla: titulo, cuerpo y fuente.

    Table Elabo ration

    Elaboración de tablas

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    33/80

    33

    Ejemplo

    Con la finalidad de mejorar la calidad de la

    construcción en una empresa constructora, se ha

    formulado la siguiente pregunta a 45 usuarios

    encuestados durante una semana: “¿Cómo  califica

    la calidad de la construcción que Ud, tiene en la

    ciudad de Huancavelica: muy bueno, bueno,

    aceptable, malo o muy malo”  

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    34/80

    34

    Muy bueno Aceptable Aceptable Muy bueno BuenoBueno Bueno Muy malo Bueno Bueno

     Aceptable Bueno Aceptable Malo Muy bueno

    Malo Aceptable Muy malo Aceptable Malo

     Aceptable Muy bueno Bueno Bueno Aceptable

    Bueno Malo Aceptable Muy malo Bueno

    Malo Bueno Malo Bueno Aceptable

    Bueno Bueno Muy malo Muy bueno Malo

     Aceptable Bueno Aceptable Malo Bueno

    Los datos recolectados se presentan a continuación:

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    35/80

    35

    Primero, se identifican las categorías:

    Muy bueno

    Bueno Aceptable

    Malo

    Muy malo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    36/80

    36

    Segundo, se realiza el conteo de las frecuencias:

    Muy bueno /////

    Bueno ///// ///// ///// / Aceptable ///// ///// //

    Malo ///// ///

    Muy malo ////

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    37/80

    37

    Tabla 1: Calidad del Servicio de la Construcción … 

    Fuente: Encuesta a los usuarios, julio 2012

    Tercero, se presenta la tabla, considerando el

    título y la fuente.

    Número de TasaCategoria Pacientes Porcentual

    Muy Bueno 5 11,11

    Bueno 16 35,55

     Aceptable 12 26,67

    Malo 8 17,78

    Muy Malo 4 8,89

    Total 45 100,00

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    38/80

    38

    Para datos cuantitativos se sigue el procedimientosiguiente:

    (1º) Se calcula el rango:(mayor - menor) + 1

    (2º) Se determina el número de clases, que mejorrepresenta a los datos (entre 4 y 20). Se

    realiza un tanteo.

    (3º) Se determina el tamaño o amplitud de clase.

    (4º) Se elige el limite inferior de la primera clase.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    39/80

    39

    (5º) Se establecen los límites inferiores de las

    siguientes clases.

    (6º) Se establecen los limites superiores de cada unade las clases.

    (7º) Se realiza un conteo, a fin de determinarcuantos datos se incluyen en cada clase.

    (8º) Se elabora la tabla: titulo, cuerpo y fuente.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    40/80

    1.- VARIABLE CUANTITATIVA DISCRETA

    TABLA Nº #EL TITULO DEBE SER CLARO. DELIMITAR EL

    ESPACIO Y TIEMPO

    Variable

    Frecuencia

    absoluta

    (f i)

    Frecuencia Relativa

    Simple en %

    (hi %)

    Frecuencia Absoluta

     Acumulada

    (Fi)

    Frecuencia relativa

    acumulada en %

    H%

    Z1

    Z2

    ...

    Zn

    f 1

    f 2

    ...

    f k

    h1%

    h2 %

    ...

    hk %

    F1%

    F2 %

    ...

    Fk %

    H1%

    H2 %

    ...

    Hk %

    TOTAL n 100

    Fuente: debe indicar la procedencia de los datos, espacio y tiempo

    Ejemplo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    41/80

     

    Númerode Hijos Frecuencia(fi)

    Frecuencia

    Relativasimple en %

    (   %ih )

    Frecuencia

     Absoluta Acumulada

    (   i F  )

    Frecuencia

    Relativa Acumulada en

    % (   %i H  )1

    2

    3

    4

    5

    6

    7

    8

    5

    6

    6

    2

    5

    2

    2

    2

    16.66%

    20.00%

    20.00%

    6.67%

    16.66%

    6.67%

    6.67%

    6.67%

    5

    11

    17

    19

    24

    26

    28

    30

    16.66%

    36.67%

    56.67%

    63.33%

    80.00%

    86.67%

    93.30%

    100.00%

    Total 30 100.00%

    Ejemplo

    Numero de Hijos por familia en la comunidad Agraria Santa Ana. Junio del 2007

    Fuente: INEI – Huancavelica. Censo Población junio 2007

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    42/80

    2.- VARIABLE CUANTITATIVA CONTINUA

    INTERVALO Marcas

    de clase

    (Yi)

    Frecuencia

    absoluta

    (fi)

    Frecuencia

     Acum.

    (Fi)

    Frecuencia

    relativa

    (hi)

    Frecuencia

    relativa en %

    (hi%)

    Frecuencia

    relativa acum.en

    % (Hi%)

    [ Li1  – Ls1 ]

    [ Li2  – Ls2 ][ Li3  – Ls3 ]

    ...

    ...

    [ Lik  – Lsk ]

    Y1

    Y2

    Y3

    ...

    ...

    Yk

    f 1

    f 2

    f 3

    ...

    ...

    f k

    F1

    F2

    F3

    ...

    ...

    n

    h1

    h2

    h3

    ...

    ...

    hk

    h1%

    h2%

    h3%

    ...

    ...

    hk%

    H1%

    H2%

    H3%

    ...

    ...

    100

    Total n 1.00 100

    TABLA DE FRECUENCIAS

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    43/80

    ¿COMO CONSTRUIMOS UNA TABLA DE FRECUENCIAS?

    PRIMER PASO: Encontrar el rango (R); es decir, la diferencia delMáximo Valor y el mínimo valor.

    R = VMAX - VMIN

    SEGUNDO PASO:  Encontrar el número de intervalos (ley de sturges)

    k = 1+3.322*log(n)  Si n > 25 nk  

    Sugerencia:

    5 < k < 15

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    44/80

    TERCER PASO: Encontrar la Amplitud del Intervalo

     Amplitud del

    intervalo

    Intervalos traslapados : 

    R = Dato mayor – Dato menor  

    Ejemplo: 

    [149  –  155>[155  – 161>[161  – 167>[167  – 173>[173  – 180>

    Intervalos no traslapados: R= Dato mayo r

     – Dato m enor + 1

    Ejemplo: 

    [149  –  154][155  – 160][161  – 166]

    [167 –

     172][173  – 180]

    Donde:A : Amplitud de un intervalo de clase.R : Rangok : Número de intervalos de clase.A

     = R/k

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    45/80

    Ejemplo:

    La gerencia de ventas de una gran empresa de contrucción y renta

    especializada en condominios vacacionales desea los lineamientos

    disponibles en lo que se refiere a rentas mensuales para enviarlos a posibles vacacionistas. Como primer paso, seleccionó una muestra de

    120 ofertas de arrendamiento que se muestran a continuación:

    Rentas mensuales (en dólares) de condominios

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    46/80

    1170 1207 1581 1277 1305 1472 1077 1319 1537 1849

    1332 1418 1949 1403 1744 1532 1219 896 1500 1671

    1471 1399 1041 1379 821 1558 1118 1533 1510 17601826 1309 1426 1288 1394 1545 1032 1289 695 803

    1440 1421 1329 1407 718 1457 1449 1455 2051 16771119 1020 1400 1442 1593 1962 1263 1788 1501 1668

    1352 1340 1459 1823 1451 1138 1592 982 1981 1091

    1428 1603 1699 1237 1325 1590 1142 1425 1550 913

    1470 1783 1618 1431 1557 896 1662 1591 1551 16121249 1419 2162 1373 1542 1631 1567 1221 1972 1714

    949 1539 1634 1637 1649 1607 1640 1739 1540 2187

    1752 1648 1978 640 1736 1222 1790 1188 2091 1829

    Rentas mensuales (en dólares) de condominios

    Las cifras que se muestran en la tabla del ejemplo se las denomina datos

    originales (o sin procesar) . En el estado que se encuentra la tabla, lo únicoque se puede apreciar son las rentas más altas y más bajas del conjunto. Sin

    embargo estos datos nos pueden dar información más valiosa

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    47/80

    SEGUNDO PASO: k = 1+3.322 log (120) 

    k = 1 + 3.322*(2.079) 

    k = 8 

    TERCER PASO:

     A = R/m

     A = 1547/8

     A = 193

    PRIMER PASO: R = VMAX - VMIN

    R = 2187 - 640 

    R = 1547 

    CUARTO PASO: Determinar los limites de clase 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    48/80

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] [ 1026 - 1218 ]

    [ 1219 - 1411 ]

    [ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990][ 1991 - 2183 ]

    [ 2184 - 2376 ]

    Existen diversos autores que tienen formas particulares de

    iniciar un intervalo; pero, para nuestro ejemplo empezaremos

    desde el mínimo valor que es 640. 

    QUINTO PASO: Contar la cantidad de datos para cada

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    49/80

    QUINTO PASO: Contar la cantidad de datos para cada

    clase 

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] [ 1026 - 1218 ]

    [ 1219 - 1411 ]

    [ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990][ 1991 - 2183 ]

    [ 2184 - 2376 ]

    Conteo

    /////

    ///// / ///// ///// /

    ///// ///// ///// ///// ////

    ///// ///// ///// ///// ///// ///// ///// ///

    ///// ///// ///// ///// ///

    ///// ///////

    /

    SEXTO PASO: Determinar la frecuencia de cada clase

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    50/80

    SEXTO PASO: Determinar la frecuencia de cada clase

    (frecuencia absoluta f i ) 

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ][ 1219 - 1411 ]

    [ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2183 ][ 2184 - 2376 ]

    (f i)

    5

    1124

    38

    23

    9

    31

    http://a/Estadistica%20I/Clases%20para%20el%20ejercito/Vinculo%20de%20frecuencia%20absoluta%20y%20relativa.ppt

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    51/80

    SETIMO PASO: Distribución de frecuencias relativas (f r ) 

    Para convertir una distribución de frecuencias a unadistribución de frecuencias relativas, cada una de las

    frecuencias de clase se divide entre el número total de

    frecuencias.

    frecuencia de clase (f i  )

    Número de observaciones (n )Frecuencia relativa (hi) =

    Calculo de las frecuencias relativas h

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    52/80

    Calculo de las frecuencias relativas hi

    Intervalos o Clase[ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ]

    [ 1219 - 1411 ][ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2183 ]

    [ 2184 - 2376 ]

    f i 

    5

    11

    2438

    23

    9

    3

    1

    hi 5/120

    6/120

    11/120

    24/12038/120

    23/120

    9/120

    3/120

    1/120 

    120

    0.04 =

    0.05 = 

    0.09 =

    0.20 =0.32 =

    0.19 =

    0.08 =

    0.02 =

    0.01 =

    1.00

    OCTAVO PASO: Distribución de frecuencias acumuladas (Fi)

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    53/80

    ( i) 

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ]

    [ 1219 - 1411 ]

    [ 1412 - 1604 ][ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2183 ]

    [ 2184 - 2376 ]

    f i 

    5

    11

    24

    38

    23

    9

    3

    1

    hi 

    120

    0.04

    0.05

    0.09

    0.20

    0.32

    0.19

    0.08

    0.02

    0.01

    1.00

    Fi = Fi-1 + f i 

    5 = 0 + 5

    11 = 5 + 6 

    22 = 11 + 11

    46 = 22 + 24

    84 = 46 + 38

    107 = 84 + 23

    116 = 107 + 9

    119 = 116 + 3

    120 = 119+1

    NOVENO PASO: Distribución de frecuencias relativas

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    54/80

    NOVENO PASO: Distribución de frecuencias relativas

    porcentuales (hi %) 

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ]

    [ 1219 - 1411 ][ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2187 ]

    [ 2184 - 2376 ]

    f i 

    5

    11

    2438

    23

    9

    3

    1

    hi 

    120

    0.04

    0.05

    0.09

    0.200.32

    0.19

    0.08

    0.02

    0.01

    1.00

    Fi

    5

    11

    22

    46

    84

    107

    116

    119

    120

    hi %

    4

    5

    9

    2032

    19

    8

    2

    1

    100

    DECIMO PASO: Frecuencias relativas porcentuales acumuladas Hi

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    55/80

    p i

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ]

    [ 1219 - 1411 ][ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2183 ]

    [ 2184 - 2376 ]

    f i 

    5

    11

    2438

    23

    9

    3

    1

    hi 

    120

    0.04

    0.05

    0.09

    0.200.32

    0.19

    0.08

    0.02

    0.01

    1.00

    Fi

    5

    11

    22

    4684

    107

    116

    119

    120

    hi %

    4

    5

    9

    2032

    19

    8

    2

    1

    100

    Hi %

    4

    9

    18

    3870

    89

    97

    99

    100

    PASO ONCE: Marca de clase Yi 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    56/80

    Intervalos o Clase

    [ 640 –  832 ]

    [ 833 - 1025 ] 

    [ 1026 - 1218 ][ 1219 - 1411 ]

    [ 1412 - 1604 ]

    [ 1605 - 1797 ]

    [ 1798 - 1990]

    [ 1991 - 2183 ][ 2184 - 2376 ]

    f i 

    5

    1124

    38

    23

    9

    31

    hi 

    120

    0.04

    0.05

    0.090.20

    0.32

    0.19

    0.08

    0.020.01

    1.00

    Fi

    5

    11

    2246

    84

    107

    116

    119

    120

    hi %

    4

    5

    920

    32

    19

    8

    21

    100

    Hi %

    4

    9

    1838

    70

    89

    97

    99

    100

    Yi 

    736

    929 

    11221315

    1508

    1701

    1894

    20872280

    La marca de clase (Xi) se calcula sumando el limite inferior y superior de un

    intervalo o clase y luego se divide entre 2. ( Yi = [Li +Ls]/2 )

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    57/80

    Resumen de la Tabla de frecuencias

    INTERVALO Marcas

    de clase

    (Yi)

    Frecuencia

    absoluta

    (fi)

    Frecuencia

     Acum.

    (Fi)

    Frecuencia

    relativa

    (hi)

    Frecuencia

    relativa en %

    (hi%)

    Frecuencia

    relativa acum.en

    % (Hi%)

    [ Li1  – Ls1 ]

    [ Li2  – Ls2 ]

    [ Li3  –

     Ls3 ]...

    ...

    [ Lik  – Lsk ]

    Y1

    Y2

    Y3...

    ...

    Yk

    f 1

    f 2

    f 3...

    ...

    f k

    F1

    F2

    F3...

    ...

    n

    h1

    h2

    h3...

    ...

    hk

    h1%

    h2%

    h3%...

    ...

    hk%

    H1%

    H2%

    H3%...

    ...

    100

    Total n 1.00 100

    Ejemplo: Las edades de los estudiantes del III ciclo de

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    58/80

    Ejemplo:  Las edades de los estudiantes del III ciclo de

    la EAP de Ing. Civil son las siguientes

    19, 25, 19, 21, 18, 21, 22, 18, 24, 22, 23, 20, 24, 20, 19

    Para construir una tabla de frecuencias tenemos que seguir

    los siguientes pasos:

    PRIMER PASO:  R = VMAX - VMIN

    R = 25 - 18 

    R = 7 

    SEGUNDO PASO: k = 1+3.322 log (15) 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    59/80

    k = 4.91 

    k = 5 

    TERCER PASO:

     A = 7/5

     A = 1.4

     A = 1

    CUARTO PASO: Construir la tabla de frecuencias 

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    60/80

    1001.00nTotal

    y1

    y2

    y3

    ...

    ...

    y4

    H1%

    H2%

    H3%

    ...

    ...

    Hm%

    h1%

    h2%

    h3%

    ...

    ...

    hm%

    F1

    F2

    F3

    ...

    ...

    Fm

    h1

    h2

    h3

    ...

    ...

    hm

    f 1

    f 2

    f 3

    ...

    ...

    f k

    [ 18  –19 ]

    [ 20 - 21 ] 

    [ 22 - 23 ]

    [ 24 - 25 ]

    [ 26 - 27 ]

    yiHi%hi%Fihif i[CLASE)

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    61/80

    Ejemplo:

    Revisemos el ejemplo sobre el coeficiente intelectual de

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    62/80

    62

    231  199  209  236  259  248  183  269  212  194  191  260  197  265  261 

    159  227  245  214  275  186  234  262  230  212  163  220  202  221  223 

    203  180  292  198  201  174  223  186  200  192  236  186  188  234  230 

    304  197 

    216  214  189  138  269  197  222  202  213  163  241  218  242 

    248  228  154  218  243  192  191  243  230  248  231  262  177  207  276 

    238  189  212  200  179  249  225  223  289  280  235  220  194  205  206 209  233  222  223  267  212  263  159  243  230  253  192  200  232  222 

    193  195  259  186  229  184  215  254  233  229  263  163  212  271  216 

    225  252  218  265  218  155  222  173  228  214  266  172  203  262  213 

    244  177  242  180  241  261  221  222  189  204  229  212  192  257  248 

    190  166  216  197  250  224  257  220  255  241  245  212  225  201  209 

    192  249  216  250  248  187  222  195  247  161  188  229  194  174  184 

    209  250  180  228  196  254  208  265  234  219  203 

    Revisemos el ejemplo sobre el coeficiente intelectual delos trabajadores presentado anteriormente.

    Solución

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    63/80

    63

    1. Se calcula el rango: R = Mayor – menor + 1

    Mayor = 317 Menor = 106

    Rango = (317 – 106) + 1 = 212

    2. Se tantea el número de clases:

    4 clases de 53 Rango corregido 212: No exceso

    5 clases de 43 Rango corregido 215: Exceso 36 clases de 36 Rango corregido 216: Exceso 4

    7 clases de 31 Rango corregido 217: Exceso 5

    8 clases de 27 Rango corregido 216: Exceso 4

    Se escoge 4 clases por tener el menor exceso.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    64/80

    64

    3. La amplitud de clase es 53.

    4. Como no hay exceso con 4 clases, el límite inferior

    de la primera clase es el menor número. En este

    caso 106.

    5. Los límites inferiores de las clases siguientes se

    forman sumando al límite inferior de la primera

    clase, la amplitud. En este caso, 53

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    65/80

    65

    NIVELES DE Tasa 

    COEF.INTEL.  PERSONAS porcentual (%)

    106 - 

    159 - 

    212 - 

    265 - 

    Total  1000 100,00 

    Fuente: Departamento de Estadística

    El menorvalor

    106 + 53

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    66/80

    66

    6. Luego se calculan los límites superiores de cadaclase. Para la primera clase se resta 1 al límiteinferior de la segunda clase. Para las clases

    siguientes, se le suma la amplitud, en este caso53.

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    67/80

    67

    Cuadro 2: Niveles de coeficiente intelectual en Huancavelica

    Fuente: Departamento de Estadística

    NIVELES DECIOEF.INTEL  porcentual (%) 

    Total  1000 100,00 

    106 - 158 

    159 - 211 

    212 - 264 

    265 - 317 

    159 - 1

    158 + 53

    Tasa PERSONAS

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    68/80

    68

    7.Finalmente se realiza el conteo de lasfrecuencias y se presenta la tabla con un

    título y fuente.

    Se acostumbra presentar una columna con lafrecuencias relativas (%)

    Cuadro 2: Niveles de coeficiente Intelectual en Huancavelica

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    69/80

    69

    Fuente: Departamento de Estadística

    NIVELES DE Tasa 

    COEF.INTEL  PERSONAS porcentual (%) 

    Total  1000 100.0 

    106 - 158  22 2.2

    159 - 211  379 37.9

    212 - 264  521 52.1

    265 - 317  78 7.8

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    70/80

    70

    En algunas ocasiones se elaboran las tablas

    con clases abiertas cuando los datos inferiores

    o superiores están muy dispersos

    Ejemplo

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    71/80

    71

    Cuadro 3: Ventas diarias en una Ferreteríadurante el mes de junio 2010 (en soles)

    Ventas Tasa

    (en soles) Dias porcentual

    (%)

    menos de 5000 3 10,00

    5000 - 8999 7 23,33

    9000 - 12999 10 33,33

    13000 - 16999 8 26,67

    17000 - 20999 2 6,67

    Total 30 100,00

    Fuente: Registro de Ventas

    Ejercicio

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    72/80

    72

    Los siguientes datos de refieren a la estatura (en metros) de50 trabajadores que laboran en la Municipalidad de

     Ascención en el 2012. Construya una tabla de distribución defrecuencias.

    1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82 1,70

    1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64 1,80 1,681,72 1,74 1,72 1,69 1,78 1,84 1,61 1,69 1,84 1,741,73 1,75 1,75 1,72 1,81 1,87 1,64 1,70 1,86 1,741,75 1,77 1,76 1,72 1,81 1,87 1,64 1,72 1,87 1,77

    La tabla de distribución de frecuenciascompleta tiene la siguiente estructura

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    73/80

    73

    Li  limite inferiorLs limite superiorXi Marca de la clase i

    completa, tiene la siguiente estructuraCLASE  Marca de Frecuencia  Frecuencia  Frec. Absoluta  Frec. Relativa 

    Li  Ls  Clase: Xi  absoluta: f i  relativa: hi  Acumulada: Fi  Acumulada: Hi 

    f i  frecuencia absoluta de la clase i.

    hi  frecuencia relativa de la clase i.Fi  frecuencia absoluta acumulada hasta la clasei.Hi  frecuencia relativa acumulada hasta la clase i.

    Ejercicio 2:Complete la siguiente tabla que corresponde al peso de 60

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    74/80

    74

    Complete la siguiente tabla que corresponde al peso de 60

    trabajadores de la Obra de la carretera Huancavelica - Huancayo. 

    PESO f i  Fi  hi  Hi 

    (en kilos) 

    [48,0 – 53>  6 

    [53,0 – 58>  0,30 

    [58,0 – 63> 

    [63,0 – 68>  0,25

    [68,0 – 73>  9 

    Total 

    Ejercicio

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    75/80

    75

    La siguiente información se refiere al peso (en Kg.) de 60

    personas. Elabore una tabla de distribución de frecuencias.

    k=6 LI1=35 LS5=64 F2=20

    h3=0,213 H4=0,799 f 6 = 5 f 1=4

    j

    Complete la siguiente tabla de distribución defrecuencias:

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    76/80

    76000.1   ih

    30 f n

    frecuencias:

    n

     f  hi  

    act ant i   f   f   F    act ant 

    i  hh H   

    f  ant --> frecuencia anteriorf  act --> frecuencia actual

    PESO f i 

    Xi 

    Fi 

    hi 

    Hi (en libras 

    128,6 - 135,4  2 

    135,5 - 142,3  7 

    142,4 - 149,2  10 

    149,3 - 156,1  8 156,2 - 163,0  3 

    Total 

    Resumamos algunos conceptos

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    77/80

    77

    Una distribución de frecuencias  (f i) es unconjunto de puntuaciones ordenadas en susrespectivas clases.

    Las frecuencias  relativas (hi) son tasasporcentuales de casos en cada clase.

    La frecuencia acumulada  (Fi  o Hi) son lasfrecuencias que se van acumulando en cada clase,

    desde la más baja hasta la mas alta.

    La marca de clase  (Xi) es el punto medio de unaclase

    B)Tablas cruzadas

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    78/80

    78

    B)Tablas cruzadas

    1. Sirven para representar dos o más variables

    cualitativas.

    2. En cada celda se puede incluir la frecuencia

    absoluta y relativa (por fila, columna y total).

    2.- TABLAS DE DOBLE ENTRADA, BIDIMENSIONALES

    O DE CONTINGENCIA

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    79/80

    TABLA Nº #

    EL TITULO DEBE SER CLARO. DELIMITAR ELESPACIO Y TIEMPO

    Variable

    1

    Variable 2TOTAL

    C1 C2 ... CK

    C1

    C2

    ..

    ..

    CK

    f 11

    f 21

    f m1

    f 12

    f 22

    f m2

    ...

    ...

    ...

    f 1k

    f 2k

    f mk

    f 1.

    f 2.

    f m.

    TOTAL f.1 f.2 ... f.k f

    Fuente: debe indicar la procedencia de los datos, espacio

    y tiempo

    Ejm.Tabla N° 04

    P ió d l S ti f ió L b l d l t b j d

  • 8/16/2019 Clase 05.- Organización Tabular de Datos.pdf

    80/80

    Satisfacción

    Laboral

    Género

    TotalMasculino Femenino

    Satisfecho

    Poco satisfecho

    Insatisfecho

    13

    9

    13

    13

    11

    14

    26

    20

    27

    Total 35 38 73

    Percepción de la Satisfacción Laboral de los trabajadores en

    sus centros de trabajo según género. Junio del 2005

    Fuente: Archivo Central del Consorcio de construcción SACHAPITE Junio del 2005