Unidad 2 Estadistica Básica UnADM

Embed Size (px)

Citation preview

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    1/12

    Unidad 2.Representacin numrica y grfica de datosPresentacin de la unidad

    En la unidad anterior, conociste las dos grandes divisiones dela estadstica: la que se dedica a la recoleccin, presentacin y

    categorizacin de datos, llamada estadstica descriptiva y laque se dedica a realizar hiptesis con base en dichos datos, lainferencial.

    Tambin aprendiste a determinar el espacio de estudio (esdecir, la poblacin) y las variables que se van a estudiar deacuerdo al problema planteado.

    En esta unidad estudiars la estadstica descriptiva yaprenders cmo organizar y presentar los datos obtenidosmediante el muestreo en poblaciones.

    Cuando se realiza un trabajo que requiere a la estadstica, se disean instrumentos paraobtener los datos deseados. Existen muchos mtodos para recolectar informacin, pero losms frecuentes son:

    Otra de las tcnicas ms recurridas en estadstica para recolectarinformacin son los experimentos, revisa en qu consisten.

    Un experimento es una prueba que se realiza para determinar lascaractersticas o comportamientos de una cosa. Por ejemplo,experimentar mediante el sentido del gusto, qu alimentos te parecenms salados.

    Tambin, experimento se define como el proceso que se realiza para verificar una seriede hiptesis relacionadas con un determinado fenmeno, en el cual se determinan lascaractersticas o comportamientos del fenmeno que se analiza.

    Por ejemplo, un experimento para determinar la velocidad de la luz en el vaco.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    2/12

    La diferencia entre la primera y la segunda definicin es que en la segunda se parte de unahiptesis mientras que en la primera no necesariamente. En el primer ejemplo,experimentas los sabores de los alimentos sin antes predecir cul ser ms salado. En elsegundo ejemplo, la hiptesis, a partir de estudios anteriores, es que la velocidad de la luzen el vaco es de 300 000 km/seg.

    Por lo tanto, el experimento verifica si esta hiptesis es cierta o no y en l cabe un margende error experimental.

    Los datos que se recopilan, usando alguna tcnica de las que acabamos de describir u otra,son organizados de acuerdo a los parmetros de la estadstica descriptiva que estudiarsen esta unidad.

    Propsitos de la unidad

    En esta unidad:

    Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos degrficas.

    Competencia especfica

    Utiliza las tcnicas de representacin numrica y grfica para representarinformacin a travs de la organizacin de los datos obtenidos de una muestra opoblacin.

    2.1. Organizacin de datos y distribucin de frecuencias

    Introduccin

    La descripcin estadstica organiza los datos y lospresenta en forma de tablas y grficas. Esta reaslo describe, resume, organiza y representa losdatos obtenidos de una poblacin o muestra de lapoblacin, sin elaborar inferencias ni obtenerconclusiones.

    La organizacin de datos se realiza a travs detablas que se utilizan para simplificar la presentaciny distribucin de estos datos.

    A continuacin, conocers que existen diferentes tiposde presentacin de datos y con base en ellos, distintasclasificaciones de frecuencia, como: frecuenciarelativa, frecuencia acumulada y frecuencia absoluta.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    3/12

    2.1.1. Frecuencias

    Frecuencia o Frecuencia absolutaLa frecuencia o frecuencia absoluta es el nmero de veces que se repite un valor dentrode un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes lasiguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendras:

    Dato Frecuencia

    2 2 (porque se repite 2 veces)

    3 3 (porque se repite 3 veces)

    5 2 (porque se repite 2 veces)

    7 4 (porque se repite 4 veces)Total de datos (N) 11

    Frecuencia absoluta acumuladaLa frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta elrengln i, se representa como Fi. Tambin es conocida como frecuencia acumulada.Siguiendo con el ejemplo anterior:

    Dato Frecuencia Frecuencia acumulada

    2 2 2 (hasta aqu tienes 2 datos

    3 3 5 (la suma de la frecuencia del primer dato con la delsegundo dato 2+3)

    5 2 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5)

    7 411 (frecuencia de 2+frecuencia de 3+frecuencia de 5frecuencia de 7)

    Total de datos (N) 11

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    4/12

    Frecuencia relativaLa frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el nmerototal de datos(N). La suma de esta columna da 1 (excepto cuando el resultado de lasdivisiones se redondea). Este dato tambin puede verse como un porcentaje, se representacomo hi. Siguiendo con el ejemplo anterior:

    Dato Frecuencia Frecuencia acumulada Frecuancia relativa2 2 2 0.181 (se divide 2/11)

    3 3 5 0.272 (se divide 3/11)

    4 2 7 0.181 (se divide 2/11)

    5 4 11 0.363 (se divide 4/11)

    Total de datos (N) 11

    Frecuencia relativa acumuladaLa frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el rengln

    i. Se representa como Hi, observa el ejemplo:

    Dato FrecuenciaFrecuenciaacumulada

    Frecuenciarelativa

    Frecuencia relativa acumulada

    2 2 2 0.18180.1818 (hasta este rengln slo tienes estafrecuencia relativa)

    3 3 5 0.27270.4545 (se suma la frecuencia relativa delprimer dato con la del segundo dato0.1818+0.2727)

    5 2 7 0.1818

    0.6363 (la frecuencia relativa de 2+la

    frecuencia relativa de 3+la frecuenciarelativa de 5)

    7 4 11 0.36360.9999 (la frecuencia relativa de 2+lafrecuencia relativa de 3+la frecuenciarelativa de 5+la frecuencia relativa de 7)

    Total dedatos

    (N)11

    Ejemplo de organizacin de frecuencias

    En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datospresentados son los siguientes:

    18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47,18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    5/12

    2.1.2. Intervalos

    Otro concepto muy utilizado en estadstica descriptiva es el de intervalo. Conoce qu es ylos dems conceptos asociados.

    Intervalos

    Conjunto de valores agrupados entre dos nmeros, conocidos como lmites, en este

    caso, lmites del intervalo.

    Intervalo de clase

    Se llama intervalo de clase a la expresin que denota un intervalo.

    Amplitud del intervalo

    La amplitud del intervalo es la distancia que hay entre los lmites superior e inferior delintervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior.

    Frontera de clase

    Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de

    clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y ellmite inferior del siguiente.

    Marca de clase

    Tambin conocida como punto medio de clase, es el resultado de la suma de loslmites inferior y superior del intervalo, dividido entre dos.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    6/12

    Ejemplo de intervalos

    Observa cmo se representan los conceptos relacionados con los intervalos, coloca elcursor sobre las palabras resaltadas.

    Dados los nmeros 15 y 25, tendras que:

    Elintervalocorresponde a todos los nmeros que se encuentran entre 15 y 25.Elintervalo de clasesera: 15-25Loslmites del intervaloson:Lmite inferior=15Lmite superior=25Laamplitud del intervalo15-25 sera: 25 menos 15, es decir, 10.

    Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puederestar el dato menor al dato mayor y dividir el resultado entre el nmero de intervalos.

    Lafrontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase seran:

    3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y36.5 para el tercer intervalo.Lamarca de clasedel intervalo 15-25 es igual a: 15+25=40/2=20.Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque estono es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la mismaamplitud.

    2.1.3. Construccin de intervalos de clase

    La formacin de clases o intervalos de clase, que se representa con (k), depende,generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer paradeterminar los intervalos de clase es lo siguiente.

    Paso 1. Calcular el rango

    Se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es elresultado de restar el nmero menor al nmero mayor; esto es: 240

    R= Xn X1Por ejemplo:

    Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente:Xn= 56X1= 18

    por lo tanto, R= Xn X1= 56 18= 38Paso 2. Determinar el nmero de intervalos que se desea tenerNo existe una regla para determinar el nmero de intervalos, pero generalmente se suelencrear entre 5 y 20 intervalos. La decisin la toma el investigador.Siguiendo con el ejemplo, se van a construir 7 intervalos.Entonces k= 7

    http://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p3_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.htmlhttp://207.249.20.69/ER20132/file.php/35/moddata/scorm/143/05_EB_2_1_2/EB_2_1_2_p2_acc.html
  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    7/12

    Paso 3. Dividir el rango entre el nmero de intervalos que se desea tener

    Recuerda que es recomendable elegir un nmero entre 5 y 20 para los intervalos y dividirel rango entre el nmero deseado de intervalos.Siguiendo con el ejemplo:

    Si son 7 intervalos 38/7 = 5.428

    sta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge elentero sin decimales.Paso 4. Formacin de intervalos:

    Los intervalos se forman comenzando un nmero antes del primer dato.

    Intervalos:

    17 a 22 (se cuenta 5 desde 18 hasta 22)23 a 28 (el siguiente intervalo comienza a partir del lmite superior del intervalo anterior)

    29 a 3435 a 4041 a 4647 a 5253 a 58

    Nota. No importa que el ltimo intervalo exceda el ltimo dato.

    Ejemplo de construccin de intervalos

    El director de una consultora en desarrollo de software desea conocer el nmero deincidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Paraello registra los siguientes datos:

    35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32,35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58,38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20.

    Observa cada paso:

    1. Calcular el rango: R=XnX1=60-20=402. Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos.

    3. Dividir el rango entre el nmero de intervalos: 40/8=54. Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 19-24,25-30, 31-36, 37-42, 43-48, 49-54, 55-60

    2.1.4. Tablas de datos

    Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla dedatos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada.Conoce en qu consiste cada una:

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    8/12

    Tablas de datosUna tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utilizacuando la informacin que necesitas son los datos mismos. Se organizan en columnas orenglones y se registran las mediciones o datos obtenidos.

    Ejemplo:

    Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientesvalores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7

    A partir de estos valores construyes la siguiente tabla:

    2.1.5. Tablas de frecuencias

    Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn

    construidas con las categoras de la variable que se est midiendo y su frecuencia.

    Un experimento da como resultado lossiguientes valores:1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2,3, 4, 5, 5, 4, 3, 3, 2Si agrupas los datos por categoras, segnla frecuencia o nmero de veces queaparece cada dato, tendras la siguientetabla:

    Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a lafrecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

    2.1.6. Tablas por intervalos de clase

    En este tipo de tablas los datos son presentados por intervalos de clase y no por los valorescorrespondientes a cada variable.

    Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad deMxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta lafrecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    9/12

    2.1.7. Tablas de doble entrada

    Estas tablas proporcionan informacin referente a dos variables o eventos relacionadosentre s. La informacin se distribuye poniendo en los renglones de la tabla la informacinde una de las variables y en las columnas la informacin de la otra variable.

    Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100personas, los resultados son los siguientes:

    En el ejemplo las variables relacionadas son la edad y el nmero de cirugas.

    Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual lasvariables relacionadas son los rangos contra el valor de las variables en dicho rango. Porejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo decalentamiento. En el rengln colocas los tiempos y en las columnas la temperaturaobtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla dedoble entrada:

    2.2. Representacin grfica de los datos

    Introduccin

    El tema anterior present diferentes formas de organizar o de

    tabular datos y la distribucin de frecuencias. Ahora estudiarsla representacin grfica de los datos.

    Las grficas son representaciones visuales de los datos que semuestran en una tabla. Existen diferentes tipos de grficas,cada una de ellas se elabora con base en el tipo deinformacin que se quiere representar.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    10/12

    2.2.1. Histograma

    El histograma es la representacin grfica de una variablecontinua. Se elabora en un sistema de coordenadasrectangulares. El eje horizontal se utiliza para representar lavariable independiente, es decir, la escala de medicin ofronteras de clase. El eje vertical representa la escala defrecuencias. Si los intervalos de clase tienen el mismo ancho,las alturas de las barras sern proporcionales a lasfrecuencias.

    El histograma permite apreciar visualmente la distribucin ydispersin de las mediciones.

    2.2.2. Grfica de barras

    Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas semuestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por

    el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por mediode espacios vacos entre las barras.

    La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

    Un histograma y una grfica de barras son muy semejantes, la diferenciaradica en que el histograma no presenta separacin entre las barras.

    2.2.3. Grfica de lneas

    Una grfica de lneas tambin se construye en un sistema coordenado rectangular ymuestra la relacin entre las variables mediante puntos conectados por lneas continuas. Lafrecuencia de cada valor medido es representada por la altura del punto.

    En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Sedeterminan los puntos de corte del valor de la variable con su frecuencia y se unen,obtenindose la grfica de lnea.

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    11/12

  • 7/27/2019 Unidad 2 Estadistica Bsica UnADM

    12/12

    Cierre de la unidad

    Has concluido la unidad 2, en la que conociste los fundamentosde la estadstica descriptiva, la utilidad de sta y el tipo deinformacin que puedes obtener a travs de ella.

    Recuerda que la organizacin de los datos se hace a travs detablas que pueden ser de frecuencias o intervalos de clase.

    La frecuencia es el nmero de veces que se repite un dato.Puede ser:

    Frecuencia absoluta Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada

    Los intervalos de clase son un conjunto de nmeros

    comprendidos entre un nmero lmite inferior y un nmero lmitesuperior.

    Tambin las grficas ayudan a visualizar la informacincontenida en las tablas de frecuencia.

    No olvides que la estadstica descriptiva es muy til en todo tipode investigaciones; por ejemplo, cuando muestran grficas oestadsticas en los medios de comunicacin.

    Para saber ms

    Consulta la siguiente direccin electrnica para saber ms sobre las tcnicas pararecolectar informacin:http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

    En la siguiente direccin electrnica puedes encontrar explicaciones, ejemplos yejercicios sobre los temas que se abordaron en esta unidad:http://www.vitutor.com/estadistica.html

    Fuentes de consulta

    Montgomery, Douglas C. y Runger, George C. (1996).Probabilidad y Estadstica aplicadas a la ingeniera(4 ed.). McGraw-Hill, Mxico.

    Walpole, Ronald E., Myers Raymond H., et al. (2007).Probabilidad y Estadstica para Ingeniera y ciencias(8 ed.). Mxico: PearsonEducacin.

    Intervalos de clase, consultado el 26 de abril de 2010en:http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2

    Censo y entrevista, consultados el 26 de abril de 2010en:http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.dochttp://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

    http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdfhttp://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdfhttp://www.vitutor.com/estadistica.htmlhttp://www.vitutor.com/estadistica.htmlhttp://www.vitutor.com/estadistica.htmlhttp://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf