52
1. ASPECTOS GENERALES: HISTORIA DE LA ESTADISTICA Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio. Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones. Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue el primero en

Recopilación Estadística

Embed Size (px)

DESCRIPTION

Contenido del Curso de Estadística en el tercer semestre de la Carrera de Abogado y Notario.

Citation preview

1. ASPECTOS GENERALES:

HISTORIA DE LA ESTADISTICA

Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del imperio.Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las ms variadas situaciones. Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.

CONCEPTOS DE LA ESTADISTICA

Estadstica: es un campo del conocimiento que permite al investigador deducir y evaluar conclusiones acerca de una poblacin a partir de informacin proporcionada por una muestra.

Especficamente, la estadstica trata de teoremas, herramientas, mtodos y tcnicas que se pueden usar en:

a. Recoleccin, seleccin y clasificacin de datos. b. Interpretacin y anlisis de datos. c. Deduccin y evolucin de conclusiones y de su confiabilidad, basada en datos mustrales. Los mtodos de la estadstica fueron desarrollados para el anlisis de datos muestreados, as como para propsitos de inferencia sobre la poblacin de la que se selecciono la muestra.

La estadstica como ciencia, cubre un extenso campo donde poder aplicarla.

Se agrupa en 2 grandes reas: estadstica descriptiva y estadstica inferencial, que desempean funciones distintivas, pero complementarias en el anlisis.

Es importante que todo profesional que utilice la estadstica como herramienta auxiliar de trabajo, posea un mnimo de conocimientos y habilidades prcticas en aquellas tcnicas que le facilitarn el buen desarrollo de esta actividad.

Estadstica descriptiva. La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos. Son sencillas desde el punto de vista matemtico y su anlisis se limita a los datos coleccionados sin inferir en un grupo mayor. El estudio de los datos se realiza con representaciones grficas, tablas, medidas de posicin y dispersin.

Estadstica inferencial. El problema crucial de la estadstica inferencial es llegar a proposiciones acerca de la poblacin a partir de la observacin efectuada en muestras bajo condiciones de incertidumbre. sta comprende las tcnicas que aplicadas en una muestra sometida a observacin, permiten la toman de decisiones sobre una poblacin o proceso estadstico. En otras palabras, es el proceso de hacer predicciones acerca de un todo basado en la informacin de una muestra. La inferencia se preocupa de la precisin de los estadgrafos descriptivos ya que estos se vinculan inductivamente con el valor poblacional.

CONCEPTOS BASICOSPoblacinEs el conjunto de todos los elementos que presentan una caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es una persona, se puede estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Los elementos que integran una poblacin pueden corresponder a personas, objetos o grupos (por ejemplo, familias, fbricas, empresas, etc). Las caractersticas de la poblacin se resumen en valores llamados parmetros.

MuestraUna muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.La mayora de los estudios estadsticos, se realizan no sobre la poblacin, sino sobre un subconjunto o una parte de ella, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao de la muestra es mucho menor al tamao de la poblacin. Los valores o ndices que se concluyen de una muestra se llaman estadgrafos y estos mediante mtodos inferenciales o probabilsticos, se aproximan a los parmetros poblacionales.

VariableSe llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Una variable se puede clasificar de la siguiente manera.

a) Variable cuantitativa: es aquella que toma valores numricos. Dentro de ella, se subdividen en:

Continua: son valores reales. Pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos.

Discreta: toma valores enteros. Ej. N de hijos de una familia, n de alumnos de un curso.

b) Variable cualitativa: es aquella que describe cualidades. No son numricas y se subdividen en:

Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo, lugar de residencia.

Ordinal: son cualidades que representan un orden y jerarqua. Ej. Nivel educacional, das de la semana, calidad de la atencin, nivel socioeconmico.

IndividuoUn individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.

MuestreoEl muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.

ValorUn valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

DatoUn dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

METODOS ESTADISTICOS

ETAPAS DEL MTODO ESTADSTICO El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que acten libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:

1. Planteamiento del problema.2. Fijacin de los objetivos.3. Formulacin de la hiptesis.4. Definicin de la unidad de observacin y de la unidad de medida.5. Determinacin de la poblacin y de la muestra.6. La recoleccin. 7. Crtica, clasificacin y ordenacin. 8. Tabulacin. 9. Presentacin. 10. Anlisis. 11. Publicacin.

1. PLANTEAMIENTO DEL PROBLEMA Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se pretende estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible sobre el o los fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones bsicas a un anlisis lgico; es decir, se debe hacer una ubicacin histrica y terica del problema.

2. FIJACIN DE LOS OBJETIVOS Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe, adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los objetivos generales y los especficos.

3. FORMULACIN DE LAS HIPTESIS Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada. Una hiptesis estadstica debe ser susceptible de docimar, esto es, debe poderse probar para su aceptacin o rechazo. Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis contraria se le llama Hiptesis Alternativa (H1).

4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la poblacin estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a las que se les har la medicin. La unidad de observacin puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja. El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qu unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la informacin.

5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes; una poblacin puede estar constituida por los habitantes de un pas o por los peces de un estanque, as como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado como infinito.

Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar las propiedades del conjunto del cual es obtenida. En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la poblacin. Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para asegurar la objetividad de la investigacin. .. 6. LA RECOLECCIN Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha de partir, a menos que se tenga experiencia con muestras anlogo, de una o varias muestras piloto en las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los parmetros con la precisin establecida. El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica, etc. Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado.

7. CRITICA, CLASIFICACIN Y ORDENACIN Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin por parte de quien depura para poder detectar falsedades en las respuestas, incomprensin a las preguntas, respuestas al margen, amn de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario.

Separado el material de "desecho" con la informacin depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de las diferentes variables que intervienen en la investigacin. El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.

8. LA TABULACIN Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un ttulodddd adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subttulos internos y la cuantificacin de los diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los crditos a la fuente de la informacin.

9. LA PRESENTACIN Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes que, antes que claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe hacerse no slo en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.

10. EL ANLISIS La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisin. Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar las conclusiones definitivas.

11. PUBLICACIN Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca de l.

FUNCIONES DE LA ESTADISTICA

As pues, la Estadstica puede aportar una primera aproximacin al campo de estudio a partir de los datos que facilita al investigador, con posterioridad se pueden aplicar los principios derivados de la Estadstica, entendida como ciencia, para la resolucin de problemas o para la toma de decisiones. Por ejemplo, puede realizarse una recopilacin de datos sociodemogrficos de una determinada zona residencial, para prever la construccin de escuelas infantiles a corto plazo. Esta informacin puede ser til para las autoridades administrativas.Downie y Heath (1983) sealan que los profesionales de la pedagoga, sociologa, psicologa, en sus trabajos de estudio e investigacin, suelen disponer de muchos y variados datos que necesitan ser analizados e interpretados, algo que no sera posible sin un conocimiento de la Estadstica, as podemos sealar que nos ofrece las siguientes posibilidades:

Permite calcular las medias aritmticas de los grupos, para comparar niveles de dominio de las variables. Establece el grado de dispersin o variabilidad de las observaciones y datos. Representa grficamente, mediante tablas y figuras, los grupos o los sujetos individuales. Ayuda en la transformacin de datos para compararlos (centiles, puntuaciones tpicas). Establece relaciones entre variables y calcula el grado de relacin entre las mismas.Facilita el clculo de la fiabilidad y la validez de los instrumentos de recogida de datos y de medida. Recurre a diversas mediciones o combinacin de variables para predecir el comportamiento futuro. Permite extrapolar los resultados de muestras representativas a grupos ms amplios (poblaciones). Compara las actuaciones de dos o ms grupos y establece la existencia o no de diferencias significativas, lo que permite comprobar qu procedimiento de trabajo ofrece mejores resultados.

De forma sinttica, las principales funciones de la Estadstica se pueden agrupar en torno a tres grandes apartados:

a) Facilitar el manejo de datos amplios y dispersos: se trata de una funcin eminentemente simplificadora y descriptiva, pues se pretenden reducir a ndices o estadsticos (media, mediana, desviacin tpica, correlacin) las caractersticas que identifican a un conjunto de datos. As se procede a la ordenacin, la categorizacin, posicin, variabilidad, simetra y asimetra, representaciones grficas y estudios de relaciones entre variables.

b) Inferir desde la muestra a la poblacin: este proceso consiste en el anlisis que sigue el investigador para extrapolar los resultados obtenidos en las muestras a las poblaciones de las que se extrajeron. Estamos hablando de la generalizacin de los resultados de muestras, cuando stas cumplen los requisitos de suficiencia y representatividad.Es decir, desde los estadsticos (proceden de muestras) se pueden estimar los parmetros (medidas de poblacin).

c) Ayudar en la toma de decisiones: tanto desde los meros anlisis descriptivos de grupos como el anlisis de los valores crticos que ponen de relieve la existencia de diferencias significativas entre los grupos de tratamiento. En ambos supuestos se trata de incorporar cambios en las actuaciones educativas que redunden en mejoras de las formas de actuacin en el campo socioeducativo.

ABUSOS DE LA ESTADSTICA

Se puede definir de dos diferentes maneras:

Como coleccin de datos numricos: Dichos datos numricos son presentados de manera ordenada y sistemtica. Una informacin numrica puede no constituir una estadstica, para merecer este apelativo los datos se deben de construir como un conjunto coherente establecido de forma sistemtica y siguiendo un criterio de ordenacin. Como ciencia: Estudia el comportamiento de masas buscando las caractersticas generales de un colectivo y preside de las particulares de cada elemento. Por ejemplo: al investigar el sexo de los nacimientos despus obtener la proporcin del sexo masculino o del sexo femenino.

1. USOS Y ABUSOS

Uso:Conocer el porcentaje de la poblacin que necesita agua. Conocer el porcentaje de poblacin que tiene diabetes. Conocer el porcentaje de personas que utilizan tomate para preparar sus comidas Conocer el porcentaje de personas guatemaltecas que consumen tortilla.

Abuso:Aprovechar dicho resultado para el aumento de precio. Aprovechar el resultado para el aumento del precio de las medicinas. Conocer el resultado de dicho estudio y aumentarles el precio. Conocer el resultado de dicho y aumentar el precio.

2. ASPECTOS FUNDAMENTALES:

TECNICAS DE MUESTREO

Como se ha puesto de manifiesto, gran parte del trabajo de un estadstico profesional se hace con muestras. Estas son necesarias porque las poblaciones son casi siempre demasiado grandes para estudiarlas en su totalidad. Exigira demasiado tiempo y dinero estudiar la poblacin entera, y tenemos que seleccionar una muestra de la misma, calcular el estadstico de esa muestra y utilizarlo para estimar el parmetro correspondiente de la poblacin. La obtencin de la informacin se puede realizar por diversos medios. Una forma es a travs de una encuesta a un grupo de individuos, donde a cada uno se le hacen las mismas preguntas. Otra forma es a travs de experimentos donde la respuesta a la variable es el resultado del experimento. Puede tambin recolectarse los datos en forma directa, es decir, la informacin se extrae de alguna base de datos seleccionando una muestra de ellos. En cualquiera de estos casos contamos con una seleccin de informacin llamada muestra y que se procede a analizar. Existen diferentes tcnicas para realizar el muestreo y que depender cada caso, cual usar. Algunas de ellas son:

1. Muestreo aleatorio simple: todos los elementos de la poblacin tiene igual posibilidad de ser escogido y se eligen al azar.

2. Muestreo sistemtico: los elementos se seleccionan a un intervalo uniforme en una lista ordenada. Una preocupacin del muestreo sistemtico es la existencia de factores cclicos en el listado que pudieran dar lugar a un error.

3. Muestreo estratificado: los elementos de la poblacin son primeramente clasificados en grupos o estratos segn una caracterstica importante. Luego, de cada estrato se extrae una muestra aleatoria simple.

4. Muestreo por conglomerado: los elementos de la poblacin estn subdivididos en grupos y se extraen aleatoriamente algunos de estos grupos completos

ESCALAS DE MEDICION, VARIABLE, TIPOS Y VALORESSi hubiese una escala para medir la amistad, nos daramos cuenta que amigos hay muy pocos Le ThierreComo sabemos las caractersticas personales como estatura , edad, gnero, habilidades, tamaos de un determinado grupo se los conoce como variables, sabemos que existe una gama muy diferenciada de variables de las cuales se pude extrapolar diferentes escalas para ser medibles, la aplicacin de la bioestadstica para medir caracterstica y valores tanto cualitativos como cuantitativos a travs de la utilizacin de escalas que permitan medir de mejor manera un resultado obtenido.MEDICION DE VARIABLES Antes que una variable sea tratada estadsticamente debe ser observada/medida para un conjunto de unidades observacionales, las unidades observacionales son aquellos entidades que se observan, cuando las observaciones se cuantifican (es decir se expresan numricamente) se dice que los nmeros son medibles, una medicin es una observacin que se expresa fsicamente en forma numrica, es decir cuando se le otorga un valor determinado segn su magnitud.De lo anteriormente mencionado podemos deducir que existen diferentes formas de medir variables, algunas se las puede medir directamente por ejemplo la temperatura, la tensin arterial, la inteligencia, y otros en forma indirecta, como el grado de aprovechamiento de una determinada asignatura, la eficiencia, eficacia, el amor , ser romntico, ser buen mal estudiante, etc.Algunos de esos mtodos de evaluacin de medicin de variables (escalas) podran arrojar datos numricos u otros podran ser expresados en palabras, de esto depende la credibilidad de la investigacin basada en la exactitud, conveniencia, y significado de las mediciones que podran ser el origen de las conclusiones, recomendaciones y acciones, fruto de la resolucin del fenmeno problema. Una vez que agrupamos estas caractersticas de los individuos de los elementos observados ( variables) en categoras en grupos clases, esta agrupacin de caracterstica comunes similares nos permite clasificarlas en :CLASIFICACION DE LAS ESCALASLas Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al mismo tiempo se sub dividen en: Cualitativas : 1. Escala nominal clasificatoria1. Escala ordinal Cuantitativas: 1. Escala discreta discontinua1. Escala concreta continua Otras escalas:1. Escala cronolgica1. Escala intervalar1. Escala de razn ESCALA NOMINAL CLASIFICATORIAEste tipo de variables no presentan un ordenamiento previo, ms al contrario es arbitraria, de ah que se haya ideado tres parmetros para entender mejor este tipo de escala; variable, escala y diferencia, por ejemplo1. Variable : PROFESION1. Escala : INGENIEROMEDICOABOGADOENFERMEROODONTOLOGO1. Diferencia : No existe diferencia entre los profesionales, Otros ejemplos: Variable: DEPARTAMENTOS DE BOLIVIAEscala: La pazCochabambaOruroPotosTarijaBeniDiferencia: Ninguna . Variable: SexoEscala: MasculinoFemeninoDiferencia: Ninguna Variable: Estado civilEscala: SolteroCasadoDivorciadoViudoUnin estableDiferencia: Ninguna. ESCALA ORDINALLas variables susceptibles de ser medidas siguiendo un ordenamiento (orden), formada por una clase mutuamente excluyentes, que se agrupan de acuerdo a un orden pre asignado. Por ejemplo1. Variable : GRADO DE INSTRUCCION1. Escala : PRIMARIASSECUNDARIASUPERIORPOST SUPERIOR1. Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes de grado primario con los de nivel superior existe no solo aos de experiencia, sino conocimiento. ,Otros ejemplos:1. Variable: GRADO DE MILITAR y/o POLICIALEscala: SOLDADOSARGENTOSUBOFICIALOFICIALGENERALDiferencia: Existe diferencia entre los grados jerrquicos no solo en aos de experiencia sino en aos de estudio. Variable: JERARQUIA FAMILIAR Escala: HIJO MENORHIJO MEDIOHIJO MAYOR MADRE PADREPADRE MADREDiferencia: Existe diferencia entre los grados jerrquicos de la familia no solo en aos de experiencia sino en edad.ESCALA DISCRETA DISCONTINUASe dice que si la variable medida es susceptible a ser contada, se puede construir una escala discreta, formada por nmeros ENTEROS con incrementos fijos, donde las fracciones no son consideradas, para esto, se debe considerar la magnitud de los nmeros expuestos. Por ejemplo:1. Variable : NUMERO DE HIJOSEscala: 1 HIJO2 HIJOS3 HIJOS4 HIJOS1. Amplitud: Entre 4 y 1 hijos , existe una amplitud de 3 hijosOtros ejemplos: Variable: NUMERO DE VISITASEscala: De 1 a 3 visitasDe 4 a 6 visitasDe 7 a 9 visitasDe 10 a 12 visitasAmplitud: Entre 1 y 3, existe una amplitud de 2 Variable: NUMERO DE CARIES DENTAL Escala: De 1 a 3 cariesDe 4 a 6 cariesDe 7 a 9 cariesAmplitud: Entre 1 y 3 caries, existe una amplitud de 2 cariesESCALA CONCRETA CONTINUACuando uno cuenta con variables de tipo cuantitativo continuo o concreto se pude utilizar este tipo de escala, cuyo requisito es l de poder presentar nmeros relativos racionales (fraccionados, porcentuales y/o decimales) siendo esta medicin aproximada. Por ejemplo:Variable: ESTATURA Escala: 1,65 m.1,66 m.1,67 m.1,68 m.1,69 m.Amplitud: Entre 1,65 y 1,69 m., existe una amplitud de 0,5mOtros ejemplos: Variable: PESO EN GRAMOSEscala: 6,5 Kg 7,5 Kg8,5 Kg9,5 KgAmplitud: Entre 6,5 y 9,5 kg, existe una amplitud de 4,0 kg. Variable: TIEMPO EN HORAS Escala: 1,10 hrs.2,10 hrs.3,10 hrs.4,10 hrs.Amplitud: Entre 1,10 y 4,10 horas, existe una amplitud de 4 horas.ESCALA DICOTOMICA Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo esta variable de tipo cualitativo cuantitativo dependiendo de la informacin resultado que se busque, por ejemplo: 1. Variable preferencia por un equipo de Futbol (football) 1. Escala de medicin: Bolvar y Wilsterman1. Respuesta : Bolvar Wilsterman Otro ejemplo:1. Variable. sexo de un estudiante de UDABOL 1. Escala de medicin: Masculino femenino 1. Respuesta: Masculino femenino

ESCALA CRONOLGICAEs un tipo de escala cuantitativa continua, se la utiliza para estudiar algunos fenmenos en funcin al tiempo, algunos autores la tratan como si fuera una escala de variable independiente, permite conocer un determinado fenmeno a travs del tiempo , es decir permite un seguimiento temporalizado (en el pasado, en el presente en el futuro).1. Variable. Cambios fsico de Mara Gordales 1. Escala de medicin : al 1 ao5 aos25 aos50 aos75 aos 100 aos 1. Respuesta: descripcin de las alteraciones fsicas durante su vida Otro ejemplo:El seguimiento de un determinada enfermedad por ejemplo el SIDA EL SIDNA, donde se podra realizar un seguimiento por memorizado de las patologas que se producen a raz de este fenmeno.ESCALA INTERVALARLas categoras se ordenan en unidades igualmente espaciadas, siendo posible medir las diferencias relativas en cada punto de la escala, no EXISTE EL CERO ABSOLUTO, tenemos como ejemplo: 1. Variable : Medicin de la temperatura corporal, 1. Escala : Grados centgrado Celsius (37) 1. Diferencia : La hace los nmero mayores menores de 37 ESCALA DE RAZN En esta escala SI EXISTE EL CERO ABSOLUTO y la magnitud de diferencia entre los valores numricos entre s por ejemplo :Variable: RELACIN ENTRE LAS EDADESEscala: Juan recin nacido (0 aos)Jos 9 aos ( 9aos ms )Joaqun 18 aos (9 aos que Jos y 18 aos ms que Juan)

3. ORGANIZACIN DE DATOS:

RECOPILACION DE DATOS

En un estudio estadstico los mtodos que se aplican son:A) Recopilacin: De acuerdo con la localizacin de la informacin los datos estadsticos pueden ser internos y externos.Los internos son los registros obtenidos dentro de la organizacin que hace un estudio estadstico,Los externos se obtienen de datos publicados y encuestas.B) Organizacin: En la organizacin de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados.C) Representacin: Hay 3 maneras de presentar un conjunto de datos mediante enunciados, tablas estadsticas y grficas estadsticas.D) Anlisis: Despus de los datos anteriores los datos estadsticos estn listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemticas durante el proceso de anlisis.METODO PARA LA RECOLECCION DE DATOS

En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que se desea investigar. Discutiremos aqu los mtodos ms importantes, incluyendo las ventajas y limitaciones de estos.La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuar a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o investigacin.Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas.Una de las desventajas de este mtodo se debe a que si el entrevistador no obra de buena f o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigacin extensa.Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar interpretaciones errneas.Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal.Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el investigador.Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las preguntas es siempre fcil.Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados.

INSTRUMENTOS PARA LA RECOLECCION DE DATOS

Cuestionarios:Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es necesario elaborar un estudio de preguntas.Los cuestionarios en general, constan de las siguientes partes:a. La identificacin del cuestionario: nombre del patrocinante de la encuesta, (oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha de la entrevista. b. Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc. c. Datos propios de la investigacin, son los datos que interesa conocer para construir el propsito de la investigacin. Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada por no tener ningn tipo de inters para el estudio.

Consideraciones que debemos tomar en cuenta: El cuestionario debe ser conciso; tratar en los posible de que con el menor nmero de preguntas, se obtenga la mejor informacin. Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla. Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado. Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del entrevistado. Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas procurando que se relacionen unas con otras. Series o distribuciones estadsticas:Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica".Clasificacin de las series estadsticas:1. Ejemplo:Produccin nacional de madera en Rola en mRollizos (periodo 1993 1998)AosProduccin (m rollizos)

19931.161.061,454

1994981.668,626

19951.087.926,142

19961.440.306,250

19971.618.075,000

19981.027.177,876

Fuente: MARN D.G.S Recurso Forestal. 1999CVG PROFORCAEs importante resaltar que cuando se trata de series temporales o cronolgicas, se debe especificar el instante o el periodo de tiempo a los que se refieren los caracteres en estudio.Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un momento especfico de tiempo.Ejemplo:Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997 2001.2. Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo. 3. Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los componentes del colectivo en estudio. Ejemplo:Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin en septiembre del 2001.2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin.Ejemplo:Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla56543

63454

34653

43646

Tabulando los datos tenemosNios distribuidos por edades: Edad (variable)N de nios (Frecuencia)

35

46

54

65

Total =20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente.2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades.Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa".Ejemplo:Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil.Estudiantes de la materia Estadsticas I, clasificados por su estado civil.Estado civilN de Estudiantes (frecuencia)

Solteros18

Casados12

Viudos1

Divorciados4

2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.Ejemplo:Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad.Edad (en aos)N de estudiantes (frecuencia)

1912

202

258

286

324

423

Total =35

2.2) series especiales o geogrficas: es aquella que est formada por los valores que toman una variable en funcin del espacio geogrfico.

TABULACION DE DATOS

La tabulacin consiste en presentar los datos estadsticos en forma de tablas o cuadros.

Forma de tabular

VARIABLES CUALITATIVAS

Pueden representarse:_ La frecuencia absoluta (smbolo: f n), que es el n de veces que aparece cada modalidad (resultado del recuento). La frecuencia total, de todas las modalidades juntas, se representa por N.

_ La frecuencia relativa (fr) o proporcin se obtiene dividiendo la frecuencia de cada modalidad entre el total de datos. fr = f / N . Los valores posibles oscilan entre 0 y 1.Suele expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 un nmero muy cercano al 1, si ha habido redondeos.

_ El porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100 % = (f*100)/N. Suele expresarse con 3 dgitos. La suma de todos los porcentajes debe dar 100 o un nmero muy prximo, si ha habido redondeos.

_ Las frecuencia acumuladas (S f Sn) que se obtienen sumando la frecuencia de cada modalidad a las frecuencias ya acumuladas anteriormente. En la primera modalidad no hay nada acumulado de antes y por tanto su frecuencia acumulada ser su misma frecuencia.

La ltima modalidad tiene que dar una frecuencia acumulada igual a N.

_ Las frecuencias relativas acumuladas y los porcentajes acumulados se obtienen de forma similar

_ En las variables nominales las modalidades pueden ponerse en el orden que se quiera, pero en las ordinales hay que respetar el orden lgico.

Ejemplo:

Residencia Sanitaria S. S. de Ciudad Vieja, GuatemalaIngresos en Pediatra. Marzo 1990

Seccinffr%ffr%

Neonatologa250.12512.5250.12512.5

Lactantes950.47547.51200.660

Preescolares800.400402001100

Total2001100

En la tabla definitiva no se presentan todos estos parmetros, sino los ms adecuados en cada caso concreto. Casi siempre f y/o %. Slo el porcentaje, sin que conste N, no es correcto. En este ejemplo bastara con f y %.

VARIABLES CUANTITATIVAS

Los datos se agrupan segn la frecuencia de los valores. Es lo que se denomina Distribucin de frecuencias. La forma de tabular depende del n de datos.

----Si son pocos (la mayora de autores pone el tope en 30), se hace una tabla simple de forma similar a lo visto para las variables CL. Cada dato equivale a una modalidad. Al final nos quedaremos con la f de cada nmero y si se prefiere tambin con el %. Los nmeros se ordenan de menor a mayor o de mayor a menor. La tabla puede hacerse en sentido vertical u horizontal.

Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1 , 4)

x12479

f24232

O bien,

xf

12

24

42

73

92

---Si son muchos se agrupan en clases, que son intervalos sucesivos de valores. Los datos se asignan a la clase que les corresponde y se cuentan los datos de cada clase, que est representada por el punto medio o centro de clase (pm c).

Esta agrupacin es arbitraria con dos condiciones esenciales: que las clases sean mutuamente excluyentes y que todos los datos puedan se asignados a una clase. Ahora bien, la experiencia ha ido introduciendo una serie de normas, que permiten hacer esta agrupacin de la forma ms racional posible.

Yo recomendara los siguientes pasos:

1) calcular el RECORRIDO (R), (a veces mal llamado Rango)

= (lmite real superior del dato mayor lmite real inferior del dato menor)O si se prefiere: = (valor tabulado mximo valor tabulado mnimo) + 1

2) calcular el N DE CLASES (NC).

Es funcin de N (tamao de la muestra) y no hay reglas fijas.En general: entre 4 y 20.Ayudas: NC = 1+ 3,32*logN 1+1,44*lnN

O la siguiente tabla: N 8 16 32 64 128 256 etc.------------------------------------------------NC 4 5 6 7 8 9 etc.

De entrada nos quedamos con 2 3 opciones

3) calcular la AMPLITUD de las clases INTERVALO (i) : i = R / NCSi i no es nmero entero, se redondea al nmero entero superior para que NC*i _ R y as queden englobados todos los datosComo probamos con 2 3 opciones, conviene elegir una i que sea impar, pues as el punto medio de la clase (pm c) tendr una cifra menos.En principio todas las clases deben tener la misma amplitud.

4) Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible entre ambos extremos de la distribucin fijando as los lmites definitivos de la tabla.

5) Construir el esquema de la tabla, poniendo columnas de:

_ CLASES LMITES TABULADOS_ LIMITES REALES_ PUNTO MEDIO (pm c)_ FRECUENCIA ( f n)_ FRECUENCIA RELATIVA ( fr)_ PORCENTAJE (P o %)_ FRECUENCIAS ACUMULADAS ( _f _n)_ FRECUENCIAS RELATIVAS ACUMULADAS (_fr)_ PORCENTAJES ACUMULADOS (_%)

6) Hacer el RECUENTO de datos y rellenar las casillas correspondientes

7) Escribir la TABLA DEFINITIVA. Son obligadas las clases y la frecuencia absoluta, pudiendo aadir otros parmetros, si se considera que mejoran la informacin. Una tabla excesivamente prolija resulta ms difcil de leer. Por tanto la norma es: poner todo lo necesario, pero no ms de lo necesario.

Es recomendable probar con al menos 2 tablas y elegir la que quede mejor

EJEMPLO 1:

Tabular los 70 valores siguientes:

DATOS ORIGINALES (N = 70)

40 55 19 51 62 15 20 44 60 60 45 15 21 31 13 44 41 43 51 35 50 33 25 16 6114 14 59 59 59 20 23 25 29 29 59 58 54 50 49 39 27 37 23 24 58 27 28 57 3232 34 57 56 35 35 54 36 43 46 52 50 49 42 43 46 40 39 31 48

PASOS DE LA TABULACION

-dato mayor: 62, cuyo LRS es 62,5

-dato menor: 13, cuyo LRI es 12,5

-recorrido (R): 62,5-12,5 = 50 (62-13)+1 = 50

-n de clases (NC): 7 u 8

-amplitud (i):-si NC = 7 , i = 50/7 = 7,1 8 (par)-si NC = 8 , i = 50/8 = 6,2 7 (impar)

-nos quedamos pues con NC = 8 de amplitud 7, que es impar

-sobras: (8*7) 50 = 6 , que repartimos as: 3 abajo y 3 arriba

la 1 clase empezar en 10 (13-3) la ltima terminar con el 65 (62+3)

--ya se puede construir el esquema de la tabla (clases, LR y punto medio) y proceder al recuento de los datos que corresponden a cada clase, para completar las otras columnas

Clases(Lmites tabulados)

Lmites realespunto medio c

ffr%ffr%

10 169,5 16,51360,098,5760,098,57

17 2316,5 23,52060,098,57120,1717,1

24 3023,5 30,52780,1111,4200,2928,6

31 3730,5 37,534110,1615,7310,4444,3

38 4437,5 44,541110,1615,7420,6060,0

45 5144,5 51,548110,1615,7530,7675,7

52 5851,5 58,55590,1312,9620,8988,6

59 - 6558,5 65,56280,1111,4701,00100

Suma701,0199,94

***Esta no es la nica tabla posible, aunque probablemente sea la mejor.Podramos hacerla con 7 clases de amplitud 8; sobras: 6. Clases: 10 17; 18 25; ...; 58 - 65O bien 6 clases de amplitud 9. Sobras: 4. Clases: 11- 19; 20 28; ...; 56 - 64o bien 10 clases de amplitud 5 . Sin sobras. Clases: 13 22; 23 32 ; .... ; 53 - 62

El primer paso de cualquier estudio estadstico es recoger los datos. Normalmente se suele llevar a cabo a travs de encuestas o entrevistas, segn la poblacin a estudiar, su tamao, el tiempo de que dispongamos,Una vez que tenemos los datos recogidos, pasamos a hacer el recuento: contando el nmero de veces que aparece cada valor de la variable a estudiar.

Ejemplo 2.- Preguntamos a 20 alumnos el nmero de miembros de su familia, y sus respuestas fueron:3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7, 5, 6, 5, 4, 4, 7, 4, 5, 3

Miembros por familia

Frecuencia

35

44

56

62

72

81

Los valores de las variables estadsticas continuas se agrupan por intervalos o clases. Adems, si la variable es discreta y toma muchos valores, tambin se suele agrupar por intervalos o clases.El valor medio de cada clase o intervalo se llama marca de clase y se calcula como la semisuma de los extremos del intervalo.El recorrido de la variable es la diferencia entre el valor ms grande y el ms pequeo. La amplitud de cada intervalo se calcula dividiendo el recorrido de la variable entre el nmero total de intervalos.

Ejemplo 3.- A los 100 empleados de una empresa de piezas de precisin, se les ha realizado una prueba de habilidad manual. En una escala de 0 a 100 se han obtenido las siguientes puntuaciones:

27, 66, 32, 55, 46, 37, 75, 81, 18, 33, 47, 74, 37, 52, 47, 66, 80, 87, 37, 29,46, 15, 29, 90, 76, 67, 23, 35, 94, 23, 25, 56, 73, 78, 17, 28, 76, 58, 45, 36,55, 60, 17, 56, 23, 82, 64, 50, 51, 45, 37, 65, 62, 26, 69, 36, 54, 42, 40, 54,27, 62, 28, 65, 46, 92, 36, 33, 23, 66, 18, 82, 47, 49, 59, 45, 73, 43, 47, 83,78, 65, 39, 36, 53, 91, 38, 35, 68, 78, 91, 23, 34, 43, 55, 56, 74, 56, 62, 38.

Observamos que los valores extremos son 15 y 94. La amplitud total entre los datos es de 80 puntos, ya que ambas puntuaciones estn incluidas.

Agruparemos los datos en 8 intervalos de amplitud 10:

, , , . Realizando el recuento con atencin, se obtiene la tabla que sigue:

Habilidad manualMarca de clase

Frecuencias

1910

2912

3917

4918

5913

6913

7911

896

Para construir una tabla estadstica completa tenemos que calcular:

Frecuencia absoluta () de cada valor : es el nmero total de veces que aparece el dato .

Frecuencia absoluta acumulada () de cada valor : es la suma de todas las frecuencias absolutas correspondientes a los valores anteriores a y a la suya propia. No tiene sentido para variables cualitativas.

Frecuencia relativa (fr) de cada valor : se calcula dividiendo la frecuencia absoluta correspondiente entre el nmero total de datos N.

Frecuencia relativa acumulada () de cada valor : es la suma de todas las frecuencias relativas correspondientes a los valores anteriores a y a la suya propia. No tiene sentido para variables cualitativas.

Ejemplo 4.- Preguntamos a 20 alumnos el nmero de miembros de su familia, y sus respuestas fueron:3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7, 5, 6, 5, 4, 4, 7, 4, 5, 3

Miembros por familia

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

3550,250,25

4490,20,45

56150,30,75

62170,10,85

72190,10,95

81200,051

4. PRESENTACION DE DATOS ESTADISTICOS:

TRABAJO DE INVESTIGACION

5. MEDIDAS DE TENDENCIA CENTRAL:

MEDIDAS DESCRIPTIVAS

Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos resumen la informacin contenida en ella

MEDIDAS POSICION

Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los percentiles.PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Ejemplo: Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles. xiniNi

01414

11024

21539

32665

42085

515100

n=100

Solucin: 1. Primer cuartil:

2. Segundo cuartil:

3. Tercer cuartil:

MEDIDAS DE TENDENCIA CENTRAL Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:MEDIA : (media aritmtica o simplemente media). es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi.MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

MEDIDAS DE DISPERSION O ASIMETRIA Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.MEDIDAS DE DISPERSIN ABSOLUTASVARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones. Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de Xi.DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza

Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin tpica):

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax - xminMEDIDAS DE DISPERSIN RELATIVASCOEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.MEDIDAS DE FORMA Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras de la distribucin, con la distribucin normal.MEDIDA DE ASIMETRADiremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coinciden.Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms lentamente por la derecha que por la izquierda. Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la izquierda. Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el Coeficiente de Asimetra de Pearson:

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe asimetra a la izquierda.MEDIDA DE APUNTAMIENTO O CURTOSIS Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

EJEMPLO 1

El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica. SOLUCIN: La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:15, 21, 32, 59, 60, 60,61, 64, 71, 80.Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana.La moda: el valor de la variable que presenta una mayor frecuencia es 60La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.

Sx2=

La desviacin tpica S: es la raz cuadrada de la varianza.

S = 427,61 = 20.67El rango: diferencia entre el valor de las observaciones mayor y el menor80 - 15 = 65 dasEl coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media aritmticaCV = 20,67/52,3 = 0,39COVARIANZA

La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variablesSi xy > 0 la correlacin es directa.Si xy < 0 la correlacin es inversa.La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares.EjemplosLas notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar la covarianza de la distribucin.xiyixi yi

212

339

428

4416

5420

6424

6636

7428

7642

8756

10990

1010100

7260431

Despus de tabular los datos hallamos las medias aritmticas:

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:Y/X024

1213

2142

3250

Hallar la covarianza de la distribucin.En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias aritmticas.xiyifixi fiyi fixi yi fi

012020

021020

032060

211212

2248816

235101530

41312312

4228416

20404176

CORRELACION

La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

Tipos de correlacin1 Correlacin directaLa correlacin directa se da cuando al aumentar una de las variables la otra aumenta.La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversaLa correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nulaLa correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacinEl grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:1. Correlacin fuerteLa correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbilLa correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula

COEFICIENTE DE CORRELACION LINEAL

El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de las desviaciones tpicas de ambas variables.El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlacin1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara.2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.Si la covarianza es positiva, la correlacin es directa.Si la covarianza es negativa, la correlacin es inversa.Si la covarianza es nula, no existe correlacin.3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.1 r 14. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

EjemplosLas notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.xiyixi yixi2yi2

21241

33999

428164

44161616

54202516

64243616

66363636

74284916

76424936

87566449

1099010081

1010100100100

7260431504380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:Y/X024

1213

2142

3250

Determinar el coeficiente de correlacin.Convertimos la tabla de doble entrada en tabla simple.xiyifixi fixi2 fiyi fiyi2 fixi yi fi

01200220

02100240

032006180

21124112

22481681616

2351020154530

41312483312

4228324816

2040120419776

Al ser el coeficiente de correlacin negativo, la correlacin es inversa. Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.

coeficiente de PearsonEl ndice numrico ms comn usado para medir una correlacin es el coeficiente de Pearson. El coeficiente de Pearson (tambin llamado coeficiente de correlacin del producto-momento), se representa con el smbolo r y proporciona una medida numrica de la correlacin entre dos variables. Es til reconocer la frmula usada para calcular el coeficiente de Pearson (es posible que vea documentos en que se haga referencia a ella). Le entregamos la frmula en una nota al pie de esta pgina. No deje que la frmula lo intimide. No necesita comprender la frmula para comprender el concepto de correlacin. Aunque si hace un esfuerzo va a comprender la frmula en poco tiempo y con claridad. Recuerde que al describir la relacin entre dos variables, necesitamos responder al menos cuatro preguntas: (1) Estn relacionadas las variables entre s? Si los cambios en el valor de una de las variables van acompaados de cambios en el valor de la otra, las variables parecen estar relacionadas. (2) Si las variables parecen estar relacionadas, qu tan fuerte es la relacin entre las variables? En otras palabras, estn estrechamente o slo levemente relacionadas? (3) La relacin entre las variables es positiva o negativa? (4) Cul es la relacin causal entre las variables? El coeficiente de Pearson no entrega respuestas a tres de estas cuatro preguntas: (1) sobre la pregunta uno, nos indica si dos variables parecen estar correlacionadas o no; (2) con respecto a la pregunta dos, el coeficiente de Pearson indica la fuerza de la aparente relacin; y (3) el coeficiente, por ltimo, nos indica si la aparente relacin es positiva o negativa. Como ya sabemos, el anlisis de correlacin no puede responder a la ltima pregunta.

El coeficiente de correlacin de Pearson (r) se mide en una escala de 0 a 1, tanto en direccin positiva como negativa. Un valor de 0 indica que no hay relacin lineal entre las variables. Un valor de 1 o 1 indica, respectivamente, una correlacin positiva perfecta o negativa perfecta entre dos variables. Normalmente, el valor de se ubicar en alguna parte entre 0 y 1 o entre 0 y 1. En las ciencias sociales en general y en educacin en particular, donde la mayora de las variables son simultneamente afectadas por una gran multitud factores, una correlacin positiva de 0,7 o una correlacin negativa de 0,7 se considera muy fuerte. (Por ltimo, tenga en mente el coeficiente de Pearson mide slo relaciones lineales entre variables, y no es til para medir relaciones que no son lineales.)Cuadro 15. El coeficiente de Pearson de correlacin.Valor delCoeficiente de PearsonGrado de Correlacinentre las Variables

r = 0Ninguna correlacin

r = 1Correlacin positiva perfecta

0 < r < 1Correlacin positiva

r = -1Correlacin negativa perfecta

-1 < r < 0Correlacin negativa

Ntese que una correlacin negativa no es menos fuerte que una correlacin positiva. As, por ejemplo, un de 0,5 es tan grande o fuerte como un de 0,5. Los signos positivos y negativos slo indican si el valor de una variable aumenta o disminuye, respectivamente, con el aumento en el valor de la otra variable. Como usted sabe, cuando los aumentos (disminuciones) de una variable producen aumentos (disminuciones) en la otra, la relacin es positiva. Es negativa cuando los aumentos (disminuciones) de una variable producen disminuciones (aumentos) en la otra.

Segn su opinin, las calificaciones profesionales de los maestros estn correlacionadas en forma positiva o negativa con el rendimiento de los estudiantes? Qu sucede con el tamao de la clase? Y el gasto en educacin?