41
ESTADÍSTICA ESTADÍSTICA DESCRIPTIVA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA

Embed Size (px)

DESCRIPTION

ESTADÍSTICA DESCRIPTIVA. ESTADÍSTICA DESCRIPTIVA. Los orígenes de la estadística, aunque no se sabe con exactitud cuándo se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 años, aproximadamente. - PowerPoint PPT Presentation

Citation preview

ESTADÍSTICA ESTADÍSTICA DESCRIPTIVADESCRIPTIVA

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

• Los orígenes de la estadística, aunque no se sabe con exactitud cuándo se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 años, aproximadamente.

• Sin duda, fueron los romanosromanos, maestros de la organización política, quienes mejor supieron ocupar la estadística. Cada cinco años realizaban un censo de la población, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales para estudiar los avances del imperio; sin olvidar los recuentos de ganancias y las riquezas que dejaban las tierras.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

• Para poder comprender mejor este tipo de estudio es importante que conozcas los siguientes términos básicos:

Población: Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una característica en común.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAMuestra: Es un subconjunto cualquiera de la población; es importante escoger la muestra en forma aleatoria (al azar), pues así se logra que sea representativa y se puedan obtener conclusiones más a fines acerca de las características de la población.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Todo estudio estadístico debe considerar diferentes tipos de variables:

VariablesVariables

Variables cualitativasVariables Cuantitativas

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Variables cualitativas: Relacionadas con características no numéricas de un individuo (por ejemplo: atributos de una persona, nacionalidad, color de la piel, sexo).

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAVariables Cuantitativas: Relacionadas con características numéricas del individuo por ejemplo: edad, precio de un producto, ingresos anuales. Las variables cuantitativas se dividen en discretas (aquellas que pueden tomar solo algunos valores en un intervalo y no valores intermedio, ejemplo: edad, número de hermanos que puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45) o continuas (aquellas que pueden tomar cualquier valor en un intervalo real, ejemplo: alturas, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.).

Estadística Descriptiva: Es la parte de la estadística que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas

que se relacionan con el resumen y la descripción de datos numéricos. Estos datos pueden ser gráficos o pueden incluir análisis computacional.

Estadística Inferencial: Cuando una muestra es representativa de una

población se pueden deducir importantes conclusiones acerca de esta, a partir de su análisis. La inferencia estadística comprende aquellas técnicas por

medio de las cuales se toma decisiones sobre una población estadística basadas solo en la muestra observada. Debido a que dichas decisiones se

toman en condiciones de incertidumbre, entonces estas serán confiables con cierto grado de probabilidad. Considerando que las características medidas de una muestra se denominan estadísticas de la muestra, las características

medidas de una población estadística, o universo se llaman parámetros de la población.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAOrdenando la Información

Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuántos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

¿Para qué se construyen las ¿Para qué se construyen las tablas de frecuencias ?tablas de frecuencias ?

1.1. ORDENARORDENAR

2.2. AGRUPARAGRUPAR

3.3. RESUMIR informaciónRESUMIR información

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEl formato general de una tabla estadística , llamada también TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es la siguiente:

Nombre de la variable

Frecuencia

Categorías o

Recorrido de la variable

Frecuencias

Observadas

TOTAL n

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEn la siguiente tabla se presenta el motivo de la consulta médica, durante una semana.

Motivo Consulta Número de pacientes

Bronquitis 19

Otitis 13

Heridas 7

Fracturas 18

Vacunas 20

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

TIPOS DE FRECUENCIAS

a)a) Frecuencia o Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una variable. Se representa por fi. 

b) Frecuencia Relativa: La frecuencia relativa se puede expresar en términos de porcentaje o de proporción y se representa por fr. (Es la razón entre la frecuencia absoluta y el total de datos)

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos 24 alumnos en un trabajo de matemáticas:

3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0 5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0 3,2 6,0 4,2 5,0 5,6 5,0

Ordenemos estos datos en una tabla:Ordenemos estos datos en una tabla: Anota en tu cuaderno una tabla de frecuencias que considere• Nombre de variable: NotasNombre de variable: Notas• Frecuencia AbsolutaFrecuencia Absoluta• Frecuencia relativa (ambas)Frecuencia relativa (ambas)Si tu resultado es un decimal, usa 3 dígitos Si tu resultado es un decimal, usa 3 dígitos después de la comadespués de la coma

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

NotaNota Frecuencia Frecuencia AbsolutaAbsoluta

Frecuencia Frecuencia RelativaRelativa

Frecuencia Relativa Frecuencia Relativa Porcentual (%)Porcentual (%)

2,82,8

3,23,2

3,93,9

4,24,2

5,05,0

5,65,6

6,06,0

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

NotaNota Frecuencia Frecuencia AbsolutaAbsoluta

Frecuencia Frecuencia RelativaRelativa

Frecuencia Relativa Frecuencia Relativa Porcentual (%)Porcentual (%)

2,82,8 1 0,041 4,166

3,23,2 4 0,166 16,666

3,93,9 3 0,125 12,500

4,24,2 5 0,208 20,833

5,05,0 4 0,166 16,666

5,65,6 3 0,125 12,500

6,06,0 4 0,166 16,666

¿Qué conclusiones puedes obtener de la tabla anterior?¿Qué conclusiones puedes obtener de la tabla anterior?

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Hasta el momento sólo hemos trabajado con una pequeña cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos muchos datos?

Tabla de Frecuencias de datos agrupados (tambien llamadas tabla de frecuencias con clase)

En ocasiones, el agrupar los datos en intervalosintervalos, nos puede ayudar para realizar un mejor análisis de ellos.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVADefiniciones:•Rango: Diferencia entre el máximo y el mínimo valor de una variable.

•Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de éste.

•Tamaño de un intervalo: Es el cuociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cuociente obtenido.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAPara estas tablas debemos considerar cada intervalo con límites cerrado y abierto, o sea [ - [La tabla siguiente la vamos a elaborar con: frecuencias absolutas: estas frecuencias son las que se obtienen directamente del conteofrecuencias relativas: corresponden a los porcentajes de cada frecuencia absoluta.frecuencia absoluta acumulada: corresponde a la frecuencia absoluta del intervalo más la suma de las frecuencias absolutas de todos los valores anteriores.frecuencia relativa acumulada: corresponde al porcentaje de la frecuencia relativa del intervalo más la suma de las frecuencias relativas de todos los valores anteriores.

Nivel de colesterol en la sangre de una muestra de hombres estadounidenses que tienen entre 25 y 34 años de edad , que fueron atendidos en centros médicos de New York y sufren de hipertensión arterial , en el año 2001

Nivel de Colesterol (mg/100 ml) Cantidad de hombres

80-120 13

120-160 15

160-200 44

200-240 29

240-280 9

¿Cuál es la variable de interés?

¿Qué se mide?

Observa: El rango de cada intervalo es de 40.Observa: El rango de cada intervalo es de 40.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEjemplo:Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de Cuarto año de Educación Media.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,921,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,771,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,711,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,761,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,761,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,751,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,751,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,761,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEstatura Mayor: 1,93 metrosEstatura Menor: 1,66 metrosRango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.

Formaremos 6 intervalos. Para calcular el tamaño de intervalo de cada uno dividimos 27 y 6, obteniendo finalmente 4,5 5Luego los intervalos de la tabla son:

Intervalo Marca de Clase Frecuencia Absoluta

1,65 – 1,69

1,70 – 1,74

1,75 – 1,79

1,80 – 1,84

1,85 – 1,89

1,90 – 1,94

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Representaciones Gráficas Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos. Existen múltiples tipos de gráficos, pero aquí trataremos solamente de los usados más frecuentemente, que son: gráfico de barras, gráfico de sectores o circular (pastel), histograma, polígono de frecuencias, la ojiva y el pictograma.

La información contenida en las tablas de La información contenida en las tablas de frecuencias resulta más accesible y fácil de frecuencias resulta más accesible y fácil de interpretar si se representan por medio de gráficos interpretar si se representan por medio de gráficos estadísticos.estadísticos.

GRÁFICOSGRÁFICOSGráficos estadísticos Gráficos estadísticos

Diagrama de barras

Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada.

GRÁFICOSGRÁFICOS

Histograma

Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus Áreas son iguales o proporcionales a sus frecuencias. Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable

GRÁFICOSGRÁFICOSPolígono de frecuencias

Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución.

GRÁFICOSGRÁFICOSDiagrama de sectores o gráfico circular

Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).

GRÁFICOSGRÁFICOSPictogramas

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee en forma aproximada.

Gráfico de líneas u ojiva

En este tipo de gráfico, al igual que el histograma y el polígono de frecuencias el objetivo es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar:  una serie o más series

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVAEjercicios: 1)Construya una tabla de frecuencia de los siguientes gráficos.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

DíasDías N° ArtículosN° Artículos Frecuencia Frecuencia RelativaRelativa

Frecuencia Frecuencia relativa relativa

porcentualporcentual

LunesLunes 33 0,1290,129 12,912,9

MartesMartes 5,25,2 0,2240,224 22,422,4

MiércolesMiércoles 4,84,8 0,2060,206 20,620,6

JuevesJueves 66 0,2580,258 25,825,8

ViernesViernes 4,24,2 0,1810,181 18,118,1

TotalTotal 23,223,2 0,9980,998 99,899,8

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

EdadEdad Frecuencia Frecuencia AbsolutaAbsoluta

Frecuencia Frecuencia RelativaRelativa

Frecuencia Frecuencia Relativa %Relativa %

20-24 6

24-28 5

28-32 3

32-36 2

Total 16

MEDIDAS DE RESUMENMEDIDAS DE RESUMEN

Entre las medidas que permiten Entre las medidas que permiten resumir información proveniente de resumir información proveniente de una población, podemos una población, podemos considerar las medidas de considerar las medidas de posición, medidas de dispersión y posición, medidas de dispersión y medidas de forma.medidas de forma.

Medidas de PosiciónTienen por objeto, obtener un valor Tienen por objeto, obtener un valor que resuma en sí todas las que resuma en sí todas las mediciones. La mayoría de ellas trata mediciones. La mayoría de ellas trata de ubicar el centro de la distribución, de ubicar el centro de la distribución, razón por la cual, se llaman razón por la cual, se llaman MEDIDAS DE TENDENCIA MEDIDAS DE TENDENCIA CENTRAL; estas son: Media, CENTRAL; estas son: Media, Mediana y Moda.Mediana y Moda.

MEDIDAS DE TENDENCIA CENTRAL

Media aritmética o promedio: Es una de las medidas de tendencia central de mayor uso. La media muestral se simboliza por y la media poblacional de denota por .

X

PROMEDIO PARA DATOS NO TABULADOSPROMEDIO PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,…, xn una muestra

de tamaño "n" de valores de la variable, se define la media aritmética de X como:

n

xxxxX n

.....321

n

xX

n

ii

1

PROMEDIO PARA DATOS TABULADOSPROMEDIO PARA DATOS TABULADOS

Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los valores y se divide entre el total de casos.Sea X una variable estadística que toma los valores , con frecuencias absolutas , respectivamente, la media viene dada por:

n

ii

n

iii

n

nn

f

fx

fff

fxfxfxx

1

1

21

2211

...

...

Ejemplo N°1

Consideremos la edad en años de ocho personas

10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmética de la edad de estas personas está dada por:

87751232251810 x

Es decir la edad promedio de estas personas es de 14,5 años.

Mediana (Me)

Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de

tamaño n de observaciones de la variable, se define como Mediana "Me" un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones, cuando estas han sido ordenadas según magnitud.

MEDIANA PARA DATOS NO TABULADOS

Ejemplo: Consideremos la edad en años de ocho personas

10 18 25 32 12 5 7 7

Para calcular la mediana , previamente se deben ordenar las observaciones. En este caso lo haremos en forma creciente:

5 7 7 10 12 18 25 32

Como la cantidad de datos es par, entonces la mediana corresponde al promedio de los datos centrales, por lo tanto la mediana es 11.

MEDIANA PARA DATOS TABULADOSMEDIANA PARA DATOS TABULADOS

En casos de datos agrupado es un poco más complejo y requiere de la utilización de la siguiente fórmula

límite inferior de la clase mediana amplitud del intervalo número total de datos frecuencia absoluta acumulada de la clase anterior a la mediana frecuencia absoluta de la clase mediana

  

i

i

i f

FN

cLM12

iLcN 1iF

if

Moda o Modo (Mo) para datos no tabulados

La moda se identifica al observar el valor que se presenta con más frecuencia en la distribución.

Si consideramos el ejemplo del peso de una muestra de personas: 65 76 48 48 68 78 90 87 67 72 78

Mo = 48 kilos

Mo = 78 kilos.

Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.

Esta distribución es bimodal. Moda o Modo (Mo) para datos tabulados

Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la siguiente expresión:  límite inferior de la clase modal.amplitud de los intervalos.diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior.diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente.

Cuantiles La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que dividen los datos de la distribución en partes iguales. Los más usados son: Cuartiles:Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales. ( cuartil primero, cuartil segundo y cuartil tercero ) Quintiles:Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales. ( quintil primero,... ) Deciles:Nueve valores iguales que dividen la distribución en 10 partes iguales. ( decil primero,...) Percentiles: Noventa y nueve valores que dividen la serie en 100 partes iguales.( percentil primero,... ) El cálculo es análogo al de la mediana.