25
CONCEPTOS BASICOS ESTADISTICA Es la parte de las matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. La estadística recolecta, organiza, presenta, analiza e interpreta. TIPOS DE ESTADISTICA Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población.

Trabajo de Matematica Estadistica

Embed Size (px)

DESCRIPTION

ESTADISTICA

Citation preview

Page 1: Trabajo de Matematica Estadistica

CONCEPTOS BASICOS

ESTADISTICA Es la parte de las matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población.

La estadística recolecta, organiza, presenta, analiza e interpreta.

TIPOS DE ESTADISTICA

Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población.

Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población.

Page 2: Trabajo de Matematica Estadistica

POBLACION

Es el conjunto de todos los valores de un fenómeno o propiedad que se quiere observar.

También se usa el nombre de variable para designar a este conjunto.

Por ejemplo, las edades de los escolares de enseñanza media del país, las preferencias de marca

de jabón manifestadas por un conjunto de consumidores, los diámetros de los ejemplares de un

objeto producido por una máquina, etc.

TIPOS DE ESTADISTICA

ESTADISTICA DESCRIPTIVA ESTADISTICA INFERENCIAL

Se ocupa de la colección y clasificación de información, de su resumen en cuadros y gráficos adecuados que resuman en forma apropiada la información captada.

Se ocupa de los procesos de estimación, análisis y prueba de hipótesis con el propósito de llegar a conclusiones que brinden una adecuada base científica para la toma de decisiones tomando como base la información captada por la muestra.

Page 3: Trabajo de Matematica Estadistica

MUESTRA

Es la parte de la población que efectivamente se mide, con el objeto de obtener información

acerca de toda la población. La selección de la muestra se hace por un procedimiento que

asegure en alta grado que sea representativa de la población.

La muestra es una herramienta de la investigación científica, cuya función básica es determinar

que parte de la población debe examinarse, con la finalidad de hacer inferencias sobre dicha

población.

Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y

diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Los errores más comunes que se pueden cometer son:

1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la

Población, se denomina error de muestreo.

2.- Hacer conclusiones hacia una población mucho más grandes de la que originalmente se

tomó la muestra. Error de Inferencia.

TIPOS DE MUESTREO

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en

general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y

métodos de muestreo no probabilísticos.

Page 4: Trabajo de Matematica Estadistica

MUESTREO PROBABILISTICO: Son aquellos que se basan en el principio de

equiprobabilidad, es decir, aquellos en los que todos los individuos tienen la misma

probabilidad de ser elegidos para formar parte de una muestra.

MUESTREO NO PROBABILISTICO: Este tipo de muestra no tiene la certeza de que la

muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la

misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo

determinados criterios procurando, en la medida de lo posible, que la muestra sea

representativa.

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

CARACTERISTICAS VENTAJAS INCONVENIENTES

Aleatorio simple

Se selecciona una muestra

de tamaño n de una

población de N unidades,

cada elemento tiene una

probabilidad de inclusión

igual y conocida de n/N.

Sencillo y de fácil comprensión.

Cálculo rápido de medias y varianzas.

Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos

Requiere que se posea de

antemano un listado

completo de toda la

población. Cuando se

trabaja con muestras

pequeñas es posible que no

represente a la población

adecuadamente.

Sistemático

Conseguir un listado de los N elementos de la poblaciónDeterminar tamaño muestral n.Definir un intervalo k= N/n.Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio).Seleccionar los elementos de

la lista.

Fácil de aplicar. No siempre es

necesario tener un listado de toda la población.

Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.

Requiere que se posea de

antemano un listado

completo de toda la

población. Cuando se

trabaja con muestras

pequeñas es posible que no

represente a la población

adecuadamente.

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés.

Tiende a asegurar que la muestra represente

Se ha de conocer la distribución en la población de las

Page 5: Trabajo de Matematica Estadistica

Estratificado

Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.

adecuadamente a la población en función de unas variables seleccionadas.

Se obtienen estimaciones más precisa

Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que las variables estratificadoras se refiere.

variables utilizadas para la estratificación

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietápico)La necesidad de listados de

las unidades de una etapa se

limita a aquellas unidades de

muestreo seleccionadas en la

etapa anterior.

Es muy eficiente cuando la población es muy grande y dispersa.

No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.

El error estándar es mayor que en el muestreo aleatorio simple o estratificado.

El cálculo del error estándar es complejo.

VARIABLES

Es una característica observable que varía entre los diferentes individuos de una población. La

información que disponemos de cada individuo es resumida en variables.

Las variables representan y sintetizan conceptualmente las propiedades o características de las

unidades de análisis, a las cuales se les pueden adjudicar distintos valores numéricos

Clasificación de las variables estadísticas: cualitativas y cuantitativas

(Discretas y continuas).

Hemos visto que un carácter estadístico es una propiedad que permite clasificar a los individuos

de la población.

Page 6: Trabajo de Matematica Estadistica

Hay dos tipos:

Caracteres estadísticos cuantitativos:

Se dice que un carácter estadístico es cuantitativo cuando sus modalidades son medibles

(expresables como números y cumpliendo unas propiedades de medida.). Ejemplos: peso, talla,

pulso, edad, etc.

Caracteres estadísticos cualitativos:

Se dice que un carácter estadístico es cualitativo cuando sus modalidades no pueden ser

medidas. Ejemplos: raza, sexo, profesión, estado civil, etc.

Nota: Es evidente, por ejemplo, que si el carácter es el estado civil, podíamos asignarle a sus

modalidades los siguientes números: A los casados 1, solteros 0, viudos un 2, etc., pero este

carácter no es medible en el sentido de que el 1>0 por ejemplo, expresión que no tiene sentido.

Ejemplos:

La profesión es un carácter cualitativo.

Dentro del podemos tener modalidades: profesor, peón, abogado, etc.

Lo anterior determina un atributo que puede ser observado pero no medido. Podemos contar el

número de abogados o profesores, pero no medirlos. En cambio, un carácter cuantitativo

determina una variable que llamaremos variable estadística. Atributos: se le suele llamar a las

variables cualitativas.

La talla es un carácter cuantitativo. Es por lo tanto una variable estadística que podemos medir,

puede tomar diversos valores: 1.60, 1.62,......., 1.92,....etc.

Las variables estadísticas cuantitativas pueden ser: continuas o discretas.

Discreta: es aquella que solo puede tomar un número finito o infinito numerable de valores.

Dicho con otras palabras: cuando no puede tomar cualquier valor entre dos valores dados. O

bien solo toma valores aislados, generalmente enteros.

Page 7: Trabajo de Matematica Estadistica

Ejemplo: el número de libros en una estantería, las tiradas de un dado, el número de pétalos de

una flor, etc.

Continua: cuando puede tomar, al menos teóricamente, todos los valores posibles dentro de un

cierto intervalo de la recta real.

Ejemplo: la temperatura de los enfermos entre 35 y 40 grados, aunque en la práctica sea

imposible medir temperaturas aproximando hasta la cuarta o quinta cifra decimal. En la

práctica son variables estadísticas continuas aquellas que fijamos como suceso elemental las

que entren en un intervalo.

DATOS NO AGRUPADOS

Son datos recolectados, normalmente en una cantidad pequeña, los cuales se analizan tal y como fueron recolectados, es decir, que no se cuentan o clasifican para analizarse.

Media Aritmética:

Medida de tendencia central usualmente llamada promedio, se define como la división de la

suma de todos los valores entre el número de datos.

 El promedio aritmético de un conjunto de valores (x1 x2 x3 x4 … xn) es:

x = ∑i=1

n

X i

n =

x1+ x2+ x3 + x4 +…+ xn

n

Page 8: Trabajo de Matematica Estadistica

Ejercicios:

1. Un cazador sale durante cinco noches a los faldeos de un cerro y diariamente trae, el siguiente número de conejos: 15, 17, 13, 18, 17. Luego, la media aritmética del número de conejos cazados diariamente es:

Solución

La media aritmética o promedio es:

x=15+17+13+18+17

5=80

5=16

2. La media aritmética del siguiente grupo de datos 7, 20 13, 14, 6, 9, 1 es :

Solución

x=7+20+13+14+6+9+1

7=70

7=10

3. El promedio aritmético de los siguientes puntajes: 12, 15, 23, 18, 32, 48, 9 es:

Solución

x=12+15+23+18+32+48+97

=1577

=22.4

4. Se sabe que el promedio del siguiente grupo de datos 2, 4, 6, 8, x es 10. ¿cuál es el valor de “X”?

Solución

Page 9: Trabajo de Matematica Estadistica

10=2+4+6+8+x5

=20+ x5

50=20+x→ x=30

5. La media entre cinco datos es 5 y se sabe que los cuatro primeros son: 4, 3, 9 y 7, entonces, el dato que falta es:

Solución

5=4+3+9+7+x5

=23+x5

25=23+x→ x=2

Mediana:

Es el valor que ocupa la posición central de un conjunto de datos, los cuales han sido

previamente ordenados, ya sea de manera creciente o decreciente.

La ubicación de la mediana de n datos ordenados se determina por:

n+12

Ejemplos:

Cuando la cantidad de datos es impar.

Determine la mediana de los siguientes datos:

6; 5; 9; 10; 15; 7; 12

Solución

Ordenamos los datos de forma creciente

5; 6; 7; 9; 10; 12; 15 ubicacion mediana→7+1

2=4

Me = 9

Cuando la cantidad de dato es par.

Page 10: Trabajo de Matematica Estadistica

Determine la mediana de los siguientes datos:

10; 13; 11; 9; 20; 7; 6; 4; 18; 16

Solución

Ordenamos en forma creciente

4; 6; 7; 9; 10; 11; 13; 16; 18; 20 ubicacionmediana→10+1

2=5.5

Me=10+112

=10.5

Moda

La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos 

con mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda

para un conjunto de datos. La notación más frecuente es la siguiente: Mo y x̂ . Esta medida se

puede aparecer tanto para datos cualitativos como cuantitativos.  Se dice que cuando un

conjunto de datos tiene una moda la muestra es unimodal,  cuando tiene dos modas bimodal,

cuando  la muestra contiene más de un dato repetido se dice que es multimodal y un último

caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es

amodal.

Es el valor, clase o categoría que ocurre con mayor frecuencia y sus características son:

- Puede no existir o existir más de una moda

- Su valor no se ve afectado por los valores extremos en los datos

- Se utiliza para analizar tanto la información cualitativa como la cuantitativa

- Es una medida “inestable” cuando en número de datos es reducido.

Ejemplos:

1.- Determinar  la moda del siguiente conjunto de datos:

Page 11: Trabajo de Matematica Estadistica

v v v v

a) 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3

La moda de este conjunto de datos es igual a 3 y si considera unimodal

b) 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3 

Las  modas de este conjunto de datos son 3 y 4  ya que ambas tienen la más alta frecuencia, por

lo que la muestra  es bimodal

c) 1, 2, 3, 4, 5, 6, 7, 8, 9

La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.

Gráficamente eso se puede reflejar mediante el análisis de un histograma de frecuencias.

DATOS AGRUPADOS

UNIMODAL BIMODAL AMODAL

Page 12: Trabajo de Matematica Estadistica

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentra

ordenada en clases y con la frecuencia de cada clase; es decir, los datos originales de varios

valores adyacentes del conjunto se combinan para formar un intervalo de clase.

Su fin es resumir la información.

Generalmente, los elementos son de mayor tamaño, por lo cual requieren ser agrupados,

esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias.

Se agrupa a los datos, si se cuenta con 20 o más elementos. Aunque contemos con más

de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la

información sea “repetitiva”, también debemos de verificar que los datos puedan

clasificarse. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se

nos está pidiendo). Una vez que ya hemos ordenado y clasificado, presentaremos la

información obtenida mediante una “tabla de frecuencias”.

La agrupación de los datos puede ser simple o mediante intervalos de clase.

Media

Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y

su resultado dividirlo por el número total de datos:

Page 13: Trabajo de Matematica Estadistica

Ejemplo:

1. Edad de los estudiantes de Topografía SENCICO

Clase Frecuencia (f) Punto Medio (X) f .X

17 – 19 71 18 1278

19 – 21 50 20 1000

21 – 23 41 22 902

23 – 25 53 24 1272

25 – 27 23 26 598

n = 238 ∑ ¿5050

❑X

−¿=∑ fX

n→

5050238

=21.22 años¿

Se determina que la media de las edades de los estudiantes de topografía es de 21.22 años.

2. En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la

tabla. Calcula la puntuación media

Clase Frecuencia (f) Punto Medio (X) f .X

Page 14: Trabajo de Matematica Estadistica

10 – 20 1 15 15

20 – 30 8 25 200

30 – 40 10 35 350

40 – 50 9 45 405

50 – 60 8 55 440

60 – 70 4 65 260

70 – 80 2 75 150

n = 42 ∑ ¿1820

❑X

−¿=∑ fX

n→

182042

=43.33 ¿

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor

a mayor. 

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

 

Cálculo de la mediana para datos agrupados

Page 15: Trabajo de Matematica Estadistica

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de

la suma de las frecuencias absolutas. 

Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2

 

Ejemplo:

1. Distribución de 250 personas según su edad, que utilizan el servicio de Windows Live

Messenger.

Edades Frecuencia FA

5 – 10 11 11

10 – 15 23 34

15 – 20 61 95

20 – 25 60 155

25 – 30 45 200

30 – 35 20 220

40 – 45 15 235

50 - …. 15 250

n = 250

Localización: n2

→250

2→125

Mediana=L+

n2−FA

f(i )

Mediana=20+

2502

−95

60(5 ) →22.5 años

2. Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

Page 16: Trabajo de Matematica Estadistica

N Frecuencia FA

60 – 63 5 5

63 – 66 18 23

66 – 69 42 65

69 – 72 27 92

72 – 75 8 100

n = 100

Localización: n2

→100

2→50

Mediana=L+

n2−FA

f(i )

Mediana=66+

1002

−23

42(3 ) →67.93

Moda

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos

agrupados, hablaremos de intervalo modal. 

La moda se representa por  Mo.

Page 17: Trabajo de Matematica Estadistica

Mo=li+(D1

D1+D2

) A i

Dónde:

Li: Limite inferior de la clase modal .

D1 :esel delta de frecuencia absolutamodal y la frecuencia absoluta premodal .

D2 :esel delta de frecuencia absolutamodal y la frecuencia absoluta postmodal .

Ai :amplitud delintervalo modal .

 

Ejemplo:

1. Determinar la Moda, a partir de la tabla presentada.

EdadMarca

clase (x i)Frecuencia

absoluta (f i)Frecuencia

acumulda (f i)10 – 20 15 8 820 – 30 25 20 2830 – 40 35 14 4240 – 50 45 8 5050 – 60 55 2 5260 – 70 65 2 5470 – 80 75 1 55

n = 55

Mo=li+( D 1

D1+D2)A i li=20

D1=20−8=12

Page 18: Trabajo de Matematica Estadistica

D2=20−14=6

Ai=10

Mo=20+( 1212+6 )10 →26.66

Ejercicios resueltos de media, moda y mediana

1. Sea una distribución estadística que viene dada por la siguiente tabla

Datos(X i)

FrecuenciaAbsoluta¿)

61 564 1867 4270 2773 8

100

Calcular la media, mediana y moda

Solución: Primero se calcula las columnas de: x i . f i y de las frecuencias acumuladas FA.

Datos(X i)

FrecuenciaAbsoluta¿)

x i . f iFrecuencia

acumulada FA

61 5 305 564 18 1152 2367 42 2814 6570 27 1890 9273 8 584 100

100 6745Calculamos la media o promedio

Page 19: Trabajo de Matematica Estadistica

X

−¿=∑ fX

n→

6745100

=67.45 ¿

Calculamos la mediana

Para calcular la mediana Me, usamos la expresión n+1

2

n+12

→100+1

2→50.5

Me = 67

Como se sabe que la moda es el dato que más se repite por lo tanto Mo = 67.