25
1) ASIMETRÍA Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico. 1.1) TIPOS DE ASIMETRÍA La asimetría presenta las siguientes formas: Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría. Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en símbolos Md=Mo Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda. También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en símbolos 1.2) MEDIDAS DE ASIMETRÍA Coeficiente de Karl Pearson Donde: = media aritmética. Md = Mediana. s = desviación típica o estándar. Nota: El Coeficiente de Pearson varía entre -3 y 3 Si As < 0 ? la distribución será asimétrica negativa. Si As = 0 ? la distribución será simétrica.

probabelidad

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

Page 1: probabelidad

1) ASIMETRÍAEs una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.1.1) TIPOS DE ASIMETRÍALa asimetría presenta las siguientes formas:Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda,

en símbolos Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su

media aritmética, su mediana y su moda son iguales, en símbolos  Md=MoAsimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda,

en símbolos 

1.2) MEDIDAS DE ASIMETRÍACoeficiente de Karl Pearson

Donde:

= media aritmética.Md = Mediana.s = desviación típica o estándar.Nota:El Coeficiente de Pearson varía entre -3 y 3Si As < 0 ? la distribución será asimétrica negativa.Si As = 0 ? la distribución será simétrica.Si As > 0 ? la distribución será asimétrica positiva.Medida de Yule Bowley o Medida Cuartílica

Donde:

= Cuartil uno;  = Cuartil dos = Mediana;  = Cuartil tres.Nota:La Medida de Bowley varía entre -1 y 1Si As < 0 ? la distribución será asimétrica negativa.Si As = 0 ? la distribución será simétrica.

Page 2: probabelidad

Si As > 0 ? la distribución será asimétrica positiva.Medida de FisherPara datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Donde:

= cada uno de los valores; n = número de datos;  = media aritmética; f = frecuencia absoluta

= cubo de la desviación estándar poblacional; xm = marca de claseNota:Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativaSi As = 0 ? la distribución será simétricaSi As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positivaEjemplo ilustrativo:Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisher dada la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17Solución:Calculando la media aritmética se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviación estándar muestral se obtiene:

Calculando el Coeficiente de Pearson se obtiene:

Page 3: probabelidad

Calculando la Medida de Bowley se obtiene

Calculando la desviación estándar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene

Datos

6 -166,375

9 -15,625

9 -15,625

12 0,125

12 0,125

12 0,125

15 42,875

17 166,375

Total 12

Los cálculos en Excel se muestran en la siguiente figura:

Page 4: probabelidad

Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la Medida de Fisher

2) CURTOSIS O APUNTAMIENTOLa curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.2.1) TIPOS DE CURTOSISLa curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:Leptocúrtica.- Existe una gran concentración.Mesocúrtica.- Existe una concentración normal.Platicúrtica.- Existe una baja concentración.

2.2) MEDIDAS DE CURTOSISMedida de FisherPara datos sin agrupar se emplea la siguiente fórmula:

Page 5: probabelidad

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Donde:  = cada uno de los valores; n = número de datos;  = media aritmética;  = Cuádruplo de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca de claseNota:Si a < 3 ? la distribución es platicúticaSi a = 3 ? la distribución es normal o mesocúrticaSi a > 3 ? la distribución es leptocúrticaMedida basada en Cuartiles y Percentiles

(letra griega minúscula kappa) = Coeficiente percentil de curtosisNota:

Si  < 0,263 ? la distribución es platicúrtica

Si = 0,263 ? la distribución es normal o mesocúrtica

Si  > 0,263 ? la distribución es leptocúrticaEsta medida no es muy utilizada.Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.Solución: Calculando la media aritmética se obtiene

Calculando la desviación estándar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene:

Datos

6 915,0625

9 39,0625

9 39,0625

12 0,0625

12 0,0625

12 0,0625

15 150,0625

17 915,0625

Total 2058,5

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

Page 6: probabelidad

6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil tres se obtiene:

Calculando el percentil 90 se tiene:

Calculando el percentil 10 se tiene:

Calculando el coeficiente percentil de curtosis se obtiene:

Como a= 2,23 y  la distribución es platicúrticaLos cálculos en Excel se muestran en la siguiente figura:

Page 7: probabelidad

Leer más: http://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-forma-asimetria-curtosis.shtml#ixzz473IfYOxv

++

Page 8: probabelidad

Medidas de tendencia central: Media, Mediana, ModaSupóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones.

En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos.

Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.

Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo el alumno  fue de 20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente, debido a que se ubicaría muy por debajo del promedio de la clase.

En resumen, el propósito de las medidas de tendencia central es:

Mostrar en qué lugar se ubica la persona promedio o típica del grupo.

Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.

Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.

Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.

Las medidas de tendencia central más comunes son:

La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.

La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos).

La media es considerada como la mejor medida de tendencia central, por las siguientes razones:

Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.

Es la medida de tendencia central más conocida y utilizada.  

Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian.

La media se utiliza en procesos y técnicas estadísticas más complejas mientras que la mediana y la moda en muy pocos casos.

Cómo calcular, la media, la moda y la mediana

Media aritmética  o promedio

El promedio de notas es muy importante.

La media, el mejor dato.

Page 9: probabelidad

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Ejemplo 1:

En matemáticas, un alumno tiene las siguientes notas:  4, 7, 7, 2, 5, 3

n = 6 (número total de datos)

La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.

Ejemplo 2:

Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta

5 10 5          .       10  =   50

6 15 6          .        15 =   90

7 20 7          .        20 =  140

8 12 8          .        12 =    96

9 6 9            .          6 = 54

Frecuencia total = 63

430

 

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.

                  5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

               20, 12, 14, 23, 78, 56, 96

Page 10: probabelidad

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.

Mediana (Med)

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución.

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.

Según el número de valores que se tengan se pueden presentar dos casos:

Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.

Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos:  5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:  1, 2, 4,  5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Ejemplo 2: 

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.

     21, 19, 18, 15,  13, 11, 10, 9, 5, 3

          

Ejemplo 3:

                  

 

Interpretando el gráfico de barras podemos deducir que:

Page 11: probabelidad

 5 alumnos obtienen puntaje de 62

5 alumnos obtienen puntaje de 67

8 alumnos obtienen puntaje de 72

12 alumnos obtienen puntaje de 77

16 alumnos obtienen puntaje de 82

4 alumnos obtienen puntaje de 87

lo que hace un total de 50 alumnos

Sabemos que la mediana se obtiene haciendo

 lo cual significa que la mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

 

puntaje alumnos

62 1

62 2

62 3

62 4

62 5

67 6

67 7

67 8

67 9

67 10

72 11

72 12

72 13

72 14

72 15

72 16

72 17

72 18

77 19

Page 12: probabelidad

77 20

77 21

77 22

77 23

77 24

77 25

77 26

77 27

77 28

77 29

77 30

82 31

82 32

82 33

82 34

82 35

82 36

82 37

82 38

82 39

82 40

82 41

82 42

82 43

82 44

82 45

82 46

87 47

87 48

Page 13: probabelidad

87 49

87 50

 

La medidas de centralización  nos indican en torno a qué valor (centro) se distribuyen los datos.

La medidas de centralización  son:

Moda

Page 14: probabelidad

La moda  es el valor  que tiene mayor frecuencia

absoluta .

Se representa por Mo .

Se puede hallar la moda  para variables

cualitativas  y cuantitativas .

Hallar   la moda  de la distribución:

2, 3, 3, 4, 4, 4, 5, 5  Mo= 4

Si en un grupo hay dos o varias puntuaciones  con la misma frecuencia  y esa frecuencia es la máxima, la distribución  es bimodal  o multimodal , es decir, t iene varias modas .

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando todas las puntuaciones  de un grupo tienen la misma frecuencia ,  no  hay moda .

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes  t ienen la frecuencia

máxima , la moda  es el  promedio  de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Page 15: probabelidad

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

L i  es el l ímite inferior de la clase modal.

f i  es la frecuencia absoluta de la clase modal.

f i - - 1  es la frecuencia absoluta inmediatamente inferior a la en clase modal.

f i -+1  es la frecuencia absoluta inmediatamente posterior a la clase modal.

a i  es la amplitud de la clase.

También se uti l iza otra fórmula  de la moda  que da un valor aproximado  de ésta:

Ejemplo

Calcular   la moda  de una distribución estadística que viene dada por la siguiente tabla:

f i

Page 16: probabelidad

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

Page 17: probabelidad

La fórmula  de la moda aproximada  cuando existen distintas amplitudes es:

Ejemplo

En la siguiente tabla se muestra las calif icaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos.  Calcular la moda .

f i h i

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50

Page 18: probabelidad

Mediana

Es el valor  que ocupa el   lugar central  de todos los datos  cuando éstos están ordenados de menor a mayor .

La mediana  se representa por Me .

La mediana  se puede hallar  sólo para variables

cuantitativas .

Cálculo de la mediana

1 Ordenamos   los datos  de menor a mayor .

2 Si la serie tiene un número impar de

medidas   la mediana  es la puntuación central  de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie tiene un número par  de puntuaciones

la mediana  es la media  entre las dospuntuaciones

centrales .

7, 8, 9, 10, 11, 12Me= 9.5

Cálculo de la mediana para datos agrupados

Page 19: probabelidad

La mediana  se encuentra en el   intervalo  donde la frecuencia acumulada   l lega hasta la mitad de la suma

de las frecuencias absolutas .

Es decir tenemos que buscar el intervalo en el que se

encuentre  .

L i  es el l ímite inferior de la clase donde se encuentra la mediana.

 es la semisuma de las frecuencias absolutas.

F i - 1  es la frecuencia acumulada  anterior a la clase mediana.

a i  es la amplitud de la clase.

La mediana  es  independiente  de las amplitudes  de los  intervalos .

Ejemplo

Calcular   la mediana  de una distribución estadística que viene dada por la siguiente tabla:

f i F i

Page 20: probabelidad

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

100

100 / 2 = 50

Clase modal: [66, 69)

Media aritmética

La media aritmética  es el valor  obtenido al sumar  todos los datos  y dividir  el resultado entre elnúmero  total de datos .

 es el símbolo de la media aritmética .

Page 21: probabelidad

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmética para datos agrupados

Si los datos  vienen agrupados  en una tabla de frecuencias, la expresión de la  media  es:

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla.  Calcula la

puntuación media .

x i f i x i · f i

Page 22: probabelidad

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

Propiedades de la media aritmética

1 La suma  de las desviaciones  de todas las

puntuaciones de una distribución respecto a lamedia  de la misma igual a cero .

Page 23: probabelidad

Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =

= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2 La media aritmética  de los cuadrados  de

las desviaciones de los valores de la variable con respecto a un número  cualquiera se hace mínima  cuando dicho número  coincide con la media aritmética .

3 Si a todos los valores de la variable se les  suma  un

mismo número , la media aritmética  quedaaumentada  en dicho número .

4 Si todos los valores de la variable se  multiplican  por

un mismo número   la media

aritméticaqueda multiplicada  por dicho número .

Observaciones sobre la media aritmética

1 La media  se puede hallar  sólo para variables

cuantitativas .

2 La media  es  independiente  de las amplitudes  de

los  intervalos .

Page 24: probabelidad

3 La media  es muy sensible a las puntuaciones

extremas . Si tenemos una distribución con los siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media  es igual a 74 kg, que es una medida de

centralización  poco representativa de la distribución.

4 La media  no se puede calcular si hay un intervalo con

una amplitud indeterminada .

x i f i

[60, 63) 61.5 5

[63, 66) 64.5 18

[66, 69) 67.5 42

[69, 72) 70.5 27

[72, ∞ ) 8

100

En este caso no es posible hallar la  media  porque no podemos calcular la marca de clase  de último intervalo.

Page 25: probabelidad