30
Tema 1: Introducción

Tema 1: Introducción

  • Upload
    lei

  • View
    55

  • Download
    0

Embed Size (px)

DESCRIPTION

Tema 1: Introducción. 1.1 Estadística Descriptiva. Conceptos generales. Medidas de centralización. Medidas de dispersión. Medidas de posición. Medidas de forma. 1. Conceptos generales. Estadística (“Estado”): parte de las Matemáticas que se encarga de RECOGER y ANALIZAR datos. - PowerPoint PPT Presentation

Citation preview

Page 1: Tema 1:  Introducción

Tema 1: Introducción

Page 2: Tema 1:  Introducción

1.1 Estadística Descriptiva

Page 3: Tema 1:  Introducción

1. Conceptos generales.2. Medidas de centralización.3. Medidas de dispersión.4. Medidas de posición.5. Medidas de forma.

Page 4: Tema 1:  Introducción

1. Conceptos generales.

Estadística (“Estado”): parte de las Matemáticas quese encarga de RECOGER y ANALIZAR datos.

MuestreoDiseño de experimentos

Estadística DescriptivaEstadística InferencialAnálisis MultivarianteRegresión…

Page 5: Tema 1:  Introducción

Muestra

POBLACION

Razones para tomar muestras: tiempo, dinero, accesibilidad, …

PARADOJICAMENTE, para conocer a la población nohace falta estudiar a TODA la población…

Page 6: Tema 1:  Introducción

        EN DOS SEMANAS RECORTA 4 PUNTOS

El PP se sitúa a dos puntos del PSOE en intención de voto, según una encuesta publicada en El PaísEl PP se encuentra a dos puntos del PSOE en intención directa de voto, según un sondeo del Instituto Opina que publica este domingo el diario El País. Agrega el periódico que el PP ha logrado recortar en dos semanas cuatro puntos en intención de voto respecto a los socialistas, quienes tenían un 44 por ciento de intención de voto, frente al 38 por ciento del PP, según la anterior encuesta de Opina, publicada el 25 de septiembre en ése mismo diario.

L D (Agencias) El sondeo publicado este domingo, hecho sobre una muestra de 1.300 entrevistas hechas desde el 4 al 6 de octubre en todo el territorio español, desvela que el PP gana dos puntos y el PSOE los pierde, "con lo que la diferencia se reduce drásticamente y supone la ventaja socialista más reducida desde las elecciones generales"..  Aunque los diarios La Vanguardia y El Periódico de Cataluña recogen otra encuesta que revela que el PSC y CiU mantienen un empate técnico, aunque en los porcentajes de intención de voto el PSC continuaría por delante. En ambas encuestas, tanto el presidente de la Generalidad, Pasqual Maragall, como el líder de la oposición, Artur Mas, mejoran sustancialmente su valoración respecto a encuestas anteriores, aunque Maragall saca 19,3 puntos en la pugna por la presidencia de la Generalidad. Así, la encuesta de La Vanguardia elaborada por el Instituto Noxa entre los días 3 y 6 de octubre a 1.000 entrevistados, otorga al PSC 44 escaños y una intención de voto del 32,5 por ciento, mientras que CiU pasaría de los actuales 46 escaños a 43 y mantendría una intención de voto del 29,2 por ciento. ERC mantendría su estatus de tercera fuerza política con 23 escaños, al igual que el PP, aunque según la encuesta crece la intención de voto respecto a las elecciones de 2003 y alcanza el 12,7 por ciento. ICV-EA también subiría y podría alcanzar los 10 escaños. Por su parte, la encuesta de El Periódico realizada durante los mismos días por la empresa Gesop a 800 entrevistados sitúa a PSC y CiU con un voto estimado del 32 por ciento en ambos casos, aunque la intención de voto directa otorga al PSC un 31,5 por ciento y a CiU un 22,3 por ciento.

Page 7: Tema 1:  Introducción

VARIABLE ESTADISTICA

Cuantitativas

Cualitativas

Discretas

Continuas

la cualidad que deseamos estudiaren la población

Page 8: Tema 1:  Introducción

• Intención de voto.• Número de hijos• Longitud del ala de un pájaro• Número de ejemplares de una especie en un continente.• Tiempo de recuperación de un ecosistema.• Número del despacho de distintos profesores.• …….

Page 9: Tema 1:  Introducción

La recogida de los datos se denomina muestreo. Tiposde muestreo: 1.- Muestreo aleatorio simple

-Todos los individuos tienen a priori la misma probabi- lidad de ser escogidos.- La selección de la muestra se realiza AL AZAR (para evitar sesgo)

2.- Muestreo estratificado

Se aplica cuando en la población se distinguen estratos que son relevantes para el estudio. Se escogenaleatoriamente individuos en cada estrato, proporcional-mente al tamaño del estrato.

Page 10: Tema 1:  Introducción

3.- Muestreo sistemático.

Se aplica cuando los individuos de la población apare-cen ordenados en una lista, de modo que individuos de características similares están próximos en ella.

Si se desea escoger a n individuos de una poblaciónde tamaño N, se determina el nº k más próximo a N/n,se escoge un individuo al azar de entre los k primeros,y los demás se escogen de la lista a partir del anterior,a intervalos regulares.

Page 11: Tema 1:  Introducción

4.- Muestreo polietápico o por conglomerados. Se divide previamente la población en unidades, siguien-do un cierto criterio, y se seleccionan aleatoriamente al-gunas de estas unidades. Sobre cada unidad, se realizaalgún muestreo de los tipos anteriores (por ejemplo, para realizar un muestreo en una gran ciudad, se subdivide primero por barrios…)

Page 12: Tema 1:  Introducción

Una vez diseñada la muestra, recogemos los datos;después, la información proporcionada por ellos debeORDENARSE

Tablas y gráficas estadísticas

(datos agrupados y no agrupados)

Page 13: Tema 1:  Introducción

Ejemplo 1:

xi

ni ó %i

17 18 19 21 22

DIAGRAMA DE BARRAS

xi ni fi %i17 2 0,1 1018 10 0,5 5019 4 0,2 2021 3 0,15 1522 1 0,05 5

20 1 100

TABLAS Y GRAFICAS ESTADISTICAS

Page 14: Tema 1:  Introducción

xi ni fi %i3.75-5.95 4,85 2 0,05 55.95-8.15 7,05 4 0,1 10

8.15-10.35 9,25 10 0,25 2510.35-12.55 11,45 16 0,4 4012.55-14.75 13,65 6 0,15 1514.75-16.95 15,85 2 0,05 5

Total: 62,1 40 1 100

Ejemplo 2:

xi

ni ó %i

3.75 5.95 8.15 10.35….

HISTOGRAMA

Page 15: Tema 1:  Introducción

10%

50%

20%

15%

5%

17

18

19

21

22

Ejemplo 1:

xi ni fi %i17 2 0,1 1018 10 0,5 5019 4 0,2 2021 3 0,15 1522 1 0,05 5

20 1 100

DIAGRAMA DE SECTORES

Page 16: Tema 1:  Introducción

2. Medidas de centralización.

1.- Media.

2.- Moda: el valor (unimodal) o valores (bimodal, etc.) con mayor frecuencia.

3.- Mediana: el valor que deja la mitad de los datos por debajo, una vez ordenados de menor a mayor. Estadístico ROBUSTO.

k

ii

k

iii

n

nxx

1

1

Page 17: Tema 1:  Introducción

3. Medidas de dispersión o variabilidad.

La DISPERSION (o variabilidad) de un conjunto de datos es una medida de la distancia entre los datos, y su media.

Poca dispersión = Datos homogéneos = Media muy representativa

Mucha dispersión = Datos heterogéneos = Media poco representativa

Page 18: Tema 1:  Introducción

Ejemplo: En una investigación sobre deficiencias medioambientales encon-tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre elnúmero de deficiencias encontradas:

Nº deficiencias com. A Frecuencia1 12 33 54 75 56 37 1

Nº deficiencias com. B Frecuencia1 62 43 24 15 26 47 6

La media es 4, en cada comunidad; pero ¿en cuál de ellas la variable es más dispersa?

Page 19: Tema 1:  Introducción

1 2 3 4 5 6 7

1 2 3 4 5 6 7

Nº deficiencias com. A Frecuencia1 12 33 54 75 56 37 1

Nº deficiencias com. B Frecuencia1 62 43 24 15 26 47 6

Ejemplo: En una investigación sobre deficiencias medioambientales encon-tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre elnúmero de deficiencias encontradas:

+ disp.

Page 20: Tema 1:  Introducción

¿Cómo podemos medir la dispersión?

1.- Rango: dif. entre el mayor y el menor de los datos.

2.- Varianza:

3.- Desviación típica: VS

k

ii

k

ii

n

nxxS

1

1

2

2

Page 21: Tema 1:  Introducción

Propiedades de la varianza y la desviación típica:

1.- La varianza no puede ser negativa.2.- A igualdad de medias, cuanto mayor sea la dispersión, mayor es la varianza (y la desv. típica).3.- Si dos conjuntos de datos poseen medias similares, es más dispersoaquel que tenga mayor varianza (desv. típica).4.- El recíproco no es necesariamente cierto, porque la varianza (desv. típica) depende también del tamaño de los datos.

Coeficiente de variación (CV)

5.- Al menos el 100(1-1/k2) de los datos está entre la media, y ±k veces la desviación típica (por ejemplo, al menos el 75% de los datos está entre la media y 2 veces la desv. típica).

Page 22: Tema 1:  Introducción

¿Cómo podemos medir la dispersión?

1.- Rango.2.- Varianza.3.- Desviación típica.4.- Coeficiente de variación:

A mayor CV, mayor dispersión, y viceversa.

x

SCV

5.- Cuasivarianza, cuasidesviación típica ó desviación estándar)

11

1

2

2

k

ii

k

ii

n

nxxs

2ss

(Estimadores de la varianza y desv. típicapoblacionales)

Page 23: Tema 1:  Introducción

4. Medidas de posición.

50%

25%

q1q3M

75%

q1 : primer cuartilM : medianaq3: tercer cuartil

Diagrama de caja y bigotes + Datos atípicos: Statgraphics

Page 24: Tema 1:  Introducción

10%

65%

89%

p10=d1 p65 p89

Deciles, percentiles

Page 25: Tema 1:  Introducción

5. Medidas de forma.

N

nxxm

k

ii

ri

r

1

Parámetros que permiten evaluar ciertas características del diagrama de barras/histograma (simetría, apuntamiento).

Momento de orden r con respecto a la media:

Page 26: Tema 1:  Introducción

Coeficiente de asimetría:

Un conjunto de datos es simétrico, si lo es su histograma/diagrama de barras

1 2 3 4 5 6 7 1 2 3 4 5 6 7

Simetría

Asimetría negativa (a la izqda.) Asimetría positiva (a la dcha.)

x x

Page 27: Tema 1:  Introducción

Coeficiente de asimetría:

Coeficiente de asimetría de Fisher:

3

1

3

33

NS

nxx

S

mA

k

iii

F

AF>0: Asimetría positiva (a la dcha.)AF=0: SimetríaAF<0: Asimetría negativa (a la izqda.)

Page 28: Tema 1:  Introducción

Coeficiente de apuntamiento o curtosis:

Previamente: curva normal N(µ,σ) o campana de Gauss

2

2

1

2

1)(

x

exf

Un conjunto de datos es normal si su polígono de frecuencias se ajustaa esta curva.

Page 29: Tema 1:  Introducción

Normal

Leptocúrtica: más apuntada g2>0Mesocúrtica: normal g2=0Platicúrtica: más aplanada g2<0

33

41

4

44

2

NS

nxx

S

mg

k

iii

Coeficiente de apuntamiento o curtosis:

Page 30: Tema 1:  Introducción

Aceptamos que un conjunto de datos es “aproximadamente normal”cuando los coeficientes de asimetría y de curtosis tipificados están entre -2 y 2.