32
1 Estadística

Estadistica gral

Embed Size (px)

Citation preview

Page 1: Estadistica gral

1

Estadística

Page 2: Estadistica gral

2

Metodología de la Investigación• La investigación es un proceso

– sistemático,– organizado y – objetivo

destinado a responder a una pregunta

• La respuesta lo que pretende es aclarar la incertidumbre de nuestro conocimiento.

Page 3: Estadistica gral

3

¿Qué investigar? Definición del problema

¿Para qué? Definición del propósito

¿Qué estudiar concretamente? Definición de los objetivos

¿Cómo? Definición del tipo de diseño

¿Preguntas a responder?

Page 4: Estadistica gral

4

Esquema general del planteamiento de un estudio

• Hipótesis de trabajo• Objetivos• Diseño de estudio• Selección de variables • Definición de variables • Escala de medida

• Protocolo de recogida de datos

• Construcción de bases de datos

• Depuración de los datos

• Análisis• Resultados• Conclusiones

Estadística: Herramienta indispensable

Page 5: Estadistica gral

5

Esquema del proceso de obtener conclusiones a partir de los datos

OBJETIVO

Materia Prima

DATOS

Procesamiento

ORGANIZACION Y ANALISIS

Producto

CONCLUSIONES

Page 6: Estadistica gral

6

El caso de análisis• Una empresa dedicada al alquiler de campos y

producción de girasol recibe el ofrecimiento de 4 lotes para alquiler ubicados en 4 localidades diferentes. Todos los lotes ofrecidos tienen la misma superficie, los costos de producción son idénticos y se precisa obtener un rendimiento mínimo de 15 quintales/ha para obtener un resultado económico positivo. Se dispone de información sobre los rendimiento del girasol en los últimos 12 años de las 4 localidades donde se ubican los lotes ofrecidos. Usted es el asesor técnico de la empresa y se le pide que, a partir de dicha información, recomiende un lote para alquilar.

Page 7: Estadistica gral

7

Objetivos del análisis de los datos• Para producir la recomendación pedida, deberá analizar los

datos de modo de contestar la siguiente pregunta general: • ¿Cómo fueron los rendimientos de girasol de los últimos

12 años en cada una de las cuatro localidades? • En relación con esta pregunta general, interesará establecer

y documentar, mediante gráficos y medidas, los siguientes puntos para cada localidad:

• ¿Los rendimientos fueron altos o bajos? • ¿Los rendimientos fueron parejos entre años? • ¿Los resultados económicos negativos fueron frecuentes o

raros? • ¿Los resultados económicos sobresalientes fueron

frecuentes o raros?

Page 8: Estadistica gral

8

Datos: rendimientos de girasol [kg/ha]

Año Loc. A Loc. B Loc. C Loc. D 1994 1400 1900 2000 920 1995 4000 2600 1690 1600 1996 1150 500 1500 1180 1997 2400 1380 1700 750 1998 2200 960 1580 800 1999 3600 0 2100 900 2000 850 2100 1100 1230 2001 3400 1700 1650 1350 2002 1360 1940 1760 1150 2003 1940 1100 1550 1120 2004 2900 1300 1850 1450 2005 260 2230 1730 1130

Page 9: Estadistica gral

9

En la actualidad el conjunto de métodos que la estadística brinda para atender todos los problemas hace que se la divida en 2 grandes campos, Estadística Descriptiva e Inferencial.

Clasificación de la estadística moderna Cuadros

representación de datos Tablas Gráficos

Descriptiva Promedios Reducción de datos Dispersiones Predice, infiere

Inferencial Trabajo en base a muestras

Decide sobre las poblaciones

Page 10: Estadistica gral

10

VARIABLECUALITATIVAS O CATEGORICASaquellas que indican una cualidad o sea una característica no medible o contable,

a) Ordenables: cuando puede hacer una correspondencia lógica entre los valores de la variable y los números naturales.

Ejemplo: x= resistencia a Roya =no resistente, resistente o muy resistente

b) No ordenables: caso contrario al anterior.•Ejemplo : x= Pelajes = Bayo, Zaino, etc.

Page 11: Estadistica gral

11

VARIABLECUANTITATIVASLas que indican características medibles o contables, a) Discretas : aquellas cuyos valores se interrumpen o separan. • Ejemplo : x= número de vacas de una granja en una determinada región. Los valores posibles son 0, 1, 2,... existe un salto o ruptura entre ellos, (por ejemplo entre 15 y 16, la variable x número de vacas, no puede tomar un valor 15,2).b) Continuas: aquellas cuyos valores posibles no tienen interrupción.• Ejemplo : x= peso de las vacas de una granja en una determinada región. Entre 400 y 500 kg podemos tener infinitos valores.

Page 12: Estadistica gral

12

TAREA ESTADISTICA1. Recopilación de datos

2. Presentación de datos

3. Análisis de datos

4. Interpretación de resultados

Page 13: Estadistica gral

13

Definiciones básicas “Población es un conjunto de elementos definidos en el

tiempo y en el espacio, sobre los cuales se realizarán las observaciones en el caso de una encuesta exhaustiva o censo, o a los cuales se referirán los resultados de la investigación en el caso de un estudio por muestreo”.

“Muestra es el subconjunto de unidades seleccionadas de la población definida. En esta recae la realización de las observaciones”.

“Valores poblacionales” Parámetros

“Estimadores” Estadísticos

Page 14: Estadistica gral

14

Los datos recopilados para cada sujeto , unidad de observación, ó expertimental pueden provenir de distintos tipos de variables y escalas de medición:

Análisis de datos

N om in a l

O rd in a l

E sca la d e m ed ic ió n

C u a lita tiva o A trib u to

In te rva lo

R azó n

E sca la d e m ed ic ió n

D isc re ta

C on tin u a

Tip o

C u an tita t iva o N ú m erica

V ariab les

Page 15: Estadistica gral

15

Unidad EstadísticaA cada elemento que integra la población se lo llama

unidad estadística, unidad elemental o simplemente elemento.

Para seleccionar una muestra, se toman unidades estadísticas de la población en estudio.

Unidad de MuestreoSe designa de esta manera a cada uno de los grupos de

unidades estadísticas, que se determinan con el objetivo de seleccionar la muestra.

Page 16: Estadistica gral

16

Presentaciones visuales, reducción de datos

Tablas, Gráficos y Distribuciones

¿Qué representación mental le sugiere la palabra estadística a la mayor parte de la gente ?

Una tabla es una ordenación de datos en filas y columnas utilizada para documentar o comunicar información. Desde este punto de vista de su uso, existen dos tipos de tablas a saber : Tablas generales o de Referencia y Tablas Específicas o de Resumen

Page 17: Estadistica gral

17

Distribución de una variable cuantitativa

discreta Veamos con un ejemplo la tabla de distribución de frecuencias. En 13 cajones de huevos se contó la cantidad de huevos desechables por cajón:

xi fi Fi fr =ifn fri% Fr= F

n Fr %

1 2 2 0,1538 15,38 0,1538 15,38 2 4 6 0,3077 30,77 0,4615 46,15 3 1 7 0,0769 7,69 0,5385 53,85 4 3 10 0,2308 23,08 0,7692 76,92 5 2 12 0,1538 15,38 0,9231 92,30 6 1 13 0,0769 7,69 1,0000 100,00 Totales 13 1,000 100,00

Page 18: Estadistica gral

18

Distribución de una variable cuantitativa

continua Ahora si lo que nos interesa son los índices de Productividad ponderado de 20 establecimientos estamos frente a una variable cuantitativa continua. En este caso los valores individuales carecen de interés, por la propia naturaleza de dicha variable, por lo tanto se los agrupa en los llamados “intervalos de clase”. La cantidad de intervalos necesarios para construir una distribución de frecuencias no se puede determinar por alguna regla precisa, depende de la experiencia y el sentido del investigador, generalmente se utilizan entre 5 -15. 

Page 19: Estadistica gral

19

Distribución de una variable cuantitativa

continua El límite inferior del primer intervalo debe ser algo menor que el valor más pequeño de la variable, y el límite superior del último intervalo algo mayor al dato más grande.Definiendo:xmáx= valor extremo superior de la variablexmín= valor extremo inferior de la variableLa diferencia entre estos dos valores nos da la “amplitud total” A=xmáx-xmín

Si creemos que la cantidad de intervalos conveniente es h entonces la amplitud de los intervalos será aproximadamente a=A/h

Page 20: Estadistica gral

20

Distribución de una variable cuantitativa

continua Veamos por ejemplo... X= valor de índice de Productividad de 20 establecimientos.

45,0 55,0 48,9 40,5 42,8 52,0 49,0 52,5 51,7 50,0 50,0 56,5 57,0 52,0 45,0 49,0 44,3 41,0 59,2 46,3

Vemos cuál es el valor extremo inferior xmín=40,5y el extremo superior, xmáx=59,2

Page 21: Estadistica gral

21

Distribución de una variable cuantitativa

continua Para obtener a= amplitud del intervalo.

4520

54060

a

Los intervalos se construyen de tal forma que contienen al extremo inferior pero no al superior.

Intervalo de clase fi Fi fri Fri 40,0 - 44,0 3 3 3/20=0,15 3/20=0,15 44,0 - 48,0 4 7 4/20=0,20 7/20=0,35 48,0 - 52,0 6 13 6/20=0,30 13/20=0,65 52,0 - 56,0 4 17 4/20=0,20 17/20=0,85 56,0 - 60,0 3 20 3/20=0,15 20/20=1,00

20 1,00

Page 22: Estadistica gral

22

Distribución de una variable cuantitativa

continua La representación gráfica correspondiente a la distribución de frecuencias simples o relativas de una variable cuantitativa continua es el HISTOGRAMA

 

HISTOGRAMA

0

1

2

3

4

5

6

7

40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0 X

FREC

UEN

CIA

S

Page 23: Estadistica gral

23

1)Construya un tabla de frecuencias con 10 clases.2)Construya un histograma que corresponde a la tabla anterior,3)Realice un diagrama de tallo y hoja.4)Construya un diagrama de caja.5)Utilice la tabla de frecuencias para encontrar la media y el desvío estándar de los números de tomates que se rechazan.

29 58 80 35 30 23 88 49 35 97 12 73 54 91 45 28 61 61 45 84 83 23 71 63 47 87 36 8 94 26 95 63 86 42 22 44 88 27 20 33 28 91 87 15 67 10 45 67 26 19

Caso estudioLos siguientes puntajes representan el número de tomates rechazados en un día en un mercado mayorista. Los puntajes corresponden a 50 días seleccionados aleatoriamente:

Page 24: Estadistica gral

24

Page 25: Estadistica gral

25

Análisis de Datos

Page 26: Estadistica gral

26

Análisis de Datos

Histograma

Page 27: Estadistica gral

27

Histograma

Page 28: Estadistica gral

28

Page 29: Estadistica gral

29

Medidas que resumen información Promedios y

Dispersión Mediana Medidas de tendencia Central Modo Media Aritmética

Promedios Media Geométrica Media Armónica Rango

Medidas de variabilidad y concentración Desvío medio- Varianza

Desvío típico (estándar) Rango intercuartilar

Coeficiente de Variación

Page 30: Estadistica gral

30

V a l o r E x t r e m ol e v e

V a l o r e se x t r e m o sl e v e s

E x t r e m o oO u t l i e r

3 D1 . 5

D

D

HINGE

HINGE

MEDIANA

D i a g r a m a d e C a j a

( B o x P l o t )

Page 31: Estadistica gral

31

Coeficiente de Variación

xScvse puede expresar como % 100*

xS%cv

Si el CV 5% ----> datos muy homogéneos, Media aritmética muy representativa Si el 5% CV 20% ----> datos con homogeneidad aceptable. La media aritmética es representativa Si el CV 20% ----> datos heterogéneos, la media aritmética es poco representativa

Page 32: Estadistica gral

32

Loc DLoc CLoc BLoc A

4.000

3.000

2.000

1.000

0

7

Comparación de los rindes según localidades

Descriptive Statistics

12 3740 260 4000 2121,67 339,319 1175,437 138165212 2600 0 2600 1475,83 217,519 753,506 567772,012 1000 1100 2100 1684,17 73,520 254,682 64862,87912 850 750 1600 1131,67 74,619 258,486 66815,15212

Loc ALoc BLoc CLoc DValid N (listwise)

Statistic Statistic Statistic Statistic Statistic Std. Error Statistic StatisticN Range Minimum Maximum Mean Std.

DeviationVariance