Transcript
Page 1: Geoestadistica descriptiva

1

Estadística

Introducción¿Qué es la estadística?Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha experimentado un gran desarrollo a lo largo de los últimos años.

¿En qué áreas se aplica la estadística?Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras.

Ejemplos de su aplicación son:

1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.

2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.

Page 2: Geoestadistica descriptiva

2

Estadística

Introducción

Ejemplos de su aplicación son:

3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos.

4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.

5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población.

En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.

Page 3: Geoestadistica descriptiva

3

Estadística

IntroducciónEtapas de un estudio estadístico

Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son:

1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.

2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.

3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.

4) Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales.

5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población

Page 4: Geoestadistica descriptiva

4

Estadística

IntroducciónEsquema de las etapas de un estudio estadístico

AREA DE INTERES DATOSDATOS

Tema de InvestigaciónTema de Investigación

-Antecedentes Previos Antecedentes Previos

-ObjetivosObjetivos

-Preguntas de InvestigaciónPreguntas de Investigación

-Posibles HipótesisPosibles Hipótesis

-Unidad de AnálisisUnidad de Análisis

-PoblaciónPoblación

-VariablesVariables

ORGANIZAR Y RESUMIRORGANIZAR Y RESUMIR

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)

INTERPRETACIÓN

INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICA

¿Población o Muestra?¿Población o Muestra?

CONCLUSIONES

Población Población

MuestraMuestra

ProbabilidadProbabilidadINFORMACIÓN

Page 5: Geoestadistica descriptiva

5

Estadística

IntroducciónEjemplos de algunos problemas a estudiar

1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.

4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.

6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

Page 6: Geoestadistica descriptiva

6

• VARIABLE: VARIABLE: es lo que se va a medir y representa una característica de la es lo que se va a medir y representa una característica de la UNIDAD DE UNIDAD DE ANÁLISISANÁLISIS..

• ¿QUIÉNES VAN A SER MEDIDOS?: ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Los sujetos u objetos o Unidades de Análisis de una Población o una MuestraPoblación o una Muestra• POBLACIÓN :POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Es el total de unidades de análisis que son tema de estudio.

Muestra: 60 trabajadores de empresas de comunicación

Unidad de análisis: Trabajador de empresa de comunicación

Variables: sexo, edad, salario, Nº de horas de trabajo, etc.

Población: Población:

““Las personas que Las personas que

trabajantrabajan en empresas de en empresas de

comunicacióncomunicación” ”

Estadística

• MUESTRA: MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.Es un conjunto de unidades de análisis provenientes de una población.

MuestraMuestra

Resumen de algunos conceptos planteados en la Introducción

Page 7: Geoestadistica descriptiva

7

TIPOS DE VARIABLESTIPOS DE VARIABLES

Variables CuantitativasVariables Cuantitativas

VariableVariable: : corresponde a la característica de la Unidad de Análisiscorresponde a la característica de la Unidad de Análisis

IntervaloIntervalo

DISCRETADISCRETA

Variables Variables CualitativasCualitativasCONTINUACONTINUA

Toma valores enteros Toma valores enteros

EjemplosEjemplos: : Número de HijosNúmero de Hijos, , Número de Número de empleados de una empresaempleados de una empresa, , Número de Número de

asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre , etc., etc.

Toma cualquier valor dentro de un intervalo Toma cualquier valor dentro de un intervalo

EjemplosEjemplos: : Peso; Estatura; Temperatura, etc.Peso; Estatura; Temperatura, etc.

Unidad de MedidaUnidad de Medida: : GramosGramos o o KilosKilos para la variable Peso; Grados para la variable Peso; Grados CC o o F F para Temperatura para Temperatura

ORDINALORDINALNOMINALNOMINAL

Característica o cualidad Característica o cualidad cuyas categorías no tienen cuyas categorías no tienen un orden preestablecido. un orden preestablecido.

EjemplosEjemplos: : Sexo, Deporte Sexo, Deporte FavoritoFavorito, etc., etc.

Característica o cualidad cuyas Característica o cualidad cuyas categorías tienen un orden categorías tienen un orden

preestablecido. preestablecido.

EjemplosEjemplos: Calificación (S, N, A); : Calificación (S, N, A); Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.

Estadística

Page 8: Geoestadistica descriptiva

8

FrecuenciaFrecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se : desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.presenta una característica.

DISCRETADISCRETA

CONTINUACONTINUA

ORDINALORDINAL

NOMINALNOMINAL

TIPO FRECUENCIATIPO FRECUENCIAFrecuencia AbsolutaFrecuencia Absoluta

(F)(F)Frecuencia RelativaFrecuencia Relativa

(f)(f)

Frecuencia Absoluta Frecuencia Absoluta Acumulada (FAA)Acumulada (FAA)

Frecuencia Relativa Frecuencia Relativa Acumulada (fra)Acumulada (fra)

DISCRETADISCRETA

CONTINUACONTINUANOMINALNOMINAL

ORDINALORDINAL

Variable Variable CuantitativaCuantitativa

Variable Variable CualitativaCualitativa

Variable Variable CuantitativaCuantitativa

Variable Variable CualitativaCualitativa

Estadística

Page 9: Geoestadistica descriptiva

9

VariablesVariables- Tipo de Industria- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (: se clasifica en industria tipo A, B, C o D. (cualitativa nominalcualitativa nominal))- - Nº de EmpleadosNº de Empleados: se refiere al número de empleados en las líneas de producción. (: se refiere al número de empleados en las líneas de producción. (cuantitativa cuantitativa

discretadiscreta))- - SuperficieSuperficie: se refiere a los : se refiere a los metros cuadradosmetros cuadrados ( (unidad de medidaunidad de medida) disponibles para las áreas de ) disponibles para las áreas de

producción. (producción. (cuantitativa continuacuantitativa continua))- - CalificaciónCalificación: calificación realizada por una institución pública sobre cumplimiento de ciertos : calificación realizada por una institución pública sobre cumplimiento de ciertos

estándares (Muy Bien, Bien, Regular, Mal). (estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinalcualitativa ordinal))

Industria nº Tipo Nº Empleados Superficie Calificación

1 A 100 1000,6 Muy Bien

2 B 150 1200,4 Bien

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

299 D 250 800,3 Mal

300 C 300 4000,2 Regular

Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. de conserva en función de algunas características.

Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva

PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país

DatosDatos

EJEMPLOEJEMPLO

Estadística

Page 10: Geoestadistica descriptiva

10

EJEMPLOEJEMPLO

TABLAS DE TABLAS DE FRECUENCIAFRECUENCIA

Tipo deIndustria

FrecuenciaAbsoluta (Fj)

FrecuenciaRelativa (fj)

Porcentaje(%)

A

B

C

D

Total 300 1 100

CalificaciónFrec.

Absoluta (Fj)Frec.Relativa

(fj) o %Frec. Absol.

Acum. (FAAj)Frec. Relat.

Acum. (fraj) o %

Muy Bien

Bien

Regular

Mal 300 1 (o 100)

Total 300 1 (o 100)

Numero deEmpleados

Frec.Absoluta (Fj)

Frec.Relativa(fj) o %

Frec. Absol.Acum. (FAAj)

Frec. Relat.Acum. (fraj) o %

<100

[100-150[

.

.

[950-1000] 300 1 (o 100%)

Total 300 1 (o 100%)Superficie

(mt2)Frec.

Absoluta (Fj)Frec.Relativa

(fj) o %Frec. Absol.

Acum. (FAAj)Frec. Relat.

Acum. (fraj) o %

<200

[200-400[

.

.

[50000-5200] 300 1 (o 100%)

Total 300 1 (o 100%)

(1)(1)(2)(2)

(3)(3)

(4)(4)

Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva en : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. función de algunas características.

Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva

PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país

Estadística

Page 11: Geoestadistica descriptiva

11

Elementos de una tabla de frecuencia cuando la variable es continua (x)Elementos de una tabla de frecuencia cuando la variable es continua (x)

Intervalo Centro de clase Amplitud F f FAA fra

I1 c1 a1

I2 c2 a2 . .

Ik ck ak n 1

Total n 1

[LI1 ; LS1 [

[LI2 ; LS2 [

[LIk ; LSk]

aj = (LSj – LIj))cj = (LIj) + LSj )/2

Estadística

Page 12: Geoestadistica descriptiva

12

Ejercicio: confección de una tabla de frecuencia para una variable Ejercicio: confección de una tabla de frecuencia para una variable continuacontinua

10,5 10,7 9,5 10,5 11,8 11,2

12,0 10,3 13,5 12,3 10,6 9,8

10,7 11,5 11,1 10,6 9,3 12,9

10,4 7,5 10,2 8,7 10,9 9,9

11,7 10,3 10,6 10,5 11,9 11,0

13,9 10,6 10,0 10,8 10,6 -

7,3 8,0 8,5 12,5 9,7 -

Los datos corresponden a la edad de Los datos corresponden a la edad de los hijos de los trabajadores de una los hijos de los trabajadores de una

empresa empresa

7,3 9,7 10,4 10,6 11,1 12,3

7,5 9,8 10,5 10,6 11,2 12,5

8,0 9,9 10,5 10,7 11,5 12,9

8,5 10,0 10,5 10,7 11,7 13,5

8,7 10,2 10,6 10,8 11,8 13,9

9,3 10,3 10,6 10,9 11,9 -

9,5 10,3 10,6 11,0 12,0 -

Datos ordenados de menor a mayorDatos ordenados de menor a mayor

1)1) Construya un Diagrama de Tallo y HojaConstruya un Diagrama de Tallo y Hoja

2)2) ¿Cuál es la variable?; ¿Cuál es la Unidad de ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. de la variable?.

3)3) Sobre una Tabla de frecuenciaSobre una Tabla de frecuencia: ¿Cuántos : ¿Cuántos intervalos podría construir?; ¿Cuál es la intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para medidas de frecuencia puede obtener para cada intervalo?.cada intervalo?.

4)4) Construir tabla de frecuenciaConstruir tabla de frecuencia para la para la variablevariable: Intervalos, centro de clase, : Intervalos, centro de clase, amplitud, frecuencias.amplitud, frecuencias.

Realice la siguiente actividadRealice la siguiente actividad

Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos.

Estadística

Page 13: Geoestadistica descriptiva

13

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

1. Gráfico de Sectores Circulares (de 1. Gráfico de Sectores Circulares (de Torta)Torta)

Distribución de las unidades de análisis de acuerdo a variable 1

A20%

D10%

C40%

B30%

Distribución de las unidades de análisis de acuerdo a variable 1

B30%

C40%

D10% A

20%

Distribución de las unidades de análisis de acuerdo a variable 1

B30%

C40%

D10%

A20%

Estadística

Page 14: Geoestadistica descriptiva

14

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

2. Gráfico de Barras2. Gráfico de Barras

Numero de unidades de análisis de acuerdo a variable 1

0

100

200

300

400

500

A B C D

variable 1

Porcentaje de unidad de análisis de acuerdo a variable 1

0 20 40 60 80 100

A

B

C

D

varia

ble

1

% unidad de análisis

-Este tipo de gráfico se utiliza generalmente para Este tipo de gráfico se utiliza generalmente para representar la frecuenciarepresentar la frecuencia de las categorías de una de las categorías de una variable cualitativavariable cualitativa. .

-Cuando una variable es cuantitativa se puede utilizar Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha este tipo de gráfico sólo si la variable se ha transformada en categorías.transformada en categorías.

-Hay distintas versiones de estos gráficos (por ejemplo Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos describir el comportamiento de una variable en distintos grupos.grupos.

Proporción de unidad de análisis de acuerdo a variable 1

0 0,2 0,4 0,6 0,8 1

A

B

C

D

varia

ble

1

Proporción de unidad de análisis

Estadística

Page 15: Geoestadistica descriptiva

15

HistogramaHistograma

- Permite la representación de - Permite la representación de la la frecuenciafrecuencia de una de una variable variable CuantitativaCuantitativa..

- El El ejeeje xx se refiere a la se refiere a la variable.variable.

- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %).frecuencia (Nº , %).

- Cada Cada barrabarra representa la representa la frecuencia de la variable en la frecuencia de la variable en la población en estudio (o la población en estudio (o la muestra). muestra).

-El histograma se puede El histograma se puede construir desde los datos de la construir desde los datos de la tabla de frecuencia de la tabla de frecuencia de la variable en estudio.variable en estudio.

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

3. Histograma3. Histograma

1413121110987

15

10

5

0

edad

Fre

cuen

cia

edadedad

HistogramaHistograma

Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores de la empresa de acuerdo a edadde la empresa de acuerdo a edad

EjemploEjemplo

En el gráfico se puede observar el En el gráfico se puede observar el número de número de hijoshijos , de menor edad (7-8 años), las de mayor , de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 hijos de los trabajadores están entre los 10 y 12

años.años.

Estadística

Page 16: Geoestadistica descriptiva

16

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Polígono de Frecuencia5. Polígono de Frecuencia

edadedad

1413121110987

15

10

5

0

edad

Fre

cuen

cia

Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores

de la empresade la empresa de acuerdo a edadde acuerdo a edad -Esta representación se basa en Esta representación se basa en el Histograma.el Histograma.

-Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..

-El El eje xeje x se refiere a la se refiere a la variable.variable.

- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %). frecuencia (Nº , %).

-Los puntos que permiten la Los puntos que permiten la unión de las líneas representa unión de las líneas representa el el centro de clase centro de clase (o marca de (o marca de clase)clase)..

Estadística

Page 17: Geoestadistica descriptiva

17

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

5. Diagrama de Caja5. Diagrama de Caja

- Permite identificar gráficamente la Permite identificar gráficamente la mediana, los cuartiles 1 y 3 mediana, los cuartiles 1 y 3 (percentiles 25 y 75), mínimo y (percentiles 25 y 75), mínimo y máximo de una variable. máximo de una variable.

- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..

-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.

- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.

Estadística

1473584N =

HombresMujeres

Eda

d

100

90

80

70

60

50

40

30

20

10

0

Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000

Page 18: Geoestadistica descriptiva

18

TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS

6. Otros6. Otros

Número de alumnos matriculados en la Carrera A según año de ingreso

0

2040

6080

100

1998 1999 2000 2001 2002 2003

año de ingreso

de

alu

mn

os

Número de alumnos matriculados en la Carrera B según año de ingreso

020406080

100

1998 1999 2000 2001 2002 2003

año de ingreso

de

alu

mn

os

Número de alumnos matriculados en las Carreras según año de ingreso

0

50

100

150

200

1998 1999 2000 2001 2002 2003

año ingreso

de

alu

mno

s

Carrera B

Carrera A

año de ingreso Carrera A Carrera B1998 60 801999 55 702000 80 502001 40 602002 68 502003 70 75

Nº de alumnos

Estadística

Page 19: Geoestadistica descriptiva

19

OBSERVACIONESOBSERVACIONES

* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.

* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).

* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.

* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.

Variables Cuantitativas

variablex i individuo elen variablela devalor ixni ,...,1

nccccn

i

1

n

iin

n

ii xccxcxcx

11

1

bxabaxbaxbaxn

iin

n

ii

11

1

)()()(

221

1

2n

n

ii xxx

21

2

1

)()( n

n

ii xxx

)()()( 111

nn

n

iii yxyxyx

)()()( 111

nn

n

iii yxyxyx

variabley i individuo elen variablela devalor iy

NOTACIONNOTACION

constantes:,, cba

Estadística

Page 20: Geoestadistica descriptiva

20

MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL

-Media Aritmética (Promedio)Media Aritmética (Promedio)

-MedianaMediana

-ModaModa

n

xx

n

ii

1

Media Aritmética o PromedioMedia Aritmética o Promedio

MedianaMediana

)(EM kx

2M )1()(

E

kk xx

x

1x

2x

nx

Datos CuantitativosDatos Cuantitativos

x

)1(x

)2(x

)(nx

Datos Cuantitativos ordenados de menor a mayorDatos Cuantitativos ordenados de menor a mayor

Si Si nn es par es par

Si Si n n es impares impar

centro del dato)( kx

repite" se más que dato el"M o ModaModaDatos Datos

Cualitativos y CuantitativosCualitativos y Cuantitativos

Estadística

Page 21: Geoestadistica descriptiva

21

Percentiles, Deciles o CuartilesPercentiles, Deciles o Cuartiles

-Percentil (ejemplo: 25, 50, 75)Percentil (ejemplo: 25, 50, 75)

-Decil (ejemplo: 4, 5, 8)Decil (ejemplo: 4, 5, 8)

-Cuartil (ejemplo: 1, 2, 3)Cuartil (ejemplo: 1, 2, 3)

El Decil va de 1 a 10El Decil va de 1 a 10

El Decil 4 (4/10)El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos: es el valor de la variable que reúne al menos el 40% de los datos

Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.

Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losPercentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los nn datos están ordenados de datos están ordenados de MenorMenor a a MayorMayor

Estadística

El Percentil va de 1 a 100El Percentil va de 1 a 100

El percentil 25 (25/100)El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos: es el valor de la variable que reúne al menos el 25% de los datos

Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.

Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.

El Cuartil va de 1 a 4El Cuartil va de 1 a 4

El Cuartil 3 (3/4)El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos: es el valor de la variable que reúne al menos el 75% de los datos

Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.

Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

Page 22: Geoestadistica descriptiva

22

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

-RangoRango

-VarianzaVarianza

-Desviación EstándarDesviación Estándar

RangoRango

VarianzaVarianzax

1x

2x

nx

Datos CuantitativosDatos Cuantitativos

Coeficiente de VariaciónCoeficiente de VariaciónComparación entre VariablesComparación entre Variables

Se refiere al comportamiento de las variables cuantitativas en Se refiere al comportamiento de las variables cuantitativas en un grupo. un grupo. Por ejemplo: Si se tiene un conjunto de personas a las Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál

presenta mayor variación? presenta mayor variación?

)min()max( ii xxR

Desviación Típica o EstándarDesviación Típica o Estándar

2

1

21 1

22

1

2

2 1)(

1)(

xxnn

xn

x

n

xxs

n

ii

n

i

n

iii

n

ii

2ss

x

scv

Estadística

Page 23: Geoestadistica descriptiva

23

Estadística

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis.

Coeficiente de Asimetría 3

1

3)(

sn

xx

CA

n

ii

Si CA=0 si la distribución es simétrica alrededor de la media.Si CA<0 si la distribución es asimétrica a la izquierdaSi CA>0 si la distribución es asimétrica a la derecha

Coeficiente de Apuntamiento 4

1

4)(

sn

xx

CAp

n

ii

- Si CAp=0 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.- Si CAp>0, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media).- Si CAp<0 la distribución es más plana y se llama platicúrtica.

Page 24: Geoestadistica descriptiva

24

Estadística

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

V2

7,06,05,04,03,02,01,0

14

12

10

8

6

4

2

0

Desv. típ. = 1,67

Media = 3,9

N = 30,00

V4

2,01,00,0-1,0

30

20

10

0

Desv. típ. = ,64

Media = 0,0

N = 30,00

V5

9,08,07,06,05,04,03,02,01,0

6

5

4

3

2

1

0

Desv. típ. = 2,42

Media = 5,2

N = 28,00

Page 25: Geoestadistica descriptiva

25

Estadística

Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría

-Kurtosis o ApuntamientoKurtosis o Apuntamiento

Ejemplos

Media 3,9

Mediana 4

Moda 4

Desviación estándar 1,67

Varianza de la muestra 2,78

kurtosis -0,43

Coeficiente de asimetría -0,02

Rango 6

Mínimo 1

Máximo 7

Cuenta 30

V1

9,08,07,06,05,04,03,02,01,0

16

14

12

10

8

6

4

2

0

Desv. típ. = 1,77

Media = 5,4

N = 66,00

1 4 4

1 4 4

1 4 5

2 4 5

2 4 6

2 4 6

2 4 6

3 4 6

3 4 7

4 4 7

Datos Histograma Medidas descriptivas

Page 26: Geoestadistica descriptiva

26

Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)

Intervalo Centro de clase Amplitud F f FAA fra

I1 c1 a1

I2 c2 a2 . .

Ik ck ak n 1

Total n 1

f1

f2

fk

n1

n2

nk

Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)

1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma:

k

jjjcc fcxMedia

1

Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.

2) La La Desviación típicaDesviación típica para datos para datos agrupados esta dada por:agrupados esta dada por:

k

jjcjc fxcs

1

2)(

3) El El Coeficiente de AsimetríaCoeficiente de Asimetría para para datos agrupados esta dado por:datos agrupados esta dado por:

3

1

3)(

c

k

jjcj

cs

fxc

CA

4) El El Coeficiente de apuntamientoCoeficiente de apuntamiento para para datos agrupados esta dada por:datos agrupados esta dada por:

4

1

4)(

c

k

jjcj

cs

fxc

CAp

Page 27: Geoestadistica descriptiva

27

Estadística

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Tabla 1   Actividad  

Transporte Estudia Pensionado Trabaja

Autobus 5 7 0

Bicicleta 3 3 2

Caminar 2 5 2

Coche 5 4 5

Metro 6 7 4

Transporte Nº %

Autobus 12 20,0

Bicicleta 8 13,3

Caminar 9 15,0

Coche 14 23,3

Metro 17 28,3

TOTAL 60 100

Actividad Nº %

Estudia 21 35,0

Pensionado 26 43,3

Trabaja 13 21,7

TOTAL 60 100

ProblemaInteresa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial.

Para esto se consultó a cada Para esto se consultó a cada persona sobre la actividad a persona sobre la actividad a la que se dedicaba y el medio la que se dedicaba y el medio de transporte preferido.de transporte preferido.

Page 28: Geoestadistica descriptiva

28

Estadística

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personasNº de personas

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

Tabla 2   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

Bicicleta 3 3 2 8

Caminar 2 5 2 9

Coche 5 4 5 14

Metro 6 7 4 17

TOTAL 21 26 13 60

Page 29: Geoestadistica descriptiva

29

Estadística

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personas y % respecto de tipo de Transporte Nº de personas y % respecto de tipo de Transporte

Tabla 3   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

% 41,7 58,3 0 100

Bicicleta 3 3 2 8

% 37,5 37,5 25 100

Caminar 2 5 2 9

% 22,2 55,6 22,2 100

Coche 5 4 5 14

% 35,7 28,6 35,7 100

Metro 6 7 4 17

% 35,3 41,2 23,5 100

TOTAL 21 26 13 60

% 35 43,3 21,7 100

Page 30: Geoestadistica descriptiva

30

Estadística

Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas

Distribución conjuntaDistribución conjunta

Nº de personas y % respecto de tipo de ActividadNº de personas y % respecto de tipo de Actividad

Tabla 4   Actividad    

Transporte Estudia Pensionado Trabaja TOTAL

Autobus 5 7 0 12

% 23,8 26,9 0 20

Bicicleta 3 3 2 8

% 14,3 11,5 15,4 13,3

Caminar 2 5 2 9

% 9,5 19,2 15,4 15

Coche 5 4 5 14

% 23,8 15,4 38,5 23,3

Metro 6 7 4 17

% 28,6 26,9 30,8 28,3

TOTAL 21 26 13 60

% 100 100 100 100

Page 31: Geoestadistica descriptiva

31

MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza

- CorrelaciónCorrelación

x

1x

2x

nx

DatosDatos

CuantitativosCuantitativos

Covarianza: Covarianza:

Recordemos que:Recordemos que: Hasta ahora hemos estudiado las Hasta ahora hemos estudiado las medidas tendencia medidas tendencia central central (Media, Mediana, Moda) (Media, Mediana, Moda) y dispersióny dispersión (Varianza y Desviación Estándar) para (Varianza y Desviación Estándar) para unauna Variable Cuantitativa Variable Cuantitativa (x).(x).

Es una medida de Variabilidad Conjunta entre Es una medida de Variabilidad Conjunta entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Si Cov(x,y) es positivaSi Cov(x,y) es positiva: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es directamente proporcional, es decir que cuando es decir que cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa.

Si Cov(x,y) es negativaSi Cov(x,y) es negativa: : la asociación entre la asociación entre x x e e y y es inversamente es inversamente proporcional, es decir que cuando proporcional, es decir que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa.

Si Cov(x,y) es ceroSi Cov(x,y) es cero: : no existe asociación entreno existe asociación entre x x e e yy..

n

iii )yy)(xx(

n)y,xcov(

1

1

Estadística

Page 32: Geoestadistica descriptiva

32

MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza

- CorrelaciónCorrelación

DatosDatos

CuantitativosCuantitativos

Coeficiente de Correlación de Pearson (Coeficiente de Correlación de Pearson (rr): ): Mide el grado de Asociación Lineal Mide el grado de Asociación Lineal entre dos variables Cuantitativasentre dos variables Cuantitativas

Se refiere al grado de asociación entre Se refiere al grado de asociación entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Si Si rr es positivo es positivo: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es decir que es directamente proporcional, es decir que cuando cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa. Si Si rr=1=1: : la asociación lineal es la asociación lineal es perfecta.perfecta.

Si Si rr es negativo es negativo: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es decir es inversamente proporcional, es decir que cuando que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa. Si Si rr=-1=-1: : la asociación lineal es la asociación lineal es perfecta.perfecta.

Si Si rr es cero es cero: : no existe asociación entreno existe asociación entre x x e e yy..

CorrelaciónCorrelación: :

11 ryxss

)y,xcov(r

yx

n

iii

ss)n(

yxnyx

r1

1

Estadística

Page 33: Geoestadistica descriptiva

33

r=1 r=-1

EJEMPLO : Representación gráfica de las variables x e yEJEMPLO : Representación gráfica de las variables x e y

Estadística

Page 34: Geoestadistica descriptiva

34

Objetivo 2Estudiar si los valores de una

variable pueden ser utilizados para predecir el valor de la otra 

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

Datos CuantitativosDatos Cuantitativos

Determinar si existe relación entre las variables x e y:

Coeficiente de Correlación

Objetivo 1Determinar si dos variables están Determinar si dos variables están asociadas y en qué sentido se da asociadas y en qué sentido se da

la asociaciónla asociación..

Estudiar la dependencia de una variable respecto de la otra:

Modelo de RegresiónModelo de Regresión

TérminosVariable Respuesta (=variable dependiente)

Variable Explicativa (=variable Independiente)Relación Lineal (modelo lineal)

Parámetros (intercepto y pendiente)Intercepto (respuesta media)

Pendiente (efecto de la variable explicativa sobre la respuesta)Error (residuo)

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Estadística

Page 35: Geoestadistica descriptiva

35

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

Datos CuantitativosDatos Cuantitativos

NotaciónVariable Respuesta: y

Variable Explicativa: x

Modelo de Regresión Lineal Simple: yi=+xi+ei

Intercepto: Pendiente:

Error: e

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

Modelo Estimado(recta de regresión)

bxay ˆ

xbya

2

11

2

111

n

ii

n

i

n

ii

n

ii

n

i

xxn

yxxynb

Método de Estimación: Mínimos CuadradosMínimos Cuadrados

iii yye ˆResiduos o Errores

Estadística

Page 36: Geoestadistica descriptiva

36

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

DATOSDATOS

MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei

x y

)1(x )(y1

)2(x )(y2

)(nx )n(y

MODELO ESTIMADO

bxay ˆ

xbya

2

11

2

111

n

ii

n

i

n

ii

n

ii

n

i

xxn

yxxynb

ESTIMADORES

iii yye ˆ

ERRORES

Estadística

Page 37: Geoestadistica descriptiva

37

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

niño edad (meses) talla (cm) i xi yi

1 3 55 2 6 68 3 5 64 4 5 66 5 3 62 6 4 65 7 9 74 8 8 75 9 9 73

10 7 69 11 6 73 12 5 68 13 8 73 14 6 71

y=talla / x=edad / n=14

95614

1

i

iy 3,68y 6,5ys

8414

1

i

ix 6x 2xs

07,9),cov( yx 88,0xyr

586314

1

i

iiyx 55614

1

2 i

ix

Estadística

Page 38: Geoestadistica descriptiva

38

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

M o d e l o E s t i m a d o bxay ˆ

44,2b 64,53a

xy 44,264,53ˆ

Interpretación de los resultados

- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta.

- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.

Estadística

Page 39: Geoestadistica descriptiva

39

REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple

Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1)

Bondad de Ajuste del Modelo R2 = 0,77

niño edad (meses) talla (cm) Talla estimada error

i xi yi iy ie 1 3 55 61,0 -6,0 2 6 68 68,3 -0,3 3 5 64 65,8 -1,8 4 5 66 65,8 0,2 5 3 62 61,0 1,0 6 4 65 63,4 1,6 7 9 74 75,6 -1,6 8 8 75 73,2 1,8 9 9 73 75,6 -2,6 10 7 69 70,7 -1,7 11 6 73 68,3 4,7 12 5 68 65,8 2,2 13 8 73 73,2 -0,2 14 6 71 68,3 2,7

86,402)(14

1

2 i

ii yy

7,92)ˆ(14

1

214

1

2

i

ii

ii eyy

Estadística