10
24/01/2011 1 OBJETIVO: BUSCAR POSIBLE RELACIÓN ENTRE DOS VARIABLES ANÁLISIS DE DATOS DOS VARIABLES AÁLISIS DE DATOS DOS VARIABLES - VISIÓ HELICÓPTERO PLAN DE EVALUACIÓN - ESTADÍSTICA I - SEMESTRE 2006-2 - INGENIERÍA INDUSTRIAL - SECCIONES 01 Y 03 TEMA SUBTEMA CONTENIDOS INSTRUMENTO POND. SUBT E S T O C Á S T I C A INTRODUCCIÓN Presentación del Curso. Misión UNEG. Introducción a la Estadística.Estadística Descriptiva vs Estadística Inferencial.Nociones de Metodología de la Investigación. Diseño de una Investigación. Pregunta Central. Tormenta de Ideas.Esquema Organizativo de las ideas. Diseño y Aplicación del Instrumento de Medición. Evaluación Corta 0 3 3 MANEJO DE DATOS ANALISIS DE DATOS UNA VARIABLE Distribuciones de Frecuencia, tablas y gráficos Ejemplos usando variables que tienen diferentes escalas de medición. Cuándo es preciso agrupar los datos en clases?Diferentes tipos de gráficos, Elementos indispensables en tablas y gráficos. Diagrama circular, Diagrama de Barra. Diagrama de Tallo y Hoja. Histogramas, Diagrama de Caja, de mosaico. Laboratorio 1 3 25 Proyecto 1 10 Evaluación 1 10 Particip/Clase 1. Asign 2 MEDIDAS ESTADÍSTICAS: Visión General.Medidas de Posición y de Dispersión. Tendencia Central: Media, Mediana, Moda, otros promedios. Cómo se calculan, cómo se interpretan?.Uso de calculadora y Software estadístico.¿Cómo ingreso los datos? Como se generan los reportes?Medidas de Dispersión: Alcance o Recorrido, Desviación Media, Varianza, Desviación Estándar.Teorema de Chevishev. Cálculo de medidas cuando se presentan los datos YA AGRUPADOS Laboratorio 2 3 18 Proyecto 2 3 Evaluación 2 10 Particip/Clase 2. Asign 2 ANALISIS DE DATOS DOS VARIABLES Análisis de Regresión Lineal Simple. Análisis de Correlación. Uso de la calculadora y de sofware estadístico Laboratorio 3 2 17 Proyecto3 3 Evaluación 3 10 Particip/Clase 3. Asign 2 PROBA BILIDAD REGLAS DE PROBABILIDA D Probabilidad.Conceptos Básicos, eventos exhaustivos y mut. Excluyentes. Reglas de Probabilidad. Diagramas de Venn, tablas de contingencia, diagramas de árbol, Probabilidad Condicional, Teorema de Bayes, Reglas de Conteo. Proyecto 4 3 17 Evaluación 4 12 Particip/Clase 4. Asign 2 DISTRIBUCION ES DE PROBABILIDA D Distribuciones de Probabilidad: de variable discreta, de variable continua. Esperanza matemática o valor esperado y Varianza en distribuciones de probabilidad. Modelos de probabilidad, ensayo Bernoulli, Distribución Binomial, Distribución de Poisson, aproximación de D.Binomial a D.Poisson. Distribución Normal, aproximación de D. Binomial a D. Normal y de D. Poisson a D. Normal. Laboratorio 5 1 18 Proyecto 5 3 Evaluación 5 12 Particip/Clase 5. Asign 2

Expo 06. Análisis Bivariante

Embed Size (px)

DESCRIPTION

Analisis estadistico. Dos Variables

Citation preview

Page 1: Expo 06. Análisis Bivariante

24/01/2011

1

OBJETIVO:

BUSCAR POSIBLE RELACIÓN ENTRE DOS VARIABLES

ANÁLISIS DE DATOSDOS VARIABLES

A�ÁLISIS DE DATOS DOS VARIABLES - VISIÓ� HELICÓPTERO

PLAN DE EVALUACIÓN - ESTADÍSTICA I - SEMESTRE 2006-2 - INGENIERÍA INDUSTRIAL - SECCIONES 01 Y 03

TEMA SUBTEMA CONTENIDOS INSTRUMENTO POND. SUBT

ESTOCÁSTICA

INTRODUCCIÓNPresentación del Curso. Misión UNEG. Introducción a la Estadística.Estadística Descriptiva vs Estadística Inferencial.Nociones de Metodología de la Investigación. Diseño de una Investigación. Pregunta Central. Tormenta de Ideas.Esquema Organizativo de las ideas. Diseño y Aplicación del Instrumento de Medición.

Evaluación Corta 0 3 3

MANEJO DE

DATOS

ANALISIS DE DATOS

UNA VARIABLE

Distribuciones de Frecuencia, tablas y gráficos Ejemplos usando variables que tienen diferentes escalas de medición. Cuándo es preciso agrupar los datos en

clases?Diferentes tipos de gráficos, Elementos indispensables en tablas y gráficos. Diagrama circular, Diagrama de Barra. Diagrama de Tallo y Hoja.

Histogramas, Diagrama de Caja, de mosaico.

Laboratorio 1 3

25

Proyecto 1 10

Evaluación 1 10

Particip/Clase 1. Asign

2

MEDIDAS ESTADÍSTICAS: Visión General.Medidas de Posición y de Dispersión. Tendencia Central: Media, Mediana, Moda, otros promedios. Cómo se calculan, cómo se interpretan?.Uso

de calculadora y Software estadístico.¿Cómo ingreso los datos? Como se generan los reportes?Medidas de Dispersión: Alcance o Recorrido, Desviación

Media, Varianza, Desviación Estándar.Teorema de Chevishev. Cálculo de medidas cuando se presentan los datos YA AGRUPADOS

Laboratorio 2 3

18

Proyecto 2 3

Evaluación 2 10

Particip/Clase 2. Asign

2

ANALISIS DE

DATOSDOS

VARIABLES

Análisis de Regresión Lineal Simple. Análisis deCorrelación. Uso de la calculadora y de sofwareestadístico

Laboratorio 3 2

17

Proyecto3 3

Evaluación 3 10

Particip/Clase 3. Asign

2

PROBABILIDAD

REGLAS DE PROBABILIDA

D

Probabilidad.Conceptos Básicos, eventos exhaustivos y mut. Excluyentes. Reglas de Probabilidad. Diagramas de Venn, tablas de contingencia, diagramas de árbol, Probabilidad

Condicional, Teorema de Bayes, Reglas de Conteo.

Proyecto 4 3

17Evaluación 4 12

Particip/Clase 4. Asign

2

DISTRIBUCIONES DE

PROBABILIDAD

Distribuciones de Probabilidad: de variable discreta, de variable continua. Esperanza matemática o valor esperado y Varianza en distribuciones de probabilidad. Modelos de

probabilidad, ensayo Bernoulli, Distribución Binomial, Distribución de Poisson, aproximación de D.Binomial a D.Poisson. Distribución Normal, aproximación de D. Binomial a D. Normal y de D. Poisson a D. Normal.

Laboratorio 5 1

18

Proyecto 5 3

Evaluación 5 12

Particip/Clase 5. Asign

2

Page 2: Expo 06. Análisis Bivariante

24/01/2011

2

Herramientas Estadísticas para buscar relaciones entre:

1-. ENTRE DOS VARIABLES CATEGÓRICAS

2-. ENTRE UNA CATEGÓRICA Y UNA NUMÉRICA

3-. ENTRE DOS VARIABLES NUMÉRICAS

•Tablas de Contingencia

•Diagrama de Mosaico

•Diagramas de Barra

•Diagrama de Dispersión

•Análisis de Regresión

•Análisis de Correlación

Gráficos y Tablas comparativas de Grupos

Diagrama de Barra

1. RELACIÓN ENTRE DOS VARIABLES CATEGÓRICAS

Tablas de Contingencia Diagrama de Mosaico

Grafica de Mosaico. Relación Aprob/Reprob Matemática I Sem 2004-3 UNEGReprobadosAprobadosA1A2A3A4A5A6D1D2D3D4D5D6F1F2F3F4F5F60 30 60 90 120 150 180N° AlumnosProyecto de Carr

eraRelación Aprob/Reprob por ProyectoAdminContadIndustInform ReprobadoAprobadoProyecto

de CarreraAprobados Reprobados Inscritos

231 460 691

33,43% 66,57% 100%

Fuente: Actas Oficiales de Evaluación Final

Resumen elaborado por: Zoraida Pérez S.

MATEMÁTICA I

Ingeniería Informática

Ingeniería Industrial

Administración y Contaduría

RESUMEN ESTADISTICO

PERIODO LECTIVO 200403

AREA DE MATEMÁTICA

234

21274 138

95

62

150

172

245

Page 3: Expo 06. Análisis Bivariante

24/01/2011

3

P royec to d e C arrera

A p rob ad os R ep rob ad os In s c r itos

2 3 1 4 6 0 6 9 1

3 3 ,4 3 % 6 6 ,5 7 % 1 0 0 %

F u en te: A c tas O f ic ia les d e E valu ac ión F in a l

R es u m en e lab orad o p or: Z ora id a P érez S .

M A T E M Á T IC A I

In g en iería In form átic a

In g en iería In d u s tr ia l

A d m in is trac ión y C on tad u ría

R E S U M E N E S T A D IS T IC O

P E R IO D O L E C T IV O 2 0 0 4 0 3

A R E A D E M A T E M Á T IC A

2 3 4

2 1 27 4 1 3 8

9 5

6 2

1 5 0

1 7 2

2 4 5

2. Relación entre una variable categórica y una numérica.

F M

sex$

15

20

25

30

35

po

st

Grafico de Caja. Comparación entrealumnos y alumnas del nivel de dificultadpercibido después de saber su nota

Fuente: J. Paolini

Page 4: Expo 06. Análisis Bivariante

24/01/2011

4

Asignatura Inscritos AprobadosReprobadosRelación Aprobado/Reprobado

Docente SecciónReprob. Aprob. InscritosIndiceAprob

IndiceReprob

MediaAritmétic

DesviaciónEstándar

4333456 1 20 16 36 44,44% 55,56% 5,3 1,3

4333456 2 30 13 43 30,23% 69,77% 4,6 2

1111111 3 28 14 42 33,33% 66,67% 6,8 1,3

2345678 4 25 11 36 30,56% 69,44% 7,0 1,3

2345678 5 24 18 42 42,86% 57,14% 7,7 1,3

5555555 6 23 23 46 50,00% 50,00% 8,4 1,3

2121212 1 32 6 38 15,79% 84,21% 9,1 1,3

2121212 2 30 10 40 25,00% 75,00% 3,4 1,3

3333333 3 34 7 41 17,07% 82,93% 3,4 1,3

3333333 4 29 10 39 25,64% 74,36% 3,4 1,3

5555555 5 20 18 38 47,37% 52,63% 3,4 1,3

7676767 6 27 11 38 28,95% 71,05% 3,4 1,3

6767676 1 25 15 40 37,50% 62,50% 3,4 1,3

8888888 2 14 20 34 58,82% 41,18% 3,4 1,3

5656565 3 16 14 30 46,67% 53,33% 3,4 1,3

5656565 4 29 10 39 25,64% 74,36% 3,4 1,3

8899990 5 27 3 30 10,00% 90,00% 3,4 1,3

8899900 6 27 12 39 30,77% 69,23% 3,4 1,2

691 231 460 33,43% 66,57%

33,43% 66,57% 100%

Fuente: Actas Oficiales de Evaluación Final

Resumen elaborado por: Zoraida Pérez S.

NOTA: ESTOS DATOS SON FICTICIOS. SOLO PARA VER EL MODELO DE REPORTE

PROYECTO DE CARRERA: INGENIERÍA INDUSTRIAL

RESUMEN ESTADISTICO

PERIODO LECTIVO 200403

AREA DE MATEMÁTICA

Matematica III

Matematica II

Matematica I

234

212 74 138

245 95

62

150

172

39%

61%

74%

26%

65%

35%

Relación entre Variables. Ejemplo

RELACIÓN ENTRE

VARIABLESCAUSAL

DE ASOCIACIÓN

UNA VARIABLE PREDICTORA

MAS DEUNAVARIABLE PREDICTORA

x xix1 x2

VARIABLE“y”

Para pronosticar

VARIABLE

“y”

Para pronosticar

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN SIMPLE

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN MÚLTIPLE

utilizautiliza

3. RELACIÓN ENTRE VARIABLES NUMÉRICAS

Page 5: Expo 06. Análisis Bivariante

24/01/2011

5

X VARIABLE PREDICTORA

3. RELACIÓN ENTRE VARIABLES NUMÉRICAS

Se busca predecir o estimar el comportamiento de una variable (Y)a través de la relación que ésta pueda tener con otra variable (X)

Y VARIABLE A PREDECIR

XPRECIO

YVENTAS

DATOS

Diagrama de Dispersión

X (PRECIO)

Y (

VE

NTA

S)

3. Relación entre DOS Variables Numéricas

Diagramas de Dispersión

No hay evidencia de quex se relacione con y

Page 6: Expo 06. Análisis Bivariante

24/01/2011

6

MODELOS NO LINEALES

CÓMO GRAFICAR UN DIAGRAMA DE DISPERSIÓN?

XPRECIO

YVENTAS

18000 6

25000 5

35000 3

15000 4

18000 4

23000 3

30000 2

DATOS

Y (

VE

NTA

S)

(doc

enas

de

blus

as v

endi

das)

X (PRECIO en Bs.)

5000 10.000 15.000 20.000 25.000 30.000

1

2

3

4

5

6

Page 7: Expo 06. Análisis Bivariante

24/01/2011

7

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE CORRELACIÓN

DETERMINAR UNAECUACIÓ� DE ESTIMACIÓ�

(UNA FÓRMULA MATEMÁTICA QUE RELACIONE LAS VARIABLES CONOCIDAS CON LA VARIABLE DESCONOCIDA)

DETERMINAR UN INDICADOR QUE MIDA LA FUERZA O I�TE�SIDAD

DE LA RELACIÓN ENTRE VARIABLES

PROPÓSITOS DE:

ANÁLISIS DE REGRESIÓN LINEAL

xByA −=

donde:

22 )(xnx

yxnxyB

=

∑∑

BxAy +=ˆ

El objetivo es encontrar la ecuación de una recta...

La recta de mejor ajuste a la nube de puntos, se consigue por el

método de mínimos cuadrados

Page 8: Expo 06. Análisis Bivariante

24/01/2011

8

En la calculadora....

Modelo Casio fx82MS o similar:

1) Seleccionar el modo de Regresión Lineal......MODE – REG—LIN2) Limpiar la memoria estadistica......................SHIFT– MODE– SCL3) Introducir los pares de datos.........................18 6 ..................4) Al finalizar la introducción de los datos, buscar los valores de A, de B y de r

Shift – 2 (S-VAR) -- replay a la derecha hasta encontrar a A , B, y r

, M+

Visualización de CorrelaciónProgramado por Erich Neuwirth

target value -0,6

empirical(data) value -0,6122

-3

-2

-1

0

1

2

3

-3 -2 -1 0 1 2 3

Desplace la barra para cambiar la correlación

Coeficiente de correlación ( r )

Page 9: Expo 06. Análisis Bivariante

24/01/2011

9

Una forma de ver el error estándar de estimación es concebirlo como la herramienta estadística que podemos usar parahacer un enunciado de probabilidad sobre el intervalo alrededor del valor estimado de Y gorrito, dentro del cual cae el valorreal de Y. Podemos ver por ejemplo , en la Figura 12-12, que podemos estar 95,5% seguros que el valor real de Y caerádentro de DOS ERRORES ESTANDAR del valor estimado de Y gorrito. Llamamos a estos intervalos , alrededor de la Y gorrito(estimada) INTERVALOS DE PREDICCIÓN APROXIMADA

FUENTE: LEVIN-RUBIN (1996) ESTADISTICA PARA ADMINISTRADORES. Pag. 674

ERROR ESTÁNDAR DE ESTIMACIÓN(Cómo se interpreta?)

Al hacer predicciones con base en la recta de mejor ajuste,es necesario observar las siguientes restricciones

RESTRICCIONES O LIMITACIONES

La ecuación debe usarse solo acerca de la población de la cual se extrajo la muestra

La ecuación debe usarse solo dentro del dominio muestral de la variable de entrada (x)

Si la muestra fue tomada en el año 2000, no espere que los resultados sean válidos para el año 1950 o el año 2006

HACER PREDICCIONES

No se debe esperar que el valor estimado ocurra exactamente; en vez de eso, “ Y gorrito sub 1” es el valor promedio de pares de zapatos de todas las veces que mantuve el precio de “X sub 1” bolivares .

Page 10: Expo 06. Análisis Bivariante

24/01/2011

10

X Y

DATOS

Y (

VE

NTA

S)

(N°

blus

as v

endi

das)

X (PRECIO en Bs.)

5000 10.000 15.000 20.000 25.000 30.000

1

2

3

4

5

6

ó

ó

bxay +=ˆ

22

xnx

yxnxyb

=

xbya −=

2

)ˆ( 2

=∑n

yyse

2

2

−−

=∑ ∑∑n

xybyayse

∑−

−=2

22

)(

)ˆ(1

yy

yyr

∑∑−

−+

=22

22

yny

ynxybyar

FÓRMULAS

Ecuación de estimación

Coeficiente de determinación

Error estándar de estimación