82
MÉTODOS ESTATÍSTICOS MÉTODOS ESTATÍSTICOS E NUMÉRICOS E NUMÉRICOS IES Isidro Parga Pondal. Departamento de matemáticas UNIDADE 3 UNIDADE 3 ÍNDICE ÍNDICE DISTRIBUCIÓNS BIDIMENSIONAIS

3. distribucións bidimensionais

Embed Size (px)

Citation preview

Page 1: 3. distribucións bidimensionais

MÉTODOS ESTATÍSTICOSMÉTODOS ESTATÍSTICOSE NUMÉRICOSE NUMÉRICOS

IES Isidro Parga Pondal. Departamento de matemáticas

UNIDADE 3UNIDADE 3

ÍNDICEÍNDICE

DISTRIBUCIÓNS BIDIMENSIONAIS

Page 2: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

ConceptosConceptos

1. Variables estatísticas bidimensionais.2.Táboas bidimensionais de frecuencias. Diagramas de dispersión.

3. Cálculo de parámetros.4. Dependencia funcional. Dependencia estatística.

5. Correlación.6. Correlación lineal. Coeficiente de Pearson.7. Regresión lineal. Rectas de regresión.

Page 3: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

1. Introdución1. Introdución

Cando vemos un rapaz de cinco anos e dicimos que está moi alto, estamos comparándoo co talle medio doutros nenos da mesma idade; é dicir, consideramos dúas variables, a idade e o talle, e a relación entre elas.

Page 4: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

1. Introdución 1. Introdución

Precisamente isto é o que imos tratar: a medida da relación entre dúas variables para ver o grao de relación que pode existir entre elas ou como poden influír unhas sobre outras.

Page 5: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•Neste tema centrarémonos nas estatísticas de dúas variables chamadas Variables Estatísticas Bidimendionais

•En calquera investigación onde observemos dúas variables para o seu estudo conxunto, interesa coñecer dúas cuestións:

1. Introdución1. Introdución

Page 6: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

• A posible relación entre as variables e, se existe, obter un índice que mida o grao desa relación.

Teoría da Correlación.•A obtención dunha fórmula que as relacione para, se coñecemos o valor dunha das variables, poder predicir o valor da outra cun determinado erro.

Teoría da Regresión.

1. Introdución1. Introdución

Page 7: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Pero...........

Por que se chama Regresión?

1. Introdución1. Introdución

Page 8: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

As teorías da correlación e a regresión son moi recentes e o seu descubrimento débese, en grande parte, ao médico inglés Sir Francis Galton (1.822-1.917).

1. Introdución1. Introdución

Page 9: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O contexto histórico que lle tocou vivir favoreceu o seu interese pola herdanza xenética: naceu o mesmo ano que George Mendel, co que mantiña unha grande afinidade, e ademais era curmán, por parte de nai, do célebre científico Charles Darwin.

1. Introdución1. Introdución

Page 10: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Estudou a relación entre: estatura media dun matrimonio - estatura media dos seus fillos adultos.

1. Introdución1. Introdución

Page 11: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Encontrou unha correlación forte: canto maior era a primeira, maior era a segunda. É dicir, canto máis altos son os pais, máis altos son os fillos. Pero...

1. Introdución1. Introdución

Page 12: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Sostiña a idea de que a pais de estatura moi, moi elevada corresponden fillos altos, pero non tanto. E pais moi baixos acostuman ter fillos baixos, mais non tan baixos.Esta observación levou a enunciar a Galton o seu principio da mediocridade:

“a estatura dos fillos regresa cara a media da poboación”.

1. Introdución1. Introdución

Page 13: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

De aí o termo de regresión que, desde entón, utilízase para designar unha relación estatística calquera.

1. Introdución1. Introdución

Page 14: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•A observación de Galton é sen dúbida certa, pero o suposto da regresión é totalmente falso e considérase actualmente como a primeira falacia da teoría da regresión.•A xustificación que se dá hoxe a este feito é que os valores extremos dunha distribución débense en gran parte ao chou.

1. Introdución1. Introdución

Page 15: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•Os traballos de Galton foron continuados, entre outros, por Pearson, que reelaborou e mellorou as súas ideas.

•A Galton e a Pearson considéraselles hoxe en día os pais da estatística moderna.

1. Introdución1. Introdución

Page 16: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Ao efectuar o estudo estatístico dun colectivo pode ser que en cada observación se considere un só carácter (peso, estatura, profesión, etc.), entón temos unha variable estatística unidimensional.

Se, pola contra, se consideran dous caracteres dun mesmo individuo (estatura- idade, profesión- sexo, etc) temos as variables estatísticas bidimensionais.

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 17: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Formalmente , defínese unha variable estatística bidimensional como o par (X,Y), onde X representa á primeira variable e Y á segunda. X e Y non teñen por que ter:

o mesmo número de valores ser da mesma clase sendo da mesma clase, unha pode ser continua e

outra discreta

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 18: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplos: Sexo e estado civil Peso e altura Número de irmáns e idade Altura e perímetro torácico

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 19: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Sexa a variable (X,Y) que toma os valoresX={x1,x2,x3,…,xn} Y={y1,y2,y3,…,ym}

Coa expresión (xi,yj) representamos un valor da variable que terá unha frecuencia absoluta fij que representa o número de veces que se repite o par (xi,yj) na mostra.

Cando teñamos o mesmo número de observacións para as variables X e Y, os pares de observacións denotarémolos por (xi,yi) e a súa frecuencia por fi

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 20: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dependendo das características das dúas variables estudadas, os datos represéntanse de diferentes xeitos. Vexamos os tres tipos máis utilizados de táboas:

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 21: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo I (Táboa bidimensional simple) Utilízase cando as dúas variables toman o mesmo número de valores e cando temos poucas observacións

yn…..…..….…y2y1Y

xn….….…..….x2x1X

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 22: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplo:A distribución de idades e presión arterial de 10 persoas é:

12

32

16.9

70

17

67

16.61314.613.512.511.311.5Tensión (Y)

63425142352830Idade (X)

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 23: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo II (Táboa bidimensional simple con frecuencia) Utilízase cando as dúas variables toman o mesmo número de valores e temos moitas observacións

fn…..…..…..f2f1fi

yn…….....…..y2y1Y

xn………..……x2x1X

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 24: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplo:As cualificacións de 30 alumnos en Historia e en Xeografía foron:

2

6

7

1

7

7

1

9

8

2321054Número de

alumnos (fi)

1076552Y=nota Xeografía

1066543X=nota Historia

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 25: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo III (Táboa de dobre entrada) Utilízase cando hai un número elevado de observacións e ademais o número de parellas diferentes é tamén alto. As variables poden ter un número diferente de valores ou modalidades.

Podemos atopar exemplos na seguinte páxina de internet: www.hiru.com/es/matematika

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 26: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Diagramas de dispersiónA representación gráfica proporciona unha imaxe visual que dá unha primeira relación entre as variables.

Para representar unha variable estatística bidimensional (X,Y), representamos no eixe horizontal os valores de X e no vertical os de Y. Obténse un conxunto de puntos sobre o plano que se denomina diagrama de dispersión ou nube de puntos.

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 27: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Vexamos un exemploNa web do IGE (Instituto Galego de Estatística) podemos ver unha táboa que reflite a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos os concellos da Coruña.

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 28: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dada unha variable estatística bidimensional (X,Y), as distribucións X e Y estudadas por separado chámanse distribucións marxinais.Para cada unha destas variables, pódese calcular os parámetros media, varianza e desviación típica.

Definiremos un parámetro conxunto para ambas variables: A COVARIANZA( ) ( )

yxN

fyx

N

fyyxxS

n

iiii

n

iii

XY ⋅−⋅⋅

=⋅−⋅−

=∑∑

== 111

4. Cálculo de parámetros4. Cálculo de parámetros

Page 29: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

A relación entre dúas variables pode ser: Dependencia unilateral: A primeira variable

inflúe sobre a segunda, pero a segunda non inflúe sobre a primeira. O consumo de alcohol inflúe sobre o número de accidentes de tráfico, pero non ao revés.

Dependencia mutua: Unha variable inflúe sobre a outra e viceversa. O prezo dun produto e a demanda del.

4. Cálculo de parámetros4. Cálculo de parámetros

Page 30: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dependencia non observable: Unha variable inflúe sobre a outra pero a través dunha variable que non observamos directamente. O número de ordenadores ten relación co número de accidentes; existe unha variable non observada que é o nivel de vida que fai que haxa máis coches onde hai máis ordenadores.

Dependencia espuria: Prodúcese cando nun determinado estudo illado, entre dúas variables hai unha relación debida a unha casualidade, á manipulación aritmética dos datos ou inclusive ser provocada polo observador que colle só os datos que lle interesan. Nun estudo feito en Babiera, G.M. Jenkins obtivo unha altísima relación entre o número de nacementos e o número de cegoñas.

4. Cálculo de parámetros4. Cálculo de parámetros

Page 31: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Imos ver que a relación que se pode dar entre dúas variables pode ser de dous tipos.

Vexamos dous casos:

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 32: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 1: Se un automobilista conduce durante unha hora, percorrerá tantos máis km canto maior sexa a súa velocidade.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 33: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 1 As variables:

espazo percorrido – velocidade están claramente relacionadas, e hai unha

fórmula coa que podemos calcular, exactamente, o espazo en función da velocidade.

Diremos entón que neste caso a relación entre as dúas variables é funcional.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 34: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 2: As persoas, en xeral, pesan máis canto máis altas son.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 35: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 2As variables:

peso – estatura tamén están relacionadas, pero non se pode

dar unha fórmula que permita obter o peso dunha persoa coñecendo a súa estatura.

Neste caso dise que entre as variables hai unha relación estatística ou correlación.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 36: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O obxecto do noso estudo é a relación estatística ou

correlación

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 37: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Defínese a correlación entre dúas variables como a relación ou interdependencia que existe entre elas; a modificación nunha das variables produce o cambio da outra.

A relación estatística pode ser positiva ou negativa e tamén pode ser forte ou débil.

6. Correlación6. Correlación

Page 38: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos exemplos seguintes debes dicir se, entre as dúas variables:

Hai relación ou non.Se a hai, se é funcional ou relación

estatística (correlación). Neste último caso, indicar se é positiva

ou negativa, forte ou débil.

6. Correlación6. Correlación

Page 39: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 1:Velocidade coa que se lanza unha pedra cara arriba- Altura que alcanza

6. Correlación6. Correlación

Page 40: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 2: Talle de zapatos–estatura

6. Correlación6. Correlación

Page 41: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 3: Raio da circunferencia – Lonxitude da circunferencia

6. Correlación6. Correlación

Page 42: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 4Índice de mortalidade infantil dun país – nº de médicos por cada 1000 habitantes.

6. Correlación6. Correlación

Page 43: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 5: Kwh consumidos nunha vivenda en outubro – custo do recibo da luz

6. Correlación6. Correlación

Page 44: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 6: Nº de persoas que viven nunha casa – custo do recibo da luz

6. Correlación6. Correlación

Page 45: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Pero, como podemos saber, dun xeito fiable, se dúas variables están relacionadas?

6. Correlación6. Correlación

Page 46: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos intentalo estudando as nubes de puntos da variable bidimensional correspondente.

6. Correlación6. Correlación

Page 47: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

6. Correlación6. Correlación

Page 48: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 1 e 4 a medida que aumenta a variable X, aumenta a variable Y. Diremos que entre as variables existe unha correlación directa ou positiva.

6. Correlación6. Correlación

Page 49: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 2 e 3, obsérvase que a medida que aumenta a variable X, diminúe a variable Y. Diremos que existe unha correlación inversa ou negativa.

6. Correlación6. Correlación

Page 50: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 1 e 2 observamos que os puntos da nube se poden condensar arredor dunha recta. Diremos que entre as variables existe unha correlación lineal.

6. Correlación6. Correlación

Page 51: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 3 e 4, obsérvase que os puntos da nube non se poden condensar arredor dunha recta, senón a unha curva. Diremos que existe unha correlación curvilínea.

6. Correlación6. Correlación

Page 52: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

No gráfico 5 observamos que non se pode establecer unha relación entre as variables. Diremos que as variables son incorreladas.

6. Correlación6. Correlación

Page 53: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Para mellorar o estudo gráfico proporcionado pola nube de puntos dunha variable estatística bidimensional definimos o coeficiente de correlación lineal de Pearson.

6. Correlación6. Correlación

Page 54: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O coeficiente de correlación de Pearson defínese mediante a seguinte expresión:

sendo Sxy a covarianza da variable bidimensional (X,Y)Sx a desviación típica de X

Sy a desviación típica de Y

yx

xy

SS

Sr

⋅=

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 55: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O coeficiente de correlación lineal de Pearson é un número, represéntase por r e cumpre:

• Está comprendido entre -1 e 1.• r = 1 corresponde á maior correlación

positiva, neste caso entre as variables hai unha relación funcional.

• r = -1 corresponde á maior correlación negativa, neste caso entre as variables hai unha relación funcional.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 56: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•Se r é próximo a 1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta crecente, a correlación entre as variables é positiva e forte.

•Se r é próximo a -1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta decrecente, a correlación entre as variables é negativa e forte.

•Se r é próximo a 0: o axuste non é aceptable, indicando que non existe relación lineal entre as variables ou é débil.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 57: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO:Os seguintes coeficientes de correlación -0,73 ; 0,69 ; - 0,98 corresponden ás variables do primeiro exemplo: Á vista dos gráficos asígnalle a cada par de variables a súa correlación.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 58: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Defínese a teoría de regresión entre dúas variables como unha parte da Estatística que trata de condensar a nube de puntos mediante unha función matemática coñecida para achar o valor dunha das variables coñecido o valor da outra.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 59: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Entre todas as funcións matemáticas que se poidan axustar a unha nube de puntos, escolleremos a que mellor se adapte aos puntos e a que permita facer as predicións máis fiables.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 60: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

As funcións máis utilizadas para facer regresións son:

RectaParábolaExponencial

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 61: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Neste tema, centrarémonos na Regresión Linear.

O noso problema será obter a ecuación da recta y=ax+b, que mellor se adapte á nube de puntos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 62: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O método matemático que nos permite calcular esta recta é o Método dos Mínimos Cadrados e a recta así obtida chámase Recta de Regresión.Vexámolo graficamente

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 63: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Recta de regresión de y sobre x

Recta de regresión de x sobre y

Vexámolo graficamente:

( )xxS

Syy

X

XY −=−2

( )yyS

Sxx

y

XY −=−2

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 64: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Vexamos un exemplo:O ESTUDO, A TELE E O NÚMERO DE SUSPENSOS

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 65: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Un psicólogo escolar ten a sospeita de que os alumnos que estudan un número moi reducido de horas dedican, en cambio, moitas horas a ver a televisión e obteñen malas notas.

Quere probar se a súa sospeita é certa.

Organiza o traballo do seguinte xeito:

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 66: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 1:Decide que variables vai estudar. Neste caso son tres para cada alumno: Horas de estudo – Horas de tv. – Nº de suspensos, vai estudar a relación entre cada dúas:

• Horas de estudo – Horas de tv• Horas de estudo – Nº de suspensos• Horas de tv – Nº de suspensos

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 67: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 2: Como non vai estudar a todos os alumnos da cidade (son demasiados) escolle ao azar 15, é o que se chama unha mostra.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 68: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 3: Pásalles unha enquisa na que lles pregunta a cada un o nº de horas que dedican ao estudo e á tv, e o nº de suspensos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 69: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 4:Recolle os datos nunha táboaAlumno nº Nº horas de estudo N horas TV Nº de suspensos1 4 2 12 5 1.5 03 4 2.5 34 2.5 4 25 6 0.5 06 0.5 5.5 67 1 5 28 2 4 59 3 2.5 310 4.5 1.5 211 3 3.5 412 1.5 5 313 3.5 2.5 414 5.5 1 115 2.5 3.5 3

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 70: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 5:Representa en diagramas cartesianos os pares de variables seguintes:

Horas de estudo – Horas de tvHoras de estudo – Nº de suspensosHoras de tv – Nº de suspensos

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 71: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Horas de estudo – Horas de televisión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 72: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

8.-Regresión linear. Rectas de regresión8.-Regresión linear. Rectas de regresión

Horas de estudo – Número de suspensos

Page 73: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

8.-Regresión linear. Rectas de regresión8.-Regresión linear. Rectas de regresión

Horas de televisión – Número de suspensos

Page 74: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Observa os diagramas e trata de contestar ás cuestións

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 75: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Existe relación entre as variables?Entre cales che parece que a correlación é máis forte? , e máis débil?Poderías distinguir, nos diagramas, entre a correlación positiva e a negativa?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 76: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión?E cantos suspensos terá?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 77: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos responder mellor a estas preguntas se axustamos unha recta aos puntos, debuxamos unha recta que se aproxime o mellor posible; é dicir, calculamos a

recta de regresión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 78: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión?E cantos suspensos terá?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 79: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO: Vimos a nube de puntos que representaba a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos

os concellos da Coruña. Existirá algún tipo de relación entre esas dúas variables?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 80: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Existe unha certa correlación linear e positiva

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 81: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Para isto axúdanos a recta de regresión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 82: 3. distribucións bidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos ver que serían, aproximadamente, 400 vehículos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión