Capt 5 Regresion Simple

-A HOMOGENEIZACIéN UT!LIZANDO MODELOS DE REGRESIóN UNEAL S¡MPLE

: .I CONCEPTUACIóN

: urodelo Clásico de Regresión tuvo su origen en los trabajos de astronomía elabora-

" , r -¡r' Gauss en e! período de 1809 a 1821 . Actuahnente el análisis de regresión es una-: : S rsrri&s de la teoría estadística rlrás utilizados en la investigación científica. Es uua;-- - r3 adecuada cuaudo se desea estudiar el conrpoñalniento de una variable (variable;r:..liente) err relación a otras que son responsables de su foruración (variables" :t::ndientes).

-:, Ingeniería dc Tasaciones generalurente se considera coluo variable dependiente,, ::ecios de contado de los datos de niercado eu oferta o efectivamente negociados, ¡,

. - -- r.ariables independientes, las respectivas características relacionadas con los as-

r,r-"rs físicos y de localización, así como los aspectos económicos (dato de oferta o,:-..,'ción, época de ocurrencia del evento, etc.). Se observa que las variables- -=::ndientes pueden ser tauto de uaturaleza cuantitativa (área, frente, etc"), colllo*;. :=tiva (uaturaleza de la infornración, orientación solaq etc.)

- -:ndo la variabilidad de los precios puecle ser explicada por apenas una variable":=-=:diente, a través de uua función Iineal, se utiliza el modelo de regresión lineali * . ;. que será tratado en este capítulo. Cuando lnás de una variable indepencliente es

,r-:.:,::ie para esta explicacióu, se adopta el moclelo de regresión lineal nrúltiple, que será

uu,,-:- - Je los próximos tres capítulos. Aunque en la práctica, lo rnás usua! es el ln«rdelo dets:: :,:l lineal rnúrltiple, se inicia con el rnodelo de regresión lineal sirnple, debido a las

::les de entendimiento de las deducciones e interpretaciones. No obstante, todos. -:eptos de regresión lineal sirnple puedeu ser generalizados para el ntodelo de, -rlinealmúltiple.- :lelo de regresión lineal sirnple, para explicar Ia variabilidad de todos los rr precios

::do (I/), a través de las variacioues provocadas por una variable úrnica ({), se-:a por una funciórt lineal del tipo 5.1 y por las cinco hipótesis básicas clefinidas

. : ..:nción Lineal

i= 1,..,111 (5.1)

lHc¡x¡¡nir oe Tosocroxrs§p

-.- - ..1 ¡

-.- \-. ',' 1

.'.

--r Iac

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN UNEAL SIMPLE-.ry- es llamada variable dependiente, variable explicada o variable respuesta.

- es llamada variable independiente, variable explicativa o covariable.

- se denominan parámetros de la población.

- son los errores aleatorios del modelo.

b) Hipótesis Básicas

1i) La variable independiente debe ser representada por números reales que no

r rntengan ninguna perturbación aleatoria.

23) El número de observaciones, m, debe ser superior al número de parámetros esti-

nrados. es decir, que para el caso de la regresión lineal simple debe ser superior a dos.

3) Los effores de las variables aleatorias tienen valor esperado nulo y varianza cons-

tante, esto es, E (e,) = 0 y Var (q) : d.

4e) Los errores son variables aleatorias con distribución normal.

5a) Los errores no están correlacionados, son independientes bajo la condición de

normalidad.

Los valores medios de mercado para cada nivel de,{ son calculados por el compo-

nente sistemático del modelo 5.1, que se representa por:

§o+ §,X, i:1,...,nt (s.2)

Como no es viable el levantamiento de todos los datos del mercado de una poblaciór¡en lapráctica se trabaja con un subconjunto de n elementos de estapoblación, denominadamuestra, a través de la cual, utilizando inferencia estadística se estiman los parámetros de

la población. La ecuación del modelo inferido está dada por:

v-r --I

i:1,...,n (s.3)

Y.,.....,Y,- son los precios observados en el mercado, forman parte de la muestra.b0, b t - son los parametros estimados correspondientes a Fo, F,.ei,...,en - son los respectivos estimadores de€,,.......,€,, también denominados resíduos

delmodelo.

Y :bo+b,X + s

Donde:

§pnrrr*r Arv¡s Duus

HOMOGI

Una estimación d<

t,: bo+b,x,

En ungráfico formen ejes cartesianos, dtica que varía en cadlineal se representa ¡también como la rectr

Y, (dependiente)

figrra S. t -

Cabe destacar q

comportamiento del rlapráctica este,comp

Un caso particular,posee apenas un parátal. En la práctica, er

formación de los pre<

general, y el modelo e

Y,: Bo+ t,.

5.2 DIAGRAMA D

El primerpaso parminadavariable influ,en una tasación se delen relación a la distacasos distintos, preset

HoMoGENEtzActóN unuzANDo MoDELos DE REGREstóN uNEAL slMpLE

Una estimación del valor medio del mercado está dada por:

b,,+b,X

En un gráfico formado por [ares de puntos obsen'ados en el mercado ¡Xl;{), dispuestosen ejes cartesianos, donde I corresponde a los precios praticados ) ,{ a una caracterís-tica que varía en cada uno de estos datos. la parte explicada del modelo de regresiórrlineal se representa por la recta que pasa más próxima a todos los puntos. conocidatambién como la recta de regresión, como se muestra en 1a fieura -i.1.Yr (depend¡ente) : §o+ §,x, + e,

Muestna Y,: bo+ b.X.* e,

X, ( ndepenc e'::

Figura 5.1 - Recta I (media de la población) y Reca 2 reCta de Ia muestra)

Cabe destacar que con la recta 1 se obtiene una estimación del vercladerocomportamiento del mercado, que sería lo obtenido si se ler antara toda la población. Enla práctica este comportamiento se infiere con la recta l.

Un caso particular del modelo de regresión lineal simple es el modelo nulo. Este modeloposee apenas un parámetro. Su representación eráfica está dada por una recta horizon-tal. En la práctica, esto significa que no existe ninsuna variable explicativa sobre laformación de los precios, pudiendo estimarse el r alor de mercado apenas por la mediageneral, y el modelo está dado por:

Y,: Po+ e ,, i: l,..,nt (s.5)

5.2 DIAGRAMA DE DISPERSIóN

El primer paso para analizar el comportamiento de los precios en relación a una deter-minada variable influyente es analizar el gráfico de dispersión. Por ejemplo, suponga queen una tasación se desea analizar el comportamiento de los precios unitarios de parcelasen relación a la distancia a un determinado polo valorizante, pudiendo ocurrir cuatrocasos distintos, presentados en las figuras 5 .2, 5.3 , 5 .4 y 5 .5 .

Y, :

\ recta 1

lxcrxr¡rí¡ o¡ Trucrox¡sV

i : 1,...,n (5.4)

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN L¡NEAL SIMPLE§q;;p- HOM(

Este analisis iniel mercado inmobiregresión.Al plotezpuede encontrar es

frg.5.7.Vu (R$/m,)

Figura 5.6

Obsérvese que r

datos, el tasador a

buena aproximaciópara terrenos que e

este intervalo no hr

permitida la extrap,

si se desea estimarbastaría con buscaresultado R$40/m2

Es muy importtmodelo de regresi(más potentes del n

Otras situacionsecciónyotrasalc

Considerando e

muestra en la figurfenómeno, como e

delmercado para d

es equivalente a ha

FBura 5.2 - Caso 1 Figura 5.3 - Caso 2

Figura 5.4 - Caso 3 Figura 5.5 - Caso 4

De acuerdo al comentario en la sección 2.2.4.2, por la simple observación gráfica se

pueden detectar cuatro informaciones muy importantes de los datos: la tendencia, laintensidad, la forma funcional de la curva, y la dispersión de los datos.

En los casos presentados en las figuras 5.2, 5.3 y 5.4 se verifica una tendencia dedecrecimiento del valorunitario amedidaque laparcela se aleja del polo valorizante.Esto que parece bastante trivial, es muy importante para comprobar la creen cia a priorique el tasador tiene sobre el comportamiento del mercado. En los puntos de la figura 5.5no se puede extraer la misma conclusión. En este caso el mercado está indicando,aparentemente, que el polo no ejerce ninguna influencia sobre la formación de los precios.La inclinación de la recta indica la intensidad con que la variable independiente influyesobre la variable dependiente.

En cuanto a la forma de la curva se verifica que los puntos dispuestos en las figuras5.2,5.4 y 5.5 presentan características de linealidad, mientras que los de la figura 5.3indican un comportamiento exponencial. Esto es fundamentalparael tasador, pues en loscasos 1, 3 y 4 se pueden ajustar los datos a una recta, utilizando regresión lineal, pero enel caso 2 eso no es posible, sino se procede a la debida transformación para linealizar losdatos.

Por último, una cuarta información de bastante interés en cuanto a la dispersión de losdatos a lo largo de la curva que mejor se ajusta a los datos. Se verifica en los casos 1, 2,y 4 que la dispersión es aparentemente constante, es decir, aparenta homocedasticidad ovarianza constante de los errores; mientras que el caso 3, lavarianza de los datos escreciente a medida que se aleja del polo valorizante, presentándose condiciones de hetero-cedasticidad.

En capítulos posteriores se demostrará que los modelos ideales son aquellos que pre-sentan condiciones favorables de linealidad, homocedasticidad y con intensidad alta, estoes, rectas distantes de la recta horizontal, además de otras cualidades.

Ynr"*r Aw¡s Drxrm

' :.: :.: ::.:': :.: :.. . ... . .

lt- - -¡- - - l- -

lttt

--J-__L_tt

Figura 5.8

HOMOGENEIZACIÓN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPLEru}',-Este analisis inicial es fundamental para formular un modelo aceptable para explicar

el mercado inmobiliario. La curva que pasa más cerca a los puntos es llamada la cuiva deregresión. Al plotear los puntos en un papel milimetrado, corlo se muestra en la fig. 5.6 sepuede encontrar esta curva con bastante aproximación, como por ejemplo la recla de lafig.5.7.Vu (R$/m'?) Vu (RS/m,)

l501-

tt

1

Figura 5.7

Obsérvese que sin necesidad de usar equipos o sistemas para el tratamiento de losdatos, el tasador al trazar esta recta, está estimando un modelo de regresión con unabuena aproximación y podría, a partir de ahí, usar el modelo para estimar el valor mediopara terrenos que estuviesen a unadistanciaentre I y5 km. del polo valorizante. Fuera deeste intervalo no hay seguridad en cuanto al comportamiento de los precios, no siendopermitida la extrapolación. Elmodelo de regresión es intrínsecamente interpolativo. Así,si se desea estimar el valor para un terreno que estuviese a 3 Km. de distancia del polo,bastaría con buscar el precio medio correspondiente en la figura 5.7 y encontrar comoresultado R$40/m2.

Es muy importante que el tasador comprenda lo que está haciendo cuando ajusta unmodelo de regresión, siendo el análisis gráfico una de las herramientas más sencillas ymás potentes del modelaje.

Otras situaciones interesantes pueden ocurrir. Algunas serán presentadas en estasección y otras a lo largo del libro.

Considerando el mismo ejemplo, puede ocurrir una distribución de los datos como semuestra en la figura 5.8. En este caso se puede considerar una sola recta para explicar elfenómeno, como en la figura 5.9, pero no habría seguridad en cuanto al comportamientodel mercado para distancias en el intervalo entre b y c. Utilizar el modelo

"n .rt" intervalo

es equivalente a hacer una extrapolación interna, o mejor una..intrapolación,,

rII

II

X,.

Iwlxc¡xr¡níl o¡ Tslc¡ox¡s

ttttt- - -¡- - -|- - - I - - -r- - - I

lttttattttl

_ - -J _ _ _l _ _ -l _ r_L _ _ _.,l

I¡IIIttt.t.lltttt

- - "1 - - -T - - -'l - - -r- -.- 1tttltttltt

1

Figura 5.6

r'jab

tt-_J___L__

-

lt

rrll---'l---T--{---l--¡-

rtl¡ttll

Figura 5.9

HoMocENElzActóx unuaxoo MoDELos o¡ n¡cnrslóx IINEAL slMPtEryOtro caso bastante interesante, que puede llevar al tasador a cometer elrores graves

se presenta en la figura 5.10. La recta de regresión (recta 1) pasa por la media del

conj unto y por un punto aislado como se muestra en la figura 5 . 1 I .

Obsérvese que el comportamiento del mercado presentado en la figura 5.10 sería

explicado por larecta} de la figura 5 . 1 1 , pero debido a un punto discrepante, la recta está

diitorsionáda, invirtiendo la tendencia del mercado. Los puntos de este tipo o el mismo

conjunto de puntos son denominados puntos influyentes y son bastante peligrosos. Los

mismos pueden ser detectados fácilmente con un análisis gráfico.En el caso de los puntos de la figura 5. 1 2 se verifica que no hay información suficiente

para utilizar el modelo fuera del intervalo [a;b], pues estos tres puntos que no pertenecen

a [a;b] son determinantes en la inclinación de la recta mucho más que los que pertenecen

al conjunto formado por el «grueso» de los datos. Obsérvese que si los tres puntos estuvieran

com6rlos de la figura 5.13, el comportamiento del mercado estaría completamente

desvirluado. Este ei un caso típico de desequilibrio de la muestra. Elpequeño conjunto de

puntos no es suficiente para explicar por sí solo su tendencia. También son puntos

influyentes.

= 3-.a S 12 Figura 5.13

Er" el caso de los puntos representados en la figura 5.14 se verifica que se trata de un

;¿-o,¡:ipi;o de un comportamiento de datos provenientes de dos poblaciones distintas,

: -- -- -- : tr e-templo. datos de oferta y datos de transacciones. Si no se obserua el fenómeno,

: :-::=1,: a,iustado seria e[ de la recta I de la figura 5.14, pero en la realidad el

: ,- -: : :=:'. e:lto del mercado debe ser explicado por las rectas paralelas mostradas en la

Figura 5.10 Figura 5.11

§t*-A¡.ws Drrr¡s

HOMO(

figura 5.15. Este caslo, asunto que será tr

Una disposicióninteracción entreuna'

los datos de oferta y

alejan del polo. En e

lelas como las mostr

1o 7.

5.3 LINEALIZACI

El proceso de reE

vados en el mercadcel fenómeno si la t<

observa este tipo de

linealizados por la r

Considérese, por eje

una recolección de c

precios unitarios de

tendencia de decrecilas áreas. En este ca

5.1 8, sería inadecua,

cia ala linealidad.

Figura 5.16

r HOMOGENEIZAC!óN UT¡IIZANDO MODELOS DE REGRESIóN tlNEAI SIMPI.Eryfiguta 5.15. Este caso sería resuelto con la inclusión de una variable dummy enel mode-.u-¡. áSUnto que será tratado en el capítulo 7.

A

Recta 1

=,:-'a 5.14

Una disposición de los puntos corno se muestra en la figura 5.1 6 es un caso típico de::eracciónentreunavariabledummyy la distancia aun polo valorizante, como por ejemplo,",ts datos de oferta y las transacciones decrecen de forma diferenciada a medida que se

alejan del polo. En este caso, el mercado sería explicado a través de dos rectas no para-r¿ias como las mostradas en la figura 5.17. Este asunto también será tratado en el capítu-ic r.

oa

a

aaa

Figura 5.16

5.3 LINEALIZAC¡óN

El proceso de regresión lineal simple se aplica para ajustar rectas a los puntos obser-r ados en el mercado. De esta forma, la recta solamente tendrá significado para explicarel fenómeno si la tendencia de los puntos fuese lineal. En la práctica, no siempre seobserva este tipo de tendencia. Sin embargo, algunos modelos no lineales pueden serlinealizados por la simple transformación de las escalas de medición de las variables.Considérese, por ejemplo, que los datos resumidos en la figura 5.1 8 son el resultado deuna recolección de datos de lotes de terreno, donde los puntos ploteados corresponden aprecios unitarios de ¡nercado (P) versus las respectivas áreas (A). Observe que hay unatendencia de decrecimiento en forma hiperbólica de los precios unitarios en relación conlas áreas. En este caso, el ajuste de una recta a los puntos, como se muestra en la figura5.1 8, sería inadecuado, pues sólo se pueden ajustar rectas a datos dispuestos con tenden-cia a la linealidad.

Figura 5.'17

lxc¡x¡¡nh or Trucronm§[p

HOMOGENEIZACIóN UTILIZANDO MODETOS DE REGRESIóN TINEAL SIMPLEVz:llP


Por ello, se hace necesario algunatransformación paralracerposible lautilización de laregresión lineal,esto es,unatransformaciónque linealice losdatos. Lasoluciónparaelpro-blemaenunciadoesutilizarunatransformación inversa,Z: 7lP, en losdatosde la figura 5.18resulta en puntos con tendencia lineal como los de la figura 5.19. Así los datos con ten-dencia lineal serían modificados para una tendencia hiperbólica, cuando se realiza unainversión de la escala de las ordenadas, la reciproca también es verdadera. De esa formase hace la regresión de Z sobre A y se obtiene Ia ecuación:

Z=bo+ br . A

se obtiene:

1

F=b.+br.A ó P:

En seguida se retorna a la escala original, sustituyendo Z por 1 lP en la ecuación 5.6 y

(s.6)

(s.7)b" +b,.A

queesla ecuación de una hipérbole, llamada hiperbólica I. Así que en la escala de P se

tienen puntos con tendencia hiperbólica, en tanto, que en la escala deZlatendencia es

lineal. I

Como se puede observar, el conocimiento del comportamiento de los gráficos de algunasfunciones muchas veces orienta al analista en relación a la transformación a adoptar . Acontinuación se presentan tres funciones no lineales, bastante utilizadas, que pueden serlinealizadas a través de transformaciones adecuadas, con sus respectivos gráficos (Daniely Wood-1971), apenas en el primer cuadrante, todavezque tanto la variable explicadacomo las explicativas son números reales positivos.

(r) Función Hiperbólica II

Esta función tiene una ecuación del tipo:x

Y= ax- b(s.8)

[-a ]inealización de la ecuación 5.8 se hace con la inversión de las escalas de x y dey,como se indica en la ecuación 5.9.

§nrr,rr Arv¡s Drxus

¡toMo(

I--av

Elcomportamien

Figura 5.20

(b) Función Ex¡

La ecuación de ur

y=a'€bx

La linealizaciéntransformación invetobteniéndose la ecuar

Lny:LniEl comportamieff

Figura 5.22

Una información ide variación de y enestimar una tasa medi¿

utiliza una función ex1

)ogarítmica poseen dirlistribución lognormal

HOMOGENEIZACIóN UTITIZANDO MODETOS DE REGRESIóN UNEAL SIMPLEx;ñ,-__a__ (s.9)yx

El comportamiento gráfico de Ia ecuación (5.8) se muestra en las figura s s.20 y 5.21.

(b) Función Exponencial

La ecuación de una función exponencial es del tipo:

y=aoebx (5. r 0)

Lalinealización de una curva exponencial se hace utilizando la correspondientetransformación inversa, esto es, una transformación logarítmica de la estala de y,obteniéndose la ecuación :

Lny=Lna+bx (s.r l)El comportamiento gráfico de (5.Il) se puede observar en las figuras 5.22y s.23.


Una información importante suministrada por la ecuación 5.10 es respecto a la tasade variación de y en relación a x, que se indica por (l-eb). Así, cuando se pretendeestimar una tasa media de valorización territorial en determinado período, por ejemplo, seutiliza una función exponencial. Otro aspecto a considerr.

", qu. si los datos en la escala

logarítmica poseen distribución normal, hay indicios de que los datos originales poseendishibución lognormal.

Figura 5.21

Figura 5.23

lxc¡xr¡rí¡ or Tunoox:s\ff

1b

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPTE'ry HOMO

5.4 ESTTMACTó¡

La manera másllos MínimosCuadraerrores calculados p

los siguientes:

a) se determina u

medios calculados ¡

b) se calculancorrespondientes ajr

vertical, entre cada

t)-tt-I

c) se define unapara una muestra dr

, =fu?. ,=l

Observe que la s

ma a los puntos, pttienen dos caminos

1

sumatoria de losmatemáticamente. (

método de estimacir

d) se deriva unay cadaresultado se

es igual al de los pestimados que se br

A continuación r

modelos nulo y de n

5.4.1 MODELO I

La estimación st

puede generalizar pr

(c) Función Potencia

Esta función tiene una ecuación del tipo:

y=a'xb (s.12)

Lalinealizaciónde 5.12 se haceutilizando unatransformadalogarítmicaen lasvariables

x e y, resultando en

Lny:Lna*bLnx (s. 1 3)

El comportamiento gráfico de 5.12 se puede visualizar en las figuras 5.24 y 5.25.

Figura 5.25 |

Una infonnación importante cuando se utiliza la función potencia es que b indica la

elasticidad de y en relación a x. El concepto de elasticidad esta ligado a un aspecto del

comportamiento de las variaciones de y en relación a las variaciones de x, por la ecuación:

(s. l4)

Cuando se usa una transformacióu, se debe enteltder que no se trata de un urero

ejercicio de matemática, es importante saber lo que representa el cambio de escala pro-

puesta y si es coherente para explicar el mercado. No se debe confundir con un simple

proceso de intentos, en el sentido de buscar mejores resultados estadísticos. Esto no

basta. Es importante que el modelo resultante pueda expresar con fidelidad el fenómeno

que se desea explicar. Si este es coherente con las creencias a priori que el tasador tiene

sobre el mercado, así como sus teorías sobre el mismo. Por ejemplo, si una cuestión es

inferir la tasa de valorización territorial en una región y es del conocimiento del tasador

que el crecimiento sigue una tasa aproximadamente constante, tiene sentido utilizar un

modelo exponencial; pero si el tasador espera que la tasa sea decreciente en el periodo

observado, el rnodelo más aproximado sería uno potencial.

dvlv" dx/x

Y

-1 <b<0b=-1

§nrtt*t Aw¡s Duus

Y:b

Y_?

v

HOMOGENEIZACIóN UTILJZANDO MODEIOS DE REGRESIóN LINEAT SIMPLE..-qFr.5.4 ESTtMAcIóx or los paruu,tETRos

La manera másfacil deestimar losparámetros del modelo es a través delMétodo delos Mínimos cuadrados. Este método consi ste en m i n imizar Ia sumade los cuadrados de loselrores calculados para una función cualquieradelaecuacióndeterminada. Lospasossonlos siguientes:

a) se determina una dunción cualquiera de los parámetros de las variables, con valoresmedios calculados por 1,.

b) se calculan Ios errores existentes:lt.renros puntos observados ({) y roscorrespondientes ajustados por el modelo definidoi, esto es, tu. J¡rtur.¡us medidas en Iar ertical, entre cada punto observado ({) y er estimádo por ár ,roJero (r ) , esto es:

E:

c) se define una función U formada por la sumatoria de los cuadrados de los errores,para una muestra de tamaño n, dada por:

(s. I 5)

(s. l6), =jr?

¡=1

¡1

óu=Irr,_y, ),i-t

observe que la sumatoria de ros errores E es nura para la curva que pasa más próxi_ma a los puntos, puesto que los errores positivos se anulan con los negativos. Así setienen dos caminos para cuantificar estas áistancias: la sumatoria de los módulos o por lasumatoria de los cuadrados. La segunda solución es nrás fácil de ser tratadamatemáticatnente. cuando se utiliza la minirnización de los cuadrados de los errores, elmétodo de estimación se denomina método de ros mínimos cuadrados.

d) se deriva una función uen relación a cada parámetro desconocido de Ia función i

A continuación se presenta Ia metodología citada para estirnar los parámetros de losmodelos nulo y de regresión Iineal simple.

5.4.1 MODELO NULO

La estimación se inicia por el modelo más sencillo, no obstante el razonamiento sepuede generalizar para los modelos más complejos. El modelo nulo está dado por:

y cada resultado se iguara a cero, obteniéndose un sistema de ecuacilones cuyo numeroes igual al de los parárnetros a ser estimados. La soruciión del siistema suministra losestimados que se buscan.

1 re. conI t, (5. I 7)

lxc¡xl¡nh o¡ Tmrcro¡¡s Y

HOMOGENEIZACIóN UTITIZANDO MODELOS DE REGRESIóN L¡NEAL SIMPLE_{§tF"

Su representación gráfica se muestra en la figura 5.26.

El estimador á, se obtiene considerando una recta horizontal cualquiera dada por { :8,, donde la sumatoria de los cuadrados de los errores está dada por:

u=fv,-í, )' 6 u=frr,-B)2i=l

Para imponerle a la función la coñdición de mínimo, se calcula inicialmente la primera

derivada de la función en relación a la variable Bo, o sea:

.ndU / dB" * -2»G, - B") = -2(ZY,- B".n)

i=t i=l

lgualandodU/dB,,acero,seimponelacondiciónde mínimo a la funclón (5.19), que co-

incide con el modelo 5.17. Así, 8., que antes era una variable, se transforrna en una

constante b,,, üna vez que el sistema nos da la solución buscada, cóñro se demuestra a

.outinuación:

sr dU/dB.: 0,

De modo que en una población de datos homogéneos, el valor del mercado se estima

por la media aritmética de los datos muestrales. Se observa que en el momento en que se

impone la condición de mínimo a la función 5. I 8, se encuentra el estimador del parámetro

desconocido representado por bo.

La comprobación de la condición de mínimo de la función se verifica observando el

resultado de la segundo derivada:

dru/dB,2 : -2. (- B") = 2n > 0

Como la segunda derivada es positiva, la condición de mínimo para la función está

gr^r-antizada

5"{-2 X'DEI.o UNEAL S¡MPLE

Ei .nlormedio ajustado para una función lineal corresponde a una ecuación del tipo

j.'-;-rv- - L L' ..t

:l

entonces n . bo =f ', , ó bo = t', ,n o aiin b,,: Y

lfnrou D¡¡¡,s

(s.21)

HOMOGEN

Surepresentacióngl

En este caso la fuprecio observado (I/,)

cualquiera Y,: B, + Á

U

Para que en esta ful

las derivadas parciale

y dJ/B,: 0, esto es

(s.1 8)

(s.1e)

(s.20)

ÍaJ/a,,: 2 z (Y,-

latta,:2»(Y,-Igualando las deri'

n +b,.8.zx,+ b,. E,

Nota: se consider¡

La solución del sir

correspondientes; de

Y,: bo

Los precios ajusta

?,: b"

v

HOMOGENEIZAC¡óN UT¡I¡ZANDO MODETOS DE REGRESIóN [INEAL SIMPTEru;p*Su representación gráfi ca es el de una recta i nc linada, como se muestra,e n la fi gura 5 .27 .

?,: b,, + b, 'X,

Figura 5.27

En este caso la función que mide la sumatoria de todasprecio observado (f,) y el correspondiente precio ajustado,cualquiera Y,: Bn * 8,.X, está dada por:

u =f ,: =f (y,- 8,, - 8,.x,)2

Para que en esta función alcance su punto mínimo, se hace necesario inicialmente quel¿s derivadas parciales en relación a cada parámetro sean iguales a cero, o ilr/B,: 0y d.l/68,:0, esto es:

Ias distancias entre cadacalculado por una recta

Igualando las derivadas a cero se obtiene el sistema siguiente:

h.. n +b,.»X:»Ylo I t i

\b^. »X.+ b,. »X2: »X . yt" t t t -¡ --¡

Nota: se considera en los sistemas 5.23 y 5.24 que X : i

(s.22)

(s.24)

(s.2s)

tr-a solución del sistema 5.24 nos da los estimadores de los parámetros poblacionalesccrespondientes; de esta forma el modelo deseado tendrá la siguiente ecuación:

Y, : b,,*brX,+e,

Los precios ajustados por la recta de regresión están dados por:

Y,: bo+ bt.X, (s.26)

lxc¡xr¡nír or rmoones§

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIÓN LINEAL SIMPLE*.{;'o

Tal como se vio en la sección 5.4.I se pr-rede confirmar la condición de mínimo de la

: * l-.; Lón si al calcular las derivadas de segundo orden, estas sorl positivas. Una forma más

*::neral de verificación se presentará en la sección 6.3'1.

Los residuos estimados se calculan por:

e:Y

5.5 COMPROBACIóN DE LAS

(s.27)

HIPóTESIS BÁSICAS

Además de la estimación de los parámetros, es de fundamental importancia la

verificación de la hipótesis básicas citadas en la sección 5.1. Cada hipótesis se analiza, en

particutar, para un modelo lineal simple ajustado a datos inmobiliarios.

PRIMERA

La vuriable independienle correspontle u los números reoles que no confienen

ning una pert urbilción aleaforia.

De hecho, en el caso de los datos inurobiliarios, las variables independientes están

relacionadas con Ias características fijas de cada elemento tomado como referencia, por

1o que se cumple la hipótesis.

SEGUNDA

El númeroestinrodos por

de observaciones, n, debe ser superior al número de pordmetros

el modelo.

Para el rnoclelo de regresión lineal sirnple, que considera dos parámetros ( §,,Y F,), el

"_, ;.:e de la recta de regresión exige al menos tres datos. Aunque este núntero de datos

:..:.i.r,.s cumple con las exigencias matenráticas de la estimación, en la práctica, no es

. -:-: r:nre para explicar el comportamíento del mercado. La nonna brasileña NB -502/89

=." ,:; :n mínimo de cinco datos cuando se estima un parámetro en las tasaciones nonnales,

:::: :.:Jelos de regresión con fr parámetros como mínimo k+5 datos en las tasaciones

: --:-s:s r en las tasaciones rigurosas especiales 2k+5 ó 3ft, el que fuere mayor. Se

;-. ;::. que para medir el efecto de una variable sobre la variabilidad de los precios, se

:.:" :.r::,r ar con un mínimo de cinco informaciones sobre estavariable, adernás de las

, -:- -.;::s:rias para estintar Ia rnediageneral. Esto es un mínimo de cinco datos para

- r - r r::;rr 3::.- .stinlado. lo que resulta en una muestra mínima de 5ft datos. Además de

:i ,; :=:: :bser,,arel eqLrilibriode lamuestra,comose indicóen lasecciótt3.5.2.

HOMOG

TERCBRA HII

Los errores son t

El primer aspect<

valor esperado del er

coeficiente á, del mcimportantes en el ani

Para la verificaci(analíticos que puedede los residuos se pu

^ Un gráfico de res

[,), que presenta putpasa por el origen, es

un indicador favoralerores; en caso con'

figura 5.29, se pued,

ciaso, se dice que el r

Figura 5.28

Cuandoelmodelo:r sesgados yconsiste

:.i menos asintótican:arámetros son sesga

rectas. En este casoenlino error, hacien<

cuadrados ponderadr

nes adecuadas en la

CUARTA HIPC

Los errores son

Como se puede «

estimación de los par

Pero la rnisma es ner

cuando el modelo es heterocedástico, los estimadores de mínimos cuadrados son tambiéninsesgadosyconsistentes, pero no son Ios de menorvarianza, es decíq que no son eficientes.ni menos asinróticamente. Las estimacione;;;il;;;;;i;"J;'i", estimadores ae rosparámetros son sesgadas, y ras inferencias sobre elras y ,obr" ios parametros son inco_rrectas' En este caso sedebe tener precaución en el se,it¡oo ie "uán¡liru,

la varianza deltérmino effor' haciendo Ia estimacion de los parámetros a través ¿"1,r¿todo de los mínimoscuadrados ponderados' que se presenta en la sección 6.3. I I , o haciendo transformacio-nes adecuadas en ra variabre dá respuesta, col,o rogarítrnica o raíz cuacrrada.

CUARTA HIPÓTESIS

Los errores son variabres areatorios con crisfribución norntor.

I como se puede observar ninguna suposición en este sentido fue necesar ia para lapstimación de los parámetros del modelo a través del método de los mínimos cuadrados.fero Ia misma es necesaria para hacer inÁr"n.ru. y

"orrt.ui. int.*aros de conftanza.

lxc¡x¡¡nír or Trucroxm§

H0M0GENErzAcróN urrl'f4tP-q.tfiilifiil?iI¡cn¡s¡óx uNEAL srMpLE

TERCERA UrPÓrNSrS:

Los errores son vartables aleatorios con valor esperodo cero y varionza constanfe.

;¿so. se dice que et modeto es htr¡oced¿.ri." y .,, J;;;;ü i",.,".§;Xlljl

El prirner aspecto de esta hipótesis es de difícir verificación, sin embargo, así sea el- ' rr esperado del error aleatorio igual a rrla constante, este puede ser absorbido por el:;:eficiente á., der modero, sin provJc";;;;;" en ros derná. .oi¡.i"r,"s, que son ros más.-lo(antes en el análisis de regresión.Para la verificación del aspeJto devariat'tzaco¡rstante der e,oq existen varios métodos¡:'alíticos que pueden ser encontrados en Kmenta ( I g7g). A travÉs de un análisis gráfico:r los residuos se puede verificar.",-, f.";il;;;;

"." ,1,07iJ,;."u"un gráfico de resíduos.(e) versLrs ros varores u.;,,riáo, por er modero de regresiórri t' que presenta puntos ¿istribuidos aleatoriame,.,á ",.,

,orná u ulu recta horizontal que:':sa porel origen, esto es, si, ningún patrón definido, como ra i*ru de ra figura 5.2g, es-: indicador favorabre a Ia acepiaci¿n ae ra hipótesis ¿" ,u.iunru constante para rosr::ores; en caso cotttrario, si.los puntos presentan unatendencia, co'r.ro los datos de la::::i:r?:,:::*:^"::'::',.x1: u1,ii11,u¿"r

",,o,,,o ", "l,,,un,e En er primer

Figura S.28

HOMOGENEIZAC!óN UTTTIZANDO MODETOS DE REGRESIóN TINEAT SIMPLE

En un primer análisis, se puede verificar esta hipótesis observando el intervalo

comprendido por los residuos estandarizados (" i ),"ttot seencuentrandividiendocada

residuo(e,) por ladesviaciónestándardehnodelo(s),calculado por(5.32), toda vez que en

una distribución normal ,68Yo de estos residuos están en el intervalo [-l; + 1],90% entre

l-1,64;+ 1,64)y 95% entre [-1,96 ;+ 1,96].

Un histograma de los residuos presentando simetría y forma parecida a la curva nor-

mal es un indicador a favor de la hipótesis de normalidad del error. El gráfico de los

residuos es el que arroja los mejores resultados en este sentido.

Para la construcción del gráfico normal de los residuos se deben plotear los puntos

correspondientes a cuartiles muestrales de los residuos ordenados versus los cuartiles

teóricos de la distribución normal, que sí resulta en una recta se puede verificar la hipóte-

sis de normalidad. El coeficiente angular de esta recta es una estimación de lavaúanzay

es un coeficiente lineal de la media. En el caso de la distribución N (0,1), los puntos se

deben situar sobre la bisectriz del primer cuadrante.

Se observa que el campo de variación de la distribución normal es todo el intervalo de

los números reales, mientras que los precios de los inmuebles son estrictamente positivos.

Esto hace que la distribución normal no sea la más apropiada para los datos inmobiliarios.

Una solución que ha sido bastante satisfactoria es el cambio para una escala logarítmica,

puesto que el logaritmo del precio abarca toda la recta real. Cuando el logaritmode los

preciostieneunadistribuciónnormal,sedicequelosprecios tiene unadistribuciónlog-normal.

Estadistribuciónsehamostrado aj ustada a los datos inmobiliarios.

QUINTA HIPÓTESIS:

Los errores no estdn correlacionaclos, es decir, que son inclepéndientes baio ta

condición de normalidad"

El concepto de independencia de los res iduos esta li gado a la independencia de los datos

de mercado. Una situación idealesaquelladondecadatransacciónserealizaindependien-

tementedeotra. Estoes,elconocimientodelprecioylascondicionesdeunatransacciónnointerfieren en la otra.

La existencia de autocorrelación en los términos de la perturbación aleatoria se puede

verifica¡ con el auxilio de la razón de Von Neumann, dada por:

I(", -t,-,)'d=¿-"

I'ii=l

(s.28)

donde e es el i-esimo residuo del modelo, ordenado de manera creciente con relación a

lo-r r alores aj ustados, considerando una muestra de tamaño n.

Para n srande se demuestraque d:2 ( t - r ),donde r es el coeficiente de correlación

e::i e ) € ,., . De manera que sí r=-1 los residuose, Y €¡-, están perfectamente

::::el::.:r.a.josnegativamel'fteyd=4;sir=*Isetieneautocorrelaciónpositiva

HOMOGE

perfecta y tl= 0. CuarEl estadístico r/fue

2,5%oy 1oá, consideravariables independiencuentran en el apéndir

Para probar la hipruna hipótesis de queecuación (5.28) y desp

-sid,,<d<4-d,,,correlacionados a favestablecido.

-§i d < d, se acept-Sid>4-drseac-En los demás casr

La representación

Región uto-regresiónPosidYa

Se puede demostraautoregresivas, los espero ya no son eficien

Un sráfico de e vfuerte iñdicador de l'a c

la situación cuando lo¡indicios de autocorrel¿

Aplicoción 5.1

En la tasac ión de ununmodeloderegresiónd=2,2.Sepideprobar I

§i-:a., A-.¡ Drrrs

la

In

HoMoGENElzAoóxutllt¡¡flg-o-Tp,il EGREsróNuNEALsrMpLE

*'f¡j:_lÍ:,|:9:rr9: nl luv autocomelación r = 0 y tF 2.

,9]:'39,.]:."r/fuerabuta¿r'piri*i;':i;;'"',;;:,,;2,5yoyrz,,.o,*ia",ffi ;ff J.TíTZ,;;,:T:1if ffi ,§[: jf ::::lTi,if]ll:rariabres i,a.p",Ji.,;.:;ililIffiil",::'i#:,¿:;.i[1:T.]i.,"[:;::1,"1:::1'^::'rs§, ssraDtectenoo los limites críticos d

,- y d ,,. Estas tablas se en_.rT:::i:::]:|^"l91:: I,.con las.idenrificaciones ls, ro ylir:.ipl"ti,ur"nt".para p ro b a r i

" n ü áL J r I il [','fi '],:] T:l'Jff : i:,

"'ÍJ,' lJni;: [:1T: : l";correlacionados (Hr) contrauna hipótesis de que los residuos no;rrá-, ;;;il";:rI§rauronaoos (fir) contra

ecuaciórr15 ?R\w^ecn,,Áo r correlacionados (l1r), se calcula á con laecuación (5.28)ydespués secomparac";i;; -vr¡v'Év'vrrquur \'I17''fr se calcula r/ con la

_sid <d<4-. renhnzorr lrna,.críticosd.ydudelaformasiguiente:; I 1,1 ;l l"l' i ; Í" :, ^ :^l I 11u,1' ; l " u

"" i u' u"il il;;' ! i : [ il ; 3 i ? [' i :5J ::U;

:,Tf,1: ::l u ¿ o, u á;

" -

" iii, ; ;ffiH::#:?J :*,¿il:::"i: : [J¡; J : ;;xffi x Í ;establecido.

-li I . d, se acepta la hipótesis de auto-regresión positiva.-:i q, 4.- d ,se acepta la hipOtesis d. uriJ_."gr"sión negativa.-En los demás casos la prueba ro ",

concluyente.La representación gráficade ra prueba il;; ser visuarizada en ra figura 5.30.

Reg¡ón no concluyente

-

R.g¡ón auto,r€$esiónPos¡r¡va

d,,

Figura 5.30

L.-..-.}

(4'du) (4-dr) Reg¡ón auro-retresiónNe8ativa

#d,

Se puede demostrar. con facilidad (Kntenta-1978)que cuando las perturbaciones sonautoregresivas, ros esrimadores ¿. ,,i,ii*á, craaríaó, ,án-i,irlrguaos y consistenres,pero ya no son eficientes, ni menos asintoiicamente. :

l:ilrfát1ai;.í¡1.{li¡i¡4n*:.,'f 1?3J:::i.::iffi .i".:,it,it"l:u:ff itr:ti3jfliffL"J#,::i:.!TI[,ffij.f¡ffiiJgl ]ispuestos.";;s;;;;,;;;.i;: p,;1,¿.Íhll

Aplicoción 5.1

En la tasación de un inmueble, donde fueron considerados 25 datos de mercado, se utílizóunmodeloderegresiónlinealsimpley..ouiruo"or¡oresurtadoelestadístic odevonNeumanc=2,2.sepideprobar ra hipóües;, ¿á no uuio-regresión .n ,t ,oa"io para un niver de 5%.

lxc¡xr¡dr o¡ TrsrqoxEs

V

l<

Región de no auto-regresión

HOMOGENE¡ZACIóN UTILIZANDO MODETOS DE REGRESIÓN t¡NEAt SIMPTErySoIución:

1) Se encuentra en la tabla I.5, apéndice I, los puntos críticos tabulados por Durbin-

Watson, que están en la primera columna y la linea 25, esto es:

d,,:1,29

2") Definir las regiones

Y du : 1,45

4 -d, 4-d,-

HOMOGE

dudL

1,29 1,45 2,55

auto-reg. no no auto-regresíonpositiva concluyente

2,71

residuos, pues cuandcestandarizados están e

mayoría de los puntos r

Pero puede ocurrir c

estandarizados fuera d

ejemplo los indicadosprovienen muy probalaquel de una muestra q5.33. Observe que toddiscrepante en relaciórdatos provengan de unque es un procedimiercon residuos estandaridisponibles en el mercide los residuos. El ajuGama, Binomial, Poissdos, asunto que será tri

Figura 5.32

5.6.2 PUNTOS INFLUY

Se entienden por pu

algunas veces hasta nulpletamente las tendenci

no

concluyente

auto-reg.negativa

3")Verificarencualregiónseencuentraelvalord=2,2.Comodestáentre 1,45y2,55,se

puedeconcluirquenoexiste auto-regresión en los residuos al nivel de significanciadel5oA.

5.ó PUNTOS ATíPICOS

Adernás de las cinco hipótesis básicas es imporlante verificar si hay presencia de

outliers o puntos influyentes, todavezque los estimadores de mínimos cuadrados no son

robustos cuando purrtos de esta naturaleza contribuyen al ajuste. En este caso, el modelo

no se ajusta bien ni al «grueso» de los datos, ni a los datos cotl un punto atípico.

Un punto atípico debe ser analizado aparte con bastante cuidado, pues puede haber

sido ocasionado por errores de medida, o por algún cambio en el compoftamiento de la

muestra. Es aconsejable que se haga otro ajuste excluyéndolos y comparando el nuevo

modelo con el anterioq obteniéndose de esta forma informaciones respecto a sus influencias

sobre los parárnetros estimados y tanrbién sobre el poder de explicación de la ecuación

de regresión.

5.6,1 OUTLIER

Se denomin a outlier al dato que tiene un residuo grande en relación a los demás que

c,¡rnponen la muestra.

Esros puntos pueden ser detectados con facilidad a través de un análisis gráfrcode los

residu,-.s estandarizador (.i) versus los valores ajustados correspondientes (i ). no,

e_ e:rp,... para puntos dispuestos como los de la figura 5.3 1 , aquellos destacados pueden

sei ca:fJlerizados cot¡o oufliers.{l¡b-erese el hecho de que el punto tenga un residuo estandarizado superior a2,en

..: --:::¡:l::,:,.estonoirnplicanecesariamentequesetratadeunoutlier.Estaindicación

=- . '_- - -- ;) r:r-.p-rr-tante para detectar urra información respecto a la nonnalidad de los

gi

+2

+1

V;'1i': L':: D$r^j

H,M.GENErzAoóN u,l!4¡q'9 ltlri,,,riíñ P'fi'REGREsTóN

uNEAr' sTMPLE

ei

+2

aaaaatati'

FIGURA 5.31

aoao

aaa

aal¡

ftura 5.32

[..r rr*ros rNFruyENrES

§e entienden por puntos influyentes aquell(unas veces hasta nuros nre cF rricro,.^i^,^ ,^1t-

p'nto'.que tienes pequeños residuos,

lf H:: [Tl']::T^'t: l::' : Y : :: ;,'r;:., ;;; i,;;ffi ;:ffi i,iendo alterar com-

-a; iuos' pues cuando los datos presentan estas características, 95yo desus residuos:rr':darizados están entre -r,g6 y +1,g6,esto es, aproximadan-lente entre -2 i +2. sí Iar;'' ':ría de los putttos están entre Lstos Irmites existen indicios favorables de normalidacl.:-:'l puede ocurrir que una mLrestra con. dispersion g.ánJ., con rarios residuosx--:ndarizados fuera del intervalo [-2:+2),sin aparenta. pi,-,ri", aircrepantes. como por*'=:rplo Ios indicados en ra figura \.t2. Érestecaso que se puede inferir que ros datos

il,.i.¿ J#frJ#l"o,.,r.nt" de una distribución cá,rru. u;,

";." conrrario puede ser: : _: o b serv" 0,,.,"0'll iJ:ffliJ :liix.Jl li, i:Jff :' ü ;T;l,r¡:?:..,i"ff lf ii*: s':repante en reración a ra masa de datos. En un caso .á,ro

"r,. es probabre que rosr::'-s provengan de una pobración con distribución binom¡ol. o" .rru forma. se 'erifica

l-3 es un procedimiento peligroso considerar purrtos outriers que apenas se presentan:::: residuos estandarizados fuera de los lilnites _2 y +2.o,rolru.", al_qunos sistemas¡.-'ponibles en elmercado' De aquí se ve L¡na.vez_más la ímportancia dei análisis gráficoir los residuos. Er ajuste de ros datos .o,, dirrribrciones áii.r",ri., a ra normar. cor¡oiJ¿ra, Binomiar, poisson y otras, sóro es posibre a través;";;;;;i", rineares _senerariza-¡--s. asunto que será trataáo e, el capitull t.

aa

a^ OaaaaaaaOaO

Figura S.S3

pietarnente tas rendencias naturales l"d;;;il;;; ;;iiil;:]lxo¡xrrnír or Trucroxrs

\[

a

HOMOGENEIZACIóX Urru4xoo uoo¡rosrP,¡ l¡cR¡slÓx LINEAL SIMPLE

Existen varios criterios estadísticos para detectar estos puntos, como el de Cook,

presentado .n tu r...ián áS, p..o con un simple análisis del comportamiento gráfico de

la variable dependiente o delos residuos en relación a cada variable independiente se

Ñ;;;;i# el problema. En la figura 5.34, por ejemplo, un punto con oaracterísticas

como el señalado indica la presencia de un punto influyente' En este caso el punto tiene

residuo cero, como ,e puede observar en la figura 5'35 y parece estar bien ajustado' pero

desvirtua completamente el modelo. Mientras que la tendencia del mercado es la indica-

da por la recta I de la figura 5.34, elpunto influyente modifica la tendencia para la

situación de la recta 2 delamisma figura'

Figura 5.35Figura 5.34

5.7 COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación es unamedida estadística importante en el análisis de un

modelo de regresión, pues informa la dependencia lineal entre las variables explicada (f)y explicativx(X,),se calcula Por:

HOMOGI

En Pereira (1970)

CoeficienlI'l : t

0 <lrl<(

Y,

0,30<lrl<00,70<lrl<00,90<lrl<0

l.l :5.8 COEFICIENTE

El cuadradodelcorindicaelpoderdeexplrradas.

R:fPorejemplo, sien

como laúnicavariableindica que el 90oA de

área.

5.9 DESVIACIóN I

La desviación estl

a¿ datos { por una,

Para el caso de ur

En el modelo 5.32a) El denominador

cada parámetro estim

b) El cuadrado demedia de los cuadradcmodelo. Entre dos m

I G, -ixv,'71'=ffi (s.2e)

Este resultado varía de-l a *1. Cuanto más próximo se encuentre el modelo de la

unidad, mayor será la dependencia lineal entre las variables involucradas y cuanto más

cercano a cero, menor será esta dependencia'

cuando r > 0 la correlación es directa, correspondiendo a una recta creciente'

cuando r = 0 la correlación es nula, correspondiendo a una recta horizontal'

cuando r < 0 la correlación es inversa, correspondiendo a una recta decreciente'

En un modelo de regresión lineal simple es deseable que el módulo del coeficiente de

conelación entre la ,uriubl. dependiente y la variable independiente sea cercano a la

unrled.

,,: J

pi-"-t A.,ii gsia:

HOMOGENEIZACIóN UTIT]ZANDO MODETOS DE REGRESIóN UNEAT SIMPTE

--

En Pereira ( 197}),existe la siguiente clasificación:

Coeficiente

lrl :o0 .l.l<0,30

0,30<lrl<0,700,70<lrl<0,900,90<lrl<0,99

l.l : I

Correlaciónnula

débitmediafuertefortísimaperfecta

5.8 COEFICIENTE DE DETERMINACIóN

Elcuadradodelcoeficientedecorrelación resultaen elcoeficiente de determinación, que'ndicaelpoderdeexplicación delmodeloen función de lasvariables independientesconside-:adas.

R = 12 (5.30)

Porejemplo, si en un modelo para la tasación de un lote de terreno se consideró el área:omo laúnicavariableparaexplicar laformación de los precios y se encontró R=0,90; esto::dica que el90oA de la variabilidad de precios observados rL d.b. a variaciones en el3rea.

5.9 DESYIACIóN ESTÁNDAR DEL MODELO

La desviación estándar de un modelo general con p parámetros estimados. aj ustadosa , datos Y,por una ecuación de mediai, está dado por la expresión:

¡- (s.3 1)

Para el caso de unarectap:2, se tiene:

s:e (s.32)

En el modelo 5.32, se puede observar lo siguiente:a) El denominadot (n-p) representa el núm-ero de grados de libertad del modelo, pues

cada parámetro estimado provoca ra pérdida de un glado ostiue;ao.

b) El cuadrado de la desviación estiándar indica la vaúanzadel sistema. Esto es, lamedia de los cuadrados de los residuos. Esta es una medida importante de diagnóstico deimodelo. Entre dos modelos satisfactorios, se debe

"r.og., uqu"l ¿. -.ri¡ varianza.,

zt,-t,)'

lxcur¡nír or Truooxts§p

HOMOGENEIZACIóN UTILIZANDO MODELgIPESEGRESIóN LTNEAL SIMPLEüry;Kporque las estimaciones son más precisas. Otra información importante es que cada

variable incluída en el modelo g"nr.u rnu."ducción en lavarianza residual' si la reducción

es significativa, hay indiciosle que la variable es importante para explicar mejor la

variabilidad de los precior, .n "u.o "ontrario,

la variable no debe ser incluída'

5.IO PRUEBA DE SIGN¡FICANCIA DE LOS PARÁMETROS

La significancia individual de un parámetro F, se mide a través de una prueba I aislada'

La hipótesis a ser Probada es:

(H":0,-o,contra.J " ','' (5.33)

la' B, *o

Probarlahipótesis5.33paraunparámetroB,'correspondeaunavariableX"essemejante a Probar:

HOMO

Lanormaparatalprueba unasignificarigurosa especial.

Para el caso de li

s(bj) = s,

Aplicación 5.2

En la tasación c

responsable por las rde 21 datos de merc

v: 900 -

donde el término erparámetro estimado

Sepideprobarlar

Solucién:

1o) Encontrar elestimado entre su de

t,: llo/81: I

2o) Encontrar enStudent para el nive

t ¡o,rrr, ,r¡ :2,09

a,

tr

importante en el modelo, contra

: la variable X,, es importante para explicar los fenómenos en estudio y debe

participar en el modelo.

Así, lo que se pretende es rechazar la hipótesis nula (I1r), ya que el tasador presume

que la variable enprueba influye en la formación de los precios'

Una vez aceptada la tendencia de normalidad de los residuos, el estadístico de la

prueba es:

. b,- 0i4

--' j - s@i)

Donde s(b) esla desviación estándar correspondiente al parámetro estimado á,'

sedemuestraquef *tienedistribuciónf destudentc onn-pgradosdelibertaddonden es

elnúmerodedatoide la muestraypes elnúmerodeparámetrosestimados'Esto es, para un

modelo de regresión simple: n - 2 grados de libertad'

Asíparaprobarlahipótesis5,33,aunniveldesignificanciarcparaunmodeloderegresión lineal simple, se compara

,, =l#l(s.3s)

con/,i-...,,-rl.Si t] essuperior 4t¡t-nn:n-2),serechazalaH,,,indicandoquelavariable

ctrrrespondiente al parám.t.o proUuábá importante para explicar el fenómeno' La prueba

es '¡llateral ¡ puede ser observada en la figura 5'36'

(s.34)

Ynrtt*t Atv¡s Dr¡us

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN UNEAL SIMPLE"rf{I;p!-

'tat_;;(n_2)

Acepta Ho <-l-+ Rechaza Ho

Figura 5.36

Lanormaparatasación deinmueblesurbanosNB-502/sg,delaABN!exigeparaesta

Prueba unasignificanciamáximadel5% en lastasacionesdeprecisión rigurosay l}Yoenlarigurosa especial.

Para el caso de la Regresión Lineal Simple, el s(bj) es calculado por la expresión:

s(á7) = 5, donde s" = (s.36)

Aplicación 5.2

En la tasación de un local comercial, se eligió la edad (X) como única variable

=sponsable por las variaciones de precio unitarios (Y), en R$/m2, con base en una muestra

:e 21 datos de mercado, obteniéndose la siguiente recta de regresión:

Y: e00 - 10 (B) . x (s.37)

¿,-rnde el ténnino entre paréntesis corresponde a la desviación estándar del respectivo;arámetro estimado.

Sepideprobarlasignificanciadelparámetrocorrespondienteala edad al nivel del5%.

1") Encontrar el I calculado por la ecuación 5.35, esto es, se divide el parámetrosrimado entre su desviación estándar, y se obtiene:

t,: ll0/Bl:1,2s

2o) Encontrar en la tabla 12 del apéndice I, el punto crítico de la distribución r de\',,dent para el nivel del 5% y 19 grados de libertad, que corresponde a:

I ¡o,orr, ,r¡ : 2,09

a, a

,

lxc¡xr¡nil or Tosocroxm§ff

- t. «l_t:;(n_2)

Rechaza Ho <-l-+

HOMOGENE¡ZACIÓX UNUZIXOO MODELOS O¡ N¡CN¡SIóX UNEAT SIMPTE

=qAM"3") Comparar ,1 calculado con t ¡o,rrr,,r¡

- como lrrl es inferior a t ¡o,rrr; te) , .se concluye que el parámetro poblacional

correspondient" a la edad no es iignifióativo al nivel del5%'

5.I I PRUEBA DE SIGNIFICANCIA DEL MODELO

La hipótesis a ser probada en este caso es la misma que para un parámetro individual'

toda vezque el modelo sólo tiene un parámetro a ser probado'

HOMOI

Se demuestra (

Considerándose un I

se encuentran los si1

. (n -l) para f (

. (n -2) para f (.

coeficientes de la re,

.Uno(l) paruZ(i

Dividiéndose ca<

encuentran las corre

-Yarianzatotal

-Yarianzano extr

-Yarianza explic

Con esto se puedtablaANOVA, comola sección 6.5.1.

Tabla 5.1 -Tabla

Observe en la figurfuese grande y la no elo, se analizalarazón

: §t = O,contra

:Bt+0(s.38)

Esto es semejante a Probar:

f .É1^ : el mercado debe ser explicado por una recta horizontal.

{ A, t "f

mercado debe ser explicado por una recta inclinada'

La visuálización gráfica de la prueba es mostrada en la figura 5.37.

A-^D : d,-Y¡ + ¡Y,-t¡ (s.3e)

bArts Drrrrs

Figura 5.37

Observe en la figrrra 5.37 lavariación total de un punto observado (I',) con relación

a la recta horizontal )/, puede ser expresada por una parte correspondiente a lqvariación

de este punto (Y,) con relación a su valor ajustado sobre la recta i¡clinadu (f,1, más la

r ariación existenie entre el punto ajustado sobre la recta inclinada (f,) y.la rectahorizon-

ul ,ñ. Así..la variación toial ({ --D .. igual a una variación explicada.Por la recta de

regresión Ú -h rnás una variación no explicada por la recta de regresión (f, - f,)' es

decir. para un punto i se tiene:

{;

:-

v

Explicada (modelo)

No explicada (error)

=b"*br'x¡

HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPLE*XlIFf-Se demuestra (Kmenta - 197g) que J (y, _ V), : » &, _T), * [ t]- _ i- t,

Considerándose un modelo de regresión lineal simple ajustado a una rn¡est*- o. i, ¿r,ár.se encuentran los siguientes grados de libertad para cada una «le las sumatorias:

. (n -l) paru 2 ( y,- F7', pues sólo se conoce un parámetro estimado, que es l-

'-(n.J) para f (Y - i¡', pu.r invorucra las medias estimadas de b,,y b ,, queson roscoeficientes de Ia recta cle regresión definida por i,.

'uno(1) paraZ(?,-r7',correspondientealresultadodeladiferencia entre(n-t)-Qt-2).

Dividiéndose cada una de las sumatorias por sus respectivos grados de libertad, seencuentrall las correspondientes varianzas, esto es:

-Yaianzatotal

-Yarianzano explicada

-Yarianza expli,cada

n -2(f,-f,)'

- Con esto se puede hacer una tabla de análisis de varianza. también conocida como

tabla ANOVA, como se demuestra en la tabla 5.1 . Un caso más general se presentará enh sección 6.5.1.

Tabla 5. I - Tabla de Análisis de yarianza

- Observe en la figura 5'3 7, que la situación ideal sería aqLrella doncle Ia varianza expiicadatuese grande y la no explicada pequeña. Así, para probaria significancia global deimode-io, se analiza laraz6n entre las cros varianzas por er estadístico:

, =»lt -rl=,fu-z)' Ilr,-tf I

Sumatoria de los cuadrados Grados de

libertad

Explicada (modelo)

\o explicada (error)

scR - »t,-tlscE: f¡1',,-i'¡

t/ exp: »t,-tfttvn exp : ¡¡r,-?¡l¡n-21

l¡tot - fA'-i)rt(n-¡)

(s.40)

lxcrxr¡rír or Trmcroxrs §p

Zs,-1¡'n -1

HOMOGENEIZACIóN UTILIZANDO MODELOS DEXEGRESIóN LINEAL SIMPLE

Este estadístico presentará un resultado un tanto mayor cuanto mayor sea la probabilidad

Ce que el modelo üa aceptado para explicar el fenómeno en estudio'

Se demuestra que,F., bajo taliipótesis ar), tiene distribución de Snedecor con I grado de

libertadenelnumeradoiy ¡i-Z¡enÁaenomiiador.EstadistribuciónfuetabuladaporFisher'LospuntoscríticosparaunniveldesignificanciaocessimbolizadoPll!r*,i;i 1,,:Ei-t1:prnto, están en las tablas 13 y 14 del apéndice I paralos níveles del 5oA y 1%o, donde el'ni,*".o de grados de libertaá del numerador sé indica en la columna y 9l número.de

_*uáo. ¿. l¡ü-erta¿ del denominador se indica en la línea, donde se localiza el punto crítico

correspondiente.- - Áripuru rechazar la hipótesis nula de no haber regresión al nivel oc, es necesario que

,F sea superior aF,*. t,,-:,; en caso contrario, hay indicios de que la recta inclinada no

.-pii., ,l.lor el feiómánó qu" la recta horizontal. debiendo ser ésta última la escogida.

La prueba es unil ral y puede ser observada a través de la figura 5'38'

de Ho rechazo de Ho

Figura 5.38

La norma para tasación de inmuebles urbanos N F-502Á9 , de la ABNT, exige que sea

p.ouuou tu hipótesis de análisis devarianzaaun nivel de significanciamáxima del 5% en

ias tasacionei de precisión rigurosa y del1oA en la rigurosa especial.

Aplicoción 5.3

Considerando los datos de la aplicación 5.2,y sabiendo que la varianzaexplicadapor

el modelo es 16 y la no explicada és igual a 40, sé pide probar la significancia del modelo

al nivel del l%.

Solución:

1") Calcular el F. por la ecuación (5.40), ó

»¡r, - 7¡2Fr= _-_ ^j. x»(Yi - Yi)'

Sustitul endo los resultados, se tiene:

16 (21-2) -/f.=zo^_=/.o

(n-2)I

Yn.,r.t Aiv¡s Dr¡rs

HOMOG

2"pncontrar el pur

un grado de libertad ren la primera columr

3o) Comparar I' r

concluye que el modt

5.I2 INTERVALO I

El intervalo de cotrecta de regresión, es

t:f tt..t t_ú¿: (n_ !

donde s(t) es la de

modelo de regresión I

I:Yo ltr_n,r..rr-,

La norma para la tintervalo de confianziintervalo se consider¿

Como se puede obcuando el bien tasabl,los datos muestrales,campo muestral. En emás cercanas a las caren las extremas.

La variación del il5.39.

HOMOGENEIZACIóN UTII.IZANDO M=_q.HwEcREstóN UNEAr stMprE

2")Encontrarel punto crítico de Iadistribución de snedecor; en latabla14, apéndicel,conun grado de libertad en er numerad ory rgjaaos en er aeromi;;;r, esto es, se encuentraen la primera corumna v err ra t9^ tíieaal at iü, "JJü';;;, , , ,r,= 8, r 9.

*i,1f""fi:'Jll,*J,x',ígí;í*+,.,'Í,T:,*;:,i:res,inrerior a F¡00,,,:,e,=B,re se

5.t2 |NTERVATo DE CONFTANZA PARA tEl intervalo de confianza a.un niver de (r - cc), en torno de un punto 1xo ;\), sobre rarccta de regresión, es calculado por

I:Y f t .t) t-q: ¡,,- rr. -(YO)

donde s¡Yn¡ es la desviación esfándar carcurada en torno ar punto(x.; %). para unmodelo de regresión rinear sirnpre, se tiene ra siguiente expresióí:

I (Xo - X)2-+ '--- --z dondes :n »(Xi - X)2 e

I=Y *t oo t-q,2:(n-2) "c

(s.41)

(s.42)

La norma pararatasación de inmuebres urbanos NB-502/g9, de raABN! admite unintervalo de confianza máxima del80%o,o una significancia *rrima del2Ú%.para esteintervalo se considera q :20yo.como se puede observar en la expresión 5.42,lamenor amplitud del intervalo ocurrecuando el bien tasable posee características iguales u ru *.áiu ¿" las características delos datos muestrales, esto es, x =X Las rnuyo.., amplitudes ocurren en la frontera delcampo muestral' En este caso, lás estimaciones más piecisas ocurren para las tasaciones

}"t"::ffiaras caracterísricas medias de ros datos a" ,"r"r.n"iu y ru, más imprecisas,

,.rrtu uur'urión der intervaro de confianza en torno de ! puede ser vista en ra figura

?=bo+b,.x,

Figura 5.39

lxc¡xr¡¡ir o¡ Tnucrox¡stff

j

HOMOGENETZACTóN UTTUZANDO MODELOS qEBEGRESIóN tlNEAt SIMPLE_.qI;ImLa estimación de un intervalo de confianza en torno de un punto cercano a la frontera

de la muestra o cuando se trata de una muestra extraída de una población con caracterís-

tica platicúrtic4 la amplitud del intérvalo puede ser bastante amplio, es decir, una estimación

basiante imprecisa parala media. En estos casos, es preferible reducir la confranzay

obtener un intervalo de variación más estrecho. En una situación opuesta, en que lamuestra

es extraída de una población con características leptocúrticas, la confianza podría ser

ampliada. Esto seríá bien informativo para el que toma decisiones, pues es preferible una

estimación con 99%o de certezaque otra con apenas 800/o, por ejemplo. Pero el tasador no

le está permitido de presentar uná confianza mayor en su trabaj o, por cuestiones normativas.

Seríamás coherente establecer intervalos aceptables de variación en torno de la media, a

furtl. O. allí, calcular la probabilidad del verdadero valor de mercado contenido en ellos'

Aplicoción 5.4

Considerando los datos de la aplicación 5.Z,estimar el valor medio de mercado y el

intervalo de confianz a al 80%o para un local comercial con diez años de edad, sabiendo

que la desviación estándar en torno a ese punto es igual a 100'

Solucién:

l") Estimar.'l\alor medio de mercado sustituyendo xo= l0 en el modelo

Y: 900 - 10. x

que coresponde a vn Yo: R$ 800,00/m2

2') Estimar el intervalo de confianza por la ecuación 5.41, es decir,

/: t" +tro,,r.s(to)

Entrando en la tabla 12, delapéndice I, se encuentra t oo. ,, : 1,33. Sustituyendo los

resultados, se tiene

I : 800 + 1,33 . 100 ó I : 800 + 133

Asl se encuentra un límite inferior de R$ 667,001m2 y un límite superior de RS 933,00/

rf. E*o es, hay una probabilidad del 80% de que el valor de mercado esté entre esos

límites del intérvalo de confianza.

5.I3 EJERC¡CIOS PROPUESTOS

5.t3.I Se propone un ejercicio bastante sencillo, que debe ser resuelto sin necesidad de

rilizar ningun sistema de tratamiento de datos. Su resolución es fundamental para ente*'

& et desarrollo de los demás asuntos abordados en los capítulos siguientes'

Para la r

distancias a

Con base en los

I - Verificargráfictro urbano. Inecuación.

2 - Estimar los p,

cuadrados".3 - La ecuación dr4 - Los coeficiente5 - Calcular la des6 - Construir la tal7 - Probar la signi.8 - Probar la signif

del5%o e inter¡9 - Encontrar un il

l0 - Analizar el gráI I - Probar la hipót12 - Probar la norm13 - Estimarel'oval<

urbano.14 - Estimar el inter

estimado e inte

5.I3.2 Para Ia tasatomándose como valy como variable indpresentó los siguient

a) b,,:7yb,estimador del paránestándar correspond

b) Coeficientec) F":25d) Desviación r

HOMC

tasaciórrl centro

lLL

§t*c tuws D¡rrrs

uT[]zANPg_MqDELOS DE

X;;?:Para la tasación de un lote de terreno, se recolectaron cinco datos relativos a lasdistancias al centro urbano y Ios respectivos precios r.lnitarios. ,"gú, .l cuadro siguiente:

HOMOGENEIZACIÓN

dato distancia(km)

preciounitario(RS/m'?)

I 0 J2 I

J

4 2 I

5

Con base en los datos recolectados, se pide:

I - verificargráfrcamente el compoftamiento del precio unitario con la disrancia al cen-tro urbano. Interpretar Ia figura, trazar una recta de re.sresión . encontrar-suecuación. '2 - Estimar los parámetros del modelo de regresión por el "método de los mínimos

cuadrados".3 - La ecuación del modero co, su respectiva interpretació,.I - Los coeficientes.de."correlación"y:'determinacibn", con las debida.-. inrerpreraciones.5 - Calcular la desviación estándar dól modelo.6 - Construir la tabla de ANOVA.7 - Probar la significancia del modelo al nivel del 5%e interpretar el resuirado.8 -

!r9b-a-r la significancia del parámetro correspondiente a la variable disrancra. al niveldel 5oA e interpretar el resultado.

9 - Encontrar un intervalo de confia nza del g0% en torno de b10 - Analizar el gráfico de los residuos estandarirrdos u..ru, .,lálor., ajustados.l1 - Probar la hipótesis de no auto-regresión al nivel de 5oA.l2 - Probar Ia nonnalidad de Ios residuos.l3 - Estimarel"valorunitario" rnediopara un lotedeterrenoque está a 1.5 km delcentro

urDarlo.l4 - Estimar el intervalo de confianza al nivel del 80% en torno del r alor unitario medio

estimado e interpretar el resultado.

5'13'2 Para la tasación de un apartamento se recolectaron 19 datos de referencia,tomándose como variable,deperrdiente el precio unitario en RS/á, de area priv;il(Apjy comovariable independiente ra edad (E). Er modero escogiáo fue

"r "*pfr"n.;i;;¿presentó los siguientes resultados:

^*?)^^!: j^,7 !^!l -- -0,02 (0,005), que representan: los términos independiente y elestlmaoor del parámetro correspondiente a la covariable edad, estando la desviaóión

estándarcorrespondiente dentro de los paréntesis;b) Coeficiente de correlación entrb Ap y E igual a _ 0,95.c) F":25d) Desviación estándar del modelo igual a 0,30.

lxc¡xr¡rh or Txrcroxrs -§[p

2

I

I 3

nOUOG¡X¡lZlClóx UTIUZIXDO MODELOS O¡. nrCntstóX tINEAL SIMPLE..ryHe) Estadístico de Durbin-Watson d:1,90

f) Residuos estandarizados en los siguientes intervalos:

entre [ 1,65 ;+ 1,65] y 98Yo entte | -1,9 6; + 1,961'

g) Gráfico de los Resíduos vs Valores Ajustados:

Con base en los datos indicados se pide:

a) La ecuación del modelo exponencial con la debida interpretación'

b) [nterpretar el coeficiente de correlación'

.i El poder de explicación del modelo con la debida interpretación.

di Prábar la significancia del parámetro correspondiente a la edad al nivel del5%o;

"i Probarlasignificanciadelmodeloalnivel dell%'

0 Probar la no auto-regresión al nivel del2,5Yu

g) Analizar. lo\residuos y su normalidad'

ñ) Analizar el gráfico de los residuos en función de la homocedasticidad'

i Estimar el válor medio de mercado, la moda y la medianapara un apartamento

con l0 años de edad.

) Estimar la tasa mínima y máxima de depreciación anual.de-los apartamentos en la

,"gión abarcada en la investigación, considerándose un intervalo de confianza de 90% en

torno de la tasa media inferida.k)Atenderel tratamiento dispensado alos datos según losniveles de rigorde laNB-502/

89.

LAHOMOGENE¡z

6.I INTRODUCC¡

El modelo de regruna variable indepenrmercado.

En la Ingeniería c

múltiple, teniendo en r

un bien.Como fue expuestr

regresión lineal simplobservados, colocadordependiente y otro pardos variables indepenejes cartesianos: uno pSuponga, por ejemplode los precios unitaricdistancias a un polo valse encuentra un gráfic

Figura 6.1

Observe que los pu:egresión lineal será re:omo lo muestra la figu:a para los precios de l.

.rpo:

P:bo+b,.

70oA entre | -1;+11;90%

Vi.:¡.r L,:: Drr's

-v

Documents

Capt 5 Regresion Simple