Upload
elio16mso
View
22
Download
0
Embed Size (px)
DESCRIPTION
Estadística aplicada a la Valuacion
Citation preview
-A HOMOGENEIZACIéN UT!LIZANDO MODELOS DE REGRESIóN UNEAL S¡MPLE
: .I CONCEPTUACIóN
: urodelo Clásico de Regresión tuvo su origen en los trabajos de astronomía elabora-
" , r -¡r' Gauss en e! período de 1809 a 1821 . Actuahnente el análisis de regresión es una-: : S rsrri&s de la teoría estadística rlrás utilizados en la investigación científica. Es uua;-- - r3 adecuada cuaudo se desea estudiar el conrpoñalniento de una variable (variable;r:..liente) err relación a otras que son responsables de su foruración (variables" :t::ndientes).
-:, Ingeniería dc Tasaciones generalurente se considera coluo variable dependiente,, ::ecios de contado de los datos de niercado eu oferta o efectivamente negociados, ¡,
. - -- r.ariables independientes, las respectivas características relacionadas con los as-
r,r-"rs físicos y de localización, así como los aspectos económicos (dato de oferta o,:-..,'ción, época de ocurrencia del evento, etc.). Se observa que las variables- -=::ndientes pueden ser tauto de uaturaleza cuantitativa (área, frente, etc"), colllo*;. :=tiva (uaturaleza de la infornración, orientación solaq etc.)
- -:ndo la variabilidad de los precios puecle ser explicada por apenas una variable":=-=:diente, a través de uua función Iineal, se utiliza el modelo de regresión lineali * . ;. que será tratado en este capítulo. Cuando lnás de una variable indepencliente es
,r-:.:,::ie para esta explicacióu, se adopta el moclelo de regresión lineal nrúltiple, que será
uu,,-:- - Je los próximos tres capítulos. Aunque en la práctica, lo rnás usua! es el ln«rdelo dets:: :,:l lineal rnúrltiple, se inicia con el rnodelo de regresión lineal sirnple, debido a las
::les de entendimiento de las deducciones e interpretaciones. No obstante, todos. -:eptos de regresión lineal sirnple puedeu ser generalizados para el ntodelo de, -rlinealmúltiple.- :lelo de regresión lineal sirnple, para explicar Ia variabilidad de todos los rr precios
::do (I/), a través de las variacioues provocadas por una variable úrnica ({), se-:a por una funciórt lineal del tipo 5.1 y por las cinco hipótesis básicas clefinidas
. : ..:nción Lineal
i= 1,..,111 (5.1)
lHc¡x¡¡nir oe Tosocroxrs§p
-.- - ..1 ¡
-.- \-. ',' 1
.'.
--r Iac
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN UNEAL SIMPLE-.ry- es llamada variable dependiente, variable explicada o variable respuesta.
- es llamada variable independiente, variable explicativa o covariable.
- se denominan parámetros de la población.
- son los errores aleatorios del modelo.
b) Hipótesis Básicas
1i) La variable independiente debe ser representada por números reales que no
r rntengan ninguna perturbación aleatoria.
23) El número de observaciones, m, debe ser superior al número de parámetros esti-
nrados. es decir, que para el caso de la regresión lineal simple debe ser superior a dos.
3) Los effores de las variables aleatorias tienen valor esperado nulo y varianza cons-
tante, esto es, E (e,) = 0 y Var (q) : d.
4e) Los errores son variables aleatorias con distribución normal.
5a) Los errores no están correlacionados, son independientes bajo la condición de
normalidad.
Los valores medios de mercado para cada nivel de,{ son calculados por el compo-
nente sistemático del modelo 5.1, que se representa por:
§o+ §,X, i:1,...,nt (s.2)
Como no es viable el levantamiento de todos los datos del mercado de una poblaciór¡en lapráctica se trabaja con un subconjunto de n elementos de estapoblación, denominadamuestra, a través de la cual, utilizando inferencia estadística se estiman los parámetros de
la población. La ecuación del modelo inferido está dada por:
v-r --I
i:1,...,n (s.3)
Y.,.....,Y,- son los precios observados en el mercado, forman parte de la muestra.b0, b t - son los parametros estimados correspondientes a Fo, F,.ei,...,en - son los respectivos estimadores de€,,.......,€,, también denominados resíduos
delmodelo.
Y :bo+b,X + s
Donde:
§pnrrr*r Arv¡s Duus
HOMOGI
Una estimación d<
t,: bo+b,x,
En ungráfico formen ejes cartesianos, dtica que varía en cadlineal se representa ¡también como la rectr
Y, (dependiente)
figrra S. t -
Cabe destacar q
comportamiento del rlapráctica este,comp
Un caso particular,posee apenas un parátal. En la práctica, er
formación de los pre<
general, y el modelo e
Y,: Bo+ t,.
5.2 DIAGRAMA D
El primerpaso parminadavariable influ,en una tasación se delen relación a la distacasos distintos, preset
HoMoGENEtzActóN unuzANDo MoDELos DE REGREstóN uNEAL slMpLE
Una estimación del valor medio del mercado está dada por:
b,,+b,X
En un gráfico formado por [ares de puntos obsen'ados en el mercado ¡Xl;{), dispuestosen ejes cartesianos, donde I corresponde a los precios praticados ) ,{ a una caracterís-tica que varía en cada uno de estos datos. la parte explicada del modelo de regresiórrlineal se representa por la recta que pasa más próxima a todos los puntos. conocidatambién como la recta de regresión, como se muestra en 1a fieura -i.1.Yr (depend¡ente) : §o+ §,x, + e,
Muestna Y,: bo+ b.X.* e,
X, ( ndepenc e'::
Figura 5.1 - Recta I (media de la población) y Reca 2 reCta de Ia muestra)
Cabe destacar que con la recta 1 se obtiene una estimación del vercladerocomportamiento del mercado, que sería lo obtenido si se ler antara toda la población. Enla práctica este comportamiento se infiere con la recta l.
Un caso particular del modelo de regresión lineal simple es el modelo nulo. Este modeloposee apenas un parámetro. Su representación eráfica está dada por una recta horizon-tal. En la práctica, esto significa que no existe ninsuna variable explicativa sobre laformación de los precios, pudiendo estimarse el r alor de mercado apenas por la mediageneral, y el modelo está dado por:
Y,: Po+ e ,, i: l,..,nt (s.5)
5.2 DIAGRAMA DE DISPERSIóN
El primer paso para analizar el comportamiento de los precios en relación a una deter-minada variable influyente es analizar el gráfico de dispersión. Por ejemplo, suponga queen una tasación se desea analizar el comportamiento de los precios unitarios de parcelasen relación a la distancia a un determinado polo valorizante, pudiendo ocurrir cuatrocasos distintos, presentados en las figuras 5 .2, 5.3 , 5 .4 y 5 .5 .
Y, :
\ recta 1
lxcrxr¡rí¡ o¡ Trucrox¡sV
i : 1,...,n (5.4)
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN L¡NEAL SIMPLE§q;;p- HOM(
Este analisis iniel mercado inmobiregresión.Al plotezpuede encontrar es
frg.5.7.Vu (R$/m,)
Figura 5.6
Obsérvese que r
datos, el tasador a
buena aproximaciópara terrenos que e
este intervalo no hr
permitida la extrap,
si se desea estimarbastaría con buscaresultado R$40/m2
Es muy importtmodelo de regresi(más potentes del n
Otras situacionsecciónyotrasalc
Considerando e
muestra en la figurfenómeno, como e
delmercado para d
es equivalente a ha
FBura 5.2 - Caso 1 Figura 5.3 - Caso 2
Figura 5.4 - Caso 3 Figura 5.5 - Caso 4
De acuerdo al comentario en la sección 2.2.4.2, por la simple observación gráfica se
pueden detectar cuatro informaciones muy importantes de los datos: la tendencia, laintensidad, la forma funcional de la curva, y la dispersión de los datos.
En los casos presentados en las figuras 5.2, 5.3 y 5.4 se verifica una tendencia dedecrecimiento del valorunitario amedidaque laparcela se aleja del polo valorizante.Esto que parece bastante trivial, es muy importante para comprobar la creen cia a priorique el tasador tiene sobre el comportamiento del mercado. En los puntos de la figura 5.5no se puede extraer la misma conclusión. En este caso el mercado está indicando,aparentemente, que el polo no ejerce ninguna influencia sobre la formación de los precios.La inclinación de la recta indica la intensidad con que la variable independiente influyesobre la variable dependiente.
En cuanto a la forma de la curva se verifica que los puntos dispuestos en las figuras5.2,5.4 y 5.5 presentan características de linealidad, mientras que los de la figura 5.3indican un comportamiento exponencial. Esto es fundamentalparael tasador, pues en loscasos 1, 3 y 4 se pueden ajustar los datos a una recta, utilizando regresión lineal, pero enel caso 2 eso no es posible, sino se procede a la debida transformación para linealizar losdatos.
Por último, una cuarta información de bastante interés en cuanto a la dispersión de losdatos a lo largo de la curva que mejor se ajusta a los datos. Se verifica en los casos 1, 2,y 4 que la dispersión es aparentemente constante, es decir, aparenta homocedasticidad ovarianza constante de los errores; mientras que el caso 3, lavarianza de los datos escreciente a medida que se aleja del polo valorizante, presentándose condiciones de hetero-cedasticidad.
En capítulos posteriores se demostrará que los modelos ideales son aquellos que pre-sentan condiciones favorables de linealidad, homocedasticidad y con intensidad alta, estoes, rectas distantes de la recta horizontal, además de otras cualidades.
Ynr"*r Aw¡s Drxrm
' :.: :.: ::.:': :.: :.. . ... . .
lt- - -¡- - - l- -
lttt
--J-__L_tt
Figura 5.8
HOMOGENEIZACIÓN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPLEru}',-Este analisis inicial es fundamental para formular un modelo aceptable para explicar
el mercado inmobiliario. La curva que pasa más cerca a los puntos es llamada la cuiva deregresión. Al plotear los puntos en un papel milimetrado, corlo se muestra en la fig. 5.6 sepuede encontrar esta curva con bastante aproximación, como por ejemplo la recla de lafig.5.7.Vu (R$/m'?) Vu (RS/m,)
l501-
tt
1
Figura 5.7
Obsérvese que sin necesidad de usar equipos o sistemas para el tratamiento de losdatos, el tasador al trazar esta recta, está estimando un modelo de regresión con unabuena aproximación y podría, a partir de ahí, usar el modelo para estimar el valor mediopara terrenos que estuviesen a unadistanciaentre I y5 km. del polo valorizante. Fuera deeste intervalo no hay seguridad en cuanto al comportamiento de los precios, no siendopermitida la extrapolación. Elmodelo de regresión es intrínsecamente interpolativo. Así,si se desea estimar el valor para un terreno que estuviese a 3 Km. de distancia del polo,bastaría con buscar el precio medio correspondiente en la figura 5.7 y encontrar comoresultado R$40/m2.
Es muy importante que el tasador comprenda lo que está haciendo cuando ajusta unmodelo de regresión, siendo el análisis gráfico una de las herramientas más sencillas ymás potentes del modelaje.
Otras situaciones interesantes pueden ocurrir. Algunas serán presentadas en estasección y otras a lo largo del libro.
Considerando el mismo ejemplo, puede ocurrir una distribución de los datos como semuestra en la figura 5.8. En este caso se puede considerar una sola recta para explicar elfenómeno, como en la figura 5.9, pero no habría seguridad en cuanto al comportamientodel mercado para distancias en el intervalo entre b y c. Utilizar el modelo
"n .rt" intervalo
es equivalente a hacer una extrapolación interna, o mejor una..intrapolación,,
rII
II
X,.
Iwlxc¡xr¡níl o¡ Tslc¡ox¡s
ttttt- - -¡- - -|- - - I - - -r- - - I
lttttattttl
_ - -J _ _ _l _ _ -l _ r_L _ _ _.,l
I¡IIIttt.t.lltttt
- - "1 - - -T - - -'l - - -r- -.- 1tttltttltt
1
Figura 5.6
r'jab
tt-_J___L__
-
lt
rrll---'l---T--{---l--¡-
rtl¡ttll
Figura 5.9
HoMocENElzActóx unuaxoo MoDELos o¡ n¡cnrslóx IINEAL slMPtEryOtro caso bastante interesante, que puede llevar al tasador a cometer elrores graves
se presenta en la figura 5.10. La recta de regresión (recta 1) pasa por la media del
conj unto y por un punto aislado como se muestra en la figura 5 . 1 I .
Obsérvese que el comportamiento del mercado presentado en la figura 5.10 sería
explicado por larecta} de la figura 5 . 1 1 , pero debido a un punto discrepante, la recta está
diitorsionáda, invirtiendo la tendencia del mercado. Los puntos de este tipo o el mismo
conjunto de puntos son denominados puntos influyentes y son bastante peligrosos. Los
mismos pueden ser detectados fácilmente con un análisis gráfico.En el caso de los puntos de la figura 5. 1 2 se verifica que no hay información suficiente
para utilizar el modelo fuera del intervalo [a;b], pues estos tres puntos que no pertenecen
a [a;b] son determinantes en la inclinación de la recta mucho más que los que pertenecen
al conjunto formado por el «grueso» de los datos. Obsérvese que si los tres puntos estuvieran
com6rlos de la figura 5.13, el comportamiento del mercado estaría completamente
desvirluado. Este ei un caso típico de desequilibrio de la muestra. Elpequeño conjunto de
puntos no es suficiente para explicar por sí solo su tendencia. También son puntos
influyentes.
= 3-.a S 12 Figura 5.13
Er" el caso de los puntos representados en la figura 5.14 se verifica que se trata de un
;¿-o,¡:ipi;o de un comportamiento de datos provenientes de dos poblaciones distintas,
: -- -- -- : tr e-templo. datos de oferta y datos de transacciones. Si no se obserua el fenómeno,
: :-::=1,: a,iustado seria e[ de la recta I de la figura 5.14, pero en la realidad el
: ,- -: : :=:'. e:lto del mercado debe ser explicado por las rectas paralelas mostradas en la
Figura 5.10 Figura 5.11
§t*-A¡.ws Drrr¡s
HOMO(
figura 5.15. Este caslo, asunto que será tr
Una disposicióninteracción entreuna'
los datos de oferta y
alejan del polo. En e
lelas como las mostr
1o 7.
5.3 LINEALIZACI
El proceso de reE
vados en el mercadcel fenómeno si la t<
observa este tipo de
linealizados por la r
Considérese, por eje
una recolección de c
precios unitarios de
tendencia de decrecilas áreas. En este ca
5.1 8, sería inadecua,
cia ala linealidad.
Figura 5.16
r HOMOGENEIZAC!óN UT¡IIZANDO MODELOS DE REGRESIóN tlNEAI SIMPI.Eryfiguta 5.15. Este caso sería resuelto con la inclusión de una variable dummy enel mode-.u-¡. áSUnto que será tratado en el capítulo 7.
A
Recta 1
=,:-'a 5.14
Una disposición de los puntos corno se muestra en la figura 5.1 6 es un caso típico de::eracciónentreunavariabledummyy la distancia aun polo valorizante, como por ejemplo,",ts datos de oferta y las transacciones decrecen de forma diferenciada a medida que se
alejan del polo. En este caso, el mercado sería explicado a través de dos rectas no para-r¿ias como las mostradas en la figura 5.17. Este asunto también será tratado en el capítu-ic r.
oa
a
aaa
Figura 5.16
5.3 LINEALIZAC¡óN
El proceso de regresión lineal simple se aplica para ajustar rectas a los puntos obser-r ados en el mercado. De esta forma, la recta solamente tendrá significado para explicarel fenómeno si la tendencia de los puntos fuese lineal. En la práctica, no siempre seobserva este tipo de tendencia. Sin embargo, algunos modelos no lineales pueden serlinealizados por la simple transformación de las escalas de medición de las variables.Considérese, por ejemplo, que los datos resumidos en la figura 5.1 8 son el resultado deuna recolección de datos de lotes de terreno, donde los puntos ploteados corresponden aprecios unitarios de ¡nercado (P) versus las respectivas áreas (A). Observe que hay unatendencia de decrecimiento en forma hiperbólica de los precios unitarios en relación conlas áreas. En este caso, el ajuste de una recta a los puntos, como se muestra en la figura5.1 8, sería inadecuado, pues sólo se pueden ajustar rectas a datos dispuestos con tenden-cia a la linealidad.
Figura 5.'17
lxc¡x¡¡nh or Trucronm§[p
HOMOGENEIZACIóN UTILIZANDO MODETOS DE REGRESIóN TINEAL SIMPLEVz:llP
Figura 5.18 Figura 5.19
Por ello, se hace necesario algunatransformación paralracerposible lautilización de laregresión lineal,esto es,unatransformaciónque linealice losdatos. Lasoluciónparaelpro-blemaenunciadoesutilizarunatransformación inversa,Z: 7lP, en losdatosde la figura 5.18resulta en puntos con tendencia lineal como los de la figura 5.19. Así los datos con ten-dencia lineal serían modificados para una tendencia hiperbólica, cuando se realiza unainversión de la escala de las ordenadas, la reciproca también es verdadera. De esa formase hace la regresión de Z sobre A y se obtiene Ia ecuación:
Z=bo+ br . A
se obtiene:
1
F=b.+br.A ó P:
En seguida se retorna a la escala original, sustituyendo Z por 1 lP en la ecuación 5.6 y
(s.6)
(s.7)b" +b,.A
queesla ecuación de una hipérbole, llamada hiperbólica I. Así que en la escala de P se
tienen puntos con tendencia hiperbólica, en tanto, que en la escala deZlatendencia es
lineal. I
Como se puede observar, el conocimiento del comportamiento de los gráficos de algunasfunciones muchas veces orienta al analista en relación a la transformación a adoptar . Acontinuación se presentan tres funciones no lineales, bastante utilizadas, que pueden serlinealizadas a través de transformaciones adecuadas, con sus respectivos gráficos (Daniely Wood-1971), apenas en el primer cuadrante, todavezque tanto la variable explicadacomo las explicativas son números reales positivos.
(r) Función Hiperbólica II
Esta función tiene una ecuación del tipo:x
Y= ax- b(s.8)
[-a ]inealización de la ecuación 5.8 se hace con la inversión de las escalas de x y dey,como se indica en la ecuación 5.9.
§nrr,rr Arv¡s Drxus
¡toMo(
I--av
Elcomportamien
Figura 5.20
(b) Función Ex¡
La ecuación de ur
y=a'€bx
La linealizaciéntransformación invetobteniéndose la ecuar
Lny:LniEl comportamieff
Figura 5.22
Una información ide variación de y enestimar una tasa medi¿
utiliza una función ex1
)ogarítmica poseen dirlistribución lognormal
HOMOGENEIZACIóN UTITIZANDO MODETOS DE REGRESIóN UNEAL SIMPLEx;ñ,-__a__ (s.9)yx
El comportamiento gráfico de Ia ecuación (5.8) se muestra en las figura s s.20 y 5.21.
(b) Función Exponencial
La ecuación de una función exponencial es del tipo:
y=aoebx (5. r 0)
Lalinealización de una curva exponencial se hace utilizando la correspondientetransformación inversa, esto es, una transformación logarítmica de la estala de y,obteniéndose la ecuación :
Lny=Lna+bx (s.r l)El comportamiento gráfico de (5.Il) se puede observar en las figuras 5.22y s.23.
Figura 5.22 Figura 5.23
Una información importante suministrada por la ecuación 5.10 es respecto a la tasade variación de y en relación a x, que se indica por (l-eb). Así, cuando se pretendeestimar una tasa media de valorización territorial en determinado período, por ejemplo, seutiliza una función exponencial. Otro aspecto a considerr.
", qu. si los datos en la escala
logarítmica poseen distribución normal, hay indicios de que los datos originales poseendishibución lognormal.
Figura 5.21
Figura 5.23
lxc¡xr¡rí¡ or Tunoox:s\ff
1b
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPTE'ry HOMO
5.4 ESTTMACTó¡
La manera másllos MínimosCuadraerrores calculados p
los siguientes:
a) se determina u
medios calculados ¡
b) se calculancorrespondientes ajr
vertical, entre cada
t)-tt-I
c) se define unapara una muestra dr
, =fu?. ,=l
Observe que la s
ma a los puntos, pttienen dos caminos
1
sumatoria de losmatemáticamente. (
método de estimacir
d) se deriva unay cadaresultado se
es igual al de los pestimados que se br
A continuación r
modelos nulo y de n
5.4.1 MODELO I
La estimación st
puede generalizar pr
(c) Función Potencia
Esta función tiene una ecuación del tipo:
y=a'xb (s.12)
Lalinealizaciónde 5.12 se haceutilizando unatransformadalogarítmicaen lasvariables
x e y, resultando en
Lny:Lna*bLnx (s. 1 3)
El comportamiento gráfico de 5.12 se puede visualizar en las figuras 5.24 y 5.25.
Figura 5.25 |
Una infonnación importante cuando se utiliza la función potencia es que b indica la
elasticidad de y en relación a x. El concepto de elasticidad esta ligado a un aspecto del
comportamiento de las variaciones de y en relación a las variaciones de x, por la ecuación:
(s. l4)
Cuando se usa una transformacióu, se debe enteltder que no se trata de un urero
ejercicio de matemática, es importante saber lo que representa el cambio de escala pro-
puesta y si es coherente para explicar el mercado. No se debe confundir con un simple
proceso de intentos, en el sentido de buscar mejores resultados estadísticos. Esto no
basta. Es importante que el modelo resultante pueda expresar con fidelidad el fenómeno
que se desea explicar. Si este es coherente con las creencias a priori que el tasador tiene
sobre el mercado, así como sus teorías sobre el mismo. Por ejemplo, si una cuestión es
inferir la tasa de valorización territorial en una región y es del conocimiento del tasador
que el crecimiento sigue una tasa aproximadamente constante, tiene sentido utilizar un
modelo exponencial; pero si el tasador espera que la tasa sea decreciente en el periodo
observado, el rnodelo más aproximado sería uno potencial.
dvlv" dx/x
Y
-1 <b<0b=-1
§nrtt*t Aw¡s Duus
Y:b
Y_?
v
HOMOGENEIZACIóN UTILJZANDO MODEIOS DE REGRESIóN LINEAT SIMPLE..-qFr.5.4 ESTtMAcIóx or los paruu,tETRos
La manera másfacil deestimar losparámetros del modelo es a través delMétodo delos Mínimos cuadrados. Este método consi ste en m i n imizar Ia sumade los cuadrados de loselrores calculados para una función cualquieradelaecuacióndeterminada. Lospasossonlos siguientes:
a) se determina una dunción cualquiera de los parámetros de las variables, con valoresmedios calculados por 1,.
b) se calculan Ios errores existentes:lt.renros puntos observados ({) y roscorrespondientes ajustados por el modelo definidoi, esto es, tu. J¡rtur.¡us medidas en Iar ertical, entre cada punto observado ({) y er estimádo por ár ,roJero (r ) , esto es:
E:
c) se define una función U formada por la sumatoria de los cuadrados de los errores,para una muestra de tamaño n, dada por:
(s. I 5)
(s. l6), =jr?
¡=1
¡1
óu=Irr,_y, ),i-t
observe que la sumatoria de ros errores E es nura para la curva que pasa más próxi_ma a los puntos, puesto que los errores positivos se anulan con los negativos. Así setienen dos caminos para cuantificar estas áistancias: la sumatoria de los módulos o por lasumatoria de los cuadrados. La segunda solución es nrás fácil de ser tratadamatemáticatnente. cuando se utiliza la minirnización de los cuadrados de los errores, elmétodo de estimación se denomina método de ros mínimos cuadrados.
d) se deriva una función uen relación a cada parámetro desconocido de Ia función i
A continuación se presenta Ia metodología citada para estirnar los parámetros de losmodelos nulo y de regresión Iineal simple.
5.4.1 MODELO NULO
La estimación se inicia por el modelo más sencillo, no obstante el razonamiento sepuede generalizar para los modelos más complejos. El modelo nulo está dado por:
y cada resultado se iguara a cero, obteniéndose un sistema de ecuacilones cuyo numeroes igual al de los parárnetros a ser estimados. La soruciión del siistema suministra losestimados que se buscan.
1 re. conI t, (5. I 7)
lxc¡xl¡nh o¡ Tmrcro¡¡s Y
HOMOGENEIZACIóN UTITIZANDO MODELOS DE REGRESIóN L¡NEAL SIMPLE_{§tF"
Su representación gráfica se muestra en la figura 5.26.
El estimador á, se obtiene considerando una recta horizontal cualquiera dada por { :8,, donde la sumatoria de los cuadrados de los errores está dada por:
u=fv,-í, )' 6 u=frr,-B)2i=l
Para imponerle a la función la coñdición de mínimo, se calcula inicialmente la primera
derivada de la función en relación a la variable Bo, o sea:
.ndU / dB" * -2»G, - B") = -2(ZY,- B".n)
i=t i=l
lgualandodU/dB,,acero,seimponelacondiciónde mínimo a la funclón (5.19), que co-
incide con el modelo 5.17. Así, 8., que antes era una variable, se transforrna en una
constante b,,, üna vez que el sistema nos da la solución buscada, cóñro se demuestra a
.outinuación:
sr dU/dB.: 0,
De modo que en una población de datos homogéneos, el valor del mercado se estima
por la media aritmética de los datos muestrales. Se observa que en el momento en que se
impone la condición de mínimo a la función 5. I 8, se encuentra el estimador del parámetro
desconocido representado por bo.
La comprobación de la condición de mínimo de la función se verifica observando el
resultado de la segundo derivada:
dru/dB,2 : -2. (- B") = 2n > 0
Como la segunda derivada es positiva, la condición de mínimo para la función está
gr^r-antizada
5"{-2 X'DEI.o UNEAL S¡MPLE
Ei .nlormedio ajustado para una función lineal corresponde a una ecuación del tipo
j.'-;-rv- - L L' ..t
:l
entonces n . bo =f ', , ó bo = t', ,n o aiin b,,: Y
lfnrou D¡¡¡,s
(s.21)
HOMOGEN
Surepresentacióngl
En este caso la fuprecio observado (I/,)
cualquiera Y,: B, + Á
U
Para que en esta ful
las derivadas parciale
y dJ/B,: 0, esto es
(s.1 8)
(s.1e)
(s.20)
ÍaJ/a,,: 2 z (Y,-
latta,:2»(Y,-Igualando las deri'
n +b,.8.zx,+ b,. E,
Nota: se consider¡
La solución del sir
correspondientes; de
Y,: bo
Los precios ajusta
?,: b"
v
HOMOGENEIZAC¡óN UT¡I¡ZANDO MODETOS DE REGRESIóN [INEAL SIMPTEru;p*Su representación gráfi ca es el de una recta i nc linada, como se muestra,e n la fi gura 5 .27 .
?,: b,, + b, 'X,
Figura 5.27
En este caso la función que mide la sumatoria de todasprecio observado (f,) y el correspondiente precio ajustado,cualquiera Y,: Bn * 8,.X, está dada por:
u =f ,: =f (y,- 8,, - 8,.x,)2
Para que en esta función alcance su punto mínimo, se hace necesario inicialmente quel¿s derivadas parciales en relación a cada parámetro sean iguales a cero, o ilr/B,: 0y d.l/68,:0, esto es:
Ias distancias entre cadacalculado por una recta
Igualando las derivadas a cero se obtiene el sistema siguiente:
h.. n +b,.»X:»Ylo I t i
\b^. »X.+ b,. »X2: »X . yt" t t t -¡ --¡
Nota: se considera en los sistemas 5.23 y 5.24 que X : i
(s.22)
(s.24)
(s.2s)
tr-a solución del sistema 5.24 nos da los estimadores de los parámetros poblacionalesccrespondientes; de esta forma el modelo deseado tendrá la siguiente ecuación:
Y, : b,,*brX,+e,
Los precios ajustados por la recta de regresión están dados por:
Y,: bo+ bt.X, (s.26)
lxc¡xr¡nír or rmoones§
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIÓN LINEAL SIMPLE*.{;'o
Tal como se vio en la sección 5.4.I se pr-rede confirmar la condición de mínimo de la
: * l-.; Lón si al calcular las derivadas de segundo orden, estas sorl positivas. Una forma más
*::neral de verificación se presentará en la sección 6.3'1.
Los residuos estimados se calculan por:
e:Y
5.5 COMPROBACIóN DE LAS
(s.27)
HIPóTESIS BÁSICAS
Además de la estimación de los parámetros, es de fundamental importancia la
verificación de la hipótesis básicas citadas en la sección 5.1. Cada hipótesis se analiza, en
particutar, para un modelo lineal simple ajustado a datos inmobiliarios.
PRIMERA
La vuriable independienle correspontle u los números reoles que no confienen
ning una pert urbilción aleaforia.
De hecho, en el caso de los datos inurobiliarios, las variables independientes están
relacionadas con Ias características fijas de cada elemento tomado como referencia, por
1o que se cumple la hipótesis.
SEGUNDA
El númeroestinrodos por
de observaciones, n, debe ser superior al número de pordmetros
el modelo.
Para el rnoclelo de regresión lineal sirnple, que considera dos parámetros ( §,,Y F,), el
"_, ;.:e de la recta de regresión exige al menos tres datos. Aunque este núntero de datos
:..:.i.r,.s cumple con las exigencias matenráticas de la estimación, en la práctica, no es
. -:-: r:nre para explicar el comportamíento del mercado. La nonna brasileña NB -502/89
=." ,:; :n mínimo de cinco datos cuando se estima un parámetro en las tasaciones nonnales,
:::: :.:Jelos de regresión con fr parámetros como mínimo k+5 datos en las tasaciones
: --:-s:s r en las tasaciones rigurosas especiales 2k+5 ó 3ft, el que fuere mayor. Se
;-. ;::. que para medir el efecto de una variable sobre la variabilidad de los precios, se
:.:" :.r::,r ar con un mínimo de cinco informaciones sobre estavariable, adernás de las
, -:- -.;::s:rias para estintar Ia rnediageneral. Esto es un mínimo de cinco datos para
- r - r r::;rr 3::.- .stinlado. lo que resulta en una muestra mínima de 5ft datos. Además de
:i ,; :=:: :bser,,arel eqLrilibriode lamuestra,comose indicóen lasecciótt3.5.2.
HOMOG
TERCBRA HII
Los errores son t
El primer aspect<
valor esperado del er
coeficiente á, del mcimportantes en el ani
Para la verificaci(analíticos que puedede los residuos se pu
^ Un gráfico de res
[,), que presenta putpasa por el origen, es
un indicador favoralerores; en caso con'
figura 5.29, se pued,
ciaso, se dice que el r
Figura 5.28
Cuandoelmodelo:r sesgados yconsiste
:.i menos asintótican:arámetros son sesga
rectas. En este casoenlino error, hacien<
cuadrados ponderadr
nes adecuadas en la
CUARTA HIPC
Los errores son
Como se puede «
estimación de los par
Pero la rnisma es ner
cuando el modelo es heterocedástico, los estimadores de mínimos cuadrados son tambiéninsesgadosyconsistentes, pero no son Ios de menorvarianza, es decíq que no son eficientes.ni menos asinróticamente. Las estimacione;;;il;;;;;i;"J;'i", estimadores ae rosparámetros son sesgadas, y ras inferencias sobre elras y ,obr" ios parametros son inco_rrectas' En este caso sedebe tener precaución en el se,it¡oo ie "uán¡liru,
la varianza deltérmino effor' haciendo Ia estimacion de los parámetros a través ¿"1,r¿todo de los mínimoscuadrados ponderados' que se presenta en la sección 6.3. I I , o haciendo transformacio-nes adecuadas en ra variabre dá respuesta, col,o rogarítrnica o raíz cuacrrada.
CUARTA HIPÓTESIS
Los errores son variabres areatorios con crisfribución norntor.
I como se puede observar ninguna suposición en este sentido fue necesar ia para lapstimación de los parámetros del modelo a través del método de los mínimos cuadrados.fero Ia misma es necesaria para hacer inÁr"n.ru. y
"orrt.ui. int.*aros de conftanza.
lxc¡x¡¡nír or Trucroxm§
H0M0GENErzAcróN urrl'f4tP-q.tfiilifiil?iI¡cn¡s¡óx uNEAL srMpLE
TERCERA UrPÓrNSrS:
Los errores son vartables aleatorios con valor esperodo cero y varionza constanfe.
;¿so. se dice que et modeto es htr¡oced¿.ri." y .,, J;;;;ü i",.,".§;Xlljl
El prirner aspecto de esta hipótesis es de difícir verificación, sin embargo, así sea el- ' rr esperado del error aleatorio igual a rrla constante, este puede ser absorbido por el:;:eficiente á., der modero, sin provJc";;;;;" en ros derná. .oi¡.i"r,"s, que son ros más.-lo(antes en el análisis de regresión.Para la verificación del aspeJto devariat'tzaco¡rstante der e,oq existen varios métodos¡:'alíticos que pueden ser encontrados en Kmenta ( I g7g). A travÉs de un análisis gráfico:r los residuos se puede verificar.",-, f.";il;;;;
"." ,1,07iJ,;."u"un gráfico de resíduos.(e) versLrs ros varores u.;,,riáo, por er modero de regresiórri t' que presenta puntos ¿istribuidos aleatoriame,.,á ",.,
,orná u ulu recta horizontal que:':sa porel origen, esto es, si, ningún patrón definido, como ra i*ru de ra figura 5.2g, es-: indicador favorabre a Ia acepiaci¿n ae ra hipótesis ¿" ,u.iunru constante para rosr::ores; en caso cotttrario, si.los puntos presentan unatendencia, co'r.ro los datos de la::::i:r?:,:::*:^"::'::',.x1: u1,ii11,u¿"r
",,o,,,o ", "l,,,un,e En er primer
Figura S.28
HOMOGENEIZAC!óN UTTTIZANDO MODETOS DE REGRESIóN TINEAT SIMPLE
En un primer análisis, se puede verificar esta hipótesis observando el intervalo
comprendido por los residuos estandarizados (" i ),"ttot seencuentrandividiendocada
residuo(e,) por ladesviaciónestándardehnodelo(s),calculado por(5.32), toda vez que en
una distribución normal ,68Yo de estos residuos están en el intervalo [-l; + 1],90% entre
l-1,64;+ 1,64)y 95% entre [-1,96 ;+ 1,96].
Un histograma de los residuos presentando simetría y forma parecida a la curva nor-
mal es un indicador a favor de la hipótesis de normalidad del error. El gráfico de los
residuos es el que arroja los mejores resultados en este sentido.
Para la construcción del gráfico normal de los residuos se deben plotear los puntos
correspondientes a cuartiles muestrales de los residuos ordenados versus los cuartiles
teóricos de la distribución normal, que sí resulta en una recta se puede verificar la hipóte-
sis de normalidad. El coeficiente angular de esta recta es una estimación de lavaúanzay
es un coeficiente lineal de la media. En el caso de la distribución N (0,1), los puntos se
deben situar sobre la bisectriz del primer cuadrante.
Se observa que el campo de variación de la distribución normal es todo el intervalo de
los números reales, mientras que los precios de los inmuebles son estrictamente positivos.
Esto hace que la distribución normal no sea la más apropiada para los datos inmobiliarios.
Una solución que ha sido bastante satisfactoria es el cambio para una escala logarítmica,
puesto que el logaritmo del precio abarca toda la recta real. Cuando el logaritmode los
preciostieneunadistribuciónnormal,sedicequelosprecios tiene unadistribuciónlog-normal.
Estadistribuciónsehamostrado aj ustada a los datos inmobiliarios.
QUINTA HIPÓTESIS:
Los errores no estdn correlacionaclos, es decir, que son inclepéndientes baio ta
condición de normalidad"
El concepto de independencia de los res iduos esta li gado a la independencia de los datos
de mercado. Una situación idealesaquelladondecadatransacciónserealizaindependien-
tementedeotra. Estoes,elconocimientodelprecioylascondicionesdeunatransacciónnointerfieren en la otra.
La existencia de autocorrelación en los términos de la perturbación aleatoria se puede
verifica¡ con el auxilio de la razón de Von Neumann, dada por:
I(", -t,-,)'d=¿-"
I'ii=l
(s.28)
donde e es el i-esimo residuo del modelo, ordenado de manera creciente con relación a
lo-r r alores aj ustados, considerando una muestra de tamaño n.
Para n srande se demuestraque d:2 ( t - r ),donde r es el coeficiente de correlación
e::i e ) € ,., . De manera que sí r=-1 los residuose, Y €¡-, están perfectamente
::::el::.:r.a.josnegativamel'fteyd=4;sir=*Isetieneautocorrelaciónpositiva
HOMOGE
perfecta y tl= 0. CuarEl estadístico r/fue
2,5%oy 1oá, consideravariables independiencuentran en el apéndir
Para probar la hipruna hipótesis de queecuación (5.28) y desp
-sid,,<d<4-d,,,correlacionados a favestablecido.
-§i d < d, se acept-Sid>4-drseac-En los demás casr
La representación
Región uto-regresiónPosidYa
Se puede demostraautoregresivas, los espero ya no son eficien
Un sráfico de e vfuerte iñdicador de l'a c
la situación cuando lo¡indicios de autocorrel¿
Aplicoción 5.1
En la tasac ión de ununmodeloderegresiónd=2,2.Sepideprobar I
§i-:a., A-.¡ Drrrs
la
In
HoMoGENElzAoóxutllt¡¡flg-o-Tp,il EGREsróNuNEALsrMpLE
*'f¡j:_lÍ:,|:9:rr9: nl luv autocomelación r = 0 y tF 2.
,9]:'39,.]:."r/fuerabuta¿r'piri*i;':i;;'"',;;:,,;2,5yoyrz,,.o,*ia",ffi ;ff J.TíTZ,;;,:T:1if ffi ,§[: jf ::::lTi,if]ll:rariabres i,a.p",Ji.,;.:;ililIffiil",::'i#:,¿:;.i[1:T.]i.,"[:;::1,"1:::1'^::'rs§, ssraDtectenoo los limites críticos d
,- y d ,,. Estas tablas se en_.rT:::i:::]:|^"l91:: I,.con las.idenrificaciones ls, ro ylir:.ipl"ti,ur"nt".para p ro b a r i
" n ü áL J r I il [','fi '],:] T:l'Jff : i:,
"'ÍJ,' lJni;: [:1T: : l";correlacionados (Hr) contrauna hipótesis de que los residuos no;rrá-, ;;;il";:rI§rauronaoos (fir) contra
ecuaciórr15 ?R\w^ecn,,Áo r correlacionados (l1r), se calcula á con laecuación (5.28)ydespués secomparac";i;; -vr¡v'Év'vrrquur \'I17''fr se calcula r/ con la
_sid <d<4-. renhnzorr lrna,.críticosd.ydudelaformasiguiente:; I 1,1 ;l l"l' i ; Í" :, ^ :^l I 11u,1' ; l " u
"" i u' u"il il;;' ! i : [ il ; 3 i ? [' i :5J ::U;
:,Tf,1: ::l u ¿ o, u á;
" -
" iii, ; ;ffiH::#:?J :*,¿il:::"i: : [J¡; J : ;;xffi x Í ;establecido.
-li I . d, se acepta la hipótesis de auto-regresión positiva.-:i q, 4.- d ,se acepta la hipOtesis d. uriJ_."gr"sión negativa.-En los demás casos la prueba ro ",
concluyente.La representación gráficade ra prueba il;; ser visuarizada en ra figura 5.30.
Reg¡ón no concluyente
-
R.g¡ón auto,r€$esiónPos¡r¡va
d,,
Figura 5.30
L.-..-.}
(4'du) (4-dr) Reg¡ón auro-retresiónNe8ativa
#d,
Se puede demostrar. con facilidad (Kntenta-1978)que cuando las perturbaciones sonautoregresivas, ros esrimadores ¿. ,,i,ii*á, craaríaó, ,án-i,irlrguaos y consistenres,pero ya no son eficientes, ni menos asintoiicamente. :
l:ilrfát1ai;.í¡1.{li¡i¡4n*:.,'f 1?3J:::i.::iffi .i".:,it,it"l:u:ff itr:ti3jfliffL"J#,::i:.!TI[,ffij.f¡ffiiJgl ]ispuestos.";;s;;;;,;;;.i;: p,;1,¿.Íhll
Aplicoción 5.1
En la tasación de un inmueble, donde fueron considerados 25 datos de mercado, se utílizóunmodeloderegresiónlinealsimpley..ouiruo"or¡oresurtadoelestadístic odevonNeumanc=2,2.sepideprobar ra hipóües;, ¿á no uuio-regresión .n ,t ,oa"io para un niver de 5%.
lxc¡xr¡dr o¡ TrsrqoxEs
V
l<
Región de no auto-regresión
HOMOGENE¡ZACIóN UTILIZANDO MODETOS DE REGRESIÓN t¡NEAt SIMPTErySoIución:
1) Se encuentra en la tabla I.5, apéndice I, los puntos críticos tabulados por Durbin-
Watson, que están en la primera columna y la linea 25, esto es:
d,,:1,29
2") Definir las regiones
Y du : 1,45
4 -d, 4-d,-
HOMOGE
dudL
1,29 1,45 2,55
auto-reg. no no auto-regresíonpositiva concluyente
2,71
residuos, pues cuandcestandarizados están e
mayoría de los puntos r
Pero puede ocurrir c
estandarizados fuera d
ejemplo los indicadosprovienen muy probalaquel de una muestra q5.33. Observe que toddiscrepante en relaciórdatos provengan de unque es un procedimiercon residuos estandaridisponibles en el mercide los residuos. El ajuGama, Binomial, Poissdos, asunto que será tri
Figura 5.32
5.6.2 PUNTOS INFLUY
Se entienden por pu
algunas veces hasta nulpletamente las tendenci
no
concluyente
auto-reg.negativa
3")Verificarencualregiónseencuentraelvalord=2,2.Comodestáentre 1,45y2,55,se
puedeconcluirquenoexiste auto-regresión en los residuos al nivel de significanciadel5oA.
5.ó PUNTOS ATíPICOS
Adernás de las cinco hipótesis básicas es imporlante verificar si hay presencia de
outliers o puntos influyentes, todavezque los estimadores de mínimos cuadrados no son
robustos cuando purrtos de esta naturaleza contribuyen al ajuste. En este caso, el modelo
no se ajusta bien ni al «grueso» de los datos, ni a los datos cotl un punto atípico.
Un punto atípico debe ser analizado aparte con bastante cuidado, pues puede haber
sido ocasionado por errores de medida, o por algún cambio en el compoftamiento de la
muestra. Es aconsejable que se haga otro ajuste excluyéndolos y comparando el nuevo
modelo con el anterioq obteniéndose de esta forma informaciones respecto a sus influencias
sobre los parárnetros estimados y tanrbién sobre el poder de explicación de la ecuación
de regresión.
5.6,1 OUTLIER
Se denomin a outlier al dato que tiene un residuo grande en relación a los demás que
c,¡rnponen la muestra.
Esros puntos pueden ser detectados con facilidad a través de un análisis gráfrcode los
residu,-.s estandarizador (.i) versus los valores ajustados correspondientes (i ). no,
e_ e:rp,... para puntos dispuestos como los de la figura 5.3 1 , aquellos destacados pueden
sei ca:fJlerizados cot¡o oufliers.{l¡b-erese el hecho de que el punto tenga un residuo estandarizado superior a2,en
..: --:::¡:l::,:,.estonoirnplicanecesariamentequesetratadeunoutlier.Estaindicación
=- . '_- - -- ;) r:r-.p-rr-tante para detectar urra información respecto a la nonnalidad de los
gi
+2
+1
V;'1i': L':: D$r^j
H,M.GENErzAoóN u,l!4¡q'9 ltlri,,,riíñ P'fi'REGREsTóN
uNEAr' sTMPLE
ei
+2
aaaaatati'
FIGURA 5.31
aoao
aaa
aal¡
ftura 5.32
[..r rr*ros rNFruyENrES
§e entienden por puntos influyentes aquell(unas veces hasta nuros nre cF rricro,.^i^,^ ,^1t-
p'nto'.que tienes pequeños residuos,
lf H:: [Tl']::T^'t: l::' : Y : :: ;,'r;:., ;;; i,;;ffi ;:ffi i,iendo alterar com-
-a; iuos' pues cuando los datos presentan estas características, 95yo desus residuos:rr':darizados están entre -r,g6 y +1,g6,esto es, aproximadan-lente entre -2 i +2. sí Iar;'' ':ría de los putttos están entre Lstos Irmites existen indicios favorables de normalidacl.:-:'l puede ocurrir que una mLrestra con. dispersion g.ánJ., con rarios residuosx--:ndarizados fuera del intervalo [-2:+2),sin aparenta. pi,-,ri", aircrepantes. como por*'=:rplo Ios indicados en ra figura \.t2. Érestecaso que se puede inferir que ros datos
il,.i.¿ J#frJ#l"o,.,r.nt" de una distribución cá,rru. u;,
";." conrrario puede ser: : _: o b serv" 0,,.,"0'll iJ:ffliJ :liix.Jl li, i:Jff :' ü ;T;l,r¡:?:..,i"ff lf ii*: s':repante en reración a ra masa de datos. En un caso .á,ro
"r,. es probabre que rosr::'-s provengan de una pobración con distribución binom¡ol. o" .rru forma. se 'erifica
l-3 es un procedimiento peligroso considerar purrtos outriers que apenas se presentan:::: residuos estandarizados fuera de los lilnites _2 y +2.o,rolru.", al_qunos sistemas¡.-'ponibles en elmercado' De aquí se ve L¡na.vez_más la ímportancia dei análisis gráficoir los residuos. Er ajuste de ros datos .o,, dirrribrciones áii.r",ri., a ra normar. cor¡oiJ¿ra, Binomiar, poisson y otras, sóro es posibre a través;";;;;;i", rineares _senerariza-¡--s. asunto que será trataáo e, el capitull t.
aa
a^ OaaaaaaaOaO
Figura S.S3
pietarnente tas rendencias naturales l"d;;;il;;; ;;iiil;:]lxo¡xrrnír or Trucroxrs
\[
a
HOMOGENEIZACIóX Urru4xoo uoo¡rosrP,¡ l¡cR¡slÓx LINEAL SIMPLE
Existen varios criterios estadísticos para detectar estos puntos, como el de Cook,
presentado .n tu r...ián áS, p..o con un simple análisis del comportamiento gráfico de
la variable dependiente o delos residuos en relación a cada variable independiente se
Ñ;;;;i# el problema. En la figura 5.34, por ejemplo, un punto con oaracterísticas
como el señalado indica la presencia de un punto influyente' En este caso el punto tiene
residuo cero, como ,e puede observar en la figura 5'35 y parece estar bien ajustado' pero
desvirtua completamente el modelo. Mientras que la tendencia del mercado es la indica-
da por la recta I de la figura 5.34, elpunto influyente modifica la tendencia para la
situación de la recta 2 delamisma figura'
Figura 5.35Figura 5.34
5.7 COEFICIENTE DE CORRELACIÓN
El coeficiente de correlación es unamedida estadística importante en el análisis de un
modelo de regresión, pues informa la dependencia lineal entre las variables explicada (f)y explicativx(X,),se calcula Por:
HOMOGI
En Pereira (1970)
CoeficienlI'l : t
0 <lrl<(
Y,
0,30<lrl<00,70<lrl<00,90<lrl<0
l.l :5.8 COEFICIENTE
El cuadradodelcorindicaelpoderdeexplrradas.
R:fPorejemplo, sien
como laúnicavariableindica que el 90oA de
área.
5.9 DESVIACIóN I
La desviación estl
a¿ datos { por una,
Para el caso de ur
En el modelo 5.32a) El denominador
cada parámetro estim
b) El cuadrado demedia de los cuadradcmodelo. Entre dos m
I G, -ixv,'71'=ffi (s.2e)
Este resultado varía de-l a *1. Cuanto más próximo se encuentre el modelo de la
unidad, mayor será la dependencia lineal entre las variables involucradas y cuanto más
cercano a cero, menor será esta dependencia'
cuando r > 0 la correlación es directa, correspondiendo a una recta creciente'
cuando r = 0 la correlación es nula, correspondiendo a una recta horizontal'
cuando r < 0 la correlación es inversa, correspondiendo a una recta decreciente'
En un modelo de regresión lineal simple es deseable que el módulo del coeficiente de
conelación entre la ,uriubl. dependiente y la variable independiente sea cercano a la
unrled.
,,: J
pi-"-t A.,ii gsia:
HOMOGENEIZACIóN UTIT]ZANDO MODETOS DE REGRESIóN UNEAT SIMPTE
--
En Pereira ( 197}),existe la siguiente clasificación:
Coeficiente
lrl :o0 .l.l<0,30
0,30<lrl<0,700,70<lrl<0,900,90<lrl<0,99
l.l : I
Correlaciónnula
débitmediafuertefortísimaperfecta
5.8 COEFICIENTE DE DETERMINACIóN
Elcuadradodelcoeficientedecorrelación resultaen elcoeficiente de determinación, que'ndicaelpoderdeexplicación delmodeloen función de lasvariables independientesconside-:adas.
R = 12 (5.30)
Porejemplo, si en un modelo para la tasación de un lote de terreno se consideró el área:omo laúnicavariableparaexplicar laformación de los precios y se encontró R=0,90; esto::dica que el90oA de la variabilidad de precios observados rL d.b. a variaciones en el3rea.
5.9 DESYIACIóN ESTÁNDAR DEL MODELO
La desviación estándar de un modelo general con p parámetros estimados. aj ustadosa , datos Y,por una ecuación de mediai, está dado por la expresión:
¡- (s.3 1)
Para el caso de unarectap:2, se tiene:
s:e (s.32)
En el modelo 5.32, se puede observar lo siguiente:a) El denominadot (n-p) representa el núm-ero de grados de libertad del modelo, pues
cada parámetro estimado provoca ra pérdida de un glado ostiue;ao.
b) El cuadrado de la desviación estiándar indica la vaúanzadel sistema. Esto es, lamedia de los cuadrados de los residuos. Esta es una medida importante de diagnóstico deimodelo. Entre dos modelos satisfactorios, se debe
"r.og., uqu"l ¿. -.ri¡ varianza.,
zt,-t,)'
lxcur¡nír or Truooxts§p
HOMOGENEIZACIóN UTILIZANDO MODELgIPESEGRESIóN LTNEAL SIMPLEüry;Kporque las estimaciones son más precisas. Otra información importante es que cada
variable incluída en el modelo g"nr.u rnu."ducción en lavarianza residual' si la reducción
es significativa, hay indiciosle que la variable es importante para explicar mejor la
variabilidad de los precior, .n "u.o "ontrario,
la variable no debe ser incluída'
5.IO PRUEBA DE SIGN¡FICANCIA DE LOS PARÁMETROS
La significancia individual de un parámetro F, se mide a través de una prueba I aislada'
La hipótesis a ser Probada es:
(H":0,-o,contra.J " ','' (5.33)
la' B, *o
Probarlahipótesis5.33paraunparámetroB,'correspondeaunavariableX"essemejante a Probar:
HOMO
Lanormaparatalprueba unasignificarigurosa especial.
Para el caso de li
s(bj) = s,
Aplicación 5.2
En la tasación c
responsable por las rde 21 datos de merc
v: 900 -
donde el término erparámetro estimado
Sepideprobarlar
Solucién:
1o) Encontrar elestimado entre su de
t,: llo/81: I
2o) Encontrar enStudent para el nive
t ¡o,rrr, ,r¡ :2,09
a,
tr
importante en el modelo, contra
: la variable X,, es importante para explicar los fenómenos en estudio y debe
participar en el modelo.
Así, lo que se pretende es rechazar la hipótesis nula (I1r), ya que el tasador presume
que la variable enprueba influye en la formación de los precios'
Una vez aceptada la tendencia de normalidad de los residuos, el estadístico de la
prueba es:
. b,- 0i4
--' j - s@i)
Donde s(b) esla desviación estándar correspondiente al parámetro estimado á,'
sedemuestraquef *tienedistribuciónf destudentc onn-pgradosdelibertaddonden es
elnúmerodedatoide la muestraypes elnúmerodeparámetrosestimados'Esto es, para un
modelo de regresión simple: n - 2 grados de libertad'
Asíparaprobarlahipótesis5,33,aunniveldesignificanciarcparaunmodeloderegresión lineal simple, se compara
,, =l#l(s.3s)
con/,i-...,,-rl.Si t] essuperior 4t¡t-nn:n-2),serechazalaH,,,indicandoquelavariable
ctrrrespondiente al parám.t.o proUuábá importante para explicar el fenómeno' La prueba
es '¡llateral ¡ puede ser observada en la figura 5'36'
(s.34)
Ynrtt*t Atv¡s Dr¡us
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN UNEAL SIMPLE"rf{I;p!-
'tat_;;(n_2)
Acepta Ho <-l-+ Rechaza Ho
Figura 5.36
Lanormaparatasación deinmueblesurbanosNB-502/sg,delaABN!exigeparaesta
Prueba unasignificanciamáximadel5% en lastasacionesdeprecisión rigurosay l}Yoenlarigurosa especial.
Para el caso de la Regresión Lineal Simple, el s(bj) es calculado por la expresión:
s(á7) = 5, donde s" = (s.36)
Aplicación 5.2
En la tasación de un local comercial, se eligió la edad (X) como única variable
=sponsable por las variaciones de precio unitarios (Y), en R$/m2, con base en una muestra
:e 21 datos de mercado, obteniéndose la siguiente recta de regresión:
Y: e00 - 10 (B) . x (s.37)
¿,-rnde el ténnino entre paréntesis corresponde a la desviación estándar del respectivo;arámetro estimado.
Sepideprobarlasignificanciadelparámetrocorrespondienteala edad al nivel del5%.
1") Encontrar el I calculado por la ecuación 5.35, esto es, se divide el parámetrosrimado entre su desviación estándar, y se obtiene:
t,: ll0/Bl:1,2s
2o) Encontrar en la tabla 12 del apéndice I, el punto crítico de la distribución r de\',,dent para el nivel del 5% y 19 grados de libertad, que corresponde a:
I ¡o,orr, ,r¡ : 2,09
a, a
,
lxc¡xr¡nil or Tosocroxm§ff
- t. «l_t:;(n_2)
Rechaza Ho <-l-+
HOMOGENE¡ZACIÓX UNUZIXOO MODELOS O¡ N¡CN¡SIóX UNEAT SIMPTE
=qAM"3") Comparar ,1 calculado con t ¡o,rrr,,r¡
- como lrrl es inferior a t ¡o,rrr; te) , .se concluye que el parámetro poblacional
correspondient" a la edad no es iignifióativo al nivel del5%'
5.I I PRUEBA DE SIGNIFICANCIA DEL MODELO
La hipótesis a ser probada en este caso es la misma que para un parámetro individual'
toda vezque el modelo sólo tiene un parámetro a ser probado'
HOMOI
Se demuestra (
Considerándose un I
se encuentran los si1
. (n -l) para f (
. (n -2) para f (.
coeficientes de la re,
.Uno(l) paruZ(i
Dividiéndose ca<
encuentran las corre
-Yarianzatotal
-Yarianzano extr
-Yarianza explic
Con esto se puedtablaANOVA, comola sección 6.5.1.
Tabla 5.1 -Tabla
Observe en la figurfuese grande y la no elo, se analizalarazón
: §t = O,contra
:Bt+0(s.38)
Esto es semejante a Probar:
f .É1^ : el mercado debe ser explicado por una recta horizontal.
{ A, t "f
mercado debe ser explicado por una recta inclinada'
La visuálización gráfica de la prueba es mostrada en la figura 5.37.
A-^D : d,-Y¡ + ¡Y,-t¡ (s.3e)
bArts Drrrrs
Figura 5.37
Observe en la figrrra 5.37 lavariación total de un punto observado (I',) con relación
a la recta horizontal )/, puede ser expresada por una parte correspondiente a lqvariación
de este punto (Y,) con relación a su valor ajustado sobre la recta i¡clinadu (f,1, más la
r ariación existenie entre el punto ajustado sobre la recta inclinada (f,) y.la rectahorizon-
ul ,ñ. Así..la variación toial ({ --D .. igual a una variación explicada.Por la recta de
regresión Ú -h rnás una variación no explicada por la recta de regresión (f, - f,)' es
decir. para un punto i se tiene:
{;
:-
v
Explicada (modelo)
No explicada (error)
=b"*br'x¡
HOMOGENEIZACIóN UTILIZANDO MODELOS DE REGRESIóN LINEAL SIMPLE*XlIFf-Se demuestra (Kmenta - 197g) que J (y, _ V), : » &, _T), * [ t]- _ i- t,
Considerándose un modelo de regresión lineal simple ajustado a una rn¡est*- o. i, ¿r,ár.se encuentran los siguientes grados de libertad para cada una «le las sumatorias:
. (n -l) paru 2 ( y,- F7', pues sólo se conoce un parámetro estimado, que es l-
'-(n.J) para f (Y - i¡', pu.r invorucra las medias estimadas de b,,y b ,, queson roscoeficientes de Ia recta cle regresión definida por i,.
'uno(1) paraZ(?,-r7',correspondientealresultadodeladiferencia entre(n-t)-Qt-2).
Dividiéndose cada una de las sumatorias por sus respectivos grados de libertad, seencuentrall las correspondientes varianzas, esto es:
-Yaianzatotal
-Yarianzano explicada
-Yarianza expli,cada
n -2(f,-f,)'
- Con esto se puede hacer una tabla de análisis de varianza. también conocida como
tabla ANOVA, como se demuestra en la tabla 5.1 . Un caso más general se presentará enh sección 6.5.1.
Tabla 5. I - Tabla de Análisis de yarianza
- Observe en la figura 5'3 7, que la situación ideal sería aqLrella doncle Ia varianza expiicadatuese grande y la no explicada pequeña. Así, para probaria significancia global deimode-io, se analiza laraz6n entre las cros varianzas por er estadístico:
, =»lt -rl=,fu-z)' Ilr,-tf I
Sumatoria de los cuadrados Grados de
libertad
Explicada (modelo)
\o explicada (error)
scR - »t,-tlscE: f¡1',,-i'¡
t/ exp: »t,-tfttvn exp : ¡¡r,-?¡l¡n-21
l¡tot - fA'-i)rt(n-¡)
(s.40)
lxcrxr¡rír or Trmcroxrs §p
Zs,-1¡'n -1
HOMOGENEIZACIóN UTILIZANDO MODELOS DEXEGRESIóN LINEAL SIMPLE
Este estadístico presentará un resultado un tanto mayor cuanto mayor sea la probabilidad
Ce que el modelo üa aceptado para explicar el fenómeno en estudio'
Se demuestra que,F., bajo taliipótesis ar), tiene distribución de Snedecor con I grado de
libertadenelnumeradoiy ¡i-Z¡enÁaenomiiador.EstadistribuciónfuetabuladaporFisher'LospuntoscríticosparaunniveldesignificanciaocessimbolizadoPll!r*,i;i 1,,:Ei-t1:prnto, están en las tablas 13 y 14 del apéndice I paralos níveles del 5oA y 1%o, donde el'ni,*".o de grados de libertaá del numerador sé indica en la columna y 9l número.de
_*uáo. ¿. l¡ü-erta¿ del denominador se indica en la línea, donde se localiza el punto crítico
correspondiente.- - Áripuru rechazar la hipótesis nula de no haber regresión al nivel oc, es necesario que
,F sea superior aF,*. t,,-:,; en caso contrario, hay indicios de que la recta inclinada no
.-pii., ,l.lor el feiómánó qu" la recta horizontal. debiendo ser ésta última la escogida.
La prueba es unil ral y puede ser observada a través de la figura 5'38'
de Ho rechazo de Ho
Figura 5.38
La norma para tasación de inmuebles urbanos N F-502Á9 , de la ABNT, exige que sea
p.ouuou tu hipótesis de análisis devarianzaaun nivel de significanciamáxima del 5% en
ias tasacionei de precisión rigurosa y del1oA en la rigurosa especial.
Aplicoción 5.3
Considerando los datos de la aplicación 5.2,y sabiendo que la varianzaexplicadapor
el modelo es 16 y la no explicada és igual a 40, sé pide probar la significancia del modelo
al nivel del l%.
Solución:
1") Calcular el F. por la ecuación (5.40), ó
»¡r, - 7¡2Fr= _-_ ^j. x»(Yi - Yi)'
Sustitul endo los resultados, se tiene:
16 (21-2) -/f.=zo^_=/.o
(n-2)I
Yn.,r.t Aiv¡s Dr¡rs
HOMOG
2"pncontrar el pur
un grado de libertad ren la primera columr
3o) Comparar I' r
concluye que el modt
5.I2 INTERVALO I
El intervalo de cotrecta de regresión, es
t:f tt..t t_ú¿: (n_ !
donde s(t) es la de
modelo de regresión I
I:Yo ltr_n,r..rr-,
La norma para la tintervalo de confianziintervalo se consider¿
Como se puede obcuando el bien tasabl,los datos muestrales,campo muestral. En emás cercanas a las caren las extremas.
La variación del il5.39.
HOMOGENEIZACIóN UTII.IZANDO M=_q.HwEcREstóN UNEAr stMprE
2")Encontrarel punto crítico de Iadistribución de snedecor; en latabla14, apéndicel,conun grado de libertad en er numerad ory rgjaaos en er aeromi;;;r, esto es, se encuentraen la primera corumna v err ra t9^ tíieaal at iü, "JJü';;;, , , ,r,= 8, r 9.
*i,1f""fi:'Jll,*J,x',ígí;í*+,.,'Í,T:,*;:,i:res,inrerior a F¡00,,,:,e,=B,re se
5.t2 |NTERVATo DE CONFTANZA PARA tEl intervalo de confianza a.un niver de (r - cc), en torno de un punto 1xo ;\), sobre rarccta de regresión, es calculado por
I:Y f t .t) t-q: ¡,,- rr. -(YO)
donde s¡Yn¡ es la desviación esfándar carcurada en torno ar punto(x.; %). para unmodelo de regresión rinear sirnpre, se tiene ra siguiente expresióí:
I (Xo - X)2-+ '--- --z dondes :n »(Xi - X)2 e
I=Y *t oo t-q,2:(n-2) "c
(s.41)
(s.42)
La norma pararatasación de inmuebres urbanos NB-502/g9, de raABN! admite unintervalo de confianza máxima del80%o,o una significancia *rrima del2Ú%.para esteintervalo se considera q :20yo.como se puede observar en la expresión 5.42,lamenor amplitud del intervalo ocurrecuando el bien tasable posee características iguales u ru *.áiu ¿" las características delos datos muestrales, esto es, x =X Las rnuyo.., amplitudes ocurren en la frontera delcampo muestral' En este caso, lás estimaciones más piecisas ocurren para las tasaciones
}"t"::ffiaras caracterísricas medias de ros datos a" ,"r"r.n"iu y ru, más imprecisas,
,.rrtu uur'urión der intervaro de confianza en torno de ! puede ser vista en ra figura
?=bo+b,.x,
Figura 5.39
lxc¡xr¡¡ir o¡ Tnucrox¡stff
j
HOMOGENETZACTóN UTTUZANDO MODELOS qEBEGRESIóN tlNEAt SIMPLE_.qI;ImLa estimación de un intervalo de confianza en torno de un punto cercano a la frontera
de la muestra o cuando se trata de una muestra extraída de una población con caracterís-
tica platicúrtic4 la amplitud del intérvalo puede ser bastante amplio, es decir, una estimación
basiante imprecisa parala media. En estos casos, es preferible reducir la confranzay
obtener un intervalo de variación más estrecho. En una situación opuesta, en que lamuestra
es extraída de una población con características leptocúrticas, la confianza podría ser
ampliada. Esto seríá bien informativo para el que toma decisiones, pues es preferible una
estimación con 99%o de certezaque otra con apenas 800/o, por ejemplo. Pero el tasador no
le está permitido de presentar uná confianza mayor en su trabaj o, por cuestiones normativas.
Seríamás coherente establecer intervalos aceptables de variación en torno de la media, a
furtl. O. allí, calcular la probabilidad del verdadero valor de mercado contenido en ellos'
Aplicoción 5.4
Considerando los datos de la aplicación 5.Z,estimar el valor medio de mercado y el
intervalo de confianz a al 80%o para un local comercial con diez años de edad, sabiendo
que la desviación estándar en torno a ese punto es igual a 100'
Solucién:
l") Estimar.'l\alor medio de mercado sustituyendo xo= l0 en el modelo
Y: 900 - 10. x
que coresponde a vn Yo: R$ 800,00/m2
2') Estimar el intervalo de confianza por la ecuación 5.41, es decir,
/: t" +tro,,r.s(to)
Entrando en la tabla 12, delapéndice I, se encuentra t oo. ,, : 1,33. Sustituyendo los
resultados, se tiene
I : 800 + 1,33 . 100 ó I : 800 + 133
Asl se encuentra un límite inferior de R$ 667,001m2 y un límite superior de RS 933,00/
rf. E*o es, hay una probabilidad del 80% de que el valor de mercado esté entre esos
límites del intérvalo de confianza.
5.I3 EJERC¡CIOS PROPUESTOS
5.t3.I Se propone un ejercicio bastante sencillo, que debe ser resuelto sin necesidad de
rilizar ningun sistema de tratamiento de datos. Su resolución es fundamental para ente*'
& et desarrollo de los demás asuntos abordados en los capítulos siguientes'
Para la r
distancias a
Con base en los
I - Verificargráfictro urbano. Inecuación.
2 - Estimar los p,
cuadrados".3 - La ecuación dr4 - Los coeficiente5 - Calcular la des6 - Construir la tal7 - Probar la signi.8 - Probar la signif
del5%o e inter¡9 - Encontrar un il
l0 - Analizar el gráI I - Probar la hipót12 - Probar la norm13 - Estimarel'oval<
urbano.14 - Estimar el inter
estimado e inte
5.I3.2 Para Ia tasatomándose como valy como variable indpresentó los siguient
a) b,,:7yb,estimador del paránestándar correspond
b) Coeficientec) F":25d) Desviación r
HOMC
tasaciórrl centro
lLL
§t*c tuws D¡rrrs
uT[]zANPg_MqDELOS DE
X;;?:Para la tasación de un lote de terreno, se recolectaron cinco datos relativos a lasdistancias al centro urbano y Ios respectivos precios r.lnitarios. ,"gú, .l cuadro siguiente:
HOMOGENEIZACIÓN
dato distancia(km)
preciounitario(RS/m'?)
I 0 J2 I
J
4 2 I
5
Con base en los datos recolectados, se pide:
I - verificargráfrcamente el compoftamiento del precio unitario con la disrancia al cen-tro urbano. Interpretar Ia figura, trazar una recta de re.sresión . encontrar-suecuación. '2 - Estimar los parámetros del modelo de regresión por el "método de los mínimos
cuadrados".3 - La ecuación del modero co, su respectiva interpretació,.I - Los coeficientes.de."correlación"y:'determinacibn", con las debida.-. inrerpreraciones.5 - Calcular la desviación estándar dól modelo.6 - Construir la tabla de ANOVA.7 - Probar la significancia del modelo al nivel del 5%e interpretar el resuirado.8 -
!r9b-a-r la significancia del parámetro correspondiente a la variable disrancra. al niveldel 5oA e interpretar el resultado.
9 - Encontrar un intervalo de confia nza del g0% en torno de b10 - Analizar el gráfico de los residuos estandarirrdos u..ru, .,lálor., ajustados.l1 - Probar la hipótesis de no auto-regresión al nivel de 5oA.l2 - Probar Ia nonnalidad de Ios residuos.l3 - Estimarel"valorunitario" rnediopara un lotedeterrenoque está a 1.5 km delcentro
urDarlo.l4 - Estimar el intervalo de confianza al nivel del 80% en torno del r alor unitario medio
estimado e interpretar el resultado.
5'13'2 Para la tasación de un apartamento se recolectaron 19 datos de referencia,tomándose como variable,deperrdiente el precio unitario en RS/á, de area priv;il(Apjy comovariable independiente ra edad (E). Er modero escogiáo fue
"r "*pfr"n.;i;;¿presentó los siguientes resultados:
^*?)^^!: j^,7 !^!l -- -0,02 (0,005), que representan: los términos independiente y elestlmaoor del parámetro correspondiente a la covariable edad, estando la desviaóión
estándarcorrespondiente dentro de los paréntesis;b) Coeficiente de correlación entrb Ap y E igual a _ 0,95.c) F":25d) Desviación estándar del modelo igual a 0,30.
lxc¡xr¡rh or Txrcroxrs -§[p
2
I
I 3
nOUOG¡X¡lZlClóx UTIUZIXDO MODELOS O¡. nrCntstóX tINEAL SIMPLE..ryHe) Estadístico de Durbin-Watson d:1,90
f) Residuos estandarizados en los siguientes intervalos:
entre [ 1,65 ;+ 1,65] y 98Yo entte | -1,9 6; + 1,961'
g) Gráfico de los Resíduos vs Valores Ajustados:
Con base en los datos indicados se pide:
a) La ecuación del modelo exponencial con la debida interpretación'
b) [nterpretar el coeficiente de correlación'
.i El poder de explicación del modelo con la debida interpretación.
di Prábar la significancia del parámetro correspondiente a la edad al nivel del5%o;
"i Probarlasignificanciadelmodeloalnivel dell%'
0 Probar la no auto-regresión al nivel del2,5Yu
g) Analizar. lo\residuos y su normalidad'
ñ) Analizar el gráfico de los residuos en función de la homocedasticidad'
i Estimar el válor medio de mercado, la moda y la medianapara un apartamento
con l0 años de edad.
) Estimar la tasa mínima y máxima de depreciación anual.de-los apartamentos en la
,"gión abarcada en la investigación, considerándose un intervalo de confianza de 90% en
torno de la tasa media inferida.k)Atenderel tratamiento dispensado alos datos según losniveles de rigorde laNB-502/
89.
LAHOMOGENE¡z
6.I INTRODUCC¡
El modelo de regruna variable indepenrmercado.
En la Ingeniería c
múltiple, teniendo en r
un bien.Como fue expuestr
regresión lineal simplobservados, colocadordependiente y otro pardos variables indepenejes cartesianos: uno pSuponga, por ejemplode los precios unitaricdistancias a un polo valse encuentra un gráfic
Figura 6.1
Observe que los pu:egresión lineal será re:omo lo muestra la figu:a para los precios de l.
.rpo:
P:bo+b,.
70oA entre | -1;+11;90%
Vi.:¡.r L,:: Drr's
-v