87
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA CIVIL PREDICCIÓN DE LAS VARIACIONES DE COSTOS PARA PROYECTOS DE CONSTRUCCIÓN UTILIZANDO REDES NEURONALES MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL MATÍAS EDUARDO JORY RUBILAR PROFESOR GUÍA: WILLIAM WRAGG LARCO MIEMBROS DE LA COMISIÓN: CARLOS AGUILERA GUTIÉRREZ RAÚL GOUET BAÑARES SANTIAGO DE CHILE NOVIEMBRE 2007

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS ......debe mejorar a pasos agigantados la gestión de las empresas constructoras. En este trabajo de título se ocupa como herramienta para

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA CIVIL

    PREDICCIÓN DE LAS VARIACIONES DE COSTOS PARA PROYECTOS

    DE CONSTRUCCIÓN UTILIZANDO REDES NEURONALES

    MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL

    MATÍAS EDUARDO JORY RUBILAR

    PROFESOR GUÍA: WILLIAM WRAGG LARCO

    MIEMBROS DE LA COMISIÓN:

    CARLOS AGUILERA GUTIÉRREZ RAÚL GOUET BAÑARES

    SANTIAGO DE CHILE NOVIEMBRE 2007

  • ii

    RESUMEN DE LA MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL POR: MATÍAS JORY R. FECHA: 23/10/2007 PROF. GUIA: Sr. WILLIAM WRAGG L.

    “PREDICCIÓN DE LAS VARIACIONES DE COSTOS PARA PROYECTOS DE CONSTRUCCIÓN UTILIZANDO REDES

    NEURONALES” El objetivo general de este trabajo de título es estudiar el uso de redes neuronales artificiales en la industria de la construcción. Más específicamente, se desarrolló un modelo cuyo propósito es estimar las variaciones de costos en una construcción habitacional en altura. Con el fin de tener un punto de comparación se realizaron los mismos modelos en regresión lineal múltiple. Adicionalmente se generaron dos modelos más, uno para predecir el costo presupuestado de un edificio en una etapa de evaluación de proyectos y otro para predecir las variaciones de plazo de un proyecto. Para conseguir la base de datos se realizó una encuesta distribuida entre más de 20 profesionales de obra de distintas empresas. Mediante herramientas estadísticas se eligieron las mejores variables para los distintos modelos. Una vez realizado cada modelo se estudió la incidencia de cada variable en el problema y se ejecutó una validación cruzada para determinar el real nivel de representatividad de los mejores modelos. Los resultados arrojan dos modelos coherentes para la predicción de variaciones de costos no así para las variaciones de plazo, problema que al parecer no puede ser modelado por las variables que posee la encuesta. Ambos modelos no son excluyentes por lo que se pueden utilizar de manera simultánea. Se concluye que es factible realizar una predicción de las variaciones de costos ya que para el caso de construcciones habitacionales en altura, la industria muestra una estandarización de sus procesos constructivos bastante avanzada. También se concluye que la inclusión de nuevas tecnologías de gestión que ayudan a la toma de decisiones es un paso serio en el mercado competitivo de hoy en día. Al final se recomiendan algunas consideraciones para estudios posteriores.

  • iii

    INDICE DE TEMAS:

    1. INTRODUCCIÓN............................................................................................................1

    2. MARCO TEÓRICO.........................................................................................................3

    2.1. BREVE DESCRIPCIÓN DE LA INDUSTRIA DE LA CONSTRUCCIÓN EN CHILE Y MOTIVACIÓN PARA ESTE ESTUDIO. ........................................................................................................................... 3

    2.1.1. Problemas con el cumplimiento de la planificación de una obra................................. 4 2.2. SOLUCIÓN PROPUESTA: ANÁLISIS DE DATOS Y UTILIZACIÓN DE TÉCNICAS MODERNAS DE GESTIÓN. ............................................................................................................................................. 6

    2.2.1. Análisis de datos usando Estadística. ........................................................................... 7 2.2.2. Redes Neuronales Artificiales como herramienta de gestión. ...................................... 8

    2.3. REDES NEURONALES ARTIFICIALES. ...................................................................................... 9 2.3.1. Introducción. ................................................................................................................. 9 2.3.2. Características de las Redes Neuronales Artificiales R.N.A....................................... 11 2.3.3. Elementos Básicos....................................................................................................... 11

    2.3.3.1 Neuronas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.3.3.2 Función de Entrada. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3.3.3 Función de Activación o de Transferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.3.4. Arquitectura de una Red Neuronal. ............................................................................ 15 2.3.5. Operación de las R.N.A: Aprendizaje y Generalización............................................. 16

    2.3.5.1 Fase de Aprendizaje. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.5.2 Fase de Generalización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.3.6. Regla LMS para aprendizaje supervisado. ................................................................. 17 2.3.7. Aprendizaje por retropropagación de errores (Backpropagation)............................. 19 2.3.8. Ventajas de las R.N.A.................................................................................................. 20

    3. METODOLOGÍA...........................................................................................................21

    3.1. MODELOS A REALIZAR.......................................................................................................... 21 3.1.1. Modelos para estimar el costo presupuestado de un proyecto de construcción......... 22 3.1.2. Modelos para estimar la variación de costo y plazo. ................................................. 22

    3.2. INFORMACIÓN SOBRE PROYECTOS DE CONSTRUCCIÓN......................................................... 23 3.2.1. Encuesta. ..................................................................................................................... 24

    3.2.1.1 Antecedentes Generales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.2.1.2 Calidad y Experiencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.2.1.3 Información Desarrollo Proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.2.1.4 Programación y Control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.2.1.5 Datos Finales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    3.3. RECOLECCIÓN Y ANÁLISIS DE DATOS. .................................................................................. 29 3.4. MODELO QUE ESTIMA EN ORDEN DE MAGNITUD EL PRESUPUESTO DE UN PROYECTO DE CONSTRUCCIÓN. ................................................................................................................................ 31

    3.4.1. Modelo de Regresión Lineal Múltiple......................................................................... 31 3.4.2. Modelo basado en R.N.A............................................................................................. 36

  • iv

    3.5. MODELO QUE ESTIMA LA VARIACIÓN DE COSTOS DE UN PROYECTO DE CONSTRUCCIÓN..... 40 3.5.1. Modelo de Regresión Lineal Múltiple......................................................................... 40 3.5.2. Modelo de R.N.A. ........................................................................................................ 44

    3.6. MODELO QUE ESTIMA EL PLAZO REAL DE UN PROYECTO DE CONSTRUCCIÓN...................... 46 3.6.1. Modelo de Regresión Lineal Múltiple......................................................................... 46 3.6.2. Modelo de R.N.A. ........................................................................................................ 47

    4. ANÁLISIS DE RESULTADOS.....................................................................................48

    4.1. COMPARACIÓN DE RESULTADOS........................................................................................... 48 4.1.1. Modelos que estiman un orden de magnitud del presupuesto..................................... 48 4.1.2. Modelo que estima la variación de costos. ................................................................. 52 4.1.3. Modelo que estima el plazo real de construcción ....................................................... 56

    4.2. VALIDACIÓN CRUZADA DEL MODELO DE VARIACIÓN DE COSTOS ........................................ 58 4.2.1. Resultado validación cruzada ..................................................................................... 58 4.2.2. Determinación del mejor modelo................................................................................ 59

    4.3. COMENTARIOS DEL CAPÍTULO .............................................................................................. 64

    5. COMENTARIOS Y CONCLUSIONES.......................................................................68

    6. ANEXO A........................................................................................................................70

    7. ANEXO B........................................................................................................................78

    7.1. DEFINICIONES ....................................................................................................................... 78 7.2. SELECCIÓN DE VARIABLES.................................................................................................... 78

    8. BIBLIOGRAFÍA ............................................................................................................80

  • v

    INDICE DE TABLAS TABLA 2.1 VALORES ESTIMADOS DE LA EXACTITUD ESPERADA DE LOS TIPOS DE

    ESTIMACIONES......................................................................................................... 4 TABLA 3.1ANTECEDENTES GENERALES ....................................................................... 26 TABLA 3.2 CALIDAD Y EXPERIENCIA ........................................................................... 27 TABLA 3.3 INFORMACIÓN DESARROLLO PROYECTO ................................................... 28 TABLA 3.4 PROGRAMACIÓN Y CONTROL ..................................................................... 29 TABLA 3.5 DATOS FINALES ........................................................................................... 29 TABLA 3.6 VALORES DESCRIPTIVOS DE LAS VARIABLES CUANTITATIVAS MÁS

    IMPORTANTES PARA TODOS LOS PROYECTOS. .................................................... 30 TABLA 3.7 VALORES DESCRIPTIVOS DE LAS VARIABLES CUALITATIVAS MÁS

    IMPORTANTES PARA TODOS LOS PROYECTOS. .................................................... 30 TABLA 3.8 VALORES DESCRIPTIVOS DE LA VARIACIÓN DE COSTOS Y PLAZOS ........ 30 TABLA 3.9 ALTERNATIVAS A REALIZAR CON R.L.M Y R.N.A. ..................................... 34 TABLA 3.10 ALTERNATIVAS A REALIZAR CON R.L.M Y R.N.A. ................................... 41 TABLA 3.11 CONFIGURACIONES DE LAS DISTINTAS ALTERNATIVAS REALIZADAS .. 44 TABLA 3.12 CONFIGURACIONES PARA LA ALTERNATIVA ELEGIDA........................... 47 TABLA 4.1 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES............... 48 TABLA 4.2 RESULTADOS ALTERNATIVA 1 ................................................................... 48 TABLA 4.3 RESULTADOS ALTERNATIVA 2 ................................................................... 49 TABLA 4.4 RESULTADOS ALTERNATIVA 3 ................................................................... 50 TABLA 4.5 RESULTADOS ALTERNATIVA 4 ................................................................... 50 TABLA 4.6 RESULTADOS ALTERNATIVA 5 ................................................................... 51 TABLA 4.7 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES............... 53 TABLA 4.8 RESULTADOS ALTERNATIVA 1 VARIACIÓN DE COSTOS ........................... 53 TABLA 4.9 RESULTADOS ALTERNATIVA 2 VARIACIÓN DE COSTOS ........................... 54 TABLA 4.10 RESULTADOS ALTERNATIVA 3 VARIACIÓN DE COSTOS.......................... 55 TABLA 4.11 RESULTADOS ALTERNATIVA 4 VARIACIÓN DE COSTOS.......................... 55 TABLA 4.12 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES ............. 57 TABLA 4.13 RESULTADOS VARIACIÓN DE PLAZO........................................................ 57 TABLA 4.14 ECM PARA VALIDACIONES DE LA ALTERNATIVA 2 ................................. 59 TABLA 4.15 ECM PARA VALIDACIONES DE LA ALTERNATIVA 3 ................................. 59 TABLA 4.16 PROYECTOS USADOS PARA VALIDACIÓN DE MODELOS.......................... 59 TABLA 4.17 ESTIMACIONES PROYECTO 1 PARA TÉCNICA DE RLM ............................. 60 TABLA 4.18 ESTIMACIONES PROYECTO 1 PARA TÉCNICA DE RNA ............................. 61 TABLA 4.19 ESTIMACIONES PROYECTO 2 PARA TÉCNICA DE RLM ............................. 62 TABLA 4.20 ESTIMACIONES PROYECTO 2 PARA TÉCNICA DE RNA ............................. 63 TABLA 4.21 PROMEDIO DE ESTIMACIONES PARA EL PROYECTO 1 ............................. 66 TABLA 4.22 PROMEDIO DE ESTIMACIONES PARA EL PROYECTO 2 ............................. 66 TABLA 4.23 ECM DE LAS ESTIMACIONES OBTENIDAS EN LA VALIDACIÓN, MODELO 1

    ................................................................................................................................ 66 TABLA 4.24 ECM PARA EL MODELO 2 ........................................................................... 67 TABLA 4.25 COMPARACIÓN DE ECM POR TÉCNICAS Y MODELOS .............................. 67 TABLA 6.1 PROYECTOS USADOS PARA GENERAR LOS DISTINTOS MODELOS ............ 70

  • vi

    INDICE DE FIGURAS FIGURA 2.1 PROCESADOR ELEMENTAL O NEURONA ................................................... 12 FIGURA 2.2 FUNCIÓN LOGÍSTICA.................................................................................. 13 FIGURA 2.3 FUNCIÓN LINEAL ....................................................................................... 13 FIGURA 2.4 FUNCIÓN TANGENTE HIPERBÓLICA .......................................................... 14 FIGURA 2.5 FUNCIÓN GAUSSIANA ................................................................................ 14 FIGURA 2.6 FUNCIÓN COMPLEMENTO DE GAUSSIANA................................................ 15 FIGURA 2.7 ARQUITECTURA DE UNA RED NEURONAL ARTIFICIAL ............................ 15 FIGURA 2.8 SUPERFICIE DE ECM................................................................................... 18 FIGURA 2.9 MÉTODO DEL DESCENSO POR GRADIENTE PARA UNA RED DE UNA

    NEURONA ............................................................................................................... 19 FIGURA 2.10 MÉTODO DEL DESCENSO POR GRADIENTE PARA UNA RED MULTICAPA

    ................................................................................................................................ 19 FIGURA 3.1 BASE DE DATOS EN SPSS ........................................................................... 31 FIGURA 3.2 PASOS PARA LA REGRESIÓN MÚLTIPLE ................................................... 32 FIGURA 3.3 ELECCIÓN DE LAS VARIABLES INDEPENDIENTES Y DEPENDIENTE ........ 32 FIGURA 3.4 OUTPUT CON LOS RESULTADOS................................................................ 33 FIGURA 3.5 PROCESO DE ETIQUETADO DE DATOS ...................................................... 36 FIGURA 3.6 ELECCIÓN DE TIPO DE RED ....................................................................... 37 FIGURA 3.7 DETERMINACIÓN DE NEURONAS CAPA OCULTA...................................... 38 FIGURA 3.8 DETERMINACIÓN DEL NÚMERO DE EPOCHS, AL MOMENTO DE

    ENTRENAR UNA RED.............................................................................................. 38 FIGURA 3.9 ENTRENAMIENTO DE LA RED .................................................................... 39 FIGURA 3.10 TESTEO DE LA RED................................................................................... 39 FIGURA 3.11 ECM VS. EPOCHS PARA 3 Y 4 NEURONAS EN LA CAPA OCULTA ............ 45 FIGURA 3.12 ECM VS. EPOCHS PARA 5, 6 Y 7 NEURONAS EN LA CAPA OCULTA ........ 45 FIGURA 3.13 ECM VS. EPOCHS PARA 8, 9 Y 10 NEURONAS EN LA CAPA OCULTA ...... 46 FIGURA 4.1 RESULTADOS ALTERNATIVA 1 .................................................................. 49 FIGURA 4.2 RESULTADOS ALTERNATIVA 2 .................................................................. 49 FIGURA 4.3 RESULTADOS ALTERNATIVA 3 .................................................................. 50 FIGURA 4.4 RESULTADOS ALTERNATIVA 4 .................................................................. 51 FIGURA 4.5 RESULTADOS ALTERNATIVA 5 .................................................................. 51 FIGURA 4.6 RESULTADOS ALTERNATIVA 1 VARIACIÓN DE COSTOS .......................... 54 FIGURA 4.7 RESULTADOS ALTERNATIVA 2 VARIACIÓN DE COSTOS .......................... 54 FIGURA 4.8 RESULTADOS ALTERNATIVA 3 VARIACIÓN DE COSTOS .......................... 55 FIGURA 4.9 RESULTADOS ALTERNATIVA 4 VARIACIÓN DE COSTOS .......................... 56 FIGURA 4.10 RESULTADOS VARIACIÓN DE PLAZO ...................................................... 57 FIGURA 4.11 ESTIMACIONES RLM PROYECTO 1 ........................................................... 60 FIGURA 4.12 ESTIMACIONES RNA PROYECTO 1 ........................................................... 61 FIGURA 4.13 ESTIMACIONES RLM PROYECTO 2 ........................................................... 62 FIGURA 4.14 ESTIMACIONES RNA PROYECTO 2 ........................................................... 63

  • 1

    1. INTRODUCCIÓN.

    Con el fin de que la construcción siga siendo un factor importante de la economía

    chilena se necesita una industria moderna y acorde con la era de la globalización, para esto se debe mejorar a pasos agigantados la gestión de las empresas constructoras. En este trabajo de título se ocupa como herramienta para una buena gestión, un sistema de Redes Neuronales Artificiales (R.N.A.). Estas se han aplicado en áreas tan dispares como procesamiento de señales, reconocimiento de patrones complejos, tareas de clasificación, procesamiento de imágenes y en ciertas áreas de la hidrología, finanzas y construcción. En teoría los modelos de R.N.A. pueden lograr predicciones confiables en la industria de la construcción, gracias a que su mayor ventaja es que pueden determinar patrones en problemas que presentan relaciones complejas y no lineales, tal como son los problemas de la industria.

    En Latinoamérica existen pocos casos en que se haya utilizado sistemas de R.N.A para

    resolver problemas de gestión en el rubro de la construcción. Sin embargo en países asiáticos y en Estados Unidos el uso de esta tecnología está empezando a cobrar cada vez más auge. Es así como en los journals de la American Society of Civil Engineers (A.S.C.E)1 se puede encontrar una gran variedad de investigaciones que utilizan esta tecnología para problemas típicos de gestión de la construcción. Por ejemplo, se pueden encontrar papers que tratan de crear sistemas de predicción del performance para proyectos de ingeniería [Georgy, 2005], otros en que se trata de predecir la variación de costos para proyectos de reconstrucción [Attalla y Hegazy, 2003], para medir la productividad de partidas de hormigón [Ezeldyn, 2006], o para modelar el markup de un contratista [Liu, 2005].

    El principal objetivo de este trabajo de título es analizar la factibilidad de desarrollar

    un modelo de redes neuronales capaz de predecir variaciones de costos y de plazos para proyectos de construcción. La idea es estudiar la posibilidad de que un modelo sirva como herramienta eficaz al momento de decidir ciertas variables en el inicio del estudio de un nuevo proyecto. Con esta ayuda el usuario podría tomar decisiones, las que pueden influir de manera positiva en la productividad de una obra.

    Otro objetivo importante es la inserción de nuevas tecnologías, en este caso sistemas

    de redes neuronales artificiales y algunos métodos estadísticos, en la industria de la construcción chilena, de manera de analizar su real utilidad y viabilidad, tarea por lo demás compleja si se considera que la construcción en Chile tiende a tener más de intuición y experiencia que uso de nuevas tecnologías y herramientas.

    La metodología de este estudio cuenta con los siguientes pasos:

    1. Estudiar experiencias pasadas en el uso de redes neuronales y de estadística para determinar variaciones de costos y plazos.

    1 http://www.pubs.asce.org/journals/jrns.html

  • 2

    2. Identificar y analizar factores que pueden influir en los problemas de costo y plazo que se pueden generar en un proyecto de construcción utilizando una base bibliográfica y la experiencia de profesionales de la industria de la construcción.

    3. Con los factores determinados en el punto anterior se diseña una encuesta con el fin de

    generar una base de datos con la cual trabajar.

    4. Determinar una metodología eficiente para la estimación de variaciones de plazo y costos que incluya el uso de métodos estadísticos y de redes neuronales artificiales.

    5. Implementación de la metodología creando un prototipo con herramientas

    computacionales.

    6. Testeo del sistema usando proyectos distintos a los de la fase de diseño. En el capítulo 2 se explica el problema a estudiar y se muestra una pequeña reseña sobre la tecnología de las redes neuronales artificiales y su funcionamiento. El capítulo 3 presenta la metodología usada para crear la base de datos y la elaboración de los distintos modelos. En el capítulo 4 se presentan y analizan los resultados de cada modelo y se efectúa una validación de los métodos que presentan los mejores resultados. Se termina este trabajo con el capítulo 5, en donde se encuentran los comentarios y conclusiones.

  • 3

    2. MARCO TEÓRICO.

    2.1. Breve descripción de la industria de la construcción en Chile y motivación para este estudio.

    Según un articulo de la revista BIT [Casares, 2007] la productividad de la industria de

    la construcción en Chile aumentó en un 40.9% entre los años 1986-1996, periodo que se conoce como el boom de la construcción. Para el entonces presidente de la Cámara Chilena de la Construcción, Fernando Echeverría, este alto valor se debió a tres factores importantes.

    El primero es la introducción de una buena cantidad de innovaciones en el sector, por

    ejemplo: moldajes industriales, la masificación del hormigón premezclado, preparación industrial del acero, etc. Estas nuevas tecnologías trajeron una disminución de costos y plazos y masificaron nuevas formas de trabajo.

    La segunda variable importante fue el sistema de gestión de las empresas constructoras: estas pasaron de hacer prácticamente todo en una obra a transformarse en administradores de ella, que contratan y coordinan subcontratistas especializados. Esto lleva a que los subcontratos realicen la mayoría del trabajo y así las empresas constructoras mantienen poco personal propio.

    El último factor clave es la notable especialización que han realizado las empresas

    subcontratistas, las cuales se han vuelto mucho más eficientes haciendo subir los estándares para toda la industria.

    A pesar de estos buenos resultados, la industria de la construcción tiene un atraso considerable si se compara su gestión con las empresas de servicios. Una de las razones para este atraso es que la mano de obra en esta industria sigue siendo barata en comparación con las otras actividades económicas. Esto quiere decir que los márgenes de ganancia siguen siendo relativamente buenos, por lo que las empresas no ponen todo su esfuerzo en mejorar la gestión de sus proyectos.

    Se da en esta industria que las empresas "gestionan" al momento de optar por sus subcontratos, esto es, que la mayoría de las veces optan por el subcontratista más barato, presionando a las empresas a bajar sus precios de manera considerable, lo que genera el incentivo de que las empresas subcontratistas muchas veces cobren precios que una vez adjudicado un proyecto no tienen la capacidad de cumplir. Como resultado se tiene grandes problemas a la a hora de hacer cumplir los contratos y una asfixia permanente sobre las pequeñas empresas las cuales subsisten sin la suficiencia económica para capacitar a sus trabajadores y menos para obtener nuevas tecnologías, ambas condiciones necesarias para mejorar su gestión.

  • 4

    Otro punto de preocupación que empieza a tomar fuerza en esta industria es el aumento en los estándares mínimos. Por ejemplo, las empresas tendrán que enfrentar las nuevas normas de confort habitacional, las nuevas políticas de vivienda pública y a un comprador más exigente que el que había en el pasado, el cual, al momento de comprar una vivienda, tiene requerimientos que no todas las empresas pueden cumplir. Lo mencionado anteriormente obliga a las empresas constructoras a mejorar su gestión y políticas de futuro para mantenerse competitivas dentro del mercado. Con este fin se pueden abordar distintas soluciones en todas las etapas de un proyecto, siendo vital la etapa de planificación, ya que es ahí donde se estiman ciertos alcances del proyecto, que a la postre pueden ser significativos en su rendimiento.

    2.1.1. Problemas con el cumplimiento de la planificación de una obra.

    La planificación de un proyecto es la etapa en donde se estiman los costos

    (presupuestos) y duraciones (programación) de las distintas partidas de un proyecto de construcción. Los factores que tienen un impacto significativo en la elaboración de la planificación son los siguientes: 1. Calidad y cantidad de información disponible a la hora de hacer un presupuesto y

    programación. 2. Tiempo destinado para preparar los presupuestos y programación 3. Competencia del proyectista o del profesional encargado de la planificación. 4. Herramientas y técnicas que se usan para las estimaciones.

    Estas estimaciones tienen distintos grados de exactitud, dependiendo de la etapa de estudio del proyecto. La siguiente tabla muestra los valores estimados de la exactitud esperada para los distintos tipos de estimación usadas a lo largo de la planificación de un proyecto.

    Tabla 2.1 Valores estimados de la exactitud esperada de los tipos de

    estimaciones.

    Descripción Tipo Ingeniería

    Desarrollada [%]

    Contingencias Probables [%]

    Exactitud de la Estimación [%]

    Definitiva 4 40 8 +/- 5 -10 Preliminar 3 12 12 +/- 10 - 20 Conceptual 2 5 15 +/- 15 - 30

    Orden de Magnitud 1 2 20 +/- 30 - 50 o más

    Con el fin de obtener un aceptable porcentaje de exactitud en la planificación, es

    importante que ésta se realice de la manera más prolija posible. Esto significa tomar en cuenta una serie de parámetros que generalmente se omiten o no se consideran importantes a la hora de confeccionar un presupuesto o programación, pero que si pueden llegar a influir. A continuación se enumeran algunos;

  • 5

    • Informes geológicos detallados sobre los tipos de terreno encontrados en el sitio. • Informes hidrográficos. • Estudios de impacto ambiental. • Reglamentos y bases del contrato. • Planificación de la obra. • Antecedentes de la zona y costos de referencia en ella. • Conocer el mercado de trabajadores especializados y de personal general en la zona de

    construcción. • Fuentes de abastecimiento de materiales y equipos. • Habitaciones. • Acceso a la obra.

    A los parámetros anteriores se deben sumar los considerados para todo proyecto, como

    sueldos, rendimientos de trabajadores y equipos, costos de operación de equipos, costo de los materiales, etc. Pero para que toda la información anteriormente citada sirva para generar un presupuesto completo y de buena calidad, la condición quizás más importante es tener un proyecto definido de la forma más completa posible. Esto incluye una buena calidad de las especificaciones técnicas, de los planos generales y de detalle.

    Aún teniendo una muy buena planificación siempre surgen imponderables en la ejecución de un proyecto. A continuación se muestra una lista de los más típicos.

    • Desmoronamiento de terreno. • Napas freáticas descubiertas en las faenas de excavación. • Problemas con los vecinos. • Atraso de permisos. • Problema con maquinarias. • Accidentes en obra. • Mal ritmo de provisión de hormigón. • Problemas con los proyectos. • No existencia de materiales. • Mal clima. • Falta de mano de obra especializada. • Rendimiento de mano de obra menor a la esperada. • Falta de presupuesto. • Demora entrega de certificados.

    De ocurrir alguno o varios de estos problemas se tiene una situación en donde el

    presupuesto y los plazos establecidos de un proyecto ya no se pueden cumplir, según lo estipulado en los contratos de construcción.

  • 6

    El no cumplimiento del presupuesto trae repercusiones complejas a las empresas constructoras. Obviamente una extensión del presupuesto significa una utilidad inferior a la esperada, lo cual, para empresas constructoras grandes, puede ser un problema menor pero para empresas pequeñas que mantienen flujos y márgenes apretados, una utilidad por debajo de la esperada puede significar problemas mayores, ya sea el fracaso del proyecto o el quiebre de la empresa si es que la desviación con respecto al presupuesto es demasiado grande.

    En el caso en que no se cumplan los plazos estipulados en los contratos las consecuencias también pueden ser nefastas, si consideramos obras que tienen una fecha de utilización impostergable. Las multas y problemas que se generan si las obras no son entregadas en las fechas correspondientes son grandes. Toda empresa embarcada en una construcción le tiene miedo a las multas por concepto de atraso de entrega de las obras, debido a que las multas son cantidades considerables de dinero, lo cual nuevamente afecta de manera directa a la utilidad del proyecto.

    Considerando lo anteriormente dicho, las empresas constructoras deben estimar de la manera más rigurosa posible los plazos y presupuestos de sus contratos. Esto obliga a hacer un análisis de riesgo de los proyectos de una manera mucho más minuciosa de lo que se hace en la actualidad, ya que el no cumplimiento de estas dos condiciones genera externalidades negativas considerables, que pueden ir desde una utilidad menor a la esperada, pasando por perdida de reputación de la empresa, y en casos más extremos la quiebra de las mismas.

    Ante estos problemas críticos la industria de la construcción debe apoyarse en herramientas novedosas de gestión. Corresponde cambiar su manera de hacer negocios y abrirse a las nuevas tecnologías disponibles con el fin de mejorar sus márgenes y rendimientos. Atrás deben quedar las prácticas de aumentar los márgenes disminuyendo sueldos o apretando casi hasta la quiebra a los subcontratistas.

    2.2. Solución propuesta: análisis de datos y utilización de técnicas modernas de gestión.

    La pregunta que surge al determinar los alcances de un proyecto, es cómo considerar

    variables que no se pueden hacer tangibles dentro del marco rígido de un presupuesto y que subyacen en cada proyecto de construcción.

    Básicamente lo que se propone es hacer un análisis de riesgo para un proyecto de construcción, utilizando herramientas novedosas y así evitar que a la hora de evaluar los riesgos o posibles retrasos y sobrecostos de construcción se recurra a herramientas determinísticas, en donde el profesional establece los imprevistos como un porcentaje, basándose en su experiencia y no en herramientas reales que le den una justificación seria de tal análisis. En otras palabras estandarizar la información y usarla de manera racional.

  • 7

    La idea es imitar sistemas que utilizan las empresas manufactureras y de servicios, las cuales están ocupando desde hace un buen tiempo sistemas de análisis de datos. Estos sistemas se ocupan de realizar un análisis exhaustivo de los datos que obtienen de sus procesos o ventas. Con ellos pueden definir nuevas estrategias o determinar ciertas predicciones de ventas o producción. Algunos de estos sistemas son el data minning, modelos estadísticos multivariados, redes neuronales artificiales o sistemas borrosos, los cuales son de gran utilidad a la hora de planificar las producciones o establecer objetivos futuros.

    Claramente, al tratar de emular ciertos patrones de gestión de otras industrias surge el problema de que en general las empresas constructoras toman una cantidad considerable de datos de sus proyectos pero no le dan un uso especial o no los someten a análisis. Incluso, una vez construida una obra, no se dan el tiempo de hacer una revisión relativamente exhaustiva del cumplimiento de sus presupuestos y programaciones, lo cual les daría una noción del rendimiento que tiene la empresa2.

    La solución es crear una base de datos potente a la cual se le sumen no sólo variables típicas sino también variables que conocen los profesionales de obra y que no son almacenados en ninguna parte. Con esta base de datos se pueden generar ciertos modelos que reconozcan patrones en ellos y que sirvan para arrojar una luz a las estimaciones de imprevistos para sobrecostos y extensiones de plazo en proyectos de construcción. Todo esto, bajo el supuesto de que la duración y los costos de un proyecto se ven afectados por un cúmulo de factores los cuales pueden ser estimados y así mitigar sus efectos sobre la productividad de una construcción.

    A continuación se establecen los alcances para las herramientas que se ocuparán en este estudio.

    2.2.1. Análisis de datos usando Estadística.

    Para un análisis de datos propiamente tal se debe incluir sin lugar a dudas un análisis

    estadístico minucioso. Lo primero en un análisis de estas características es separar la estadística descriptiva de la estadística inferencial [Triola, 2000a].

    La estadística descriptiva sirve para estudiar las características más importantes de un conjunto conocido de datos de una población. Esta división de la estadística permite conocer la naturaleza o distribución de los datos lo cual es muy útil para conocer entre que valores se mueven los datos que se tienen. También se pueden calcular medidas de tendencia central con las cuales se tiene una idea de donde tienden a agruparse los datos y por último determinar medidas de variación para estudiar la dispersión de los datos y como varían entre sí.

    2 David Baccarini realizó una encuesta a ejecutivos de empresas constructoras británicas y ante la pregunta de si al finalizar una construcción revisaban la precisión de sus presupuestos y programaciones el 62% de los encuestados dijo que no [Baccarini, 2005].

  • 8

    Con ayuda de la estadística inferencial se pueden determinar generalizaciones o inferencias a partir de los datos. Acá es donde se recaba la información implícita que tienen los datos, la cual puede servir para tomar decisiones o ayudar en la gestión. Para esto existen distintas herramientas en esta área de la estadística, las cuales se pueden utilizar para determinar por ejemplo: parámetros de poblaciones usando datos de muestra, diferencia entre las medias o varianzas de muestras de distintas poblaciones, correlaciones e independencias entre variables para una muestra, etc. Con alguna de las herramientas anteriormente citadas de la estadística inferencial se podrá establecer ciertas diferencias o relaciones entre las distintas variables que inciden en el riesgo de un proyecto de construcción y a la vez depura una base de datos, con el fin de realizar modelos más complejos que ayuden a la predicción de resultados o estimación de riesgos.

    Otra ayuda importante para el análisis de datos son los sistemas multivariados de estadística, los cuales, gracias al uso de software especializados para computadores personales son de fácil uso y acceso. Con distintas técnicas del análisis multivariante se pueden realizar variados tipos de inferencias a partir de tres o más variables al mismo tiempo. Por ejemplo se pueden reducir el número de variables de una base de datos, mediante las interrelaciones que se dan entre las distintas variables, condensando la información en un número menor de variables con una pérdida mínima de información. Otra técnica de gran ayuda que sirve para realizar predicciones a partir de varias variables independientes, es la regresión múltiple. Con la regresión múltiple se pueden determinar predicciones relativamente precisas para las variaciones de costos y plazos3.

    Se tiene entonces en la estadística una herramienta poderosa para hacer inferencias a partir de una base de datos y así tratar de comprender de mejor manera la influencia de distintas variables sobre las variaciones de plazos y costos para proyectos de construcción.

    Obviamente la estadística no es por si sola la panacea ni la que resolverá todos los problemas de la industria, se necesita para que funcione, que la base de datos sea lo más seria posible ya que por muy grande que sea una muestra esta puede ser no representativa de una población. Esto debido a que la manera de conseguir la base de datos no se realiza de una manera prolija y sin un estudio previo de las variables importantes en el rendimiento de una construcción.

    2.2.2. Redes Neuronales Artificiales como herramienta de gestión.

    Las redes neuronales artificiales se han aplicado en una serie de actividades de

    diversas industrias y también con variado éxito en la industria de la construcción. Este uso se torna interesante al considerar que los problemas en la industria de la construcción para estimar sus resultados, dependen de un entorno complejo e incierto el cual posee una fuerte 3 Varias investigaciones leídas comparan modelos de regresión lineal múltiple con modelos de redes neuronales. [Attalla y Hegazy, 2003]

  • 9

    interrelación entre muchos factores conocidos y desconocidos. Con las características de la industria anteriormente señaladas, las redes neuronales tienen varias ventajas frente a otros tipos de métodos ya que pueden reconocer patrones complejos y no lineales.

    Desde principios de la década de los noventa que el uso de redes neuronales en el sector construcción ha cobrado un mayor auge, aunque todavía con un carácter más de investigación a nivel universitario que con un claro sentido empresarial, como en otras aplicaciones de esta técnica. Algunos de los trabajos interesantes han sido, por ejemplo, aumento de costos de construcción en autopistas durante un tiempo dado [Wilmot y Mei, 2005], estimación de las utilidades para una propuesta [Liu y Ling, 2005], modelos para estimar la productividad en faenas con uso de concreto [Ezeldin y Sharara, 2006], modelos para estimar los resultados de un proyecto de construcción [Georgy et al, 2005], etc. Como se aprecia, existen varias iniciativas con diversos resultados por lo que se hace vital el estudio de estas experiencias para ir mejorando los modelos y poder ampliar el espectro de usos. Al utilizar una herramienta basada en redes neuronales artificiales, se lograría cubrir cuatro aspectos básicos a la hora de estimar los errores en la planificación de un proyecto. Estos son: 1) Automatización en la forma de determinar la variación de costos y duración para un proyecto inmobiliario, 2) Interacción entre la inmobiliaria y la constructora para determinar los alcances de un proyecto, 3) Análisis de distintos escenarios para la ejecución de la obra y su diseño, y 4) Estimación fiable que sirva para tomar ciertas dediciones.

    Como las redes neuronales no sirven para hacer inferencias a partir de una base de datos sino que más bien funcionan como una herramienta, cobra sentido realizar un análisis estadístico para obtener información que puede ser importante y de ayuda en el problema descrito.

    2.3. Redes Neuronales Artificiales.

    2.3.1. Introducción.

    El cerebro humano, a través de su red neuronal biológica, tiene la capacidad de

    procesar grandes cantidades de información a gran velocidad. Esta información se combina y se compara con la ya almacenada en el cerebro y se entregan respuestas adecuadas incluso, para situaciones nuevas. Es así como un ser humano sabe que se puede quemar con el fuego, reconoce las imágenes que ve, puede diferenciar distintos olores, etc. Esto nos dice que el ser humano es capaz de resolver problemas gracias a su experiencia acumulada a lo largo de su vida.

    Las redes neuronales artificiales son un modelo simplificado del cerebro humano. Estas “copian esquemáticamente la estructura neuronal del cerebro para tratar de reproducir

  • 10

    sus capacidades, como por ejemplo, aprender de la experiencia a partir de las señales o datos del exterior, con el objetivo de construir sistemas de procesamiento de la información paralelos, distribuidos y adaptativos” [Martín del Brío y Sanz, 2001]. Las redes neuronales actúan sobre un conjunto de datos en donde reconocen patrones, pueden hacer predicciones o tomar una decisión, gracias a la experiencia obtenida en una etapa de aprendizaje. Así, las redes tienen un buen desempeño en la solución de problemas complejos donde el reconocimiento de patrones o comportamientos es importante. Algunos ejemplos de uso de redes neuronales son los siguientes: Biología: - Obtención de modelos de la retina. Empresa: - Evaluación de probabilidades de formaciones geológicas y petrolíferas. - Explotación de bases de datos. - Optimización de plazas y horarios en líneas de vuelo. - Modelado de sistemas para automatización y control. Medio Ambiente: - Analizar tendencias y patrones. - Previsión del tiempo. Finanzas: - Previsión de la evolución de precios. - Valoración del riesgo de créditos. - Interpretación de firmas. Manufactura: - Robots automatizados y sistemas de control. - Control de producción en líneas de procesos. - Inspección de calidad. Medicina: - Analizadores del habla. - Diagnóstico y tratamiento a partir de síntomas. - Predicción de reacciones adversas en los medicamentos. Militares: - Clasificación de las señales de radar. - Creación de armas inteligentes. - Reconocimiento y seguimiento en el tiro al blanco.

    Como se puede ver, las redes neuronales tienen una gran cantidad de aplicaciones, muchas de las cuales todavía no se pueden ni siquiera prever.

  • 11

    2.3.2. Características de las Redes Neuronales Artificiales R.N.A.

    Las Redes Neuronales Artificiales emulan tres características claves de los sistemas

    nerviosos, los cuales son: a) Procesamiento Paralelo: Al igual que las neuronas del cerebro, las redes neuronales artificiales están formadas por una gran cantidad de procesadores sencillos. De esta manera se tiene la ventaja de que cada uno realiza un procesamiento separado de las otras neuronas con lo que se puede procesar una gran cantidad de datos al mismo tiempo y de manera más rápida que en un sistema de procesador único. b) Memoria Distribuida: En una R.N.A. la información queda almacenada en los pesos de cada conexión y por eso se habla de una memoria distribuida. Esto tiene la ventaja de que si una conexión se daña se pierde solo una pequeña parte de toda la memoria almacenada en la red. Esto es completamente distinto a un computador normal donde la memoria se almacena en posiciones bien definidas. Esto entrega un sistema tolerante a fallos, como vemos en el sistema nervioso del ser humano, en donde muere una gran cantidad de neuronas al día pero pasan varios años antes de que sus capacidades se vean resentidas. c) Adaptabilidad: Una R.N.A. es capaz de adaptarse a su entorno, ya que en la etapa de entrenamiento, va modificando sus pesos a medida que acumula más información procedente del exterior. Así en una etapa posterior, tiene la capacidad de generalizar para un nuevo conjunto de datos.

    2.3.3. Elementos Básicos.

    2.3.3.1 Neuronas.

    La neurona o procesador elemental (PE) es un dispositivo básico de cálculo y es la

    estructura básica de una red neuronal. Esta recibe un vector de entrada procedente del exterior o de otras neuronas y, mediante una función de activación, emite una única salida, la cual se envía hacia otra neurona o hacia el exterior. Las neuronas se agrupan formando capas, las cuales a su vez forman las redes neuronales. La Figura 2.1 muestra una neurona i, a la cual le llega información desde neuronas de una capa anterior.

  • 12

    Figura 2.1 Procesador elemental o neurona.

    2.3.3.2 Función de Entrada.

    La función de entrada más habitual es la función lineal que se muestra a continuación:

    ∑ −= ijiji XWNeta θ ,

    donde θ es el umbral de excitación.

    Como se puede observar la función lineal es una suma ponderada de las entradas con los pesos sinápticos.

    Los pesos sinápticos Wij determinan la intensidad de la interacción entre la neurona

    presináptica j con la postsináptica i. Los pesos sinápticos toman valores entre -1 y 1. Si el peso es positivo se habla de una sinapsis excitadora en cambio si es negativo, se tiene una sinapsis inhibidora.

    También se pueden considerar funciones de entrada no lineales.

    2.3.3.3 Función de Activación o de Transferencia.

    La función de activación es la que determina la manera en que se manipulan los datos y como se genera la información que se envía a las siguientes capas o hacia el exterior, en caso de que sea de la capa de salida. A continuación definiremos las funciones más usadas. - Función Logística o Sigmoide. Es la función más usada, con rango de salida desde 0 a 1. Permite concentrar el aprendizaje en valores no extremos ya que acomoda señales muy intensas sin producir

  • 13

    saturación y admite señales débiles sin una excesiva atenuación. La expresión matemática es la siguiente:

    xexF −+=

    11)( .

    Figura 2.2 Función Logística.

    - Función Lineal. Esta función se utiliza cuando se quiere que todos los datos tengan la misma importancia, esto ya que esta función no se hace menos sensible al alejarse de cero. La expresión matemática es la siguiente:

    xxF =)( .

    Figura 2.3 Función Lineal.

  • 14

    - Función Tangente Hiperbólica. Esta función tiene las mismas propiedades que la Logística pero permite un rango de salida que va desde -1 a 1. La expresión matemática es la siguiente:

    xx

    xx

    eeeexF −−

    +−

    =)( .

    Figura 2.4 Función Tangente Hiperbólica.

    - Función Gaussiana y complemento de Gaussiana. La función gaussiana se usa cuando la información del centro es la más relevante, en cambio el complemento de gaussiana se usa para que la red le de más importancia a los valores extremos. Las expresiones matemáticas son las siguientes.

    Gaussiana 2

    )( xexF −= Complemento de Gaussiana 2

    1)( xexF −−= .

    Figura 2.5 Función Gaussiana.

  • 15

    Figura 2.6 Función Complemento de Gaussiana.

    2.3.4. Arquitectura de una Red Neuronal.

    La arquitectura de una red es la topología, estructura o patrón de conexiones de una

    red neuronal. En una red neuronal los nodos o neuronas se conectan a través de conexiones sinápticas, las cuales se pueden propagar en un solo sentido. En general las neuronas se suelen agrupar en capas y el conjunto de más de una de ellas constituye una red neuronal.

    Una red neuronal típica posee tres tipos de capas como se ve en la siguiente figura.

    Figura 2.7 Arquitectura de una red neuronal artificial.

    La capa de entrada es la que almacena la información que se le suministra a la red.

    Es de carácter única y su número de neuronas está determinado por la cantidad de inputs de la red. Esta capa no realiza ningún proceso, salvo la aplicación de una función escalar antes de pasar la información a la siguiente capa. Puede recibir variables de entrada binarias o continuas, dependiendo de la aplicación.

  • 16

    El procesamiento de los datos se lleva a cabo en la capa oculta, es ahí donde se procesa y se memoriza la información. La cantidad de capas ocultas y su número de neuronas lo decide quién arma la red y al pasar por ella los datos se propagan a la capa siguiente, después de pasar por una función de activación.

    La respuesta de la red se da en la capa de salida la cual es de carácter única y su

    cantidad es el número de outputs de la red. En esta capa los datos también pasan por una función de activación antes de dar el producto final de la red que puede ser binario, para el caso de problemas de clasificación o continuo en el caso de predicciones.

    Existen otros tipos de arquitecturas para redes neuronales como puede ser una red

    monocapa. También se pueden dar conexiones intra-capa o conexiones retrorealimentadas en que el sentido es contrario entrada-salida.

    2.3.5. Operación de las R.N.A: Aprendizaje y Generalización

    En los sistemas de redes neuronales artificiales se distinguen dos fases de operación, la

    primera es la etapa de aprendizaje en donde se entrena a la red a partir de un grupo de datos para que luego en la siguiente fase de generalización la red se pueda ocupar como una herramienta útil.

    2.3.5.1 Fase de Aprendizaje.

    En la fase de aprendizaje se produce el ajuste de los parámetros libres de la red a partir

    de un proceso de estimulación. La mayoría de estos procesos consideran sólo el cambio en los pesos sinápticos y el tipo de aprendizaje viene dado por la manera en que se cambian dichos parámetros.

    El aprendizaje parte con un cierto modelo de neurona, arquitectura de red y con los

    pesos sinápticos iniciales como nulos o aleatorios. La red va alterando sus pesos conforme se le entregan nuevos conjuntos de datos. A continuación se explican los distintos tipos de aprendizaje que se dan en las R.N.A.

    El método más sencillo es el aprendizaje supervisado en donde a la red se le presentan los inputs y outputs de un conjunto de datos, de manera iterativa la red ajusta sus pesos para que el output tienda a ser el deseado. Los métodos más usados de aprendizaje supervisado son el algoritmo de retropropagación (Back-propagation) y la regla delta generalizada.

  • 17

    El caso en que a la red no se le presentan respuestas deseadas el tipo de aprendizaje es no supervisado, para que este funcione se le debe presentar a la red una multitud de patrones para generar un cierto nivel de redundancia en las entradas y así la red sea capaz de descubrir por sí misma rasgos comunes, regularidades, correlaciones o categorías. Es por esto que este tipo de aprendizaje es de gran utilidad para generadores de categorías.

    Existe dos tipos más de aprendizaje, conocidos como híbrido y reforzado. El primero

    es una mezcla del aprendizaje supervisado y no supervisado, el cual mezcla estos tipos en distintas capas. El segundo lo que hace es emplear información del error pero la ocupa sólo para determinar si está funcionando bien o mal, y por ende no explicita la salida deseada.

    2.3.5.2 Fase de Generalización.

    En esta fase se detiene el aprendizaje por lo que la estructura y pesos logrados en la

    fase anterior quedan fijos. Con esta arquitectura y pesos fijos la red es capaz de generalizar a partir de casos nuevos que se le presenten.

    2.3.6. Regla LMS para aprendizaje supervisado.

    La regla LMS (Least Mean Square) o regla Widrow-Hoff conduce a actualizaciones de

    tipo continuo, siendo la actualización de los pesos proporcional al error que la neurona comete [Haykin, 1994].

    El método consiste en establecer una función de error o coste que mida el rendimiento

    de la red y que dependa de los pesos sinápticos. Dada esta función se establece el procedimiento de optimización capaz de proporcionar una configuración de pesos que corresponda a un mínimo local de la función propuesta. Dicho de otra manera, el método aplicado proporciona una regla de actualización iterativa de los pesos en función de los patrones de aprendizaje. Así se puede lograr la búsqueda de un punto óptimo de la red neuronal. A continuación se explicará el algoritmo de enseñanza para la red más simple, llamada Adalina, la cual consta de una neurona similar a la de la Figura 2.1 pero la función de activación es la identidad.

    La función error o coste más utilizada es la del Error Cuadrático Medio:

    2

    1

    2 )(21

    21 ∑

    =

    −==p

    kkk xwdeJ ,

    donde d: salida deseada wk: peso sináptico xk: entrada k-ésima

  • 18

    Al graficar se obtiene una curva como la mostrada en la Figura 2.8, en donde el punto w* corresponde a una configuración de pesos localmente óptima.

    Figura 2.8 Superficie de ECM.

    Para el caso en que el problema sea mayor a dos dimensiones, la representación

    gráfica de esta función, sería como una hipersuperficie con montañas y valles, en donde la configuración de pesos w* ocupada por un valle es la solución localmente óptima.

    Expresada de manera matemática, la condición óptima para la función de error está

    dada por:

    pkwJJ

    kwk

    ,....,2,1,0 ==∂∂

    =∇ .

    Esta condición arroja un sistema de ecuaciones conocida como Wiener-Hopf, el cual

    se soluciona con el método de optimización del descenso por el gradiente. Según Bonifacio del Brío [Martín del Brío y Sanz, 2001] para encontrar un mínimo local se realiza el siguiente procedimiento; “Se parte en t = 0 de una cierta configuración w(0) y se calcula el sentido de la máxima variación de la función J(w) en w(0), que vendrá dado por su gradiente en w(0). El sentido de la máxima variación (máximo gradiente) apuntará hacia un colina del paisaje de la hipersuperficie de J(w). A continuación se modifican los parámetros w siguiendo el sentido contrario al indicado por el gradiente de la función error. De este modo se lleva acabo un descenso por la hipersuperficie del error, aproximándose en una cierta cantidad al valle, un mínimo (local); el proceso se itera hasta alcanzarlo”. La regla de actualización de los pesos es la siguiente:

    pknxnxnwndnwnw kp

    jjjkk ,......,2,1)()()()()()1(

    1=⎟⎟

    ⎞⎜⎜⎝

    ⎛−+=+ ∑

    =

    η .

    η indica el tamaño del paso tomado en cada iteración. Para el caso de una red multicapa (con una o más capas ocultas) se extiende el

    algoritmo LMS, esto quiere decir que la funcional de error se derivará en función de los pesos de la capa de salida y de los pesos de las neuronas de las capas ocultas, haciendo uso de la

  • 19

    regla de cadena. En consecuencia, las funciones de transferencia de las neuronas deben ser diferenciables. Las siguientes figuras muestran la utilización del método del descenso por gradiente para una red de una neurona y de una red multicapa.

    Figura 2.9 Método del descenso por gradiente para una red de una neurona.

    Figura 2.10 Método del descenso por gradiente para una red multicapa.

    2.3.7. Aprendizaje por retropropagación de errores (Backpropagation).

    El algoritmo de Backpropagation consiste en propagar el error hacia atrás desde la capa de salida hacia al capa de entrada, pasando por las capas ocultas, esto se hace para modificar los pesos de las conexiones. El proceso completo sigue los siguientes pasos:

  • 20

    - Se introducen los inputs en la capa de entrada. - Se propaga esta señal por todas las capas de la red hasta la que se obtiene un output en la capa de salida. - Se compara el output de salida de la red con el deseado. - Se calcula un error para cada unidad de salida. - Se transmite el error hacia atrás hacia todos los nodos que están conectados directamente. - Estos nodos reciben una fracción el error proporcional al peso de sus conexiones. - Se actualizan de manera iterativa todos los pesos de las conexiones con tal de disminuir el error. - Cuando el error resulta aceptable se detiene el aprendizaje.

    2.3.8. Ventajas de las R.N.A.

    Las redes neuronales artificiales presentan grandes ventajas las cuales hacen que este

    tipo de tecnología esté entrando con fuerza en múltiples áreas. Entre las ventajas se incluye:

    • Aprendizaje Adaptativo: Capacidad de aprender a realizar ciertas tareas mediante una experiencia inicial o entrenamiento.

    • Generalización: Facultad de las redes neuronales de responder de manera acertada cuando se le presentan datos nuevos a los cuales no había sido expuesta, esta ventaja se da gracias a la auto-organización de la información que reciben.

    • Tolerancia a fallos: Si una parte de la red falla la otra puede seguir funcionando con lo que la red neuronal no pierde su funcionalidad, esto gracias a que almacenan su información de manera distribuida, cada neurona tiene una parte pequeña de la información a diferencia de los sistemas tradicionales en la cual cada parte de información esta almacenada en una parte específica.

    • Operación en tiempo real: Las redes neuronales son de rápido procesamiento de datos. Esto gracias ha que a aumentado la eficiencia de los programas a través del diseño de procesadores con arquitectura mejorada y también se ha extendido la capacidad y manejo de la memoria computacional.

    • Compatibilidad con tecnologías existentes: Las redes neuronales pueden ser fácilmente implementadas utilizando técnicas existentes e integradas a casi cualquier tipo de sistema.

  • 21

    3. METODOLOGÍA.

    3.1. Modelos a realizar.

    En el momento en que un mandante concibe un proyecto de construcción se deben realizar varias estimaciones iniciales para determinar la viabilidad del mismo. El primer paso es definir los alcances y características generales del proyecto.

    La experiencia indica que esta fase de estimaciones iniciales se realiza en un corto periodo de tiempo por lo que se debe contar con herramientas adecuadas de análisis, de no ser así muchas estimaciones pueden ser erróneas. Si un proyecto mal estimado en su orden de magnitud, pasa a una segunda fase en donde se determina que no es viable, se ha perdido un tiempo valioso el cual podría haber sido destinado a proyectos realmente factibles.

    A nivel de estimaciones de orden de magnitud los profesionales dedicados a la evaluación de proyectos deben contar con modelos que los ayuden a realizar estimaciones lo más exactas posibles. Al contar con modelos de estas características se obtienen varias ventajas como por ejemplo: - Reducción importante de tiempo y costos al momento de definir en una primera

    instancia la viabilidad de un proyecto. - Evaluar las mejores oportunidades de inversión o participación. - Estandarización del proceso de estimación de costos en la etapa de evaluación o

    planificación de un proyecto. - Permiten al mandante analizar distintas opciones sobre los alcances y características

    del proyecto. Esta última ventaja da al mandante un abanico de opciones para elegir el proyecto que más le convenga a los intereses de su empresa. Para este trabajo de título se abordarán dos problemas a modelar. El primer problema a tratar será la construcción de un modelo capaz de realizar una estimación de orden de magnitud del costo presupuestado de un proyecto de construcción4, el cual servirá para entender el comportamiento de las R.N.A y la regresión lineal múltiple (R.L.M.). El segundo problema, en donde se pretende ocupar todo el potencial de estas dos herramientas, es

    4 Para rangos de valores de una estimación de orden de magnitud ver Tabla 2.1

  • 22

    elaborar cuatro modelos, dos de R.N.A. y dos de R.L.M., capaces de estimar las variaciones de costos y plazos de un proyecto de construcción, objetivo principal de este trabajo de título.

    3.1.1. Modelos para estimar el costo presupuestado de un proyecto de construcción.

    Se elaboran varios modelos basados en R.N.A., en donde se utilizara el software comercial de redes neuronales Neurosolutions, y en R.L.M. utilizando el software de estadística SPSS. Ambos modelos tienen la tarea de lograr una estimación del costo presupuestado de un proyecto de construcción5 a partir de una serie de variables. Para un buen uso de estos se software se ocupó literatura especializada [Príncipe et al, 2000], [Pérez, 2005]. El tipo de estimación para estos modelos es de orden de magnitud. Una vez realizados los dos modelos se procede a analizar el poder de generalización de cada uno. Para esto se utilizaron cuatro proyectos de testeo con el fin de determinar cual de los dos métodos logra una mejor estimación.

    3.1.2. Modelos para estimar la variación de costo y plazo.

    En estos modelos se decidió utilizar como variable dependiente los plazos y costos finales de un proyecto6, en vez de las variaciones, ya que mejoraba el nivel de generalización. Tanto como para la variación de costos y plazos se realizanon varios modelos en R.N.A. y en R.L.M. utilizando los software antes mencionados. Una vez realizados los modelos se procedió a analizar el poder de generalización de cada uno. Para esto se utilizaon cuatro proyectos de testeo con el fin de determinar cual de los métodos logra una mejor estimación. Con el fin de legitimar los mejores modelos se realizó una validación cruzada. Esto implicó rehacerlos varias veces con la base de datos aleatorizada. A continuación se muestra un diagrama de flujo de los pasos a seguir para la realización de los modelos.

    5 Presupuesto Proyecto = Costos Generales + Costo Directo de Obra, en Tabla 6.1del Anexo A columna Costo Presupuestado. 6 Ver columnas Costo real y Plazo real en Tabla 6.1 Anexo A

  • 23

    3.2. Información sobre proyectos de construcción.

    Según la bibliografía revisada, uno de los aspectos claves de la realización de un

    modelo predictivo en redes neuronales se basa en tener un amplio registro de datos con que

    Recolección de DatosEncuesta orientada a proyectos habitacionales en altura.

    Análisis de Datos Valores descriptivos, correlaciones, análisis de varianza, etc.

    Selección de modelos Costo Presupuestado CP Variación de Costos VC Variación de Plazos VP

    Identificación de variables CPSuperficie Pisos sobre cota 0 Subterráneos Categoría (Clase1, Clase2, Clase3)

    Identificación de variables VC-Costo presupuestado -Superficie -Pisos sobre cota 0 -Empresa construye y vende -Subterráneos -Complejidad del Layout -Técnicas especiales de construcción

    Identificación de variables VP-Costo presupuestado -Superficie -Empresa construye y vende -Subterráneos Plazo programado

    Diseño modelos de regresión Ecuación de regresión Coeficientes estandarizados Coeficiente de determinación R2

    Diseño de R.N.A. Definir: - Nº de capas ocultas - Nº de neuronas

    Entrenamiento R.N.A.Establecer: - Proyectos para entrenamiento - Proyectos para testeo - Nº de iteraciones

    Testeo y Validación Regresión vs. Redes Neuronales Elección del mejor modelo y revalidación

  • 24

    alimentarla y que a su vez esta información sea lo más acuciosa y fidedigna posible. Debido al punto anterior, se determinó realizar una encuesta a una gran variedad de empresas constructoras e inmobiliarias. Esto tiene la ventaja de que se puede encausar la recolección de datos hacia los temas que el investigador desee. La encuesta y su utilización se explican en el siguiente punto.

    3.2.1. Encuesta.

    La encuesta que se decidió enviar a las distintas empresas contiene varias categorías

    que son de interés para el rubro de la construcción, para cada categoría se consideraron distintas variables que pueden afectar la productividad de cada proyecto o que tienen un cierto riesgo inherente en ellas. Dichas variables fueron determinadas analizando distintos estudios similares a este7 y una vez estipuladas fueron sometidas al juicio de profesionales del rubro para asegurar la utilidad de cada una de ellas.

    De manera de evitar que el encargado de contestar la encuesta dejase partes en blanco

    o simplemente lo hiciese para un solo proyecto en vez de para varios, la encuesta se diseñó para que se conteste de manera rápida y fácil. Además se creó con un formato tipo cuestionario en donde se le explica al encargado como contestar la encuesta. Así se evita que se tengan distintos tipos de respuesta para una misma pregunta. Cabe mencionar que para cada proyecto se tiene un cuestionario diferente.

    Una de las conclusiones más destacables de los distintos estudios es la importancia de

    contar con una muestra que pertenezca a una población relativamente homogénea, esto para no tener casos extremos o muy dispares entre si, que dificulten el reconocimiento de patrones. Por esto se determinó usar sólo proyectos habitacionales de edificación en altura.

    A continuación se detalla cada categoría, las variables que contienen y una breve

    explicación de cómo contestar cada una de ellas. Además, para evitar algún tipo de problema, toda la información se registra de manera anónima para así asegurar la confidencialidad de las empresas que entregaron datos.

    3.2.1.1 Antecedentes Generales.

    Este punto contiene antecedentes típicos de cada proyecto de construcción, los cuales

    se analizan por separado.

    7 Se encontraron varias experiencias similares realizadas en distintas partes del mundo, estas fueron de gran ayuda para evitar incluir variables cuya incidencia era mínima en el problema a estudiar [Sutrisna et al, 2005].

  • 25

    - Costo presupuesto del proyecto y Costo directo de obra: Con estas dos variables y con los costos reales se calcularán las diferencias de costos de cada proyecto. Una de estas dos variables será la variable dependiente a estimar en los modelos. - Tipo de contrato: Con esta variable se pretende identificar si existe alguna diferencia significativa en el resultado de la construcción a partir de distintos tipos de contratos entre el mandante y la empresa constructora.. - Duración programada proyecto: Sirve para definir un tiempo estimado de estudio y elaboración de los distintos proyectos y para ver su incidencia en los resultados. - Superficie proyecto: Sirve para estudiar la incidencia del tamaño del proyecto en la estimación que se haga de los costos y plazos. - Empresa construye y vende: Es una variable interesante ya que se podrá inferir si es que existe una diferencia en como se hacen las proyecciones si el propietario del proyecto a la vez lo construye. - Comuna: Puede indicar alguna diferencia en los resultados dependiendo de la ubicación del proyecto. - Habitacional o Comercial: Responde a si el proyecto para el cual se está contestando la encuesta es de carácter comercial o habitacional. - Fecha de inicio y término de la construcción: Esta variable puede ser interesante para ubicar el proyecto en las distintas coyunturas económicas por las que puede estar pasando el país o la industria de la construcción. - Número de pisos y subterráneos: Se analizará si la cantidad de pisos sobre y bajo la cota 0 pueden incidir en una alteración de las proyecciones, interesante es analizar el número de pisos por separado ya que los subterráneos pueden acarrear más complicaciones que los pisos sobre la cota 0. - Tipo de estructura: Se analizará la diferencia entre una construcción cuya estructura sismorresistente es de muros de hormigón armado, marcos rígidos de vigas y columnas o si es una estructura de acero.

  • 26

    La categoría completa con la explicación que lee el encuestado se muestra a continuación.

    Tabla 3.1Antecedentes Generales. Antecedentes generales Observaciones

    Costo o presupuesto del proyecto Costo total del proyecto en UF sin IVA (gastos grales. + costo directo)

    Costo directo de obra Costo directo de la obra en UF sin IVA

    Tipo de contrato

    Tipo de contrato entre mandante y constructora. Opciones: Suma alzada, Serie de Precios Unitarios y Administración Delegada. Si es un sistema mixto elegir de las tres opciones la más cercana al contrato del proyecto.

    Duración programada proyecto Duración total en días desde el inicio del Proyecto de Arquitectura hasta entrega de terreno.

    Superficie proyecto Superficie total del proyecto en m2.

    Empresa construye y vende Sí: si la misma empresa construye y explota el proyecto, No: caso contrario.

    Comuna Comuna donde se sitúa el proyecto. Tipo de proyecto Habitacional o Comercial Fecha de inicio de la construcción Especificar año y mes en que empezó la construcción Fecha de término de la construcción Especificar año y mes en que terminó la construcción Número de pisos Nº de pisos desde la cota 0. Número de subterráneos Nº de subterráneos del proyecto. Tipo de estructura Estructura de marcos rígidos, de muros o de acero.

    3.2.1.2 Calidad y Experiencia.

    Acá tenemos algunas variables que debido a que pueden tener un rango de respuestas

    demasiado amplio se someterán al juicio de expertos para encausarlas en 4 o menos categorías, las variables anteriormente citadas son el nombre de la oficina de Arquitectura y el nombre de la oficina de ingenieros que realiza el cálculo estructural.

    Algunas variables interesantes a analizar por separado son:

    - Experiencia empresa constructora, años de experiencia administrador de obra: Es interesante ver si es que el know how adquirido por la empresa y el administrador de obra durante años sirve para establecer una diferencia con empresas más pequeñas o nuevas. - Valor venta promedio: Puede ser un parámetro interesante considerar la calidad del producto a vender y si esto afecta la productividad del negocio. - Inspección técnica externa: El analizar si el proyecto posee una inspección técnica externa también puede ser importante al momento de subir los costos ya que los requerimientos de calidad pueden ser mayores al exigir el fiel cumplimiento de las especificaciones técnicas

  • 27

    - Coordinación de proyectos externa: La realización de una coordinación externa del proyecto puede determinar que el proyecto sea mejor estudiado y así muchos errores de diseño se corrigen antes de llegar a terreno. - Certificación: Es interesante analizar si la empresa que posee algún tipo de certificación que estandarice sus procesos o gestione la calidad obtiene mejores rendimientos que una empresa que no posee ningún tipo de certificación. La categoría completa con la explicación que lee el encuestado se muestra a continuación.

    Tabla 3.2 Calidad y Experiencia.

    Calidad y Experiencia Observaciones Arquitecto Nombre oficina de arquitectura. Calculista Nombre oficina de ingenieros. Experiencia empresa constructora Superficie total construida por la empresa. Valor venta promedio Valor de venta promedio en UF/m2

    Años de experiencia administrador obra Años de experiencia del administrador de obra.

    Inspección técnica externa Sí: si se realizó una inspección externa a cargo del mandante (incluir nombre empresa), No: caso contrario.

    Coordinación de Proyectos Sí: si una empresa externa se encargó de la coordinación de los distintos proyectos (incluir nombre empresa). No: caso contrario.

    La empresa posee certificación Si: si la empresa posee algún tipo de certificación. Ej: ISO 9000, etc. (nombrar certificación), No: caso contrario.

    3.2.1.3 Información Desarrollo Proyecto.

    En esta categoría se tocan temas que atañen al proceso mismo de la construcción del proyecto, el análisis por separado se hace a continuación: - Accesibilidad de los materiales: Puede ser importante ya que para las obras extraordinarias la lejanía de un material dado puede traer asociado un costo mayor a que si las materias primas están relativamente cerca. - Técnicas especiales de construcción: Es interesante analizar la posible relación entre la introducción de tecnologías nuevas en un proyecto y los sobrecostos o variaciones de plazo que estas pueden acarrear. - % de subcontratación: El porcentaje de subcontratación en un proyecto de construcción es uno de los temas importantes en el rubro ya que no hay una regla establecida, por ende no se puede indicar de manera exacta si a mayor porcentaje de subcontratación se reducen los costos o los plazos o hasta que punto se puede dar esa lógica.

  • 28

    - Duración construcción programada: Con esta variable y la duración real del proyecto se determinará la segunda variable dependiente u output del modelo. - Complejidad del layout: Esta variable que puede tener cierto efecto en la organización de una obra que es la complejidad de la instalación de faena o del layout, esto por que es sabido que con un terreno complejo el layout de instalaciones puede traer complicaciones serias en la ejecución de las obras. La categoría completa con la explicación que lee el encuestado se muestra a continuación.

    Tabla 3.3 Información Desarrollo Proyecto. Información Desarrollo Proyecto Observaciones

    Accesibilidad de los materiales

    Alta: La obra se encuentra cerca de sus insumos (< 5 hrs.), Media: La obra se encuentra a una distancia media de los insumos (>5 hrs.,1.5 días).

    Número de obras extraordinarias Número de obras extraordinarias llevadas a cabo durante la ejecución del proyecto.

    Técnicas especiales de construcción

    Alto: Se usaron nuevas tecnologías en una gran parte de la construcción, Medio: el proyecto incluye ciertas tecnologías nuevas de mediana complejidad. Baja: El proyecto no presentó uso de tecnologías nuevas en su construcción.

    % de subcontratación según proyecto % de partidas subcontratadas del proyecto. (costo total partidas subcontratadas*100/costo directo de construcción)

    Duración Construcción Programada Duración programada en días desde la entrega de terreno hasta termino de construcción.

    Complejidad del layout

    Bajo: El terreno permite una fácil instalación de faenas y no presenta grandes problemas, Medio: La instalación de faena es más compleja, Alta: el terreno presenta características que complican la construcción y el layout de instalaciones.

    3.2.1.4 Programación y Control.

    Las dos variables que pertenecen a esta categoría se incluyeron para determinar si

    genera alguna influencia en el resultado de un proyecto el que se ocupe algún software en el control de presupuestos y que se tenga un profesional dedicado a la programación y control de la obra. La categoría completa con la explicación que lee el encuestado se muestra a continuación.

  • 29

    Tabla 3.4 Programación y Control. Programación y control Observaciones

    Profesional dedicado exclusivamente a programación y control

    Sí: si la empresa posee un profesional a cargo exclusivamente para programación y control, No: caso contrario.

    Utiliza algún software para control de presupuesto

    Sí: si la empresa utiliza algún tipo de software para control de presupuesto, Ej: Rego, Arquímides, Presto, Unysoft, Opus olé, etc., No: caso contrario.

    3.2.1.5 Datos Finales.

    Utilizando las variables que se muestran en la siguiente tabla y las variables

    construcción programada y costo inicial del proyecto se calcularán los outputs a los que será sometido el modelo. Con estos outputs se generará la red de retropropagación que se explicó en el marco teórico. La categoría completa con la explicación que lee el encuestado se muestra a continuación.

    Tabla 3.5 Datos Finales. Datos finales Observaciones

    Duración real construcción Duración real de construcción del proyecto.

    Variación de costo total proyecto Costo total real del proyecto al final de su construcción (gastos grales + costo directo + obras extraordinarias).

    Variación de costo directo de obra Costo directo de obra real al final de la construcción. (Incluyendo obras extraordinarias, si se tienen)

    3.3. Recolección y análisis de datos.

    La encuesta mostrada en el punto anterior se distribuyó a cerca de 20 profesionales del

    rubro de la construcción de 15 empresas distintas. Entre los profesionales se encontraban administradores de obra, supervisores de proyectos y gerentes. La encuesta se difundió principalmente mediante entrevistas, aunque en algunos casos se mandó sólo por email, previo contacto telefónico. El periodo de difusión se extendió desde mediados de abril hasta fines de junio del año 2007 y se obtuvieron 32 proyectos distintos. Cabe destacar que se podrían haber obtenido más de no ser por el límite de tiempo para entregar este trabajo de título.

    En un primer análisis se eliminaron proyectos que no cumplían con el requisito de ser

    edificios habitacionales en altura con lo que la base de datos se redujo a 27 proyectos. Luego se quitaron 3 más debido a que no eran proyectos representativos o tenían demasiados datos ausentes. Al final la base de datos quedó de 24 proyectos, todos edificios habitacionales en altura. En el anexo A se presentan los valores de cada variable para los 24 proyectos a ocupar en los modelos.

  • 30

    En las Tabla 3.6 y Tabla 3.7 se muestran los rangos en que se mueven las variables más importantes de la base de datos. Con esta se pretende dar una idea de la magnitud, tamaño y costo, de los edificios recabados. Como se observa la muestra va desde pequeños proyectos de poco más de 3.000 [m2] hasta grandes proyectos de aproximadamente de 35.000 [m2], lo que garantiza una muestra representativa del problema a estudiar.

    Tabla 3.6 Valores descriptivos de las variables cuantitativas más importantes

    para todos los proyectos.

    Variables N Mínimo Máximo Media Desv.

    Estándar Costo del proyecto [UF] 24 43.271,00 376.778,00 152.365,65 83.465,28 Pisos sobre cota 0 [uni] 24 4,00 27,00 15,70 5,72 Nº de subterráneos [uni] 24 1,00 6,00 1,95 1,26 Superficie proyecto [m2] 24 3.500,00 34.837,00 14.105,66 7.585,89 valor de venta [UF/m2] 24 25,00 50,00 34,48 7,13

    Tabla 3.7 Valores descriptivos de las variables cualitativas más importantes para todos los proyectos.

    Técnicas Especiales de Construcción

    Frecuencia

    Complejidad de Layout

    Frecuencia

    Empresa Construye y Vende

    Frecuencia

    Alta 8 Alta 6 No 6 Baja 14 Baja 12 Si 18

    Media 2 Media 6 Total 24 Total 24 Total 24

    En la Tabla 3.8 se ven algunos valores descriptivos de la variación de costos y plazos para los proyectos de la base de datos. En ambas variables el rango de valores es amplio lo que indica que los resultados de los proyectos también son representativos de la industria.

    Tabla 3.8 Valores descriptivos de la variación de costos y plazos. N Mínimo Máximo Media Desv. Estándar

    Variación de costo del proyecto [UF]

    24 -13.972,00 16.378,30 2.580,45 7.242,86

    Variación de plazo [día] 24 -30,00 90,00 26,79 26,77

    Las variables de comuna y valor de venta se juntaron para crear una variable cualitativa nueva llamada categoría la cual será incluida en los distintos modelos. Esta variable será dividida en tres clases. La primera incluye proyectos de gran calidad, en comunas de alto costo de suelo y de alto costo de venta de sus departamentos. La segunda clase incluye proyectos de mediana calidad, en comunas de un costo de suelo medio y con un

  • 31

    precio de venta de departamentos medio. La tercera clase incluye los proyectos no contenidos en las otras dos.

    3.4. Modelo que estima en orden de magnitud el presupuesto de un proyecto de construcción.

    3.4.1. Modelo de Regresión Lineal Múltiple.

    Los distintos modelos de regresión múltiple de este trabajo de título se realizaron con el

    software de estadística SPSS. A continuación se detallan los pasos para obtener una regresión múltiple con este programa.

    Lo primero es importar la base de datos al software. La siguiente imagen muestra la

    base de datos ya importada al SPSS.

    Figura 3.1 Base de datos en SPSS.

    El paso siguiente es realizar la regresión múltiple, las imágenes que se muestran a

    continuación muestran el proceso a realizar.

  • 32

    Figura 3.2 Pasos para la regresión múltiple.

    Figura 3.3 Elección de las variables independientes y dependiente.

    Una vez establecidas las condiciones para la regresión el software crea una ventana

    aparte con un Output en donde aparecen los resultados.

  • 33

    Figura 3.4 Output con los resultados.

    Siguiendo los pasos mencionados y habiendo mezclado los proyectos al azar previamente, se elaboraron varias regresiones con distintas variables cada una. La elección de las variables se explica en el Anexo B. La nueva variable categoría es separada en dos variables ficticias con el fin de poder usarla en la regresión lineal8. Para realizar los modelos se ocuparon veinte proyectos para la regresión y cuatro para testear la exactitud de las estimaciones, los cuales se pueden ver en el Anexo A. Se ocupa el coeficiente de determinación ajustado9 para comparar entre regresiones. Además, para determinar la importancia de cada variable en cada regresión se mostrará los coeficientes estandarizados beta10. La siguiente tabla muestra las variables que se ocuparon para las cinco mejores alternativas:

    8 Al tener una variable con tres clases sólo se necesitan dos variables ficticias para poder representarla en la regresión y en la red neuronal. Ver Anexo B. 9 Se ocupa el R2 ajustado ya que cada regresión tiene un número distinto de variables independientes. Ver Anexo B 10 Ver Anexo B

  • 34

    Tabla 3.9 Alternativas a realizar con R.L.M y R.N.A. Variables Predictoras Alt. 1 Alt. 2 Alt. 3 Alt. 4 Alt. 5

    Superficie(X1) X X X X X Pisos sobre cota 0 (X2) X X X Subterráneos(X3) X X Clase 1 (X4) X X X X Clase 2 (X5) X X X X Sí empresa construye y vende (X6) X

    Variable Criterio

    Costo Proyecto(Y) X X X X X La primera regresión es la siguiente:

    1*99.1037,2135 XY +−= Con R2: 0,946 Los coeficientes estandarizados son:

    Variable Coeficiente

    estandarizado Beta

    Superficie [m2] (X1) 0,974

    La segunda regresión es la siguiente:

    4*07.267545*59.185542*86.14051*42.1029.33794 XXXXY ++++−= Con R2: 0,959 Los coeficientes estandarizados son:

    Variable Coeficiente estandarizado

    Superficie [m2] (X1) 0,923 Clase 1 (X4) 0,163 Clase 2 (X5) 0,110

    Pisos sobre cota 0 [uni] (X2)

    0,094

    La tercera regresión es la siguiente:

    5*18.210584*21.294413*61.79572*17.21971*36.1053.32805 XXXXXY ++−++−= Con R2: 0,966

  • 35

    Los coeficientes estandarizados son:

    Variable Coeficiente

    estandarizado

    Superficie [m2] (X1) 0,918 Clase 1 (X4) 0,180 Clase 2 (X5) 0,126

    Pisos sobre cota 0 [uni] (X2)

    0,148

    Subterráneos [uni] (X3)

    -0,096

    La cuarta regresión es la siguiente:

    5*40.119504*15.238891*63.1098.11483 XXXY +++−= Con R2: 0,956 Los coeficientes estandarizados son:

    Variable Coeficiente

    estandarizado

    Superficie [m2] (X1) 0,966 Clase 1 (X4) 0,142 Clase 2 (X5) 0,072

    La quinta regresión es la siguiente:

    6*39.90485*17.242764*87.326333*99.91402*99.24391*46.1090.31129

    XXXXXXY −++−++−=

    Con R2: 0,965 Los coeficientes estandarizados son:

    Variable Coeficiente estandarizado

    Superficie [m2] (X1) 0,927 Clase 1 (X4) 0,200 Clase 2 (X5) 0,145

    Pisos sobre cota 0 [uni] (X2)

    0,164

    Subterráneos [uni] (X3) -0,110 Sí empresa construye y

    vende (X6) -0,045

  • 36

    A partir de los coeficientes estandarizados de las distintas alternativas se pueden realizar varias inferencias. Primero, para las cuatro alternativas se observa que la variable más importante es la Superficie del proyecto, lo cual obedece a que es la variable de mayor correlación con el costo del proyecto, a mayor superficie obviamente aumenta el costo presupuestado. La variable ficticia clase 1 muestra un coeficiente estandarizado mayor que la clase 2 lo que confirma que a medida que se aumentan los estándares de un edificio los costos aumentan. Por último en los coeficientes de la alternativa 4 se observa que el número de subterráneos posee un coeficiente estandarizado negativo lo que indica que de dos edificios con la misma superficie total será más barato el que posea más subterráneos, esto se debe a que el costo por metro cuadrado de subterráneo es menor. El coeficiente asociado a la variable sí empresa construye y vende en la alternativa 5 es negativo, lo que indica que si una empresa es inmobiliaria y constructora el costo del proyecto sale más barato que si son dos empresas separadas. En el capítulo 4 se analizan los resultados para cada modelo.

    3.4.2. Modelo basado en R.N.A.

    Como ya se ha mencionado el software ocupado para realizar los modelos en redes neuronales es el Neurosolutions5 for Excel, el cual permite manipular los datos con el editor de planillas de cálculo lo que facilita su uso. A continuación se detallan los pasos más importantes para obtener un modelo utilizando esta herramienta. Lo primero es tener los datos ordenados en la planilla de cálculo para luego proceder a etiquetar las variables que serán independientes y dependientes. Los proyectos se etiquetan como de entrenamiento y de testeo. La siguiente figura muestra como se etiquetaron los datos.

    Figura 3.5 Proceso de etiquetado de datos.

  • 37

    Una vez que se tienen todos los datos etiquetados se procede a crear la red, para eso el software tiene tres opciones. La primera es para problemas de clasificación, la segunda para aproximación de funciones, en ambas una vez creada la red se pueden cambiar varios parámetros como el número de ep