224
Modelos economicos de multiples agentes Una aproximaci on de la economa desde los sistemas complejos D. Heymann 1 , R. Perazzo 2 y M.G. Zimmermann 3 WORK IN PROGRESS Junio 2011 1 Universidad de Buenos Aires 2 Instituto Tecnol ogico Buenos Aires 3 Universidad de San Andr es

Modelos econ omicos de multi ples agentes · 1.4 Contenido del trabajo12 Bibliograf a16 2 Modelos computacionales 19 2.1 Introducci on19 2.2 Aut omatas celulares20

  • Upload
    ledung

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Modelos economicos de multiples agentes

Una aproximacion de la economıa desde los sistemas complejos

D. Heymann1, R. Perazzo2 y M.G. Zimmermann3

WORK IN PROGRESS

Junio 2011

1Universidad de Buenos Aires2Instituto Tecnologico Buenos Aires3Universidad de San Andres

2

Modelos economicos de multiples agentes 23-06-2011

i

Prefacio

Este texto es una sıntesis de como algunos importantestemas de los sistemas complejos se manifiestan en laeconomıa.Partiendo de modelos esquematicos donde prima la inter-accion por sobre el comportamiento racional, se muestramediante algoritmos y simulaciones, la emergencia de pa-trones de escala macroscopica y la aparicion de fenomenoscrıticos.Este texto esta en estado de work in progress. Naciocomo serie de apuntes, que paulatinamente se han ido depu-rando a medida que dictabamos el curso de ”Topicos deRacionalidad Acotada” para la maestrıa en Economıa dela Universidad de San Andres. Es por ellos que debe-mos agradecer a todos los alumnos que nos permitieronmostrar mediante la discusion, el modelado y hasta experi-mentacion, que la economıa es un muy interesante sistemacomplejo que no debemos descuidar.

D. H.R. P.M. G. Z.

Modelos economicos de multiples agentes 23-06-2011

ii

Modelos economicos de multiples agentes 23-06-2011

Contenido

1 Introduccion 1

1.1 Mas es diferente 1

1.1.1 Hechos fısicoquımicos 2

1.1.2 Hechos biologicos 3

1.1.3 Hechos sociales 4

1.2 Sistemas complejos: propiedades y formas de exploracion 5

1.3 Estrategias de representacion en Economıa 8

1.4 Contenido del trabajo 12

Bibliografıa 16

2 Modelos computacionales 19

2.1 Introduccion 19

2.2 Automatas celulares 20

2.3 Variedades de dinamicas y complejidad algorıtmica 22

2.4 (*) Algoritmos, procedimientos efectivos y computabilidad 26

2.4.1 (*) Maquinas de Turing 27

2.4.2 (*) Computacion universal 28

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 30

2.5.1 El juego de la vida de Conway 30

2.5.2 Modelo de condensacion 31

2.5.3 El modelo de segregacion de Schelling 34

2.5.4 Un mercado inmobiliario 39

2.5.5 Dilema del Prisionero en Vecindarios 40

2.6 Conclusiones 43

Bibliografıa 45

iii

iv CONTENIDO

3 Modelos estadısticos 47

3.1 Las bases estadısticas 47

3.2 Entropıa, desorden e informacion 50

3.3 Principio de maxima entropıa 53

3.3.1 Distribuciones compatibles con un vınculo 55

3.3.2 Loterıas bilaterales y la distribucion de Gibbs 57

3.3.3 Intercambios bilaterales entre muchos jugadores 62

3.4 La hipotesis ergodica 64

3.5 Metodos de Monte Carlo 66

3.5.1 El muestreo de una distribucion P (x) 66

3.5.2 Algoritmo de Metropolis 68

3.5.3 Dinamica de Glauber o muestreo de Gibbs 68

3.5.4 Recocido simulado 68

3.5.5 El problema del viajante 71

3.6 El modelo de Ising 74

3.6.1 Transiciones en el modelos de Ising 76

3.6.2 Ejemplo numerico del modelo de Ising 77

Bibliografıa 81

4 Leyes de potencias 83

4.1 Distribuciones que siguen leyes de potencias 83

4.2 Casos de leyes de potencias 86

4.2.1 Mercados financieros y paseos al azar. 87

4.2.2 Fenomenos crıticos 95

4.2.3 Criticalidad Autoorganizada 101

Bibliografıa 105

5 Redes complejas, modas y cacerolazos 107

5.1 Introduccion 107

5.2 Que es una red y algunas definiciones generales 109

5.3 Redes aleatorias, mundos pequenos y redes libres de escala 112

5.3.1 Redes aleatorias 113

5.3.2 Mundos pequenos 114

5.3.3 Redes libres de escala: Preferential attachment 116

5.3.4 Robustez y vulnerabilidad 117

5.4 Modelos de contagio en ciencias sociales 117

5.4.1 Que es un contagio epidemiologico 118

5.4.2 SIS y el umbral crıtico de infeccion 119

5.4.3 Ejemplo numerico 120

Modelos economicos de multiples agentes 23-06-2011

CONTENIDO v

5.4.4 SIS con rewiring: redes adaptativas 123

5.4.5 SIS en redes libres de escala: Viruses informaticos 124

5.4.6 Modelos de umbrales locales: modas y revoluciones 125

Bibliografıa 129

6 Aprendizaje 131

6.1 Aprendizaje adaptativo en modelos economicos 131

6.2 Redes neuronales amorfas: Modelo de Hopfield 135

6.2.1 Ejemplo: Recuperacion de una imagen 141

6.3 Redes neuronales en capas 143

Bibliografıa 152

7 Evolucion, adaptacion y aprendizaje 155

7.1 Motivacion biologica de modelos evolutivos de adaptacion 155

7.1.1 Agentes complejos adaptivos 158

7.2 Algoritmos Geneticos 158

7.2.1 Implementacion computacional del AG 160

7.2.2 Ejemplo I: Aplicacion al “problema de la particion” 162

7.2.3 Ejemplo II: Optimizacion de un portafolio de inversiones 163

7.3 Modelos poblacionales: los individuos y el medio 165

7.3.1 Ejemplo poblacional (I): El juego de la minorıa 166

7.3.2 Ejemplo poblacional (II): El modelo del Bar de Brian Arthur 169

7.3.3 Derivacion del BAM: Un modelo de panico 173

7.4 Coadaptacion 178

7.5 El diseno de agentes complejos adaptivos: Los desafıos de la supervivencia 180

7.6 Asociacion y cooperacion 183

7.6.1 La Teorıa de la Cooperacion de Axelrod 183

7.6.2 Seleccion basada en la cooperacion 184

7.7 El aumento de la complejidad 186

Bibliografıa 192

8 Modelo de formacion de precios, comportamiento y experimentos 195

8.1 Introduccion 195

8.2 Juego de Bertrand-Edgeworth: construccion bottom-up 196

8.2.1 Precios Bertrand, inexistencia de Nash en estrategias puras 198

8.3 Competencia sin informacion 199

8.3.1 Heurıstica “Brutus” 199

8.3.2 Heurıstica “MaxBene” 200

8.3.3 Competencia entre modelos de formacion de precio 203

Modelos economicos de multiples agentes 23-06-2011

vi CONTENIDO

8.4 Experimentos 204

8.4.1 “Brutus” es una mejor aproximacion que “MaxBene” 205

8.4.2 Patrones generales de comportamiento 205

8.5 Conclusiones 207

Bibliografıa 208

Capıtulo 1 211

Capıtulo 2 212

Capıtulo 3 213

Capıtulo 4 213

Capıtulo 5 214

Capıtulo 6 215

Capıtulo 7 215

Capıtulo 8 216

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 1

Introduccion

Un sistema complejo, estimulado controladamentey observado bajo condiciones de laboratorio se

comporta como se le da la gana.(autor anonimo)

1.1 Mas es diferente

Partıculas que se agrupan en atomos y moleculas que se organizan para formar los objetosque nos rodean; moleculas que llevan instrucciones para fabricar otras que se combinan paraconformar organismos; organismos que funcionan interdependientemente en comunidades ysistemas ecologicos; personas vinculadas entre sı y con el entorno, de las multiples manerasque se manifiestan en la actividad cotidiana: los efectos observables de los fenomenos deorganizacion (y desorganizacion) de seres y cosas aparecen por donde se mire. (Anderson,1972) expreso el argumento de manera sucinta: “mas es diferente”, es decir que ciertossistemas formados por muchos elementos tienen propiedades derivadas de las caracterısticasde armado del conjunto, que son muy difıciles (en la practica, tal vez imposibles) de explicaro describir por agregacion de rasgos de sus componentes.

El analisis economico recurre a veces a la imagen de un Robinson Crusoe quien vive ytrabaja solo en su isla, y produce, consume y acumula bienes en contacto con la naturalezacircundante. El uso de esa alegorıa no deberıa hacer ignorar que cada agente economicoparticipa de una vasta red de relaciones e intercambios, a traves de contactos cercanos ydirectos con algunos individuos, y de modos que tal vez no perciba o imagine, con otros:basta con tratar de especificar el colectivo de personas que han participado del proceso por elcual un bien cualquiera se ha producido y ha llegado adonde esta. Ası las cosas, que algunosaspectos del funcionamiento economico puedan en algunas condiciones ser contempladoscomo si derivaran de la conducta de un “agente representativo” serıa una propiedad quedemanda explicacion, y cuidado en la exploracion de sus requisitos de validez.

Las ciencias sociales se ocupan de sistemas donde interactuan grupos de personascon sus percepciones, creencias y criterios de eleccion. Se trata ni mas ni menos que debuscar representaciones de fenomenos determinados por la actuacion de agentes cuyas ca-pacidades cognitivas son al menos comparables a las del investigador, en entornos (talescomo mercados, empresas, familias, ambitos de accion polıtica) que definen interdependen-cias potencialmente intrincadas entre las conductas individuales. En una situacıon ası, esde esperar que el trabajo analıtico recurra a simplificaciones a veces drasticas, y que seutilicen distintos enfoques, metodos u herramientas. Los problema que implica definir pro-cedimientos de abordaje analıtico adquieren rasgos particulares en contextos sociales, pero

1

2 1. Introduccion

tambien existen puntos en comun con los que surgen cuando se trata con fenomenos natu-rales. Esto abre un campo para dialogos concretos y productivos entre disciplinas. Mas alladel contenido algo difuso del termino, el trabajo en el area de “sistemas complejos” ofreceuna variedad de discusiones relevantes y de tecnicas utiles para emplear como referencia.

Uno de los factores clave del enorme avance que han tenido las ciencias de la natu-raleza ha sido la identificacion de “ladrillos basicos” a partir de los cuales se ”construyen”objetos mayores, y la elaboracion de hipotesis sobre los procesos observables a partir delcomportamiento de esas unidades elementales. La quımica dio un gran paso adelante cuandose individualizaron los elementos quımicos y se clasificaron sus propiedades. La biologıa ex-perimento un fuerte desarrollo cuando se reconocio que los seres vivos estan constituidospor celulas organizadas de distinta manera. La fısica tuvo un salto en su capacidad deexplicacion cuando reconocio la existencia de los atomos y pudo describir su estructura enterminos de partıculas mas elementales. La busqueda de interpretaciones para los fenomenosmacroscopicos asociados con el calor y la temperatura en base a movimientos de objetossegun la mecanica clasica condujo al surgimiento de la mecanica estadıstica, fructıfera enla generacion de resultados, y tambien de preguntas algunas de las cuales siguen abiertas.

La actitud reduccionista ha sido elevada a veces al rango de un principio universal.Un destacado fısico, Richard Feynmann, expreso alguna vez que si hubiera que elegir tansolo una frase para que futuras generaciones puedan reconstruir el conocimiento actual,esta deberıa manifestar que todo sistema fısico puede describirse por medio de atomos ysus interacciones.

Sin embargo, esa expresion de posibilidad, aunque fuera incontrovertible, no equivalea restringir el conjunto de teorıas potencialmente validas (dentro de un cierto rango deaplicacion) a aquellas que se deriven de una descripcion explıcita del comportamiento de laspartıculas que componen el sistema estudiado. Una cosa es sostener que todos los fenomenosse determinan por la operacion de procesos naturales regidos por las leyes basicas de la fısica.Otra cosa distinta serıa prescribir que solo son aceptables descripciones que den explıcitacuenta de esa determinacion. Un intento de implementar esa prescripcion en el propioambito de la fısica enfrentarıa dificultades insolubles.

Esta verdadera catastrofe de las multitudes es compartida por fenomenos de muydiversos campos. Algunas instancias se comentan a continuacion.

1.1.1 Hechos fısicoquımicos

El contraste entre lo singular y aislado, y lo plural y organizado, se manifiesta en unavariedad de instancias. Por ejemplo:

• En dinamica de fluidos se trabaja usualmente con ecuaciones fenomenologicas, quedescriben comportamientos a escala macroscopica, sin buscar representaciones basadasen los movimientos individuales de las partıculas componentes.

• Las interacciones electromagneticas poseen simetrıa esferica, o sea, no reconocen di-recciones privilegiadas en el espacio. Sin embargo, los atomos y moleculas complejas,que solo se mantienen unidas por fuerzas electromagneticas, no satisfacen esa simetrıa.

• La reduccion de la termodinamica a la mecanica clasica ha planteado difıciles interro-gantes sobre la irreversibilidad temporal de la evolucion de sistemas cuyos elementossiguen leyes temporalmente reversibles. Las ecuaciones diferenciales de la dinamicaque expresan el movimiento de los cuerpos en funcion de las fuerzas que se ejercen

Modelos economicos de multiples agentes 23-06-2011

1.1 Mas es diferente 3

sobre ellos son de segundo orden y, por consiguiente, invariantes frente a reversiontemporal (consistente en el cambio de t por −t). Esto significa que si se filmara, porejemplo, la colision de dos cuerpos perfectamente elasticos, como dos moleculas de ungas, no habrıa manera de reconocer si la pelıcula se proyecta tal como ha sido filmadao al reves, cambiando el curso del tiempo. No obstante, muchas moleculas que chocanentre sı a las leyes de Newton poseen una evolucion que es termodinamicamente ir-reversible, en la que la direccion del tiempo queda bien determinada. En las viejaspelıculas se veıan a veces secuencias como la de un automovil cuyos pedazos ”retroce-den” a alta velocidad de una pared, y se rearman, como si fuera espontaneamente,para formar el objeto entero. El efecto comico de proyectar ası la escena de la colisionen sentido inverso provenıa del contraste entre el hecho mostrado y la intuicion de queno podıa ser real.

• Uno de los problemas especialmente interesantes en la quımica organica es comprenderla conformacion y las propiedades de los polımeros en general, y de las proteınasen particular. Los polımeros son moleculas hechas como una cadena muy extensacuyos eslabones son la repeticion de pocos compuestos simples. Las proteınas sonpolımeros formados por no mas de veinte compuestos basicos llamados aminoacidos.Aminoacidos y proteınas actuan como bloques fundamentales en la constitucion de losorganismos vivos (el ADN, en particular, esta hecho de una larga secuencia de cuatroaminoacidos ordenados en forma de doble helice). Las proteınas se pliegan sobre sımismas adoptando configuraciones que determinan sus propiedades quımicas y, porconsiguiente, su operacion en funciones biologicas. Hasta donde se sabe, el procesode plegamiento involucra efectos del conjunto de las moleculas componentes, y no secomprende en terminos de relaciones aisladas entre las partes de la proteına.

1.1.2 Hechos biologicos

Al discutir las diferencias entre el “reduccionismo constitutivo” y el teorico en biologıa,(Mayr, 1999) senalo que los exitos de la biologıa molecular, impresionantes como son,no resultan aplicables automaticamente al conjunto de la disciplina, y que areas comola ecologıa requieren conceptos y formas de analisis especıficos. El argumento haceespecial referencia a la organizacion jerarquica de los sistemas vivientes (“del nucleocelular, a la celula, a los organos como el rinon o el hıgado, al individuo, a la especie,al ecosistema, a la sociedad”, op. cit., p. 14), que puede requerir una descripcion enel “nivel de la jerarquıa” que corresponda al problema especıfico bajo estudio. Ası,por caso:

• El cerebro es un organo conformado por neuronas interconectadas (cada una de lascuales posee una elaborada estructura interna), donde las partes se comunican medi-ante impulsos electricos y transmision de sustancias quımicas; de esa operacion surgenlas percepciones, sensaciones, ideas y conductas de las personas. Una neurona aisladapuede considerarse como un simple procesador de umbral, ya que tiene solo dos esta-dos, y se comporta como un interruptor que pasa de apagado a prendido, o viceversa,cuando un estımulo del medio, supera un cierto valor. Sin embargo, un conjuntogrande de neuronas pueden efectuar un procesamiento de la informacion sumamentecomplejo, como lo que implica reconocer un rostro, construir un mensaje o efectuar suanalisis semantico. Chomsky ha afirmado que “Quiza exista una ley fısica desconocidaque dice que si se ponen 1010 neuronas en un recipiente del tamano de una pelota debasquetbol, se obtiene la gramatica transformacional” (Chomsky, 1990)

Modelos economicos de multiples agentes 23-06-2011

4 1. Introduccion

• Los conjuntos de abejas de un panal o de hormigas de un hormiguero desplieganconductas con un alto nivel de organizacion, y realizan acciones cooperativas alta-mente eficaces, al punto que ha motivado el estudio de una llamada “inteligencia deenjambres” (Bonaneau, Theraulaz and Dorigo, 1999).

• La transicion entre lo singular y lo plural se presenta tambien de manera marcada enel estudio de sistemas ecologicos. Comprender los mecanismos por los que se formancomunidades de especies, y se determinan caracterısticas como su robustez o resilien-cia requiere explorar los procesos de agregacion involucrados, y la manera en que seconforman los diversos niveles de organziacion de los individuos que componen el sis-tema. La composicion de organismos simples para dar lugar a otros mas complejoses un tema central de los modernos enfoques de la teorıa de la evolucion que apun-tan a comprender y cuantificar la emergencia de complejidad en organismos vivos.Algunos estudios postulan la ocurrencia de ”transiciones evolutivas principales” rela-cionadas con, por ejemplo, el surgimiento de organismos pluricelulares en un mundosolo poblado por organismos unicelulares (Szathmry and Smith, 1995).

1.1.3 Hechos sociales

Las sociedades humanas funcionan como una red de interacciones interpersonales, cuyascaracterısticas y dinamica vienen dada por el conjunto interconectado de conductas in-dividuales. La “emergencia” de propiedades colectivas a partir del conjunto de accionesacopladas segun ciertos patrones de interrelacion es un tema que se tratara en diversoscontextos sociales a lo largo de este trabajo. Para mencionar algunos ejemplos de tipogeneral:

• Los efectos de organizacion derivados de contactos interpersonales surgen en una grandiversidad de situaciones en cuyo estudio pueden ser utiles tecnicas derivadas de lafısica estadıstica. Procesos de la relevancia de la evolucion del lenguaje o la dinamicade normas o patrones culturales pertenecen a este conjunto; tambien fenomenos amenor escala como los comportamientos de grupos que generan flujos de transito depeatones o vehıculos (Castellano, Fortunato and Loreto, 2009).

• La historia de las formas sociales muestra procesos de agregacion y organizacion por losque conjuntos de individuos conforman una partida de caza, se agrupan en una tribu,o constituyen sociedades con mas elaboradas divisiones de funciones y mecanismos degobierno. El problema analıtico que implica la comprension de estos desarrollos esrealtivamente sencillo de plantear, pero especialmente difıcil de abordar, por la ampliagama de comportamientos y mecanismos de interaccion potencialmente intervinientes.

• En sus orıgenes como disciplina, la Economıa ha reconocido como uno de sus temasprincipales el estudiar como se conforman, organizan y funcionan sistemas donde laproduccion se caracteriza por una amplia division del trabajo y, por consiguiente, ex-iste una vasta red de intercambios. Esto involucra estudiar situaciones donde, en loshechos, los agentes actuan de modo asincronico y descentralizado tomando decisionessobre la base de informacion incompleta y en respuesta a incentivos que muchas vecesson contrapuestos entre si, restringidos y orientados por instituciones (que definen reg-ularidades de comportamiento socialmente establecidas y generalmente verificadas),cuyo surgimiento es a veces espontaneo y otras resultado de un designio “desde ar-riba”. Las modalidades de coordinacion que operan en esos sistemas, sus propiedadesde homeostasis y, asociado con eso, los alcances y limitaciones de los mecanismos

Modelos economicos de multiples agentes 23-06-2011

1.2 Sistemas complejos: propiedades y formas de exploracion 5

capaces de amortiguar y corregir perturbaciones siguen planteando preguntas tantopara el analisis como para las polıticas economicas.

1.2 Sistemas complejos: propiedades y formas de exploracion

La problematica referida al estudio de conjuntos de partes interactuantes donde adquierenrelevancia efectos de organizacion ha sido agrupada bajo el rotulo de sistemas complejos.Una caracterıstica central de esos sistemas es que el acoplamiento de un numero de ele-mentos cuyo comportamiento individual responde a leyes sencillas puede generar variadosy complicados comportamientos “grupales”. Es decir que los sistemas exhiben rasgos ydinamicas distintos y propios segun la escala de observacion. Desde el punto de vista for-mal, esto se asocia con propiedades de no linealidad: conjuntos de mayor envergadura noconstituyen “ampliaciones proporcionales” de sus componentes. En el campo del analisiseconomico, la asociacion entre division del trabajo y tamano del mercado formulada porAdam Smith constituye una temprana expresion de tales no linealidades.

Los atributos posibles de los “sistemas complejos” escapan a una definicion simple yescueta. Sin embargo, como sugieren los ejemplos previamente comentados, pueden iden-tificarse algunas caracterısticas generales salientes, que de alguna manera identificarıan aesos sistemas

1. El todo es mas que las partes. Cuando el agregado es cualitativamente diferentede lo que son sus partes constitutivas se suele decir que el sistema posee propiedadesemergentes que son atribuibles a su nivel de organizacion interna.

2. Poseen multiples escalas de espacio y de tiempo. El comportamiento del agre-gado puede presentar rasgos de organizacion en una o varias escalas tanto espacialescomo temporales que, en principio, no tienen por que coincidir con las escalas detiempos o dominios espaciales propios de las partes que componen el sistema.

3. La variabilidad a pequena escala es compatible con constancia macroscopica.Los sistemas con muchos elementos pueden presentar caracterısticas agregadas maso menos estacionarias aunque los elementos individuales cambien de estado sin con-verger a situaciones de reposo. Es decir que la quietud de los componentes del sistemano es condicion necesaria para que persiste un “equilibrio dinamico” del conjunto.

4. Presentan una organizacion jerarquica. Los individuos o subconjuntos que com-ponen un sistema complejo suelen presentar capas sucesivas de organizacion, que aveces, conforman un ordenamiento de creciente complejidad. Por lo general, los indi-viduos de un dado nivel se asocian dando ası lugar a individuos de un nivel inmediatosuperior.

5. Contienen informacion. En un sistema de este tipo las partes se comunican dealgun modo entre sı y con el ambiente, lo cual genera la organizacion y la evoluciondel conjunto. Los componentes determinan su estado en funcion de lo que ocurre ensu entorno. Como la organizacion de los sistemas complejos puede cambiar con eltiempo a medida que el sistema evoluciona, se suele decir que poseen capacidad deprocesamiento; dicha capacidad es una propiedad emergente como las mencionadasen el primer punto.

6. Son capaces de adaptacion. La organizacion interna de los sistemas complejospuede cambiar, redefiniendose con el transcurso del tiempo. Se da ası lugar a unproceso de adaptacion o de “aprendizaje sistemico”.

Modelos economicos de multiples agentes 23-06-2011

6 1. Introduccion

7. Simplificacion de las componentes y de sus interacciones. En un sistemacomplejo, no todas las propiedades de sus componentes o de sus interacciones sereflejan en el comportamiento del conjunto. Ciertas propiedades emergentes respondensolo a ciertos caracteres estilizados de las partes que forman el sistema complejo. Estees una propiedad muy importante en el estudio de sistemas sociales, porque esta en labase de la posibilidad de estudiar caracterısticas relevantes de los comportamientos degrupos de agentes sin tener que enfocar el enorme repertorio de conductas potencialesde las personas que los integran.

8. Poseen mecanismos de regulacion a menudo antagonicos. En un sistema com-plejo por lo general estan presentes mecanismos antagonicos cuya accion conjunta o lomantienen en equilibrio, o lo llevan a el. La analogıa es mantener constante la temper-atura de una habitacion operando al mismo tiempo un equipo de refrigeracion y otrode calefaccion. En el sistema nervioso central, por ejemplo, existen neurotransmisoresque son tanto excitatorios como inhibitorios; en la evolucion biologica, las dinamicasde predador y presa generan “carreras adaptativas” reflejadas en fenomenos como eldesarrollo de capacidades crecientemente refinadas de mimetismo o de deteccion.

El estudio de las propiedades y dinamicas de sistemas complejos puede encararse devarias maneras. Una de ellas es la busqueda de regularidades fenomenologicas mas o menosrobustas que permitan, dentro de un cierto rango de validez, organizar una descripciondirectamente a escala macroscopica. Otra aproximacion posible es “de abajo hacia arriba”(bottom-up), tratando de comprender a la operacion del conjunto a partir de hechos, partese interacciones elementales, en el doble sentido de su escala reducida y simplicidad. Estoimplica un esfuerzo de “simplificacion estrategica”, de ignorar en el analisis rasgos que, a losefectos de la pregunta planteada, se pueden considerar como circunstanciales, y concentrarseen trazar vinculaciones funcionales y causales entre aspectos que se consideran esenciales. Elprocedimiento aquı es constructivo, porque se procura “armar” o “hacer crecer” al sistemaen base al comportamiento de partes o subsistemas mas simples que el conjunto. Ambosabordajes son complementarios. Las propiedades fenomenologicas que se identifiquen, almargen de su utilidad, tienen un caracter menos “fundamental” que aquellas que se derivanconstructivamente, lo cual puede hacer incierta su aplicabilidad practica por la falta debases para establecer su caracter mas limitado o mas general. Del otro lado, cuando lo queinteresa es entender como funciona un sistema como un todo, el analisis de sus partes einteracciones es por ultimo un instrumento para establecer confiablemente caracterısticasfenomenologicamente relevantes.

A lo largo de este trabajo exploraremos principalmente enfoques del segundo tipo.El planteo no comporta un reduccionismo ciego o incondicional. Es claro que las leyes quegobiernan distintas escalas jerarquicas de organizacion son diferentes, y eso puede implicar,como fuera mencionado, la irreversibilidad temporal de un conjunto de comportamientostemporalmente reversibles. Al mismo tiempo, el punto de arranque es la presuncion de quees posible entender caracterısticas de conjuntos de elementos como composicion de las partesaun cuando de estas solo se retengan muy pocos y muy estillizados rasgos para describirlos:de otro modo, el estudio de los efectos de composicion no resultarıa factible en la practica.Por consiguiente, las estrategias de modelizacion seran llevadas a hacer uso reiterado dela “navaja de Occam” construyendo modelos minimales en las que se desechan hipotesissuperfluas y se renuncia a dar cuenta de detalles, y donde los argumentos para agregarmas elementos y mas complicaciones deberıan sobrellevar la carga de la prueba para seraplicados. No obstante, las descripciones que se construyan deberan tener cierto grado derobustez frente a cambios o perturbaciones en el valor de los parametros de control del mod-elo o en sus hipotesis constitutivas, para que resulten efectivamente utilizables. El abordaje

Modelos economicos de multiples agentes 23-06-2011

1.2 Sistemas complejos: propiedades y formas de exploracion 7

podrıa sintetizarse en la proposicion: dada una propiedad emergente (un hecho que parececaracterizar de manera mas o menos general el comportamiento de un sistema compuestode partes), buscar una base microscopica simple (y en el lımite, minimal) suficiente paradar cuenta del fenomeno macroscopico observado.

Ası como es difıcil dar una definicion explıcita de los que se entiende por sistemascomplejos, tampoco se cuenta con una teorıa unica para estudiarlos y analizarlos. Sin em-bargo, existe un conjunto de metaforas, herramientas, y modos de analisis que ayudan adesarrollar modelos matematicos dirigidos a “acomodar las evidencias”, en la expresion deGalileo orginalmente referida al movimiento de los astros. Esto implica buscar, no tantouna descripcion literal o necesariamente basada en “primeros principios”, sino mas bienla elaboracion de un esquema analıtico que facilte una comprension de los mecanismos yrelaciones causales en juego y, al mismo tiempo, de cuenta de manera ordenada y, preferi-blemente cuantitativa, de los hechos observados, y pueda servir de base para elaboracionesulteriores.

Segun la celebre afirmacion de Galileo que marco la evolucion posterior del avancecientıfico, el libro de la naturaleza esta escrito en el lenguaje de la matematica. Por analogıa,si es que pudiera escribirse el libro de los sistemas complejos, su lenguaje serıa probable-mente el de la computacion (en conjunto con el lenguaje natural: por ultimo, ese es el medioque empleamos para introducir, interpretar y comentar modelos, y para llevar adelante dis-cusiones como esta) . Esto es debido al papel preponderante que posee la informacion tantoen la conformacion como en la evolucion de un sistema complejo: como imagen general,este se compone de procesadores, que “leen” las condiciones del entorno, y determinan suestado consecuentemente, lo que actualiza los datos relevantes para la conducta de otroselementos. Los modelos computacionales de multiples agentes se adaptan de manera bas-tante natural al estudio de ese tipo de dinamicas; se trata de esquemas ”constructivos” quebuscan generar conjuntos de elementos interactivos (o ”sociedades”) artificiales, en base apartes descriptas con un alto nivel de abstraccion y simplicidad, como aproximaciones de(aspectos de) sistemas reales. Desde el punto de vista de las ciencias computacionales, esosmodelos pertenecen al area de la Inteligencia Artificial Distribuida (Weiss, 1999), que hatenido en tiempos recientes un fuerte impulso excepcional por la disponibilidad de mediosde calculo con una potencia que muy poco tiempo atras era impensable.

El uso de estas tecnicas requiere atribuir a los agentes comportamientos y capacidadesde procesamiento que se formalizan como un programa de instrucciones (eventualmente, eseprograma puede incorporar procedimientos para modificar el programa que define conductasconcretas en funcion del estado del medio ambiente relevante). Cuando se trata de sistemassociales, esto implica aceptar que el procesamiento de informacion por parte de las personas,y la consecuente determinacion de una regla de decision puede ser representada como unalgoritmo, que resulta en la implementacion de una accion dentro de un elenco posiblementelimitado de alternativas. Se podıa objetar la limitacion que significa imponer conductasalgorıtmicas a los agentes. Sin embargo esta restriccion no impide en principio que elagente artificial tenga un comportamiento “sofisticado” (si es que el entorno lo permite oaconseja, y el analista es capaz de representarlo computacionalmente). En todo caso, esteno es el lugar para abordar la profunda pregunta sobre si un agente dotado de razon puedeo no ser representado fielmente por una computadora.

En la practica, toda representacion de un sistema complejo enfrenta decisiones sobrecuan intrincadas serıan los comportamientos y los entornos de interaccion que se trata deincorporar en un modelo. Es probable que a menudo se presenten disyuntivas entre com-plicar (o simplificar) las conductas elementales, por un lado, o el ambiente de interrelaciones,por otro, a efectos de hacer que el analisis resulte manejable, y de evitar la desmesurada

Modelos economicos de multiples agentes 23-06-2011

8 1. Introduccion

proliferacion de parametros, que puede dificultar considerablemente la interpretacion de losresultados y la extraccion de conclusiones. Mas que una cuestion de precepto, se trata deun problema referido a la efectividad de un conjunto de hipotesis para ayudar a la com-prension de preguntas especıficas respecto de determinados comportamientos individualesy colectivos. Como criterio aproximativo, parece conveniente intentar una lınea de avancede lo simple a lo mas complicado, y apoyar en lo posible las conductas supuestas para losagentes modelados sobre evidencia empırica o experimental.

En algunas instancias, los modelos de agentes multiples pueden tener solucion analıtica;en otras (la mayorıa), hace falta recurrir a simulaciones computacionales. En cualquier caso,por construccion, son sistemas dinamicos con alta dimensionalidad (dado que, directa o in-directamente, el estado de cada agente esta descripto por una funcion del vector de estadosprevios de los demas elementos) y, casi con seguridad, de caracter no lineal. Esto tieneconsecuencias apreciables sobre las propiedades del sistema y sobre la forma de sus posiblestrayectorias en el tiempo.

En las ciencias de la naturaleza, y en desarrollos formales en otras disciplinas, hasido usual hacer supuestos y aproximaciones que implican la validez del principio de su-perposicion, tal que que causas y efectos son proporcionales (o bien, efectos de causasindependientes se superponen de la misma manera que sus causas). En terminos de unarepresentacion matematica, eso implica que la suma de soluciones de las ecuaciones quedescriben la evolucion del sistema es tambien una solucion, lo que esta asociado a sistemaslineales de ecuaciones. Estas hipotesis limitan fuertemente el tipo cualitativo de dinamicasque pueden surgir de los modelos.

Al margen de la utilidad analıtica de las aproximaciones lineales, abundantementeempleadas en Economıa, los sistemas economicos parecen instancias donde el principiode superposicion tendrıa validez particularmente limitada. Por caso, en una vision desdelos extremos, los efectos de escala sobre las formas de organizacion, las posibilidades deproduccion y el comportamiento mismo de las personas surgen claramente si se contrasta elfuncionamiento de grupos de personas pequeos y aislados con sociedades numerosas. En otrocontexto, las fluctuaciones economicas, y las crisis, en especial, suelen mostrar transicionesbruscas, donde una acumulacion de impulsos dispara una subita respuesta caracterısticade la presencia de de efectos de umbral reflejados en fenomenos de distinto tipo, comoincumplimientos contractuales o quiebras, grandes modificaciones de polıtica economica(que, por su propia naturaleza, son eventos ”indivisibles”), o comportamientos de corridaen mercados financieros‡1.

1.3 Estrategias de representacion en Economıa

Visto con algun detalle, un sistema economico se presenta como una entidad practicamenteindescriptible, conformada por una enorme diversidad de bienes, agentes, relaciones y con-ductas. Para percibirlo bastarıa con detenerse a observar la variedad de objetos economicosque rodean a un habitante de una ciudad en un momento dado, y tratar de imaginar alconjunto de personas que participaron directa o indirectamente en el proceso de poner esascosas donde estan, y la trama de interacciones sociales de comportamientos que tuvieron lu-gar para que eso ocurra (o que operaron para que algo que “deberıa estar ahı” este faltando).El caracter aparentemente banal de lo cotidiano oscurece su complejidad.

Desde la perspectiva del analisis economico, habrıa insuperables dificultades para darcuenta de esta abrumadora abundancia y variedad de hechos y cosas. En contextos macroe-conomicos, es comun encontrar requerimientos por “microfundaciones” de los modelos que

Modelos economicos de multiples agentes 23-06-2011

1.3 Estrategias de representacion en Economıa 9

buscan representar la evolucion agregada. Mas alla del natural interes por que las teorıasse muestren compatibles con comportamientos individuales que “tengan sentido”, si esereclamo se interpreta literalmente, resultara de cumplimiento imposible. Es natural que serecurra a simplificaciones y atajos analıticos diversos (lo que incluye como una posibilidadentre otras a los modelos que usualmente se califican como microfundados); tambien loserıa reconocer que esos recortes de los problemas abordados facilitan el estudio de ciertaspreguntas, y limitan el de otras. Por lo tanto, no cabrıa esperar que un unico conjunto dehipotesis, tecnicas y procedimientos sea de aplicabilidad universal. La Economıa ha con-siderado un conjunto de alternativas, sin por ello agotar el menu de opciones abiertas paraexplorar (y explotar).

Durante un largo perıodo, la elaboracion de argumentos mediante razonamientos dis-cursivos, complementada con evidencia empırica de tipo cualitativo o por la identificacionde patrones en datos numericos (p.ej. subas y bajas indicativas de fluctuaciones), fue laforma principal de analisis y de exposicion. Esa clase de aproximacion es altamente versatil(y, de hecho, ha estado asociada con el estudio de fenomenos muy variados y con marcosteoricos bien diferentes), y permite incorporar matices y calificaciones, y discutir alcances,restricciones y posibles extensiones de los argumentos (aun cuando aquellos hayan sido elab-orados formalmente: se trata de sugerir “de que habla” un modelo, y no solo mostrar “loque dice”). La potencialidad de este modo de analisis se ha manifestado en una gran var-iedad de ricas y sofisticadas elaboraciones en materia de teorıa y de comprension de hechoseconomicos, algunas de las cuales han mantenido su pertinencia a pesar del paso del tiempo.Sin embargo, las contracaras de esa riqueza de posibilidades son la apertura de margenesde imprecision, y la dificultad para sostener una lınea argumental definida sin incurrir enambiguedades o, incluso, contradicciones. La calidad del razonamiento discursivo dependemucho del “arte” de quien lo practica, y los riesgos de imprecision se manifiestan incluso enla produccion de grandes figuras historicas: en parte, los debates inconclusos respecto de lainterpretacion de ciertas obras refleja el problema existente en especificar nıtidamente lasproposiciones que formula el texto.

Para ensayar una imagen: una discusion verbal de temas y fenomenos economicospuede generar un producto con abundante y pertinente “carne” analıtica, pero tal vezpresente debilidades en su “esqueleto” de estructura argumental. Los modelos donde primala formalizacion posiblemente tengan las caracterısticas opuestas; de ahı el potencial paraque existan complementariedades. En todo caso, el avance del grado de formalismo enel analisis economico ha sido una definida tendencia a lo largo de varias decadas. Sinpretension de exhaustividad, a los efectos de esta discusion, se pueden identificar algunasvariantes en cuanto al abordaje general en la elaboracion de modelos economicos.

Una posibilidad es construir esquemas a partir de ecuaciones de tipo fenomenologico,o basadas en patrones intuitivos de comportamiento. En el campo de la macroeconomıa,por ejemplo, un gran conjunto de modelos de esta clase fueron desarrollados en funcionde los argumentos de ingreso- gasto, incluyendo los clasicos casos de la “curva de 45” (enque el producto se determina por igualacion del volumen de ahorro, representado como unaproporcion fija del ingreso, y una inversion considerada exogena); o el sistema graficado enel diagrama IS-LM y sus extensiones. En esas instancias, las ecuaciones tienen subyacenteun argumento de “representatividad” de ciertas respuestas de comportamiento derivadas deconsideraciones de sentido comun (como ser: el ahorro varıa positivamente con el ingreso ynegativamente con la tasa de interes real, la demanda de dinero aumenta con el producto ydisminuye con la tasa de interes nominal), o de regularidades observadas (p.ej. los preciosnominales no parecen responder flexiblemente a excesos de demanda; como inferencia, enprimera aproximacon valdrıa considerar como dados al nivel general de precios y a las

Modelos economicos de multiples agentes 23-06-2011

10 1. Introduccion

expectativas sobre esa variable).

Esta forma de estudiar fenomenos colectivos pasa mas o menos rapidamente de unaracionalizacion aproximada de la conducta individual que (cuestiones de agregacion aparte)estarıa implıcita en las funciones del modelo a una descripcion macroscopica. El trabajoprincipal se realiza entonces en la escala propia de los fenomenos de interes (p.ej.: fluctua-ciones macroeconomicas). Pero, al margen de su practicidad (que se refleja en su utilizacionen muchos ejercicios aplicados de interpretacion de hechos economicos y en discusiones depolıtica), ese procedimiento de analisis deja abiertas preguntas basicas sobre la relevan-cia y la consistencia interna de las hipotesis implıcitas y sobre el rango de validez de lasconclusiones que se pueden obtener de su empleo.

La elaboracion de modelos formales derivados explıicitamente de hipotesis de com-portamiento (tıpicamente, la busqueda de un maximo de alguna funcion objetivo comola utilidad esperada, o mas recientemente, diversas variantes conductuales) ha tenido unafuerte expansion en las ultimas decadas. La formalizacion ha permitido precisar y aclararlos argumentos desarrollados, y facilitado la discusion de hipotesis y conclusiones, y el tra-bajo de construccion acumulativa a partir de contribuciones previas. Sin embargo, en elcamino se han marcado tambien limitaciones y, en ciertos casos, aun incongruencias, de esasformas de analisis, particularmente en su aplicacion al campo macroeconomico.

La teorıa de juegos ha desarrollado una muy sofisticada representacion de situacionesdonde los agentes actuan como si resolvieran problemas de optimizacion y donde las ex-pectativas y planes de los individuos terminan siendo compatibles entre sı: los estadosrelevantes serıan entonces equilibrios de Nash donde cada participante implementa estrate-gias que maximizan los pagos recibidos dadas las acciones que ejecutan los demas. Con esaaproximacion se pueden estudiar interacciones sociales de gran interes, y tambien generarproposiciones practicas para el diseno de polıticas e instituciones economicas. Sin embargo,a menudo la identificacion de planes optimos en los modelos se funda en refinados y sutilesrazonamientos de los agentes hipoteticos (es decir, del analista que trata de representarlos),que deciden a partir de conjeturas (finalmente validadas, aunque sea probabilısticamente)sobre las conductas de los demas, que tambien estan activos imaginando lo que otros pien-san y haran, y ası de seguido. Si encontrar el resultado de esos procesos mentales desafıageneralmente al experto constructor de modelos, se abre la pregunta sobre el potencial delesquema para describir al comportamiento de los agentes en la vida cotidiana. Las tensiones,logicas y practicas, resultantes de la auto- referencia de la argumentacion (el economistagenera y resuelve un problema de decision nuevo para la literatura, que supuestamente de-scribe lo que los individuos en la practica han venido haciendo todo el tiempo) se planteanen campos diversos del analisis economico.

Mientras que, por comprensibles razones, la modelizacion procede “recortando” esce-narios y focalizandose en una situacion especıfica, los agentes enfrentan muchas veces deci-siones en “simultaneo” en diversas interacciones (y, como en el refran infantil: “cada cualatiende su juego y el que no, una prenda tendra”). La teorıa de juegos explora representa-ciones de agentes muy sofisticados que operan en ambientes (con “reglas”) relativamentesencillos. La simplificacion de los entornos de decision resulta muy fuerte en los modelosmacroeconomicos basados en el esquema de equilibrio general intertemporal (usualmenteestocastico). Esos modelos dan por supuesta la coordinacion de planes de los agentes (cuyavalidez constituye uno de los principales interrogantes del analisis macroeconomico, si noel principal), a traves del mecanismo del subastador respecto de los mercados abiertos enel presente, y de la hipotesis de ”expectativas racionales” en cuanto a las decisiones en eltiempo. En el lımite, el conjunto de la economıa se representa como si fuera una ampliaciona escala de un individuo (el proverbial Robinson) interactuando con la naturaleza: todas

Modelos economicos de multiples agentes 23-06-2011

1.3 Estrategias de representacion en Economıa 11

las relaciones economicas interpersonales, presentes y esperadas, se tratan como un “velo”transparente. Aun ası, los problemas de decision que plantean y resuelven los modelos (yque, por construccion, serıan “como si” formulados y resueltos por los agentes) consistenen no triviales ejercicios de programacion dinamica estocastica.

Al margen de la diversidad y de la riqueza de la amplia literatura centrada de unamanera u otra en la representacion de las conductas como elecciones optimas mutuamenteconsistentes, sus hipotesis de partida limitan la generalidad de los resultados, porque desdeun principio restringen los recortes con fines analıticos de los problemas de decision de losagentes a aquellos que llevan a formulaciones de optimizacion resolubles (por el analista) yporque, al concentrarse exclusivamente en instancias de consistencia de planes, dejan fueradel campo de estudio a los procesos de co-adaptacion de las acciones de los individuos y,por lo tanto, a las preguntas acerca de la pertinencia de las condiciones de equilibrio. Esaslimitaciones surgen en contextos de diferente tipo, y serıan relevantes, por ejemplo, en elestudio de fenomenos como las fluctuaciones macroeconomicas de gran amplitud, donde noes adecuado postular sin mas una coherencia de acciones y expectativas que dejarıa de ladola eventualidad de fallas de coordinacon a gran escala (vease por ejemplo (Leijonhufvud,1981; Heymann, 2007)

La ampliacion del rango de las preguntas potencialmente abordables para el estudio,y de los fenomenos economicos considerados requerirıa entonces la busqueda de enfoquesy procedimientos alternativos. Una de las lıneas de investigacion recientes ha enfatizadoel estudio de los mecanismos de decision individual, a partir de la evidencia que pone encuestion la validez de la maximizacion de la utilidad esperada aun en contextos experi-mentales relativamente simples (vease por ejemplo (Kahneman and Tversky, 2000). La“economıa del comportamiento” ha encarado la busqueda de hipotesis que se adecuen aesa evidencia, considerando a veces el posible sustrato neurologico de las conductas (cf.(Camerer, 2003; Navarro, 2008); vease la discusion en (Gul and Pesendorfer, 2005). Los“modelos de multiples agentes”, por su parte, se enfocan en el estudio de sistemas cuyarepresentacion lleva a concentrarse principalmente en las formas de interaccion entre losagentes, mas alla de los detalles de las conductas individuales; es decir, situaciones dondela evolucion del sistema dependerıa sobre todo de la manera en que estan definidas lasrestricciones a las acciones de los individuos, y no tanto de la manera precisa en que ellosestos elegirıan entre las alternativas abiertas (una instancia polar serıa el de los modelosde mercado con “agentes de inteligencia cero”, al modo de (Gode and Sunder, 1993). Entodo caso, el enfasis sobre la especificacion de los mecanismos y procesos de interaccion (sinrestringir los entornos a aquellos que permitirı’an conductas explıcitamente optimizadoras)hace que, en general, los comportamientos individuales se modelen en base a heurısticaso procedimientos adaptativos relativamente simples, no necesariamente por una opcionmetodologica a priori, sino por los requerimientos del problema. De todos modos, la repre-sentacion de comportamientos “razonables” en entornos que no son fuertemente estiizadoses uno de los desafıos abiertos para los modelos multi- agentes; aquı, es posible que laspotenciales asociaciones con estudios de tipo experimental jueguen un papel importante.

El estudio de sistemas economicos y sociales con modelos computacionales de multiplesagentes (a veces descripto con la sigla “ACE”, Agent- Based Computational Economics),aunque bastante incipiente, ha tomado un volumen apreciable, y generado la produccion detextos y recopilaciones (por ejemplo, (BarYam, 2003; Epstein and Axtell, 1996; Aoki andYoshikawa, 2006; Lux and Marchesi, 2002), ası como relevamientos del campo (por ejemplo,Leijonhufvud, 200x, Tesfatsion, 200x, y el material contenido en www.econ.iastate/testatsi/ace).El presente trabajo busca extender y complementar a esos estudios mediante una discusionde procedimientos de analisis pertinentes para la construccion de modelos multi- agentes (lo

Modelos economicos de multiples agentes 23-06-2011

12 1. Introduccion

que, en variedad de casos, puede aprovechar complementariedades con esquemas y metodosde las ciencias naturales), y presentando un conjunto de aplicaciones especıficas al estudiode sistemas sociales, varias de las cuales resultan de trabajos realizados por los autores,mientras que otras provienen de la literatura.

1.4 Contenido del trabajo

Este texto es una derivacion de un curso de posgrado en Economıa que los autores hanvenido dictando por varios aos. Como tal, intenta ser de utilidad con propositos de enseanza.Al mismo tiempo, la materia con la que se trata tiene mas la naturaleza de una obra enproceso que de un cuerpo plenamente estructurado de productos y resultados. Por lo tanto,interesa poner de manifiesto el caracter activo, y en evolucion, del campo de estudio. Estose refleja principalmente en la inclusion de modelos economicos en vı’as de elaboracion porlos autores, y de ilustraciones basadas en trabajos realizados por estudiantes en el citadocurso. Por otra parte, la importancia que se le asigna a la implementacion concreta de ideasy metodos se manifiesta en la incorporacion al texto de codigos que expresan modelos enlenguaje computacional (MATLAB).

En un documento de este tipo, la exposicion puede proceder, sea a traves de undesarrollo de nociones y tecnicas generales, complementado por ejemplos de aplicacion alcampo economico y social, o bien mediante la definicion de areas y preguntas de interes,para las cuales se presentan modelos con metodos adaptados al caso, los que se describenen funcion de los requerimientos particulares del tema. Los primeros capıtulos del trabajosiguen el primero de esos criterios, a efectos de facilitar una presentacion ordenada, y abrirun panorama de imagenes, enfoques y tecnicas que han sido utilizadas en el estudio de sis-temas de elementos en interaccion, y que pueden resultar relevantes de manera mas o menosamplia para el trabajo en ciencias sociales, lo cual se ilustra con ejemplos seleccionados. Enlos capıtulos finales, en cambio, se procede de la manera alternativa, con una discusion dediversos modelos de multiples agentes aplicados a campos economicos especıficos.

Desde un punto de vista formal, las leyes de movimiento que rigen a una coleccion deagentes o elementos interactuantes pueden verse como derivaciones de un sistema dinamico,posiblemente de alta dimensionalidad, y eventualmente de naturaleza estocastica, en el cuallas variables de estado de cada parte individual dependen de la historia previa de algun sub-conjunto de componentes. Los rasgos propios de un sistema estarıan incorporadas en lasecuaciones que describen esos movimientos acoplados, y los patrones macroscopicos observ-ables en las soluciones conformarıan las propiedades emergentes que caracterizarıan a loscomportamientos colectivos. Esto orientarıa el estudio hacia una especificacion (necesari-amente simplificada) de las interacciones microscopicas relevantes, la identificacion de lasdinamicas que de ahı resultan (presumiblemente por metodos computacionales, por la difi-cultad para encontrar soluciones cerradas), y la busqueda de regularidades, cuantitativas ocualitativas, a la escala de bloques mas o menos grandes del sistema.

En el capıtulo 1 se adopta esa perspectiva, de una manera particular. Los automatascelulares son representaciones del comportamiento de sistemas formados por “celulas” (el-ementos localizados en un espacio) cuyos estados se determinan en funcion de la confor-macion pasada de su “vecindario”. La imagen es la de una “grilla” (de alguna dimension)de localidades, que va variando su configuracion (p.ej. lugares ocupados o no, activos oinactivos, si se trata de celdas con estados binarios) segun un algoritmo caracterıstico Losautomatas celulares muestran secuencias obtenidas del procesamiento de informacion (cadaelemento “mira a sus vecinos” y actualiza su estado) a traves de un programa (las re-glas de actualizacion: como se discute brevemente en ese capıtulo constituyen de hecho

Modelos economicos de multiples agentes 23-06-2011

1.4 Contenido del trabajo 13

un enfoque general de la computacion, y pueden generar dinamicas variadas y de diversosgrados de complejidad. En la practica, los modelos de automatas se prestan para la pre-sentacion grafica de las soluciones y su correspondiente interpretacion. En el capıtulo sediscuten varias aplicaciones, que ilustran como esos modelos permiten generar y visualizarpropiedades emergentes de sistemas en distintos contextos; uno de ellos es el analisis de lasegregacion residencial hecho por (Schelling, 1978), que represento un trabajo pionero en elestudio de temas economicos mediante algoritmos simples de interaccion de agentes.

Al margen de sus propiedades generales que hacen en principio a los automatas celu-lares capaces de implementar cualquier posible computacion, en los hechos, su aplicacionse refiere principalmente a problemas aptos para tratarse con representaciones de conjun-tos de elementos de mediano tamano: con muy pequenas escalas no se pueden observarpropiedades emergentes mientras que una descripcion explıcita del comportamiento de grancantidad de partes no resulta practicable. Por otro lado, en el estudio de ciertos fenomenos,aunque se parta de una representacion microscopica, resulta conveniente enfocar directa-mente la atencion sobre rasgos a mayor tamano de escala, asociados con distribuciones devariables individuales. En el capıtulo 3 se emplea un enfoque complementario al de lossistemas dinamicos de base microscpica, el de los modelos estadısticos, de larga y fructıferatradicion en las ciencias naturales para el estudio de fenomenos determinados por dinamicasde multitudes de objetos.

Un determinado estado macroscopico de un sistema no necesariamente se correspondecon una unica configuraci’on de sus elementos. En cambio, serıa de esperar que, cuandohay una gran cantidad de componentes, muchos “microestados” sean compatibles con cier-tas caracterısticas “agregadas”, y que estas reflejen una suerte de promedio de situacioneso comportamientos individuales. Esto valdrıa para sistemas de diferente naturaleza. Enel campo de la fısica, el punto surgio de manera saliente en el estudio de fenomenos ter-modinamicos (asociados con variables como el calor y la temperatura, y con aparatos comolos motores a vapor o de combustion), que se refieren a las propiedades emergentes de sis-temas formados por numerosas partıculas, cuyos movimientos individuales estan regidos porlas leyes de la mecanica.

La disciplina de la mecanica estadıstica, desarrollada para aportar una “microfun-dacion” mecanica a las leyes fenomenologicas de la termodinamica, se basa en una inter-pretacion de esas leyes como derivacion de las distribuciones de probabilidad de los estadosde conjuntos de partıculas. Esta implcito que se deja de lado la pretension de describir loscomportamientos de elementos individuales, y que (aun cuando las leyes subyacentes seandeterministas), se trata de considerar estocasticamente las maneras en que pueden config-urar multitudes de componentes, y de aprovechar las “propiedades de grandes numeros”para trabajar con valores de variables promediadas sobre grandes coinjuntos de partıculas.Un aspecto destacado de esta teorıa es la nocion del “principio de maxima entropıa” comomanifestacion de la altısima probabilidad de estados “desordenados” (p.ej. hay enormecantidad de permutaciones tales que las partıculas de un gas se encuentran distribuidasuniformemente en un recipiente, y pocas formas de que esten arrinconadas, de forma queesto ultimo no ocurrirıa en la practica). Esta formulacion fue trasladada al campo de lateorıa de la informacion; el concepto de entropıa ası definido ha sido usado con frecuenciaen las ciencias sociales.

En el capıtulo 3 se presenta una rapida introduccion de conceptos y modelos es-tadısticos originados en la fısica; reconociendo los riesgos de traslaciones automaticas entredisciplinas (marcados en su momento por autores como (Samuelson, 1960), esas construc-ciones teoricas ofrecen instrumentos y metaforas potencialmente utiles para el estudio detemas sociales (vease, por ejemplo: (Smith and Foley, 2008; Castellano et al., 2009). Uno

Modelos economicos de multiples agentes 23-06-2011

14 1. Introduccion

de los temas de los modelos estadısticos es el surgimiento de algun tipo de orden a partirde “encuentros” aleatorios de elementos de un sistema; en el texto se muestra una apli-cacion economica, dada por la evolucion de una distribucion de riqueza entre agentes querealizan secuencias de intercambios bilaterales con contrapartes definidos al azar. Por otrolado, dado que las leyes termodinamicas tienen asociados problemas de maximizacion ominimizacion (mınima energıa, maxima entropıa) los esquemas originados en la mecanicaestadıstica tienen potencial utilidad como metodos para resolver optimizaciones, o para de-scribir comportamientos de agentes en ciertos entornos. En ese capıtulo se comentan dosde estas instancias (las dinamicas de Glauber y el “recocido simulado”), que incorporan lanocion de temperatura como una medida de variabilidad aleatoria (“ruido termico”), capazde desdibujar lo que serıa un movimiento en la direccion preferida (gradiente de satisfaccion,por ası decirlo). En un contexto de aprendizaje, o de busqueda de una accion de maximarecompensa, esa temperatura puede verse sea como un indicador del grado de imperfeccionde las conductas, sea como un parametro susceptible de ser calibrado para permitir que laexploracion del espacio de posibilidades no se restrinja a una region pequena (lo cual elim-inarıa el potencial de oportunidades “lejanas”), y al mismo tiempo sea apta para explotarlas mejoras “locales” disponibles.

Entre los modelos canonicos de la fısica estadstica esta el que trata de explicarfenomenos del magnetismo como aquel por el cual ciertos objetos se comportan como imanesa baja temperatura, y pierden mas o menos abruptamente esa propiedad cuando se loscalienta por encima de una temperatura caracterıstica. Este es un caso saliente de feomenocrıtico, donde ciertos rasgos macroscopicos de un sistema se modifican drasticamente cuandoun parametro de control atraviesa un valor crıtico particular. En el modelo originalmentepropuesto por Ising, el objeto potencialmente imantado se describe como un conjunto de“imanes elementales” ubicados en el espacio, cuya orientacion (hacia ”arriba o abajo”) sedetermina segun el estado de sus vecinos. Esta es una ilustracion de situaciones donde unsistema se representa microscopicamente (aquı, mediante un automata celular), pero cuyaspropiedades se estudian observando rasgos estadısticos de grandes conjuntos de elementos.Al margen de su interes desde estos puntos de vista, el modelo de Ising ha inspirado apli-caciones en ciencias sociales, referidas por ejemplo a dinamicas de opinion, algunas de lascuales se comentan brevemente en el capıtulo 3.

En los sistemas que se encuentran cerca de un estado crıtico (del tipo del mencionadoen el parrafo anterior), las distribuciones de probabilidad de variables relevantes (como ladel tamano de grupos adyacentes de imanes elementales de igual orientacion en el modelode ferromagnetismo de Ising) obedecen a leyes de potencia. Es decir que, en el rangode los “eventos de gran magnitud”, la probabilidad decae como una potencia del valorde la variable, no tan rapido como la caıda exponencial que muestra una normal. Lasdistribuciones de potencias aparecen en situaciones diversas, y han sido identificadas ennumerosas instancias, tanto en fenomenos naturales (intensidades de terremotos, avalanchasen pilas de arena, por ejemplo) como sociales (como poblaciones de ciudades, tamano defirmas, o conectividad de nodos en Internet). Por eso, merecen una atencion particular.

El capıtulo 4 esta destinado a indicar propiedades de las leyes de potencia, comentarcondiciones que llevan a su surgimiento y discutir instancias sociales donde serıan aplicables.Al respecto, se presentan ilustraciones basadas en dos analisis referidos a temas economicos:uno (Axtell, 1999) que estudia con un esquema multi- agente relativamente sencillo ladinamica de tamanos de empresas y busca reproducir la distribucion segun una ley depotencia, y otro (Bak, Chen, Scheinkman and Woodford, 1993), que utiliza la nocion de“criticalidad auto- organizada” (que se asocia con la alegorıa de la pila de arena) en unmodelo de una cadena de insumo-producto. Por otra parte, en el capıtulo se considera

Modelos economicos de multiples agentes 23-06-2011

1.4 Contenido del trabajo 15

tambien el empleo de las distribuciones de potencia para describir comportamientos deprecios de activos, una cuestion que ha sido tratada particularmente en trabajos del campode la “econofısica”.

La imagen de las interacciones sociales configurando redes ha tomado prominencia,no solo en el ambito de la investigacion, sino tambien en los medios y en la converscioncotidiana. De hecho, los esquemas basados en la teorıa de grafos (que se remonta a Euler)y en los trabajos recientes sobre redes complejas apuntan como instrumentos de apreciablepotencial. El capıtulo 5 aborda el tema. Ahı se presentan propiedades de distintos tipos degrafos, como las redes aleatorias, las redes libres de escala (asociadas con leyes de potenciadel grado de vinculacion de los nodos) y los ”pequenos mundos” (que pueden dan lugar aefectos como el de ”seis grados de separacion” entre dos personas cualquiera, motivo de unapelıcula de ese nombre). Esa exposicion sirve de punto de partida para una discusion demodelos sociales de contagio y propagacion (virus informaticos, modas, cacerolazos, conduc-tas de cooperacion o defeccion. El analisis de redes, por otra parte, ha sido crecientementeutilizado para estudiar la resiliencia o fragilidad de sistemas interconectados, como Internet,redes de transmision electrica, o cadenas de credito. Las aplicaciones financieras han tenidoimpulso en los ultimos anos. En el capıitulo se comentan algunos ejemplos.

La teorıa biologica de la evolucion ofrece un poderoso marco general para estudiardinamicas de poblaciones de individuos interactuantes, potencialmente sujetos a modifi-cacion en sus caracterısticas o comportamientos, y cuya supervivencia o reproduccon de-pende de su desempeno definido de alguna manera. El potencial para analogıas y aplica-ciones sociales surge mas o menos directamente; los ensayos en ese sentido son de larga data(a veces con resultados poco felices, como en las versiones ideologicas de Darwinismo social).Asimismo, la metafora evolutiva o adaptativa, se presta tambien para analizar procesos deaprendizaje individual, en los que un agente busca mejorar la manera en que determina susacciones o expectativas.

En el capıtulo 7 se trata sobre modelos de adaptacion y aprendizaje. En el subcapıtuloinicial se lleva a cabo una breve discusi’on acerca del diseno de agentes complejos adapta-tivos, donde aparece el conflicto entre, por un lado, los “beneficios de la cooperacion” paracolectividades de entes que pueden aprovechar complementariedades y, por otro, la aparicionde parasitos que drenan recursos de esos conjuntos. Asimismo, se estudia la emergencia desistemas con respuestas flexibles, como compromisos entre la capacidad para aprovecharplenamente rasgos bien adaptados al entorno vigente, y la posibilidad de reaccionar a cam-bios.

En la segunda parte del capıtulo se discuten diferentes modelos de aprendizaje al-gorıtmico. Se comienza por los modelos de ındole adaptativa mas usuales en Economıa,basados en la revision de parametros de funciones de formacion de expectivas de acuerdocon los errores registrados en las proyecciones. Luego, se consideran modelos de inspiracionmas cercanamente biologica. La seccion destinada a las redes neuronales permite una ex-cursion para tratar sobre representaciones del comportamiento inspiradas en rasgos delfuncionamiento cerebral y que, en su aplicacion a problemas como el del reconocimiento depatrones, aprovecha no linealidades incorporadas por construccion. Por su parte, los esque-mas de algorimos geneticos que se discuten luego parten de la imagen de una ”competenciaevolutiva” de diferentes reglas de decision de un agente. Vista como tecnica de busquedade conductas que ”maximicen aptitud”, estos modelos han sido utilizados en aplicacioneseconomicas de diferente tipo. En el texto se tratan varias instancias en situaciones de co-adaptacion de conductas, como el “juego de la minorıa” (un conjunto de agentes buscaelegir la accion que es poco comun entre los participantes), un problema de coordinacion(variante del conocido modelo de (Arthur, 1994), sobre patrones de concurrencia al Bar ”El

Modelos economicos de multiples agentes 23-06-2011

16 NOTAS

Farol”), y un juego de formacion de precios.

El capıtulo 8 esta destinado a un modelo economico especıfico (elaborado por losautores junto con Enrique Kawamura) que trata de combinar una modelizacion algorıtmicade agentes multiples con experimentos de laboratorio, a fin de buscar regularidades decomportamiento que puedan servir de base para describir a los ”agentes artificiales” en lassimulaciones y permitir una comparacion de los patrones observadas en estas con las quesurgen de la interaccion de personas en un juego en tiempo real. En este caso, el modelose enfoca sobre mercados donde un conjunto de firmas sujetas a restricciones de capacidadcompiten mediante fijacion de precios (por un perıodo), y enfrentan a demandantes que (enel ejemplo aquı) no incurren en costos de busqueda. Los resultados que se muestran en esecapıtulo ilustran acerca de la evolucion de heurısticas que definen conductas individuales encontextos de interaccion, y sobre rasgos de organizacion del sistema (como la posibilidad deevolucion regular de agregados junto con mucha variabilidad individual); tambıen sugierencomplementariedades de interes entre simulaciones y experimentos.

Por su parte, el capıtulo ?? comenta algunas aplicaciones de modelos de agentesmultiples al campo de la Macroeconomıa, y discute oportunidades y posibles restriccionespara el desarrollo de modelos en este campo. Algunas conclusiones y comentarios sobrelıneas de investigacion abiertas se incluyen en el capıtulo ??.

Notas

‡1 Un ejemplo de los efectos profundos que puede tener la presencia de terminos no lineales en la dinamicade un sistema puede apreciarse en el sencillo problema del crecimiento de una poblacion. Sea P (t) la lacantidad de miembros de algun grupo en el momento t. Una ley de crecimiento lineal presupone que lapoblacion en un momento posterior es proporcional a la poblacion en el instante previo: P (t+ 1) = λP (t).Una fincion de este tipo da por resultado una misma familia de leyes exponenciales de aumento (λ > 1) odisminucion (λ < 1) a partir de una poblacion inicial Po; o sea P (t) = (λ)tPo.

Las no linealidades pueden surgir cuando, por ejemplo, existe una limitacion en el acceso a recursosalimenticios. Si se supone que el ambiente solo sustenta a una poblacion maxima (que se puede normalizar a1), una ley de crecmiento no lineal que contemple este hecho puede escribirse como P (t+1) = λP (t)(1−P (t)).En ella se corrige la ley lineal suponiendo que, si el grupo es muy numeroso se agotarıan los recursos, y lapoblacion se reducirıa. Con esta modificacion, el comportamiento del sistema puede alterarse en formamarcada: para, distintos valores de λ, las formas de las dinamicas posibles no se reestringen ya a aumentos ocaıdas exponenciales, sino que presentan una diversidad grande de potenciales comportamientos, que abarcanla desaparicion de la poblacion, su estabilizacion en ciertos valores, oscilaciones sostenidas, o secuencias“caoticas” con fluctuaciones aperiodicas. Este caso simple ilustra acerca de la diversidad de potencialesevoluciones de sistemas no lineales, como serıan los multiagentes.

Bibliografıa

Anderson, P.: 1972, More is different, Science 177(4047), 393–396.

Aoki, M. and Yoshikawa, H.: 2006, Reconstructing Macroeconomics. A perspective from Sta-tistical Physics and Combinatorial Stochastic Processes, Cambridge University Press,Cambridge.

Arthur, W. B.: 1994, Complexity in economic theory: Inductive reasoning and boundedrationality, AEA Papers and Proceedings 84, 406–411.

Axtell, R.: 1999, The emergence of firms in a population of agents: Local increasing returns,unstable nash equilibria, and power law size distributions. Brookings Institute preprintNo. 3.

Modelos economicos de multiples agentes 23-06-2011

1.4 Bibliografıa 17

Figura 1.1: Evolucion lineal y no lineal de una poblacion. El crecimientoo disminucion de la poblacion segun una ley lineal es siempre exponencial.La inclusion de terminos no lineales puede dar lugar a leyes de movimientode naturaleza muy diversa.

Bak, P., Chen, K., Scheinkman, J. A. and Woodford, M.: 1993, Aggregate fuctuations fromindependent sectoral shock: Self-organized criticality in a model of production andinventory dynamics, Ricerche Economiche 47, 3–30.

BarYam, Y.: 2003, Dynamics of Complex Systems (Studies in Nonlinearity), Westview,Boulder.

Bonaneau, E., Theraulaz, G. and Dorigo, M.: 1999, Swarm Intelligence: From Natural toArtificial Systems, Santa Fe Institute Studies in the Sciences of Complexity, OxfordUniversity Press.

Camerer, C.: 2003, Behavioral game theory: Experiments on strategic interaction., Prince-ton University Press.

Castellano, C., Fortunato, S. and Loreto, V.: 2009, Statistical physics of social dynamics,Rev. Modern Physics 81(2), 591–646.

Chomsky, N.: 1990, Modular Approaches to the Study of the Mind, San Diego State Uni-versity, San Diego, USA.

Epstein, J. and Axtell, R.: 1996, Growing Artificial Societies: Social Science from theBottom Up, Brookings, Washington.

Gode, D. K. and Sunder, S.: 1993, Allocative efficiency of markets with zero intelligencetraders: Market as a partial substitute for individual rationality, Journal of PoliticalEconomy 101, 119–137.

Modelos economicos de multiples agentes 23-06-2011

18 NOTAS

Gul, F. and Pesendorfer, W.: 2005, The case for mindless economics. Princeton UniversityWorking Paper.

Heymann, D.: 2007, Desarrollos y alternativas: Algunas perspectivas del anlisis macroe-conmico, in D. Heymann (ed.), Progresos en Macroeconomıa, Editorial Temas.

Kahneman, D. and Tversky, A.: 2000, Choices, Values and Frames, Cambridge UniversityPress, Cambridge. (ed.).

Leijonhufvud, A.: 1981, Information and coordination: Essays in macroeconomic theory,Oxford University Press.

Lux, T. and Marchesi, M.: 2002, Special issue on heterogeneous interacting agents in financemarkets, Journal of Economic Behavior and Organization .

Mayr, E.: 1999, Towards a New Philosophy of Biology: Observations of an Evolutionist,The Belknap Press of Harvard University Press, Cambridge, UK.

Navarro, A.: 2008, Economıa, biologıa y evolucion. Conferencia Presidencial, AsociacionArgentina de Economıa Polıtica.

Samuelson, P. A.: 1960, Structure of a minimum equilibrium system, in R. W. Pfouts (ed.),Essays in Economics and Econometrics: A Volume in Honor of Harold Hotelling,University of North Carolina Press.

Schelling, T. C.: 1978, Micromotives and Macrobehavior, W. W. Norton & Company.

Smith, E. and Foley, D.: 2008, Classical thermodynamics and economic general equilibriumtheory, Journal of Economic Dynamics and Control 32, 7–65.

Szathmry, E. and Smith, J. M.: 1995, The major evolutionary transitions, Nature 374, 227–231.

Weiss, G.: 1999, Multiagent Systems. A Modern Approach to Distributed Artifical Intelli-gence, The MIT Press.

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 2

Modelos computacionales

2.1 Introduccion

El uso de metodos y herramientas computacionales en el campo de la Economıa se ha ex-tendido considerablemente (vease por ejemplo Judd, 1998, Kendry, Mercado y Amman,2005). Naturalmente, la continua ampliacion de la oferta de capacidad de procesamiento deinformacion ha permitido, desde el punto de vista del trabajo empırico, manejar mayoresmasas de datos mediante procedimientos mas sofisticados y, en la perspectiva analıtica, haabierto posibilidades de abordar problemas que no podıan atacarse con tecnicas dirigidasa buscar soluciones cerradas. El desarrollo de modelos cada vez mas complicados basadosen el empleo de crecientes potencias de calculo no carece de aristas problematicas, sobretodo cuando esos modelos buscan describir el comportamiento individual de los agentes:la presuncion implıcita es que la sofisticacion de estos va paralela a la del analista (asis-tido de su equipo de computo), lo que no resulta de por sı evidente. De todos modos,sea como fuera la manera en que se aborde la cuestion de la auto-referencia (el modelointenta interpretar como los agentes actuarıan en el contexto del modelo), el avance de lasrepresentaciones computacionales es un proceso que probablemente seguira una rapida ten-dencia. Este capıtulo enfoca de una manera algo distinta a los procedimientos algorıtmicosde computo: no tanto como instrumentos de resolucion de problemas, sino como potencialesgeneradores de representaciones analogas de los sistemas bajo estudio: de un modo u otro,estos se comportan y evolucionan a traves del procesamiento de informacion.

Los automatas celulares, cuyas propiedades basicas se discuten aquı, ofrecen un marcogeneral para describir y analizar la dinamica de sistemas donde las partes actualizan suestado en funcion de las condiciones de su entorno. Los modelos de automatas celularespermiten representaciones “atomistas” de los comportamientos interactivos, tıpicamente atraves de algoritmos asociados con heurısticas simples. Asimismo, es posible estudiar de esemodo dinamicas transicionales de los sistemas, sin limitarse a las propiedades de los estadosestacionarios.

En terminos formales, todo proceso computacional puede ser expresado en el lenguajede los automatas celulares. Como instrumento practico, esos esquemas son especialmenteaptos para estudiar interacciones de elementos en un contexto “espacial”. En el capıtulose comentan varias instancias de aplicaciones. La primera de ellas (referida al conocidomodelo del “juego de la vida”) ilustra como emergen patrones y dinamicas muy diversos yvariados a partir de la interaccion de comportamientos gobernados por reglas simples. Otraaplicacion, tomada del campo de la fısica, describe fenomenos de condensacion (formacionde gotas lıquidas a partir de vapor); un interes especial del modelo es que muestra un caso

19

20 2. Modelos computacionales

donde el sistema experimenta una transformacion importante (un “cambio de fase”) cuandoun parametro (aquı, la proporcion de elenentos que estan inicialmente en estado lıquido)atraviesa un valor crıtico. Posteriormente, se comenta el analisis de Schelling acerca dela segregacion etnica por barrios de residencia, un modelo pionero en la representacion demultiples agentes en Economıa, junto con algunas extensiones. La ultima seccion muestrauna aplicacion de los automatas celulares al estudio de comportamientos de oportunismo ocooperacion (aquı, en contextos de juegos de dilemas de prisionero), un tema general quese retoma en el capıtulo 6.

2.2 Automatas celulares

La historia de los automatas celulares se origina en los anos 1940, a partir del interes deJohn Von Neumann por el problema de la auto-replicacion de los sistema biologicos, ysu proyecto de disenar una maquina que tuviera la capacidad de generar otras maquinassimilares a ella misma‡1.

Se aprecia la naturaleza del problema, que tiene analogıas en el campo de la economıa:una “escala de representacion” muy grande esconde los efectos de organizacion y emergenciade comportamientos colectivos que se busca estudiar, mientras que una escala muy pequenatambien hace perder de vista esos efectos en una marana de detalles “microscopicos” irrel-evantes. En la ocasion, Stanislaw Ulam, un matematico colega de von Neumann, le sugirioque intentara utilizar esquemas mas abstractos como la algorıtmica y la entonces incipienteteorıa de la computacion, que Ulam habıa empleado de modo pionero en simulaciones delcrecimiento de cristales. Sobre estas ideas se baso el desarrollo de los automatas celulares.

Los modelos computacionales de multiples agentes suponen que cada elemento sepuede representar como un objeto capaz de procesar informacion. En las teorıas de lacomputacion, esos objetos pueden idealizarse usando el concepto de automata finito.

Definicion 1 (Automata finito) Un automata finito recibe informacion y produce re-spuestas. Esta definido por dos listas, cuya riqueza determina la capacidad de procesamientodel dispositivo:

Si : Este conjunto reune los posibles estados internos de la maquina.

Ti,j : Los elementos del conjunto indican las transiciones posibles entre dos estados delautomata. La transicion Ti,j(J) del estado interno Si al estado interno Sj esta deter-minado por la informacion J que recibe el automata

Los automatas celulares (AC) describen e implementan procesos de computacion enbase a la nocion de automata finito que definimos arriba, de un modo distinto, pero equiv-alente, al desarrollo de Turing que sento las bases de la teorıa de la computabilidad, y quese comenta brevemente en la seccion 1.4.

Definicion 2 (Automata Celular) Un automata celular (AC) consiste en un

• Un conjunto N de celulas (agentes) o automatas finitos. Se suele identificar a losestados internos de cada celula con las letras Si de un alfabeto A; (Si ∈ A)

• Cada celula se supone conectada a n (con n < N) otras celulas del automata y recibela informacion de los estados en que se encuentran. Para ello el arreglo de N celulasdebe tener definida un sistema de vecindades.

Modelos economicos de multiples agentes 23-06-2011

2.2 Automatas celulares 21

• Cada celula cambia su estado interno dependiendo del estado en que se encuentranlos vecinos a los que se encuentra conectadas. La regla que define el cambio de estadode una celula es fija a lo largo de la evolucion del automata. La transicion de lasN celulas del automata puede ser sincronica (todas cambian de estado en un mismoinstante de tiempo) o asincronica (los N automatas cambian de estado en momentosdiferentes).

A diferencia del modelo de Turing donde un programa determina como un todo elcomputo a realizar, la imagen asociada con el esquema de von Neumann es la de un proce-samiento que esta distribuıdo entre las N celulas del automata. Dada la configuracon departida que establece el estado inicial de los elementos del automata, este evoluciona medi-ante el “comportamiento” de las celulas, segun reglas que utilizan informacion del entornorelevante y la procesan para determinar la actualizacion del estado. La alusion al caracter“celular” de los automatas refleja el objetivo original de von Neumann de emular a lostejidos vivos. Sin embargo, es posible percibir una estrecha correspondencia con las interac-ciones sociales, donde cada individuo reacciona a la informacion provista por las actitudesy acciones de los agentes con quienes se encuentra en contacto.

A los efectos de una modelizacion, la vecindad entre agentes puede asociarse con unavecindad fısica y estar determinada por la efectiva proximidad espacial. Las conexionesentre celulas pueden tambien representar relaciones funcionales, como las que por ejemplose establecen en contextos economicos a traves de intercambios o contratos entre agentes enlas que se definen precios y transacciones que determinan la evolucion del sistema. Desdeesta perspectiva, en una terminologıa de uso difundido, las dinamicas sociales serıan unamanifestacion de una inteligencia artificial distribuida.

Mas formalmente, la dinamica de los automatas celulares viene definida por la especi-ficacion de sus estados y por sus reglasa de evolucion:

Definicion 3 (Estados) Los estados Ek del AC estan definidos por el estado de todas suscelulas.

Ek ≡ S1, S2, . . . , SN (2.1)

Es usual que el alfabeto con que se simbolizan de los estados internos de cada celula seasimplemente A ≡ 0, 1, en cuyo caso los estados Ek pueden ser representados por palabrasde N bits.

Definicion 4 (Evolucion) La evolucion de un AC esta determinada por la sucesion deestados del AC a lo largo del tiempo:

E1 → E2 → · · · → Et → Et+1 → . . . (2.2)

Se suele representar un AC disponiendo sus celulas en una grilla de una, dos o masdimensiones. La evolucion de los automatas unidimensionales se representa facilmente ubi-cando sucesivos instantes de tiempo en renglones consecutivos, de manera que la secuen-cia de estados se observa verticalmente. Cuando las vecindades de cada celula tienen latopologıa de los numeros naturales se suele aludir a un automata ordenado. Puede tambiendefinirse un automata con vecindades que no siguen un patron definido, en cuyo caso sesuele decir que se trata de un automata desordenado (ver fig. 1.1). A au vez, las reglasde actualizacion de estados pueden ser deterministas o aleatorias. Una clase especial deesas reglas es de tipo “totalıstico”, en que el estado de cada sitio (indicado por un numero

Modelos economicos de multiples agentes 23-06-2011

22 2. Modelos computacionales

natural) es funcion de la suma de los estados de us vecinos. Para el caso de un AC unidi-mensional ordenada con vecindarios dados por las celdas adyacente a un lado y otro, unaregla ası vendrıa dada por:

Si(t+ 1) = f(X(t)) ; X(t) =j=+2∑j=−2

Si+j(t) (2.3)

Figura 2.1: Automata unidimensional. Se indican las vecindades quecorresponden a un automata ordenado y a uno desordenado.

En la fig. 1.2 se muestran ejemplos de variacion en el tiempo de AC deterministasy aleatorios con vecindades reducidas: en este caso, los automatas representan la funcionlogica XOR, tal que una celula est’a “prendida” si (o, con alta probabilidad si se trata deuna regla aleatoria) una celula de sus dos vecinas esta prendida, y apagada si o bien ningunade sus vecinas o bien ambas estan apagadas. Se ve como este muy simple procedimiento deactualizacion genera patrones cambiantes que quedan marcados en la representacion graficadel AC.

2.3 Variedades de dinamicas y complejidad algorıtmica

El estado de un AC se determina en funcion de la historia previa; desde este punto de vista,constituye un sistema dinamico. En terminos generales, los sistemas dinamicos puedengenerar evoluciones de naturaleza muy diferente: convergencias a estados estacionarios,fluctuaciones periodicas, senderos divergentes, o movimientos “caoticos”, propios de ciertasdinamicas no lineales, donde las variables que caracterizan al sistema experimentan oscila-ciones aperiodicas, y sus valores futuros son muy sensibles a condiciones iniciales 1. Se hansugerido diversos modelos economicos que generan ese ultimo tipo de dinamicas, si bienla relevancia practica del “caos determinista” en Economıa es materia abierta (vease, porejemplo, la discusion en Heymann, Perazzo y Schuschny, 1997). En todo caso, a efectos deidentificar la capacidad de los AC para representar sistemas naturales o sociales, interesaestablecer cual es el conjunto de dinamicas que pueden generar, y si ese conjunto abarca demanera exhaustiva a los comportamientos potencialmente observables.

La pregunta quedo respondida por la afirmativa en un estudio realizado por S. Wol-fram (Wolfram, 1984). Allı se propuso una clasificacion de los AC deterministas unidimen-

1La imagen popular del “vuelo de la mariposa” que induce un gran evento meteorologico en un lugarlejano busca captar esta imagen de la amplificacion de pequenas diferencias en las condiciones de partida

Modelos economicos de multiples agentes 23-06-2011

2.3 Variedades de dinamicas y complejidad algorıtmica 23

Figura 2.2: Ejemplo de evolucion de automatas unidimensionales or-denados. Uno es determinista y el otro es estocastico o aleatorio. Laactualizacion de cada sitio se efectua con la funcion booleana que seindica al costado del dibujo. Las dos entradas son el estado de los dossitios vecinos a la derecha y a la izquierda. Los sitios en 1 tiene color ob-scuro e instantes sucesivos estan graficados en renglones contiguos haciaarriba. La condicion inicial es la misma para ambas evoluciones y es queel casillero central esta en 1 y los restantes en 0.

sionales en cuatro grandes grupos segun su evolucion y del estado asintotico al cual llegan.En la fig. 1.2 se muestran ejemplos de cada uno de estos grupos, pertenecientes al conjuntode AC unidimensionales ordenados y con reglas de actualizacion totalısticos. La tipologıade dinamicas es la siguiente:

• Clase 1: evolucionan hacia un estado fijo y homogeneo (ejemplo en fig. 1.3, corre-sponde a la regla Si(t+ 1) = 1 solamente si X(t) = 2).

• Clase 2 : evolucionan hacia un estado fijo inhomogeneo o a un ciclo lımite (ejemploen fig. 1.3, corresponde a la regla Si(t+ 1) = 1 solamente si X(t) = 3).

• Clase 3 : evolucionan hacia un estado caotico o aperiodico (ejemplo fig. 1.3, corre-sponde a la regla Si(t+ 1) = 1 solamente si X(t) = 1 o 3).

• Clase 4 : evolucionan hacia un estado que involucra una estructura compleja ylocalizada (ejemplo en fig. 1.3, corresponde a la regla Si(t + 1) = 1 solamente siX(t) = 2 o 4).

Los ejemplos anteriores indican que la evolucion de los AC puede poseer propiedadesque, intuitivamente, se asociarıan con diversos grados de complejidad. En todo caso, esta

Modelos economicos de multiples agentes 23-06-2011

24 2. Modelos computacionales

nocion esta ligada a la informacion contenida en el sistema y en su comportamiento. Unenfoque, estatico, para acercarnos a una definicion cuantitativa, medirıa la complejidadsegun la multitud de elementos que forman el sistema y su mutua dependencia. En concreto,se suele definir al grado de complejidad de un sistema en base a la cantidad de informacionnecesaria para especificarlo. Si las unidades de medicion son bits de informacion, la formulacorrespondiente resultarıa:

S = log2(Ω) (2.4)

En esta ecuacion Ω es la cantidad de estados del sistema y S es su entropıa. El conceptode entropıa nacio en el estudio de maquinas termicas propia de la termodinamica perofue luego incorporado en teorıa de la informacion, lo que manifiesta la existencia de basesconceptuales comunes a ambos campos. Se volvera sobre estas ideas en el Capıtulo 3.

Otro abordaje para definir cuantitativamente a la complejidad tiene caracter dinamico,y es el que sigue la clasificacion de los AC hecha por Wolfram. En este segundo enfoque(que no es independiente del de teorıa de la informacion), un comportamiento complejo estaasociado con una evolucion intrincada del correspondiente sistema, segun la secuencia deestados recorrida en el transcurso el tiempo.

Esta segunda definicion (Kolmogorov - Chaitin) conocida como de complejidad al-gorıtmica mide la complejidad de una secuencia (que puede ser la que describa la evoluciondel sistema) por la longitud del mınimo conjunto de instrucciones (la longitud del programamas corto) capaz de reproducirla efectivamente, o sea sobre cuya base se pueda calcularla secuencia en su conjunto. Se reconoce que esto es equivalente a determinar el menorprograma capaz de predecir la evolucion del sistema. Se deriva de allı una nocion de aleato-riedad: se suele decir que una secuencia es aleatoria cuando el algoritmo mas breve que ladescribe posee la misma longitud que la misma secuencia (o sea que esta no es “reducible”a una formula que la determine). Por extension, esta definicion puede usarse en el enfoqueestatico mencionado arriba, definiendo la complejidad por la longitud del programa mascorto necesario para especificar el sistema.

La clasificacion de Wolfram que se ilustra en la figura siguiente es de naturalezacualitativa, y busca establecer grandes grupos de AC segun las dinamicas que generan; eneste sentido, uno de sus objetivos principales es mostrar que sistemas muy simples (es decir:determinadas por reglas sencillas y especificadas con pocas instrucciones) pueden dar lugara evoluciones de un alto grado de complejidad.

Una vinculacion entre las clases de Wolfram y el concepto de complejidad algorıtmicade Kolmogorov-Chaitin (Wolfram, 1984; Wolfram, 1986) se establece considerando la infor-macion necesaria para especificar el estado en que se encontrara una celda cualquiera delAC despues que este haya evolucionado durante suficiente tiempo.

Valen las siguientes consideraciones:

• Los AC de la clase 1 evolucionan siempre con certidumbre hacia un punto fijo inde-pendientemente de las condiciones de las que se parta.

• En los AC de la clase 2 el valor de un sitio particular esta determinado por los valoresiniciales de sitios de una region limitada del AC.

• Para predecir el estado de una celula de un AC de clase 3 se requiere informacionde los valores iniciales de sitios que pertenecen a regiones cada vez mas extensas amedida que transcurre el tiempo. Por estas razones estos AC son mas complejos quelos anteriores. Se ha conjeturado que, con todo, el valor que adoptara un determinadositio del AC en un momento futuro puede determinarse mediante un algoritmo simple,

Modelos economicos de multiples agentes 23-06-2011

2.3 Variedades de dinamicas y complejidad algorıtmica 25

Figura 2.3: Se muestran sendos ejemplos de la evolucion de AC de lascuatro clases indicadas en el texto.

es decir mediante un programa breve, en el sentido de involucrar menos informacionque la contenida en todas las celulas del AC en todo tiempo previo.

• Los AC de clase 4 son los de maxima complejidad ya que presentan una evolucion queescapa a lo expresado para los de clase 3. La unica manera de establecer el valor deun determinado sitio del AC es siguiendo efectivamente toda la evolucion del mismo.

El agrupamiento de los AC en cuatro categorıas sugiere una clasificacion de la dinamicade un sistema en dos grandes clases: reducible e irreducible, segun su grado de compleji-dad. El primer conjunto agruparıa a todos los sistemas cuya evolucion puede ser descriptamediante un algoritmo simple, al modo de una convergencia monotona o una oscilacionperiodica. En este grupo se inscriben muchos sistemas fısicos tales como el formado porun par estrella- planeta representado por las leyes de Newton, o un oscilador armonicosimple que describe el movimiento de un resorte; en el caso de la Economıa, pertenecerıana esta clase, por ejemplo, todos los modelos macroeconomicos que siguen el esquema deimpulso- propagacion (o sea tales que, siguiendo la tradicional imagen de la mecedora deWicksell- Frisch, estan caracterizados por estados estacionarios estables perturbados porshocks). Las leyes de movimiento de estos sistemas generan trayectorias cercanas paracondiciones iniciales cercanas: desde este punto de vista, la evolucion futura serıa previsible(efectos aleatorios aparte) aunque el estado original no este medido con total precision.Por contraste, la evolucion de sistemas que presentan una complejidad “irreducible” solo sepodrıa establecer mediante su observacion y no serıa susceptible de ser anticipada de man-era sencilla (por la propia naturaleza de la dinamica, aun ausencia de impulsos aleatorios“externos”). Aquı, los efectos no lineales de las ecuaciones dinamicas se manifiestan en unadivergencia entre trayectorias que parten de posiciones similares: el resultado puede ser un

Modelos economicos de multiples agentes 23-06-2011

26 2. Modelos computacionales

comportamiento capaz de ser descripto como aleatorio aunque las leyes subyacentes seandeterministas (al modo de una tirada de moneda, que obedece a la mecanica clasica, perocuyo movimiento es muy sensible a como es arrojada). Este conjunto incluye a sistemas conpocos grados de libertad (uno solo, en el lmite, como en la evolucion de la funcion logısticamostrada en el capıtulo previo), y tambien a otros con gran cantidad de partes en interccon,como una computadora, o una celula viva. Los AC de clase 4 son sistemas de complejidadirreducible con muchos grados de libertad internos. Esta “irreducibilidad” es compatiblecoun una representacion de los cambios de cada elemento a traves de un algoritmo simple:la complejidad resulta del comportamiento colectivo. Este contraste ilustra la “transicionde lo singular a lo plural” comentada en el Capıtulo ?? en asociacion con interaccionesno lineales; desde otra perspectiva se puede ver tambien como una instancia de propiedademergente.

En general, un sistema capaz de procesar informacion que se le suministre y a partirde allı realizar un calculo cualquiera mostrarıa una evolucion de complejidad irreducible,dado que para que conocer el resultado habrıa que realizar la operacion misma y esperarsu finalizacon. Desde este punto de vista, los AC estan relacionados formalmente con elesquema de la computacion definido por las maquinas de Turing, cuyas caracterısticas setratan someramente a continuacion..

2.4 (*) Algoritmos, procedimientos efectivos y computabilidad

Los terminos de de algoritmo, heurıstica, programa de computo o reglas de transicion usa-dos frecuentemente hasta ahora refieren a ingredientes centrales de cualquier modelo com-putacional, como son las instrucciones que determinan su operacion. Una representacionmediante automatas finitos vinculados entre sı en la forma de un AC define una arquitec-tura o “hardware” sobre el cual correra el modelo. La especificacion de las conductas delos agentes establece el “software”, que detalla de manera completa las posibles respuestasde cada automata a todos los posibles estımulos que reciba. En este contexto, se puedeplantear la definicion de “efectividad” de un algoritmo:

Definicion 5 (Procedimiento o algoritmo efectivo) Un procedimiento es efectivo cuandoindica en todo momento y condicion posible que accion toma el automata.

La nocion de procedimiento efectivo fue introducida formalmente por Turing en 1936,y conlleva una profunda equivalencia entre los conceptos de automata y de programa decomputo. Una motivacion de ese desarrollo fue la pregunta (conocida como decima preguntade Hilbert, Entscheidungsproblem, o problema de decidibilidad acerca de la validez de laconjetura sobre la naturaleza mecanica de la matematica, es decir, sobre la existencia deun procedimiento deductivo automatico que produzca todas las proposiciones verdaderasde un sistema formal, como por ejempo la aritmetica.

Turing mostro, de manera paralela a la prueba formulada por Godel (193x), quela conjetura tiene una respuesta negativa. Estas profundas proposiciones estan asociadasa problemas de auto-contradiccion (al modo de la sentencia “esta afirmacion es falsa”),e indican que los sistemas formales son genericamente “incompletos”, o sea que existen“verdades matematicas” que no pueden ser demostradas.

A esos efectos, Turing asocio la efectividad de los procedimientos de calculo con laoperacion de una maquina abstracta:

Modelos economicos de multiples agentes 23-06-2011

2.4 (*) Algoritmos, procedimientos efectivos y computabilidad 27

Definicion 6 (Tesis de Church-Turing) Cualquier proceso que pueda ser naturalmenteconsiderado como un procedimiento efectivo puede ser realizado por una “maquina de Tur-ing”.

Esa maquina se puede especificar enumerando sus elementos:

Definicion 7 (Maquina de Turing) Una maquina de Turing (MT) se compone de

• Un numero finito (que puede ser muy grande) de estados internos (es un automatafinito)

• Una memoria. Turing supuso que esta no esta restringida en su capacidad de alma-cenamiento, y la represento por una cinta (potencialmente infinita) dividida en celdasen cada una de las cuales es posible escribir un sımbolo de un alfabeto finito (porsimplicidad, se puede usar un alfabeto binario compuesto por los sımbolos 0, 1). Eneste sentido, una MT no es una maquina finita.

• Una cabeza lectora y escritora que sea capaz de desplazarse hacia la derecha o izquierday examinar y/o cambiar el dato que se encuentra en el sitio de la cinta con el queesta en contacto. Se sobreentiende que cuando el calculo finaliza la cabeza lectora sedetiene.

• Un conjunto de instrucciones o programa. Cada instruccion controla el desplazamientode la cabeza lectora y la lectura o escritura de informacion en la memoria.

2.4.1 (*) Maquinas de Turing

Las instrucciones de una MT tienen el formato µ, S′, a′, S, a donde

1. µ indica el movimiento de la cabeza lectora y µ ∈ I,D,H donde I (D) indicadesplazamiento de un sitio hacia la izquierda (derecha) y H indica que la cabeza sedetiene.

2. S′, S indican estados internos de la MT.

3. a′, a indican sımbolos del alfabeto.

Sea el caso donde la cabeza lectora de la MT esta ubicada en una posicion determinadade la cinta y la maquina se encuentra en un estado interno S. A partir de esa situacion la MTejecuta secuencialmente las instrucciones almacenadas con el formato anterior realizandolas siguientes acciones:

1. Lee el caracter a de la cinta en el sitio donde esta posicionada la cabeza

2. Encuentra la instruccion µ, S′, a′, S, a cuyos dos ultimos elementos son (S, a)

3. Cambia su estado interno S por S′

4. Escribe el caracter a′ en el sitio donde esta posicionada la cabeza.

5. Efectua el movimiento indicado por µ

Modelos economicos de multiples agentes 23-06-2011

28 2. Modelos computacionales

Una MT puede ser considerada un sistema dinamico en el que los estados internosS(t), S′(t), los caracteres a(t), a′(t) y la posicion en la cinta son funciones del tiempo y lasinstrucciones cumplen el papel de una matriz de transicion determinista cuyos elementosvinculan el estado, el caracter leıdo y la ubicacion en el instante t y los correspondientes enel instante t+ 1.

EJEMPLO µ S′ a′ S a COMENTARIOEjemplo 1(*) H S1 0 S1 1 Parte de (S1,1); cambia por

(S1,0); se detiene

Ejemplo 2(**) D S2 1 S1 1 Parte de (S1,1); cambia por

(S2,1); va a la derecha

I S1 1 S2 1 Estaba en S2,lee 1; cambia por

(S1,1); va a la izquierda

(*) Se supone que la cabeza lectora enfrenta inicialmente un 1. La instruccion solo cambiael contenido de la cinta por un 0 y se detiene. (**)Se supone que la cabeza lectora enfrentainicialmente un 1 que tiene a su derecha otro 1. Con estas instrucciones y esos datos en lacinta, el programa no se detiene nunca.

Ejercicio 1 Suponga que en la cinta hay un numero de casilleros ocupados por 1’s y lacabeza lectora esta lejos, a la izquierda del primer 1 y en un estado S0 Escriba una secuenciade instrucciones que agregue un 1 a la derecha del ultimo 1.

Respuesta

1. D;S0, 0;S0, 12. D;S1, 1;S0, 03. H;S0, 1;S1, 04. D;S1, 1;S1, 1

Si se representa un numero natural por igual numero de 1’s (representacion “unaria”),el programa anterior es equivalente a la instruccion de sumar 1 al numero inicial. De estemodo se puede programar tambien operaciones mas complejas como la resta, la multipli-cacion y la division entera. Resulta claro que con una MT es posible efectuar cualquieroperacion aritmetica entre enteros o entre numeros reales con precision finita. Sin duda,la programacion de una MT es en extremo incomoda pero, de cualquier forma es posiblerepresentar con ella a todas las funciones logicas y aritmeticas imaginables. Es decir, lasoperaciones realizables con una MT definen al conjunto de computaciones capaces de serefectuadas por cualquier maquina o instrumento.

2.4.2 (*) Computacion universal

Si bien una MT solo puede efectuar las operaciones que le indica su programa de instruc-ciones, su estructura es tal que permite construir una que puede imitar a cualquier otra.Para ello le debe ser provista la descripcion de la maquina que se quiere emular en la cintade memoria. Esta MT capaz de imitar otras se denomina Universal (MTU) y puede pen-sarse que es todo lo complejo que puede llegar a ser un sistema dinamico. Algunos sistemas

Modelos economicos de multiples agentes 23-06-2011

2.4 (*) Algoritmos, procedimientos efectivos y computabilidad 29

dinamicos pueden considerarse equivalentes a una MTU. Por ejemplo, se conjetura que losAC de clase 4 mencionados en una seccion previa caen en esta categorıa. Las computadorasde uso corriente son MTU y es por ello que es posible hacer que una maquina se comportecomo cualquier otra.

En el lenguaje de las MTU el Entscheidungsproblem de Hilbert se formula como elProblema de la Detencion de una MT en ingles es el “halting problem”:

Definicion 8 (Halting problem) ¿Es posible elaborar una teorıa sistematica que deter-mine que procesamientos mecanicos hacen que una MT llegue a detenerse y cuales hacenque el procesamiento de la MT no concluya nunca?

Es ciertamente posible, mediante algun analisis particular, decidir que algunas maquinasson capaces de terminar su calculo y dar una respuesta mientras que otras no. La preguntase refiere en cambio a las condiciones generales que se deben satisfacer para establecer demanera sistematica y universal cuando una maquina puede llegar a detenerse y dar un resul-tado. La respuesta a la pregunta y, por consiguiente, al 10mo. problema de Hilbert - es queuna tal teorıa no es posible. Se dice que el halting problem es indecidible. Puede mostrarseque la proposicon es equivalente a la formulada por Godel, segun la cual en todo sistemalogico existen enunciados verdaderos que no se pueden ser demostrados en un numero finitode pasos.

Se desprende que una MTU es un sistema dinamico con una enorme variedad deposibles comportamientos. Esta versatilidad y generalidad ha llevado a discusiones sobreposibles analogıas entre una MTU y un cerebro humano (vease, por ejemplo: Velupillai,1990, para un tratamiento de modelos economicos donde los agentes se representan comoMT). El debate sobre si el cerebro tiene las mismas posibilidades computacionales queuna MT, menos o mas, es mas filosofico que practico ya que no puede demostrarse por laafirmativa o la negativa.‡2

En terminos matematicos esa proposicion es equivalente a imaginar una MT gober-nada por una secuencia de instrucciones parcialmente sujetas al azar. Desde este puntode vista una MT podrıa “liberarse” de una operacion mecanicamente determinada con eltramite de agregarle una cinta con instrucciones aleatorias. Sin embargo, una cinta deeste tipo no puede en principio fabricarse mediante un algoritmo finito con lo que quedarıaal menos formalmente marcada la diferencia entre una MT y una mente no determinadapor completo. Sin embargo esa diferencia pueda hacerse tan imperceptible como se deseecon lo que, para todos los fines practicos serıa imposible diferenciar una maquina de uncomportamiento inteligente en un tiempo compatible con la duracion de la vida de un serhumano. Esta consideracion es tambien aplicable al comportamiento de un agregado deagentes inteligentes que, en conjunto, podrıan ser equivalentes a una MTU.

No parecen existir limitaciones formales que imposibiliten representar con la maximafidelidad un sistema social o economico con herramientas computacionales. Sin embargoexiste una restriccion de ındole practico: un hipotetico modelo que reproduzca fielmente elraciocinio o la conducta de seres humanos reales no sera de utilidad ya que poseerıa la mismacomplejidad que la realidad misma. No se habrıa entonces reducido el mundo observablea terminos mas simples que permitan abstraer caracterısticas o rasgos de alcance generalaplicables a otras situaciones semejantes.

Modelos economicos de multiples agentes 23-06-2011

30 2. Modelos computacionales

2.5 Modelos y aplicaciones con automatas celulares bidimensionales

Un importante conjunto de aplicaciones de los AC a diversas disciplinas utiliza una rep-resentacion de las celulas dispuestas en un plano. Pasar de una dimension (como en laexposicion realizada en la seccion 2.2) a dos dimensiones requiere una definicion del entornode cada celula. Esto se puede hacer de varias maneras segun el interes del ejercicio. Unaforma usual es incluir en la vecindad a todas las ocho celdas que estan en contacto (aunquefuera en un punto) con una celda dada; en otros casos se incluyen solo a los casilleros ubica-dos en los cuatro puntos cardinales (N, S, E y O). Tambien hay casos donde se consideranvecindades mas extensas, que involucran mas hileras. Una cuestion adicional es como tratarlos efectos de borde (donde ”termina” la grilla de un AC finito). Al respecto, a menudose imponen condiciones de contorno periodicas, tales que se “pegan” los bordes superior einferior y los de ambos costados entre sı; con estas suposiciones el AC posee la topologıa dela superficie de un toro (en el caso de un AC unidimensional, resultarıa la topologıa de unanillo).

En lo que sigue se comentan varios conocidos modelos donde los AC estan aplicadosen distintos contextos, naturales y sociales, y que ilustran acerca de los usos que puedentener como instrumento de analisis.

2.5.1 El juego de la vida de Conway

Un automata bidimensional muy popular es el llamado “Juego de la Vida” del matematicoingles J. H. Conway‡3. Este AC muestra de manera grafica que reglas extremadamentesencillas pueden dar lugar a comportamientos colectivos de una enorme complejidad. Lasinstrucciones que definen la evolucion del sistema se basan en criterios elementales respectode los procesos de supervivencia y reproduccion biologica. En las condiciones iniciales, uncierto numero de sitios estan ocupados por celulas “vivas” y los otros sitios por celulas“muertas”. La dinamica surge del hecho que celulas pueden transitar entre estados seguncomo sea su vecindad.

Aun cuando las reglas son en extremo simples y absolutamente deterministas el ACtiene una evolucion que muestra un tipo particular de inestabilidad: aun partiendo decondiciones iniciales muy parecidas entre si, la evolucion temporal puede conducir al AC aconfiguraciones que se alejan arbitrariamente unas de otras (conforme a distancias indicadaspor ejemplo por la medida de Hamming, que es el numero de celulas que estan en estadosdiferentes).

Las reglas del automata de Conway son las siguientes:

Arquitectura:

1. Se trata de un AC bidimensional con la topologıa del toro

2. la vecindad de cada celula son las ocho celulas que la rodean.

3. Los estados internos de cada celula son dos: viva (representada con un 1) o muerta(representada con un 0).

Comportamiento:

1. Una celula permanece viva si tiene 2 o 3 celulas vivas en su vecindad. De lo contrariomuere.

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 31

2. Una celula muerta permanece como tal a menos que tenga exactamente 2 (o 3) celulasvivas en su vecindad. Si sucede esto, renace.

3. Todas las celulas evolucionan de manera sincronica

Este AC admite puntos fijos y ciclos lımite de diversa periodicidad. En la fig. 1.4 semuestran algunos ejemplos. En el panel (A) se muestran sucesivos estados en un ciclo lımitede orden 2 que se suele denominar “Semaforo”. En el panel (B) se muestra una secuenciade configuraciones que conducen a un punto fijo denominado el “Panal”. Finalmente enel panel (C) se muestra una sucesion de configuraciones denominadas “Trineo”. El primerestado se vuelve a encontrar despues de algunos pasos pero desplazado a lo largo de unadiagonal a 45o.

Figura 2.4: Ejemplo de evoluciones del AC de Conway: (A): “Semaforo”:ciclo lıimite de orden 2, (B) “Panal” punto fijo, (C) “Trineo”: esquemaque se auto replica desplazandose segun una diagonal.

Con estas caracterısticas, es dable presumir que un AC de Conway posea una com-plejidad tal que ubiqueo en la misma clase que los AC unidimensionales de clase 4 en laclasificacion de Wolfram. A pesar de lo sencilla que son las reglas de evolucion, la riquezadinamica del AC de Conway es la maxima imaginable: de hecho un AC de Conway es for-malmente equivalente a una MTU (ver Paul Rendell http://rendell-attic.org/gol/tm.htm oRendell en “Collision-based Computing” Andrew Adamatzky (ed) Springe Verlag)

2.5.2 Modelo de condensacion

Si el ejemplo anterior indicaba una propiedad de ”universalidad” de un AC de sencilladefinicion, este muestra a un automata que representa un fenomeno fısico concreto (laformacion de gotas asociada con la transicion de un gas a un lıquido) y muestra propiedades

Modelos economicos de multiples agentes 23-06-2011

32 2. Modelos computacionales

relevantes del proceso estudiado. Aquı, el AC bidimensional de este ejemplo correspondeal espacio ocupado por una substancia que puede estar en una de dos posibles fases: gaso lıquido. Cada celula representa un elemento de volumen que puede pertenecer a la fasecondensada (lıquida) o a la no condensada (gaseosa). Las reglas del AC son las siguientes:

Arquitectura:

1. Se trata de un AC bidimensional con la topologıa del toro

2. la vecindad de cada celula son las ocho celulas que la rodean.

3. Los estados internos de cada celula son dos: condensada (representada con un 1) o nocondensada (representada con un 0).

Comportamiento:

1. Una celula se condensa (0→ 1) si en su vecindad hay 4 o mas celulas condensadas

2. Una celula pasa a un estado gaseoso (1→ 0) si en su vecindad hay menos de 4 celulascondensadas

3. Todas las celulas cambian de estado de manera sincronica

En terminos economicos (y, por supuesto, figuradamente) hay una suerte de “com-plementariedad estrategica” entre las celdas vecinas, de modo que un sitio cercano a unamayorıa de celulas lıquidas esta en estado lıquido, y simetricamente para el estado gaseoso.

Figura 2.5: Diferentes momentos en la iteracion del automata de con-densacion. Ambas fases estan representadas por distintos tonos de gris.En 50 iteraciones el AC ha alcanzado un punto fijo.

En las condiciones iniciales se determina con probabilidad pc si cada celula perteneceo no a la fase condensada. Este es un parametro de control del modelo. La dinamica deeste AC esta dominada por puntos fijos, esto significa que cualquiera sea la condicion inicialel AC converge a una configuracion estable que no cambia en el tiempo. En la fig. 1.5 semuestran varios momentos del proceso evolutivo para condiciones iniciales en las que hayun 25% de celulas que pertenecen a la fase condensada (pc = 0.25).

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 33

Figura 2.6: Diferentes estados asintoticos para diferentes pc iniciales.Panel (A) pc = 0.20, panel (B) pc = 0.25 y panel(C) pc = 0.27 con lasimulacion detenida a las 50 iteraciones.

En los momentos iniciales las celulas condensadas que estan aisladas pasan a la fasegaseosa mientras que las celulas condensadas proximas entre si tienden a formar “gotas”mas grandes (primer panel en fig. 1.5). Esta dinamica puede entenderse analizando lo quesucede en las fronteras entre ambas fases. Es facil comprobar que separaciones verticales,horizontales o a 45o son estables y no cambian en el tiempo, mientras que las concavidadestienden a desaparecer dando lugar al crecimiento de las gotas al tiempo que las fuerza aque sean convexas. Estos efectos se pueden ver comparando los paneles que correspondena 10 y a 12 iteraciones que se muestran en la fig. 1.5.

Se puede mostrar que este modelo presenta un comportamiento lımite cuando laprobabilidad inicial de celulas condensadas pc es proxima al 25 %. Cuando pc < 0.25, elestado asintotico contiene gotas condensadas cuyo tamano posee una distribucion cuyo valormedio es tanto mas pequeno cuanto menor es pc (ver panel superior en la fig. 1.6).

Para el valor lımite de pc ∼ 0.25 el estado asintotico posee gotas cuya distribucion seaproxima una ley de potencias (P (S) ∝ S−α) con P (S) = probabilidad de ocurrencia deuna gota de tamano S). Cuando una distribucion posee este compatimiento es facil ver queno existe un valor medio finito. En este caso se suele decir que esta distribucion no poseeun tamano caracterıstico (ver panel central de la fig. 1.6). Si pc > 0.25 el punto fijo es unoen que todo el espacio pertenece a la fase condensada. En el tercer panel del la fig. 1.6se muestra el estado del AC al cabo de 50 iteraciones, justamente antes que el espacio seaintegramente ocupado por la fase condensada. Observese que en este panel abundan lasconcavidades que deben ser rapidamente llenadas en sucesivas iteraciones.

Este cambio brusco en el comportamiento de un sistema para valores crıticos dealguno de sus parametros de control sera objeto de reiteradas consideraciones en proximoscapıtulos. La transicion que acabamos de ver esta relacionada con un fenomenos se recibioel nombre de transicion de percolacion, y que se discute extensamente mas adelante.

Si se quisiera trazar una analogıa economica de este modelo, se puede pensar en unsistema donde los agentes tienen dos conductas posibles (“lıquido” o “gaseoso”), sujetas,como se menciono, a complemetariedad estrategica. Los individuos tienden a alinear sucomportamiento con el de los vecinos, y existen dos equilibrios estables donde todos eligenunanimamente un tipo u otro de “accion”. El estado crıtico marcarıa entonces una situaciondonde el sistema esta “en el filo” entre los dos equilibrios, y se observan islas de diferentetamano en que rige una conducta o la otra.

Modelos economicos de multiples agentes 23-06-2011

34 2. Modelos computacionales

2.5.3 El modelo de segregacion de Schelling

Este ejemplo esta basado en un trabajo pionero, que aplico de manera muy efectiva her-ramientas simples de la modelizacion de AC a un problema social relevante, y que ilustrasobre los fenomenos colectivos que pueden emerger a partir de respuestas individuales ca-paces de ser descriptas en forma muy esquematica. Schelling se propuso dilucidar el vınculocausal que podrıa existir entre las actitudes individuales de intolerancia y la existencia engrandes ciudades de ghettos, o barrios segregados. En concreto, su pregunta se referıa algrado de aversion al contacto con miembros de otros grupos serıa necesaria para que seobserven patrones de residencia marcados por separacion etnica. El modelo que elaboroSchelling se basa en un AC bidimensional; con el correr del tiempo se le han introducidodiversas variantes. La version que se presenta aquı difiere de la original, pero retiene suscaracterısticas centrales. Las reglas del automata son las siguientes:

Arquitectura

1. Los agentes estan ubicados en una grilla bidimensional con los bordes identificados demodo de reproducir la topologıa del toro.

2. Todos los sitios de la grilla estan ocupados por un agente que pertenece a uno de dosgrupos (“colores”).

3. La vecindad de cada agente consiste en las 8 celdas con las que el agente esta encontacto.

Comportamiento: Analizaremos dos posibles alternativas sobre preferencias: una es laque motivo a Schelling (incentivos a tener cercanıa con “iguales”); la otra representa unasituacion donde a los individuos les interesa ser “especiales” en su vecindario. En amboscasos se supone que la dinamica consiste en una secuencia de “mudanzas” en que los agentesmodifican su localizacion. Cada individuo hace un recuento de la composicon de su vecindady evalua si pertenece a la mayorıa o a la minorıa. La convencion que se utiliza es que endicho recuento se incluye al propio agente.

1. Alternativa 1: La situacion favorable para un agente es participar de la mayorıa

(a) Se seleccionan al azar un par de agentes de distinto color

(b) Ambos agentes deciden si estan “contentos” o “descontentos” efectuando unrecuento en sus respectivas vecindades con alguno de los criterios antes definidos.

(c) Si ambos agentes estan descontentos intercambian sitios, de lo contrario ambospermanecen en sus respectivos lugares.

(d) Se recomienza desde el paso (a) y se continua hasta que no se encuentran maspares de agentes de distinto color descontentos. En la practica se suele establecerque la busqueda se detiene si no se encuentra a pares descontentos en un numeropreestablecido (elevado) de intentos.

(e) Las actualizaciones del AC son asincronicas (es decir que los pares de mudanzasocurren secuencialmente, manteniendo fija la configuracion del resto).

En la fig. 1.7 se muestra la evolucion del AC cuando la situacion favorable es pertenecera la minorıa de la propia vecindad. La configuracion inicial es una en que cada celda del ACesta ocupada por un agente de cada color con probabilidad 1/2. Como esta configuracionse determina al azar es dable que no haya exactamente el mismo numero de agentes de

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 35

cada color. La regla local de preferencias induce mudanzas que progresivalemente vandisminuyendo el numero de agentes descontentos (comparar paneles D y E de la fig. 1.7). Esareduccion es abrupta al comienzo pero luego se torna lenta, aproximandose asintoticamentea una situacion de mınimo descontento.

Figura 2.7: Evolucion del AC de Schelling en el caso en que la situacionfavorable es pertenecer a la minorıa. En el panel A se indica la configu-racion inicial, en el panel B luego de 500 mudanzas y en el C luego de1500 mudanzas. En los paneles D y E se muestran en tonos mas clarosa los agentes de ese color que estan descontentos al cabo de las 500 y1500 mudanzas respectivamente.

La disminucion del numero de agentes individualmente descontentos se acompana porla induccion de un un orden en “gran escala” en que los las celdas de distinto color se agrupanen “calles”. La organizacion resultante es a “gran escala” porque posee un alcance espacialmucho mayor que el de las vecindades elementales, y termina por abarcar al conjunto delAC. Este ordenamiento, sin embargo, no es perfecto en cuanto a eliminar la disconformidadde los individuos. Se observa que los agentes descontentos (paneles D y E) se agrupan enzonas muy definidas que se corresponden con la frontera entre dominios en los que las callescorren en direcciones perpendiculares. Estos dominios se producen porque a lo largo delproceso evolutivo la generacion de calles tiene lugar de manera independiente en distintospuntos del AC. Este proceso genera “islas de orden” que crecen hasta colisionar con otrascuyo ordenamiento es incompatible con el propio. Cuando el sistema esta ıntegramenteparcelado en dominios, la cantidad de descontentos es mucho menor que al principio, peroel ritmo de disminucion se frena, porque cada reduccion adicional requiere la relocalizacionde una gran cantidad de agentes.

Es interesante observar que aunque se permita que el AC evolucione durante una can-tidad arbitrariamente grande de pasos existen situaciones en que resulta imposible alcanzar

Modelos economicos de multiples agentes 23-06-2011

36 2. Modelos computacionales

un ordenamiento global compatible con optimos individuales (al modo de un equilibrio deNash). Tal es el caso aquı cuando el numero de celdas en cada direccion no es congruentecon las dimensiones de la vecindad. Si el AC tiene la topologıa del toro y una vecindadde 8 celdas, si se pretende que el ordenamiento sea “perfecto” se deben alternar agentes dedistintos colores y, al llegar al borde opuesto, se debe encontrar el mismo color con el quese partio. Caso contrario, no hay manera de implementar estados donde todos los agentesesten en sus situaciones preferidas. En estas condiciones, se dice que el sistema esta enun estado frustrado. El concepto reaparece nuevamente en el texto (especialmente en ladiscusion del “modelo de Ising” en el Capıtulo 3). Por lo pronto, se puede usar la siguientedefinicion:

Definicion 9 (Frustracion) Se dice que un sistema es frustrado cuando todos su agentesno se pueden acomodar optimamente de modo de satisfacer todas las condiciones impuestaspor sus interacciones o condiciones de borde.

En la fig. 1.8 se muestra un ejemplo de evolucion del AC para la otra alternativa, estoes cuando la situacion favorable es pertencer a la mayorıa. Este es el caso originalmenteestudiado por Schelling y utilizado como modelo de segregacion residencial. Aquı se observatambien una disminucion monotona del descontento junto con la emergencia de un ordende gran alcance. Ahora, surgen “barrios” segregados donde los habitantes son agentes deun mismo color.

En este caso el sistema no es frustrado con lo que la convergencia no solo es masrapida sino que ademas se puede alcanzar un orden global que se corresponde con un estadoestacionario, mostrado en el panel D. En este panel subsisten dos descontentos (en el bordesuperior de la grilla) debido a que en el sorteo inicial el numero de agentes de ese colorno resulto igual a la mitad exacta del total de agentes (o sea que no pueden encontrarcontraparte para mudarse). En las etapas intermedias se puede observar como los agentesdescontentos se ubican en las fronteras de los barrios.

El ejemplo de la fig. 1.8 corresponde a un rechazo moderado de los agentes a mezclarsecon los del otro grupo: no quieren ser minorıa en su vecindad pero no objetan de por sıla presencia de individuos del otro color. Este es un resultado fuerte del modelo: no hacefalta una intolerancia extrema para producir segregacion. Un grado mayor de intransigenciacorresponderıa, por ejemplo, a definir como favorable una vecindad en la que el color propiodebe exceder al otro en dos o mas unidades. Si se impone esta pauta individual, se observaque el AC tarda mas en converger a un ordenamiento y las fronteras de los ghettos carecende las concavidades que se muestran en la fig. 1.8. Si se aumenta aun mas el nivel deintolerancia (la situacion extrema es exigir que la unica situacion favorable es que toda lavecindad sea del mismo color), el sistema no converge a ningun equilibrio. Estos rasgos delmodelo se comprenden viendo que la dinamica de adaptacion del AC se da en las fronteras:es allı donde habitan los descontentos y se producen las mudanzas. Por otro lado, seobserva que barrios que muestran convexidades o concavidades dan lugar a vecindades masequilibradas en su composicion por color (y por consiguiente mas activas en mudanzas)cuando se imponen pautas individuales de mayor intolerancia.

Es interesante notar, que si uno mide la cantidad de descontentos a los largo deltiempo, la evolucion del modelo hace que dicha medida decaiga paulatinamente hasta algunmınimo. A los lectores inclinados por las ciencias economicas, este fenomeno les puede sug-erir que la evolucion orienta un proceso de minimizacion a gran escala, y que efectivamenteel sistema actua como si hubiera un agente unico que minimiza descontentos. En este punto,quisieramos destacar que la motivacion original de Schelling era modelar un efecto agregado

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 37

Figura 2.8: Evolucion del AC de Schelling en el caso en que la situacionfavorable es pertenecer a la mayorıa. En el panel A se muestra la con-figuracion inicial aleatoria, en el panel B luego de 50 mudanzas, en elC luego de 150 mudanzas y en el D la situacion asintotica estable en laque no se pueden producir mas mudanzas. En las etapas intermedias, losagentes descontentos se muestran con un sombreado mas tenue.

(segregacion) a partir de comportamientos individuales sencillos. Y por otro lado, puedeocurrir en otros procesos de origen economico que la propia evolucion pueda ser visto comosi existiera un proceso de optimizacion.

Ejemplo computacional

Se presenta aquı una implementacion en Matlab del modelo de Schelling. La red se defineinicialmente mediante una tirada aleatoria (dada por la variable U), que distribuye unos yceros con igual probabilidad. Hay una funcion measures satisfaction(one, x, y) quecuenta la cantidad de vecinos del mismo color de un agente. La permutacion de lugares dedos agentes, seleccionados al azar, ocurre cuando ambos tienen una cantidad de vecinos desu preferencia por debajo del umbral crıtico.

Listado 2.1: Codigo de Schelling

function nn = s c h e l l i n g (N0 , thresh )

global U N;

step = 150 ;rand ( ’ s t a t e ’ , 0 ) ;

Modelos economicos de multiples agentes 23-06-2011

38 2. Modelos computacionales

N = N0 ;

% t i t l e o f main windowt i t u l o = [ ’ S c h e l l i n g Game : N=’ , num2str(N∗N ) ] ;U = round(rand (N,N) ) ; % s e t s random f i e l d

% s e t s main f i g u r ef i l m = imagesc (U, [ 0 1 ] ) ;

axis o f f ; axis square ; axis on ;t i t l e ( t i t u l o ) ;xlabel ( ’ x ’ , ’ f o n t s i z e ’ , 1 6 ) ;ylabel ( ’ y ’ , ’ f o n t s i z e ’ , 1 6 ) ;axis ( [ 0 N+1 0 N+1] ) ;

i =1;while i <=90000,

i

% S e l e c t s one agentone = round(rand ( 1 , 2 )∗ (N−1))+1;x1 = one ( 1 ) ; y1 = one ( 2 ) ;

% s e l e c t s second agent and measures s a t i s f a c t i o ntwo = round(rand ( 1 , 2 )∗ (N−1))+1;x2 = two ( 1 ) ; y2 = two ( 2 ) ;

% computes s a t i s f a c t i o ni f U( x1 , y1 ) ˜= U( x2 , y2 )

sat1 = m e a s u r e s s a t i s f a c t i o n ( one , x1 , y1 ) ;sat2 = m e a s u r e s s a t i s f a c t i o n ( two , x2 , y2 ) ;

i f sat1 < thresh & sat2 < threshtemp = U( x1 , y1 ) ;U( x1 , y1)=U( x2 , y2 ) ;U( x2 , y2)=temp ;

end ;end ;i f (mod( i , s tep )==0)

set ( f i lm , ’ cdata ’ ,U) ;drawnow

endi=i +1;

end

function sa t = m e a s u r e s s a t i s f a c t i o n ( one , x1 , y1 )

global U N;x l = mod( x1−2,N)+1; % index l e f txr = mod( x1 ,N)+1; % index r i g h tyb = mod( y1−2,N)+1; % index bottomyt = mod( y1 ,N)+1; % index top

% measures the number o f 1 s in neighborhoodne ig = U( xl , y1 ) + U( xr , y1 ) + U( x1 , yb ) + U( x1 , yt ) ;ne ig = ne ig + U( xl , yb ) + U( xl , yt ) + U( xr , yb ) + U( xl , yt ) ;

% d e f i n e s s a t i s f a c t i o ni f U( x1 , y1 ) == 0

sat = 8−ne ig ;

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 39

elsesa t = ne ig ;

end ;

Ejercicio 2 i) En el modelo original, los agentes tienen una cota inferior a la toleranciaantes de la mudanza. Modificar el programa para incluir este efecto.

2.5.4 Un mercado inmobiliario

Sobre la base del esquema de Schelling, es posible construir un modelo elemental de un mer-cado inmobiliario, donde las mudanzas implican una transaccion economica, y los agentestoman en cuenta el costo de trasladarse a un barrio que les resulta mas afın. Para ello sesupone que cada individuo posee una riqueza pecuniaria K y una propiedad cuyo valor im-putado para el agente es P , que depende de las caracterısticas del vecindario. Las mudanzasse producen intercambiando propiedades, lo cual puede tener asociado un pago de dinerode un individuo al otro, todo esto siempre y cuando ambos agentes mejoren su utilidad conla operacion.

Se define entonces la utilidad de un agente i con un capital Ki y una propiedad devalor Pi como Ui ∝ Kα

i P(1−α)i . Se establece ademas que el valor que le asigna un agente

del color X a una habitacion es:

P (X) = A[C(X)− C(X)] +B (para la alternativa 1) (2.5)P (X) = A[C(X)− C(X)] +B (para la alternativa 2) (2.6)

donde C(X) indica la cantidad de agentes del color X en su vecindad (incluyendolo a elmismo) y C(X) la cantidad de agentes de un color diferente del de X. Las constantes A yB (A y B) aseguran que P sea no negativo.

La dinamica para las transacciones procede de la manera siguiente:

1. Dos agentes son elegidos al azar. Cada uno fija el precio que pagarıa por la propiedaddel otro (o sea calcula el correspondiente valor imputado).

2. Se determina un precio de transaccion potencial en el promedio de ambos valores

3. Ambos agentes intercambian sus propiedades si y solo si se verifican las siguientescondiciones: a) El agente dueno de la propiedad mas barata puede pagar la diferenciade precio, y b) Ambos agentes mejoran su utilidad.

4. La dinamica se detiene cuando no se pueden concertar transacciones durante unnumero preestablecido de sorteos de pares de agentes

Con estas variantes al modelo original se pueden formular preguntas como: ¿Subsistela segregacion y que forma toma?; ¿donde se concentran los agentes descontentos? ¿Dondese ubican los agentes que posen una maxima utilidad? ¿como es la convergencia?,¿Se alcanzaun orden que agota las transacciones posibles?.

En la fig. 1.9 se muestran algunos resultados para el caso en que los individuos prefierenpertenecer a la mayorıa (se utiliza la regla (1.6)). En estos experimentos se puede observarel efecto de variar las preferencias: en el panel (A) los agentes obtiene una mayor utilidadde una “mejor” propiedad mientras que en el panel (B) y (C) prefieren crecientemente

Modelos economicos de multiples agentes 23-06-2011

40 2. Modelos computacionales

disponer de un mayor capital. Las simulaciones corresponden a un estado inicial dondetodos los agentes poseen el mismo capital (K = 1). Se muestran curvas de iso-utilidad y laconvencion de colores utilizada es como en aplicaciones geograficas:

Se observa que convergencia a un estado estacionario. El grado de segregacion quese alcanza es menor que en el modelo original de Schelling. En realidad, la separacion degrupos es tanto menor cuanto mas relevancia tiene el capital en la utilidad de los agentes.La imposicion de restricciones economicas para la reubicacion de los agentes dificulta alcan-zar segregaciones mayores y la reubicacion para formar barrios homogeneos opera menos yaque no siempre se pueden encontrar transacciones mutuamente convenientes. Las mayoresutilidades se alcanzan en el medio de los barrios, y las menores en las fronteras, independi-entemente del valor de α. Para α = 0.5 (Panel B) las curvas de nivel de K y U resultan sermuy semejantes. Tambien los individuos menos ricos se concentran en las fronteras. Se tratade agentes que no poseen recursos para buscar mejores ubicaciones, y deben conformarsecon una propiedad de bajo valor imputado.

Figura 2.9: Evolucion del AC de Schelling con la dinamica del mercadoinmobiliario. Curvas de nivel de igual utilidad. El AC evoluciono hastaalcanzar un estado asintotico. Los tres experimentos partieron de lasmismas condiciones iniciales: ademas se fijo K = 1 y α iguales paratodos los agentes. Se tomo α = 0.1 para el panel A α = 0.5 para elpanel B y α = 0.9 en el Panel C.

2.5.5 Dilema del Prisionero en Vecindarios

Un tema que aparece recurrentemente tanto en contextos sociales como biologicos es el dela emergencia y sostenibilidad de conductas por las que un agente no ejecuta una accionindividualmente optima (en el sentido de no implementar una mejor respuesta a los com-portamientos de los demas) y de ese modo contribuye al bienestar de los otros con quienesinteractua, y facilita que el conjunto alcance estados colectivamente preferibles a un equilib-rio de tipo Nash. Una ilustracion saliente del conflicto entre comportamientos “miopementeegoıstas” y cooperativos es la del Dilema del Prisionero, un escenario aplicable a situacionessociales muy diversas (como, por ejemplo, el encuentro entre un potencial comprador de unbien, que elige si realizar o no el correspondiente pago, y un vendedor que decide si entre-gar o no el objeto). En este juego dos jugadores escogen simultaneamente (sin capacidadpara asumir compromisos) entre dos acciones: cooperar (C) o no-cooperar (D). Segun latabla de pagos (ver tabla 1.1), una interaccion de una sola vez posee un unico equilibriode Nash donde ambos jugadores no-cooperan: el comportamiento egoısta es una estrategiadominante. Sin embargo, se observa que tanto en comunicades humanas como animalesexisten comportamientos cooperativos que se mantienen el el tiempo. Esta cueston, que ha

Modelos economicos de multiples agentes 23-06-2011

2.5 Modelos y aplicaciones con automatas celulares bidimensionales 41

C DC 1 0D b 0.1

Tabla 2.1: Matriz de pagos para el agente 1 (fila) en el Dilema del Prisionero. Parametrode control: b > 1.

generado una extensa literatura, y tambien intensos debates, se trata con algo mas de de-talle en un capıtulo posterior. La presente seccion se concentra en un argumento particular,en que los individuos se encuentran ubicados en un entorno geografico y la evolucion de lasconductas se estudia mediante un AC bidimensional.

Una lınea de razonamiento posible para motivar la presencia de cooperacion es plantearun escenario de interacciones repetidas donde los individuos aplican estrategias tales que laaccion ejecutada en una vuelta del juego es contingente a la conducta previa de los demas.Por caso, (Axelrod, 1984) sugirio que un escenario que podra sustentar cooperacion de man-era robusta es cuando los agentes se comportan con reciprocidad segun un criterio de “ojopor ojo”, que empieza con una accion C y luego replica a C con C y a D con D. Otra aprox-imacion resulta de notar que un individuo que juega C con otros que hacen lo mismo recibeun pago sustancialmente mayor que un defector rodeado de otros de su calaa, lo que podrıallevar a la propagacion de C si los agentes “imitan al exitoso”. Al respecto, (Nowak andMay, 1992; Nowak, Bonhoeffer and May, 1994) realizaron extensas simulaciones numericascon el automata celular descripto a continuacion.

Cada jugador se ubica en uno de los nodos de una grilla bidimensional, y juega con suscuatro vecinos mas cercanos2, acumulando los premios que obtienen de cada interaccion.Una vez que todos los jugadores han jugado con sus vecinos, todos deciden de manerasincronica, que estrategia utilizaran en el proximo paso. Para ello, se supone que cadajugador selecciona la accion realizada en la ronda anterior por su vecino que ha obtenidoel maximo premio. Estas reglas determinan la variacion de las conductas, y a partir de allıse puede considerar como se define la proporcion de agentes cooperantes para diferentesespecificaciones de la matriz de pagos.

El modelo se puede representar con el codigo de Matlab que aparece a continuacon, ydonde la magnitud del “beneficio de la defeccion”, b > 1, se trata como parametro. La grillabidimensional en que estan instalados los jugadores tiene condiciones de contorno periodicas,identificando el borde izquierdo con el derecho, y el borde superior con el inferior.

Listado 2.2: Dilema del Prisionero

function uout = pd2d (U, b0 , o u t s t e p s )

global bpar ;

rand ( ’ s t a t e ’ , 0 ) ;

[N, N] = s ize (U) ;bpar = b0 ;

look = zeros (N,N) ;

i l = mod ( ( 1 :N)−2 ,N) + 1 ; % vecino i z qi r = mod ( ( 1 :N) ,N) + 1 ; % vecino der

2El numero de vecinos y la topologıa de las vecindades son importantes para los resultados. Puede verseque un sistema con pocos vecinos no genera posibilidad de cooperacion.

Modelos economicos de multiples agentes 23-06-2011

42 2. Modelos computacionales

i t = i l ; % vecino a r r i b aib = i r ; % vecino abajo

t i t u l o = [ ’PD2D Game: N=’ , num2str(N ) ] ; % t i t l e o f main window

% se tup o f output imagef i l m = imagesc (U,[−1 1 ] ) ;

axis square ; axis on ; axis ( [ 0 N 0 N ] ) ;t i t l e ( t i t u l o ) ;xlabel ( ’ x ’ , ’ f o n t s i z e ’ , 1 6 ) ;ylabel ( ’ y ’ , ’ f o n t s i z e ’ , 1 6 ) ;

s tep = 1 ;while s tep <= out s t eps ,

s teppay = zeros (N,N) ;for i =1:N

for j =1:N,s1 = U( i , j ) ; % e s t r a t e g i a jugador 1

% v e c i n o s que cons idera e l jugador ( i , j )nn = [ i , i t ( j ) ; i , ib ( j ) ; i l ( i ) , j ; i r ( i ) , j ] ;p lays = zeros ( 1 , 4 ) ;for k=1:4 ,

ne i = nn(k , : ) ;s2 = U( ne i ( 1 ) , ne i ( 2 ) ) ;p lays ( k ) = play game ( s1 , s2 ) ;

end% guarda en l o o k e l i n d i c e d e l vec ino de mas puntuacionpay ( i , j ) = sum( p lays ) ;

endend

% busca e l maximo l o c a l de p a y o f f e n t re v e c i n o sspay = s ize ( pay ) ;for i =1:N

for j =1:N,% c o n v i e r t e l a s coordendas de v e c i n o s en i n d i c e snn = [ sub2ind ( spay , i , i t ( j ) ) , sub2ind ( spay , i , ib ( j ) ) , sub2ind ( spay , i l ( i ) , j ) , sub2ind ( spay , i r ( i ) , j ) ] ;% busca e l maximo[mm, inx ] = max( pay (nn ) ) ;

% asigna a l agente su mejor vec inol ook ( i , j ) = nn( inx ) ;

endend% asigna nuevas e s t r a t e g i a sU = U( [ look ] ) ;

i f (mod( step ,1)==0)set ( f i lm , ’ cdata ’ ,U) ;drawnow

ends tep = step + 1 ;%pause ;

enduout = U;

% pd p a y o f f matrixfunction payo f f = play game ( s1 , s2 )global bpar

i f s1 == 1

Modelos economicos de multiples agentes 23-06-2011

2.6 Conclusiones 43

i f s2 == 1payo f f = 1 . 0 ;

elsepayo f f = 0 . 0 ;

endelse

i f s2 == 1payo f f = bpar ;

elsepayo f f = 0 . 1 ;

endend

Este programa parte de una matriz determinada exogenamente, U, donde cada celdaesta marcada por un numero (0, 1) que identifica respectivamente a las acciones (D,C). Losarreglos il, ir, ib, it identifican a los vecinos. El algoritmo primero hace jugar a todoslos agentes, y luego define las nuevas jugadas en la matriz bidimensional look. Para iniciarel algoritmo se debe crear U. En los ejercicios graficados abajo se utiliza una condicion inicialaleatoria:

U0 = rand (50 ,50) < 0 . 3 ;

donde un 30% de los agentes, dispersados al azar por la red bidimensional, juegan coop-eracion. Entonces se puede ejecutar el algoritmo por medio de

uu = pd2d (U0 , 1 . 1 , 100)

Cuando finaliza la jugada, el programa devuelve una nueva matriz, con el estado del sistemaen la ultima iteracion, que puede ser utilizado para procesar nuevamente el modelo.

En la figura fig. 1.10 se muestran simulaciones numericas con N = 2500 agentes. Elvalor de parametro de la matriz de pagos b mide el incentivo por no cooperar. En este juegoespacial, los agentes cooperantes pueden sobrevivir para un b > 1 suficientemente pequenoy un numero de vecinos suficientemente grande. Para b = 1.1 vemos que la evolucion iniciales la de agrupacion y crecimiento de grupos de cooperantes. Cuando estos comienzan achocar con otros conjuntos de cooperantes, quedan no-cooperantes en las zonas de contactoy, como hay agentes D que obtienen altos beneficios de “explotar” a sus vecinos C, la nocooperacion se difunde localmente a traves del comportamiento imitativo. Como se puedever en la iteracion t = 10, se crean grupos alternados de jugadores C y D; estos jugadorespueden medrar aprovechando la proximad de “racimos” de jugadores C, cuya cantidad seva reduciendo. Finalmente, queda solo un grupo de cooperantes que se mueve en la redbidimensional. Para 1 < b < 1.2 sobreviven grupos pequenos de cooperantes; para b > 1.2es improbable que sobrevivan y solo quedan no-cooperantes.

Ejercicio 3 Estudie el dilema del prisionero espacial con b = 1.1, 1.2, 1.3, 1.4. Observeque tipos de estructuras se crean, cuales son las que son localmente estables y frente a queestructuras son inestables.

Ejercicio 4 Modifique el codigo para incluir mas vecinos. Que sucede con la cantidad decooperantes que sobreviven para b pequenos?

2.6 Conclusiones

Ademas de las aplicaciones especıficas presentadas previamente, este capıtulo ilustra algunospuntos generales:

Modelos economicos de multiples agentes 23-06-2011

44 2. Modelos computacionales

BA

C D

Figura 2.10: Evolucion del Dilema del Prisionero con N = 2500 agentes,b = 1.1. (A) Se comienza con 30% de agentes cooperando. (B) En laiteracion t = 10 los grupos con cooperantes crecen hasta que comienzana chocar. (C) En la iteracion t = 20 hay grupos de no-coperantes alter-nados con cooperantes; las zonas de poblacion homogenea disminuyanen tamano. (D) En t = 40 solo queda un grupo de cooperantes que semueve a la izquierda continuamente, y sin modificarse; este es el estadoasintotico.

1. Reglas simples de determinacion de conductas individuales pueden dar lugar a com-portamientos colectivos muy diversos y complejos.

2. Modelos donde los individuos estan representados muy esquematicamente pueden sinembargo capturar patrones colectivos que evocan situaciones reales.

3. Hay propiedades del conglomerado de agentes que emergen como rasgos del conjuntoy que no se pueden reducir de manera inmediata como replicas a escala de compor-tamientos de los integrantes del sistema.

4. Existen situaciones en que, cerca de valores crıiticos, pequenos cambios en los parametrosde control pueden dar lugar a comportamientos colectivos muy divergentes entre si.La transicion entre uno y otro de estos regımenes es tanto mas abrupta cuanto mayores el numero de agentes del sistema

5. Si se admite que el comportamiento de una sociedad real no puede exceder en compleji-

Modelos economicos de multiples agentes 23-06-2011

NOTAS 45

dad a una computadora universal (hipotesis de inteligencia artificial fuerte), resultarıaque la riqueza de dinamicas de AC como el de Conway es en principio equivalente ala de una sociedad real. Sin embargo, de esa afirmacion general no se desprende queese u otro determinado modelo sea en la practica apto para ser tratado como uninstrumento util para todo proposito.

Notas

‡1 En un conjunto de conferencias Von Neumann (von Neumann and Burks, 1966) se refirio a la dificultadque encontraba para identificar los elementos necesarios y suficientes para armar su sistema auto-replicante.

First of all one may define parts in such numbers, and each of them so large and involved, thatone has defined the whole problem away. If you chose to define as elementary objects thingswhich are analogous to whole living organisms, then you obviously have killed the problem,because you would have to attribute to these parts just those functions of the living organismwhich you would like to describe or to understand. So, by choosing the parts too large, byattributing too many and too complex functions to them, you lose the problem at the momentof defining it.

One also loses the problem by defining the parts too small, for instance, by insisting thatnothing larger than a single molecule, single atom, or single elementary particle will rate asa part. In this case one would probably get completely bogged down in questions which,while important and interesting, are entirely anterior to our problem. We are interested herein organizational questions, about complicated organisms, and not in questions about thestructure of matter [...]. So, it is clear that one has to use some common sense criteria aboutchoosing the parts neither too large nor too small.

‡2Descartes considero que el cerebro y la capacidad de razonamiento humanos no son una maquina porqueel ser humano posee el libre albedrıo. Mientras que una maquina debe obedecer ciegamente una secuenciafija de instrucciones preestablecidas, el ser humano podrıa decidir en todo momento cambiar el rumbo desus acciones librandolas al azar (vease tambien la vıvida reflexion de Dostoievsky en sus ”Notas desde elSubsuelo”, 1864).

‡3Existe un buen numero de sitios de Internet que comentan o ilustran este juego; vease por ejemplo:http://www.bitstorm.org/gameoflife/, http://www.ibiblio.org/lifepatterns/, http://www.youtube.com/ watch?v=XcuBvj0pw-E

Bibliografıa

Axelrod, R.: 1984, The Evolution of Cooperation, Basic Books, New York.

Nowak, M. A., Bonhoeffer, S. and May, R. M.: 1994, Spatial games and the maintenanceof cooperation, Proc. Natl. Acad. Sci. USA 91, 4877–4881.

Nowak, M. A. and May, R. M.: 1992, Evolutionary games and spatial chaos, Nature359, 826–829.

von Neumann, J. and Burks, A. W.: 1966, Theory of Self-Reproducing Automata, Universityof Illinois Press.

Wolfram, S.: 1984, Universality and complexity in cellular automata, Physica D 10, 1–35.

Wolfram, S.: 1986, Theory and applications of Cellular Automata, World Scientific.

Modelos economicos de multiples agentes 23-06-2011

46 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 3

Modelos estadısticos

En el capıtulo anterior se trato de establecer un nexo entre la capacidad de procesamientode un agente (o celula) y las propiedades emergentes del conjunto. El presente capıtulocomplementa esa vision buscando sortear la “catastrofe de las multitudes” tal como hemosllamado al problema de superponer las acciones de los numerosos elementos que forman unsistema.

Una manera de sortear los problemas propios de la interaccion de numerosos elementoses el estadıstico, o sea, obteniendo distribuciones de probabilidad independientes del tiempode las variables individuales y utilizarlas para calcular promedios. Por este camino es posiblecaracterizar el orden y el desorden del sistema, como este esta vinculado con la informacionque contiene, y como surgen sus propiedades colectivas.

3.1 Las bases estadısticas

La creciente complejidad de la administracion publica de los reinos de Europa a partirdel siglo XVIII torno crecientemente necesario conocer la sociedad a traves de sus datos.Es precisamente de este hecho del que deriva la palabra alemana Statistik, cuya definicionacuno Gottfried Achenwall en 1749 en la Universidad de Gottingen. En 1700, Leibniztenıa el mismo pensamiento cuando propone al rey Federico I de Prusia la creacion de laAcademia de Ciencias en Berlın. En 1733 cuando ya habıa avanzado la tarea de registrode informacion, los datos recolectados pasaron a ser secretos de estado. Solo en el siglosiguiente los datos estadısticos de los reinados seran difundidos publicamente.

Esta acumulacion de datos reafirmo la percepcion de las regularidades estadısticas alpunto de motivar a la Royal Society en Londres a establece la idea filosofica del designio(o del diseno) divino interpretando la estabilidad de los procesos estocasticos como unaevidencia de que existe Dios. El hecho de que estas regularidades aparecieran tambienen decisiones individuales, que no podıa sospecharse que estuvieran reguladas por ningunhecho natural, hizo que no se tardara en trazar un puente entre los hechos sociales y lasregularidades astronomicas.

Quetelet, astronomo belga y conocedor de la teorıa de errores de observacion, dioamplia aplicacion a la misma en las estadısticas sociales. En sus trabajos de 1830 definelo que es un hombre tipo, caracterizado por los valores medios de los parametros fısicosde un grupo humano. Este concepto echo raıces profundas aun en el espıritu del propioQuetelet, que termino por atribuir una realidad fısica a los valores medios asociandolos auna suerte de arquetipo del grupo humano correspondiente. El creıa en la existencia real de

47

48 3. Modelos estadısticos

un hombre tipo y consideraba que los valores medios son una propiedad de un ente colectivocaracterizando ası a una raza, un pueblo o una comunidad.

En 1835 vuelve sobre este punto en un Tratado sobre el hombre que es muy bienrecibido por la comunidad cientıfica inglesa. El fısico escoces James Clerk Maxwell lee congran interes ese libro y aplica los mismos conceptos al estudio de los gases protagonizandoası, a fines del siglo XIX una de las grandes sıntesis de la fısica. Esta fue la conciliacion dela termodinamica (desarrollada desde comienzos del siglo XIX) y la mecanica de Newton(proveniente del siglo XVII). Mientras la mecanica de Newton habıa tenido un enorme exitoen describir el movimiento de los astros, la termodinamica lo habıa tenido entendiendo lasmaquinas termicas que la revolucion industrial habıa generalizado. En ellas el protagonistaprincipal era la energıa mecanica que podıa extraerse de gases a alta temperatura y presion.

Las preguntas acerca de la naturaleza ıntima de los gases llevaron a Bernoulli, Maxwell,Boltzmann, Gibbs y hasta al propio Einstein a sentar las bases de la nueva mecanica es-tadıstica que apunta a explicar comportamientos colectivos de muestras de gases o de ma-teriales solidos en terminos de las propiedades de la enorme cantidad de partıculas que lasconstituyen‡1.

Esta corriente de conocimiento reafirmo la creencia de que muchas leyes de la natu-raleza y de la sociedad son basicamente estadısticas y otorgo a esta perspectiva derechospropios. Un siglo y medio despues del aporte inicial que las estadısticas sociales hicieron ala fısica y a la quımica, existe una creciente tendencia a aplicar lo que se aprendio en estoscampos al conocimiento de las sociedades, ası como a areas muy distantes.

Aun cuando los ingredientes basicos de la sociedad y de la fısica son profundamentediferentes se ha podido observar el mismo tipo de regularidades. Tal es el caso de latransicion entre orden y desorden, la ocurencia de densidades de probabilidad que siguenleyes de potencias, la ocurrencia de transformaciones abruptas y, sobre todo, la ocurrenciade comportamientos colectivos caracterizados por pocos elementos aun cuando resulten dela interaccion de numerosısimos agentes.

Solo en los ultimos anos, y merced al desarrollo explosivo de las capacidades decomputo, pudo intentarse una vision “atomista” de la sociedad. En las ciencias de lanaturaleza, esta vision permitio reinterpretar varios conceptos que pueden ahora buscaraplicaciones en otras disciplinas. Podemos mencionar:

• la temperatura en un gas esta determinada por la energıa cinetica promedio de laspartıculas que lo componen.

• la presion se puede comprender como el constante bombardeo de las moleculas delgas contra las paredes del recipiente que lo contiene.

• el magnetismo y las propiedades basicas de materiales magneticos pudieron expli-carse como el resultado de la interaccion entre los campos magneticos de atomo indi-viduales. Se pudo comprender como el efecto de una temperatura elevada destruye elmagnetismo de los materiales.

• la entropıa que mide la eficacia de una maquina termica por la cantidad de calortransferida por cada grado de temperatura pudo explicarse en terminos de la infor-macion almacenada en el sistema y su grado de desorden.

En tiempos recientes se ha afianzado la tendencia a tratar de esta misma maneramuchos problemas sociales e interdisciplinarios. La ambicion es establecer un nexo entre

Modelos economicos de multiples agentes 23-06-2011

3.1 Las bases estadısticas 49

detalles microscopicos y comportamientos globales y comprender de esta manera las razonesultimas que gobiernan las propiedades emergentes del sistema. Un punto de particularinteres es el de comprender mejor la estabilidad y la resiliencia del sistema conociendocuales son las razones y las oportunidades en que pueden darse cambios abruptos en suconfiguracion. Estas transiciones bruscas son conocidas como crisis en el contexto de laorganizacion social o economica y son casi siempre imposibles de anticipar.

En este capıtulo nos proponemos explorar este camino en sistemas sociales o economicos.Si bien extrapolar esas ideas a la economıa o al estudio de la sociedad entrana grandes di-ficultades creemos que es una propuesta de la que es posible extraer lecciones provechosas.Estos acercamientos ya tienen alguna tradicion. Ver por ejemplo (Gordon, 2003); en lateorıa de juegos (Blume, 1993) y en los mercados financieros (Smith, Farmer, Gillemot andKrishnamurthy, 2003; Daniels, Farmer, Iori and Smith, 2003). Una excelente recopilacionde recientes desarrollos en una problematica social se puede encontrar en (Castellano et al.,2009).

Hay varios elementos que hacen atractivo este enfoque. Por un lado, en los sistemassociales existen parametros agregados que dependen, en ultima instancia, de actitudes in-dividuales o de interacciones interpersonales. En este campo podemos inscribir indicadorescomo el producto bruto interno, el ahorro, la inversion o procesos de contagio que hacenque una moda se difunda o que una opinion prevalezca, que una moneda se imponga a otrao que un idioma desplace a otro.

Las dificultades que se plantean son sin embargo muy grandes. En todos estos ejem-plos los elementos en interaccion son personas o firmas que son la antıtesis de los atomoso moleculas de un gas. El comportamiento detallado de un ser humano es de una enormecomplejidad y las interacciones entre agentes economicos o sociales distan mucho de lasfuerzas que ejercen entre si las moleculas de un gas.

El camino que propone el presente capıtulo requiere por consiguiente groseras sim-plificaciones de conductas e interacciones. Esto da lugar a un doble nivel de dificultad: elprimero es precisamente hacer esta simplifcacion de manera sensata y constructiva, el se-gundo es llevar a cabo la estadıstica propiamente dicha e inferir comportamientos globalesde manera apropiada.

Para lo que resta de este capıtulo es importante resaltar las siguientes cuestiones:

• Un elemento central es el uso de distribuciones de probabilidades como medio pararetener las caracterısticas colectivas del observable y abstrayendose del detalle de ele-mentos individuales. Dichas distribuciones contienen esencialmente informacion sobrela frecuencia con que ocurre algun observable relevante y permite obtener facilmentevalores medios y tamano tıpico de las fluctuaciones.

• La nocion de equilibrio conocida y aplicada en economıa y en el estudios de sistemassociales tiene un significado diferente del utilizado en los modelos estadısticos, y con-viene en este punto detenerse por un instante. Por un lado la teorıa de juegos asociael equilibrio social a uno de Nash. Esta situacion esta caracterizado por el hecho quetodos los jugadores practican siempre la misma estrategia y cualquier abandono dela misma produce un perjuicio que el jugador desea evitar. Este equilibrio implica laconsistencia de los planes de todos los agentes economicos y una vez que el sistema losalcanza cesa toda la dinamica debida al cambio de roles y actitudes de los agentes. Poresta razon el equilibrio economico tiende a ser concebido como una situacion estatica,de reposo, en que los agentes producen, consumen o intercambian cantidades fijas aprecios constantes. Esta idea es semejante a la de un equilibrio mecanico en el que

Modelos economicos de multiples agentes 23-06-2011

50 3. Modelos estadısticos

todas las partes de un sistema estan en reposo. En los modelos estadısticos la visiones algo diferente. En este caso el equilibrio suele por lo general estar asociado a laconstancia de valores medios de variables colectivas del sistema (como p.ej. la temper-atura o presion) y es compatible con fluctuaciones o aun variaciones temporales que,de todos modos, preserven constante los valores medios. En esa situacion las que nocambian con el tiempo son las distribuciones de probabilidad pero eso no implica quelos elementos que forman el sistema esten en reposo. En realidad las mismas estande hecho cambiando constantemente pero de un modo tal que las probabilidades semantienen inalterados.

• Una dificultad importante en trasladar modelos fısicos a un contexto economico o so-cial reside en el hecho que los actores elementales son numerosısimos en el primer casomientras que en las ciencias sociales o la economıa son muy pocos. Que las partıculassean muy numerosas hace que el calculo de promedios sea significativo y que las fluc-tuaciones puedan en general ser despreciadas. Lo reducido del numero de agentes ensistemas economicos puede bien hacer que los promedios dejen de ser significativos ylas fluctuaciones pasen a ser tan importantes que sean las que efectivamente dominen.

En las secciones que siguen vamos a introducir la entropıa como una medida deldesorden. Luego se introducira el Principio de Maxima Entropıa que permite obtener lasdistribuciones de probabilidad compatibles con las restricciones que operan sobre el sistema.Discutimos luego dos ejemplos con motivacion economica y un fuerte sesgo estadıstico: elprimero permite introducir una ecuacion de evolucion para la distribucion de probabili-dades. El segundo es una extension de los intercambios de Edgeworth, pero repetitivos yen una poblacion de N jugadores. Luego presentamos un metodo de optimizacion combi-natoria basado en conceptos propios de los modelos estadısticos. Finalmente, presentamosel paradigma de Ising en el que estan presente los ingredientes basicos para analizar laocurrencia de situaciones de orden y desorden. Si bien este modelo fue desarollado parael estudio teorico de medios magneticos ha motivado muchısimas aplicaciones en contextosvariados en los que los agentes enfrentan una decision binaria.

3.2 Entropıa, desorden e informacion

El concepto de entropıa se origino en el desarrollo de la termodinamica. Su interpretacionmicroscopica pudo darse gracias al surgimiento de la mecanica estadıstica. La misma con-sistio en asociar la entropıa de un sistema a una medida de su desorden. Esta idea trascendiola frontera de la fısica y fue adoptada por Shannon en la teorıa de la informacion, donde sela interpreta como una medida de la cantidad de informacion de un mensaje.

Consideremos un automata celular (AC) de N celulas que evoluciona de acuerdo consu propia regla interna de actualizacion. De esta manera visita en cada momento algunade sus 2N configuraciones posibles. Podemos considerar a este sistema como un emisor decaracteres Xi. Cada uno de ellos corresponde a una de las 2N configuraciones de las Nceldas. Los Xi son parte de un alfabeto A con |A| = 2N sımbolos.

Comparemos la situacion (A) donde el AC alcanza un punto fijo y la secuencia decaracteres que se emiten a partir de ese momento contiene siempre un mismo sımbolo, y(B) para un AC de Tipo III que ya discutimos en el capıtulo anterior. La secuencia decaracteres emitidos en este caso contendra siempre sımbolos diferentes y - probablemente -terminara por agotar toda la lista de los 2N sımbolos del alfabeto.

Modelos economicos de multiples agentes 23-06-2011

3.2 Entropıa, desorden e informacion 51

Esta claro que la situacion (B) sugiere un mayor desorden que la (A). Una primeramedida del desorden, podrıa ser, por ejemplo, un numero que dependa a la cantidad desımbolos accesibles por la dinamica. Para el caso (A) esa cantidad es menor que el tamano delalfabeto, mientras que para el caso (B) si se itera suficiente tiempo, puede llegar a ser iguala ese tamano. El desorden medido de esta forma fue la base de la primera interpretacionmicroscopica de entropıa dada por Boltzmann, quien la definio como

S(X) = log ΩX (3.1)

donde ΩX = |A| es la cantidad de estados del sistema accesibles1. La entropıa se mide enbits si el logaritmo es base 2 y en nats si es en base e. Si los mensajes transmitidos tienenΩ = 2N posibles configuraciones, la entropıa es maxima y valdrıa N bits.

Las variables de estado se suelen clasifican segun sean intesivas o extensivas. Enuns sistema fısico la temperatura o la presion son intensivas porque son independientedel tamano del sistema; variables como el volumen o el numero de sus partes (moleculas,agentes) son extensivas porque crecen o disminuyen con su tamano.

Esta idea es tambien aplicable a la entropıa. Consideremos lo que sucede cuando seponen en contacto dos AC independientes entre si. Si uno de ellos emite sımbolos Xi, y elotro Yi, el sistema compuesto por el par emitira simbolos Zi que son la composicion de Xi

y Yi. Estos pueden visitar los puntos de un espacio que tiene ΩXΩY estados. La entropıadel conjunto entonces queda

S(X,Y ) = log(ΩXΩY ) = log(ΩX) + log(ΩY ) = S(X) + S(Y ) (3.2)

El desorden atribuible al conjunto de los dos sistemas resulta la suma del desorden desus partes. La introduccion del logaritmo logra que la entropıa ası definida sea una variableextensiva2

Esta primera aproximacion de la medida del desorden como proporcional al logaritmodel numero de estados accesibles es, sin embargo, insuficiente para distinguir a dos sistemasque poseen la misma cantidad de estados accesibles Ω pero que emiten sımbolos de maneradiferente.

Imaginemos, por caso, que uno de los sistemas visita todos los estados accesibles conla misma frecuencia, mientras que el otro visita 100 veces mas frecuentemente una mitad.Es intuitivo que el primer caso corresponde a un desorden mayor que el segundo. La manerade distinguir ambos casos es utilizando la probabilidad de ocurrencias de distintos sımbolosdel alfabeto. Se puede decir que la ocurrencia de un sımbolo muy probable produce poca’sorpresa’, mientras que lo contrario sucede con los sımbolos poco probables. Si suponemosque la ’sorpresa’ del sımbolo Xi es proporcional a log(1/P (Xi)), es posible dar como medidade entropıa del sistema al promedio de la sorpresa que aporta la emision de cada sımbolo.Se justifica entonces la siguiente definicion:

Definicion 10 (Entropıa de Gibbs) Sea X una variable aleatoria discreta cuyas real-izaciones Xi pertenecen a un alfabeto finito A y sea P (Xi) la distribucion de probabilidadde las mismas, o sea P (Xi) = P (X = Xi) con Xi ∈ A. La entropıa de la variablealeatoria X se define como

S(X) =∑i

P (Xi) log(1/P (Xi)) = −∑i

P (Xi) log(P (Xi)) (3.3)

1La expresion (3.1) esta, a pedido del propio Boltzmann, grabada en su lapida porque la considero sumaximo descubrimiento.

2Veremos sin embargo mas adelante que hay sistemas con fuertes correlaciones internas en los que alaumentar su tamano, la entropıa no se comporta como extensiva.

Modelos economicos de multiples agentes 23-06-2011

52 3. Modelos estadısticos

Esta definicion se extiende al caso de variables continuas X con una medida µ(X) reem-plazando la suma por una integral

S(X) = −∫AP (X) log(P (X))dµ(X) (3.4)

Esta nueva definicion tiene en cuenta la frecuencia de ocurrencia, por lo que da unamedida del desorden contemplando no solamente numero de estados accesibles, sino tambiensu importancia relativa en el curso del tiempo. Con estas definciones puede darse queun gran numero de sımbolos del alfabeto cuya ocurrencia tiene muy baja probabilidaddeterminen la entropıa del sistema.

Veamos los siguientes ejemplos:

• el valor de la entropıa es maxima, cuando la distribucion P es uniforme (ver ejemplo3.3).

• Si uno de los sımbolos tiene probabilidad cero, este no contribuye a la entropıa deGibbs (este es otro ejemplo en que se ve la diferencia entre la entropıa de Gibbs y lade Boltzmann).

• Una memoria de 4 bits, tiene Ω = 24 configuraciones, y si cada sımbolo es equiprob-able, la entropıa de Gibbs es S = log2 24 = 4 bits. Supongamos que agregamos unanueva memoria de 3 bits. Si se supone independencia de las configuraciones de estesubsistema con el original, la nueva entropıa sera de 7 bits, ya que Ω′ = 2423 = 27.

• el ADN de nuestras celulas se puede ver como una cadena de ≈ 1010 pares de bases.Los pares de bases puede ser: C-G,T-A,G-C,A-T, es decir 4 sımbolos. La moleculapuede estar por lo tanto en uno de los Ω = 41010

configuraciones, con lo que elcontenido de informacion (suponiendo independencia de la ocurrencia de pares debases) es S = log2 41010

= 1010 log2 4 = 2.1010 bits.

El concepto de probabilidad de hechos independientes motivan el uso del logaritmoen la definicion de ’sorpresa’. La probabilidad conjunta de dos variables aleatorias indepen-dientes x ∈ X e y ∈ Y es el producto de las probabilidades,

P (x, y) = P (x)P (y) (3.5)

Es por otra parte bueno que el contenido de informacion sea ’aditivo’, es decir si se tienela medida de informacion de x, y se le quiere agregar la de los eventos y, la informacionasociada a x⊕ y sea la suma. Si se calcula la entropıa de x e y:

S(x, y) = log1

P (x, y)= log

1P (x)P (y)

= log1

P (x)+ log

1P (y)

= S(x) + S(y) (3.6)

para variables aleatorias x e y independientes.

Ejercicio 5 Verifique que el mismo resultado aplica para S(X,Y ) =∑P (X,Y ) log 1

P (X,Y ) .

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 53

Ejercicio 6 Programar un AC de cada una de las clases introducidas en el capıtulo 1.Permitir que evolucionen hasta obtener una muestra representativa de los estados a losque convergen y como para poder asignarles una probabilidad. Calcular numericamente laentropıa asociado a cada uno.

La defincion dada arriba posee un ambito de validez mucho mayor que el originalmentepensado por Boltzmann. De hecho Shannon (1948) y Khinchin (1949) buscaron expresionesde la entropıa con el requisito de cumplir exigencias de naturaleza muy general, tales comoque sea maxima cuando todas las realizaciones poseen la misma probabilidad, o que lainclusion de una realizacion de probabilidad nula no cambie su valor. En esas condicionesdemostraron que la expresion de Gibbs es la unica que las satisface.

En el campo economico, las definiciones dadas arriba se utilizan para caracterizar porejemplo distribuciones de ingreso o de algun otro parametro que caracterice a segmentosde una poblacion. Sea Yi es un intervalo de la distribucion del ingreso, es posible definirla probabilidad P (Yi) que un habitante seleccionado al azar tenga un ingreso comprendidoen el mismo. En este caso, la entropıa S(Y ) da una idea sobre la distribucion del ingresoen esa poblacion. Ver por ejemplo (Dragalescu and Yakovenko, 2001; Silva and Yakovenko,2005) para un estudio sobre la distribucion del ingreso en USA.

Ejercicio 7 (Entropıa y distribucion de ingreso) Discuta los siguientes ejemplos:

• El 5% de la poblacion es analfabeta, el 70% tiene educacion primaria, el 15% secun-daria el 8% terciaria y el 2% cuaternaria. ¿Cual es la entropıa educacional de estasociedad?

• ¿ Cual es la entropıa de una distribucion del ingreso muy pareja?

• Si la probabilidad de tener un ingreso y es P (y) = e−y/A ¿Cual es la entropıa de esadistribucion de ingreso?

• ¿ Cual es la entropıa asociada a una distribucion del ingreso que sea log-normal?

3.3 Principio de maxima entropıa

De acuerdo con la definicion de entropıa de Gibbs, la misma es calculable si es posibleenumerar todos los estadosXi del sistema y se conoce su probabilidad (o es posible hacer unahipotesis plausible de la misma). Aqui nos vamos a ocupar de la pregunta inversa, esto es,conociendo la entropıa atribuible a una sucesion de observaciones de una variable aleatoriatrataremos de buscar cual es la distribucion de probabilidad que es compatible con ella.Dicho de otro modo, dada la entropıa, ¿Es posible obtener la distribucion de probabilidadde una variable aleatoria X que corresponda a esa entropıa y cuyas realizaciones sean las quehayamos observado? Como se puede ver, aca la incognita es la distribucion de probabilidad!

Tengase en cuenta que en una multitud de casos practicos simplemente se supone quela variable aleatoria cuyas realizaciones se observan, obedece a una distribucion normal,estimandose medias y varianzas como si ese fuera efectivamente el caso. Esta hipotesis depresuponer una distribucion de Gauss puede ser efectivamente falsa y conducir a errores deapreciacion graves como veremos mas adelante.

Modelos economicos de multiples agentes 23-06-2011

54 3. Modelos estadısticos

Conocer la distribucion de probabilidad P (X) de una variable aleatoria X permitecalcular lo que se ha propuesto desde el comienzo de este capıtulo, esto es, valores mediosde cualquier magnitud H que sea funcion de X en la forma:

〈H〉 =∑i

P (Xi)H(Xi) (3.7)

(NOTA: Observese que en la definicion de entropıa se recalco que se trata de la informacionaportada por un mensaje con un gran numero de realizaciones Xi de la variable aleatoriaX. Con esta definicion de valor medio la entropıa de Gibbs no es sino el valor medio dela sorpresa que produce una realizacion, o sea S(X) = 〈− log(P (X))〉.) Una manera mas

precisa de formular la pregunta que hicimos al comienzo es ¿Cual es la distribucion deprobabilidad que solo contiene la informacion que esta contenida en las observaciones y queno tiene ningun otro sesgo? En respuesta a esta pregunta Jaynes (1957) formulo el principiode maxima entropıa3:

Definicion 11 (Principio de Jaynes o de maxima entropıa) De todas las distribucionesde probabilidad que son compatibles con los vınculos vigentes en las observaciones realizadas,la densidad de probabilidad que no contiene ningun otro sesgo, es la que maximiza la en-tropıa.

Es util comprobar las consecuencias de este principio cuando se lo aplica a un casoen que solo se sabe que el sistema posee N estados y no existe ninguna otra restriccon.

Ejemplo 1 (Maximizacion de la entropıa sin vınculos). Se trata de determinar P (Xi) parai = 1, . . . N maximizando

S = −∑

i=1...N

P (Xi) log(P (Xi)) sujeto a∑

i=1...N

P (Xi) = 1 (3.8)

Para esto se introduce un multiplicador de Lagrange λ y se calcula el extremo deS + λ(

∑i P (Xi)− 1). Se obtiene:

δ[S + λ(∑

i=1...N

P (Xi)− 1)] =∑

i=1...N

δP (Xi)[− log(P (Xi)− 1 + λ] = 0 (3.9)

con lo que log(P (Xi)) es una constante. Una vez normalizada para que su suma sea 1,resulta que

P (Xi) =1N

(3.10)

que es la distribucion uniforme. Tal como era de esperar, si no se imponen restricciones deninguna naturaleza sobre el sistema, la distribucion resultante debe ser la uniforme, que,claramente, no tiene ningun sesgo.

3Este principio tiene un gran alcance porque Jaynes logro reescribir la mecanica estadıstica a partir delmismo.

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 55

3.3.1 Distribuciones compatibles con un vınculo

Consideremos ahora el caso en que existen restricciones debido a las cuales algunos de losestados del sistema resultan inaccesibles. Esta situacion es muy frecuente. Las restric-ciones pueden ser que ciertas variables propias del sistema - como el numero de los agentesque lo integran - se mantenga constante. Para estos fines es util introducir las siguientesdefiniciones.

Definicion 12 (Microestado. Espacio de fases) Un microestado de un sistema es unaconfiguracion posible del mismo y queda especificado por el estado de cada una de sus com-ponentes. El conjunto de todos los microestados de un sistema configuran su espacio defases.

Ejemplos:

• Comunidad de N agentes economicos: Los microestados podrıa definirse lastenencias de bienes de los N agentes. El espacio de las fases estarıa integrado portodas las distribucones posibles de bienes entre N agentes.

• Automata Celular: Los microestados son palabras de N bits y el espacio de faseses un alfabeto con 2N sımbolos.

• Gas de moleculas: el microestado estarıa especificado por las energıas cineticas delas moleculas que lo componen y el espacio de fases serıa todas las configuraciones deN moleculas con una energıa total determianda.

Por lo general, la virtual imposibilidad de conocer todos los microestados de un sis-tema induce a asociarlos a una variable aleatoria X. En los ejemplos anteriores, X puedeser un vector de una cantidad muy elevada de dimensiones.

Es importante tener en cuenta que el espacio de las fases abarca la totalidad de losmicroestados posibles. Importa solo que sean posibles y de momento, no importa cuanprobables son. En su evolucion y con el transcurso del tiempo un sistema puede pasar deun microestado a otro. La existencia de algun vınculo puede bien imponer restricciones eneste proceso haciendo que algunas regiones del espacio de las fases sean accesibles y otrasinaccesibles y por consiguiente ocurran con una probabilidad nula.

En general, el sistema evoluciona en el tiempo visitando distintos microestados. Enel caso de una comunidad de agentes, que pueden hacer transacciones transfiriendo dineroentre ellos, lo que cede uno lo recibe otro, con lo que la masa total M de dinero se mantieneconstante. Algo analogo sucede en un sistema fısico como un gas en que las moleculascolisionan entre si cambiando sus energıas individuales pero manteniendo constante su suma.Consideremos un AC. Puede suponerse que la magnitud que debe ser constante es algunafuncion de los numeros N+ y N− que indican cuantas celdas estan respectivamente en losestados +1 y -1. Dependiendo de la regla de evolucion del AC, puede bien suceder que Esolo mantenga constante en valor medio.

La porcion del espacio de las fases que corresponde, por ejemplo, a mantener la tenen-cia global de dinero M constante alberga con todo una gran diversidad de estados. Pienseseque esa condicion es compatible con que los agentes puedan distribuirse esa cantidad demuchas maneras posibles. Lo mismo sucede con la energıa almacenada en el movimientode las moleculas de un gas: fijar la energıa es compatible con situaciones en las que unaspocas moleculas se desplacen a gran velocidad y las restantes esten en reposo o que todas

Modelos economicos de multiples agentes 23-06-2011

56 3. Modelos estadısticos

se muevan a una misma velocidad intermedia. Visto desde el punto de vista de una de laspartıculas del gas o desde uno de los miembros de la comunidad economica cada transacciono cada colision altera el valor individual de la magnitud que se conserva pero el valor mediodel total no cambia: los valores para cada una de las partes interactuantes fluctua peroel valor medio no. Como tanto las colisiones como las transacciones tienen lugar al azarestamos inducidos a resolver el problema de determinar las probabilidades con que ocur-ren microestados con distintos valores posibles de la variable cuyo valor medio suponemosconstante.

El caso de agente economicos la probabilidad de ocurrencia de un microestado quecorresponde a la de tenencias de dinero M =

∑imi puede expresarse como el producto de

las probabilidades de las tenencias aisladas, o sea P (M) = P (∑mi) =

∏P (mi) con lo que

el problema se reduce a obtener las probabilidades P (m) de ocurrencia de agentes con unadada cantidad de dinero m.

Tanto la energıa Ei de los microestados de un sistema fısico como la tenencia m dedinero de agentes individuales son soluciones del problema de maximizar la entropıa deGibbs

S(X) = −∑

i=1...N

P (Xi) log(P (Xi)) (3.11)

sujeta a dos condiciones. Una es la normalizacion de las probabilidades pero la otra corre-sponde a la conservacion del valor medio de la cantidad E o M :∑

i=1...N

P (Xi) = 1 (3.12)∑i

P (Xi)E(Xi) ≡ 〈E〉 = E (3.13)

En este caso es necesario introducir dos multiplicadores de Lagrange, uno por cada uno delos dos vınculos con lo que queda:

P (Xi) =e−βE(Xi)

Zβ(3.14)

Zβ =∑i

e−βE(Xi) (3.15)

Estas ecuaciones sugieren que es poco probable que cualquier medicion que se efectue sobreel sistema permita observarlo en un estado con una Ei (mi) elevada, mientras que es encambio exponencialmente mas probable que se lo detecte en un estado con baja Ei (mi).

La ecuacion (3.14) recibe el nombre de distribucion de Gibbs mientras que la funcion(3.15) que asegura que la distribucion de probabilidad P (Xi) esta correctamente normal-izada, recibe el nombre de funcion de particion. Al igual que con la entropıa, estas dis-tribuciones han probado tener vastısimas aplicaciones y muchas veces se las supone validasen contextos muy diversos, aun cuando no existan demostraciones rigurosas de su vigenciapara ciertas situaciones.

Es interesante la aparicion del multiplicador de Lagrange β que actua domo unavariable “conjugada” de la energıa. En termodinamica, este multiplicador de Lagrangeque surge por la imposici on del segundo de los vınculos, es la inversa de la temperatura.Determina una escala para para la variable que se supone que esta conservada en valormedio en la distribucion de probabilidad4.

4En termodinamica se convierte la escala de “grados”(para la T ) a dimensiones de una energıa intro-duciendo la constante de Boltzmann k poniendo β = 1/kT . Esta constante k no es de importancia en elpresente contexto y en general sera ignorada

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 57

En una seccion posterior volveremos sobre la interpretacion estadıstica de T . Ya quefija una escala para las energıas, este parametro puede entenderse como asociada al nivelde “quietud” o “agitacion” interna delas partıculas que integran el sistema: para muy bajatemperatura, solo son significativamente probables unos pocos estados de mınima energıa.Para una temperatura elevada sucede en cambio que todos los estados internos del sistematiene una probabilidad significativa de ser observados. Se puede suponer que cuando Tes elevada, el sistema “visita” (puede ser observado) con probabilidad comparable tantomicroestados de baja como de alta energıa mientras que si T → 0 el sistema solo se loobservara en su estado de mınima energıa.

Si bien es cotidiano escuchar hablar sobre una “economıa recalentada” o sobre “enfriarla economıa” no es sencillo hacer una correspondencia rigurosa del concepto de temperaturaa sistemas sociales. Algo se insinua en el ejemplo que se trata en la proxima seccion. Dela explicacion dada arriba surje que deberıa existir una “temperatura” asociada a algunavariable conservada en el sistema economico. Si se restringe este concepto a la masa dedinero, un sistema “caliente” serıa uno en el que el dinero esta distribuıdo de manerauniforme entre todos los agentes. Una economıa frıa es en cambio una en la que el dinerosolo esta concentrado en una fraccion reducidad de los agentes.

3.3.2 Loterıas bilaterales y la distribucion de Gibbs

Como primer ejemplo de un abordaje estadıstico de un sistema economico representadopor multiples agentes, seguimos el esquema propuesto por (Dragalescu and Yakovenko,2000; Dragalescu, 2003). Se trata de un sistema compuesto por N jugadores, cada uno deellos con una dotacion de dinero mi. Los N jugadores estan comprometidos en una loterıadonde iterativamente se sortea un par i, j de ellos y se decide, al azar, quien de ellos ’gana’una cantidad δm, y quien ’pierde’ una cantidad igual. Las dotaciones cambian de acuerdocon

[mi,mj ]→ [m′i,m′j ] ≡ [mi − δm,mj + δm] (3.16)

En caso que el agente que ’pierde’ no pueda afrontar el pago de δm, la jugada quedacancelada.

Siguiendo con la analogıa de teorıa cinetica de los gases, cada sorteo es equivalentea la colision de dos moleculas en un gas: la cantidad total de dinero de ambos jugadoresantes y despues del sorteo es la misma ya que mi +mj = m′i +m′j , En el caso de la colisionde dos moleculas, la energıa total de ambas antes y despues de la colision es la misma talcomo lo garanatiza el principio de conservacion de la energıa. Se desea ahora averiguar cuales la probabilidad con que se pueden encontrar agentes con una tenencia de dinero m queresulte estacionaria frente ese tipo de transacciones. Este problema se debe encuadrar enuna la aplicacion del principio de Jaynes que acabamos de enunciar y resolver en la seccionanterior, o sea

maxmi

∑P (mi) log(P (mi))

sujeto a∑

P (mi) = 1 y∑

miP (mi) = M

En realidad, la propiedad ya senalada de la factorizacion de la probabilidad permiteadelantar que la unica forma funcional que la satisface es P (m) = Ae−βm que correspondea la distribucion de Gibbs. Es interesante observar que el papel de la temperatura β estadesempenado por la cantidad promedio de dinero por agente β = 1/T = N/M

Modelos economicos de multiples agentes 23-06-2011

58 3. Modelos estadısticos

Ecuacion maestra. En esta seccion examinaremos en mayor detalle como es el proceso porel que se llega a una distribucion de probabilidades estacionaria en este problema y elcorrespondiente valor de la entropıa.

Para ello supondemos que en el estado inicial todos los agentes comienzan con unacantidad de dinero mi = m∗,∀i y que los intercambios son δm = 1 constante. Definamos ladistribucion de m en el instante t como P (m, t); en realidad, dependiendo de m∗ se tendraun conjunto finito de valores de tenencias m para todos los jugadores. Al iterar la loterıamuchas veces, se espera que la distribucion asintotica llegue a una situacion estacionaria.

Si en cada paso de tiempo se eligen dos jugadores al azar y juegan esta loterıa, laecuacion de evolucion para P (m, t) queda:

∂P (m, t)∂t

= P (m− 1, t)∑j=1

P (j, t) + P (m+ 1, t)∑j=0

P (j, t)

−P (m, t)∑j=1

P (j, t)− P (m, t)∑j=0

P (j, t) (3.17)

para m > 0, y otra similar para el caso especial m = 0. Los primeros dos terminoscorresponden al cambio de P (m, t) debido a que los agentes de m − 1 ’ganan’ δm = 1(jugando contra jugadores de m = 1..N que ’pierden’ δm = 1), y aquellos que tienen m+ 1’pierden’ δm = 1 (jugando contra jugadores que tienen m = 0..N y ’ganan’ δm = 1),respectivamente. Los ultimos dos terminos corresponden a los agentes que tenıan m y’pierden’ o ’ganan’ δm respectivamente. Con la condicion de normalizacion

∑∞j=0 P (j) = 1,

podemos reescribir:

∂P (m, t)∂t

= P (m− 1, t)(1− P (0, t)) + P (m+ 1, t)− P (m, t)(1− P (0, t))− P (m, t)

= [P (m− 1, t) + P (m+ 1, t)− 2P (m, t)]+P (0, t)[P (m, t)− P (m− 1, t)] (3.18)

para m > 05

Esta ecuacion se denomina ecuacion maestra de la evolucion de la distribucion deprobabilidad. Los primeros 3 terminos de (3.18) corresponden a un proceso de ’difusion’de P (m, t). La difusion es un proceso fısico cotidiano, y describe la dispersion homogeneade materia o energıa por efecto de la agitacion termica de las moleculas. En este caso ladistribucion de probabilidad se va ’esparciendo’ homogeneamente por el espacio de fases‡2 .Por el otro lado, el ultimo termino corresponde a un termino de ’transporte’ en la direccionx, con una velocidad proporcional a P (0, t).

Inicialmente todo el m esta distribuido igualitariamente entre todos los agentes, porlo que la distribucion P (0, 0) = P (1, 0) = 0. Mientras esto se mantenga, P (0, t) se mantieneconstante, y la evolucion de P (m, t) corresponde a un proceso puramente difusivo: de

5Para m = 0 suponemos una condicion de contorno ∂mP (m, t)|m=0 = 0, o equivalentemente para mdiscretos, P (−1, t) = P (1, t). Para m = 0 tenemos,

∂P (0, t)

∂t= 2[P (1, t)− P (0, t)] + P (0, t)[P (0, t)− P (1, t)]

= [2− P (0, t)][P (1, t)− P (0, t)]

Como al inicio P (0, t) = P (1, t) = 0, se espera que cuando P (1, t) aumente, P (0, t) tambien lo haga hastatanto P (0, t) ≈ P (1, t), equilibrandose ambos puntos. Esta claro que una vez que sucede esto, la unicamanera que P (0, t) puede decrecer es si P (0, t) crece mas rapido que P (1, t). Concluimos que P (0, t) crecesolo cuando P (1, t) lo hace.

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 59

manera aleatoria algunos jugadores ganan en promedio mas sorteos que los que pierden, yvan a formar parte de la cola ’ganadora’ de P (m, t). Los otros jugadores que en promediopierden, contribuyen a la cola ’perdedora’ de la distribucion. Si se grafica P (m, t) en estemomento, se observarıa una campana alrededor de m∗ =

∑mP (m, t) que se ensancha a

medida que pasa el tiempo. Este es un tıpico proceso ’difusivo’.

En algun momento, comienzan haber jugadores que quedan en ’bancarrota’, por loque P (0, t) > 0. Ahora es cuando el segundo termino de (3.18) comienza entonces a tenerun efecto mas visible. El efecto de ’transporte’ a una velocidad proporcional a P (0, t) >0 hara que la campana comience a deformarse debido a que la proporcion de jugadorescorrespondientes a la cola ’perdedora’ aumenta (P (m, t) − P (m − 1, t) > 0), mientras queaquellos que tengan m del lado ’ganador’ tienden a disminuir (porque P (m, t)−P (m−1, t) <0). Este fenomeno continua hasta que P (0, t) ≈ P (1, t), y deja a P (0, t) constante. Es ahoraque la distribucion corresponde a una funcion exponencial!

En cuanto a la entropıa, inicialmente la distribucion es homogenea, por lo tanto laentropıa es S(0) = 0. A medida que se va ensanchando la distribucion, la entropıa aumenta,siempre acotada por su lımite maximo que corresponde al desorden total correspondiente ala distribucion uniforme. El valor asintotico va a depender de cuantos estados consideramosque tiene m. Para el caso considerado de δm = 1, habrıa Ω = M estados. Por lo que laentropıa maxima deberıa ser S∗ = log(Ω) = log(M).

Modelo computacional. Podemos simular numericamente el proceso de loterıas mediante elcodigo del listado 3.1.

Listado 3.1: Juego de intercambio al azar y distribucion de Gibbs

function [m g hx s ] = gibbs ( m ini , N, t i m t o t a l )

m step = 1 ; % money exchanged per i n t e r a c t i o nm = m ini ∗ ones (1 ,N) ; % i n i t i a l money f o r a l l agent s

o u t s t e p s = N;num bins = 50 ;hx = 1 : num bins ;% c a l c e l v a l o r a s i n t o t i c og = exp(−hx/ m ini )/sum(exp(−hx/ m ini ) ) ;sg = − sum( g .∗ log ( g ) ) ;

f igure (1 )

s = [ ] ;tim = 0 ;while tim < N∗ t im to ta l ,

co in = randint ( 1 , 2 , [ 1 N ] ) ;up = co in ( 1 ) ;down = co in ( 2 ) ;dm = m step∗rand ( 1 , 1 ) ;

i f m(down) < dm,cont inue

end

m(up) = m(up) + dm;m(down) = m(down) − dm;

i f mod( tim , o u t s t e p s ) == 0 ,

Modelos economicos de multiples agentes 23-06-2011

60 3. Modelos estadısticos

[ tim/N, sum(m) ]

% compute entropy at t h i s s t e ph = hist (m, hx ) ;p = h/sum(h ) ;xx = find (p > 0 ) ;s = [ s ; tim/N, −sum(p( xx ) . ∗ log (p( xx ) ) ) , sg ] ;

i f mod( tim , 100∗ o u t s t e p s ) == 0 ,drawplot (p , s , h , hx , m ini ) ;

endendtim = tim + 1 ;

end

% normal ized prob d i s t r i b u t i o nh = hist (m, hx ) ;p = h/sum(h ) ;

g = drawplot (p , s , h , hx , m ini )

end

function [ g , sg ] = drawplot (p , s , h , hx , m ini )

% t h e o r e t i c a l f u n c t i o ng = exp(−hx/ m ini )/sum(exp(−hx/ m ini ) ) ;

subplot (2 , 1 , 1)plot (hx , p , ’ r+’ , hx , g , ’b ’ )%semi logy ( xx , h/sum( h ) , ’ r + ’ , xx , exp(−xx / m agent )/sum( exp(−xx / m agent ) ) , ’ b ’ )xlabel ( ’m’ ) ; ylabel ( ’p (m) ’ ) ;legend ( ’p ( x ) ’ , ’ g ibbs ’ ) ;subplot ( 2 , 1 , 2 )plot ( s ( : , 1 ) , s ( : , 2 ) , ’ b ’ , s ( : , 1 ) , log ( length (p ) ) , ’ r ’ , s ( : , 1 ) , s ( : , 3 ) , ’ g ’ )xlabel ( ’ t ’ ) ; ylabel ( ’ s ’ ) ;drawnow ;

end

Inicialmente todos los jugadores comienzan con la misma dotacion mini. En cadapaso del tiempo se eligen un par de agentes al azar, donde el up va a ganar y el down va aperder. Luego se define la cantidad intercambiada dm como una variable aleatoria entre 0 ymstep. A continuacion se realiza el intercambio, si el ’perdedor’ pueda afrontar su perdida.Al cabo de out steps se realiza un histograma, se calcula la entropıa en ese momento, yse grafican los resultados, comparando la distribucion teorica con exponente 1/mini, con laobtenida mediante la simulacion. Notar que la escala temporal que se registra la entropıas es equivalente a que se haya actualizado por lo menos cada agente una vez.

En la fig. 3.1 se muestran los resultados para N = 500 jugadores. Se ve que ladistribucion asintotica de m converge a la distribucion de Gibbs s† = em/m

∗/∑em/m

∗, con

m∗ = mini. Por otro lado, la entropıa, que comienza en un valor cercano a cero (todos losagentes tiene la misma dotacion inicial), aumenta sostenidamente y tiende asintoticamenteal valor que corresponde Slim =

∑−s† log(s†), manteniendose siempre por debajo del valor

de la entropıa S∗ = log(50) (pues num bins=50) correspondiente al maximo desorden.

Ejercicio 8 Que sucede si elimina la restriccion de no aceptar loterıas que resultarıan en

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 61

A

B

0

1

2

3

4

0 125 250 375 500

t

S(t) S*=log(50) Slim

0

0.03

0.06

0.09

0.12

0 12.5 25.0 37.5 50.0

m

Figura 3.1: (A) Distribucion de m para una loterıa de intercambios.Se superpone la funcion s† = em/m

∗/∑em/m

∗con m∗ = mini. (B)

Serie temporal de la entropıa s(t) = −pm log pm. La curva S∗ = log(50)corresponde al limite desordenado, porque la distribucion P (m) se sub-dividio en 50 estados; mientras que Slim =

∑−s† log(s†) corresponde

a su lımite teorico. La variable t esta en unidades de actualizaciones detodo el sistema de N unidades. Parametros N = 500,m∗ = 10.

Modelos economicos de multiples agentes 23-06-2011

62 3. Modelos estadısticos

la bancarota de un jugador? A que distribucion se llega?

Ejercicio 9 Que espera que suceda si comienza con una distribucion donde no todos losjugadores tienen la misma dotacion inicial?

3.3.3 Intercambios bilaterales entre muchos jugadores

Un ejemplo similar, aunque mas interesante desde el punto de vista de la economıa, es elanalisis de los intercambios bilaterales de Edgeworth entre dos bienes x, y en una poblacionde N jugadores. Supongamos que cada agente tiene existencias Xi = (xi, yi), una funcionde preferencia sobre cada bien Cobb-Douglas tipo u(X) = u(x, y) = α log(x) + β log(y)donde α + β = 1, y en cada iteracion se eligen un par de jugadores al azar que tienen laposibilidad de realizar un intercambio siempre y cuando mejoren o igualen las utilidades deambos jugadores. Nuevamente tenemos un problema donde existe una restriccion operativa,y los intercambios realizados aseguran que se conserva la cantidad total de cada uno de losbienes, por lo que se espera una distribucion de Gibbs para la distribucion de cada uno delos bienes.

Veamos con mas detalle el juego propuesto. El cambio de utilidad sufrido por unjugador que le ofrecen intercambiar cantidades δx y δy de cada producto afectan su utilidaden

δu =α

xδx+

β

yδy (3.19)

Como el jugador acepta intercambios solo si δu ≥ 0, para intercambiar una unidad del bienx tiene dos posibilidades segun las cantidades ofrecidas o demandas del bien y:

• [Compra y, vende x]: acepta intercambios solo si recibe δy ≥ α/xβ/y ≡ py a cambio

de vender una unidad de x (δx = −1)

• [Vende y, compra x]: acepta intercambios donde paga δy ≤ α/xβ/y ≡ py a cambio de

comprar una unidad de x (δx = +1)

En otras palabras, py corresponde al ’precio’ de intercambiar cada unidad de x medido enunidades del bien y.

Supongamos que todos los agentes tienen el mismo α y β. En cada paso del tiempose generan dos vectores ξ1,2 con permutaciones al azar del vector (1, 2, .., N). Esto definelos pares de intercambio que se van a intentar en dicho paso del tiempo. Como cadajugador aparece una vez en cada vector ξ1,2, efectivamente los jugadores pueden realizar 2transacciones por paso de tiempo. Sean los jugadores (A,B) = (ξ1i, ξ2i) que computan susrespectivos precios py(A), py(B). Por lo visto anteriormente, si py(A) > py(B) para queambos mejoren su utilidad (δuA > 0 y δuB > 0), implica que B compra de A bien y poruna unidad de bien x. La cantidad del bien y intercambiada sera δy ∈ (py(A), py(B)). Parasimplificar, tomemos el precio realizado p como el promedio p = (py(A) + py(B))/2 y si lasexistencias lo permiten, se intercambian una unidad del bien x por p del bien y:

XA(t+ 1) = (xA + 1, xB − p)XB(t+ 1) = (xB − 1, xB + p)

Realizamos experimentos numericos para verificar que tipo de distribucion se llegaasintoticamente siguiendo el proceso descripto arriba. La fig. 3.2 muestra la distribucion de

Modelos economicos de multiples agentes 23-06-2011

3.3 Principio de maxima entropıa 63

0

0.05

0.10

0.15

0.20

0 3.75 7.50 11.25 15.00

0

0.05

0.10

0.15

0.20

0 3.75 7.50 11.25 15.00

m

A

B

Figura 3.2: Distribucion de bienes x (A) e y (B) que surgen delmodelo de intercambios bilaterales tipo Edgeworth luego de 5000 pa-sos de tiempo. En cada panel se superpone la funcion f(x) =e−2x/xini/

∑e−2x/xini . Parametros N = 1000, xini = 5, α = 0.4, β =

0.6.

A

B

0

1

2

3

4

0 1250 2500 3750 5000

s

1

10

100

1000

10000

0 17.5 35.0 52.5 70.0

p

Figura 3.3: (A) Serie temporal de la entropıa s(t) = −Px logPx delbien x. La funcion constante representa la entropıa de desorden totalS∗ = log(50). (B) Distribucion de precios promedio de intercambio. Lamisma tiene una forma tipo exponencial. Parametros N = 1000, xini =5, α = 0.4, β = 0.6.

Modelos economicos de multiples agentes 23-06-2011

64 3. Modelos estadısticos

unidades del bien x, e y en toda la poblacion de jugadores luego de 1500 pasos de tiempo(y 3000 intentos de intercambio), habiendo partido de una condicion inicial de existenciasdonde cada jugador tiene un numero aleatorio entre [0, xini] para cada bien. Claramente elproceso va convergiendo a una distribucion de Gibbs, con parametro de escala xini/2 que esjustamente el promedio de existencias para cada bien de la poblacion.

En la fig. 3.3 se muestra como varıa la entropıa del sistema a lo largo del tiempo,junto con el precio promedio de intercambio realizado en cada iteracion. Se observa quela entropıa crece y llega a un maximo, mientras que el precio promedio del sistema fluctuafuertemente. Los precios se disparan cuando alguno de los py del intercambio diverge, yesto ocurre cuando la existencia del bien x es mınima.

3.4 La hipotesis ergodica

La idea que un sistema puede ’visitar’ una cantidad de sus microestados preservando elvalor medio de alguna cantidad como lo suponemos en la (3.13), esta directamente ligadaal concepto de equilibrio.

En los sistemas fısicos que mencionamos en la seccion anterior, siempre se aseguraque la energıa promedio se mantiene constante. Por lo ya visto con la distribucion de Gibbs(3.14), esta hiptesis garantiza que se mantenga inalterada la distribucion de probabilidadescon que se pueden observar los microestados del sistema pero en ningun momento estoimplica que el sistema permanece en un unico microestado sin apartarse de el.

En el ejemplo de la comunidad de jugadores, la distribucion de probabilidad de lastenencias de dinero llega a una situacion estacionaria pero esto no impide que ellos continuenefectuando transacciones, respetando la restriccion impuesta de mantener M constante. Ladistribucion exponencial a la que se llega indica que es exponencialmente mas probableencontrar un jugador en la ruina que muy adinerado. La distribucion permanece inalteradaen tanto no se aporte dinero al sistema o sea que aumente M , ya que esta variable viene adesempenar un papel semejante al de la temperatura de un sistema fısico.

Preservar los valores medios es pues equivalente - en cuanto a la presente discusion - amantenerse en equilibrio. Podrıamos decir que las condiciones del sistema no cambian du-rante lapsos compatibles con el tiempo que media entre observaciones sucesivas del mismo.Los promedios de los que hemos estado hablando hasta ahora, serıan, de este modo prome-dios temporales. Esto agrega una complicacion ya que solo podrıamos calcularlos luego deobservar el sistema a traves de repetidas mediciones extendidas por largos lapsos.

Si sabemos que un sistema visita todos los microestados luego de algun lapso suficien-temente prolongado, podremos estimar la frecuencia de ocurrencia de distintos microesta-dos. A la larga, con buena estadıstica, se puede pensar que en lugar de realizar un promediotemporal (con la complicacion que esto conlleva) es analogo a calcular el promedio en elespacio de fases, tomando todos los microestados, y sumarlos con su respectiva probabilidadde ocurrencia. Esto es lo que implica la siguiente

Definicion 13 (Hipotesis ergodica) Los valores medios temporales (a lo largo de la evolucion)son equivalentes a valores medios sobre densidades de probabilidad independientes del tiempoque solo dependen de los estados internos del sistema.

Esto significa que, por un lado podemos calcular promedios temporales observandola evolucion del sistema y registrando los microestados que va ocupando y por el otro, en

Modelos economicos de multiples agentes 23-06-2011

3.4 La hipotesis ergodica 65

un dado instante, podemos calcularlo pesando cada uno de los microestados del volumenaccesible del espacio de las fases por su probabilidad de ocurrencia. La hipotesis ergodicadice que ambos promedios son enteramente equivalentes y dan el mismo resultado.

Esta hipotesis fue objetada para ciertos sistemas fısicos y se pudo tambien demostrarsu validez en otros. Se sabe que la dinamica de algunos sistemas, dependiendo de la condicionde la que se parte, puede terminar por atrapar al sistema en una region acotada del espaciode fases. Sin embargo en muchas situaciones reales de interes, si eso ocurre, se da encircunstancias tan especiales que pueden despreciarse sin problemas. Es sin embargo buenotener en cuenta que para que la distribucion de probabilidades sea la de Gibbs, ademasde cumplir con que se mantenga constante un valor medio, se debe cumplir la hipotesisergodica para calcular correctamente dichos promedios.

Representacion esquematica de lo que implica la hipotesis ergodica.

Figura 3.4: Representacion esquematica de lo que implica la hipotesisergodica.

En la figura fig. 3.4 estan representados esquematicamente los elementos que inter-vienen en la hipotesis ergodica. En la izquierda se representa la evolucion temporal delsistema que en instantes sucesivos ocupa microestados diferentes. Estos estan resaltadoscon un cırculo de mayor tamano. En la derecha se representa una densidad de probabili-dad independiente del tiempo, mostrado los estados inaccesible con probabilidad nula. Sesupone que si se observara una evolucion suficientemente prolongada, se podrıa detectar alsistema visitando todas las regiones del espacio de las fases pasando en cada una de ellasun tiempo proporcional al numero microestados accesibles de esa region. La probabilidadque se le asigna a cada porcion se toma proporcional al tiempo que el sistema permaneceen ella en el decurso de su evolucion temporal.

En una situacion de equilibrio el sistema solo visita una fraccion reducida del espaciode fases. La evolucion por la que el sistema relaja a esa situacion queda afuera del conceptode ergodicidad porque el sistema no vuelve a visitar nunca los estados de los que partio.En el modelo de intercambios bilaterales en una comunidad de jugadores de la seccion3.3.3, el proceso de relajacion hasta alcanzar la distribucion exponencial de tenencias de

Modelos economicos de multiples agentes 23-06-2011

66 3. Modelos estadısticos

dinero se inicializa el sistema en una situacion que luego no vuelve a visitar nunca mas.La hipotesis ergodica es aplicable en cambio a la evolucion posterior del sistema en la quevisita distintos microestados debido a las continuas transacciones de la loterıa, compatiblescon una distribucion exponencial estacionaria.

El concepto de equilibrio que es comun en la fısica o la quımica contiene estas fluc-tuaciones. Puede pensarse que se trata de un equilibrio dinamico ya que los elementosdel sistema no cesan de evolucionar preservando de cualquier manera una distribucion deprobabilidad. Un ejemplo cotidiano de equilibrio de esta naturaleza es la de una personacon zancos o un equilibrista sentado en un monociclo: ambos deben efectuar cuidadososmovimientos de vaiven para mantenerse encaramados en sus disposiciones. Esta idea, queen la fısica posee otros alcances, es aplicable al presente contexto. Se suele hablar de estetipo de equilibrio cuando un sistema posee una dinamica que preserva inalteradas distribu-ciones o valores medios de algunos parametros que lo describen.

Es en general sumamente difıcil demostrar que un sistema fısico se ajusta a la hipotesisergodica y, de hecho, existen circunstancias en las que se ha comprobado con experimentosnumericos que la misma no es aplicable. Sin embargo la mecanica estadıstica ha sidoutilizada con gran exito en una variedad enorme de situaciones. Por otro lado parecieraque esta hipotesis es particularmente util y aplicable describiendo sistemas no lineales conun numero creciente de elementos. Esta es una situacion relevante al tipo de interaccionesque pueden tener lugar en un sistema social.

3.5 Metodos de Monte Carlo

Por lo hasta aquı visto y para la mecanica estadıstica la distribucion de probabilidadesP (Xi) encierra toda la informacion relevante de un sistema. Sin embargo, en aplicacionespracticas la utilizacion de dicha distribucion puede dificultarse. Por ejemplo para utilizarla distribucion P (Xi) para obtener los promedios de una funcion Y (Xi) en la forma Y =∑

i Y (Xi)P (Xi), es necesario sumar sobre todos los estados del espacio de fases y conocer ladistribucion P (Xi) en todos esos puntos. La cantidad de estados, diverge exponencialmentecon el numero de dimensiones, y en la mayorıa de los casos practicos se vuelve imposibleenumerar todos los estados para calcular correctamente un promedio. Se hace entoncesnecesario disponer de un metodo para muestrear la distribucion en un subespacio menor,y que el mismo no introduzca un sesgo en el calculo del promedio. Esto se conoce como elproblema del muestreo.

3.5.1 El muestreo de una distribucion P (x)

Se trata de obtener muestras xi de la distribucion P (x) donde el soporte de la funcion seencuentra acotado: x ∈ [a, b]. El metodo directo consiste primero en obtener una muestraξ de una distribucion uniforme en el rango [0, 1], y de ello obtener una variable aleatoriaxi = a+ (b− a)ξ, tal que xi ∈ [a, b]. Con una segunda muestra ζ ∈ [0, 1] de la distribucionuniforme, podremos asegurar que xi es una muestra de P (·) si se cumple que ζ < P (xi);en caso contrario se descarta la muestra. Es claro que este metodo va probando uniforme-mente el espacio de fases (en este caso unidimensional), y se torna impracticable cuando lasdimensiones de P (·) aumentan.

§ Ejemplo distribucion uniforme

Modelos economicos de multiples agentes 23-06-2011

3.5 Metodos de Monte Carlo 67

Si la distribucion que se desea muestrear P (x) es uniforme, como la funcion es in-dependiente de x, solo es necesario comparar muestras uniformes con P (x). El siguienteejemplo obtiene n muestras de la distribucion uniforme en el rango x ∈ [0, 10] y grafica ladistribucion de probabilidad obtenida.

n = 10000 ;r e s = [ ] ;for i = 1 : n ,

r r = rand ( ) ;i f r r < 1/10 ,

r e s = [ r e s ; r r ] ;end

end

hist ( r e s )

[mean( r e s ) , sqrt ( var ( r e s ) )/ sqrt (n ) ]

La funcion hist() genera un histograma de las muestras, y la ultima sentencia calculael promedio de la muestra y el error estandard de la media calculada. Como se puede ob-servar, al aumentar n el error estandard decrece y la distribucion se aproxima a la uniformeen el rango [0, 10].

Ante este escenario, se torno necesario contar con metodos que sean capaces de aprox-imar promedios. La idea de estos metodos es obtener muestras de la distribucion que seanrepresentativas (por la frecuencia de su ocurrencia), y basar los promedios en sumas sobreesas muestras. Veremos que algunos metodos utilizan la hipotesis ergodica, donde en vezde sumar sobre todos los estados, se podrıa sumar a lo largo de una trajectoria Xi(t) du-rante un tiempo suficientemente largo. Esto se conoce en estadıstica como el problema delmuestreo.

En la decada del 40, aprovechando el desarrollo de las primeras computadoras, Metropo-lis y colaboradores, retomaron el estudio del problema de muestreo aplicado a colisiones conneutrones, dando de paso origen a la fısica computacional. John von Neumann fue uno de losque impulso dichos estudios, dandole el nombre de “Monte Carlo” por los conocidos casinosdel Principado de Monaco. Con el tiempo estos metodos de muestreo de distribuciones deprobabilidad se conocieron como “metodos de Monte Carlo”. Se han implementado variasvariantes de este metodo y dentro de las que estudiaremos en las siguientes secciones estael algoritmo de Metropolis, la dinamica de Glauber o muestreo de Gibbs y el “recocidosimulado”.

Antes de comenzar, es importante destacar que estos metodos parten de una dis-tribucion de probabilidades conocida, y no es necesario conocer cual es la dinamica propiaque dio lugar a ella. Por lo general esta distribucion es la de Gibbs. La “trayectoria” a lacual se hace referencia, debe entenderse como una secuencia de muestras Xit obtenidaspor una dinamica propia del metodo6 y no necesariamente del sistema estudiado. En casode no conocer la distribucion, evoluciones temporales de la dinamica pueden servir paraconstruir tanto la distribucion de probabilidades como las muestras.

6Esta dinamica corresponde a una cadena de Markov, con algunas propiedades que aseguren que laevolucion de la distribucion de la cadena, converja a la distribucion deseada P (Xi).

Modelos economicos de multiples agentes 23-06-2011

68 3. Modelos estadısticos

3.5.2 Algoritmo de Metropolis

Partiendo de una condicion inicial elegida al azar X0, este algoritmo genera una sucesionde muestras. Esta condicion incial corresponde a un microestado del sistema que se suponedeterminado por una unica variable. En la iteracion t de la evaluacion se genera una nuevamuestra Xt. La nueva muestra Xt+1 se calcula siguiendo los siguientes pasos:

(a) Se calcula la probabilidad P (Xt).

(b) Se elige una nueva muestra X ′ y se evalua P (X ′).

(c) Si P (X ′) > P (Xt) se acepta como nueva muestra X ′ y se define Xt+1 ≡ X ′.

(c1) Si P (X ′) < P (Xt) con probabilidad P (X ′)/P (X0) se acepta como nueva muestra X ′

y se define Xt+1 ≡ X ′.

(c2) En caso contrario, se toma como nueva muestra la anterior Xt+1 ≡ Xt.

Este algoritmo requiere correr una serie de pasos iniciales tmin que son descartados, ysolo a partir de t > tmin se consideraran legıtimas muestras de la distribucion P (X). Estedescarte inicial sirve para asegurarse que la distribucion de la cadena haya convergido aP (X). Este metodo puede expresarse como una cadena de Markov.

3.5.3 Dinamica de Glauber o muestreo de Gibbs

En este caso nuevamente se parte de una condicion inicial elegida al azar, y el algoritmo gen-era una sucesion de muestras Xt a cada paso t. A diferencia del metodo de Metropolis, lanueva muestra no depende de la muestra anterior. Este metodo se aplica cuando el espaciode fases es multidimensional; digamos Xt = (x1, x2, ..., xN ), y en vez de calcular la proba-bilidad conjunta P (x1, x2..., xN ), para cada nueva muestra, se elige una coordenada al azarj y se toma una muestra de esa coordenada de la probabilidad condicional P (xj |xii 6=j).

Esta dinamica es aplicable por ejemplo a un AC en el que cada celda es actualizadaindependientemente para generar la sucesion de muestras. Se basa en la idea que los cambiosconjuntos en los que cambian simultaneamente mas de una coordenada de los microestadosXi posee una probabilidad despreciable. De esta manera la distribucion se va aproximandosegun cada una de las coordenadas elegidas al azar.

3.5.4 Recocido simulado

Ambos metodos fueron utilizados con exito para resolover problemas de optimizacion com-binatoria. Las bases conceptuales del metodo de recocido simulado (Kirkpatrick, Gelatt,Jr. and Vecchi, 1983) fueron tomadas de la practica usual de someter piezas metalicasa un tratamiento termico para eliminar las tensiones residuales que haya quedado comoresultado de procesos previos de forja o laminado. En dichos tratamientos las piezas soncalentadas primero a una temperatura elevada y luego se las enfrıa gradualmente segun unprotocole establecido. Las tensiones internas estan asociadas a una energıa interna elevaday su eliminacion lleva al sistema a un mınimo de su energıa que, por otra parte, correspondea su equilibrio termodinamico.

El procedimiento numerico se ha aplicado exitosamente en una gran diversidad desituaciones en las que no estan realmente involucrados sistemas fısicos. En estas aplicacionesse asimila la energıa a una funcion de costo cuyo extremo se desea obtener y la temperatura

Modelos economicos de multiples agentes 23-06-2011

3.5 Metodos de Monte Carlo 69

es tan solo un parametro de control que regula cambios aleatorios que permiten la busquedadel mınimo.

Consideremos para fijar ideas que el problema consiste en encontrar la configuracionparticular de celdas activas (si = +1) e inactivas (si = −1) de un automata celular de Ncelulas que hagan mınima una funcion E(si). Ambos metodos de Montecarlo explicadosarriba pueden utilizarse para encontrar una sucesion de configuraciones internas Xt ≡ sitque conducen al sistema al mınimo de E. Es facil ver que aquellos problemas donde lafuncion de costo E(si) es aditiva (o sea que se puede expresar como una suma de terminosen que cada uno afecta a una celula del sistema), el metodo puede brindar soluciones muybuenas en tiempos de computo razonables.

El metodo de recocido simulado utiliza el algoritmo de Glauber-Metropolis, junto aun protocolo de enfriamiento presuponiendo una funcion de distribucion de Gibbs. Es-quematicamente se puede resumir en los siguientes pasos:

• Se supone que el sistema se encuentra a una temperatura T elevada. Se alteranrepetidamente el valor de las variables si y se comprueba que < E > es constante.Se elige un estado de referencia Xt=0 a partir del cual se construira una secuencia demicroestados Xt ≡ sit que conduzcan a un mınimo de < E >.

• Se disminuye T .

• Se cambia una de las variables sj del estado de referencia y se calcula ∆E. Si la funcionE(si) es aditiva ∆E depende solo de la variable que cambio y hace al algorimto muyeficiente.

• Si ∆E < 0 se acepta el cambio en sj redefiniendo el estado de referencia Xt+1

• Si ∆E > 0 solo se acepta el cambio en si con una probabilidad determinada por ladistribucion de Gibbs para esa temepratura y < E >.

• Se repiten los pasos a partir del segundo.

• El protocolo de enfriamiento se detiene cuando los cambios en < E > son aceptable-mente pequenos. El enfriamiento debe en general ser ajustado para cada caso. Por logeneral se utilizan variantes en el que sucesivas temperaturas siguen una ley del tipoTk = ηTk−1 con η < 1.

Este algoritmo explora muestras de los si en la region de mayor probabilidad de dis-tribucion P (X) gobernada por el parametro T y compatible con una dada energıa promedio.Para el caso de una distribucion de Gibbs, las regiones de mayor probabilidad correspondena las de mınima energıa < E >, con lo que el efecto de este muestreo es seleccionar losmicroestados de mınima energıa a una T dada. En un equilibrio a una dada temperaturael sistema “visita” distintos microestados, manteniendo inalterado ese valor medio. Si latemperatura disminuye y se permite que el sistema relaje a un nuevo equilibrio, los microes-tados que se visitaran son un subconjunto de los anteriores. En ellos las distintas partes delsistema se acomodan eliminando las interacciones que tienden a aumentar su energıa.

El hecho que no se rechacen algunas configuraciones que conducen a un aumento dela funcion costo, hace que en la poblacion de microestados en cada equilibrio intermediose encuentren representadas situaciones a las que no se habrıa podido llegar si solo seaceptan cambios que conducen a la disminucion del costo. Es util visualizar el proceso deoptimizacion como el descenso por las laderas de un paisaje accidentado cuyas alturas estan

Modelos economicos de multiples agentes 23-06-2011

70 3. Modelos estadısticos

dadas por la funcion que se desea minimizar. Hallar el optimo consiste en encontrar el vallemas profundo de ese paisaje. Con esta imagen in mente, las fluctuaciones termicas actuanpermitiendo ’saltar’ por encima de ’barreras’ formadas por maximos locales del costo eimpiden que la busqueda del mınimo quede estancada en mınimos secundarios. Permitenası acceder a los microestados de los valles mas profundos. Este proceso esta ejemplificadoen la fig. 3.5. Si el proceso de enfriamiento es muy rapido, puede ocurrir que no se visitetoda la region compatible con esa energıa y el sistema quede atrapado en un mınimo localdel que no podra salir.

Dado que esta heurıstica no esta limitada por la dimensionalidad del problema, hatenido particular exito en la solucion de problemas de optimizacion combinatoria. Estafamilia de problemas es muy vasta y es un campo activo de investigacion. Habitualmentese los denomina como problemas NP (por No Polinomicos) porque el tiempo para procesarlos algoritmos para resolverlos llevan un tiempo que crece mas rapidamente que cualquierpotencia en el numero de datos de entrada. Un problema de esta naturaleza es, por ejemplo,el problema del viajante de comercio que consiste en encontrar el recorrido que pasa porN ciudades que hace que la distancia total recorrida sea mınima‡3. Otros problemas NP,involucran restricciones temporales tales como las que ocurren en la asignacion de horariosde clases o en los turnos de un hospital, y, en general, todos los problemas de coordinacionentre agentes economicos.

En el algoritmo de Metropolis es posible demostrar que

d〈E(T )〉dT

=〈E(T )2〉 − 〈E(T )〉2

T 2(3.20)

con lo que se dispone de una estimacion de las fluctuaciones de la funcion costo a lo largodel proceso de optimizacion.

Figura 3.5: Se ejemplifica el proceso de optimizacion como la busquedade un mınimo en un paisaje accidentado. Temperaturas mas elevadaspermiten explorar regiones mas amplias del espacio de las fases y suce-sivos enfriamientos reducen esa busqueda a microestados mas proximosal optimo evitando quedar estancados en mınimos locales.

Modelos economicos de multiples agentes 23-06-2011

3.5 Metodos de Monte Carlo 71

3.5.5 El problema del viajante

Una aplicacion interesante del recocido simulado es para resolver el conocido problema delviajante: dadas N ciudades se trata de encontrar la secuencia de visitas que debe realizarun viajante que desea minimizar la distancia recorrida.

Primero introducimos un primer codigo que genera una matriz de posiciones aleatoriaspara n posiciones, y dividida en k grupos. La escala maxima de las coordenadas es 1000.

Listado 3.2: Generacion de posiciones aleatorias para el problema del Viajante

function pos = tsp pos g rupos (n , k )

e s c a l a = 1000 ;

pos = [ ] ;

while k > 0 ,one = round(rand (1 , 2 )∗ e s c a l a ) ;pos = [ pos ; one ] ;for n = 1 : n/k

pos = [ pos ; round(rand (1 , 2 )∗ e s c a l a /k/10) + one ] ;endk = k − 1 ;

end

end

En el siguiente codigo, tenemos el algoritmo de recocido simulado sobre el problema delviajante. La funcion fitness toma un vector de orden de visitas, y conociendo las distanciasentre los pueblos, recorre el viaje en dicha secuencia y suma las distancias correspondientes,obteniendo la longitud del viaje. La funcion swap busca al azar dos pueblos en la secuenciaactual y genera una nueva con las posiciones intercambiadas. Si en la nueva secuenciade visitas el fitness es menor, se acepta el cambio. Ahora si el fitness es mayor, con unaprobabilidad dependiente del cambio de fitness se acepta el cambio. En esta implementacion,el enfriado se hace luego de una cantidad de cambios propuestos. Asi mismo, luego de cadacambio de temperatura, se reintroduce la mejor solucion.

Listado 3.3: Algoritmo de recocido simulado para el problema del Viajante

function [ anneal , a l l f i t s ] = t sp annea l ( pos , opts )rand ( ’ seed ’ , 1223)

o u t s t e p s = 2500 ;max steps = 2000000;

temp step = 1 . 1 0 ;sta temp = 10 ;min temp = 0 .000001 ;f i t s t e p s = 5000 ;

anneal . n = length ( pos ) ;

% d i s t a n c e matrixmat = zeros ( anneal . n , anneal . n ) ;for k1 = 1 : anneal . n ,

for k2 = k1+1: anneal . n ,d i s t = sqrt (sum( pos ( k1 , : ) . ˆ 2 + pos ( k2 , : ) . ˆ 2 ) ) ;mat( k1 , k2 ) = d i s t ;mat( k2 , k1 ) = d i s t ;

end

Modelos economicos de multiples agentes 23-06-2011

72 3. Modelos estadısticos

end

anneal . orden = randperm( anneal . n ) ;anneal . bes t = anneal . orden ;[ anneal . f i t ] = f i t n e s s ( pos , mat , anneal . orden )anneal . b e s t f i t = anneal . f i t ;

anneal . temp = sta temp ;anneal . count swap = 0 ;anneal . changed = 0 ;

f igure ( 1 ) ; p l o t s o l ( pos , anneal . orden ) ;

a l l f i t s = [ ] ;m i n i f i t s = [ ] ;anneal . s a m e f i t = 0 ;anneal . r e j e c t i o n s = 0 ;

anneal . n o t f i n i s h e d = 1 ;anneal . s tep = 1 ;while ( anneal . s tep < max steps & anneal . n o t f i n i s h e d == 1)

anneal = swap ( anneal , pos , mat ) ;

m i n i f i t s = [ m i n i f i t s ; anneal . s tep anneal . f i t ] ;

anneal . s tep = anneal . s t ep + 1 ;anneal . changed = anneal . changed + 1 ;

i f anneal . changed > anneal . n∗100 | | mod( anneal . count swap , f i t s t e p s ) == 0 ,

anneal . count swap = anneal . count swap + 1 ;

anneal . changed = 0 ;% s e t s b e s t so f a r f o r next l e v e lanneal . orden = anneal . bes t ;anneal . f i t = anneal . b e s t f i t ;

anneal . temp = anneal . temp/ temp step

f igure ( 1 ) ; p l o t s o l ( pos , anneal . orden ) ;i f ˜isempty ( a l l f i t s )

f igure ( 2 ) ; plot ( a l l f i t s ( : , 1 ) , a l l f i t s ( : , 2 ) ) ;end

endi f anneal . temp < min temp ,

anneal . n o t f i n i s h e d = 0 ;end

i f mod( anneal . step , o u t s t e p s ) == 0 ,a l l f i t s = [ a l l f i t s ; anneal . s tep m i n i f i t s (end , 2 ) ] ;m i n i f i t s = [ ] ;f igure ( 1 ) ; p l o t s o l ( pos , anneal . orden ) ;f igure ( 2 ) ; plot ( a l l f i t s ( : , 1 ) , a l l f i t s ( : , 2 ) ) ;%pause ( ) ;

endend

[ anneal . step , anneal . count swap , anneal . temp ]

f igure ( 1 ) ; p l o t s o l ( pos , anneal . bes t ) ;

Modelos economicos de multiples agentes 23-06-2011

3.5 Metodos de Monte Carlo 73

end

function [ d i s t ] = f i t n e s s ( pos , mat , orden )

d i s t = 0 ;for k = 1 : length ( orden )−1 ,

x = orden ( k ) ; y = orden ( k+1);d i s t = d i s t + mat(x , y ) ;

endd i s t = d i s t + mat( orden ( length ( orden ) ) , orden ( 1 ) ) ;

end

% swaps two p o s i t i o n sfunction anneal = swap ( anneal , pos , mat)

% random p o s i t i o nxx1 = round(rand ( )∗ ( anneal . n−1))+1;xx2 = round(rand ( )∗ ( anneal . n−1))+1;

i f xx1 ˜= xx2 ,orden = anneal . orden ;

k1 = orden ( xx1 ) ; k2 = orden ( xx2 ) ;oo = orden ; oo ( xx1 ) = k2 ; oo ( xx2 ) = k1 ;f i t n e w = f i t n e s s ( pos , mat , oo ) ;f i t d i f = f i t n e w − anneal . f i t ;

i f f i t d i f < 0 | | ( f i t d i f > 0 && rand ( ) < exp(− f i t d i f / anneal . temp ) )

orden ( xx1 ) = k2 ;orden ( xx2 ) = k1 ;

anneal . orden = orden ;anneal . f i t = f i t n e w ;anneal . count swap = anneal . count swap + 1 ;anneal . changed = 0 ;

elseanneal . r e j e c t i o n s = anneal . r e j e c t i o n s + 1 ;

end

i f anneal . b e s t f i t > anneal . f i t ,anneal . bes t = orden ;anneal . b e s t f i t = f i t n e w ;

end

endend

% p l o t s s o l u t i o nfunction p l o t s o l ( pos , orden )

plot ( pos ( : , 1 ) , pos ( : , 2 ) , ’ r . ’ ) ;hold onplot ( pos ( [ orden , orden ( 1 ) ] , 1 ) , pos ( [ orden , orden ( 1 ) ] , 2 ) ) ;hold o f fdrawnow

end

Podemos probar el algoritmo mediante:

pos = tsp pos g rupos (12 , 4)t sp annea l ( pos )

Modelos economicos de multiples agentes 23-06-2011

74 3. Modelos estadısticos

El recorrido aleatorio inicial, posee muchos tramos entre grupos, por lo que la distancia deese primer intento es muy larga. En muy pocos pasos se logra reducir la distancia total,dejando tan solo dos tramos para viajar entre grupos. Luego en forma mas paulatina,se minimiza las distancia en cada uno de los grupos, gracias al descenso paulatino de latemperatura. En la fig. 3.6A se ve que en los primeros pasos se obtiene una buena solucionque luego se va a redescubrir en muchas ocaciones posteriores. La solucion final obtenidafig. 3.6B, no es la solucion optima del problema.

0

200

400

600

800

0 275 550 825 1100

B

16900

16925

16950

16975

17000

0 500000 1000000 1500000 2000000

Adist

Figura 3.6: Problema del viajero resuelto con el algoritmo de recocidosimulado. (A) Serie temporal de la distancia de cada solucion a medidaque itera el algoritmo. Se ve que a medida que la temperatura dismin-uye, se van probando soluciones de menor variacion de distancia. (B)Solucion final obtenida luego de 106 iteraciones. Los puntos representanlas coordenadas de las ciudades elegidas al azar. Parametros: N = 12,distribuidos en 4 grupos.

Uno de los inconvenientes de este tipo de metodo a la hora de implementarlo, esjustamente definir con que ritmo se reduce la temperatura. Si se realiza muy temprano, lasbusquedas subsiguientes estaran confinadas en una distancia mas pequenas, y por lo tantosi no se entro en una buena solucion, es altamente improbable que se pueda lograr una vez“enfriado” el sistema.

3.6 El modelo de Ising

El enfoque estadıstico ha servido extensamente para analizar situaciones en las que cambia elordenamiento interno de un sistema. Muchos de estos estudios se han basado en un modeloelaborado por Ising (Ising, 1925) para el estudio de medios magneticos. Este esquemafue repetidamente aplicado sin cambios conceptuales importantes para la descripcion desistemas de muy diversa naturaleza, incluyendo problemas sociales y economicos7.

Este paradigma toma como base un conjunto de N agentes entre los que es posibledefinir una vecindad espacial por lo que se los suele suponer ubicados en los nodos deuna grilla. Se supone ademas que enfrentan una opcion binaria de comprar o vender, deacompanar una opinion u oponerse a ella, etc. Ambas opciones suelen ser representadaspor una variable si = ±1 con i = 1, 2 . . . N . En numerosas oportunidades se las representacon una flecha con dos orientaciones posibles arriba≡ +1 y abajo≡ -1.

7Una medida del exito de este modelo es que se han publicado 12000 artıculos sobre el mismo entre 1969y 1997.

Modelos economicos de multiples agentes 23-06-2011

3.6 El modelo de Ising 75

En este modelo, se permite que las variables individuales si puedan cambiar porefecto de la vecindad o por efecto del azar. El primero de ambos efectos se representa porla interaccion de un agente con sus vecinos y cumple el mismo rol que las conexiones quecada celulas posee con sus vecinas en un AC. Para el esquema de Ising se utiliza

Ei,k = −Jsisk (3.21)

donde i y k son dos celdas y J es una constante. Se supone ademas que cada celda k delAC interactua solo con las vecinas mas proximas. Representaremos con n(k) esa vecindad.Seguimos la misma convencion que se introducjo en el Cap. 1 acerca de los automatas uni- ybidimensionales: Si las celdas estan ubicadas en una grilla unidimensional n(k) contendransolamente las celdas a la derecha y a la izquierda pero si la grilla posee dos dimensionesn(k) tendra los cuatro vecinos que se encuentran arriba, abajo a la derecha y a la izquierda.

Con estas condiciones se puede definir una energıa para el total del sistema que es

Etot = −12

∑i∈n(j)

Jsisj (3.22)

El factor 1/2 compensa el doble conteo de la sumatoria. Con estas convenciones Etot es unavariable extensiva porque es proporcional a su tamano medido por el numero de celulas delAC. Merced as signo - en 3.21, si J > 0, dos celdas vecinas con le mismo signo poseen unaenergıa menor que si los tienen opuestos; si en cambio J < 0 el mınimo de la energıa sealcanza en configuraciones con celdas vecinas con signos opuestos. Con estas convenciones,el modelo de Ising puede representar la dinamica de cambio de opiniones en el que cadaagente esta influido poe la mayorıa de sus vecinos a adoptar una opinion (J > 0) o arechazarla (J < 0).

Para J > 0 el mınimo de la energıa de todo el AC se alcanza cuando todas las celdastiene el mismo signo. En el caso de un modelo de opinion corresponde a un consensoabsoluto. En una situacion general puede suponerse en cambio que J dependa de lasceldas particulares que estan vinculadas, o sea J ≡ Ji,k. Un caso interesante se presentacuando coexisten pares en los que J > 0 y J < 0. Supongamos tres celdas en los verticesde un triangulo en el que dos de los vınculos de, digamos, las celdas 1 y 2 y 2 y 3 sonJ1,2 = J2,3 = Ja > 0 y el de las celdas 1 y 3 es J1,3 = Jr < 0. En este caso la configuracionde celdas que corresponde a un mınimo de la energıa queda indefinida ya que siempre habrauna celda que no posee el signo que hace mınima la interaccion con alguna de sus vecinas.Esta situacion que conduce a estados de equilibrio inciertos recibe el nombre frustracion.Si se trata de un modelo de opinion esta situacion es la que impide que se pueda producirun consenso absoluto.

Ejercicio 10 Utilizando 3.22 calcule la energıa interna de un sistema para todos los mi-croestados posibles de tres celdas. Utilice las convenciones dadas en el texto con |Ja| =|Jr| = J y verifique que no existe un mınimo absoluto de la energıa

El modelo de Ising se completa con la presencia del azar. Este se representa por unparametro externo de control T , que en modelos fısicos corresponde a la temperatura. Si sesupone que el sistema se mantiene a una temperatura constante las variables de cada celdafluctuan constantemente. Podemos preguntarnos cual sera su distribucion si se exige que laenergıa total del sistema se mantiene constante. Estamos exactamente en las condicionesque exploramos mas arriba para la aplicacion del principio de maxima entropıa. En esascondiciones las variables de cada celda acomoden su valor al azar con una distribucioncompatible con la de Gibbs,

P (si) = e−βEtot(si)/Zβ, β = 1/T (3.23)

Modelos economicos de multiples agentes 23-06-2011

76 3. Modelos estadısticos

3.6.1 Transiciones en el modelos de Ising

Si J > 0 y la temperatura es muy elevada T Etot, la distribucion de probabilidad espracticamente uniforme y deberıa aproximar a 1/Ω(N), donde Ω(N) = 2N es la cantidadde configuraciones posibles con N variables binarias. En esta situacion cada celda poseeun valor que es al azar e independiente de su vecindad, por lo que esta se denomina unafase desordenada. Por el otro lado, si la temperatura es muy baja, las configuracionesmas probables son aquellas de mınima energıa. Si J > 0 las interacciones locales ganan alas fluctuaciones termicas y las situaciones de vecinos con una misma orientacion logranenergıas mas bajas. La configuracion de mınima energıa es la de todas las celdas con unmismo valor. Esta configuracion corresponde a una fase ordenada del sistema.

Este analisis sugiere la posibilidad de que exisita un valor crıtico de la temperaturaT = Tc para el que se produzca una transicion profunda que lleve al sistema de una situacionde orden a otra de desorden. Para poder capturar esta transicion, se define un parametrode orden,

M =∑i

si/N (3.24)

que mide cuan semejante es la orientacion de la totalidad de las celdas: tendremos M ≈ ±1cuando el sistema esta en una fase ordenada, y M ≈ 0 en el caso que sus valores estendistribuidos al azar.

Esta es una transicion orden-desorden que es tanto mas brusca cuanto mas numerosasson las celdas del AC. Esta transicion de fase representa un cambio profundo en la estructuradel sistema frente a cambios pequenos en los parametros que lo controlan. Esta transicionesta gobernada por la interaccion entre los vecinos mas proximos de cada celda y se reflejaen un cambio global del sistema. La estructura del sistema en el entorno de ese valorcrıtico de la temperatura posee caracter”ısticas que recuerdan la ocurrencia de “gotas” enel modelo de condensacion presentado 1.5.2. En el caso de Ising se producen regiones enlos que todas las celdas poseen el mismo signo y el tamano de las mismas se distribuyesiguiendo una ley de potencias por lo que no poseen un tamano medio. Mas adelante severa como una transicion de esta naturaleza puede describir el desencadenamiento de unaestampida debida al panico.

Las transiciones de fase en el modelo de Ising pueden ser analizadas por medio de ladinamica de Glauber que ya fue presentada en la seccion anterior. Para esto es necesariocalcular el costo en energıa que corresponde a la reorientacion de una celda suponiendo quelas demas no cambian. Este costo determina la probabilidad con que una celda cambiasj → −sj a una dada temperatura.

Sean cada uno de esos estados X+1 = (..., sj = 1, ...) y X−1 = (..., sj = −1, ...). Aellos se les asocia, respectivamente, las energıas E+1 y E−1. De acuerdo con lo dicho en laseccion anterior, se puede decir que para una dada temperaura T , vale que

P (X+1) =e−E+1/T

Zs(3.25)

P (X−1) =e−E−1/T

Zs(3.26)

conZs = e−E+1/T + e−E−1/T (3.27)

porque P (X+1) + P (X−1) = 1. Resulta entonces que

P (X+1) =1

1 + e∆E/T; ∆E = E+1 − E−1 (3.28)

Modelos economicos de multiples agentes 23-06-2011

3.6 El modelo de Ising 77

y (P (X−1) = 1− P (X+1)) que son solo funcion de la diferencia de las dos energıas involu-cradas.

Si se mantiene constante T , en sucesivas observaciones del sistema, este debe ser en-contrado en los estados X+1 o X−1 con las correspondientes probabilidades dadas arriba.Hemos ası obtenido el costo energetico de cambiar la orientacion de una celda y la prob-abilidad que dicho cambio tenga lugar a una dada temperatura T . De acuerdo con estasecuaciones se debe pensar que el aporte de una mayor temperatura hace que el sistemapueda sufrir, con una creciente probabilidad, la reorientacion de celdas que comporten ungran cambio en energıa y recıprocamente una menor temperatura permite con apreciableprobabilidad solo reorientaciones que impliquen un reducido costo energetico.

Figura 3.7: Comparacion entre la probabilidad de transicion de GlauberP (X+1) = 1/(1 + exp(∆E/T )) y la de Metropolis P (X+1) =min(1, exp(∆E/T )) como funcion de la diferencia de energıa ∆E =E+1 − E−1. La escala de la energıa es arbitraria y se comparan a 2temperaturas diferentes.

La probabilidad de la actualizacion queda dada por la ecuacion (3.28) que involucra elcosto energetico de un cambio de orientacion dado por (∆E). La probabilidad de observarun cambio de orientacion se muestra en la fig. 3.7. Si el sistema tiene inicialmente susceldas si en alguna configuracion (cuya energıa es E−1), es necesario aportar ∆E > 0 paracambiar el valor de una unica celda. Si ∆E T la exponencial en el denominador de (3.28)se aproxima a 1 y P (+1) ' 1/2 que significa que el salto de energıa necesario para redefinirel valor de una celda es despreciable frente a T con lo que el sistema puede ser observado enel estado X−1 donde se encontraba o en el X+1 con esencialmente la misma probabilidad.Cuando T es menor, el estado X+1 solo tiene una probabilidad ser observado si se aportauna energıa que supera el valor ∆E. Cuando T ' 0 esto en cambio sucede con P = 1 si∆E tiene el valor apropiado.

Ejercicio 11 Modifique la funcion ising() para encontrar muestras de la distribucion deequilibrio usando la dinamica de Glauber.

3.6.2 Ejemplo numerico del modelo de Ising

En lo que sigue definimos una funcion que estudia el modelo de Ising en una grilla cuadradade lado n; N = n2, utilizando el metodo de Metropolis para obtener las muestras de

Modelos economicos de multiples agentes 23-06-2011

78 3. Modelos estadısticos

la distribucion de Gibbs para este problema. Para esto, se parte de una dada muestraX = (s1, ..., sN ) y se propone una nueva muestra X ′ donde se elige una celda al azar j y sela invierte s′j = −sj . La nueva muestra X ′ se acepta si (a) P (X ′) > P (X) o (b) si P (X ′) <P (X) se la acepta con probabilidad P (X ′)/P (X). Si definimos ∆E ≡ (E(X ′)− E(X)), lacondicion (a) es equivalente a imponer ∆E < 0,

∆E = 2Jsj∑i∈n(j)

si (3.29)

Y para el caso (b) tenemos que ∆E > 0 y la probabilidad del evento es:

P (X ′)P (X)

=e−βE(X′)

e−βE(X)= e−β(E(X′)−E(X)) = e−β∆E (3.30)

Es decir que el metodo de Metropolis toma muestras donde la energıa total del sistemadisminuye, o acepta aumentar la energıa, solo con una probabilidad pequena, controlada porla temperatura externa T : a menor temperatura es altamente improbable que se aceptenmuestras que aumenten energıa, en cambio con altas temperaturas el muestreo exploramas libremente el espacio de fases. Esto permite que el muestreo de la distribucion deprobabilidad no se estanque en mınimos locales y se pueda barrer todo el soporte de ladistribucion mas probable.

La siguiente funcion define el proceso basico del metodo de Metropolis:

Listado 3.4: Modelo de Ising, con actualizacion de Metropolis

function [U, menergy , res , s t ep ] = i s i n g (n , J , beta , opts )

max steps = 100000;o u t s t e p s = 500 ;seed = round(rand ( )∗1 0 0 0 0 ) ;

rand ( ’ s t a t e ’ , seed ) ;

U = round(rand (n , n ) ) ; % d e f i n e campo a l azarU = (U−0 .5)∗2 ; % r e s c a l e a a v a l o r e s en t re (−1 ,1)

f i l m = imagesc (U,[−1 1 ] ) ; % d e f i n e l a f i g u r aaxis o f f ;

r e s = [ ] ;

s t ep = 1 ;while ( s tep <= max steps )

one = round(rand ( 1 , 2 )∗ ( n−1))+1; % E l i g e un jugador a l azar

ec = compute loca l energy change (U, n , J , one ) ;

% paso de Metropo l i si f ( ec < 0) | | ( ec > 0 && rand ( ) < exp(−beta∗ ec ) ) ,

% cambia l a o r i e n t a c i o n de e s t e esp inU( one ( 1 ) , one ( 2 ) ) = −1 ∗ U( one ( 1 ) , one ( 2 ) ) ;

end

i f (mod( step , o u t s t e p s )==0)mag = sum(sum(U) ) / n / n ;r e s = [ r e s ; s tep mag ] ;[ count mag , mag ]

Modelos economicos de multiples agentes 23-06-2011

3.6 El modelo de Ising 79

end

% a c t u a l i z a f i g u r aset ( f i lm , ’ cdata ’ ,U) ;drawnow

s tep=step +1;

end

% c a l c u l a ene rg i a promediomenergy = 0 ;for i i = 1 : n ,

for j j = 1 : n ,menergy = menergy − compute loca l energy change (U, n , J , [ i i , j j ] ) / 2 . 0 / 2 . 0 ;

endend

menergy = menergy / (n∗n ) ;

end

donde la funcion compute local energy change() calcula el cambio de energıa de todo elsistema debido a cambiar un espin elegido al azar ∆Ej = 2Jsj

∑i∈n(j) si, y suponemos que

la vecindad de cada espin son los primeros 4 vecinos y los bordes de la grilla rectangular seconectan entre si (condiciones periodicas de contorno) :

Listado 3.5: Calculo de variacion de energıa en todo el sistema

function e = compute loca l energy change (U, n , J , one )

xx = one ( 1 ) ; yy = one ( 2 ) ;

x l = mod( xx−2,n)+1; % index l e f txr = mod( xx , n)+1; % index r i g h tyb = mod( yy−2,n)+1; % index bottomyt = mod( yy , n)+1; % index top

m = U( xl , yy ) + U( xr , yy ) + U( xx , yb ) + U( xx , yt ) ;

e = 2 ∗ J ∗ U( xx , yy ) ∗ m;end

Los cambios de energıa posibles son ∆E ∈ (−8J,−4J, 0, 4J, 8J).

La evolucion temporal del parametro de orden M(t) es muy fluctuante, y solo cuandose usa temperaturas ’bajas’ T ≈ 1 se observa que el sistema se queda en uno de los mınimosde energıa de maximo consenso M ≈ ±1 y el promedio de energıa por celula e = Etot/N =−2.

Para obtener con mas precision como influye la temperatura en el sistema, se realizoun experimento numerico simulando un sistema de N = 100 celdas durante 106 iteracionesy barriendo valores de T . Se promediaron los ultimos valores de M(t) y e(t) = Etot/N decada simulacion. En el grafico de la fig. 3.8 se observa que para temperaturas bajas, elvalor de |M | esta cercano a los estados ordenados, mientras que al aumentar T , este valordisminuye abruptamente hasta caer alrededor de cero.

Esta caida marca una transicion de fase para cierto valor del parametro T . Simula-ciones con N creciente apuntan a que la transicion ocurre alrededor de Tc = 2.27. Otra

Modelos economicos de multiples agentes 23-06-2011

80 NOTAS

caracterıstica importante es que si medimos las fluctuaciones lejos de la transicion, dis-minuyen con N creciente como 1/

√N (respetan el teorema central del lımite). Cerca de

la transicion, las fluctuaciones se vuelven muy importantes y se dice que el sistema tienecorrelaciones de largo alcance.

Figura 3.8: Parametro de orden |M | y energıa por celda e = Etot/N enfuncion de la temperatura T en el modelo de Ising. Notar que cerca de latransicion las fluctuaciones son maximas. Parametros N = 100, J = 1,106 iteraciones, promediados sobre 50 realizaciones.

Ejercicio 12 (Fluctuaciones en funcion de T ) Investigue que sucede si grafica la desviacionestandard de la energıa a lo largo de la transicion. Vea que pasa si aumenta N .

Ejercicio 13 (Transicion en 1-D?) Investigue que sucede si en vez de simular el modelode Ising en 2-D, lo hace en 1-D. Existe la transicion?

Ejercicio 14 (Caso Antiferromagnetico J = −1) Haga un experimento numerico conJ = −1. Investigue como se alinean los espines, dependiendo si N es par o impar. Vea quepasa con la magnetizacion cuando cambia la temperatura.

Notas

‡1El exito del abordaje se debio en gran parte al hecho que cualquier muestra de laboratorio esta compuestapor una enorme cantidad de partıculas. Esto robustece la idea de trabajar con promedios y despreciarfluctuaciones. Dentro de un globo lleno de helio a temperatura ambiente, hay del orden de 1023 atomos, cadapartıcula individual viaja a 500 metros por segundo, y colisiona 1 vez cada 600 picosegundos, o 1666 millonesde veces por segundo. Para una interesante simulacion numerica de dos gases en un contenedor, y como essu distribucion de velocidades, visitar http://intro.chem.okstate.edu/1314F00/Laboratory/GLP.htm

‡2El ejemplo clasico de difusion corresponde al calor: ∂tu(x, t) = ∂xxu(x, t), describe como se difundela temperatura u(x, t) en la posicion x y a tiempo t. Discretizando la coordenada espacial x en puntosxii=1,..,N aislados separados por δx, el calor u(x, t) pasa a estar dado en posiciones discretas . . . , u(xi−1), u(xi), u(xi+1), . . . ,y podemos aproximar las primeras derivadas por sus diferencias finitas. La ecuacion diferencial se puede

Modelos economicos de multiples agentes 23-06-2011

3.6 Bibliografıa 81

entonces aproximar en diferencias finitas como ∂2xxu(x, t) ≈ (u(xi+1) +u(xi−1)− 2u(xi))/(2δx

2). Por lo quepodemos decir que los primeros 3 terminos de la ecuacion maestra (3.18) corresponden a la “difusion detenencias monetarias” m. Asi mismo, si a la ecuacion de calor se le agrega un termino gradiente c ∂ux(x, t),este corresponde al transporte del calor en la direccion x a una velocidad c. La discretizacion del gradienteresulta ∂xu ≈ (u(xi+1)− u(xi))/δx, que corresponde al ultimo termino de (3.18).

‡3 La funcion costo del problema del viajante es aditiva ya que el costo total para un dado itinerarioes la suma de las distancias entre las ciudades en un dado orden. Una alteracion individual consiste enuna permutacion de dos ciudades que solo implica corregir una parte muy limitada del recorrido dejandoinalterado todo el resto, haciendo que se computo sea ’barato’.

Bibliografıa

Blume, L. E.: 1993, The statistical mechanics of strategic interaction, Games and StrategicBehavior 5, 387–424.

Castellano, C., Fortunato, S. and Loreto, V.: 2009, Statistical physics of social dynamics,Rev. Modern Physics 81(2), 591–646.

Daniels, M. G., Farmer, J. D., Iori, G. and Smith, E.: 2003, Quantitative model of pricediffusion and market friction based on trading as a mechanistic random process, Phys.Rev. Lett. 90, 108102.

Dragalescu, A. A.: 2003, Applications of physics to economics and finance: Money, income,wealth, and the stock market. e-print arXiv:cond-mat/0307341v2.

Dragalescu, A. and Yakovenko, V.: 2000, Statistical mechanics of money, Eur. Phys. J. B17, 723–729.

Dragalescu, A. and Yakovenko, V.: 2001, Evidence for the exponential distribution of in-come in the usa, Eur. Phys. J. B 20, 585–589.

Gordon, M.: 2003, An introduction to statistical mechanics, in P. Bourgine and J.-P. Nadal(eds), Cognitive Economics, Springer-Verlag.

Ising, E.: 1925, Beitrag zur theorie des ferromagnetismus, Zeitschr. f. Physik 31, 253–258.

Jaynes, M. O.: 1957, Information theory and statistical mechanics, Physical Review106(4), 620–630.

Khinchin, A. I.: 1949, Mathematical foundations of statistical mechanics, Dover, New York.

Kirkpatrick, S., Gelatt, C. D., Jr. and Vecchi, M. P.: 1983, Optimization by simulatedannealing, Science 220, 671–680.

Shannon, C. E.: 1948, A mathematical theory of communication, The Bell Systema Tech-nical Journal 27, 379–423, 623–656.

Silva, A. and Yakovenko, V.: 2005, Temporal evolution of the ”thermal” and ”superthermal”income classes in the usa during 1983-2001, Europhys. Lett. 69(2), 304–310.

Smith, E., Farmer, J. D., Gillemot, L. and Krishnamurthy, S.: 2003, Statistical theory of thecontinuous double auction, Quantitative Finance 3, 481514. e-print cond-mat/0210475.

Modelos economicos de multiples agentes 23-06-2011

82 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 4

Leyes de potencias

En la decada del 40, el linguista George Zipf descubrio una propiedad curiosa de como secomporta la frecuencia de aparicion de las palabras dentro de una gran cantidad de textosdel idioma ingles. Encontro que la palabra mas frecuente es “the” con una frecuencia deaparicion de 7%, mientras que la segunda es “of”, con una frecuencia de 3.5%, y la terceramas frecuente es . La frecuencia de aparicion f es inversamente proporcional a su rankingn: f(n) ' 1/n, conocida ahora como Ley de Zipf. Lo que interesante es que la misma leyocurrıa con en otros lenguajes, marcando un principio de universalidad que apunta a laforma en que nuestro cerebro en ultima instancia hace evolucionar al lenguaje.

En 1881 el astronomo Simon Newcomb encontro que las primeras paginas de los libroscon tablas de logaritmos, estaban mas usadas que las ultimas. En 1938 el matematicoBenford analizo una gran cantidad de numeros que utilizamos a diarios (registros de pagosde impuestos, alturas de calles, etc) y descubrio que el dıgito 1 aparece como primer dıgitoen 30% de los casos, mientras que el numero 2 aparece 18%, el 3 aparece 12%, el 4 aparece9%, etc. Esta ley se conoce ahora como Ley de Benford y se la ha utilizado para encontrarfraudes contabilidad, y es aceptado como una herramienta legal en los juicios de EstadosUnidos.

En 1806, Vilfredo Pareto analizo los ingresos de muchas sociedades, y descubrio quela frecuencia ingresos podıa ser resumida como inversamente proporcional a los ingresos.

Lo interesante de estas distribuciones, es que son marcadamente distintas a la dis-tribucion normal o Gaussiana, y ocurren en una gran cantidad de fenomenos. Esto permitioque se indague sobre las condiciones por las cuales distribuciones distintas a la distribucionGaussiana, puedan aparecer. En este sentido Levy tuvo un papel importante en discutirsobre la ’estabilidad’ de las distribuciones, introduciendo las distribuciones de Levy. Porotro lado, desde la mecanica estadıstica se conocıan varios fenomenos crıticos que hemosmencionado en capıtulos anteriores, donde las distribuciones de leyes de potencia son fre-cuentes.

Es por esto que en este capıtulo ahondaremos en este tipo particular de distribuciones,y discutiremos distintos mecanismos que dan origen a las mismas.

4.1 Distribuciones que siguen leyes de potencias

Una lista de registros o mediciones pueden ser caracterizada por algun valor medio que esrepresentativo de todo el conjunto. La lista contiene tanto valores mayores como menoresa esa media pero aquellas mediciones que dan resultados proximos a ese valor son por lo

83

84 4. Leyes de potencias

general mucho mas frecuentes. Este hecho esta formalmente representado por densidadesde probabilidad Gaussianas o de Poisson que poseen un maximo en algun valor intermediode la variable aleatoria. Existen sin embargo una gran variedad de magnitudes cuyas dis-tribuciones no siguen este patron. Estas estan asociadas tanto a fenomenos naturales comoa hechos sociales o economicos. Tal por ejemplo es la distribucion de tamanos de ciudades,de intensidades de terremotos, de los diametro de los crateres de la Luna, la distribucionde frecuencias de uso de palabras en un dado idioma (ley de Zipf), numero de muertes enconflictos belicos, numero de citas en publicaciones cientıficas, numero de especies en tax-ones biologicos, distribucion de ingresos, fluctuaciones de luminosidad en fuentes estelaresde ondas de radio, flujo de automoviles en una carretera, y una enorme variedad de otros.

Muchas de estas magnitudes tienen una distribucion de probabilidad que sigue unaley de potencias que, tecnicamente, se puede escribir como P (x) = Axλ, donde A es unaconstante de normalizacion. En el contexto del principio de maxima entropıa visto en elCapıtulo 3, una distribucion de esta naturaleza surge cuando se la trata de maximizar sujetaa la condicion de vıculo que el valor medio del logaritmo de la variable aleatoria sea unaconstante C > 0 arbitraria, o sea:

max∫p(x)log(p(x))dx sujeto a

∫p(x)dx = 1 y

∫log(x)p(x)dx = C (4.1)

Si se introducen los multiplicadores de Lagrange λ y µ asociados respectivamente ala media del logaritmo de x y a la normalizacion de las probabilidades resulta

p(x) = Ax−λ (4.2)A = (λ− 1)a(λ−1) (4.3)

λ = 1 +1

C − log a(4.4)

En estas ecuaciones se ha supuesto que la ley de potencia es validad en el rango x ∈[xmin,∞] ya que de otro modo la normalizacion de la probabilidad divergerıa en el origen.Mandelbrot utilizo estos argumentos para justificar la ley de Zipf que establece que ladistribicion de probabilidad de uso de las palabras en un dado idioma es aproxiamdamenteuna ley de potencias en su longitud. La idea de Mandelbrot fue que maximizar la distribicionde probabilidad debıa corresponderse con optimizar la informacion transmitida que estarelacionada con el logaritmo de la longitud de las palabra.

Las leyes de potencias tambien ocurren en diversas funciones termodinamicas en lasproximidades de transiciones que corresponden, por ejemplo al cambio de lıquido a vapor ode lıquido a solido. Estos fenomenos crıticos fueron ya mencionados en capıtulos anterioresen el contexto del Modelo de Ising y en la difusion de rumores o la instalacion de una moda.En presencia de una situacion crıtica las densidades de probabilidad que obedecen a leyes depotencias han sido vinculadas al hecho que zonas muy distantes del sistema se encuentrande todos modos fuertemente correlacionadas entre si. Esta correlacion se traduce a su vezen la ausencia de escalas caracterısticas. En el modelo de condensacion que presentamos enel Capıtulo 3, cuando el parametro de control posee algun valor particular, no es posibleencontrar que ’gotas’ de algun tamano particular sean particularmente frecuentes. En elmodelo de Ising, los imanes elementales ubicados en cada nodo de la grilla tienden a agru-parse en islas en las que todos tienen la misma orientacion. En las vecindades del puntocrıtico en la que el sistema adquiere una magnetizacion permanente, la distribuicion de lasextensiones de dichas islas no indica que abunden las islas de algun tamano particular. Porestas razones se dice que las distribuciones que obedecen a leyes de potencias correspondena sistemas libres de escala. Mas abajo damos una definicion precisa de este hecho.

Modelos economicos de multiples agentes 23-06-2011

4.1 Distribuciones que siguen leyes de potencias 85

Algunas propiedades

• Normalizacion∫ ∞xmin

P (x)dx =∫ ∞xmin

Ax−λdx =A

1− λ

[x−λ+1

]∞xmin

= 1 (4.5)

que define la constante A y restringe el valor del exponente a λ > 1 con lo que ladensidad de probabilidad se puede escribir como

P (x) =λ− 1xmin

[x

xmin

]λ(4.6)

• Momentos. De la misma manera se puede determinar que las distribuciones con λ ≤ 2no tienen media finita:

〈x〉 =∫ ∞xmin

xP (x)dx =A

2− λ

[x−λ+2

]∞xmin

(4.7)

De la misma manera se puede establecer que si λ ≤ 3 la varianza resulta infinita. Engeneral, el momento de orden m se expresa como:

〈xm〉 =λ− 1

(λ−m− 1)xmmin (4.8)

Hay que tener en cuenta que si se calculan los momentos sobre muestras recogidasde la realidad, tanto la media como la varianza de distribuciones que siguen leyesde potencias pueden arrojar resultados finitos pero eso es debido a que el calculo seefectua siempre sobre una muestra finita de realizaciones de la variable aleatoria.

• Las distribuciones que obedecen a leyes de potencia son libres de escala. Se suele decirque una distribucion p(x) es libre de escalas cuando se verifica que p(bx) = g(b)p(x)o sea que la distribucion de la variable aleatoria afectada por un factor de dilataciono de contraccion b es proporcional a la distribucion original. Observese que ese factores irrelevante porque puede absorberse en la normalizacion de la distribucion. Parademostrar la propiedad senalada al comienzo basta poner x = 1 en la condicion delibertad de escalas, con lo que queda p(b) = g(b)p(1). Es posible entonces escribirp(bx) = p(b)p(x)/p(1). Como esta propiedad vale para cualquier valor arbitrario deb, puede deducirse que xp′(x) = p′(b)p(x)

p(1) ponendo p′ por la derivada respecto de b. Sien esta ecuacion se pone ahora b = 1 se obtiene una ecuacion diferencial que define ladistribucion p(x). Epecıficamente:

xdp

dx=p′(1)p(1)

p(x) (4.9)

cuya solucion es

log p(x) =p(1)p′(1)

log(x) + constante (4.10)

que corresponde a una ley de potencia p(x) = p(1)x−λ con λ = −p(1)/p′(1)

• Observabilidad de las leyes de potencias. Los valores de las distribuciones que siguenleyes de potencias por lo general se extienden por algunas decadas y son los valoresmayores los mas importantes para determinar tanto la dependencia funcional de ladistribucion como el exponente de la misma en el caso que ella obedezcan una ley de

Modelos economicos de multiples agentes 23-06-2011

86 4. Leyes de potencias

potencias. Este hecho entrana una dificultad ya que esos valores son por lo generallos menos frecuentes y estan afectados de importantes errores de observacion. Otroaspecto a tener en cuenta es que distribuciones observadas varıan su aspecto de manerasignificativa dependiendo del ancho de la ventana en que se agrupan las realizacionesde la variable aleatoria que se utilice para graficarlas. Estos elementos hacen que esmenester ser muy cauteloso cuando se llega al punto de aseverar que una distribucionsigue una ley de potencias. Este punto esta cuidadosamente discutido en la (Newman,2005).

4.2 Casos de leyes de potencias

En esta seccion presentamos diversas situaciones en las que ocurren distribuciones de prob-abilidad que siguen leyes de potencias. Nos concentraremos en los siguientes casos:

1. Fenomenos crıticos (I). Muchas substancias pueden congelarse, evaporarse o fundirsesi se cambian parametros ambientales como la presion o la temperatura. Si la substan-cia esta en estado gaseoso, sus estados de equilibrio poseen densidades de probabilidadde las velocidades de sus moleculas que solo dependen de la temperatura del gas. Enuna transcion de fase que lleve el gas a condensarse como un lıquido esa distribucioncambia profundamente. Estos mismos sistemas naturales estan ademas caracterizadospor alguna dimension particular, como puede ser el camino libre medio entre colisionesde las moleculas del gas o el tamano de los dominios magneticos si se trata de unasubstancias magnetizable. En presencia de una transicion de fase estas longitudes decorrelacion pueden llegar a diverger dejando al sistema sin ninguna escala de longitudque le sea caracterıstica. Existen muchos fenomenos de este tipo en los que los cambiosson abruptos, profundos y globales y tiene lugar para un valor muy preciso de algunparametro de control externo. Se los suele englobar bajo la denominacion generica defenomenos crıticos. En estas situaciones las distribuciones de probabilidad relevantessiguen leyes de potencias y las interacciones entre las componentes del sistema carecende escalas caracterısticas.

2. Fenomenos crıticos (II). Muchos sistemas naturales proseen alguna escala de lon-gitud que les es propia y que representa la distancia a la que quedan correlacionadassus partes por efecto de las interacciones que operan en su seno. Esta distancia se de-nomina (distancia de correlacion). Esta escala cambia con las condiciones del medioen que se encuentra el sistema. En ciertas oportunidades dicha distancia diverge in-dicando que todas las partes del mismo estan correlacionadas entre si. Cuando esteproceso tiene lugar se dice que el sistema se encuentra en un punto crıtico. Por logeneral estos coinciden con los cambios de fase, esto es cuando un gas se condensao cuando un lıquido se congela. En las inmediaciones de un punto crıtico las dis-tribuciones de probabilidad asociadas a funciones termodinamicas siguen una ley depotencias.

3. Paseos al azar en mercados financieros. El analisis de series de tiempo de mer-cados financieros permite generar distribuciones que dan la probabilidad de obtenerun dado rendimiento al cabo de distintos plazos. En algunas series estas densidadesde probabilidad siguen leyes de potencia con lo que resultan invariantes frente a dilat-aciones o contracciones de la escala temporal permitiendo de esa manera relacionarentre si rendimientos obtenidos al cabo de plazos muy diferentes. Esto ademas per-mite, dentro de ciertos lımites, relacionar las fluctuaciones de las cotizaciones quetiene lugar en pocos dıas con las que ocurren en lapsos mas prolongados.

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 87

4. Criticalidad autoorganizada. En el caso de sistemas termodinamicos siempreexiste un parametro de control externo (generalmente es la temperatura) que permitecolocarlos en un punto crıtico. Si los mercados desarrollan su dinamica cerca de unestado crıtico tal como parece surgir del la ocurrencia de leyes de potencias, para ladistribucion de probabilidad de sus rendimientos, cabe preguntarse cual deberıa ser elparametro de control que los lleva a una situacion de esa naturaleza. Respecto a estepunto se ha popularizado el concepto que muchos sistema naturales se auto-organizancerca de una tal situacion crıtica sin que para ello medie ningun control externoque los conduzca a ese estado. En esta propiedad dinamica se denomina criticalidadautoorganizada (Bak, Tang and Wiesenfeld, 1999) y se la repasa en una proximaseccion. De acuerdo con este concepto la ocurrencia de eventos catastroficos no sedeberıa a ninguna ingerencia externa sino que serıa el resultado de una combinacionmuy poco probable de eventos que son propios del funcionamiento regular y normaldel sistema.

4.2.1 Mercados financieros y paseos al azar.

Una de las conjeturas basicas de la literatura acerca de mercados financieros es que losprecios responden procesos estocasticos caracterizados por un paseo al azar. Este principiofundamental es en el que se apoya Bachelier (1900). Toda la formulacion de su teorıa sesostiene sobre la idea de que los rendimientos estan normalmente distribuidos.

Para que el movimiento de los precios de un activo financiero siga un paseo al azar, lastransacciones realizadas deberıan ser consistentes con lo que se denomina un “fair game”, enel cual la ganancia esperada de un especulador deberıa ser identicamente nula. La “mejor”prediccion del precio de manana, es simplemente el precio de hoy, donde el termino“mejor”se refiere a aquella prediccion que minimiza el error cuadratico medio de la prediccion. Unaimportante consecuencia de esta hipotesis, es que los cambios en precios de los activos noestan correlacionados, lo cual implica que no es posible realizar predicciones sobre la basede algun predictor de los precios futuros basado en la secuencia de los pasados.

Si el rendimiento, definido como rt+1 = pt+1 − pt = pt+1 − E(pt+1/It) es un “fairgame”, debe cumplirse que E(rt+1/It) donde It es la informacion disponible en el momentot. En general se trabaja con el logaritmo del precio para que el calculo de los rendimientosse haga en terminos relativos. La expectativa del precio de manana dado el de hoy es elprecio de hoy. En este mundo, el unico cambio posible de precio es resultado del arribode nueva informacion, como no hay razones para esperar que la informacion llegue demanera no aleatoria, el cambio de precios perıodo a perıodo sera aleatorio y estadısticamenteindependiente, de manera consistente con la llegada de informacion. En estas circunstanciases dable suponer que los rendimientos de un perıodo son variables aleatorias independientes.

Si se considera que no han tenido lugar, durante el perıodo de analisis, cambios deregimen que modifiquen sustancialmente la estructura del mercado, se puede considerar,adicionalmente, que estas variables aleatorias estan identicamente distribuidas. Se tieneentonces que E(rt+1/It) = E(rt+1).

Los modelos basados en la hipotesis de paseo al azar suponen adicionalmente, porrazones operativas, que toda la distribucion es independiente de la informacion disponible Ity que esta es ademas estacionaria. Entonces que la funcion de distribucion de los rendimientosatisface que f(rt+1/It) = f(rt + 1) con la misma funcion de distribucion para todo t. Estono nos indica que la informacion pasada carece de valor. Como la distribucion de losrendimientos se presupone estacionaria, los rendimientos pasados son la mejor fuente de

Modelos economicos de multiples agentes 23-06-2011

88 4. Leyes de potencias

informacion para conocerla, sin embargo, estos no producen ninguna consecuencia sobre lafutura evolucion de los mismos.

Se puede afirmar que la combinacion de las propiedades que se originan a partir dela suposicion de que la evolucion de los mercados financieros es consistente con los paseosal azar y, por otro lado, el tratamiento de los ajustes basados en el analisis de riesgo, hadado importantes resultados, especialmente en el estudio de la fijacion de los precios deopciones financieras. Esto pone de manifiesto la importancia de estudiar las propiedades delas funciones de distribucion de los rendimientos en estos mercados.

Muchos modelos de formacion de precios de activos de capital dependen del conocimientoestas distribuciones, como por ejemplo, los modelos de (Lintner, 1965; Mossin, 1966; Sharpe,1964), y el famoso modelo de (Black and Scholes, 1973) respecto de los precios de las op-ciones bursatiles. En general, se suele suponer que el proceso estocastico es un movimientoBrowniano, por lo que, esta guiado por una distribucion normal. En su forma mas estricta,la hipotesis de paseo al azar supone que los rendimientos se distribuyen de manera inde-pendiente y estan identicamente distribuidos. Una version no tan restrictiva permite quela historia del proceso pueda influir sobre las estrategias de inversion, pero descarta quesea posible utilizar eficientemente tecnicas o reglas de prediccion determinısticas (linealeso no lineales). Finalmente, versiones menos restritivas suponen que no es posible utilizartecnicas de prediccion lineales, como el analisis de regresiones.

En lo que sigue veremos ejemplos de distribuciones de mercados que no se ajustan aestas hipotesis de paseos al azar y se ajustn en cambio a leyes de potencias. Algunas dis-tribuciones que guıan al proceso generador de rendimientos son distribuciones denominadasestables que dan lugares a “colas gordas” y distribuciones que siguen leyes de potencias.Excluimos del presente analisis las descripciones multifractales de series financieras (?).

Distribuciones estables y vuelos de Levy

Supongamos un proceso estocastico caracterizado por un paseo al azar, unidimensional,cuyo saltos son independientes e identicamente distribuidos con una probabilidad p(x).Cabe preguntarse si las fluctuaciones que tuvieron lugar durante un dıa, son las mismas,a menos de un factor de escala, que las que tienen lugar durante una semana o un mes.Responder a esta pregunta es equivalente a responder a ?cuando la probabilidad Pn(x) deque el paseo al azar haya arribado a la posicion x luego de n pasos (x = x1 +x2 + · · ·+xn) esla misma que la p(x) a menos de un factor de escala? Si esto sucede, la p(x) correspondienteda lugar a un paseo al azar con una trayectoria autosimilar. Se suele tambien decir quela distribucion de probabilidad es invariante frente a cambios en la escala temporal. Estasinvariancias sugieren que la distribucion carece de una escala de tiempos caracteristica yestan siempre realcionadas con el surgimiento de leyes de potencias.

Si p(x) es una distribucion normal con media µ y varianza σ, esas condiciones se vensatisfechas pues Pn(x) tambien es normal con media µn = nµ y varianza σn = nσ. Sin em-bargo, a principio de siglo, Levy, 1937 demostro que este es tan solo un caso particular y queexisten otras soluciones que admiten trayectorias auto-similares. La condicion de autoseme-janza se verifica cuando las distribuciones asociadas a la suma de n y m pasos se relacionancon la de n + m. La distribucion de una suma de variables aleatorias independientes es laconvolucion de sus distribuciones. o sa que :

Pn(x) =∫ +∞

−∞Pn−m(x− x′)Pm(x′)dx′ 0 ≤ m ≤ n (4.11)

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 89

Como la transformada de Fourier del producto de convolucion de dos funciones es elproducto de las transformadas, es mas comodo trabajar con las funciones caracterısticas delas distribuciones, que son, precisamente las transformadas de Fourier de la funciones dedistribucion. Resulta entonces:

Pn(k) = Pn−mPm(k) con P (k) =∫ +∞

−∞eikxP (x)dx (4.12)

La variable k es la conjugada de x. Una funcion caracterıstica que satisface estacondicion tiene la forma

Pn(k) = e(−n|k|β) (4.13)

Definicion 14 (Distribucion estable) . Las distribuciones con funciones caracterısticas(4.13) se denominan distribuciones estables y corresponde a un proceso estocastico llamadocomo vuelo de Levy y verifican que sumas parciales de n variables aleatorias tienen la mismafuncion de distribucion. El exponente β se denomina exponente caracterıstico.

Propiedades de los Vuelos de Levy.

1. Por definicion, la funcion de distribucion es:

Pn(x) =1

∫ +∞

−∞e−n|k|

β

e−ikxdx (4.14)

2. Para cualquier funcion caracterıstica, desarrollando la exponencial compleja en seriesde potencias, se demuestra que el momento de orden q de la distribucion vale:

〈xq〉 = (−1)q∂qp(k)∂kq

q = 0, 1, 2 . . . (4.15)

Entonces, como Pn(k) = pn(k) y p(k = 0) = 1 implica 〈xq(n) = n〈xq〉 Con esto esposible calcular todos los momentos de la distribucion conociendo la funcion carac-terıstica de la misma.

3. Resulta que: |p(k)| = p(k = 0) = 1. Efectivamente:

|p(k)| =∣∣∣∣∫ +∞

−∞eikxp(x)dx

∣∣∣∣ =∫ +∞

−∞

∣∣∣eikx∣∣∣ p(x)dx =∫ +∞

−∞p(x)dx = 1 ≡ p(k = 0)

(4.16)

4. La varianza que puede calcularse a partir de derivada segunda de p(x) en el origen.Existe solo si β = 2, que corresponde a la distribucion normal. De 2) resulta evidenteque cuando β < 2 , el momento de segundo orden es infinito. Como la varianza esinfinita no hay un tamano caracterıstico para la magnitud de los saltos del procesoestocastico. Desde el punto de vista muestral resulta difıcil de comprobar que lavarianza de una distribucion sea infinita ya que, como el tamano de todamuestra esfinita, siempre se puede definir un estimador de la varianza de la distribucion. Usandoseries temporales de tamano finito los momentos asociados a la distribucion se venafectados por los valores que fluctuan alrededor del centro de las distribuciones y nopor sus colas.

Modelos economicos de multiples agentes 23-06-2011

90 4. Leyes de potencias

5. Ejemplo: La distribucion de Cauchy corresponde al caso β = 1. Poniendo Pn(k) =en|k| y p(k) = e−|k| se obtiene

Pn(x) =1πn

11 + (x/n)2

=1np(x

n) (4.17)

6. El exponente caracterıstico ′beta describe el grado de “rugosidad” de la serie temporal.El espectro de potencia (cuadrado de la transformada de Fourier) de estas series sigueuna ley de potencias S(f) ∝ 1/fη con η = 1+2/β y la dimension fractal (de Hausdorff)de una serie temporal con estas caracterısticas es Df = 2 − 1/β. Cuando β = 2 lacorrelacion entre incrementos es nula y corresponde al caso Gaussiano.

Ejemplo: Vuelos de Levy en mercados cambiarios

A continuacion analizaremos las series temporales de mercdos de divisas con la optica delas distribuciones estables. Para ello definimos el rendimiento al cabo de ∆t perıodos detiempo como

r(t) =p(t)− p(t−∆t)

p(t−∆t)(4.18)

donde p(t) es el valor del tipo de cambio al cierre en t. La variable r(t) es una variablealeatoria. Veremos que su distribucion de probabilidad P (r,∆t) que ocurra un valor r paraun dado ∆t resulta ser estable. El exponente caracterıstico de la distribucion se puedeestimar de la probabilidad de retorno al origen P (r = 0) (Mantegna and Stanley, 1995)pero expresada como funcion de ∆t, o sea, la probabilidad de alcanzar un rendimiento netonulo al cabo de ∆t pasos del paseo al azar.

Para ello es conveniente encontrar primero una expresion de la distribucion de prob-abilidad en la que la invariancia frente a cambios en la escala temporal sea manifiesta.

El valor de n usado en la seccion anterior que indica el numero de variables aleatoriasque se suman, en este contexto se relaciona con el intervalo de tiempo ∆t de cada paso delpaseo al azar. Podemos escribir Pn(r) = P (r, n∆t) con lo que la funcion caracterıstica deuna distribucion estable se puede expresar:

P (r, n∆t) =1

∫ −∞+∞

e−n∆t|k|βe−ikrdk =1π

∫ 0

+∞e−(n∆t)kβcos(kr)dk (4.19)

Se puede definir un rendimiento estandar o rendimiento normalizado rs mediante:

rs =r

(∆t)1/β(4.20)

Queda ası vinculado un rendimiento r para cualqueir intervalo de tiempo ∆t con un rendimientoestandar. Utilizando esta nueva variable, la invariancia de escala temporal de la distribucion(4.19) queda manifiesta:

Ps(rs, n∆t) =P (r, n∆t)(∆t)1/β

(4.21)

Esta ecuacion indica que una distribucion de probabilidad de rendimientos para cualquierintervalo n∆t esta relacionada con la distribucion de rendimientos estandar: se puedensuperponer las distribuciones para diferentes ∆t corrigiendolas solo por un factor relacionadocon su escala temporal

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 91

Con la expresion (4.19) es posible ademas calcula la probabilidad de retorno al origen.Para ello ponemos

P (0, n∆t) =1π

∫ ∞0

e−(n∆t)kβ =Γ(1/β)

πβ(n∆t)1/β(4.22)

donde hemos utilizadoΓ(z) =

∫ ∞0

uz−1e−udu conz > 0 (4.23)

La distribucion (4.22) sigue una ley de potencias en ∆t con el exponente caracterıstico dela distribucion estable.

Con estas reglas se estudio la evolucion del tipo de cambio de la Libra Esterlina contrael Dolar Americano. La serie de datos esta formada por el tipo de cambio diario al cierrey corresponde al perıodo comprendido entre el 1ro. de junio de 1973 y el 21 de mayo de1987, conformando una total de 3511 datos.

En la fig. 4.1 mostramos P (r = 0,∆t) como funcion de ∆t, en una escala log-log. Es-tos datos pueden ajustarse con una recta cuya pendiente es - 0,604. Hasta los primeros 50valores de ∆t el ajuste da un coeficiente de correlacion de 0.988. La pendiente permite de-terminar el exponente carcaterıstico que corresponde con un comportamiento no gaussiano- ya que β = 0.60 - y por lo tanto la varianza de la distribucion deberıa ser teoricamenteinfinita. Como hemos comentado anteriormente no es posible comprobar si la varianza de ladistribucion es efectivamente infinita ya que el tamano de la muestra es finita (3511 datos).

Figura 4.1: Probabilidad de retorno al origen P (r = 0) como funcionde ∆t.

De la lista de rendimientos se pueden obtener la P (r,∆t) para diferentes intervalos detiempo Se tomaron n∆t = 1, 2, 8 y 32 dıas). Un estudio estadıstico mas minucioso deberıausar datos en intervalos no superpuestos, pero debido a la escasez de datos numericos esto noresulta posible. No obstante, los exponentes crıticos obtenidos con intervalos superpuestoso no son similares.

En la fig. 4.2 se muestra el grafico de P (r,∆t) utilizando los 4 valores distintos de ∆t. Se ha pretendido que estos intervalos esten aproximadamente equi-espaciados en terminos

Modelos economicos de multiples agentes 23-06-2011

92 4. Leyes de potencias

logarıtmicos. Como se puede observar estas distribuciones son visiblemente simetricas y suscolas obviamente se despliegan al crecer el intervalo ∆t, ya que al elegir un mayor intervalosobre el cual se calculan los rendimientos relativos, crece la probabilidad de obtener grandesrendimientos (positivos o negativos).

Figura 4.2: Histograma de la distribucion de rendimientos para difer-entes valores de ∆t.

Con el exponente caracterıstico β obtenido de la distribucion P (r = 0,∆t) se puedecorroborar que las distintas distribuciones son similares salvo un factor de escala. Paraverificar esta propiedad, se debe re - escalar todas las distribuciones para diferentes ∆t,utilizando la variable rs

En la fig. 4.3 se comprueba que, salvo eventos de gran amplitud, las distribucionesescaladas se superponen en una unica distribucion. En estos mercados no se pueden puesdefinir escalas de tiempo privilegiadas. En la Tabla se muestran otros exponentes crıticosobtenidos de esta misma manera:

EJEMPLOS DE EXPONENTES CRITICOS

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 93

Figura 4.3: Distribuciones re-escaladas de los rendimientos Libra vsDolar.

Mercado Perıodo No. Datos Exponente Coef. Correl.L.E. - D.A. 6/73-5/87 3,511 0.60 ± 0.02 0.988Y.J. - D.A. 6/73-5/87 3,511 0.59 ± 0.02 0.981D.C. - D.A. 6/73-5/87 3,511 0.59 ± 0.02 0.983M.A. - D.A. 6/73-5/87 3,511 0.651 ± 0.03 0.997F.S - D.A. 6/73-5/87 3,511 0.60 ± 0.02 0.989

L.E. - D.A. (1) 6/73 - 6/87 1,174,941 0.581 ± 0.004 -Y.J. - D.A. (1) 6/73 - 6/87 1,477,992 0.591 ± 0.003 -F.S. - D.A. (1) 6/73 - 6/87 1,214,901 0.594 ± 0.004 -M.A. - D.A. (1) 6/73 - 6/87 2,409,086 0.591 ± 0.004 -ORO - D.A. (1) 6/73 - 6/87 652,194 0.580 ± 0.004 -

Dow Jones 1/00-6/93 25,770 0.583 ± 0.007 0.976S & P 500 (2) 7/62-12/95 8,431 0.588 ? -

IBM (2) 7/62-12/95 8,431 0.561 ? -AMPCO (2) 7/62-12/95 8,431 0.621 ? -

DAX (3) 11/86-9/92 1,452 0.54 ± 0.08 -

L.E.: Libra Esterlina, D.A.: Dolar Americano, Y.J.: Yen japones, D.C.: Dolar canadiense, M.A.: Marco

Aleman, F.S.: Franco suizo. DAX: ındice de 30 acciones del Mercado Bursatil de Frankfurt. (1) Tomado de

Muller et al, 1990, datos intradiarios (”tick by tick”), se utiliza otra metodologıa para realizar el calculo.

Las invariancias de escala y las leyes de potencias en sistemas naturales ocurren enlas vecindades de sus puntos crıticos y transiciones de fase (cambio de solido a lıquido o delıquido a vapor). Las mismas estan ligadas por lo general a propiedades muy fundamentalesde las interacciones entre las partıculas que los componen, tales como la dimensionalidad desu ordenamiento espacial y sus simetrıas (ver (Kadanoff, 1993)) y resultan por otra parteindependientes de una gran numero de otras propiedades que no hacen a la esencia delsistema. por estas razones ha sido posible agrupar estas leyes de potencias y transiciones en

Modelos economicos de multiples agentes 23-06-2011

94 4. Leyes de potencias

clases de univerdalidad. Una clasificacion de mercados por sus exponentes crıticos podrıaquiza conducir al analisis de la naturaleza del mercado en la que intervienen, por ejemploel tipo, monto o frecuencia de transacciones que tiene lugar en el mismo. Podrıa biensuceder, por ejemplo, que un mecado cambiario se comporte diferente de uno bursatil o deotro tipo de activos financieros. Responder a estas conjeturas requiere construir modelosde funcionamiento de estos mercados y verificar la emergencia de estas leyes de potenciasvinculando sus expoenentes crıticos con su estructura o funcionamiento. Un modesto avanceen este sentido consiste en analizar los lımites de validez de estas reglas de invariancia, temaque tratamos en la proxima seccion.

Un quiebre de la invariancia de escala temporal

En esta seccion aplicamos la metodologıa explicada arriba a un mercado de divisas con laspatologıas propias de una inflacion persistente a lo largo de perıodos muy prolongados. Paraello Se trabajo con la serie temporal de las cotizaciones del dolar en la Argentina a lo largodiez anos en el perıodo 1871-1991 con datos diarios, recopilado segun la siguiente tabla.

MERCADO CAMBIARIO ARGENTINO

Mercado PerıodoParalelo 2/8/71 hasta 30/12/75; 4/1/82 hasta 9/10/87; 19/5/89 hasta 14/12/89

Libre 7/1/76 hasta 17/6/81; 15/10/87 hasta 18/5/89; 15/12/89 hasta 30/3/91financiero 18/6/81-23/12/81

La probabilidad de retorno al origen se muestra en la fig. 4.4. Ya no queda represen-tada por una unica ley de potencias sino que se requieren dos rectas de distintas pendientespara ajustar la distribucion de probabilidad. Una de ellas es valida para perıodos breves,de ∆t < 8 dıas y la otra abarca todos los intervalos de tiempo mas prolongados.

Las correspondientes distribuciones de rendimientos se muestran en la fig. 4.5. Lasmismas no son mas simetricas como las que se mostraron para el mercado dolar-libra ester-lina sino que se extienden mucho mas hacia la derecha, como corresponde a una situacioninflacionaria. En una situacion de ese tipo la probabilidad de rendimientos positivos debeser claramente mayor que la de obtener rendimientos negativos para un mismo perıodo ∆t.El regimen inflacionario se traduce en una probabiliad de retorno al origen que decae masrapidamente para perıodos mas prolongados. Comparese por ejemplo el exponente crıticopara el mercado dolar-libra que es '.6 con el del mercado peso-dolar que es '.8

Como es previsible, cuando se trata de re-escalar estas distribuciones para comprobarsu invariancia resulta imposible. Sin embargo es posible con todo encontrar un alto grado deinvariancia de escala si se utilizan las dos pendientes diferentes extraıdas del grafico fig. 4.4para perıodos prolongados y breves. Si se trata ambas series de rendimientos por separadose obtienen los correspondientes graficos que se muestran en la fig. 4.6 utilizando para ellolos respectivos rendimientos estandar rs.

Surge de estos resultados que el mercado cambiario en presencia de inflacion presentaun quiebre de la invariancia de escala temporal. No es mas posible arguir que este mercadocarece de una escala de tiempo que le es tıpica. Podrıa bien suponerse, en cambio, que∆t ' 8dıas representa un intervalo de tiempo significativo ya que los exponentes crıticoscambian cuando se pasa de intervalos menores a otros mas prolongados. Es sin embargodifıcil extraer una interpretacion practica y transparente de esta escala de tiempo.

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 95

Figura 4.4: Probabilidad de retorno al origen para el mercado peso-dolarcomo funcion de ∆t.

Debe con todo observarse que la invariancia de escala temporal parece ser una propiedadmuy fundamental de las series temporales asociadas a mercados de divisas. Pareciera que lamisma es capaz de sobrevivir en alguna medida. La serie analizada presenta dos regımenes,ambos con un alto grado de invariancia para lapsos ∆t < 8 y ∆t > 8dıas. Lo llamativo esque esto sucede aun en situaciones tan extremas como un regimen inflacionario y con reglasde mercado extremadamente distorsionadas.

4.2.2 Fenomenos crıticos

Cuando se calienta o enfrıa una sustancia o se la somete a presiones diferentes puede cambiarsu naturaleza y pasar de ser solida a lıquida o de ser lıquida a gaseosa. En esas circunstanciasse dice que la misma se ha fundido, evaporado o sublimado que es cuando pasa de la fasesolida a la gaseosa sin fundirse previamente. Cada uno de esas transiciones de fase secorresponden con cambios profundos en la organizacion de los atomos y moleculas quecomponen la sustancia y se traducen en alteraciones en la distribucion de probabilidadde sus magnitudes fısicas. Por lo general dichas distribuciones adoptan la forma de leyesde potencias. Es por esta razon que la ocurrencia de distribuciones que siguen leyes depotencias sugieren la vencindad de cambios estructurales. estas transiciones de fase, seagrupan bajo la denominacion generica de fenomenos crıticos y han dado lugar a extensasinvestigaciones.

Las distintas fases de los sistemas naturales poseen escalas de longitud, volumen oenergıa que le son caracterısticas y que, ademas son muy distintas entre si. Ası por ejemplolas moleculas de un gas recorren distancias grandes entre colisiones (lo que se denominacamino libre medio) mientras que en el seno de un lıquido o de un solido no se desplazancon igual libertad y se encuentran siempre ubicadas a distancias mucho menores que enun gas. Las distintas partes del material quedan entonces correlacionadas por causa delas interacciones entre las moleculas que la componen y esas distancias de correlacion se

Modelos economicos de multiples agentes 23-06-2011

96 4. Leyes de potencias

Figura 4.5: Probabilidad de retorno al origen para el mercado peso-dolarcomo funcion de ∆t.

ven alteradas en presencia de un fenomeno crıtico del mismo modo que las densidades deprobabilidad.

Sistemas sociales pueden tambien presentar cambios abruptos en su estructura uorganizacion interna. Algun ejemplo ya se vio en el capıtulo anterior cuando se analizaroncontagios, la instalacion de una moda o la difusion de un rumor. En todos estos casos,un fenomeno que puede ser localizado, puede, por efecto de las interacciones entre losagentes del sistema, extenderse y abarcarlo por completo. El proposito de esta seccion espresentar elementos que permitan ubicar dentro de un mismo marco conceptual fenomenossociales aparentemente desconectados entre si y, de esta manera ofrecer un modo diferentede contemplarlos.

Muchos fenomenos crıticos se pueden simular mediante experimentos numericos re-alizados en sistemas altamente estilizados pero que retienen, de todos modos, esas discon-tinuidades que tienen lugar para valores singulares de sus parametros de control. Un modelode estas caracterısticas es el automata celular que se utiliza para representar el fenomenode la condensacion presentado en 1.5.2. Veremos a continuacion que la ocurrencia de leyesde potencias es una caracterıstica compartida que permiten ubicarlos en el contexto de losfenomenos crıticos.

El automata celular de la seccion 1.5.2 representa de manera estilizada la formacionde gotas de lıquido en un ambiente de gas sobresaturado de vapor. Por esta razon cadacelula puede cambiar de la fase vapor a la lıquida si en su vecindad hay 4 o mas celulascondensadas y pasa al estado de vapor si en su vecindad hay menos de 4 celulas condensadas.El parametro de control de ese modelo es la densidad con que se ”siembran inicialmenteceldas en la fase condensada. Una vez que se le permite evolucinar el automata celularlleva el conjunto de celdas a un punto fijo. Si dicha probabilidad es menor que 0.25 elpunto fijo al que converge consiste en gotas representadas por porciones de la grilla que sonconvexas y de distinto tamano. Si dicha densidad es levemente superior a ese valor, el punto

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 97

Figura 4.6: Probabilidad de retorno al origen para el mercado peso-dolarcomo funcion de ∆t.

fijo corresponde a que la totalidad de las celulas se encuentren en la fase condensada. Pordebajo de 0.25 el sistema posee una escala de longitud caracterıstica, finita que esta dadapor el tamano medio de las gotas. Para p = pc esa longitud de correlacion diverge porquese hace igual al tamano e la grilla.

Este modelo de condensacion guarda muchas semejanzas con otro en que la dinamicade condensacion no se tiene en cuenta y solo se presta atencion al tamano de racimos deceldas pertencientes a la fase condensada. Si la probabilidad es pequena los racimos tienenun tamano medio bien definido que es independiente del tamano de la grilla, pero cuandoesa probabilidad aumenta el maximo racimo tiene un tamano que esta solo limitado por lasdimensiones de la grilla. En este caso se trata de averiguar cual debe ser la probabilidadinicial de ocurrencia de celdas condensadas para que suceda eso y aparezca un camino queuna ambas margenes de la grilla y que este formado solo por celdas vecinas (que tengan almenos un lado en comun). Hoy se sabe que este umbral de percolacion tiene lugar cuandop = 0.5927462. La longitud de correlacion es, esta dada en este caso por las dimensionesdem maximo racimo de celdas y solo diverge (es del mismo tamano que la grilla misma)cuando se alcanza el umbral de percolacion. Un ejemplo se da en la figura fig. 4.7. En esagrilla se marcaron al azar algunas celdas y se indica un camino que une ambas margenes dela grilla. En estas condiciones se dice que el sistema de celdas percola por semejanza con

Modelos economicos de multiples agentes 23-06-2011

98 4. Leyes de potencias

lo que sucede con el flujo de algun lıquido a traves de un medio granular. El analisis deeste modelo permite demostrar que en una grilla regular ortogonal existe una probabilidadcrıtica pc para la cual se forma algun racimo cuyas dimensiones crecen con el tamao de lagrilla.

Figura 4.7: Situacion en el umbral de percolacion pc.

Esta probabilidad crıtica puede determinarse numericamente con gran precision y, enalgunas redes regulares se la ha podido calcular analıticamente. La siguiente es una tablade valores de los umbrales de percolacion para diferentes grillas regulares.

UMBRALES DE PERCOLACION

Grilla umbralpanal de abeja 0.6962

cuadrada 0.592746triangular 0.5000diamante 0.43

cubica 0.3116hipercubica (4dim.) 0.197hipercubica (5dim.) 0.141hipercubica (6dim.) 0.107hipercubica (7dim.) 0.089

Observese que el problema de percolacion que se acaba de plantear puede plantearseen termino de grafos como los presentados en el capıtulo anterior. Basta para ello hacer cor-responder una celda a un nodo del grafo y asociar los vınculos del mismo con las vecindadesde las celdas tal como se muestra en los paneles A y B de la fig. 4.8. Una vez formulado

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 99

en este lenguaje es posible generalizarlo para un grafo general tal como el del panel C de lafig. 4.8. Este esquema se discutio en el capıtulo anterior cuando se estudio la difuscion derumores, contagios y modas. La ocurrencia de un umbral de percolacion una grilla se corre-sponde con el resultado de Erdos y Renyi sobre la ocurrencia de una componente gigantesen un grafo aleatorio construido introduciendo vınculos al azar con una probabilidad p. Eneste caso tambien existe una probabilidad crıtica para tal aparicion de una componente queconecta la mayorıa de los nodos del grafo (ver seccion 4.3.1). En el estudio de problemassociales o economicos, la existencia de un umbral de percolacion puede interpretarse comolas circusntancias propicias para que una alteracion local pueda propagarse a una impor-tante fraccion del sistema. Muchos de estas implicacias fueron ya discutidas en el capıtuloanterior.

Figura 4.8: Representacion del problema de percolacion en una grilla yen grafos regulares e irregulares.

En la fig. 4.9 se muestran ejemplos de resultados de la densidad de probabilidad detamano de gotas en el modelo de condensacion para distintas probabilidades p con la quese siembran celdas condensadas en el estado inicial. Cuando p < pc = 0.25 se producengotas cuyos tamanos G se distribuyen siguiendo aproximadamente una ley exponencial comoP (G) e−λG. Esto se muestra en el panel (A) en el que la distribucion de tamanos ha sidoajustada por una curva de ese tipo. A medida que p aumenta el tamano medio de las gotascrece, se sigue obedeciendo a una ley similar pero con la constante λ cada vez menor. Parap > pc = 0.25, el proceso de condensacion de gotas invade toda la grilla produciendo unaunica gota gigante que la cubre por completo. La distribucion de tamano de gotas parap pc se aproximan a una ley de potencias P (G) G−γ . Esto se muestra en el panel (B) de lafig. 4.9 en que se ha trazado una curva que corresponde a γ 1.1.

Puede observarse que la probabilidad de ocurrencia de una gota grande (una catastrofe)comparada con la de una gota pequena es notoriamente mayor que para valores chicos dep. Esta transicion de fase es independiente del tamano de la grilla y un analisis meticulosorequiere comparar resultados para grillas de tamanos crecientes. A modo de ejemplo se

Modelos economicos de multiples agentes 23-06-2011

100 4. Leyes de potencias

muestra como las distribuciones para una grilla de 50X50 y p pc son muy similares a losde una grilla de 60X60. Sin embargo, ambas distribuciones caen rapidamente para grandestamanos. Este es un efecto de tamano finito. Como las grillas que se pueden utilizarnumericamente son en realidad finitas, las gotas que se pueden llegar a observar nuncaexceden el tamano de la grilla (en el ejemplo que se muestra ese lımite es G = 2500) con loque la probabilidad de ocurrencia de gotas mayores es cero dando ası lugar a la caida quese observa.

Figura 4.9: Distribucion de tamano de gotas. (A) Para p < pc ladistribucion es aproximadamente una exponencial. (B) Para p pc la dis-tribucion se aproxima a una ley de potencias.

Una vez alcanzado el punto fijo del automata se puede tratar de determinar la den-sidad D de gotas para distintos valores de la probabilidad p con que se siembran celdascondensadas. Para ello, se pueden contar cuantas gotas N(L) han quedado encerradas enuna grilla de lado L. Para p < pc las gotas tiene un tamano medio G y la cantidad N(L)esta bien definida y crece linealmente con L2. La densidad - constante - es, simplementeD = N(L)/L2. Si se hace un grafico de D como funcion de L se debe obtener una constante,salvo para grillas muy pequenas en las que se pueden obtener resultados alterados por eltamano reducido de las grillas. El valor de D puede, como es natural, cambiar con p. Sinembargo, la situacion es muy diferente para p pc. Para p pc la distribucion de tamanos delas gotas siguiendo una ley de potencias indica que si la grilla es suficientemente grande esposible encontrar gotas de todos los tamanos. En el umbral de condensacion no se puededefinir un valor medio de G y es posible encontrar gotas que solo esten parcialmente con-tenidas en un dado cuadrado de lado L. Si se mide N(L) como funcion de L para p pcse comprobara que no aumenta linealmente con L2 sino con alguna potencia diferente, osea N(L) Lβ. El exponente β recibe el nombre de dimension fractal del conglomeradode gotas1. Un conglomerado de gotas que se distribuyen como una ley de potencias esestadısticamente autosemejante, esto es, una muestra cualquiera puede ser magnificada oreducida para coincidir- estadısticamente - con el propio conglomerado del que se extrajo la

1La dimension fractal de Hausdorff que es una generalizacion de la nocion de dimension espacial, se definecomo limL→0 log(N(L)/ logL donde N(L) es el numero de cubrimientos de lado L que es necesario realizarpara abarcar todo el conjunto de puntos cuya dimension se desea establecer.

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 101

muestra. Del mismo modo, las series temporales analizadas en la seccion anterior puedenser consideradas fractales en el tiempo, ası como las gotas generadas con el modelo decondensacion pueden considerarse fractales en dos dimensiones espaciales.

Este calculo de la densidad esta ejemplificado en la fig. 4.10 en el que se ha graficadolog[N(L)/L2] como funcion de logL para p =0.15,0.20 y 0.25. Se repitio el calculo 40 vecespara cada valor de p y L para disponer de una estadıstica mınimamente representativa y secalculo el promedio de N(L). Para densidades muy bajas y grillas pequenas no se consignandatos por estar fuertemente afectados por lo reducido del sistema. Si bien estos resultadosson solamente un ejemplo es possible observar que para p = 0.20 la curva se aproxima muysatisfactoriamente a una constante pero para p = 0.25, en el umbral de la condensacion, lospuntos obtenidos se aproximan a una recta con una leve pendiente negativa. Esto indicaque N(L) L2−γ con γ > 0, revelando que proliferan gotas de tamanos diferentes que nollenan uniformemente el plano.

Figura 4.10: Densidad de gotas para distintos valores de p y L. Seha graficado D = N(L)/L2 como funcion de L en una escala doblelogarıtmica, de este modo una ley de potencias del tipo [N(L)/L2] L−γ ,se aproxima a una recta de pendiente negativa. Crecientes valores dep (roja, negra y azul) se corresponden con mayores valores de D. Lacurva azul corresponde al umbral de percolacion. En la curva roja no seincluyen valores pequenos de p y L.

4.2.3 Criticalidad Autoorganizada

Cuando la densidad de probabilidad sigue una ley de potencias, suele decirse que posee colasgordas. En este caso, la probabilidad de ocurrencia de un evento catastrofico es mucho mayorque si la distribucion poseyera una cola exponencial. Una de las preguntas que subyacen

Modelos economicos de multiples agentes 23-06-2011

102 4. Leyes de potencias

a la idea de la criticalidad autoorganizada es si la ocurrencia de eventos de gran amplitudpuede o no ser atribuible al funcionamiento regular y normal de propio sistema.

En la seccion anterior hemos visto ejemplos de series temporales economicas en lasque la transformada de Fourier de su funcion de autocorrelacion decae mas lentamente acero que lo que debiera esperarse de series puramente estocasticas. Esta transformda deFourier suele tambien llamarse espectro de potencia. Otras series con esta propiedad estanligadas a indicadores macroeconomicos tales como el producto bruto per capita, tasa dedesempleo, produccion industrial per capita, etc. (Nelson y Plosser 1982).

Este fenomeno de persistencia es conocido tambien como ruido 1/f , ya que dichastrasformadas de Fourier se comportan, para bajas frecuencia como f−α. El ruido 1/fsignifica que existe una importante contribucion de las bajas frecuencias (que correspondea fenomenos de “deriva”) en la descripcion del fenomeno.

Las series naturales de este tipo se presentan en sistemas “abiertos” esto es, en sis-temas en que existe un continuo aporte exterior de energıa, materia u otro elemento. Unmercado puede tambien ser considerado como un sistema abierto en el que los aportes ex-ternos mas significativos son el dinero y la informacion. No debe pues sorprender que laserie temporal de los precios refleje el comportamiento de cualquier otro sistema de estanaturaleza y presente las persistencias senaladas arriba.

En anos recientes se ha elaborado un modelo de criticalidad autoorganizada que proveeuna imagen de la dinamica que subyace a la ocurrencia de ruido 1/f . Se trata de un modelopara sistemas abiertos y extendidos, o sea, con gran cantidad de componentes en inter-accion y con una dimension en la que se pueden definir vecindades o, si se quiere, el alcancede las mutuas influencias entre sus partes. Este modelo hace surgir el ruido 1/f como lasuperposicion de eventos de distintas vidas medias. En lugar de colisiones individuales seprefiere la imagen de “avalanchas” mecanismo que se encarga de disipar la energıa que sele ha aportado al sistema y que se encuentra acumulada en distintas partes del mismo. Lasavalanchas se suponen que ocurren debido a perturbaciones externas esporadicas. Surge delmodelo que dichas avalanchas pueden propagarse y afectar a porciones mayores o menoresdel sistema. Pueden por consiguiente poseer distintas vidas medias segun una distribucionde probabilidades que que involucra - con una correspondiente baja probabilidad - vidasarbitrariamente largas. De este modo aun cuando cada proceso individual pueda dar lu-gar a un relajamiento exponencial este tiene lugar con tan diversas vidas medias que susuperposicion puede dar lugar a decaimientos mas lentos como los que se observan en larealidad.

Como el sistema que se considera es abierto y extendido, los aportes externos de en-ergıa se traducen en perturbaciones locales sobre cualquiera de sus unidades. Se suponeademas que la respuesta de cada unidad no es una funcion lineal del estımulo sino que setrata de un fenomeno todo o nada o del tipo “stick-slip” o adherencia - deslizamiento: sila perturbacion es suficientemente debil la unidad afectada absorbe integramente la pertur-bacion sin que suceda nada mas. Si en cambio la perturbacion supera un umbral la unidaddescarga una perturbacion sobre todas aquellas otras unidades con las que interactua. Ellaspueden, a su vez y siguiendo la misma ley, perturbar a otras dando asi lugar a una avalanchacuyas dimensiones espaciales y cuya duracion depende del estado de las sucesivas unidadesafectadas.

En este modelo resulta que la respuesta global del sistema a los estımulos recibidosdel exterior es autoorganizarse dinamicamente en un estado crıtico en que la distribucion deavalanchas sigue una ley de potencias y por consiguiente no posee ni dimensiones espacialesni temporales caracterısticas. Las dimensiones espaciales de la avalancha o su intensidad

Modelos economicos de multiples agentes 23-06-2011

4.2 Casos de leyes de potencias 103

dan respectivamente una medida de la cantidad total de energıa que se libera en cada eventoy la cantidad de elementos del mismo que se han visto afectados. En el marco de este modelolas grandes catastrofes (avalanchas que afectan a una porcion particularmente grande delsistema) no se presupone que sean debidas a causas externas particulares sino mas bien a unacombinacion particularmente desgraciada - e infrecuente - de acontecimientos y situacionesque de otro modo serıan totalmente normales.

Figura 4.11: Avalancha en una “pila de arena” unidimensional. Cadacuadrado representa un grano de arena. Se agrega un grano en unacolumna que esta en el valor crıtico. Se muestra el progreso de unaavalancha.

El modelo se lo formaliza mediante un automata celular que representa una ideal-izacion de una pila de arena. Los aportes externos consisten en el agregado de granos dearena que, cuando se los agrega a lugares que se encuentran colmados, dan lugar a avalan-chas .

Para realizar una simulacion numerica se comienza por construir un estado crıticodepositando en un tablero de dimensiones establecidas una cantidad grande de “granos” dearena y permitiendo que los sitios descarguen en sus vecinos los granos que exceden un valorzcrit establecido. Si bien se han estudiado numerosas variantes de este sistema variando ladimensionalidad y naturaleza de la grilla todos los efectos se pueden observar en un tableroregular de dos o tres dimensiones.

La altura de la pila de arena en la i-esima ubicacion del tablero se representa por unavariable discreta zi, zi ≤ zcrit. En caso que zi > zcrit se produce una descarga en la que elsitio zi y sus n primeros vecinos alteran sus respectivos zj segun la regla:

zi(t) → zi(t+ 1) = zi(t)− n (4.24)zj(t) → zj + 1 j ∈ vecindad de i (4.25)

Los sitios que se encuentran en el borde del tablero descargan su exceso al exterior delsistema. La actualizacion de los valores de zi en todos los sitios de la red se realiza de manerasincronica. Se llega de sta manera a una estado crıtico con una distribucion de granos dearena en la que no se producen mas avalanchas y con muchos sitios con zi = zcrit. A partir deeste estado crıtico es que se analiza la distribucion de avalanchas. Esto se hace perturbandolomediante el agregado, por turno, de un grano en cada sitio que esta con una altura zi = zcrity registrando la avalancha que se produce a partir de esa perturbacion. La intensidad de unaavalancha puede medirse por el numero de vecinos perturbados o por el area cubierta. Paraobtener una distribucion de tamanos de avalanchas que sea estadısticamente representativase repite este analisis con numerosos estados crıticos iniciales.

Modelos economicos de multiples agentes 23-06-2011

104 4. Leyes de potencias

La simulacion computacional de estos sistemas da lugar a funciones de distribucion demagnitud y duracion de eventos que obedecen leyes de potencias y ha permitido reproduciralgunos de los fenomenos naturales mencionados al comienzo. El exito mas significativo dela teorıa ha sido la descripcion de la ley de Gutenmberg y Richter que da la distribucion desismos por la energıa liberada.

El exponente crıtico de las distribuciones depende tan solo de propiedades estruc-turales del sistema tales como el numero de vecinos (la dimensionalidad de la grilla queocupan los elementos del sistema) pero de ninguna otra caracteristica del mismo tal comosu dimension o del tipo de interaccion que se desee poner entre vecinos. Notese que a me-dida que el sistema es forzado por los aportes externos, su evolucion presenta un importantequiebre de la ergodicidad: Cualesquiera sea la condicion inicial que se elija, el sistema ter-mina visitando un subespacio muy reducido de estados que son aquellos que satisfacen lacondicion de poseer la altura crıtica.

Las distribuciones que siguen leyes de potencias carecen de escalas o duraciones crac-terısticas. Los autores del modelo de criticalidad autoorganizada arguyen que el hecho quela probablidad de retorno al origen de distribuciones de este tipo sigan una ley T 1/β nece-sariamente implica que la serie temporal tiene ruido 1/f . Para ello comienzan por postularque cada evento individual (la descarga de cada sitio) que “libera” una cantidad total Ade energıa en toda su vida presenta una funcion de autocorrelacion que decrece exponen-cialmente con el tiempo c(t) = (A/T )e−t/T . Si se supone que todos los eventos tienen lamisma intensidad inicial, debe suceder necesariamente que A T con lo que la funcion deautocorrelacion es S(f,A) = A/(1 + 4π2f2T 2) ≈ T/(1 + 4π2f2T 2) El espectro de poten-cia de una serie producida por la superposicion independiente y concurrente de eventos dediversas vidas medias T (y por consiguiente de distintas intensidades A) se expresa como

S(f) =∫P (T )S(f,A)dT =

∫P (T )TdT

1 + 4π2f2T 2≈ f2−1/β (4.26)

En esta expresion el termino (1+4π2f2T 2)−1 que corresponde a la transformada de Fourierde un unico evento c(t) esa tomado simplemente como un corte para altas frecuencias quepermite redefinir el lımite superior de la integral.

Aplicacion a la economıa. La plena aplicabilidad del concepto de criticalidad autoorgani-zada al comportamiento de mercados es tema para una discusion mucho mas amplia. En(Bak et al., 1993) se analiza el fenomeno de criticalidad autoorganizada en un contextoeconomico sumamente estilizado y en Dabus et al, 1995, se plantea la posibilidad de quelos procesos inflacionarios esten auto-organizados criticamente). El modelo de la pila dearena y sus variantes posee, por una parte, elementos que son indiscutiblemente atractivos:se trata de un modelo tıpicamente holista que refleja caracterısticas del sistema como untodo, independizandose de sus detalles como la frecuencia relativa de eventos pequenos ygrandes o los mecanismos microscopicos de interaccion, esquematizandolos como siendo deltipo “todo o nada”. Presenta un proceso de autoorganizacion dinamica del sistema sin quemedien elementos o parametros exogenos que deban sintonizarse para que tal organizaciontenga lugar. Sin embargo, por otra parte, se debe admitir que en un sistema economicoexisten agentes heterogeneos de influencias muy diferentes, y en el que coexisten y se super-ponen procesos de muy diversa naturaleza. Esto hace inviable una vision agregada ingenua.Ademas, admitir plenamente que los mercados se autoorganizan crıticamente puede con-siderarse equivalente a admitir la existencia de una ley estructural e inmutable de la cuallos agentes economicos no pueden substraterse y que, de hecho contradice sus innegablesposibilidades de aprender o adaptarse a diferentes circunstancias.

Modelos economicos de multiples agentes 23-06-2011

NOTAS 105

Notas

‡1El exito del abordaje se debio en gran parte al hecho que cualquier muestra de laboratorio esta compuestapor una enorme cantidad de partıculas. Esto robustece la idea de trabajar con promedios y despreciarfluctuaciones. Dentro de un globo lleno de helio a temperatura ambiente, hay del orden de 1023 atomos, cadapartıcula individual viaja a 500 metros por segundo, y colisiona 1 vez cada 600 picosegundos, o 1666 millonesde veces por segundo. Para una interesante simulacion numerica de dos gases en un contenedor, y como essu distribucion de velocidades, visitar http://intro.chem.okstate.edu/1314F00/Laboratory/GLP.htm

‡2El ejemplo clasico de difusion corresponde al calor: ∂tu(x, t) = ∂xxu(x, t), describe como se difundela temperatura u(x, t) en la posicion x y a tiempo t. Discretizando la coordenada espacial x en puntosxii=1,..,N aislados separados por δx, el calor u(x, t) pasa a estar dado en posiciones discretas . . . , u(xi−1), u(xi), u(xi+1), . . . ,y podemos aproximar las primeras derivadas por sus diferencias finitas. La ecuacion diferencial se puedeentonces aproximar en diferencias finitas como ∂2

xxu(x, t) ≈ (u(xi+1) +u(xi−1)− 2u(xi))/(2δx2). Por lo que

podemos decir que los primeros 3 terminos de la ecuacion maestra (3.18) corresponden a la “difusion detenencias monetarias” m. Asi mismo, si a la ecuacion de calor se le agrega un termino gradiente c ∂ux(x, t),este corresponde al transporte del calor en la direccion x a una velocidad c. La discretizacion del gradienteresulta ∂xu ≈ (u(xi+1)− u(xi))/δx, que corresponde al ultimo termino de (3.18).

‡3 La funcion costo del problema del viajante es aditiva ya que el costo total para un dado itinerarioes la suma de las distancias entre las ciudades en un dado orden. Una alteracion individual consiste enuna permutacion de dos ciudades que solo implica corregir una parte muy limitada del recorrido dejandoinalterado todo el resto, haciendo que se computo sea ’barato’.

Bibliografıa

Bak, P., Chen, K., Scheinkman, J. A. and Woodford, M.: 1993, Aggregate fuctuations fromindependent sectoral shock: Self-organized criticality in a model of production andinventory dynamics, Ricerche Economiche 47, 3–30.

Bak, P., Tang, C. and Wiesenfeld, K.: 1999, Self-organized criticality, Phys. Rev. A38(16), 364–374.

Black, F. and Scholes, M.: 1973, The pricing of options and corporate liabilities, Journalof Political Economy 81(3), 637–654.

Kadanoff, L.: 1993, From Order to Chaos, Essays: Critical, Chaotic and Otherwise, WorldScientific.

Lintner, J.: 1965, The valuation of risk assets and the selection of risky investments in stockportfolios and capital budgets, Review of Economics and Statistics 47(1), 13–37.

Mantegna, R. N. and Stanley, H. E.: 1995, Scaling behviour in the dynamics of an economicindex, Nature 376(6), 46–49.

Mossin, J.: 1966, Equilibrium in a capital asset market, Econometrica 34, 768–783.

Newman, M. E. J.: 2005, Power laws, pareto distributions and zipf’s law, ContemporaryPhysics 46, 323–351. condmat/0412004v3.

Sharpe, W. F.: 1964, Capital asset prices: A theory of market equilibrium under conditionsof risk, Journal of Finance 19, 425–442.

Modelos economicos de multiples agentes 23-06-2011

106 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 5

Redes complejas, modas y cacerolazos

5.1 Introduccion

Uno de las innovaciones tecnologicas mas sobresalientes de la Era de la Informacion, es elsurgimiento de Internet, la red mas grande creada por el hombre. Terabytes1 de informacionson transmitidos diariamente entre los 540 millones de servidores2 interconectados por fibraoptica, satelites, cables coaxil, y lineas telefonicas. El origen de esta formidable red deautopistas de informacion se remonta a 1992, cuando se lanzo (gratuitamente) el programaMozilla.

Mozilla fue el primer programa que permitıa a cualquiera construir paginas con in-formacion, y ,mas interesante, definir vınculos links o otras direcciones a otras paginas a lascuales se podıa ir. Esta innovacion abrio la posibilidad de navegar por esa incipiente redformada esencialmente por paginas de Universidades. Desde su lanzamiento, la home-pagede Mozilla iba anunciando que pagina nuevas iban surgiendo, hasta que al poco tiemposurgieron muchas otras con mas listas de links. Como este proceso se torno inmanejable,surgieron los primeros buscadores masivos: Altavista, Lycos, Yahoo, etc. Debido a la es-tructura que tenıa la red, se desarrollaron programas automticos (bots) que recolectaronprimero los links y luego el contenido de cada pagina. Esto culmina en tiempos recientescon el surgimiento de Google, que, por medio de su granja de mas de un millon de servidoresnos permite realizar busquedas relativamente acotadas en un tiempo muy corto.

Internet cambio la forma en que vivimos, y sin duda cambiara la forma que viviremosen el futuro. La innovacion esencial para su exito fue que acorta las distancias y los tiempos.El acortamiento de las distancias puede ser mas figurativo que real ya que lo que realmentehace Internet es disminuir la cantidad de ’pasos’ que es necesario dar para establecer uncontacto. Hay herramientas propias para establecer redes sociales que estan orientadas asugerir a caa usuario cual otro puede ser su amigo de la infancia, haya compartido escuelas ovivan en lugares proximos. Para ello se utiliza una medida de ’distancia’ que tiene en cuentala edad, el domicilio, los estudios realizdos, etc. En cuanto al tiempo, Internet permiterealizar mas tareas por unidad de tiempo. Actualmente se busca mucho mas frecuentementeque poco tiempo atras debido a la facilidad de hacerlo.

Matematicamente, el estudio de redes se formalizo por la teorıa de grafos, que sepuede decir que nacio cuando Euler dio en 1736 con la solucion al Problema de los Puentesde Koenigsberg: encontrar un recorrido en esa ciudad que atraviese todos los puentes una

1Un terabyte equivale a 1000 gigabytes o 106 megabytes.2Son datos del 2008. En el 2007 crecio un 25%.

107

108 5. Redes complejas, modas y cacerolazos

sola vez. Un avance importante lo dieron Erdos y colaboradores en la decada del 50 conel estudio de redes aleatorias. En la ultima decada se puso atencion principalmente en lasllamadas redes complejas, que han permitido modelar redes sociales y economicas, incluidasInternet. Los estudios actuales estan orientados a

• Deteccion de comunidades (individuos, paginas web, empresas) que representen in-tereses parecidos con propositos de comercializacion o de seguridad (deteccion deagrupaciones o actividades terroristas). El estudio de redes de interes economico esmucho mas limitado.

• Difusion y diseminacion de ideas (Bikhchandani, Hirshleifer and Welch, 1992), (Bikhchan-dani, Hirshleifer and Welch, 1998)

• Busquedas en redes complejas. Los problemas que se encaran es establcer cual es lamanera mas eficiente de organizar una gran coleccion de documentos relacionados ocomo son los mecanismos que se usan para buscar algo? (Adamic, Lukose, Puniyaniand Huberman, 2001), (Kleinberg, 2000)

• Evolucion de epidemias y protocolos de vacunacion. El estudio del SIDA ha puesto enevidencia la importancia de la estructura de la red de vinuclacin social en los modosde propagacion de las enfermedades infecciosas. Esta problematica se aplica tambiena la difusion de los virus en las computadoras.

• Metodos de optimizacion. El desarrollo de actividades en el seno de una red obligay al mismo tiempo facilita implementar soluciones a problemas de optimizacion talescomo determinar el recorrido mas corto entre un conjunto de destinos tal que solose visite cada destino una sola vez (Problema del Viajante de Comercio), obtener lamejor distribucion de camiones para despachar un conjunto de mercaderıas (Prob-lema del Viajante de Comercio con multiples vehıculos y restricciones de capacidadpor cada uno de ellos. La teorıa de grafos tambin permite optimizar el cableado encircuitos electronicos, minimizando la energıa disipada, y las interferencias entre suscomponentes.

En este capıtulo estamos interesados en explorar algunos fenomenos propios de redessociales, biologicas, y economicas y cuales son los procesos mas comunes que operan sobrelas mismas. Nos interesara principalmente ver como hechos o interacciones que afectan aoloa una parte de la red pueden propagarse y manifestarse como efectos globales. Esto nosllevara a considerar modelos de se propagacion de infecciones, la instalacion de una moda,el desarrollo de una revolucion, o protestas como los cacerolazos pot-banging3). Si bien no sepretende tocar todos estos temas, se repasaran algunos que son los mas representativos y serecomienda consultar referencias mas especializadas (Albert and Barabasi, 2002), (Newman,2005) o de divulgacion (Barabasi, 2003). En todo lo que sigue, es conveniente tener presenteque hay dos grupos de problemas que pueden analizarse a la luz de estas teorıas. Un grupoesta orientado al analisis de la topologıa y otras propiedades del grafo. El otro grupo enfocaaspectos dinamicos. Estos, a su vez, pueden ser de dos tipos. Uno pretende describir como sedesarrolla un fenomeno en un grafo que permanece inalterdo en el tiempo (p.ej. propagacionde una enfermedad) y el otro pretende analizar como y porque cambia y evoluciona el propiografo por efecto de las interacciones entre sus nodos (p.ej. interacciones entre las especiesen un sistema ecologico).

3Ver extensa nota en www.wikipedia.com

Modelos economicos de multiples agentes 23-06-2011

5.2 Que es una red y algunas definiciones generales 109

5.2 Que es una red y algunas definiciones generales

Una red o grafo es un objeto muy general. Involucra un conjunto finito de nodos, que puedenrepresentar maquinas, personas, empresas, u organizaciones, y sus relaciones, vınculos olinks, que dependiendo de la aplicacion puede ser el costo entre empresas, distancia fısicaentre maquinas, la amistad entre personas o en general cualquier otra relacion que describanalguna propiedad entre nodos. Este conjunto de relaciones definen naturalmente la vecindadde un nodo como aquellos nodos que estan directamente relacionado con aquel nodo.

En los automatas celulares del capıtulo 1 dicha relacion estaba dada generalmente porla vecindad fısica de las celulas o agentes. En las redes neuronales dicha vecindad se podıaextender a todo el conjunto de celulas (modelo de Hopfield) o representar un conexionadoen cascada como en las redes en capas.

En la siguiente tabla se dan algunos ejemplos de redes.

EJEMPLOS DE REDES

Red Nodos Relaciones / VınculosRed de distrib. Centros de generacion lineas de transmision

electrica subestaciones electrica

Red trofica en especies presa - predador

un ecosistema

Internet paginas web hiperlinks

sistema nervioso neuronas axones

coautorıa cientıfica autores artıculos publicados

en comun

comercio internacional paises transacciones comerciales

Las redes de arriba no son todas iguales, y segun lo que se desee estudiar los grafosreciben diverso tipo de apelativos que restringen la definicon general que se dio de una red.Por ejemplo, un grafo es:

• dirigido u orientado cuando la relacion entre sus nodos tiene alguna direccionalidadpredeterminada. Por ejemplo en una red de compras y ventas, la relacion ”nodo Acompra de nodo B” especifica una relacion que A tiene con B, pero no una que Btiene con A. Esto ocurre por ejemplo con la relacion de proveedor a consumidor, deprestamista a prestatario, de empleador a empleado, etc.

• disconexo cuando existe un subconjunto de nodos que no se vinculan al resto o, equiv-alentemente, cuando no es posible conectar cualquier par de nodos recorriendo uncamino formado por relaciones consecutivas.

• pesado o es un multigrafo cuando a sus vınculos se les asigna algun peso que determinela intensidad o importancia de la interaccion. Los tratamientos pueden cambiar si elpeso se define como un numero natural o uno real. Tal por ejemplo si se trata de unared de prestamistas y prestatarios, el peso del vınculo puede estar relacionado conel monto del dinero prestado. Si se trata de una red comercial el peso puede ser elnumero, costo o naturaleza de los bienes transados.

• arbol cuando el mismo no tiene ningun ciclo. Un ciclo en un grafo es un subconjuntode nodos que cada uno tiene por lo menos dos conexiones, y uno puede definir un

Modelos economicos de multiples agentes 23-06-2011

110 5. Redes complejas, modas y cacerolazos

orden de visita (respentando naturalmente las conexiones existentes) tal que si salede cualquier miembro, vuelve a pasar por el mismo.

• regular cuando todos los nodos tienen el mismo numero de vecinos y tiene una dis-posicion particular en algun espacio Euclideo. Tal es, por ejemplo el caso de lasintersecciones de una grilla regular cuadrada o hexagonal en el plano, como el tablerode un juego de ajedrez.

• aleatorio cuando sus relaciones o vınculos son determinadas mediante un procesoestocastico (digamos por alguna distribucion de numeros aleatorios). En general sesuele referir a una red aleatoria, aquella que proviene de utilizar una distribucionuniforme de numeros aleatorios (red de Erdos y Renyi ver 5.3.1).

• bipartito cuando esta compuesto por nodos de dos tipos y las conexiones solo vinculana nodos de distinto tipo. Tal es el ejemplo de un sistema de bancos y empresas, enque el vıculo es el otorgamiento de creditos; de directorios de empresas y de personas,en el que el vınculo es el de pertenencia; de de actores y pelıculas en que el vıculo esel de formar parte del elenco.

• dinamico si la cantidad de nodos o sus conexiones cambian con el tiempo. Tal es porejemplo Internet en que los nodos son servidores que se suman al sistema constan-temente o la red de relaciones interpersonales que se establecen por un vınculo deamistad cambia en el tiempo.

Formalmente un grafo N queda definido cuando se denotan sus N nodos, y las Krelaciones entre ellos. Estas ultimas suelen especificarse mediante una matriz de adyacenciaAi,j cuyas filas y columnas estan rotuladas por los nodos y sus elementos Ai,j ∈ 0, 1indican respectivamente la ausencia o presencia, respectivamente, de un vınculo entre elnodo i y el j. Para los grafos pesados, es util definir la matriz de adjacencia con coeficientesreales Ai,j ∈ R, indicando el peso del vınculo entre los nodos correspondientes. En lamayorıa de las aplicaciones en redes complejas no se admiten auto-conexiones, por lo queAi,i = 0 para todo nodo i. Para el caso de un grafo comun Ai,j es una matriz simetrica,mientras que si el grafo es dirigido es, en general, no simetrica. Para redes bipartitas, con N1

nodos de una especie, y N2 nodos de la segunda especie, cada fila de la matriz correspondena una especie de nodos de tipo 1, y cada columna a especies de nodos de tipo 2, por lo queAi,j ∈ RN1xN2 no es una matriz cuadrada.

La representacion grafica de los grafos suele ser puntos para los nodos y segmentoso curvas para sus relaciones. Actualmente estan disponibles en Internet softwares especial-izados para hacer estos dibujos4. Algunos ejemplos de grafos se muestran en la fig. 5.1.

Como se puede apreciar los ambitos donde se puede aplicar la teorıa de grafos es deuna enorme generalidad y abarca una gran diversidad de situaciones. Para caracterizar losgrafos es usual consideras los siguientes elementos:

• Vecindad de un nodo. Para un nodo i, su vecindad corresponde al subconjunton(i) ∈ N de un nodo i, tal que Ai,n(i) = 1 (o distinto de cero para redes pesadas).

• Grado o fuerza de un nodo. Para un nodo i, su grado ki es el numero de vecinoso |n(i)| la cardinalidad de su vecindad. Especıficamente

ki =∑j

Ai,j (5.1)

4http://vlado.fmf.uni-lj.si/pub/networks/pajek/ o http://www.graphviz.org

Modelos economicos de multiples agentes 23-06-2011

5.2 Que es una red y algunas definiciones generales 111

Random graph Powerlaw graph

Figura 5.1: Se muestran diverso tipo de grafos.

En el caso que se trate de un grafo pesado, la extension natural del concepto de gradoes el de fuerza que es la suma de los pesos de todos los vıculos que parten de esenodo y cumple con la definicion dada en (5.1). Por lo general lo que se analiza es ladistribucion de pesos P (k) que es la probabilidad de ocurrencia de un nodo con grado(o fuerza) k. Como es usual, los momentos de esta distribucion son

〈kn〉 =∑i

knP (k) (5.2)

Una cantidad importante es la conectividad promedio de una red 〈k〉 ≡ 2K/(N(N −1)), donde K es el numero total de relaciones o vınculos de la red5.

• Distancia entre nodos La distancia di,j entre los nodos i y j es el numero mınimo devınculos o relaciones que es necesario recorrer para unir ambos nodos. Por lo generalesta distancia tambien recibe el nombre de camino mınimo entre nodos. Existenalgoritmos para calcular las distancias mınimas, como el de Dikjistra. Por extensionse suele llamar diametro de un grafo al camino (mınimo) mas largo entre todos losnodos de ese grafo. Por otra parte, se define como distancia caracterıstica entre losnodos de esa red al valor medio:

L = 〈di,j〉i,j =1

N(N − 1)

∑i,j;i 6=j

di,j (5.3)

Debe notarse que esta definicion debe ser aplicada con precaucion pues L diverge siel grafo es disconexo.

• Clustering El coeficiente de clustering Ci del nodo i es la fraccion de sus vecinos queson, a su vez, vecinos entre si. Es una medida de que tan social es el vecindario de unnodo. Mas formalmente se la suele definir como

Ci =Ei

ki(ki − 1)/2(5.4)

5Una red de N nodos, posee un maximo de N(N −1)/2 conexiones unicas (la coneccion A→ B y B → Acuentan una sola vez).

Modelos economicos de multiples agentes 23-06-2011

112 5. Redes complejas, modas y cacerolazos

donde ki es el el grado del nodo i y Ei es el numero de relaciones o vınculos que unenentre si a los vecinos de nodo i (y excluyen al nodo i). Obviamente, el clusteringmedio se define como

C = 〈Ci〉 =1N

∑i

Ci (5.5)

Por su definicion 0 ≤ Ci ≤ 1.

• Centralidad En muchos estudios es util contar con una medida de la centralidad oimportancia de un nodo para conectar distintas partes de la red, o sea, una medidade la relevancia de un nodo en su estructura general6. En una red de distribucionde mercaderıa, un nodo de elevada centralidad puede ser, por ejemplo la oficina en-cargada de la vinculacion de diversos centros de acopio o reparto. En una red decomunicaciones puede tratarse de una central de conmutacion telefonica que vinculados centros con gran cantidad de telefonos.

Una manera de calcular la centralidad de un nodo es preguntarse, para ese nodo,cuantos caminos mınimos que unen entre si a dos nodos cualesquiera de la red debenpasar necesariamente por el. Con esta idea, la centralidad de un nodo i se define como

Bi =∑

j,k;j 6=k

nj,k(i)nj,k

(5.6)

donde nj,k es el numero total de caminos mınimos que conectan los nodos j y k ynj,k(i) es el numero de caminos mınimos que unen los nodos j y k que pasan por elnodo i. Tambien se puede aplicar esta definicion a los vınculos y definir la ligazonde un vınculo como la fraccion de caminos mınimos del grafo que pasan por dicharelacion.

Varios de los parametros definidos arriba requieren gran tiempo de computo para redesde cierta importancia. Para un grafo comun, de N = 1000 nodos, las computadoras actualespermiten almacenar la matriz de adjacencia Ai,j para definir todas las relaciones, aunqueen muchas aplicaciones dicha matriz esta plagada de ceros y es mas eficiente para cadanodo guardar su lista de vecinos. Para medir distancias mınimas entre nodos con matriz deadjacencia Ai,j ∈ 0, 1, un metodo sencillo de aplicar es obtener sucesivas potencias An,pues sus coeficientes indican el numero de caminos de largo n entre los nodos de la red. Sinembargo este algoritmo es muy lento para redes grandes N > 100 y es necesario recurrir aotros metodos (metodo de Dijikstra).

5.3 Redes aleatorias, mundos pequenos y redes libres de escala

Durante mucho tiempo, los grafos mas utilizados fueron los regulares y los aleatorios. Porejemplo, los regulares fueron utilizados en la decada del 20 por von Neumann con losautomatas celulares, y lo mismo Fermi, Pasta y Ulam (decada del 50) en sus primerosexperimentos computacionales sobre el principio de equiparticion de energıa. Los grafosaleatorios tuvieron su gran empuje hacia finales de la decada del 50, cuando Erdos y Renyi7

caracterizaron la construccion y las propiedades de los grafo aleatorio.6Tambien se lo puede llamar ligazon (betweeness) o carga (load).7Erdos fue un matematico hungaro extremadamente prolıfico, llegando a publicar mas de 2000 trabajos

a lo largo de su vida, con muchisimos coautores. Tan famoso termino siendo que las generaciones posteriorescomenzaron a medir en el grafo de publicaciones matematicas, cual es la distancia mınima entre ellos yErdos. Este numero se conoce como numero de Erdos y su promedio es 3.

Modelos economicos de multiples agentes 23-06-2011

5.3 Redes aleatorias, mundos pequenos y redes libres de escala 113

Mas recientemente, Watts y Strogatz (Watts and Strogatz, 1998), introdujeron lasredes de mundo pequeno, cuya caracterıstica central es que preservan la propiedades de lasredes regulares, y contienen tambien alguna propiedad de las redes aleatorias. Asi mismoBarabasi y Albert (Barabasi and Albert, 1999), estudiaron como son la distribucion denodos en redes reales, y notaron que eran altamente skewed: muchas de ellas poseıan unregimen power-law.

5.3.1 Redes aleatorias

Erdos y Renyi (1959) dieron un metodo para generar redes aleatorias, conocidas ahoracomo it redes de Erdos y Renyi o directamente redes aleatorias. Para construir un grafoaleatorio de K vertices y N nodos, se genera una matriz de adyacencia de NxN de ceros,y se ponen unos, en posiciones elegidas al azar, que no esten ocupados previamente, ni esteen la diagonal. Otro metodo similar, es recorrer la matriz de adyacencia inicialmente conceros y con una probabilidad p = 2K/N(N−1) cambiar un 0 por un 1. Este ultimo metodogenera un grafo con K aristas solo en promedio.

Como segundo aporte, Erdos y Renyi, estudiaron las propiedades de las redes gener-adas a medida que aumentaban K o analogamente p. Demostraron que para p = pc = 1/Nlas redes sufren cambios profundos (y corresponde a un grado promedio crıtico kc = 〈k〉 = 1.El resultado central se puede resumir en:

• si p < pc el grafo no tendra componentes mayores que O(logN) con una probabilidadque tiende a 1 cuando N →∞

• cuando p = pc su componente mas grande tiene un tamano O(N2/3) con una proba-bilidad O(1)

• si p > pc el grafo tiene una componente ”gigante” que tiene O(N) nodos y ningunaotra componente tiene mas que O(logN) nodos.

• La distribucion P (k) para N grande y valor fijo de 〈k〉 puede aproximarse muy bienpor una distribucion de Poisson

P (x) = e−〈k〉〈k〉x

x!(5.7)

Esta transicion se conoce hoy como transicion de percolacion y fue independientementeestudiada por los fısicos (?????).

Otro resultado importante conocido de las redes aleatorias es su dependencia de ladistancia mınima media L y el clustering C de la cantidad de nodos N y el grado promedio〈k〉. Dado que un nodo tienen en promedio 〈k〉 vecinos, y (supongamos) que esos vecinos noson vecinos entre ellos los vecinos (es decir no hay ciclos), la cantidad de segundos vecinosson 〈k〉2, y en general la cantidad de n-vecinos, sera 〈k〉n. Como la cantidad de vecinos esfinita en la red, tenemos que existe un L tal que 〈k〉L = N , o,

Lrand ≡ L =logNlog〈k〉

(5.8)

con lo cual a medida que aumenta linealmente la cantidad de nodos en una red, su distanciamınima media aumenta mas lentamente. Para el clustering C, la probabilidad que dosvecinos sean vecinos entre si es es la probabilidad que dos nodos sean vecinos:

Crand =〈k〉N

(5.9)

Modelos economicos de multiples agentes 23-06-2011

114 5. Redes complejas, modas y cacerolazos

5.3.2 Mundos pequenos

La nocion de mundo pequeno fue introducida por el psicologo Milgram, en la decada del 60,en su intento de caracterizar cual es la distancia que separa dos individuos cualesquiera. Elexperimento consistio en medir cuantos contactos debıan visitarse para conectar un sujetode Nebraska con otro desconocido X de Boston. Para esto, Milgram pidio a algunos sujetosdel estado de Nebraska, que envıen cartas postales a sus conocidos, solicitando si conocıanal sujeto X y de lo contario reenvıen la carta utilizando sus propios conocidos. Las cartasrecibidas por el sujeto X, contenıan la lista de todos los contactos visitados, y de allı Milgramconcluyo que en promedio se necesitaron 6 cartas. De este experimento surgio la idea que enpromedio hay 6 grados de separacion entre cualquier individuo elegidos al azar, un numeroque a priori, parece extremadamente pequeno si pensamos cuantas conexiones nos separancon individuos en otra parte del globo. Sin embargo, vimos que para una red aleatoria,la distancia mınima media entre dos nodos elegidos (5.8) si tomamos la poblacion mundialcomo N = 6109 y la cantidad de vecinos promedio que conocemos 〈k〉 = 200, nos dejaLrand ≈ 4.2. Es decir, un numero incluso menor a 6!

Mas recientemente, Watts y Strogatz (1998) (Watts and Strogatz, 1998) definieron lanocion de mundo pequeno en un modelo matematico. Si bien, de acuerdo a los resultados deMilgram, las redes sociales tienen una distancia mınima pequena, Watts y Strogats notaronestas redes tambien tienen vecindarios conectados, es decir los vecinos de un nodo suelen servecinos entre si. Para caracterizar esto, introdujeron el coeficiente de clustering, definidoen (5.4). Con esta definicion, podıan clasificar las redes por los valores relativos de L y C:las redes aleatorias (tiene distancia pequena Lrand 1 y Crand = 〈k〉/N 1), las redesregulares (Lreg grande8 y Creg ≈ 3/49), mientras que las de mundo pequeno (Lsw 1 yCsw ≈ 1): la distancia entre nodos es corta como en una red aleatoria, pero preserva lapropiedad social de tener vecindarios conectados entre si.

Watts y Strogatz presentaron resultados sobre mediciones de L y C sobre redes realesmuy diversas. Como se puede observar las longitudes caracterısticas reales y de un grafoaleatorio son muy semejantes pero el clustering aleatorio es notablemente inferior al real loque coloca a esos grafos en la categorıa de mundos pequenos.

EJEMPLOS DE MUNDOS PEQUENOS

Red N 〈k〉 〈L〉 〈L〉(rndm) 〈C〉 〈C〉(rndm)www 153,127 35.21 3.1 3.35 0.1078 0.00023

Actores 225,226 61 3.65 2.99 0.79 0.00027

Coautores cient. 52,909 9.7 5.9 4.79 0.43 0.00018

Estuario de Ythan 134 8.7 2.43 2.26 0.22 0.06

Parque Silwood 154 4.75 3.40 3.23 0.15 0.03

co-ocurrencia palabras 460,902 70.13 2.67 3.03 0.437 0.0001

Sinonimos 22,311 13.48 4.5 3.84 0.7 0.0006

Red electrica 4,914 2.67 18.7 12.4 0.08 0.005

c.elegans 282 14 2.65 2.25 0.28 0.05

8Esta distancia es proporcional a N1/d, siendo d la dimension del espacio considerado.9Para un red regular de grado k en el espacio 2-D, se puede mostrar que el clustering es:

Creg(k) =3

4

k − 2

k − 1(5.10)

que tiende a 3/4 para k →∞, y no depende de N .

Modelos economicos de multiples agentes 23-06-2011

5.3 Redes aleatorias, mundos pequenos y redes libres de escala 115

En la table N es el numero de nodos; 〈k〉 es el grado promedio del grafo, 〈L〉 la distancia media entre nodos

y 〈C〉 es el clustering medio. Las columnas que poseen las sigla (rndm) corresponden al valor del parametro

correspondiente para un grafo aleatorio con igual numero de nodos y aristas. www indica la red Internet

y es un grafo dirigido, el dato consignado es sobre una parte de toda Internet; Parque Silwood y Estuario

Ythan son redes troficas de ecosistemas muy estudiados; en las redes de actores o de coautores cada actor

/ autor es un nodo y hay un vınculo si han firmado conjuntamente un trabajo o han participado en una

misma pelıcula, la fila c.elegans corresponde al sistema nervioso de esa especie.

Un modelo de red que ejemplifica estas nociones es el siguiente. Se parte de ungrafo regular de 〈k〉 vecinos, y de acuerdo a un parametro llamado ’probabilidad de atajos’p, se lo altera mediante el siguiente proceso estocastico: se elije con probabilidad p unaconexion de la red regular, y se la reemplaza por otra donde uno de los nodos es elegidoal azar. En otras palabras, las conexiones intercambiados generan atajos o shortcuts, queefectivamente acortan la distancia mınima promedio. A medida que p → 1, se espera quetoda las conexiones se randomizen, por lo que en ese lımite se estarıa muy cerca de una redcomplemente aleatoria. En la fig. 5.2 se muestra la distancia caracternıstica y el clusteringmedio para un grafo con 〈k〉 = 20 como funcion de p. El clustering se mantiene elevadoy cambia relativamente poco con p hasta que cae a valores pequenos propos de un grafoaleatorio. La distancia caracterıstica en cambio decae mas o menos abruptamente aun paravalores de p pequenos.

0

0.25

0.50

0.75

1.00

0 0.25 0.50 0.75 1.00

p

L C

Figura 5.2: Redes de Watts-Strogatz para distintas probabilidades deatajos p. Parametros N = 500, k = 8. Promediado sobre 10 realiza-ciones.

El hecho que la red tenga las caracterısticas de un mundo pequeno mejora la velocidadde transmision de senales a traves de la red si es que esta actua como un sistemas decomunicaciones. Se ha pensado que el sistema nervioso del C. elegans posee una red deneuronas con estas caracterısticas pues puede ofrecer ventajas evolutivas con respecto a unconexionado al azar.

En un estudio empırico reciente, Dodds et al (Dodds, Muhamad and Watts, 2003)rehicieron los experimentos de Milgram. Usando 8 destinos, y utilizando una aplicacionweb, de 24000 individuos que participaron, solo 384 cadenas lograron llegar a uno de losdestinos. Los resultados no son del todo concluyentes, debido a la gran cantidad de cadenasque no se concluyeron, aunque nuevamente el valor de la distancia mınima promedio es

Modelos economicos de multiples agentes 23-06-2011

116 5. Redes complejas, modas y cacerolazos

Red N 〈k〉 〈L〉 〈C〉 γ

AS2001 11,174 4.19 3.62 0.24 2.38

Routers 228,263 2.80 9.5 0.03 2.18

Gnutella 709 3.6 4.3 0.014 2.19

WWW ' 108 7.5 16 0.11 2.1/2.17

Proteinas 2,115 6.80 2.12 0.07 2.14

metabolica 778 3.2 7.40 0.7 2.2/2.1

Math 1999 57,516 5.00 8.46 0.15 2.47

actores 225,226 61 3.65 0.79 2.3

e-mails 59,812 2.88 4.95 0.03 1.5/2.0

Tabla 5.1: Ejemplos de redes libres de escala. Todas las redes con ex-cepcion de WWW, metabolica (de Escherichia Coli) y los e-mails songrafos no dirigidos. Los dos valores de γ cuando la red es dirigida repre-sentan a los grados de entrada y de salida a cada nodo. La red AS2001corresponde a Internet al nivel de sistema autonomo mientras que Routerscorresponde a la descripcion de Internet desde la perspectiva de los servi-dores. Gnutella es una red de pares (P2P) que comparten archivos deun cierto tipo. WWW es Internet determinada a traves de los hiperlinks.Tabla sacada de la (Albert and Barabasi, 2002).

entre 5 y 7.

5.3.3 Redes libres de escala: Preferential attachment

Cuando se comenzaron a analizar grafos reales de gran porte, particularmente Internet, seencontro que la distribucion P (k) no decaıa exponencialmente sino que lo hacıa como unaley de potencias (Barabasi and Albert, 1999), P (k) ' Ak−γ con 2 < γ < 3 lo que hace quesu varianza resulte divergente con el maximo grado de la red:

〈k2〉∫ kmax

k2p(k) ' k3−γmax (5.11)

Estas redes recibieron el nombre de redes libres de escala porque las distribucionesde potencias conservan su forma frente a un cambio de escala de su variable dependiente(P (αx) = β(α)P (x)). En otras palabras, estas redes carecen de una cantidad de vecinoscaracterıstica.

En la tabla adjunta se enumeran algunas redes libres de escala con sus respectivosexponentes.

Un mecanismo que produce redes libres de escalas ocurre en redes que crecen enel tiempo adicionando nodos que se vinculan a los existentes con una probabilidad tantomayor cuanto mayor es el grado del nodo al que se conectan. En la literatura este mecanismorecibe el nombre de preferential attachment. Este proceso responde a la intuicion: una nuevapagina web se vincula preferentemente a las paginas preexistentes mas direccionadas, o bien,un nuevo comerciante trata de tener transacciones con los centros comerciales con mayormovimiento. Veremos en el Capıtulo XX un modelo de generacion de redes libre de escala.

La distancia mınima promedio entre nodos para una red libre de escalas crece aprox-imadamente como las redes aleatorias (es decir ≈ log(N)). El clustering en estas redes por

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 117

lo general es un poco mas grande que para redes aleatorias (5 veces), pero nunca como elque se observa en redes de mundo pequeno.

5.3.4 Robustez y vulnerabilidad

Que sucede si a una red se la intenta ’romper’ eliminando alguno de sus nodos (y susrespectivas conexiones) o alguno de sus vınculos? En principio, si los danos son suficiente-mente grandes, uno espera que una red inicialmente con una sola componente gigante, sefragmente.

Las redes libres de escala cobraron importancia por su robustez frente a los llamadosdanos parciales. Esto se puede cuantificar con el siguiente experimento numerico. Se defineuna probabilidad p con que se cortan vınculos (o eliminan nodos) elegidos al azar a unadeterminarda red con distribucion de grado P (k), y en cada realizacion se efectuan lossiguientes pasos:

i Se genera una nueva realizacion de la red (y se determina que sea conexa, sino lo esse vuelve a generar una nueva red),

ii Una fraccion p de vınculos se cortan (o nodos se eliminan),

iii Se mide si la red resultante se fragmento en mas de una componente.

Realizando este experimento muchas veces se puede determinar cual es la probabilidad queuna red de distribucion P (k) se fragmente. Lo que se observa es que existe una probabilidadcrıtica pc, tal que para p > pc la red casi siempre se rompe. Se determino el valor crıtico paradistintas distribuciones de grado, y se mostro que para una red infinita con P (k) ' k−γ conγ ≤ 3 esa transicion nunca tiene lugar (pc ' 1). En un ejemplo concreto, para un tama/ nofinito, y un exponente γ ' 2.5 (como el de Internet), se tiene que pc ' 0.9 con lo que esnecesario eliminar al azar 90% de sus nodos para que la red se fragmente.

La vulnerabilidad de una red es un parametro diferente a la robustez. Si bien paraesta ultima se presupone que la eliminacion de nodos o vınculos es aleatoria, para medir lavulnerabilidad el proceso de remocion no debe ser aleatorio sino dirigido. Si bien Internet,resulta muy robusta a una remocion aleatoria de nodos, resulta ser muy vulnerable, pues sucomponente gigante desaparece si se remueve tan solo el 1% de los nodos de maxima grado.

Estos experimentos muestran dos caracterısticas importantes de redes de tipo leyesde potencia. Mas adelante vamos a ver otras propiedades singulares, en lo que se refiere adinamica de propagacion sobre estas redes.

5.4 Modelos de contagio en ciencias sociales

Las ciencias sociales tienen una cierta tradicion con modelos de rumores, modas y/o rev-oluciones. A partir de los modelos de Schelling (Schelling, 1971) sobre fenomenos de seg-regacion, comenzaron los estudios sobre fenomenos de difusion de informacion o senales’contagiosa’. Esto ultimo podrıa ser un rumor, un nuevo producto, una ideologıa, en fin,un sin numero de aplicaciones que requiere un marco teorico razonable para su correctainterpretacion.

Uno de los pioneros en modelos de contagio en las ciencias sociales fue Granovet-ter (Granovetter, 1975a), (Granovetter, 1975b). En su tesis doctoral estudio cuales eran

Modelos economicos de multiples agentes 23-06-2011

118 5. Redes complejas, modas y cacerolazos

los mecanismos por los cuales sus colegas y companeros obtenıan sus nuevos trabajos, esdecir que rol o influencia tenia la red social sobre las elecciones que tienen que hacer los em-pleadores. Mediante numerosas entrevistas, constato que el modo mas frecuente era obtenertrabajo por medio de las relaciones debiles o weak links, es decir, conocidos y que no tenıanun contacto muy frecuente. La explicacion es que las relaciones directas (familiares y ami-gos mas cercanos, o strong links) temen realizar una recomendacion muy exagerada ya quepueden danar su propia reputacion o su amistad directa, si la recomendacion no fue deltodo satisfactoria. En cambio por medio de las relaciones debiles, las recomendaciones sibien tal vez no son tan fundadas, son mas efectivas por que las expectativas entre el querecomendo y el empleador son debiles.

Si bien estos modelos tratan de prescindir de muchos detalles, las preguntas intere-santes son las condiciones para que un determinado rumor pueda surgir (y contagiar unaproporcion de la poblacion) o cual es la probabilidad que un rumor invada la totalidad delsistema. En otras aplicaciones se estudian distintos mecanismos o estrategias para ’vacunar’y protegerse de lo ’contagioso’, como el caso de los virus informaticos.

Las aplicaciones de estos modelos van desde la propagacion de rumores durante unacampana polıtica, la implementacion de campanas de comercializacion conocidas como mar-keting virosico, como ası tambien el entendimiento de ’burbujas’ en mercados financieros.

En el pasado, muchos de estos modelos utilizan la aproximacion random-matchingpara definir quien interactua con quien: en cada paso de tiempo, se sortean al azar dosindividuos para que interactuen. Esta aproximacion supone que los vecindarios son muyhomogeos entre si, y mucho mas importante, que correlaciones entre las acciones de losindividuos decaen muy rapidamente con la ’distancia’ entre ellos. Para el caso de rumores,modas o revoluciones, esta ultima aproximacion resulta mas discutible, ya que justamentela ocurrencia de un rumor en un vecino de un individuo i, tiende a aumentar la probabilidadque el rumor le llegue a i. En esta seccion presentamos dos modelos de propagacion de modasy epidemias, ilustrando sus principales caracterısticas y utilizando algunas herramientas dela teorıa de grafos.

5.4.1 Que es un contagio epidemiologico

Para fijar ideas trabajemos sobre contagios epidemiologicos. En general los fenomenos decontagio se denominan aquellos procesos donde un individuo ’suceptible’ (S, sano) de sercontagiado se infecta (I) de otro individuo que previamente poseıa la enfermedad. Dependi-endo del tipo de enfermedad, hay muchos caminos posibles para el infectado: puede quedarcon la infeccion para siempre, se puede morir (D) luego de un determinado tiempo, puedequedar inmunizado por un lapso finito (R), transcurrido el cual vuelve a la poblacion desuceptibles, o luego del lapso que infecta, se recupera como suceptible nuevamente. Tipi-camente se denota con las letras S, I, R, D, los tipos de estados que la enfermedad puedetener, mientras que una secuencia de letras identifica la secuencia que sigue la enfermedad(por ejemplo SIR, SIS, SI, etc).

Estos fenomenos pueden ocurrir a distintas escalas espaciales, por ejemplo, celular,individuo, o especie. A nivel celular el contagio podrıa corresponder a un cancer; a nivelindividuo a una gripe cuyo contacto es estar cerca un determinado tiempo con otro enfermode gripe; a nivel especie nos podemos contagiar de distintas ideologıas o incluso religiones.Las escalas de tiempo involucradas son, el tiempo caracterıstico que dura un contagio, eltiempo que dura una infeccion (y los tiempos caracterısticos de otros estados si los hubiere;ver mas abajo).

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 119

La probabilidad de contagio, depende por lo general de la cantidad de infectados.Uno espera que a mayor numero de infectados, sea mas probable adquirir la enfermedad. Sise asume una red de contactos, el numero de infectados esta acotado al numero de vecinosque tiene un agente, por lo tanto la probabilidad de infeccion puede depender de como seala red. Aca se pueden distinguir dos modos de contagio muy parecidos: el individuo tieneuna probabilidad de contagio por cada contacto, o simplemente tiene una probabilidad decontagio proporcional a la proporcion de vecinos contagiados. La mayorıa de las aplicacionessupone una probabilidad de contagio por contacto.

Si bien hay procesos infecciosos complejos que involucran muchos estados intermediosde ’infeccion’ (tuberculosis por ejemplo), el procesos mas sencillo es suponer que el individuoesta o no infectado. Esto lo hace analogo a muchos otros problemas de decision binaria enlas ciencias sociales, como ser la propagacion de rumores (’acepto o no propagar el rumor’)o modas (’compro o no el vestido que veo en la vidriera’). Este fenomeno puede modelarsecomo un cambio de estado a partir de un determinado umbral (que puede o no dependerdel individuo). Por ejemplo, si tenemos un problema social de ir o no la huelga, se puedemodelar a los ’obreros’ que tienen un umbral que depende de la cantidad de obreros que yase adhirieron.

Las preguntas interesantes en este tipo de fenomenos son:

• Cuales son las condiciones para que se adopten las modas?

• Cual es la frecuencia con que ocurren las cascadas de modas?

5.4.2 SIS y el umbral crıtico de infeccion

Veamos un ejemplo de contagio epidemiologico S-I-S o simplemente SIS. Tenemos unapoblacion de N individuos, en una red aleatoria con K vınculos, por lo que el grado prome-dio de la poblacion es 〈k〉 = 2K/(N − 1) ≈ 2K/N . La poblacion puede estar en el estadosuceptible (S), y se contagia con una probabilidad p si tiene un vecino en estado infectado(I). Asi mismo los infectados se recuperan con una tasa probabilıstica r, y vuelven a lapoblacion de suceptibles. Dada esta tasa de recuperacion, la duracion media de la infecciones del orden de 1/r.

Tomemos que i(t) representa la fraccion de infectados, y s(t) representa la fraccionde suceptibles que la poblacion tiene a tiempo t. Podemos escribir las siguientes ecuacionesde evolucion poblacional,

s(t+ 1) = s(t)− k∗s(t) i(t) + r i(t) (5.12)i(t+ 1) = i(t) + k∗s(t) i(t)− r i(t) (5.13)

donde k∗ = p 〈k〉 y supusimos que cada individuo tiene la misma cantidad vecinos 〈k〉.Esto se conoce como aproximacion de campo medio, y para un red aleatoria es una aproxi-macion buena en la mayorıa de los casos. La explicacion del modelo es que la poblacion desuceptibles disminuye a una tasa k∗s(t) i(t) cuando un suceptible se interactua con un in-fectado, y aumenta a una tasa r i(t) cuando los infectados se recuperan. Como la poblacionpuede estar solo suceptible o infectado, tenemos que s(t) + i(t) = 1 es invariante, por lo quepodemos eliminar una de las dos ecuaciones y llegar a

i(t+ 1) = f(i(t)) = (1− r + k∗(1− i(t)) i(t) (5.14)

Modelos economicos de multiples agentes 23-06-2011

120 5. Redes complejas, modas y cacerolazos

que tiene un equilibrio i∗ = i(t+ 1) = i(t) cuando

i∗A = 0 (5.15)

i∗B = 1− r

k∗(5.16)

Para determinar la estabilidad de estos equilibrios analizamos f ′(i) = 1− r + k∗ − 2k∗i encada uno de ellos. El origen es inestable10 cuando r < k∗, mientras que el equilibrio notrivial es estable si r < k∗. En otras palabras, para un dado r fijo, si k∗ es suficientementepequeno, el origen es estable, y cualquier intento de propagacion de la infeccion concluira enla extincion de la misma, dado que la recuperacion es suficientemente alta. En este regimende parametros el equilibrio i∗B < 0 por lo que no es fısicamente posible. Sin embargo, amedida que aumenta k∗, para el lımite k∗ = r, i∗A = i∗B, y la tasa de recuperacion es iguala la tasa de infeccion. Es aquı donde ocurre una bifurcacion11 en el sistema, y el equilibrioi∗A se vuelve inestable, mientras que el i∗B es positivo (fısicamente realizable) y estable.

En conclusion, si definimos λ ≡ k∗ = 〈k〉p como una tasa de infeccion efectiva, hayuna tasa crıtica

λ > λc = r (5.17)

para el cual el sistema presenta asintoticamente en el tiempo una poblacion constante i∗B > 0de infectados. Esto se conoce como una endemia, y su tamano i∗B depende de la red, dela probabilidad de contagio p y de la tasa de recuperacion r. Una cantidad analoga parala epidemiologıa es R ≡ λ/r = 〈k〉p/r, que corresponde a la tasa promedio de infeccionessecundarias dado un suceptible. Dicha cantidad se conoce como coeficiente de reproduccionbasica de la infeccion, y su interes es conocer cuando R > 1, dado que en este caso laepidemia puede propagarse.

Ejercicio 15 Que sucede si no hay recuperacion (r = 0) y el modelo es simplemente SI?

5.4.3 Ejemplo numerico

Veamos un ejemplo numerico de la propagacion SIS. En el listado 5.1, definimos una funcionpara generar la matriz de adjacencia aleatoria de N nodos y grado promedio z, distribuyendoK = Nz/2 links, donde a una matriz inicialmente de ceros, se le van agregando progresiva-mente unos elegidos al azar (salva en las diagonales y en lugares donde ya habıa previamenteun uno).

Listado 5.1: Creacion de red aleatoria

function adj = adj rand (N, z )

adj = zeros (N) ;n l i n k s = N∗z /2 ;

while n l inks >0,x= f loor (rand (1 , 2 )∗N) + 1 ;while adj ( x ( 1 ) , x ( 2 ) ) == 1 | | x (1 ) == x ( 2 ) ,

x= f loor (rand (1 , 2 )∗N) + 1 ;end

10Se dice que un equilibrio es inestable cuando una pequena perturbacion al equilibrio se alejaasintoticamente del mismo. La condicion para mapas es que el Jacobiano tenga autovalores modulo mayoresa uno, que es lo mismo que f ′(i∗A) > 1

11Esta bifurcacion se conoce como transcritica y suele ocurrir cuando hay algun plano invariante en elespacio de fases, como en este caso i(t) = 0.

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 121

adj ( x ( 1 ) , x (2) )=1;adj ( x ( 2 ) , x (1) )=1;

n l i n k s = n l i n k s − 1 ;end

Ahora definimos en el listado 5.2, la funcion sis net que realizara el contagio SISpropuesto sobre la red aleatoria, con una evolucion temporal asincronica: en cada paso detiempo se elige un nodo al azar, realiza los contagios pertinentes y actualiza su estado.

Listado 5.2: Evolucion de infeccion tipo SIS sobre red aleatoria

function [U, t s e r i e s , adj ] = s i s n e t (N, z , nsteps , p , r )

global adj

adj = adj rand (N, z ) ;

U = zeros (1 ,N) ;f l i p = randint ( 1 , 1 , [ 1 N ] ) ;U( f l i p ) = 1 ; % s e l e c t random i n i t i a l node

t s e r i e s = [ ] ;s t ep = 0 ;while s tep < nsteps ,

U = i n f e c t a s y n c (U, p , r ) ;

t s e r i e s = [ t s e r i e s ; s t ep mean(U) ] ;

s tep = step +1;end

end

function U = i n f e c t a s y n c (U, p , r )

global adjN = length (U) ;

s e l = rand int (1 ,N, [ 1 N ] ) ;

for i = 1 : length ( s e l ) ,x = s e l ( i ) ;

i f U( x ) == 0 ,ne i = find ( adj (x , : )==1) ; % f i n d n e i g h b o r si n f = find (U( ne i ) == 1 ) ; % f i n d i n f e c t e d n e i g h b o r spp = rand (1 , length ( i n f ) ) < p ;i f sum(pp) > 0 ,

U( x ) = 1 ;end

elsei f rand ( 1 , 1 ) < r , % i f i n f e c t e d , i s recovered ?

U( x ) = 0 ;end

end

endend

Modelos economicos de multiples agentes 23-06-2011

122 5. Redes complejas, modas y cacerolazos

La matriz adj de 0, 1 corresponde a la matriz de adjacencia de la red, mientras queel vector U representa el estado infectado (1) o no infectado (0) de cada nodo. Si el nodo noesta infectado, busca los vecinos infectados, y prueba con cada uno de ellos si se propaga elcontagio con probabilidad p. En cambio, si el nodo estaba infectado, con probabilidad r elmodelo admite una recuperacion.

A

B

pc

0

0.2

0.4

0.6

0.8

0 70 140 210 280 350

t

inf teo

0

0.25

0.50

0.75

1.00

0 0.25 0.50 0.75 1.00

p

mean max teo

Figura 5.3: (A) Serie temporal de proporcion de nodos infectados i(t)en el modelo SIS converge a un valor estacionario correspondiente auna endemia. El resultado de campo medio (5.16) indica un valor pro-porcion promedio de i∗B = 0.75 (linea verde) infectados. ParametrosN = 100, k = 16, p = 0.1, r = 0.4. (B) Valor medio (cruces) y maximo(cırculos) de i∗B promediado en 50 realizaciones, comparando con el valorteorico (5.16) de i∗B(p) (linea). En funcion de p, su valor crıtico espc = r/k = 0.09. Parametros N = 100, k = 10, r = 0.9.

Un ejemplo de la variacion de i(t) a lo largo del tiempo puede verse en fig. 5.3, dondeal cabo de unos pasos de tiempo, el sistema llega a un estado estacionario, cercano alteorico de i∗B = 0.75 de (5.16). Notese que para λ cercanos a 1, muchas corridas lleganal estado estacionario, ya que la recuperacion vence a la infeccion, por lo que solo quedansuceptibles. Por eso es interesante ver como se compara el valor teorico de i∗B en (5.16) conlas simulaciones numericas. Partiendo de distintas condiciones iniciales (se elige una red alazar, y donde se infecta solo un nodo), se mide el valor estacionario de i∗B, incluyendo las

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 123

veces que no arranco la infeccion (corresponde a la curva mean), y solo mirando el valormaximo infectado (corresponde a la curva max).Asi mismo, comparamos con el valor teoricodel promedio de infectados de fig. 5.3; corresponde muy de cerca para los valores maximosde infectados en cada corrida.

5.4.4 SIS con rewiring: redes adaptativas

Una variante reciente propuesta por Gross et al (T. Gross and Blasius, 2006), es un proponerque la red se adapta dado los nodos infectados, de modo de evitar la infeccion. Proponenque los nodos suceptibles, con probabilidad w hagan una reconnexion de sus contactosinfectados, elegiendo a otro nodo al azar. Esta modificacion permite a los suceptibles, ’irescapando’ de los infectados, aunque si bien la conectividad promedio con los infectadosdisminuye, aumenta la de suceptibles con suceptibles. Esto ultimo, favorece en ultimainstancia una infeccion si ese cluster recibe una infeccion, pues el contagio es mas rapidodebido a una conectividad efectiva alta.

La modificacion al contagio esta en la funcion:

Listado 5.3: Modelo SIS con rewiring

function [U] = i n f e c t r e w i r e a s y n c (U, p , r , w)

global adj

N = length (U) ;

s e l = rand int (1 ,N, [ 1 N ] ) ;

for i = 1 : length ( s e l ) ,x = s e l ( i ) ;

i f U( x ) == 0 ,ne i = find ( adj (x , : )==1) ; % f i n d n e i g h b o r si n f = find (U( ne i ) == 1 ) ; % f i n d i n f e c t e d n e i g h b o r spp = rand (1 , length ( i n f ) ) < p ;i f sum(pp) > 0 ,

U( x ) = 1 ;else

% rewire s t o c h a t i s c a l l y each i n f e c t e d l i n k i f not i n f e c t e dpp = find (rand (1 , length ( ne i ) ) < w) ;nn out = ne i (pp ) ;nn new = randint (1 , length (pp ) , [ 1 N ] ) ; % new n e i g h b o r sfor kk = 1 : length (pp ) ,

adj (x , nn out ( kk ) ) = 0 ;adj ( nn out ( kk ) , x ) = 0 ;adj (x , nn new ( kk ) ) = 1 ;adj ( nn new ( kk ) , x ) = 1 ;

end

end

else

i f rand ( 1 , 1 ) < r , % i f i n f e c t e d , i s recovered ?U( x ) = 0 ;

end

end

Modelos economicos de multiples agentes 23-06-2011

124 5. Redes complejas, modas y cacerolazos

endend

En la fig. 5.4 se muestra una simulacion numerica donde la tasa de reconexion esalta. Se ve que inicialmente el sistema intenta ir al estado endemico, pero esto no es posibledebido a la reconfiguracion de la red. Hace falta una tasa de infeccion mas alta para hacerefectiva la infeccion endemica.

0

0.25

0.50

0.75

1.00

0 250 500 750 1000

t

inf

Figura 5.4: Proporcion de nodos infectados en el modelo SIS con re-conexion a lo largo del tiempo para una realizacion. El resultado de campomedio da que la poblacion endemica deberıa ser i∗B = 0.75. ParametrosN = 100, k = 10, p = 0.05, r = 0.03, w = 0.7.

5.4.5 SIS en redes libres de escala: Viruses informaticos

A la luz que las red Internet es libre de escala P (k) ' k−γ , con γ entre 2 y 3, Pastor-Satorrasy Vespignani (Pastor-Satorras and Vespignani, 2001) analizaron los virus informaticos. Ob-servaron una incongruencia entre el resultado teorico (5.17) y los datos experimentales. Sibien para una tasa de recuperacion r dada, la teor’ıa indica que hay un λc ≡ p〈k〉/r = 1crıtico a partir del cual la red permite la propagacion del virus a una proporcion importantede la red (i∗B > 0), para el caso de virus informatico no se observa una poblacion importantede computadoras infectadas. Analizando base de datos de viruses, tambien observaron quela tasa media de decaimiento de los archivos infectados es del orden de 6-9 meses12, untiempo suficientemente largo como para indicar que la tasa de infeccion es mayor a la recu-peracion, por lo que la cantidad de infectados deberıa ser importante. Esta incongruenciaentre los datos y la realidad deberıa tener una explicacion. Analizaron la validez de laaproximacion ’campo medio’ utilizada para estimar el umbral crıtico (5.17) para una redlibre de escala donde es probabilisticamente significativo obtener nodos en la red con unnumero de vecinos mucho mas grande que 〈k〉.

Su resultados analıticos predicen que la cantidad media de infectados es proporcional

12La cantidad de archivos infectados decae con una ley exponencial exp(t/τ) con τ = 6− 9 meses.

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 125

a i∗B ≈ exp(−1/p), y

λc = r〈k〉〈k2〉

(5.18)

Para las redes aleatorias que vimos anteriormente, como la distribucion de grado es unadistribucion de Poisson, 〈k〉 = 〈k2〉, con los que λc = r. Ahora para redes con leyes depotencia 2 ≤ γ ≤ 3, 〈k2〉 diverge por lo que λc tiende a cero13. Este resultado indica quelo que se observa en Internet es un umbral infinitesimal, pero con una prevalencia de laendemia chica, porque exp(−1/p) es chico para un contagio p muy grande.

5.4.6 Modelos de umbrales locales: modas y revoluciones

En los modelos epidemiologicos, el contagio se debe a un proceso ’probabilıstico’ donde unnodo suceptible se puede infectar debido a cada uno de sus vecinos infectados. En modelosde modas y revoluciones, parece sensato suponer que la adopcion de la misma dependa delnumero de individuos que ya adopto. Es decir, el contagio no se debe a cada uno de los queadopto, sino a la cantidad total que haya adoptado. Por ejemplo en una decision de ir o noa una huelga, puede ser importante la cantidad de agentes que previamente adoptaron ira la huelga. En particular, si suponemos que el agente solo mira a sus vecinos para tomarsu decision, la regla es adoptar la moda si el numero de vecinos que adopto es mayor a unumbral φ ∈ [0, 1] (que para simplificar, es el mismo para todos los agentes).

Watts (Watts, 2002) analiza ese mecanismo de propagacion de modas en una redesaleatorias de N nodos, y grado promedio k. El aspecto interesante de este modelo es que laadopcion de una moda depende de la topologıa de la red y del estado de cada agente. Estoabre la posibilidad que solamente aquellos agentes de umbral particularmente bajo sean losque inicien la moda mientras que aquellos reticentes con umbral elevando la adopten mastarde, una vez que muchos de sus vecinos la hayan adoptado.

En el listado 5.4 se implementa este modelo. Se supone que todos los agentes tienenel mismo umbral phi0:

Listado 5.4: Modelo de Watts de modas

function [U, s tep ] = f a d s n e t (N, z , phi0 )

global A phi ;

phi = ones (1 , N)∗ phi0 ;

adj = adj rand (N, z ) ; % b u i l d random networkA = adj ;

U = zeros (1 , length (A) ) ;f l i p = rand in t ( 1 , 1 , [ 1 N ] ) ;U( f l i p )=1;

f l i p p e d = 1 ;s tep = 0 ;while f l i p p e d > 0

[U, f l i p p e d ] = i n f e c t (U) ;s tep=step +1;

end

end

13Para redes con γ > 4 el umbral λc de las redes aleatorias vuelve aparecer.

Modelos economicos de multiples agentes 23-06-2011

126 5. Redes complejas, modas y cacerolazos

function [ Unew , f l i p p e d ] = i n f e c t (U)global A phi

Unew = U;f l i p p e d = 0 ;no t In f = find (U==0);

for i =1: length ( no t In f ) ,x = not In f ( i ) ;ne i = find (A(x , : )==1) ; % se busca a l o s v e c i n o si f length ( ne i )>0 ,

i n f = mean(U( ne i )==1); % h a l l a l a f r a c c i o n de v e c i n o s c o n v e r t i d o si f i n f > phi ( i ) ,

Unew( x ) = 1 ;f l i p p e d = 1 ;

endend

end

La funcion principal es infect(U) donde U es el estado de cada agente: 0 si no adopto,1 si adopto. El modelo comienza construyendo una matriz aleatoria, y luego definiendo elvector U con el estado de cada agente: 0 si no adopto, 1 si adopto. Inicialmente se elige unsitio al azar y se lo infecta. A partir de ahi se itera sobre la funcion infect(U), que infectahasta tanto no se realizen nuevas infecciones (flipped = 0). Esta funcion, el algoritmolocaliza todos los agentes que hasta ese momento no han adoptado la moda (agentes de tipo0). Para cada uno verifica la proporcion de vecinos que la han adoptado (agentes de tipo1) y verifica la condicion de umbral. Si la misma se ve satisfecha, el agente se transforma atipo 1 colocando un 1 en su lugar en el vector U. Una vez que todos los agentes de tipo 0han sido verificados la funcion devuelve el nuevo valor de U. El calculo mencionado arriba serepite hasta que ningun agente de tipo 0 desea adoptar la moda, en cuyo caso el algoritmoregistra el tamano de grupo de agentes de tipo 1 y el numero de iteraciones que se requiriopara que la moda se propague hasta reclutar a ese grupo.

Para lograr una intuicion de lo que va sucediendo, comencemos con N = 500, φ = 0.1y k = 10.Se observa que hay una gran probabilidad que todos los nodos terminen infectados.A medida que disminuye k, se ve que no todos los nodos se contagian, aunque sean unospocos. Una transicion abrupta ocurre cuando k ' 1, donde ningun nodo se contagia. Porel otro extremo, si aumentamos k, vemos que a veces se contagian todos, y otras ninguno:es todo o nada. Hasta un maximo de k = 16 donde es muy improbable que se contagientodos.

Un estudio mas detallado, nos lleva a realizar un promedio de varias simulacionesnumericas, o realizaciones. Para esto vamos a estudiar las siguientes cantidades de interes:

• el valor medio del tamano del grupo contaminado por la moda

• el valor medio del numero de pasos

• el numero maximo de pasos

• el tamano maximo del grupo contaminado

• la frecuencia (probabilidad) con la que dicho tamano maximo es alcanzado dentro detodas las repeticiones. Esta ultima cantidad es de interes para medir cuan probablees la ocurrencia de una evento de gran tamano dependiendo de la topologıa del grafo.

Modelos economicos de multiples agentes 23-06-2011

5.4 Modelos de contagio en ciencias sociales 127

0

7

14

21

28

0 7.5 15.0 22.5 30.0

t t_max

0

0.25

0.50

0.75

1.00

0 7.5 15.0 22.5 30.0

k

s max pm

A

B

Figura 5.5: Modelo de modas. (A) Numero promedio (t) y numeromaximo (t max) de pasos de iteracion requeridos como funcion del gradok. (B) Tamano medio (s) y maximo del grupo (max), probabilidad deocurrencia del grupo de tamano maximo (pm), como funcion del gradok. Parametros N = 500, φ = 0.10. Numero de realizaciones 50.

Modelos economicos de multiples agentes 23-06-2011

128 NOTAS

En la fig. 5.5 se muestran los resultados de promediar 50 simulaciones numericas porcada valor de k elegido. Se observa que hay un rango de k donde la moda es adoptada demodo generalizada. Pero para k chicos y grandes hay una transicion abrupta que tienennaturaleza diferente:

• para bajos valores del grado se presenta un incremento similar y abrupto en el valormedio y maximo del numero de agentes que adoptaron la moda,

• para grandes valores de k el tamano maximo permanece constante mientras que elvalor medio decrece monotonamente. Esto se compensa por una probabilidad deocurrencia de grupos de gran tamano que tambien decrece de manera monotona yproporcional al tamano de grupo promedio. Para valores suficientemente grandes delgrado la probabilidad de ocurrencia de grupos gigantes tiende a cero, como asi tambienel tamano del grupo mas grande tambien cae a 0, significando con esto que el conjuntode agentes no adopta la moda en absoluto.

La primera de las transiciones se conoce en fısica como umbral de percolacion y lahemos analizado para redes aleatorias (ver 5.3.1). Se trata de una transicion que indicaque la red subyacente de agentes contaminados no presenta fragmentos disconexos entre si.Para valores extremadamente bajos del grado medio la probabilidad que se pueda navegara traves de toda la red a lo largo de sus vınculos es cero porque no hay suficientes vınculosdisponibles en el grafo. Precisamente esta transicion tiene lugar (con una probabilidadque se aproxima a la unidad) para un grafo infinito cuando se impone la condicion de unvınculo por nodo. En estas condiciones todos los agentes adoptan la moda y conforman unacomponente o grupo gigante. Noten tambien que debido al tipo de contagio, esta transicionno depende del umbral de contagio, es decir es totalmente topologica.

La segunda transicion es sumamente interesante porque ocurre para altos valores delgrado medio o sea en el lımite de grafos de gran conectividad. En este caso, cuando el gradopromedio de los nodos es suficientemente grande, resulta crecientemente difıcil diseminarla moda; sin embargo, cuando ocurre, la misma es con probabilidad casi uno, gigante.Este lımite es justamente el de interes para aplicaciones sociales. Notese la diferencia enel numero medio y maximo de pasos de iteracion que toma alcanzar el estado estacionarioen ambos lımites. Este numero maximo parece hacerse aun mayor en el momento de latransicion. Esta aparente “divergencia” en las escalas de tiempo, es tambien indicativo dela ocurrencia de una transicion de fase.

Por ultimo, haciendo simulaciones con distintos valores de φ, se observa que el rangode adopcion de modas parece disminuir para mayores valores de φ y parece desaparecer paraφ ' 0.25 aproximadamente. Surge pues que agentes con valores altos del umbral inhibennaturalmente la adopcion de la moda y esto parece ser el caso de para la mayorıa de lasmodas sin importar para esto la topologıa del grafo.

Notas

‡1El exito del abordaje se debio en gran parte al hecho que cualquier muestra de laboratorio esta compuestapor una enorme cantidad de partıculas. Esto robustece la idea de trabajar con promedios y despreciarfluctuaciones. Dentro de un globo lleno de helio a temperatura ambiente, hay del orden de 1023 atomos, cadapartıcula individual viaja a 500 metros por segundo, y colisiona 1 vez cada 600 picosegundos, o 1666 millonesde veces por segundo. Para una interesante simulacion numerica de dos gases en un contenedor, y como essu distribucion de velocidades, visitar http://intro.chem.okstate.edu/1314F00/Laboratory/GLP.htm

Modelos economicos de multiples agentes 23-06-2011

5.4 Bibliografıa 129

‡2El ejemplo clasico de difusion corresponde al calor: ∂tu(x, t) = ∂xxu(x, t), describe como se difundela temperatura u(x, t) en la posicion x y a tiempo t. Discretizando la coordenada espacial x en puntosxii=1,..,N aislados separados por δx, el calor u(x, t) pasa a estar dado en posiciones discretas . . . , u(xi−1), u(xi), u(xi+1), . . . ,y podemos aproximar las primeras derivadas por sus diferencias finitas. La ecuacion diferencial se puedeentonces aproximar en diferencias finitas como ∂2

xxu(x, t) ≈ (u(xi+1) +u(xi−1)− 2u(xi))/(2δx2). Por lo que

podemos decir que los primeros 3 terminos de la ecuacion maestra (3.18) corresponden a la “difusion detenencias monetarias” m. Asi mismo, si a la ecuacion de calor se le agrega un termino gradiente c ∂ux(x, t),este corresponde al transporte del calor en la direccion x a una velocidad c. La discretizacion del gradienteresulta ∂xu ≈ (u(xi+1)− u(xi))/δx, que corresponde al ultimo termino de (3.18).

‡3 La funcion costo del problema del viajante es aditiva ya que el costo total para un dado itinerarioes la suma de las distancias entre las ciudades en un dado orden. Una alteracion individual consiste enuna permutacion de dos ciudades que solo implica corregir una parte muy limitada del recorrido dejandoinalterado todo el resto, haciendo que se computo sea ’barato’.

Bibliografıa

Adamic, L. A., Lukose, R. M., Puniyani, A. R. and Huberman, B. A.: 2001, Search inpower-law networks, Physica Review E 64, 046135.

Albert, R. and Barabasi, A.-L.: 2002, Statistical mechanics of complex networks, Rev.Modern Physics 4, 47–97.

Barabasi, A.-L.: 2003, Linked: How Everything Is Connected to Everything Else and WhatIt Means, Plume.

Barabasi, A.-L. and Albert, R.: 1999, Emergence of scaling in random networks, Science286, 509–512.

Bikhchandani, S., Hirshleifer, D. and Welch, I.: 1992, A theory of fads, fashion, custom andcultural change as information cascade, Journal of Political Economy 100, 992–1026.

Bikhchandani, S., Hirshleifer, D. and Welch, I.: 1998, Learning from the behavior of others:conformity, fads and informational cascades, The Journal of Economic Perspective12, 151–179.

Dodds, P. S., Muhamad, R. and Watts, D. J.: 2003, An experimental study of search inglobal social networks, Science 301, 827–829.

Granovetter, M.: 1975a, The strength of weak ties, Americal Journal of Sociology78(6), 1360–1380.

Granovetter, M.: 1975b, Threshold models of collective behavior, Americal Journal of So-ciology 83(6), 1420–1443.

Kleinberg, J.: 2000, Navigation in small world, Nature 406, 845.

Newman, M. E. J.: 2005, Power laws, pareto distributions and zipf’s law, ContemporaryPhysics 46, 323–351. condmat/0412004v3.

Pastor-Satorras, R. and Vespignani, A.: 2001, Epidemic spreading in scale-free networks,Phys. Rev. Lett. 86(14), 3200–3203.

Schelling, T.: 1971, Dynamic models of segregation, Journal of Mathematical Sociology1, 143–186.

Modelos economicos de multiples agentes 23-06-2011

130 NOTAS

T. Gross, C. J. Dommar, D. L. and Blasius, B.: 2006, Epidemic dynamics on an adaptivenetwork, Physical Review Letters 96, 208271.

Watts, D. J.: 2002, A simple model of global cascades on random networks, Proc. NationalAcademy of Science 99(9), 5766–5771.

Watts, D. J. and Strogatz, S. H.: 1998, Collective dynamics of small-world networks, Nature393, 440–442.

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 6

Aprendizaje

En este capıtulo y el siguiente se presentaran diversos modelos para dotar a los agentesde alguna capacidad de adaptacion y aprendizaje. En todo lo visto hasta el momento losagentes han sido representados mediante algoritmos que pretenden codificar sus respuestasa estımulos del medio. Si bien dichos algoritmos procuran representar alguna heurıstica o elestereotipo de alguna conducta, esta implıcito que la misma no cambia como consecuenciade los resultados (utilidad) obtenidos de ponerla en practica.

Hasta el momento los agentes fueron considerados como un sistema que recibe estımulosy produce respuestas. El cambio principal que se introduce a partir de ahora es considerarcambios en el procesamiento que da lugar a esa respuesta. Aprendizaje o adaptacion com-portan entonces una modificacion de esa capacidad y por ende de la estructura misma delagente con el objeto de guardar en memoria resultados tanto beneficiosos como perjudicialespara aprovecharlos en futuras oportunidades.

En estos modelos resulta particularmente evidente que el agente, considerado estecomo un sistema complejo en sı mismo, contiene informacion - determinada por su estructurainterna - y la misma cambia como resultado de su interaccion con el medio. Ası visto, elproceso de aprendizaje es un proceso esencialmente irreversible de cambio estructural decada agente.

Aun cuando en el fondo resulte arbitrario diferenciar el aprendizaje de la adaptacionen este capıtulo forzaremos una diferencia y nos concentraremos en lo primero, entendi-endo que ese proceso se aplica a alguna circunstancia definida y la modficacion que se hagaal procesamiento del agente es para el logro de un objetivo preciso y cuantificable. Nosreservamos en cambio la palabra adaptacion para el siguiente capıtulo y para referirnos aun proceso continuo que tiene el proposito de acomodarse a circunstancias que cambianconstantemente y como resultado de los cambios del propio agente. El caso que particular-mente nos interesara sera el de las acciones que deben realizarse para hacer frente a cambiosocasionados por otros agentes que tambien se estan adaptando.

En ambos capıtulos abordarmeos estos modelos fuertemente inspirados en las posibil-idades de cambio que poseen los seres vivos que en todos los casos formalizaremos medianteprocedimientos computacionales.

6.1 Aprendizaje adaptativo en modelos economicos

En el analisis de situaciones economicas donde juega un papel importante la formacion deanticipaciones por parte de los agentes es usual, especialmente en el ambito de la macroe-

131

132 6. Aprendizaje

conomıa, clasificar a los posibles esquemas de determinacion de expectativas dentro de unpequeo conjunto de alternativas. Dentro de este conjunto se suele ubicar a las expectativasextrapolativas, o ”miopes”, las adaptativas, y las ”racionales”. En terminos concretos, esosesquemas estarıan definidos por las expresiones:

• Extrapolativas: xet,t+1 = xt

Es decir: en esta hipotesis, la expectativa que el agente formula en el momento trespecto del valor de la variable x en t + 1 es el valor observado en t: el individuosimplemente genera sus previsiones repitiendo la ultima realizacion de la variable.

• Adaptativas: xet,t+1 = xet−1,t + β(xt − xt− 1, te)

Aquı, la expectativa se forma agregando al valor esperado anterior un numero pro-porcional al error de prevision en el momento t. El coeficiente de proporcionalidad βmide la intensidad de la respuesta de las expectativas a esos errores.

• Racionales: xet,t+1 = Etxt+1

En este esquema, la expectativa serıa la esperanza de la variable, dada la informaciondisponible en t, y calculada segun la distribucion de probabilidades (colapsada a unpunto, si se estuviera en una instancia no estocastica) que efectivamente determinarael valor de xt+1. Esto supone que el agente actua como si comprendiera a su entornohasta el punto en que sus errores de prevision solo pueden deberse a efectos de un”azar irreductible” que actua sobre la variable de inters. Las funcion de los valorespasado que expresarıa a las expectativas racionales depende del proceso que gobiernaa la variable, y en algunos casos particulares puede coincidir con aquella que definea las expectativas extrapolativas (si la variable sigue un paseo al azar) o adaptativas(si x sigue el proceso: xt+1 = xt + εt+1 − (1 − β)εt), si bien la existencia de estasintersecciones no modifica las sustanciales diferencias entre un procedimiento mecanicoy otro que supuestamente incorpora todo el conocimiento que es posible obtener sobreel sistema‡1

Ciertamente, esa taxonomıa esta lejos de agotar los esquemas utilizables en la for-macion de expectativas. Cabe suponer que, en la practica, los criterios y procedimientosempleados tıpicamente por los agentes a los efectos de sus decisiones economicas no se basenni en automatismos rudimentarios (tales como proyectar sistematicamente la continuidad delas condiciones actuales o revisar expectativas como proporcion fija del error de prevision),ni tampoco en la completa correspondencia con las verdaderas leyes de movimiento que pos-tula la hipotesis de expectativas racionales, un termino que en este contexto no significa quelos agentes utilizan si capacidad de razonamiento para construir esquemas provisorios paraentender y anticipar la evolucion de su entorno, sino que han dejado atras (desde siempre)la formulacion de conjeturas, y se manejan con certezas (aunque estas fueran estocasticaspor naturaleza). Interpretada literalmente, por otra parte, la hipotesis de expectativasracionales presenta problemas logicos cuando se la utiliza en experimentos usuales en elanalisis economico, como los ejercicios de evaluacion de arreglos de polıtica alternativos. ‡2

La hipotesis de expectativas racionales describe agentes que conocen al sistema masque el analista. Cualquier estimacion econometrica resultante de un conjunto finito dedatos esta sujeta, al menos, a una incertidumbre muestral sobre el valor de los parametros,y se entiende que esas estimaciones variaran con el arribo de nueva informacion (aunqueel proceso subyacente permanezca inalterado), pero la distribucion de probabilidades deun agente con expectativas racionales esta fija en aquella que, en todo caso, marcarıa ellımite asintotico de una secuencia muy larga de revisiones de parametros. El punto ha sido

Modelos economicos de multiples agentes 23-06-2011

6.1 Aprendizaje adaptativo en modelos economicos 133

enfatizado particularmente por (Sargent, 1993) y (Evans and Honkapohja, 2001) quienessugieren tratar a las expectativas como resultado de un aprendizaje de tipo estadıstico, enque los agentes estiman recursivamente un modelo, tal vez especificado segun una funcioncompatible con una eventual convergencia a expectativas racionales.

Vale notar que esos procedimientos recursivos pertenecen a la familia de esquemasadaptativos, porque los parametros de una regresion se modifican segun los errores delmodelo. Ası, si se estima una ecuacion (donde c

′es un vector de parametros, que puede

incluir una constante, (xi,yi) son los valores de las variables dependiente e independiente enel perıodo i):

yi = c′xi + εi (6.1)

Entonces, los valores de los parametros estimados con los datos en i = 1....t por mınimoscuadrados ordinarios se pueden escribir como ((Evans and Honkapohja, 2001), pag. 33):

ct = ct−1 + t−1R−1t xt(yt − x

c′t−1

t

Rt = Rt−1 + t−1(xtx′t −Rt−1) (6.2)

Es decir: el conjunto de parametros que resultan de una estimacion hecha en el momento tactualiza a los valores estimados en el perıodo anterior en una magnitud que depende delerror de la regresion en t, y se anula si ese error es cero (la ecuacion Rt expresa de manerarecursiva el computo de la matriz de varianza- covarianza). El ajuste adaptativo (apren-dizaje en funcion de los errores) se lleva a cabo entonces en el espacio de los parametros dela ecuacion que presumiblemente genera los movimientos de y, en lugar de hacerlo directa-mente sobre los propios valores de la variable de interes, como ocurre con las ”expectativasadaptativas” sencillas.

Una caracterıstica del algoritmo recursivo de cuadrados mınimos es que, por la pres-encia del factor t−1, la magnitud del cambio de parametros ante un dado error va dismin-uyendo con t, el tamao de la muestra de datos. En una terminologıa usada en el campode los metodos de aproximacion estocastica, se trata de un procedimiento de ”gananciadecreciente”. La logica implicita es que, al agregarse mas datos, cada registro adicionaltiene menos contenido informativo: en el lımite de un conjunto infinito de observaciones,el nuevo error de estimacion no contribuirıa al aprendizaje porque, dado el conocimientoacumulado, corresponde interpretarlo como una realizacion puramente aleatoria. El criteriosupone que todas las observaciones tienen igual relevancia para la estimacion, o sea que laestructura del sistema cuyas caracterısticas interesa aprender se mantiene en el tiempo. Ensistemas cuyo comportamiento se modifica (es decir, donde los parametros que determinansu evolucion no son constantes), habrıa una ”obsolescencia” de los datos mas antiguos: porese motivo no serıa apropiado cerrar el aprendizaje tendiendo a anular la respuesta a erroresde estimacion sucesivos‡3. Una manera de mantener prendida la adaptacion a los datos quegenera el entorno (a riesgo de sobre- reaccionar a variaciones estocasticas sin real contenidosistematico) es utilizar procedimientos de ”ganancia constante”, donde se mantiene fija laintensidad de respuesta a los errores, en vez de reducirse segun la funcion t−1.

En todo caso, una diferencia esencial entre el aprendizaje respecto de sistemas natu-rales y el que tiene lugar en contextos sociales es que en estos ultimos existe un efecto deauto- referencia: en la medida en que el procesamiento de la experiencia por parte de losagentes modifica percepciones, expectativas y conductas, tambien cambia los patrones deevolucion del sistema habitado por esos individuos. Esto implica que la ”ley de movimientopercibida” por los agentes influye sobre la ”ley de movimiento realizada” (cf. (Evans andHonkapohja, 2001)). En concreto, sea por ejemplo un sistema cuya evolucion viene deter-minada por el proceso:

Xt = F (Zt−1, Xet−1,t) + εt (6.3)

Modelos economicos de multiples agentes 23-06-2011

134 6. Aprendizaje

Donde Xt es un vector de variables endogenas, Zt−1 es un conjunto de variables explicati-vas observables en t − 1 (y que pueden incluir rezagos de las X), Xe

t−1,t son expectativasformadas en t− 1 respecto del valor de X en t (el argumento no cambiarıa sustancialmentesi esas expectativas se refieren a valores futuros, como por caso Xe

t,t+1)), y εt representaimpulsos aleatorios. La formulacion supone que la estructura subyacente de la economıa,dada por la funcion F, es constante en el tiempo. Sea ahora la ley de movimiento percibidaque los agentes utilizan para formar expectativas (se hace abstraccion aquı de posibles het-erogeneidades de creencias, y de los problemas vinculados con las expectativas de ”ordensuperior a uno” cuando los agentes buscan anticipar las previsiones de los demas, y asdeseguido, al modo del ”concurso de belleza” evocado en el capıtulo 12 de (Keynes, 1936)):

Xet−1,t) = Gt−1(Z ′t−1) (6.4)

De este modo, Gt−1 indica la ley de movimiento percibida (LMP), que los agentes suponenen t − 1 mejor representa la evolucion de X. En principio, la lista de variables Z ′ que losagentes incluyen como relevantes no tiene necesariamente que coincidir con el verdaderoconjunto Z ′, en cuyo caso la LMP estarıa mal especificada.

La ”forma reducida” de la dinamica de X en los hechos queda ahora como:

Xt = HGt−1(Zt−1, Z′t−1) = F (Zt−1, Gt−1(Z ′t−1)) + εt (6.5)

La funcion HGt−1 define la ley de movimiento realizada (LMR) en t−1, cuya forma dependede la regla de formacion de expectativas, como esta indicado en la notacion HG. En otrosterminos, el sistema (va la funcion F ) genera la LMR, que es una transformacon de la LMP.Surge de ahı una proposicion analoga a la de la ”crtica de Lucas” antes mencionada: la LMRvarı’a en principio cada vez que se modifica la LMP pero, aquı, sin presuponer ninguna formani caracterıstica particular del esquema de l formacion de expectativas. Por otro lado, puedeverse que la LMR posiblemente incluye variables ”espurias”, que forman parte de la LMPpero no pertenecen a los determinantes ”fundamentales” (Z) de las variables de interes.

De la ecuacion anterior se desprende naturalmente una formulacion precisa de lahipotesis de expectativas racionales: esta valdrıa cuando los agentes utilizan una LMPG∗(Zt−1) que se ”auto-valida”, en el sentido de inducir una LMR que coincide con ella:

G∗(Zt−1) = F (Zt−1, G∗(Zt−1)) = T ((Zt−1) (6.6)

Es decir que G∗ es un punto fijo de la transformacion que lleva de la LMP a la LMR (enprincipio, para un dado sistema caracterizado por F , podrıan existir multiples puntos fijosde esa clase: habrıa una variedad de posibles ”trayectorias de expectativas racionales”).Pero, a menos de imponer como condicion a priori que las economıas realizan de maneraautomatica ese punto fijo (en forma analoga a la hipotesis de que los precios de mercadose ubican en todo momento en el valor de equilibrio que representa el punto de reposo del”tanteo” de un subastador walrasiano) se abren las preguntas acerca de como se realizael aprendizaje fuera del equilibrio de expectativas racionales (EER), como se comporta elsistema en esas condiciones, y si el EER es alcanzable como lımite de una convergencia dela dinamica de revisiones de las LMP por parte de los agentes.

Esa ultima pregunta ha sido tratada particularmente por (Evans and Honkapohja,2001), quienes formularon criterios de ”E- estabilidad” sobre la convergencia de las LMPa la LMR cuando el aprendizaje sigue esquemas de tipo estadıstico (como la estimacionde parametros por mınimos cuadrados). Para considerar un caso especıfico, sea un modelodefinido estructuralmente por:

xt = γ + αzt−1 + βxet−1,t + µt (6.7)

Modelos economicos de multiples agentes 23-06-2011

6.2 Redes neuronales amorfas: Modelo de Hopfield 135

donde z denota un impulso exogeno que actua sobre la variable x. El EER se expresasimplemente aquı como:

xt = γ(1− β)−1 + α(1− β)−1zt−1 + µt (6.8)

Supongase ahora que los agentes definen su LMP a traves de un modelo especificado deacuerdo a la LMR que corresponde al EER, es decir como funcion de una constante y de z(o sea que los agentes reconocen a la variable que efectivamente influye sobre x‡4.

xet−1,t = ct−1 + at−1zt−1 (6.9)

Aquı, ct−1yat−1 denotan los valores de los parametros empleados por los individuos en t−1a efectos de la formacion de expectativas en t, y que se actualizan de acuerdo con algunprocedimiento estadıstico recursivo. A esa LMP le corresponde una LMR:

xt = (γ + βct−1) + (α+ βat−1)zt−1) + µt (6.10)

Es decir que el sistema hace una transformacion de los parametros de la LMP a aquellos dela LMR:

T (ct−1, at−1) = (γ + βct−1), (α+ βat−1)) (6.11)

La proposicion de E-equivalencia afirma que las condiciones de convergencia de la dinamicade ajuste de parametros mediante procedimientos como los cuadrados mınimos son las dela ecuacion diferencial ”virtual”:

d(c, a)−

τ = T (c, a)− (c, a) = (γ + (β − 1)c, α+ (β − 1)a (6.12)

En este caso, la estabilidad asintotica del EER se cumplira si β − 1. Puede notarse que elargumento supone que los agentes estiman los parametros como si fueran constantes, cuandoel propio aprendizaje implica que los parametros de la LMP varıen con el tiempo. Es decirque, al estimar una ecuacion que tiene la forma del EER, los agentes estarıan utilizando unmodelo que esta mal especificado en la transicion (si bien (?) han sugerido que el error deespecificacion puede no ser detectable facilmente en la practica). En todo caso, la maneraen que los individuos identificarıan sus modelos de proyeccion es una cuestion abierta,y no trivial. Por otro lado se ve que, de por sı, la misma dinamica de aprendizaje inducecambios en los patrones de comportamiento de un sistema influido por previsiones de agentesque procesan activamente informacion, aun en el caso en que la estructura subyacente seainvariable: la evolucion de las experiencias individuales y su repercusion sobre las conductasle imprime un caracter de irreversibilidad historica a la dinamicas resultantes.

6.2 Redes neuronales amorfas: Modelo de Hopfield

En esta seccion expondremos un modelo de aprendizaje basado en una descripcion suma-mente esquematica e idealizada de ese proceso tal como tiene realmente lugar en el sistemanervioso central de organismo superiores. Tal como anticipamos supondremos que el mecan-ismo de procesamiento de los agentes posee un cierto grado de plasticidad que les permitecambiar su estructura interna para incorporar nueva informacion del medio.

La capacidad de aprendizaje y de deteccion de senales del medio que posee tanto elhombre como otros vertebrados superiores es debida a su sistema nervioso central (SN). Elmismo esta compuesto por un gran numero de celulas denominadas neuronas1, que tienen

1Existen ademas otras celula denominadas gliales que no poseen funciones sensoras o de control motrizy no son de interes en esta discusion.

Modelos economicos de multiples agentes 23-06-2011

136 6. Aprendizaje

la responsabilidad de recibir, procesar y transmitir pulsos de informacion. Poseen un cuerpo(soma) y una membrana que se prolonga en un largo filamento (axon). Si bien las neuronasposeen dimensiones del orden de los micrones, los axones pueden ser muy largos ya quedeben alcanzar todos las extremidades motrices y sensoras del cuerpo.

Las celulas nerviosas tiene la capacidad de polarizar electricamente su membrana porintercambio de iones entre el interior de la celula y su exterior. Dicha polarizacion puedealcanzar a la membrana que rodea el soma pero puede ademas producir pulsos de tensionelectrica que viajan por el axon a lo largo de grandes distancias sin distorsion significativa.

Tanto los extremos del axon como el resto de la membrana celular poseen una grancantidad de ramificaciones (dendritas) en la forma de una cabellera. La comunicacionentre neuronas o entre una neurona y un tejido muscular se produce por el contacto de lasdendritas de la celula excitatoria con la membrana de la siguiente celula. Dicho contacto sedenomina sinapsis y tiene lugar mediante los “botones sinapticos” que se encuentran en losextremos de las dendritas de la celula excitatoria. Dicho boton alberga diminutas vesıculasque contienen una sustancia neurotransmisora.

Cuando la membrana de una neurona esta polarizada, las vesıculas sinapticas derra-man su contenido en el hendidura sinaptica. Las moleculas neurotransmisoras viajan en eseespacio e ingresa en la celula vecina a traves de receptores especializados en su membrana:el paso de los neurotransmisores esta condicionado por los receptores, de la misma maneraque una llave abre una cerradura. El ingreso de los neurotransmisores polarizan la meme-brana de la siguiente neurona dando lugar a un pulso de polarizacion que puede a su veztransmitirse a otras celulas, produciendo de este modo la transmision nerviosa.

Los primeros modelos computacionales de las neuronas fueron realizados por McCul-loch y Pitts en 1943 (McCulloch and Pitts, 1943) y representan su funcionamiento medianteel esquema indicado en la figura 6.1 que comprende dos operaciones‡5. La primera de e-

Figura 6.1: Neurona de Mc Culloch y Pitts.

llas consiste en sumar las senales de ingreso a la celula. Cada una esta afectada por unaconstante Wi que representa la eficacia de la conexion sinaptica. La siguiente operacion con-siste en filtrar el resultado de la suma por una funcion de transferencia que es una funcionescalon, signo o sigmoide:

Si = g

∑j

Wi,jSj − θi

; g(.) = tanh(.), sign(.); etc. (6.13)

En 6.13 Si con Si ∈ −1, 1 o Si ∈ 0, 1 representa el estado de la i−esima neurona. Lasenal de salida de la i−esima neurona es positiva si la suma supera un umbral θi. Laseficacias sinapticas Wi,j pueden ser positivas (sinapsis excitatorias) o negativas (sinapsis

Modelos economicos de multiples agentes 23-06-2011

6.2 Redes neuronales amorfas: Modelo de Hopfield 137

inhibitorias)2. McCulloch y Pitts demostraron que con un conjunto de neuronas simbolicasde este tipo es posible ensamblar una MTU.

En la representacion de McCulloch y Pitts, las neuronas pueden estar en uno dedos posibles estados “activa” o “en reposo”. Hopfield (Hopfield, 1982) propone una repre-sentacion esquematica del funcionamiento de una memoria asociativa utilizando neuronascomo la de McCulloch y Pitts. Una memoria asociativa posee una cierta capacidad de proce-samiento de informacion ya que es capaz de direccionar la informacion por su contenido yno por su ubicacion en un archivo.

Un ejemplo de memoria asociativa es la capacidad que poseemos de evocar a unapersona contemplando una imagen suya parcialmente deteriorada. Esta no es igual a lamanera usual con la que se ordena una biblioteca o trabaja una computadora. En estoscasos se recupera el contenido de una porcion de la memoria conociendo su ubicacion.Es posible recuperar la informacion contenida en un libro conociendo su ubicacion en unanaquel de la bilbioteca. Observese que para la operacion de una memoria asociativa esnecesaria una cierta capacidad de procesamiento, ya que se debe inferir el todo partiendode tan solo una parte de toda la informacion buscada.

Para construir una memoria asociativa se representa a una red de neuronas medianteun AC y se construye un modelo del procesamiento de la informacion utilizando para ellola propia evolucion del AC. Se efectuan las siguientes suposiciones:

• Una neurona (una celula del AC) se comunica con muchas otras que se encuentran endistintos lugares del sistema nervioso (SN)(no se supone un ordenamiento espacial)

• Una neurona puede pasar de activa a inactiva o viceversa dependiendo de las senalesque le transmiten las otras neuronas con las que esta conectada (cada neurona es comolas que propusieron McCulloch y Pitts)

• Los estados de la red quedan especificados por una palabra de N bits y estos codificanla informacion almacenada en la red. (Se utiliza la convencion que un 1 indica queesa neurona esta activa y un -1, que esta inactiva.)

Representar la elaboracion de informacion con mediante un AC con estas carac-terısticas suele recibir el nombre de enfoque conexionista del procesamiento. En su formamas elemental, la red de Hopfield considera que todas las N neuronas del AC estan in-terconectadas entre si. Esta idea no es una abstraccion demasiado distante de la realidadya que, al menos en el ser humano el SN cuenta con unas 1011 neuronas cada una de lascuales posee unas 104 terminales sinapticas con lo que en a lo sumo en tres pasos, cualquierneurona se conecta con cualquier otra.

La dinamica del AC de Hopfield con la que se produce el procesamiento de la infor-macion almacenada en la red es la siguiente:

Si(t+ 1) = sign

N∑j=1

Ji,jSj(t)

(6.14)

donde Sj(t) representa el estado de la j−esima neurona en el instante t; Ji,j es la matrizde eficacias sinapticas que son numeros reales independientes del tiempo y las neuronas delAC se actualizan asincronicamente al azar. Se ha supuesto por simplicidad que el umbralde las neuronas es 0.

2Existen neurotransmisores que favorecen la polarizacion de la membrana de la siguiente neurona y otrosque promueven su despolarizacion. Se los llama excitatorios e inhibitorios respectivamente

Modelos economicos de multiples agentes 23-06-2011

138 6. Aprendizaje

Consideremos ahora un conjunto de estados del AC ~ξµ ≡ ξµi con µ = 1, 2 . . . p yi = 1, 2 . . . N que satisfacen la condicion de ser puntos fijos de la dinamica 6.14, o sea:

ξµi (t) = sign

N∑j=1

Ji,jξµj (t)

. (6.15)

Estos estados cumplen un primer requisito para ser considerados recuerdos o memoriasalmacenados en la red ya que su procesamiento no aparta al AC de ese mismo estado. Lasiguiente condicion que deben cumplir para ser considerados legıtimamente como recuerdoses es que sean el resultado de algun proceso de evocacion, o sea que, posicionado el AC enun estado proximo a uno de ellos, la dinamica 6.14 conduza la AC a uno de esos estados.

Es posible construir una situacion como esta en el caso elemental en que los estados~ξµ son no correlacionados, esto es, que surgen de un paseo al azar. En este caso los ~ξµ

resultan cuasi ortogonales, o sea, satisfacen

〈 ~ξµ, ~ξµ′〉 =1N

∑i

ξµi ξµ′

i = δµ,µ′ +O(1/√N). (6.16)

En estas condiciones se puede definir la matriz de eficacias sinapticas Ji,j utilizando lasmemorias ~ξµ mediante

Ji,j =p∑

µ=1

ξµi ξµj . (6.17)

Es inmediato verificar que dadas estas definiciones los estados ξµi son puntos fijos de ladinamica6.14 tal como debe cumplirse y, ademas, cualesquiera sea la configuracion inicial delAC, este evolucionara hasta converger a un punto fijo. Esto puede comprobarse definiendouna funcion (“funcion de Lyapunov”)que se asemeja a una energıa mediante:

H = − 12N

∑i,j

Ji,jSi(t)Sj(t) (6.18)

y comprobando que la dinamica 6.14 es tal que H es monotona decreciente y acotadainferiormente con lo que la evolucion conducira necesariamente al AC a un punto fijo enel cual H no puede disminuir. Observese que no es posible asegurar que el AC convergeranecesariamente a uno de los puntos fijos ~ξµ. Sin embargo esto solo sucede si la cantidad pde memorias no es demasiado grande y las condiciones iniciales son parecidas a uno de losestados ~ξµ.

Es pertinente aclarar algunos conceptos utilizados arriba. Cuando se habla de de“estados parecidos” a otros se sobreentiende una metrica en el espacio de estados del ACque es la que prevalece en teorıa de la informacion. La metrica de uso comun en este casoes la distancia de Hamming :

Distancia de Hamming:

La distancia de Hamming dH(~S, ~S′) entre dos palabras ~S y ~S′ (~S ≡ S1, S2 . . . SN) de Nbits es el numero de bits en que difieren.

Otro punto a aclarar es cuando la cantidad p de memorias almacenadas es grande opequena. El valor de p se estudia en el lımite de N → ∞; en ese caso p resulta excesivosi p ∝ Nk con k > 1. Una cantidad “aceptable” de memorias es p ≤ αN con α < 1 (paraN →∞ resulta α ' .2).

Modelos economicos de multiples agentes 23-06-2011

6.2 Redes neuronales amorfas: Modelo de Hopfield 139

Una propiedad de los AC de Hopfield es que no siempre la evolucion del AC lo conducea uno de los estados ~ξµ. Dicho de otro modo, no todos los puntos fijos del sistema son losestados ~ξµ sino que aparecen otros que son espureos. Estos estados indeseados resultan sercombinaciones de las memorias genuinas ~ξµ y proliferan exponencialmente a media que paumenta. Cuando se supera un valor crıtico de memeorias, el AC de Hpfield es incapazde recuperar ningun recuerdo genuino. Esta transicion es un punto crıtico como el que sedescribio para el modelo de la condensacion y suele llamarse la “catastrofe de confusion”.

Un estado ~So poximo o parecido a uno de los ~ξµ es uno cuya distancia de HammingdH( ~So, ~ξµo) N . Esta dH puede interpretarse como informacion contenida en ~ξµo que estadestruida (cambiada). En este caso, la evolucion del AC que hace que ~So(t =∞) = ~ξµo loque en realidad hace es recuperar esa informacion deteriorada y permite que el AC actuecomo una memoria asociativa.

El proceso de evocacion de una memoria que se produce en el AC de Hopfield se puedevisualizar como una caıda hacia un mınimo local en un “paisaje” de energıa en el espacio delas 2N configuraciones del sistema (ver figura 6.2). Los puntos en el interior del cuadradorepresentan los 2N estados posibles del AC. Se han representado 5 memorias ~ξµ, cada unade las cuales se la puede imaginar en el fondo de un valle que se separa de los vecinos porelevaciones. El proceso de evocacion puede representarse como una “caıda” hacia el fondodel valle a lo largo de la cual H disminuye hasta alcanzar un mınimo. Los estados vecinos acada memoria conforman una “cuenca” de atraccion (una esta sombreada) ya que ubicadoel AC en cualquier punto de una cuenca, la dinamica lo conducira al fondo del valle (lastrayectorias del AC en el espacio de estados se indican con lıneas las trayectorias del AC).

Figura 6.2: Representacion del proceso de evocacion de recuerdos enuna red de Hopfield.

En el contexto de este modelo los recuerdos ~ξµ estan almacenados en la matriz deeficacias sinapticas de de la red. Este almacenamiento no esta localizado en ninguna sinapsisparticular sino que esta embebido en la totalidad de las conexiones. Es posible hacerel experimento de embeber algunos recuerdos y luego “cortar” sinapsis al azar con unaprobabilidad P . Es posible comprobar que P puede ser significativamente distinta de 0 y, contodo, la red mantiene la capacidad de evocar exitosamente los recuerdos embebidos en ella.Esta propiedad suele recibir el nombre de “degradacion gracil”. La red presenta crecientesdificultades para evocar todos los recuerdos o que estos sean puntos fijos. Finalmente cuandoP ' 1 la red colapsa por completo.

Es posible interpretar que un proceso de aprendizaje o de olvido no es mas que unaredefinicion de la matriz sinaptica y es asemejable a una alteracion de la estructura delAC. La ecuacion 6.17 permite asimismo representar un proceso progresivo de aprendizaje.La incorporacion del (m + 1)−esimo recuerdo consiste en cambiar todas las conexiones

Modelos economicos de multiples agentes 23-06-2011

140 6. Aprendizaje

sinapticas segun:Jm+1i,j = Jmi,j + ξm+1

i ξm+1j (6.19)

La idea que los recuerdos esten embebidos en la matriz sinaptica no se aleja de lo queen realidad sucede en el proceso de aprendizaje en animales. La fijacion de recuerdos enlos seres vivos se produce por una alteracion del arbol dendrıtico de ciertas neuronas delsistema nervioso central que en algunos casos es permanente (algunas habilidades motrices,el lenguaje) y en otras temporario (memoria de corta o larga duracion). La hipotesis generaldel aprendizaje se suele resumir en la regla de Hebb:

Definicion 15 Regla de Hebb: Cuando una neurona excita repetidamente a otra, las sinap-sis entre ambas tiende a fortalecerse

Es conveniente destacar un ultimo punto. La capacidad de procesamiento de unared de Hopfield, lo mismo que los recuerdos, no esta localizada en ninguna parte ni ennigun elemento particular de la red sino que es patrimonio del conjunto de neuronas, de susconexiones y de la dinamica propia del AC. Es por consiguiente un ejemplo claro de que “eltodo es mucho mas que las partes” tal como se dijo en el Capıtulo 1. Por esta razones sedice que esta es una propiedad emergente del sistema en este caso, de la red de neuronas.Es de todos los ejemplos vistos hasta ahora el mas claro de este tipo de propiedad.

Resumen de propiedades importantes:

1. El sistema de N neuronas funciona como una memoria direccionable por sus con-tenidos: si se inicializa el sistema en un estado que corresponde a una memoria par-cialmente corrompida, durante su evolucion, el sistema es capaz de restaurar la partefallada.

2. Esa propiedad computacional es una propiedad emergente, en el sentido que a) esinherente al conjunto de las N neuronas b) no es privativo de ninguna de ellas enparticular y c) esa propiedad no es parte constitutiva de la dinamica de cada compo-nente.

3. Existe una regla mediante la cual se puede formalizar un proceso de aprendizaje ode adaptacion mediante el cual el sistema puede ser “entrenado” para que tenga uncomportamiento determinado.

4. El proceso de aprendizaje consiste en la redefinicion de las interacciones entre lasunidades que conforman el sistema. Dar una regla para el aprendizaje es, desde elpunto de vista de los sistemas dinamicos, un problema inverso: partiendo del hechoque el sistema posee una dinamica establecida de evocacion se debe determinar cual esla interaccion (matriz sinaptica) entre su partes constitutivas (neuronas) que conduceal sistema a los estados que se desean.

5. Tanto la dinamica de todo el sistema como cada una de las memorias que almacena noestan localizadas en alguna componente individual o determinada del mismo sino quese encuentran dispersas en toda su matriz sinaptica. Como consecuencia, el sistema estolerante frente a fallas individuales de cada una de sus partes y se degrada gracilmentecuando se producen danos parciales.

Modelos economicos de multiples agentes 23-06-2011

6.2 Redes neuronales amorfas: Modelo de Hopfield 141

6.2.1 Ejemplo: Recuperacion de una imagen

En este ejemplo se muestra la recuperacion de una imagen mediante una red de Hopfield.Las imagenes se suponen almacenadas en una grilla de 15 X 15 pixeles tal como se muestraen la figura 6.3 asociando cada pixel a cada neurona de la red. La idea es que cada una deellas sea una de los recuerdos ~ξµ. En este contexto, una imagen parcialmente deteriorada esuna en la que algunos pixeles estan con sus valores cambiados: 0 esta como un 1 y viceversa.Esta regla permite dar una medida cuantitativa de la corrupcion dando el porcentaje depixeles equivocados, o, equivalentemente, la distancia de Hamming entre la letra correcta yla corrompida.

Figura 6.3: Imagenes de 5 letras representadas en una grilla de 15 X 15celdas (pixeles). Cada celda roja corresponde a un pixel 0 y cada celdanegra corresponde a un pixel 1.

Estas cinco imagenes pueden utilizarse para construir una matrtiz sinaptica de unared de Hopfield usando la convencion que asocie un pixel 0 a una neurona en el estadoSi = −1 y un pixel 1 a una neurona en el estado Si = +1 y numerando los pixeles dela imagen con algun criterio establecido. Con estas convenciones se puede construir unamatriz de 152 X 152 embebiendo de esa manera a las cinco imagenes de la figura 6.3 con laregla dada en la ecuacion 6.17.

Los recuerdos asociados a las letras de la figura 6.3 no cumplen con la propiedad deser cuasi ortogonales. En la tabla adjunta se muestran los productos escalares 〈 ~ξµ, ~ξµ′〉.Como se puede comprobar el par de letras (C,L) tienen por ejemplo una alta correlacionmientras que el par (I,A) son practicamente ortogonales. A pesar de este hecho, un AC deHopfield construido con estos recuerdos puede operar con algun margen satisfactorio.

TABLA DE PRODUCTOS ESCALARES

I L A C OI 1.000 0.280 0.040 0.333 0.209L 0.280 1.000 0.280 0.769 0.307A 0.040 0.280 1.000 0.369 0.493C 0.333 0.769 0.369 1.000 0.413O 0.209 0.307 0.493 0.413 1.000

Modelos economicos de multiples agentes 23-06-2011

142 6. Aprendizaje

En la figura 6.4 se muestra el resultado de un proceso de evocacion asociativa. En lacolumna de la derecha se muestra el estado inicial del AC y en la columna de la izquierdael resultado de la evocacion. En las filas (A) y (B) se han embebido solo tres recuerdos (lasimagenes de la I, la L y la A). En la fila rotulada (A) se muestra el resultado de dar comocondicion inicial la letra L con un 20% de corrupcion y la recuperacion es perfecta. En lala fila (B) se eligio como estado inicial la misma letra L pero con un 60% de corrupcion.Con una corrupcion que supera el 50% las imagenes comienzan a parecerse cada vez masal “negativo” del recuerdo embebido. La evocacion conduce efectivam,ente a una imagenmuy semejante al negativo de la L(en realidad, a una distancia de Hamming igual a 1 deese negativo). Esta es una propiedad general, es facil verificar que si ~ξµ es un recuerdoembebido, tambien esta embebido su negativo: − ~ξµ.

En la fila rotulada con una (C) se muestra el efecto de abarrotar la red de recuerdosembebiendo en ella las 5 imagenes de la figura 6.3. El abuso en el almacenamiento derecuerdos es mas notorio cuando estos no son ortogonales tal como sucede en este ejemplo.En el ejemplo que se muestra se inicializa el AC con la L con un 15 % de corrupcion. Elproceso de evocacion conduce a un estado espureo que es una mezcla de los recuerdos Cy L. Estas dos imagenes pueden confundirse facilmente pues poseen un elevado productoescalar.

Figura 6.4: Tres ejemplos de evocacion de recuerdos con una Red deHopfield.

Modelos economicos de multiples agentes 23-06-2011

6.3 Redes neuronales en capas 143

6.3 Redes neuronales en capas

El modelo de Hopfield puede interpretarse como un conexionado amorfo en el sentido queno presupone ningun orden en el cual las neuronas reciben senales o las transmiten nitampoco existe ninguna direccion privilegiada para el flujo de la informacion. Una estrategiaalternativa que recibio mucha atencion en la literatura es el de modelos de redes neuronalescon una entrada y una salida de informacion.

El primero y mas elemental fue el Perceptron de Rosenblatt directamente inspiradoen la neurona simbolica de McCulloch y Pitts (ver figura 6.1). Dicho sistema recibe lospatrones ~ξµ en sus puertos de entrada. Cada una de las componentes de dichos patrones espesada por las eficacias sinaptica Wj y se las suma. El resultado de esta operacion se filtramediant de una funcion de transferencia g(.). Dicho filtrado no es mas que la comparaciondel resultado de la suma con un umbral. El resultado de esta operacion se entrega en elpuerto de salida. En todo lo que sigue supondremos que la funcion de trasferencia es unasigmoide que satura en ±1 y que es derivable en el origen:

Sµ = g[∑j

Wjξµj − θ] (6.20)

En realidad todo el AC de Hopfield esta construido con dipositivos de este tipo enel que los patrones de entrada son los estados de activacion de las restantes neuronas delautomata. La unica diferencia es que para un Perceptron no es necesario que los patronesde entrada ~ξµ sea vectores de 1’s y -1’s como es el patron de activacion de las neuronas delAC de Hopfield.

En el lenguaje de la teorıa de la informacion un dispositivo que funcione como enla ec. 6.20 se lo denomina “clasificador lineal“. Es un clasificador porque a cada uno delos patrones ~ξµ con µ = 1...p el dispositivo le asigna ya sea S = +1 ya sea S = −1. Esademas lineal porque los ~ξµ que el dispositivo asigna a S = 1 estan separados de los otrospor el hiperplano

∑jWjxj − θ = 0. De esto resulta claro que la clasifiacion que efectua el

perceptron depende de los coeficientes Wj que son los que determinan el plano separadorde las dos categorıas.

Ya hemos visto que, en el contexto del modelo de Hopfield, el aprendizaje se asocia conun cambio en el valor de los vınculos entre las neuronas de la red. Cabe pues preguntarse si esposible construir un perceptron para que a determinadas entradas les correspondan salidaspreestablecidas, esto es, si es posible construir un perceptron que reproduzca una tablaξµ, Sµ determinada. Como logica consecuencia de esta propuesta tambien es necesariosaber cuantos pares ξµ, Sµ con Sµ ∈ 0, 1 pueden “almacenarse” en un perceptron, o, loque es equivalente, cuan larga puede ser la tabla que acabamos de mencionar de asociacionesentre entradas y salidas.

La respuesta a la primera pregunta es afirmativa: es efectivamente posible construirun perceptron que relaciones un conjunto de entradas con una lista preestablecida de sal-idas siempre que, por supuesto, esa lista corresponda a una clasificacion lineal. Existe unalgoritmo permite ir ajustando progresivamente las eficacias sinapticas esto y que convergeen un numero finito de pasos‡6.

La segunda pregunta acerca de cuan extensa puede ser la lista de asociaciones que sele pueden exigir a un perceptron puede en realidad asemejarse una capacidad de memoria.En el lımite en que el numero de entradas tiende a infinito y la funcion de transferencia escontinua, resulta que dicha capacidad es pmax = 2N .

Modelos economicos de multiples agentes 23-06-2011

144 6. Aprendizaje

La limitacion de separabilidad lineal hizo caer en el desinteres a los perceptronesdurante cierto tiempo ya que se observo que funciones muy sencillas no son linealementeserparbles (el ejemplo que siempre se da es la funcion logica de la disyuncion XOR). Elinteres renacio con la propuesta de dotar al perceptron de una capa de neuronas intermediascon lo que el dispositivo de computo pasa a ser un clasificador de grado mayor que 1. Puedetambien actuar como un interpolador de grado elevado entre datos conocidos. En la figura6.5 se muestra la tabla de verdad del XOR (panel A) y su correspondiente repesentacion(panel B) en el que se ve que los pares S = 1 y S = 0 no pueden ser separados porninguna recta en el plano ξ1, ξ2. En el panel C se muestra un perceptron con dos entradas.Sus puertos de entrada se representan por rectangulos. El unico elemento capaz de algunprocesamiento es la neurona que se representa con un cırculo. Este dispositivo no puedereproducir el patron de salidas de la funcion logica del panel, A represntada en el panel B.En el panel D se muestra un perceptron de varias entradas con una capa intermedia y dossalidas. Los puertos de entrada se representan con rectangulos y las neuronas de la capaintermedia se han resaltado con cırculos sombreados.

Figura 6.5: Paneles (A) y (B): tabla de verdad de una funcion logicaque no es linealmente separable y su representacion. Paneles (C) y (D):Perceptron simple y perceptron multicapa.

Los perceptrones multicapa han dado lugar a numerosas aplicaciones, en algunoscampos han demostrado ser dispositivos de calculo muy utiles y en otros no cumplieron esaexpectativa. Igual a lo dicho para un perceptron simple, las redes en capas puede tambienser “entrenadas” para “memorizar” una tabla preestablecida de entradas y salidas. Elproceso de entrenamiento puede plantearse como la solucion de un problema de optimizacionconsistente en buscar el juego de eficacias sinapticas que minimice una funcion costo quemide el apartamiento cuadratico de las salidas efectivamente producidas por la red (Sµj )(j = 1, ...K) y las salidas correctas (σµ). El costo se define como:

Modelos economicos de multiples agentes 23-06-2011

6.3 Redes neuronales en capas 145

C =p∑

µ=1

K∑i=1

[σµi − Sµi ]2 (6.21)

p indica el numero de patrones y K es el numero de puertos de salida de la red. Si seexplicitan las eficacias sinapticas poniendo W (1) y W (2) para las eficacias que conectan losN puertos de entrada con la M neuronas de la capa oculta y las que conectan a estas conlas K neuronas de salida, esta ecuacion queda:

C =p∑

µ=1

K∑i=1

σµi − g M∑j=1

W(2)i,j g[

N∑j=1

W(1)j,k ξ

µk ]

2

(6.22)

Se trata de una funcion altamente no lineal de las eficacias W . El procedimento numerico es,con variantes, el descenso por el gradiente de C, para ello se hace la hipotesis que tanto lasentradas como las salidas son numero reales (por lo general normalizados a algun intervalode referencia como [−1, 1]) y que las funciones de transferencia son continuas.

Si recordamos que frente a un cambio pequeno de los W , se puede escribir:

C( ~W + δ ~W ) = C( ~W ) + δ ~W · ∂C∂ ~W

(6.23)

basta con elegir los cambios

δ ~W = −η ∂C∂ ~W

(6.24)

para asegurarse que ellos redundaran en una disminucion sistematica de C:

C( ~W + δ ~W ) = C( ~W )− η | ∂C∂ ~W

|2 (6.25)

Siendo que la “superficie” C tiene una enorme cantidad de dimensiones un recursode minimizacion como el explicado corre el riesgo cierto de quedarse atrapado en mınimoslocales. Por esta razon los procesos disponibles en diversos paquetes de software comercialrecurren a elementos mas sofisticados que, entre otros elementos, contemplan variacionesaleatorias.

La constante η suele llamarse tasa de aprendizaje como en el caso de los perceptrones.Los gradientes utilizados en las ecuaciones arriba pueden escribirse de modo que las cor-recciones en las W se produzcan iterativamente y primero en la capa de salida, luego estacorreccion se propaga a la capa intermedia para terminar en la de entrada. Por esta razona este algoritmo se lo suele llamar de retropropagacion del gradiente (en ingles gradientbackpropagation).

El desarrollo de una red en un problema independiente del tiempo (o sea uno en que nilas entradas ni las salidas son funciones del tiempo) involucra por lo general cuatro etapasque en la literatura reciben nombres particulares:

1. Entrenamiento: Minimizacion de la funcion costo utilizando un conjunto de pares( ~ξµ, ~σµ) que son conocidos

2. Memorizacion: Comprobacion que la red es capaz de reproducir las salidas correctascuando se presenta cada una de las entradas utilizadas en la etapa de “Entrenamiento”

Modelos economicos de multiples agentes 23-06-2011

146 6. Aprendizaje

3. Validacion: Ensayos de la red con entradas no utilizadas en el entrenamiento perocuyas salidas se conocen

4. Generalizacion: Prueba de la red con entradas no utilizadas en el entrenamientopara producir salidas cuya validez se desconoce

Es posible - y existen diversos metodos para ello - desarrollar redes para un problemadependiente del tiempo, por ejemplo la prediccion de los terminos sucesivos de una serietemporal a medida que se reciben datos de ella o la adaptacion de un sistema de control entiempo real para regular algun proceso fısico.

Al final de este capıtulo damos los pasos esenciales del algoritmo de retropropagaciondel gradiente‡7

Ejemplo: La “telarana”: una red neuronal para tanteo de precios.

En esta seccion daremos ejemplos de utilizacion de una red neuronal en capas para anticiparla evolucion de precios. Cuando se trata de anticipar futuros valores de una serie temporaltal como podrıa ser el caso de la cotizacıon de un activo financiero se puede utilizar una redcuya arquitectura se muestra en la figura 6.6.

Figura 6.6: Prediccion de precios en una serie temporal: una arquitectura posible paraaprendizaje en tiempo real.

Es importante tener en cuenta que desde el momento en que se define la arquitecturade la red se estan haciendo muchas hipotesis. En esta arquitectura se utilizan como datosde entrada los precios registrados en m instantes previos, y con ellos se pretende estimar elprecio en el instante subsiguiente t. Es obvio que si se supone que esta arquitectura tienepoder predictivo tambien se esta suponiendo que existe alguna relacion causal por la quevalores previos de la serie determinan los posteriores. Ademas esta relacion es entre preciospasados y futuros de ese activo particular. Con este modelo no se tienen en cuenta, porejemplo, otros datos globales del mercado o la cotizacion de otros activos relacionados conel que se esta analizando o aun, otros datos macroeconmicos. Una arquitectura como lapresentada en la figura no hace sino una regresion no lineal sobre datos pasados. Un modelomas meticuloso deberıa considerar otra arquitectura que permita incluir mas datos en laentrada.

En lo que sigue discutimos un ejemplo consistente en la anticipacion de los pasosfuturos en un proceso de tanteo para corregir excesos de demanda. Para fijar ideas supong-amos un pescador que sale de campana con su bote en un dıa t, y pesca una cierta cantidadcon la hipotesis de que podra venderla a un precio esperado P esp(t). A su llegada a puerto,toda su pesca es rematada y vendida a un precio P real(t) 6= P esp(t). Este hecho inducira al

Modelos economicos de multiples agentes 23-06-2011

6.3 Redes neuronales en capas 147

pescador a estimar para la siguiente jornada de mercado en el dıa t+ 1 un precio corregidoque llamaremos P esp(t+ 1). Esto esta representado en la figura 6.7. Buscaremos en conse-cuencia una red neuronal que permita determinar P esp(t + 1) conociendo el precio que sehabıa esperado para el dıa t y el que efectivamentese se realizo P real(t) implmentando larelacion:

P esp(t), P real(t) −→ P esp(t+ 1) (6.26)

Para estos fines la red debera tener dos entradas y una unica salida(ver Figura 6.7). Sedebe fijar el numero de neuronas de su capa oculta. No existe una regla universal para estoy por lo general surge de diversas pruebas.

Figura 6.7: Ejemplo de ajuste de exceso de demanda mediante tanteode precios. Arriba: representacion grafica mediante curvas de oferta yde demanda y correspondencia entre precios estimados y realizados enel dıa t y el precio esperado en dıa t + 1. Abajo: arquitectura de la redutilizada para el tanteo y uso iterado de la misma para determinar valoresde equilibrio.

Para determinar las intensidades de las eficacias sinapticas es necesario contar conel registro de otros eventos semejantes en lo que se conoce cual ha sido el valor tantode las entradas como de la salida. En este caso se ha contado con 10 “ejemplos” quecorresponden a otras tantas jornadas de pesca de campanas anteriores. No se supone quelos mismos respondan a una dada secuencia temporal de tanteos ni que esten correlacionadosde ninguna manera particular3. La red solo “conoce” los 10 ejemplos que se enumeran en

3Para elaborar el ejemplo se supusieron conocidas las funciones que dan el precio como funcion de lacantidad tanto para la oferta como para la demanda. Se eligieron al azar diez valores de P esp(t) y sedeterminaron los correspondientes P real(t) y P esp(t + 1) con la ayuda de esas funciones. Debe quedar enclaro que estas no estan en modo alguno incorporadas a la arquitectura de la red.

Modelos economicos de multiples agentes 23-06-2011

148 6. Aprendizaje

la tabla siguiente.

Ejemplos para entrenamiento de la red

Numero de orden P esp(t) P real(t) P esp(t+ 1)1 .6014 .3168 .62122 .5150 .4048 .52283 .3980 .5303 .38894 .2629 .6830 .23795 .7435 .1825 .77736 .5604 .3580 .57477 .5822 .3359 .59958 .5919 .3262 .61059 .5117 .4082 .519110 .7262 .1980 .7589

Cada conjunto de ejemplos puede pues suponerse asociados a campanas de pesca realizadaspara otros mercados o por otros barcos de pesca. Con este conjunto de ejemplos, se entrenouna red en la que se utilizaron cinco neuronas ocultas. En el proceso de aprendizaje seajustan las eficacias seleccionando al azar los ejemplos del conjunto enumerado en la tablaanterior.

Una manera de supervisar la convergencia del proceso es forzando periodicamentea que la red calcule el conjunto de ejemplos y evaluando un error medio cuadratico porejemplo:

E =1Nex

µ=Nex∑µ=1

[Sµ − σµ]2 (6.27)

En la ec.[6.27] hemos puesto Sµ para la salida de la red para la entrada correspondiente alejemplo µ y un dado juego de eficacias sinapticas y σµ la salida correcta que se enumera enla tabla de ejemplos. El error E es entonces funcion del juego de eficacias sinapticas y si elproceso de entrenamiento es exitoso, debe converger a un valor satisfactoriamente pequeno.En la figura 6.8 se muestra el proceso de convergencia para este conjunto de diez ejemplos.

En la jerga propia de las aplicaciones de redes neuronales, una vez completada estaetapa se puede afirmar que la red ha “memorizado” los diez ejemplos de la tabla. Paraverificar que la red es capaz de “generalizar” correctamente se debe disponer de otro conjuntode ejemplos de entradas y salidas, que no hayan sido utilizados en el entrenamiento yverificar que la red es capaz de reproducir las salidas correspondientes. En la figura 6.9 semuestran los valores que provienen de otro conjunto de ejemplos mostrando con diferentessımbolos las salidas de la red y los valores correctos. Se puede comprobar que la red es capazde “generalizar” satisfactoriamente ya que ambos valores son muy proximos entre si. Losdiez ejemplos han sido suficientes para que la red pueda “inferir” una buena aproximacionde las funciones de oferta y demanda.

Una vez entrenada, la red puede ser utilizada para predecir cual debe ser el precio queresultara en una jornada de pesca cualesquiera conociendo los precios estimados y realizadoscorrespondientes. Sin embargo ese no es el uso ms apropiado ya que, los precios corregidosestarın sistematica sobreestimados o subestimados.

Si se tiene en cuenta que se trata de un tanteo que debe converger a un valor deequilibrio, la red puede ser utilizada para investigar si dicho proceso posee un punto fijo.

Modelos economicos de multiples agentes 23-06-2011

6.3 Redes neuronales en capas 149

Figura 6.8: Variacion del error cuadratico medio a lo largo del procesode entrenamiento de una red con una entrada, dos salidas y cinco neu-ronas ocultas utilizando los ejemplos dados en la tabla. Observese queel numero de iteraciones es tan elevado que asegura que cada ejemploparticular es utilizado repetidas veces.

Para ello se debe utilizar reiteradamente la red redefiniendo los sucesivos datos de entradautilizando para ello los datos anteriores y la salida correspondiente. Este proceso se ilustraen la figura ??. Alli se muestra que el resultado del tanteo para el dıa t que dio lugar aP est(t+ 1) permite redefinir las entradas para obtener la estimacion en t+ 2 segun la regla:

P est(t+ 1) ← P real(t)P real(t+ 1) ← P est(t+ 1)

y obtener con esas dos nuevas entradas P est(t+ 2). Esto esta resumido en la parte inferiorde la figura 6.7.

La busqueda del valor de equilibrio se puede hacer tomando como datos iniciales losde cualquier ejemplo. Si la red ha sido correctamente entrenada, la convergencia debe serla misma sin importar las condiciones iniciales. Esto se muestra la figura 6.10 en la que sehan graficado las sucesivas salidas de la red como funcion del numero de veces que se iterosu uso partiendo de dos ejemplos diferentes. Segun se puede observar se llega aun mismopunto fijo sin importar las condiciones iniciales

Modelos economicos de multiples agentes 23-06-2011

150 6. Aprendizaje

Figura 6.9: Prueba de generalizacion de la red neuronal con un conjuntodiferente de 10 ejemplos. Los sımbolos negros son los valores exactos ylos rojos los que provee la red.

Figura 6.10: Se indican dos tanteos sucesivos indicando como se puedenutilizar parte de los datos y la salida correspondientes al tanteo del dıa tpara definir las entradas del dıa t+ 1.

Modelos economicos de multiples agentes 23-06-2011

NOTAS 151

Notas

‡1Una distincion usual es la que diferencia entre ”expectativas que miran hacia atras” (backward-looking) yaquellas orientadas ”hacia adelante” (forward-looking). La terminologıa no es informativa. En los hechos, lasexpectativas no pueden basarse en otra cosa que en la historia pasada, y en la experiencia o el conocimientoque se extrae de ella. Lo que (unicamente) puede estar en cuestion es la sofisticacion del esquema deproyeccion o la efectividad que tenga la funcion de los datos pasados que se utiliza en cuanto a anticipar laevolucion del sistema (cf. (Sargent, 1993)).

‡2Vease por ejemplo (Heymann, 2007). Desde la perspectiva de los agentes del modelo que supuestamenteproyectan el futuro con expectativas racionales, una modificacion de los criterios de polıtica como resultado deun ejercicio analıtico no contemplado (siquiera probabilısticamente) en sus previsiones anteriores constituirıauna perturbacion arbitraria y fuera del campo de las posibilidades antes consideradas respecto de un estadode cosas que los agentes suponıan, confiadamente en su certeza, fijo e inamovible. Por eso, mas que validar (onegar) expectativas racionales, los experimentos de ”cambio de regimen” de los que se derivan proposicionescomo la crıtica de (?) son inconsistentes por principio con la hipotesis. Los problemas de auto- contradiccionno desaparecen si se re- interpreta a la nocion de expectativas racionales, no ya como una identidad precisaentre las reglas de formacion de expectativas y los procesos que gobiernan en los hechos al sistema, sino masbien como la consistencia de las expectativas de los individuos con los senderos que el modelo mismo generasuponiendo que los individuos actuan de esa manera. Aquı, un modelo presuntamente ”novedoso” cuandose lo introduce es validado con datos pasados, por lo cual la modelo-consistencia presume que los agentesvan ”un paso adelante” del analista; al mismo tiempo, ese modelo tiene duracion finita (en algun momento,se sabe, sera re-estimado o re- calibrado o reemplazado por otro de nueva generacion), pero se representa alos agentes decidiendo como si creyeran sin dudar que el modelo seguira proveyendo el criterio de proyeccional infinito.

‡3(?) presenta una muy util discusion del punto en un modelo de aprendizaje en un entorno de parametroscambiantes, y destaca que allı el ”tamao efectivo” de la muestra de datos no va a infinito con el paso deltiempo, y puede aproximarse en ciertos casos por una ventana de observaciones de longitud constante. Comocorolario, seala que la adicion de nuevos datos no llega a generar predicciones que dependan exclusivamentede las realizaciones observadas del sistema, y que por lo tanto la influencia de las creencias a priori nodesaparece asintoticamente. Asimismo, el argumento que las distribuciones de los errores de pronosticopueden tener ”colas anchas” aunque las perturbaciones exogenas se determinen segun una normal

‡4Es claro que, como proposicion general no habrıa convergencia posible al EER si los agentes no incluyendirecta o indirectamente dentro de los condicionantes de sus expectativas a las variables exogenas relevantes;en cambio, el proceso de aprendizaje podrıa llevar (haciendo que los correspondientes parametros vayan acero) que se dejen de lado a variables irrelevantes originalmente contempladas en la especificacion de la LMP

‡5Estos primeros trabajos apuntaron a determinar que podıan computar maquinas de estados finitos. Enparticular, muestran que un predicado logico es siempre representable por medio de una red neuronal sinrecurrencias. Ver http://www.dlsi.ua.es/ mlf/nnafmc/pbook/node10.html

‡6 Algoritmo de aprendizaje del perceptron: Sean ~ξµ las entradas y sean σµ las salidas correctas

Algoritmo: Recorrer la lista de entradas y para cada una de ellas comparar la salida correcta con laque efectivamente produce el perceptron y cambiar las eficacias sinapticas segun la regla siguiente:

Wnuevai = W

viejai + ∆Wi (6.28)

con∆Wi = 0 si Sµ = σµ (6.29)

o sea dejar inalterada la eficacia si la salida es correcta, y

∆Wi = 2ηξµi σµ si Sµ 6= σµ (6.30)

corregirla con el signo apropiado si la salida es incorrecta. En ambas ecuaciones η es un parametro queregula la tasa de convergencia del proceso. Suele llamarselo “tasa de aprendizaje” y es menor que 1.

‡7 Algoritmo de retropropagacion del gradiente

El algoritmo de retropropagacion no es mas que aplicar con alguna sutileza la regla de la cadena enla derivacion de funciones compuestas. Hoy en dıa existen numerosos programas que lo contienen y nohay mayores dificultades en conseguir versiones del mismo listas para su uso. Por razones de completitudexplicaremos el algebra necesaria. Seguiremos de cerca el desarrollo dado en el libro de Hertz, Krogh yPalmer (Hertz, Krogh and Palmer, 1991)

Modelos economicos de multiples agentes 23-06-2011

152 NOTAS

Supondremos que la funcion de transferencia de las neuronas es de la forma

g(h) =1

1 + e−2βh(6.31)

y el parametro β por lo general se lo toma igual a 1 o 1/2. La derivada se puede expresar en terminos dela misma g(h) como g′ = 2βg(1− g). Explicaremos el algoritmo para el caso de una red con un unica capaoculta. En lo que sigue no se explicitan los umbrales que deben intervenir en las funciones de transferencia.Los mismos pueden absorberse suponiendo que las sumas de eficacias sinapticas que definen el campo medioh que afecta a una neurona se extienden desde 0 y agregando formalmente una neurona adicional en lasentradas cuyo valor esta fijo en 1. En lo que sigue rotulamos las neuronas de la capa oculta con el ındice j,con i a las neuronas de salida, con k a las de entrada y con µ a cada ejemplo del conjunto de entrenamiento.

Se busca un mınimo de la funcion costo Cµ, que corresponde solo al unico ejemplo µ del conjuntoseleccionado para el entrenamiento. Se desciende segun su gradiente respecto de las eficacias W (1) y W (2).Se descuenta que cada ejemplo es tratado independientemente con lo que el algoritmo se debe repetirseleccionando en cada oportunidad un ejemplo diferente. Nos limitamos aquı a calcular las correcciones∆W (1) y ∆W (2) para un dado ejemplo de acuerdo con:

∆W(2)i,j = −η ∂Cµ

∂W(2)i,j

(6.32)

∆W(1)j,k = −η ∂Cµ

∂W(1)j,k

(6.33)

Si se calcula primero la correccion para las sinapsis que vinculan la capa oculta con la de salida y luegolas que vinculan la entrada con la capa oculta, las correcciones se pueden poner como

∆W(2)i,j = −ηδµi g(

Xk=0

W(1)j,k ξ

µk ) (6.34)

∆W(1)j,k = −ηδµj ξ

µk (6.35)

donde se utilizo:

δµi = g′(hµi )[σµi − Sµi ] (6.36)

δµj = g′(hµj )Xi=0

W(2)i,j δ

µi (6.37)

Observese que para calcular δµj que corresponde a las neuronas de la capa oculta es necesario disponerde la correccion δµi que corresponde a las neuronas de la entrada con lo que las correcciones se propagandesde la capa de salida hacia la de entrada.

Quedan dados de este modo todos los elementos del algoritmo que puede resumirse en los siguientespasos:

1. inicializar los valores de las eficacias sinaptias a valores pequenos y aleatorios

2. seleccionar un ejemplo al azar

3. propagar la senal de entrada a traves de toda la red

4. calcular las correcciones δ para la capa de salida y para la capa oculta utilizando 6.37

5. utilizar las ecuaciones 6.35 y 6.35 para corregir las eficacias sinapticas

6. volver a repetir toda la secuencia desde el punto 2.

Bibliografıa

Evans, G. and Honkapohja, S.: 2001, Learning and Expectations in Macroeconomics, Prince-ton University Press.

Modelos economicos de multiples agentes 23-06-2011

6.3 Bibliografıa 153

Hertz, J., Krogh, A. and Palmer, R.: 1991, Introduction to the theory of neural computa-tion, in J.-J. Herings, A. Talman and G. van der Laan (eds), Lecture Notes Volume,Santa Fe Institute USA, Addison- Wesley Publ. Co., Reading Mass.

Heymann, D.: 2007, Desarrollos y alternativas: Algunas perspectivas del anlisis macroe-conmico, in D. Heymann (ed.), Progresos en Macroeconomıa, Editorial Temas.

Hopfield, J.: 1982, Neural networks: a physical system with emergent computational abili-ties, Proc. Natl. Acad. Sci. USA 79, 2254.

Keynes, J. M.: 1936, The General Theory of Employment, Interest and Money, MacmillanCambridge University Press.

McCulloch, W. and Pitts, W.: 1943, A logical calculus of the ideas immanent in nervousactivity, Bulletin of Mathematical Biophysics 5, 115–133.

Sargent, T. J.: 1993, Bounded Rationality in Macroeconomics: The Arne Ryde MemorialLecture, Clarendon Pr.

Modelos economicos de multiples agentes 23-06-2011

154 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 7

Evolucion, adaptacion y aprendizaje

Tal como lo enunciamos en el comienzo del capıtulo anterior, en este consideraremos losprocesos de adaptacion que permite a los agentes acomodarse a circunstancias que cambianregularmente, del mismo modo que los seres vivos se adaptan a su medio ambiente. Igualque en el capıtulo anterior los agentes son concebidos con la capacidad de recibir estımulosdel entorno y proveer respuestas. La principal diferencia que consideraremos ahora es quetales respuestas pueden a su vez alterar el medio.

Esa situacion es la que se presenta cuando el medio esta compuesto por otros agentesque se encuentran en el mismo proceso de adaptacion. Los modelos que consideraremos enel marco de procesos adaptativos son particularmente aptas para dar lugar a situacionesde equilibrio sean estos estaticos como en un equilibrio de Nash o dinamicos como los quesurgen en las descripciones estadısticas vistas en el capıtulo III.

En este capıtulo partimos de una definicion de agentes complejos adaptivos cuyoproceso de adaptacion formalizamos fuertemente inspirados en la teorıa darwiniana de laevolucion.

7.1 Motivacion biologica de modelos evolutivos de adaptacion

El principal mecanismo de cambio y adaptacion que opera en los seres vivos esta condensadoen la evolucion delas especies tal como la concibiera Carlos Darwin a mediados del sigloXIX. Su Teorıa de la Evolucion provoco un cambio profundo en el modo de pensar sobre ladiversidad biologica y en general sobre todos los fenomenos ligados a la vida. Hoy en dıasuele decirse que nada se puede comprender en biologıa fuera de dicha teorıa. El “Origende las Especies” de Darwin es considerado ademas como la teorıa que mas ha cambiado elpensamiento cientıfico de los anos posteriores.

En el momento en que Darwin formulo los conceptos ligados a la evolucion de lasespecies existıan varios antecedentes importantes. En primer lugar era conocido el hechoque variedades de flores (rosas en particular) o de ganado podıan ser mejoradas por cruza deejemplares seleccionados. En segundo lugar, en el estudio de la geologıa se habıa adquiridoconciencia de la realidad de las trasformaciones progresivas del ambiente geografico y loslapsos extremadamente prolongados en el que los mismos habıan sucedido.

Otro antecedente importante son las ideas de Lamarck (1744-1829)- bien conocidasy compartidas por Darwin - que habıa propuesto la primera teorıa evolutiva para los seresvivos.Segun esta las especies son capaces de sufrir cambios a lo largo de las generacionesmerced a que los descendientes heredan los caracteres que habıan adquirido sus ancestros

155

156 7. Evolucion, adaptacion y aprendizaje

a lo largo de su vida. Su imagen de la manera en que las jirafas adquirieron sus largoscuellos podrıa haber sido que a lo largo de las generaciones aquellos ejemplares que mas seesforzaban estirando sus cuellos para alcanzar las hojas mas altas de los arboles transmitıana su descendencia los pocos centımetros de cuello ganados de esa manera

La formulacion evolutiva de Darwin postula en cambio la heredabilidad de los carac-teres que mejor contribuyen a que el individuo pueda reproducirse. La capacidad de tenerdescendientes es por otra parte una medida de cuan exitoso ha sido ese individuo en su luchapor la supervivencia. Este concepto se resumio incorrectamente diciendo que la teorıa deDarwin postulaba “la supervivencia del mas apto” dando ası lugar a un razonamiento cir-cular.

La diferencia entre el enfoque de Darwin y el de Lamarck reside en que Darwintiende mas a pensar que la diversidad y la capacidad de cambio es una cualidad inherente anaturaleza misma de los individuos y que esos cambios se producen al azar. Ademas el medioambiente lo supone jugando el papel de seleccionar cuales son los cambios mas ventajosos.La manera en que Darwin habrıa explicado el cuello largo de la jirafas serıa que aquellosindividuos que por mera casualidad han nacido con el cuello mas largo se pueden alimentarmejor y dejan por eso mas descendencia, razon por la cual al cabo de suficientes generacionesesa caracterıstica pasa a generalizarse en toda la poblacion. El cambio evolutivo tal como loentendıa Lamarck quedo finalmente desacreditado por la evidencia empırica que, al menosen organismos superiores, demuestra que los caracteres adquiridos no son heredados por losdescendientes.

Una objecion importante a la teorıa de Darwin en momentos en que fue formuladaera que el proceso evolutivo debıa converger a una perdida de diversidad y no a su aumentotal como en realidad puede constatarse por la observacion directa de una enorme variedadde especies. Esa objecion pudo ser levantada luego de las investigaciones de Mendel quehacia 1900 establecio la naturaleza “atomica” de la herencia. De los estudios de Medelsurgio que las cartacterısticas heredables se concentraban en elementos que el denomino“genes”. Por esta razon en el proceso de la reproduccion una caracterıstica se transmitede los progenitores a la descendencia de manera completa (si el “gen” se trasmite a ladescendencia) o no se transmite (si el gen no esta presente en los descendientes).

La moderna biologıa molecular dio sustento quımico al concepto de gen cuando seestablecio que la informacion que se transmite en la herencia esta codificada en la moleculade ADN que reside en el nucleo de las celulas. La nueva sıntesis evolutiva en la que las basesmoleculares son adecuadamente tenidas en cuenta se ha dado en llamar “neodarwinismo” odarwinismo molecular. El ADN contine dos largas secuencias enfrentadas en la disposicionde una doble helice y construidas por la repeticion de 4 compuestos quımicos diferentes(nucleotidos) 1 cuyo ordenamiento particular gobierna el proceso de sıntesis de las proteinas.Estas moleculas son los ladrillos fundmantales con los que se construyen las celulas delorganismo y hacen posible todas sus funciones vitales.

Desde el punto de vista biologico, la evolucion no esta asociada a un “progreso”. Nopuede decirse que un ser vivo cualquiera es mas evolucionado que otro ya que ambos sonel resultado de del mismo proceso que comenzo con la aparicion de las primitivas formasde vida en la Tierra. Lo que por otra parte surje de la observacion directa es que existenalgunos organismos que son mas complejos que otros: hay una gran diferencia entre unalga y un delfin o entre una mariposa y un orangutan. Una observacion identica puedeefectuarse para organizaciones dentro de una sociedad. Sin embargo, si se desea poner estos

1Los mismos son Adenina, Guanina, Citosina y Timina que se abrevian por A, G, C, T. En el caso delser humano, esa cadena contiene 3.1010 “eslabones”

Modelos economicos de multiples agentes 23-06-2011

7.1 Motivacion biologica de modelos evolutivos de adaptacion 157

argumentos de manera mas precisa y cuantitativa se choca con la dificultad de que no existe,al menos en biologıa, una medida universalmente aceptada de la complejidad de un ser vivo.Algo similar podrıa bien decirse de organizaciones sociales.

Curiosamente existe una tendencia antropocentrica de hablar de organismos masevolucionados que otros con la aceptacion implıcita que el ser humano es el mas evolu-cionado de todos. En realidad todos los seres vivos que observamos, incluidos los sereshumanos, son casualidades que se han encontrado a lo largo de un paseo en el espacio detodas las secuencias genomicas preservando en cada paso, aquellas alternativas que mejora-ban sus posibilidades de dejar mas descendencia. El proceso evolutivo alcanza a toda laescala biologica, y afecta por igual a sistemas de muy diversa complejidad con estructurasinternas tan diversas como moleculas, celulas y organismos pluricelulares, operando sobresus cracterısticas comportamentales y en su relacion con sus semejantes y con otras especies.

Hoy en dıa la moderna biologıa ha podido comprobar los postulados basicos del en-foque darwiniano observandolo bajo el microscopio o en el laboratorio de bioquıimica. Ex-isten lıneas de pensamiento en las que se intenta trasladar estos conceptos al contexto de lasneurociencias tanto en la morfogenesis de conglomerados de neuronas en el cerebro (“dar-winismo neuronal”) como en teorıas cognitivas sobre la genesis y estabilizacion de conceptos.Existen en cambio intentos que no han ganado consenso sobre “darwinismo social”.

Los conceptos de la evolucion darwiniana han sido tambien trasladados al lenguajeformal de las ciencias de la computacion dando ası lugar a los algoritmos geneticos queveremos en una proxima seccion de este capıtulo.

Resulta muy tentador utilizar el estilo de pensamiento de la teorıa de la evolucionpara trasladarlo a contextos a veces distantes de problemas biologicos. Si bien nostros uti-lizaremos estas ideas y formularemos algunas de estas metaforas hay que ser muy concientede las limitaciones de las mismas. Los conceptos derivados del enfoque evolutivo darwinianohan tenido por ejemplo un impacto enorme en la ciencia polıtica a traves de extrapolacionesen las que transgreden muchos de los conceptos basicos de la misma. Las ideas de Dar-win impresionaron mucho a Marx quien dedico parte de su obra al naturalista ingles. Losseguidores de Marx trasladaron la competencia entre especies al medio social reformulandolacomo una lucha entre clases que debıa conducir a la supervivencia y consiguiente gobiernopor la “clase mas apta”. Una extrapolacion profundamente equivocada fue la del nazismoque imagino que el medio social es el escenario de una lucha entre razas, lucha en la cual estallamada a prevalecer una “raza superior”. Finalmente se debe mencionar que buena partedel sustento de los conceptos ligados al liberalismo economico reside en visualizar la librecompetencia entre firmas como un mecanismo de seleccion que redunda en una superaciony mejora de las mismas.

El mecanismo de evolucion darwiniana solo contiene los siguientes elementos basicos:

1. Es un fenomeno poblacional: El proceso evolutivo solo puede tener lugar en elseno de una poblacion que, en principio, esta formada por una gran cantidad de indi-viduos. Jamas el mecanismo de cambio y seleccion de aptitudes puede desenvolverseen un individuo aislado sino que tiene lugar a traves del proceso de procreacion querenueva la estructura de la poblacion. Por estas razones el proceso de cambio involu-cra lapsos prolongados ya que la “unidad de tiempo” es el requerido para renovargeneracionalmente la poblacion.

2. Genesis de diversidad. Se supone que la diversidad se genera por mutaciones al azaren la informacion genetica de los miembros de una poblacion. En la practica la tasa decambios debe ser lo suficientemente pequena como para que las variantes favorables

Modelos economicos de multiples agentes 23-06-2011

158 7. Evolucion, adaptacion y aprendizaje

no se vean destruidas en ulteriores mutaciones y lo suficientemente significativa comopara efectuar un aporte apreciable a la diversidad en la informacion genetica de todala poblacion.

3. Seleccion. Solo una fraccion de los individuos son capaces de transmitir cambios ala siguiente generacion. Los individuos de la poblacion compiten por recursos escasos(alimento, agua, espacio, etc.) que son indispensables para su supervivencia y re-produccion. Esa competencia hace que solo algunos selectos individuos puedan dejardescendencia. Por lo general la cualidad por la que los individuos son seleccionadosrecibe el nombre de “aptitud”, “desempeno” o “fitness”.

4. Heredabilidad Aquellas caracterısticas que contribuyen a una mayor exito repro-ductivo se transmiten por la herencia entre los progenitores y su descendencia. Enrealidad, la afirmacion debiera ser en sentido inverso: solo aquellas caracterısticas quecontribuyen a una mejor “fitness” que son heredables son relevantes.

7.1.1 Agentes complejos adaptivos

El esquema explicado arriba induce a pensar que la evolucion pueda imaginarse como unaacumulacion lenta y progresiva de cambios en la informacion genetica de los individuos dela poblacion o, en terminos mas matematicos como un paseo al azar en el espacio de lassecuencias genomicas. Si bien este concepto posee sus limitaciones (ver secciones posteriores)es una base adecuada para trasladar este mecanismo a un contexto formal que permitevisualizar el proceso evolutivo como uno de optimizacion por el cual, a lo largo de lasgeneraciones se maximiza una funcion “fitness”.

Para establecer este paralelismo conviene imaginar que un ser vivo, en interaccioncon el medio ambiente, puede representarse de modo elemental como un agente que recibeestımulos y produce respuestas. Desde un punto de vista computacional ese comprtamientose lo puede sintetizar en una lista de sentencias del tipo: SI[estimulo] ENTONCES[respuesta]que podemos simbolizar como

[E] =⇒ [R] (7.1)

La respuesta R puede manifestarse a traves de sistemas motrices (p.ej. contraccionde musculos para provocar la caza de una presa o la huida de un predador) o de valorestestigo que sirvan de control (p.ej. alteracion del nivel de glucosa en sangre para dar lugara la sensacion de hambre).

La conducta y eventualmente la estructura de un agente de un cierto nivel de comple-jidad podrıa en consecuencia simbolizarse como una lista de sentencias del tipo 7.1. Dichalista puede asimilarse al “genoma” del individuo y pueden a su vez suponerse codificadascon valores numericos de referencia, por una lista de caracteres cualesquiera ai, o masgeneralmente con 0’s y 1’s.

([E1] =⇒ [R1])⊕ ([E2] =⇒ [R2])⊕ · · · ⊕ ([EN ] =⇒ [RN ]) ≡ a1a2 · · · aN (7.2)

7.2 Algoritmos Geneticos

A partir de aquella representacion de agentes adaptativos es posible hacer un modelo com-putacional de un proceso evolutivo darwiniano siguiendo los puntos 1 a 4 arriba menciona-

Modelos economicos de multiples agentes 23-06-2011

7.2 Algoritmos Geneticos 159

dos. El proceso adaptativo darwiniano formalizado de esta manera puede tambien sercontemplado como uno de optimizacion combinatoria ya que es una manera de encontrarextremos de la funcion de fitness en un espacio que, en principio, posee muchas dimensiones.Como se vera el algoritmo exlora el efecto de cambios en cualquier posicion del “genoma”con lo que busca dicho extremo mediante un procedimiento que analiza “en paralelo” todassus dimensiones. Por estas razones los algoritmos geneticos son considerados como una her-ramienta para encarar problemas de optimizacion. Holland y sus colegas de la Universidadde Michigan originaron este modelo (Holland, 1975) que puede resumirse en los siguientespuntos:

1. Se parte de una poblacion inicial en la que cada individuo es un “genoma” como losrecien descriptos.

2. en cada nueva generacion cada genoma es alterado produciendo un cambio al azar(mutacion) en la informacion que contiene. Este cambio se efectua con una probabil-idad que debe respetar lımites ya mencionados.

3. Se evalua la “fitness” de todos los individuos de la poblacion y se seleccionan aquellosque la tienen mejor.

4. Se construye una nueva poblacion de secuencias a partir de la existente mediantealgun mecanismo de reproduccion del que solo participan los individuos mas aptos.

En la formalizacion que acabamos de dar los individuos son asimilados a su infor-macion genetica, despreciando en gran medida el papel que puede jugar el medio ambienteen la expresion de la misma (lo que en biologıa recibe el nombre de “fenotipo”). Este puntoes discutido mas adelante.

Por semejanza con lo que sucede en seres vivos, los mecanismos de reproduccionpuede ser la simple copia de la secuencia (reproduccion asexual) o puede involucrar a dosprogenitores (una reproduccion sexual). Esta cruza suele llamarse “crossover”. Se sueleproceder de la manera siguiente:

1. Se seleccionan dos secuencias A y B aptas para reproduccion,

2. se determina al azar un punto de corte.

3. ambas secuencias son cortadas en el mismo lugar generando asi los segmentos A1 yA2 de la primera secuencia y B1 y B2 de la segunda,

4. se generan dos descendientes componiendo dos nuevas secuencias (A1,B2) y (B1,A2).

Si las secuencias progenitoras (A) y (B) son:

Sec.A = a1a2a3 · · · an︸ ︷︷ ︸A1

an+1 · · · aN−1aN︸ ︷︷ ︸A2

(7.3)

Sec.B = b1b2b3 · · · bn︸ ︷︷ ︸B1

bn+1 · · · bN−1bN︸ ︷︷ ︸B2

(7.4)

las secuencias descendientes (1) y (2) resultan:

Sec.1 = a1a2a3 · · · an︸ ︷︷ ︸A1

bn+1 · · · bN−1bN︸ ︷︷ ︸B2

(7.5)

Sec.2 = b1b2b3 · · · bn︸ ︷︷ ︸B1

an+1 · · · aN−1aN︸ ︷︷ ︸A2

(7.6)

Modelos economicos de multiples agentes 23-06-2011

160 7. Evolucion, adaptacion y aprendizaje

Tanto el “crossover” como la mutacion son recursos para introducir diversidad en lapoblacion de secuencias. La estrategia de reproduccion sexual ha sido ligada a una ciertacapacidad de los algoritmos geneticos para explorar de manera casi simultanea distintasregiones del espacio de parametros en el proceso de optimizacion.

Es menester aclarar que la aplicacion de algoritmos geneticos en un proceso de op-timizacion no obedece a reglas precisas. Si bien siempre se deben componer generacionessucesivas de un mismo numero de individuos hay libertad para establecer el mecanismo deseleccion y reproduccion. Por ejemplo, el proceso de seleccion puede hacerse de maneradeterminista (reteniendo solo los individuos de mayor fitness y permitiendoles tener descen-dencia hasta completar la poblacion inicial) o de manera probabilıstica (seleccionando a losmiembros de la siguiente generacion con una probabilidad proporcional a su fitness). En elproceso reproductivo se puede utilizar la reproduccion sexual o asexual, y, si se eligio la se-gunda alternativa, se pueden retener a los dos descendientes o a solo uno de ellos eligiendoloal azar. Tambien la probabilidad de mutacion puede elegirse con cierta libertad dentro demargenes que a su vez dependen de si se utiliza la reproduccion sexual o asexual.

Es opinion de los expertos en optimizacion que los algoritmos geneticos pueden noser los mejores en una variedad de problemas. Sin embargo, en el contexto que nos interesaaqui, su virtud reside precisamente en lo que los matematicos aplicados resaltan como undefecto: su principal merito en la formulacion de modelos multi agente u otros ligados a labiologıa es la de retener las principales caracterısticas de la evolucion biologica: Los seresvivos no se corresponden con optimos absolutos. Por lo general su desempeno depende deuna enorme cantidad de grados de libertad con lo que la busqueda de un optimo absolutoen tal espacio requiere explorar una cantidad de alternativas que crece exponencialmentecon la dimension del espacio de parametros2 El proceso evolutivo en biologıa conduce enrealidad a configuraciones que, por lo general son suboptimas pero robustas.

Las metaforas evolutivas aplicadas a contextos economicos o sociales deben ser elab-oradas con cuidado. En lo que sigue veremos varios de estos ejemplos. En todos ellosel proceso evolutivo es utilizado para representar un proceso de aprendizaje en que launidad de seleccion que participa en el proceso evolutivo son estrategias, recuerdos o in-formacion. Nunca son estructuras tales como organizaciones o sectores sociales, firmas osectores economicos de una economıa compleja. Si esas fueran las unidades de seleccionse caerıa rapidamente en problemas por cuanto el proceso de reproduccion o la heredabili-dad de las caracterısticas mas ventajosas no se pueden parangonar directamente con nadareal. En estos contextos pareciera que el proceso evolutivo deberıa involucrar elementosLamarckianos.

7.2.1 Implementacion computacional del AG

El proceso de adaptacion segun el esquema de los algoritmos geneticos es una forma deaprendizaje no supervisado. En un proceso de esta naturlaeza no se busca alcanzar unextremo mediante la intervencion de un agente externo al sistema que corrige errores talcomo se hace en los mecanismos de entrenamiento de una red neuronal. El aprendizajeno supervisado debe ser comprendido como un proceso dinamico de adaptacion en el cualalgunas caracterısticas propias de la dinamica da lugar a un proceso de adaptacion a lolargo del cual la fitness siempre tiende a aumentar. A estos rocesos a veces se los suele

2Un ejemplo serıa: la busqueda del conexionado optimo de las 1011 neuronas del cerebro. Esto implicaajustar unas 1015 coexiones sinapticas. El numero de posibles alternativas que habrıa que explorar serıa

del orden de e(1015) con lo que se puede afirmar que no ha habido suficiente tiempo en toda la historia del

universo para completar esa tarea .

Modelos economicos de multiples agentes 23-06-2011

7.2 Algoritmos Geneticos 161

denominar de autoorganizacion. Un proceso de este tipo aprovecha en cada momento laestructura del sistema incorporandole informacion valiosa aprovechando lo bueno que hayaen el y descartando lo malo por un proceso de prueba y error.

La version mas sencilla consiste en utilizar una cadena de 1’s y 0’s que se define comoun gen (cromosoma en el codigo de abajo). Una coleccion de genes definen un genoma yse supone que cada gen tiene una fitness asociada. Claramente la funcion de fitness o deaptitud depende da cada aplicacion que se desee implementar y es, en general, la parte mascomputacionalmente intensiva del algoritmo.

Un genoma inicial, con una estructura al azar, puede definirse facilmente utilizandosentencias propias del lenguaje de Matlab:

Creacion de un nuevo genoma binario

function genome = ga binary new (k ,m)

genome . chromos = round(rand (k ,m) >= 0 . 5 ) ;genome . f i t n e s s = zeros (k , 1 ) ;

El proceso adaptativo de los algoritmos geneticos contempla que el genoma evolucionemediante dos operaciones: cruza y mutacion. Para la cruza se suelen tomar dos genomas yse los combina para dar lugar a dos descendientes imitando el mecanismo de reproduccionsexual de celulas vivas. La mutacion toma por lo general un unico genoma y cambia al azarun 1 por un 0 o viceversa. Estas operaciones generan genomas proximos y solo cambianla aptitud levemente. De este modo el proceso adaptativo explora nuevos sistemas que seencuentran en la vecindad del anterior, mientras que la cruza explora nuevos sistemas en elque se combinan estructuras y caracterısticas conocidas del sistema anterior

La siguientes funciones Matlab implementan esos dos operadores.

Operaciones de cruzamiento y mutacion para el algoritmo genetico

# Operador de cruza : c o r t e y unionfunction chromo = chromo cross ( chromo1 , chromo2 )

l en = length ( chromo1 ) ;cutx = randint ( 1 , 1 , [ 1 l en ] ) ;chromo = [ chromo1 ( 1 : cutx ) chromo2 ( cutx+1 : l en ) ] ;

# Operador de mutacion : cambia un b i tfunction chromo = chromo mutate ( chromo1 )

l en = length ( chromo1 ) ;x = randint ( 1 , 1 , [ 1 l en ] ) ;chromo = chromo1 ;chromo ( x ) = 1−chromo1 ( x ) ;

Estos dos operadores estan gobernados por el proceso dinamico que trata de mejroarlas aptitudes individuales. Hay varios aspectos en el modo de implementar esta parte delalgoritmo. Haremos solo breves comentarios en resguardo de la claridad y la simplicidad.

Algoritmo para evolucionar un genoma

function new chromos = ga evo lve ( genome )

# ordena l a nueva l i s t a de cromosomas por apt i tud d e c r e c i e n t e[ s , indx ] = sort ( genome . f i t n e s s , ’ descend ’ ) ;chromos1 = genome . chromos ;new chromos = genome . chromos ( indx , : ) ;

Modelos economicos de multiples agentes 23-06-2011

162 7. Evolucion, adaptacion y aprendizaje

l en = rows ( chromos1 ) ;# s e l e c c i o n a dos cromosomas a l azar para cruzar y# reemplazar e l segundo peor cromosomai i = rand int ( 1 , 2 , [ 1 l en ] ) ;i f ( i i ( 1 ) ˜= i i ( 2 ) )

c c r o s s = chromo cross ( chromos1 ( i i ( 1 ) , : ) , chromos1 ( i i ( 2 ) , : ) ) ;new chromos ( len −1, : ) = c c r o s s ;

end

# s e l e c c i o n a un cromosoma a l azar para mutarlo , excepto e l primero# y reemplaza a l pero cromosomai 1 = randint ( 1 , 1 , [ 2 l en ] ) ;cmut = chromo mutate ( chromos1 ( i1 , : ) ) ;new chromos ( len , : ) = cmut ;

Observese que hemos utilizado una probabilidad de mutacion uniforme igual a 1/numerode genomas. En aplicaciones reales desearıamos controlar esta probabilidad, ası como laprobabilidad de cruza. Tambien es bastante normal adoptar una cruza preferencial entrelos genomas de mayor fitness. Todas estas caracterısticas pueden ser incluidas en muestroalgoritmo basico

7.2.2 Ejemplo I: Aplicacion al “problema de la particion”

Un problema de optimizacion combinatoria bien conocido es el de particionar un conjunto denumeros. La idea es separar un conjunto de numeros en dos subconjuntos tales que la sumade ambos sea la misma. Por ejemplo, tomemos el conjunto x = [4, 16, 3, 7, 8, 1, 4, 2, 11, 13, 9, 6].Se deberıan encontrar los subconjuntos x1 = [16, 3, 4, 2, 11, 6], y x2 = [4, 7, 8, 1, 13, 9], cadauno de los cuales sume 42. Cuando se encuentra una tal particion se la llama perfecta.

Este es un problema que se enfrenta a menudo en juegos infantiles cuando se debenintegrar equipos rivales: se seleccionan dos capitanes y estos seleccionan, alternativamente,a los mejores jugadores disponibles para cada equipo. Este es en realidad un metodoheurıstico para resolver el problema de particionar un conjunto. Vease por ejemplo elartıculo en American Scientist “The Easiest Hard Problem” por Brian Hayes 3.

Para resolver este problema utilizando algoritmos geneticos se procede como sigue.Se toma un genoma binario g, tal que cada posicion sea 1 o -1. Se toma luego el productoescalar del vector x con el genoma para comparar la suma del conjunto positivo con la delnegativo. Si el producto escalar es 0, se ha obtenido una particion aceptable.

Tambien para que lo que el programa busque sea un maximo, la funcion de costo sedefine como M−g.x, donde M es una constante que se elige mayor que la suma de todos losnumeros del conjunto a particionar y g es el genoma binario. La siguiente funcion computael costo para un genoma completo g:

Funcion de costo

function f i t n e s s = g a c o s t ( g , o r i )

f i t n e s s = g . f i t n e s s ;for i i = 1 : length ( g . f i t n e s s ) ,

c = g . chromos ( i i , : ) ;x = 2∗c−1;f i t n e s s ( i i ) = 10000000 − abs ( x∗ or i ’ ) ;

end

3http://www.americanscientist.org/template/AssetDetail/assetid/14705/page/1

Modelos economicos de multiples agentes 23-06-2011

7.2 Algoritmos Geneticos 163

Para procesar el algoritmo completo podemos utilizar las siguientes instrucciones:% Se d e f i n e primero un l i s t a i n c i a l de numerosx = [ 4 16 3 7 8 1 4 2 11 13 9 6 ]

% Se i n c i a l i z a e l genomag = ga binary new (30 , length ( x ) ) ;

% Se i t e r a por un dado n\ ’ umero f i j o de pasoss tep = 0while s tep < 65 & g . f i t n e s s (1 ) < 10000000

g . f i t n e s s = ga c o s t ( g , x ) ;g . f i t n e s s ’g1 = ga evo lve ( g ) ;g . chromos = g1 . chromos ;g . f i t n e s s = g1 . f i t n e s s ;

s tep=step +1;end

p1 = x ( find ( g . chromos ( 1 , : ) == 0))sum( p1 )p2 = x ( find ( g . chromos ( 1 , : ) == 1))sum( p2 )

Es interesante observar que que este problema tiene dos comportamientos lımitesdiferentes. Para una lista de longitud fija de numeros existe una diferencia cualitativa si elconjunto es de numeros pequenos o si existe un gran rango de dispersion entre ellos. Enel primer caso, parece razonablemente sencillo encontrar una o mas particiones perfectas.Por el contrario, en el segundo caso es casi seguro que no existan tales particiones. Esterazonamiento plantea la pregunta interesante acerca de que es lo que sucede en un rangointermedio. Es interesante tener este ejemplo in mente pues el modelo de asistencia al barque se explica mas adelante es una version extendida de este problema en el que en lugarde dos conjuntos iguales, los agentes tratan de hacer decisiones para repartirse en gruposde proporciones establecidas.

7.2.3 Ejemplo II: Optimizacion de un portafolio de inversiones

Considerese el problema de optimizacion de un portafolio de inversiones. Un modo deplantear un modelo esquematico de este problema en termino de algoritmos geneticos puedeser el siguiente: supongamos que existen N inversiones financieras posibles, cada una de lascuales ofrece para un dado plazo (que consideraremos igual para todas las alternativas) unrendimiento ri con i = 1, 2 · · ·N . Un portafolio puede simbolizarse mediante un vector ~xcon componentes xi, i = 1, 2 · · ·N que representan las fracciones de dinero asignadas a cadainversion. Estas deben cumplir la condicion

∑i xi = M .

Para optimizar un portafolio mediante algortimos geneticos puede suponerse que el“genoma” que lo especifica es el vector ~x y la funcion de fitness puede definirse por surendimiento: ϕ =

∑i xi(1 + ri).

Puede suponerse un inversor que enfrenta un conjunto de alternativas que se puedenrepresentar como una “poblacion” de P secuencias ~xµ;µ = 1, 2, · · ·P . El proceso de opti-mizacion puede representarse como un proceso de prueba y error en el cual se va mejorando“darwinianamente” la poblacion de P estrategias generando sucesivas poblaciones (todasde P individuos) mutando y reproduciendo los ejemplares mas aptos.

Para este problema, una “mutacion”, que consiste en una alteracion aleatoria y localen la composicion del portafolio, se puede efectuar eligiendo al azar con probabilidad Pmut

Modelos economicos de multiples agentes 23-06-2011

164 7. Evolucion, adaptacion y aprendizaje

una componente xµi de algun ejemplar y cambiandola por un nuevo valor xµi (nuevo) elegidoal azar en el intervalo [xµi − δ, x

µi + δ] con δ 1 4

Si el vector de rendimientos ~r es siempre el mismo y los terminos de este problemason los que han sido presentados, su solucion es trivial. El proceso de optimizacion deberıaconducir a un portafolio optimo trivial que corresponde a un vector xjo = M y xi = 0 ∀i 6= jocon rjo = maximo.

Una version mas realista de este problema es encontrar la mejor combinacion deproyectos con tasas de retorno establecidas. Digamos que hay n proyectos, y xi = 1 si elproyecto i es aceptabla y xi = 0 si no es el caso. Dado que cada proyecto tiene una tasa deretorno ri y un costo ci y el total de dinero disponible es el escalar w, entonces el problemaes

maximizarn∑i

rixi (7.7)

sujeto an∑i

cixi ≤ w (7.8)

La siguiente funcion provee la implementacion de ese problema.

Algoritmo para resolver el problema de decision de inversiones

function [ i n v e s t r e t co s t genome ] = i n v e s t g a ( r , c , w)

genome = ga binary new (10 , length ( r ) ) ;genome . f i t n e s s = f i t n e s s ( genome , r , c , w) ;

i t e r = 0 ; same = 0 ; bes t = 0 ;

dogenome . chromos = ga evo lve ( genome ) ;genome . f i t n e s s = f i t n e s s ( genome , r , c , w) ;i f genome . f i t n e s s (1 ) > best ,

same = 0 ;bes t = genome . f i t n e s s ( 1 ) ;

elsesame++;

end

i t e r ++;u n t i l same>50

i t e r

i n v e s t = genome . chromos ( 1 , : ) ;r e t = dot ( inves t , r ) ;c o s t = dot ( inves t , c ) ;

function s c o r e = f i t n e s s ( genome , r , c , w)

for i =1: length ( genome . f i t n e s s ) ,chro = genome . chromos ( i , : ) ;genome . f i t n e s s ( i , 1 ) = dot ( chro , r ) ;c o n s t r a i n t = dot ( chro , c ) − w;i f c o n s t r a i n t > 0 ,

4Es claro que si se altera una componente de ~x se debe luego imponer la condicion de normalizacionPi xi = M .

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 165

genome . f i t n e s s ( i , 1 ) −= c o n s t r a i n t ∗100 ;end

ends c o r e = genome . f i t n e s s ;

Como ejemplo encontramos la combinacion optima de proyectos dadas las condicionessiguientes:

r = [ 2 4 3 2 1 .5 1 . 3 ] ;c = [ 3 8 2 5 3 .2 2 . 3 ] ;w = 10 ;i n v e s t g a ( r , c , w)

Usualmente se obtiene la solucion x = (1, 0, 1, 1, 0, 0) con una tasa de retorno de 7 ycon el vınculo satisfecho con una igualdad.

Ejercicio 16 Verifique este resultado y encuentre otra combinacion posible que da la mismatasa de retorno.

Para hacer una comparacion hemos implementado la solucion del mismo problemamediante programacion lineal:

Funcion para resolver el problema con programacion lineal

function i n v e s t = i n v e s t l p ( r , c , w)

l en = length ( r ) ;i n v e s t = lp(−r , c , w, zeros (1 , l en ) , ones (1 , l en ) )dot ( inves t , r )dot ( inves t , c)−w

Procesando la funcion:

i n v e s t l p ( r , c , w)

da como resultado x = (1.00000, 0.33750, 1.00000, 0.00000, 0.00000, 1.00000), con una tasatotal de retorno de 7.65. Observe que en programacion lineal se suponen valores reales paralas decisiones de inversion, mientras que la implementacion con algoritmos geneticos utilizavalores enteros. Por esta razon la tasa de retorno provista por la programacion lineal essolamente una cota superior para la solucion real.

El problema de optimizacion de un portafolio se torna mas interesante si se tiene encuenta que el medio, que esta representado por el vector de rendimientos ~r, puede cambiarmientras el agente inversor “descubre” cual es la mejor inversion en un dado momento.En ese caso la optimizacion involucra el ajuste de un portafolio contra una serie temporal~r(t). Cabe pues comparar las escalas de tiempo asociadas al aprendizaje del inversor paramejorar el rendimiento de su portafolio y la escala asociada a la tasa de cambio de ~r(t).En esta situacion, los mejores ejemplares de la poblacion de P estrategias de inversionque corresponden a una generacion deben ser probados con los rendimientos del siguienteperıodo.

7.3 Modelos poblacionales: los individuos y el medio

Una manera simplificada de considerar la evolucion es una en que los individuos se moldeanpara adaptarse al medio ambiente pero este no se ve alterado por ellos. Un logro importante

Modelos economicos de multiples agentes 23-06-2011

166 7. Evolucion, adaptacion y aprendizaje

de las primeras teorıas evolutivas es la distincion conceptual entre “organismos” y “medioambiente”, pero, al hacer esto incluso Darwin desestimo el papel activo que cumplen losseres vivos en cambiar el ambiente que los rodea. Para las primeras teorıas el medio erasimplemente el escenario en el cual los seres vivos mostraban sus diferentes capacidades desupervivencia y reproduccion. En realidad una dada especie no puede dejar de modificar elmedio en que vive y, en consecuencia, altera de hecho su propio proceso evolutivo.

La modificacion del medio es una cuestion de capital importancia en modelos socialeso economicos. En la teorıa economica se suele suponer que agentes individuales no puedenalterar los mercados con acciones aisladas. El equilibrio, si existe, se supone que deriva deacciones colectivas en las que se encuentra implıcito algun proceso mediante el cual soloson efectivos los promedios. La principal cuestion es establever como sistemas compuestosde multiples agentes que actuan de manera independiente maximizando funciones de util-idad que muchas veces son contrapuestas, alcanzan estados con un cierto grado de “ordenmacroscopico” en el cual las acciones individuales son aproximadamente consistentes entresi. Los modelos basados en agentes multiples permiten considerar tanto situaciones en queacciones individuales afectan condiciones globales como analizar de que manera las accionesindependientes de numerosos agentes pueden llegar a coordinar sus acciones.

La modificacion de los aspectos formales de los algoritmos geneticos para considerarestas situaciones no es importante ya que solo se limita a tomar en cuenta el cambio delmedio: antes de calcular del desempeno de cada individuo se debe evaluar el efecto combi-nado de las acciones de toda la poblacion sobre el medio y recien cuando se hubo evaluadoese efecto se determina la fitness de cada individuo.

En lo que sigue veremos dos ejemplos en los que se considera una comunidad de agentesque encaran una tarea conjunta. Esta requiere que cada uno deba adaptarse a la conducta delos restantes con lo que enfrentan un medio ambiente que cambia constantemente. En ambosejemplos el conjunto de agentes deben resolver un problema de coordinacion enfrentandouna opcion binaria. En el primero la utilidad de cada uno aumenta solo si su opcion coincidecon la de la minorıa mientras que en el segundo su utilidad aumenta si la fraccion de lasociedad que asumio esa actitud no excede un umbral preestablecido.

El primer ejemplo es de un sistema frustrado ya que no existe una unica solucionoptima. En el segundo existe en cambio un equilibrio de Nash en el que todos salen ben-eficiados. En ambos casos se llega a un equilibrio con la diferencia que en el caso de unapoblacion frustrada el equilibrio es dinamico: todos los agentes cambian constantemente deestrategia pero mantienen constante una distribicion de probabilidades. El segundo ejemploque no contiene frustracion da lugar a un equilibrio que es estatico.

7.3.1 Ejemplo poblacional (I): El juego de la minorıa

El juego de la minorıa ha sido muy discutido en la literatura en dos variantes. Aqui soloconsideraremos aquella en la que los agentes carecen de todo recuerdo de la pasada historiadel sistema. Se trata de un sistema de N jugadores (N impar). Cada uno de ellos posee unaprobabilidad pi; i = 1, 2 · · ·N de optar por una de las dos alternativas de una opcion binaria(rotulamos las opciones con 1 y 0). Una vez efectuada la opcion se efectua un recuento ysolo los jugadores que estuvieron en el bando minoritario ganan y reciben un pago de 1$.Puede pensarse por ejemplo en el caso de conductores que deben elegir entre dos caminos:los que eligen el menos transitado se veran beneficiados. Los perdedores deben en cambioefectuar un pago de 1$. Cada jugador posee una cuenta corriente. Cuando la misma pasapor debajo de 0, el jugador altera su estrategia de juego cambiando pi → p′i elegido al azaren el intervalo [pi − δ, pi + δ] con δ 1.

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 167

Este esquema puede considerarse encuadrado en el modelo de algoritmos geneticos sise supone un “genoma” de una unica componente (pi). La funcion de fitness es binaria yda o quita un punto dependiendo de los votos reclutados para cada alternativa. Como seve la misma depende de lo que han decidio todos los demas jugadores.

El juego comienza asignando a cada jugador una cuenta de 0 $ y estrategias individ-uales pi elegidas al azar 0 ≤ pi ≤ 1. Para estudiar la evolucion del juego los pasos son lossiguientes:

Figura 7.1: Resultados del Juego de la Minorıa para 101 agentes, 50000iteraciones, δp = .05. En el panel de la izquierda se muestra la evolucionde la concurrencia. La horizontal marca el valor 50/101=.4950495, quees la maxima minorıa posible. Notese como disminuyen el tamano de lasfluctuaciones. En el panel de la derecha se muestra la funcion densidadP (p) obtenida en una simulacion del El resultado que se muestra es unpromedio sobre 100 evoluciones independientes.

1. Se recorre el conjuto de N jugadores y se determina por que opcion vota cada uno,

2. Se recuentan los votos

3. Se determinan los ganadores y perdedores

4. Se efectuan los pagos y cobros y se ajustan las cuentas corrientes que correspondan

5. Se corrigen los pi de los agentes que quedaron con su cuenta en saldo negativo. Serestituyen sus cuentas a 0.

6. Se recomienza desde el punto 1.

Si se itera este proceso el sistema alcanza un equilibrio. Para mostrar el resultadode este juego sobre la poblacion de N jugadores se repite la iteracion descripta arriba enun conjunto grande (∼un centenar) de sistemas identicos (para poder efectuar estimacionesestadısticamente significativas). Con esa informacion se puede determinar la funcion de

Modelos economicos de multiples agentes 23-06-2011

168 7. Evolucion, adaptacion y aprendizaje

densidad P (p) que determina la fraccion de la poblacion que posee estrategias pi compren-didas entre p y p+ dp. Esta funcion adopta la forma de una U con dos picos simetricos enp ' 0 y p ' 1 (ver figura 7.1).

Resulta del modelo que la unica distribucion estadısticamente significativa que tornaconsistentes entre si las decisiones de los N agentes es una en la que la mayor parte de lapoblacion se autosegrega en dos fracciones aproximadamente iguales que toman decisionesopuestas, una opta por (digamos) 1 y la otra opta por 0. Puede interpretarse que el procesode ajuste de las estrategias individuales a traves del algoritmo iterativo que acabamos dedescribir representa un proceso de adaptacion que de todos los individuos de la poblacionpara poder alcanzar la consistencia antedicha.

Dicha consistencia, sin embargo no es estatica. Es intersante comprobar que si bienla distribucion de probabilidades se mantiene inalterada cada jugador, individualmenteconsiderado, sobrelleva cambios constantes en su conducta a lo largo del tiempo: pasa dedecidirse en un sentido con probabilidad proxima a 1a decidirse en el sentido opuesto alguntiempo mas tarde. Al mismo timepo, su “cuenta” de puntos pasa de la opulencia a lamisria constantemente. Este es un caso de equilibrio dinamico como el mencionado en eltratamiento de modelos estadısticos en que las distribuciones de probabilidad se mantieneninalterada pero las suertes individuales cambian constantemente.

Implementacion computacional Se supone que existen N0 agentes caracterizados por unaprobabilidad p de ir al bar. En cada iteracion se cuenta cuantos optaron pr cada opcion.El grupo de la minorıa acumula un punto, mientras que la mayorıa pierde un punto. Paraque el grupo de la minorıa siempre exista N0 debe ser un numero impar.

Despues de cada ronda las probabilidades se adaptan al azar como si sufrieran unamutacion: se cambia p en δp que es una variable aleatoria uniformemente distribuida en elintervalo [−0.05, 0.05]. Si merced a este cambio p alcanza el valor 0 o 1 se aplican condicionesde controno reflectantes.

El codigo Matlab que implementa este modelo es el siguiente:

Algoritmo de Bar Attendence Model

function nn = bam(N0)global U N;

close a l l ;

s t ep = 300 ; % numero de computos s i n mostrar r e s u l t a d o sN = N0 ;rand ( ’ seed ’ , 1 2 3 4 ) ;

% t i t u l o de l a ventana p r i n c i p a lt i t u l o = [ ’ Bar Attendance Game : N=’ , num2str(N ) ] ;

p = rand (1 ,N) ; % asigna p r o b a b i l i d a d e s a l azars = zeros (1 ,N) ; % asigna p u n t a j e s a ceroh1 = hist (p ) ; % prepara histograma acumulat ivos1 = hist ( s ) ; % prepara e l his tograma de p u n t a j e save = [ ] ;

mu l t ip l o t ( 1 , 3 ) ;

i =1;while i <=90000,

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 169

i

f l i p = rand (1 ,N) ; % arroo ja l o s dados para cada agentet e s t = f l i p < p ;i f sum( t e s t ) < N/2 −1

win = t e s t ; % grupo de l a monor\ ’\ i aelse

win = 1− t e s t ;ends = s + win ; % l a minor \ ’\ i a auumenta 1 puntos = s − (1 − win ) ; % l a mayoria p i e r d e 1 punto

ave = [ ave sum( t e s t )/N ] ; % agraga l a ocupaci \ ’ on promedio

% a q u e l l o s agen tes con punta je n e g a t i v o a c t u a l i z a n sus p r o b a b i l i d a d e sx = find ( s <= 0 ) ;p ( [ x ] ) = p ( [ x ] ) + 0.05∗ (rand (1 , length ( x ) ) −0 .5 ) ;

% se c o r r i g e s i p excede l a f r o n t e r a s u p e r i o r%p ( [ f i n d (p>1)]) = 1 ; p ( [ f i n d (p<0)]) = 0 ;x = find (p>1); p ( [ x ] ) = 2−p ( [ x ] ) ;x = find (p<=0); p ( [ x ] ) = −p ( [ x ] ) ;

i f (mod( i , s tep )==0)[ h is , xh i s ] = hist (p ) ; h1 = h1 + h i s ;subplot ( 3 , 1 , 1 ) , c l e a r p l o t ; plot ( xhis , h1 )

[ h is , xh i s ] = hist ( s ) ; s1 = s1 + h i s ;subplot ( 3 , 1 , 2 ) , c l e a r p l o t ; plot ( xhis , s1 )

subplot ( 3 , 1 , 3 ) , c l e a r p l o t ; plot ( ave )text ( 1 0 0 , 0 . 8 ,num2str ( [mean( ave ) std ( ave ) ] ) ) ;drawnow

endi=i +1;

%pause ;end

Se generan tres graficos. El de mas arriba muestra la distribucion de las p dentrode la poblacion. El del medio corresponde a una distribucion acumulada de los puntajes sque corresponderıan a promediar sobre todas las iteraciones. El grafico final es una serietemporal del resultado de las encuestas que, despues de algunos transientes converge al50%.

7.3.2 Ejemplo poblacional (II): El modelo del Bar de Brian Arthur

El modelo de concurrencia la bar (o “Bar attendance model” (BAM)) es un modelo canonicoen el estudio de procesos de coordinacion y autoorganizacion. De el se derivo, como casoparticular, el juego de la minorıa que acabamos de describir. Este es un ejemplo en el que ladecision de cada agente afecta a todos los demas y la organizacion se alcanza cuando todaslas decisiones son consistentes entre si.

Se trata de un sistema de N parroquianos que concurren regularmente a un Bar. Lacapacidad del Bar es fija. Todos comparten el parecer que la fraccion de parroquianos queconcurre al bar debe estar comprendida entre dos umbrales: debe ser mayor que un umbralmınimo para que el ambiente este animado y debe ser menor que uno maximo para que nohaya aglomeraciones.

Modelos economicos de multiples agentes 23-06-2011

170 7. Evolucion, adaptacion y aprendizaje

Los parroquianos obtienen una utilidad positiva si toman una decision acertada o seaque concurren cuando la fraccion esta comprendida entre los dos umbrales y se abstienende hacerlo si la fraccion de concurrentes esta fuera de esos margenes. Si la decision quetoman esta equivocada obtienen en cambio una utilidad negativa. Se supone que todos losparroquianos conocen la historia previa de concurrencias al Bar y, en base a esa informacion,cada uno, de manera independiente debe decidir si concurren o no.

Segun el modelo los parroquianos toman decisiones individuales basadas en valoresagregados (globales) para todo el sistema que estan disponibles para todos los agentes porigual. Se supone que los agentes efectuan algun razonamiento inductivo, propio de cadauno para decidir su concurrencia para el dıa siguiente.

Figura 7.2: Simulacion del modelo de concurrencia al Bar considerando256 agentes, una Pmut = 0.005, umbrales Nmax

u = 0.8 y Nminu = 0.2.

Los planes son para s = 10 dıas y la poblacion de estrategias de cadaagente es P = 20. El panel superior muestra la convergencia a unaconcurrencia optima. En el inferior el sistema relaja a una configuracionsuboptima. Cada dıa el 10% de los agentes actualiza su estrategia vigenteevocando un algoritmo genetico.

Para encuadrar este problema en el esquema de los algoritmos geneticos5 se puedeproceder de la manera siguiente. A cada uno de los N agentes se le asigna una poblacion Pde estrategias de concurrencia para los subsiguientes s dıas de la semana. Cada una de esasestrategias puede codificarse en un genoma de s numeros ci con ci ∈ 1, 0; i = 1, 2, · · · scon la convencion que ci = 1 significa que se ha decidido concurrir al bar en el i−esimo dıay que ci = 0 significa lo contrario. Cada agente puede entonces tener una estrategia que esla que efectivamente aplica para concurrir al bar (la “estrategia vigente”) y un conjunto deotras P − 1 “estrategias alternativas”.

Puestos a jugar, cada uno de los N agentes aplica la estrategia vigente durante los sdıas de la semana. Al cabo de la semana puede evaluar sl desempeno de dicha estrategia,sumando la utilidad obtenida en cada uno de los s dıas de la semana. Sin embargo cadaagente puede ademas evaluar el desempeno que habrıa obtenido aplicando las restantes es-trategias que posee. Este calculo es aproximado pues debe suponer que todos los restantes

5Este modelo ha sido resuelto en la literatura sin utilizar algoritmos geneticos. El metodo que utilizamosaqui es una version iterada de un juego similar al de la minorıa que anticipa la concurrencia para varios dıasen el futuro

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 171

agentes no cambian sus respectivas estrategias vigentes. Esta estimacion alcanza para asig-nar a cada estrategia una fitness que mide en definitiva el grado de consistencia de susposibles decisiones individuales con las del restante conjunto de N − 1 agentes.

Existen pues todos los elementos para implementar N procesos evolutivos independi-entes en el seno de cada una de las poblaciones de estrategias asignadas a cada agente. Enese proceso cada agente descarta aquellas estrategias que son menos compatibles con las delos N − 1 agentes restantes y reafirma aquellas que son mas consistentes6.

En la figura 7.2 se muestra el resultado de la convergencia en el caso en que se imponeno solamente una concurrencia maxima N (>)

u sino tambien una mınima N (<)u . Este umbral

inferior da lugar a soluciones en los que un dıa cualquiera es descartado por los parroquianoscomo apropiado. Durante el proceso de convergencia y por una circunstancia casual algunosparroquianos encuentran que en un dado dıa hay demasiado poco publico. Al descartar esedıa como apropiado, dan lugar a que en jornadas sucesivas otros parroquianos adopten lamisma tesitura. Cuando esto sucede el sistema queda confinado en una situacion suboptimade la que solo puede salir por el evento altamente improbable que consiste en que unacantidad apreciable de agentes sufran, simultaneamente, una mutacion en sus respectivasestrategias de concurrencia para el mismo dıa. Este tipo de confinamiento es por otraparte un hecho que podemos comprobar cotidianamente en una gran variedad de conductassociales.

La solucion a la que se llega representa una delicada coordinacion entre los planesde concurrencia de diversos agentes. Es importante notar que esta solucion es estableporque entrana una gran diversidad de estrategias. Es facil darse cuenta que no todos losparroquianos pueden elegir la misma solucion de concurrir al bar en un mismo dıa porquesi ese fuera el caso excederıan la capacidad del local. En la Tabla (III) se muestra quetipo de coordinacion es la que se establece para el caso en que solo hay 10 parroquianos, laconcurrencia se planea para los subsiguientes 8 dıas y no se tolera una concurrencia superiora 4 parroquianos. Con una cruz se indica que el agente concurre al bar y con un blanco queno concurre.

TABLA III

Agente ↓ (dıa )→ 1 2 3 4 5 6 7 8

1 X X X X X X X

2 X X X X X X

3 X X X X

4 X X X X

5 X X X

6 X X X

7 X X

8 X X

9 X

10

Es posible comprobar que el estado que se alcanza es un equilibrio de Nash ya queninguno de los jugadores puede mejorar su posicion alterando unilateralmente su estrategia.Por otra parte existe una gran cantidad de equilibrios equivalentes. Cualquier transfor-macion de la matriz de la tabla III en la que una X es intercambiada con un lugar vacıo dela misma columna lleva de un equilibrio de Nash a otro igualmente aceptable. El sistema,una vez que alcanza su estado asintotico “visita” siempre las vecindades del equilibrio de

6Para evitar efectos de manada indeseados se puede establecer que distintas partes de los N agentesactualizan sus estrategias en distintos momentos.

Modelos economicos de multiples agentes 23-06-2011

172 7. Evolucion, adaptacion y aprendizaje

Nash que logro debido a que ocasionalmente la tasa de mutacion cambia un 0 por un 1 enel genoma de algun jugador.

Al final del capıtulo se da otro ejemplo del uso poblacional de los algoritmos geneticospara describir un fenomenos de coordinacion entre agentes‡1

Implementacion computacional Suponemos que hay N agentes que desean concurrir al Barsolamente si su ocupacion es menor que un valor umbral umbral.

Cada agente posee un mecanismo de aprendizaje que utiliza algoritmos geneticos:posee una coleccion P de planes semanales que se expresan como un vector binario m ycada posicion es el compromiso de cada dıa de permencer en casa (0) o ir al Bar (1). Encada iteracion el barman cuenta cuantos visitaron el Bar y hace publico ese resultado. Cadaagente esta pues en condiciones de actualizar su puntaje para todos sus P planes, sumandoun punto siempre que el plan haya contemplado concurrir al Bar y ese dıa este se encontrabadebajo del umbral. Tambien suma un punto si la opcioin es quedarse en casa y el bar estademasiado lleno de gente. Se resta un punto en toda otra situacion desfavorable. De estemodo cada plan tiene un puntaje que se actualiza en cada iteracion. El programa queimplementa este algoritmo es el siguiente

Bar Attendence Model

function [ st , plan , a]= bam( occupation , npop , m, n i t e r , pevol , seed )k = 6 ;

% numero de genomas de cada agentei f ( nargin < 3) occupat ion = 0 . 8 0 ;seed = 1234npop = 10m = 4n i t e r = 15endrand ( ’ seed ’ , seed ) ;for i 1 =1:npop ,a ( i 1 ) = agent new ( i1 , k , m) ;

endst . o c c l i s t = [ ] ;% ocupacion media

l i s t s t . s c l i s t = [ ] ;% punta je medio

l i s t f o r i t e r = 0 : n i t e r ∗m,%i t e r ;

day = mod( i t e r , m) + 1 ;% encuentra todas l a s e s t r a t e g i a s en todos l o s genomas para un dado d\ ’\ i a

go = zeros (k , npop ) ;for k1 = 1 : k ,for i 1 = 1 : npop ,go ( k1 , i 1 ) = a ( i 1 ) . genome . chromos ( k1 , day ) ;endend

% l o s agentes van a l bar e l i g i e n d o genoma 1 , de modo que d e f i n e quien ganagoes = go ( 1 , : ) ;mgo = mean( goes ) ;i f (mean( goes ) > occupat ion )

wins = 1−go ;else

wins = go ;endfor i 1 =1:npop ,a ( i 1 ) . genome . f i t n e s s = a ( i 1 ) . genome . f i t n e s s + wins ( : , i 1 ) ;end%s t . o c c l i s t = [ s t . o c c l i s t mgo ] ;

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 173

i f day == m,% a c t i u a l i z a l a e s t a d i s t i c a con l o s genomas v i g e n t e s

plan=zeros ( npop , m) ;for i 1 =1:npop ,plan ( i1 , : ) = a ( i 1 ) . genome . chromos ( 1 , : ) ;end

%planmplan = mean( plan ) ;s t . o c c l i s t = [ s t . o c c l i s t mean( mplan ) ] ;s c = zeros (1 , npop ) ;for i 1 =1:npop ,sc ( i 1 ) = a ( i 1 ) . genome . f i t n e s s ( 1 ) ;ends t . s c l i s t = [ s t . s c l i s t mean( sc ) ] ;

%pause%e v o l u c i o n a e l genoma

for i 1 = 1 : npop ,i f rand ( 1 , 1 ) < pevol ,

% devuwelve l o s genomans ordenados de acuerdo con su f i t n e s sa ( i 1 ) . genome = ga evo lve ( a ( i 1 ) . genome ) ;

% r e d e f i n e l a s f i t n e s sa ( i 1 ) . genome . f i t n e s s = zeros (k , 1 ) ;endendendendst . s c l i s t

% Define un nuevo agente. function agent = agent new ( i , k , m)agent . name = i ;agent . genome = ga binary new (k ,m) ;

%agent . p r e f e = 0 . 8 0 ; %rand ( 1 , 1 ) ;agent . s c o r e = 0 ;

Observe que la actualizacion de estrategias no se hace simultaneamente para todoslos agentes. Para quebrar esa sincronıa artificial la funcion acepta un parametro pevol quecorresponde a la probabilidad de actualizacion de cada agente al final de cada semana. Deesta manera, dependiendo de este parametro, no todos los agentes actualizan sus estrategiasal mismo tiempo.

En la Figura 7.3 primero se estudia el papel de m en el sistema. Para planes maslargos, las fluctuaciones son menores.

En la Figura 7.4 se muestra como varıa la evolucion cuando cambia el parametropevol. Para valores proximos a 0.1, las fluctuaciones son bastante visibles y resultan co-herentes lo que corresponde a un efecto de manada que se forman cuando la mayorıa de losagentes cambian simultaneamente sus estrategias afectando de esta manera la coordinacionde todo el sistema. Por otra parte para valores muy pequenos de pevol se observan fluc-tuaciones muy pequenas junto con una convergencia lenta a la maxima ocupacion posibledel Bar.

7.3.3 Derivacion del BAM: Un modelo de panico

El modelo de Bar visto en el ejemplo anterior no es un “modelo extendido” en el sentidoque no posee ninguna dimension espacial o de proximidad que sea natural para el conjuntode agentes. Una modificacion de este modelo para tener en cuenta una variable de estetipo puede servir para introducir, por ejemplo, efectos de contagio. Desde el punto de vistadel tipo de la informacion que manejan los agentes estos efectos pueden interpretarse como

Modelos economicos de multiples agentes 23-06-2011

174 7. Evolucion, adaptacion y aprendizaje

0.45

0.5

0.55

0.6

0.65

0.7

0.75

0.8

0.85

0.9

0 20 40 60 80 100 120 140 160 180 200

BAM model: N=30, pevol = 0.1, occupation = 80%

m = 10m = 5

Figura 7.3: Modelo BAM. Probabilidad de ocupacion para cadapaso de tiempo para m=5, 10. Parametros N = 30, pevol =0.1, occupation = 0.80,m = 6.

informacion que proviene de un nucleo de agentes proximos a otro. Se la puede llamar localpor oposicioon al tipo de informacion global del modelo tradicional en que cada agente soloconoce el efecto agregado de lo que decidio todo el conjunto.

En las figuras que siguen se muestra el efecto de introducir contagio en el modelodel Bar. Para ello se supone que cada agente esta ubicado en una grilla regular con bordesidentificados y en cada momento el agente puede saber cual ha sido la decision de sus cuatrovecinos ubicados al N, S, E y O de su posicion y cuales han sido sus respectivas utilidades

Se permite que cada agente pueda abandonar su estrategia siempre que encuentre quesu desempeno no es satisfactorio. Debe notarse que debido a este hecho se debe distinguirentre la accion vigente cat(i,j) del agente ubicado en el sitio (i, j), en el t-esimo dıa, y su planvigente para el mismo dıa c#t

(i,j). Para decidir un abandono de su plan el agente determinael resultado obtenido con su estrategia y lo compara con el que habrıa obtenido si hubieraimitado a sus vecinos mas inmediatos. Con este proposito cada agente calcula la “accionmedia local” (o campo medio local):

h(i,j) =14

(cat(i,j+1) + cat(i,j−1) + cat(i+1,j) + cat(i−1,j)

)(7.9)

Una vez que esta es conocida el agente puede determinar si va a seguir a sus vecinos o no.Es claro que la disposicion de agentes en una grilla no es un ingrediente esencial del modelosalvo por el hecho que define una vecindad. La misma puede bien definirse por medio deun grafo general o con la misma grilla pero con vecindades diferentes. Los resultados porsupuesto cambian pero retienen sin embargo las mismas caracterısticas esenciales que sediscuten mas abajo. Puede ademas suponerse que existe algun “ruido” o incertidumbreen la decision tomada por el agente. Esta puede representarse por una agitacion termica

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 175

0.45

0.5

0.55

0.6

0.65

0.7

0.75

0.8

0.85

0.9

0 20 40 60 80 100 120 140 160 180 200

BAM model: N=30, m=6, occupation = 80%

pevol = 0.1pevol = 0.5

Figura 7.4: Modelo BAM. Probabilidad de ocupacion para cada pasode tiempo para pevol=0.1, 0.5. Parametros N = 30, occupation =0.80,m = 6.

caracterizada por un parametro de control que juega el papel de una temperatura T = 1/β.Se la introduce por medio de una dinamica de Glauber que establece la probabilidad P deimitar o ignorar la decison de su entorno inmediato. Siguiendo la prescripcion deE GlauberP se define como:

P (accion = ±1) =1

1 + e∓2βh(i,j)(7.10)

Por consiguiente cada agente computa cada dıa que es lo que habrıa obtenido siguiendola accion media de su entorno. Si esta resulta mayor que la que obtuvo con su estrategiavigente el agente abandona su plan para dıa siguiente con una probabilidad P y hace lo quehizo su entorno. Puede interpretarse que el agente se contagia con esa probabilidad P . Sila utilidad no es mayor el agente mantiene su estrategia vigente.

Los resultados que se obtienen se muestran en la figura 7.5 donde se comparan losresultados con y sin contagio en una situacion en la que se agrega un shock externo entret = 300 y t = 500. El shock consiste en declarar que cualquier concurrencia es inaceptable(o sea, da lugar a una utilidad negativa) lo que es equivalente a decir que el Bar cierra suspuertas sin preaviso en t = 300 y las vuelve a abrir, tambien sin preaviso, en t = 500.

El panel A de la figura muestra resultados del ordenamiento del conjunto de agentesque ya se discutio en la seccion anterior. En el panel B se muestra el mismo procesoagregando el intercambio de informacion local. En el panel C se muestra cual es el porcentajede agentes que decidieron su accion contagiandose de sus vecinos, en cada momento.

Tanto en el panel A como en el B se ha marcado con 1 y 4 la etapa de organizacion enla que los agentes coordinan sus conductas individuales de modo de maximizar su utilidad.El proceso de organizacion es robusto (sobrevive) frente a la inclusion del ruido provenientedel contagio. La coordinacion que sobreviene despues de este momento y hasta t = 300no es sustancialmente diversa con o sin contagio. En promedio, durante todo ese perıodo

Modelos economicos de multiples agentes 23-06-2011

176 7. Evolucion, adaptacion y aprendizaje

Figura 7.5: Comparacion de aprendizaje con y sin informacion local.

la tasa promedio de contagio nunca supera un 20% (se lo individualiza en la figura comoel intervalo (8)). Las diferencias aparecen a partir de t = 300. El intervalo (2) muestraque el conjunto de agentes busca maximizar sus utilidades cambiando gradualmente susestrategias porque descubren que se obtiene una mayor utilidad si no se concurre al bar. Laadaptacion es gradual. El intervalo (3) es enteramente semejante al (2) pero con cambiosen la direccion opuesta.

La diferencia producida por la informacion local (contagio) surge de comparar elintervalo (2) con el (5) y (6) del panel B. En el intervalo (5) el nivel de contagio es muybajo y el aprendizaje es gradual tal como sucede en el panel A. Durante el intervalo (5)no se produce contagio porque la mayorıa de agentes esta usando estrategias equivocadasy no ofrecen una alternativa atractiva para que sus vecinos abandones sus planes vigentes.Este perıodo puede bien asociarse con un estado de “alerta”. Cuando la proporcion deagentes que aprendieron que no concurrir es mejor negocio se produce el contagio se haceposible y da lugar a una avalancha (6) acompanada de otra de imitacion (intervalo (9)) queda lugar a un brusco abandono de planes y una caida brusca en la concurrencia. A partirde ese momento hay una creciente proporcion de agentes que ajustan sus planes vigentesde acuerdo con la nueva situacion y la tasa de contagio comienza a bajar gradualmente(intervalo (10)). La concurrencia no cae hasta 0 entre t = 300 y t = 500 porque siempreexistio una proporcion de agentes que nunca pudieron concurrir al bar y por consiguientetienen estrategias exitosas para una situacion como la que es vigente durante la crisis.

El fin de la crisis en t = 500 da lugar a un brusco aumento de la concurrencia. Estoes debido a que los agentes encuentran en su bagaje de estrategias alternativas, aquellasque eran las vigentes antes de t = 300 y no fueron completamente eliminadas. Ellas vuel-ven a proporcionar una excelente utilidad. El conjunto de agentes vuelve a poner dichas

Modelos economicos de multiples agentes 23-06-2011

7.3 Modelos poblacionales: los individuos y el medio 177

estrategias en practica como si nada hubiera pasado entre t = 300 y t = 500. El modelo nocontiene nada que pueda asemejarse a un aprendizaje social que tenga prevenciones por laocurrencia eventual de una nueva crisis. Observese que justo en la transicion cae mucho elcontagio debido a ese bagaje de estrategias sobrevivio merced a que los agentes no tuvierontiempo de depurarlas de su memoria por la brevedad de la crisis.

Figura 7.6: Simulacion de la crisis bancaria por la devaluacion del pesomejicano.

Estos resultados permiten elaborar una metafora acerca de una situacion de alertay panico real como la que se dio en el sistema bancario argentino en oportunidad de ladevaluacion del peso mejicano. Para ello la concurrencia al bar se la hace semejante a lautilizacion del sistema bancario y los parametros del modelo (numero de agentes, tasa decontagio, tasas maximas y mınimas de concurrencia, duracion de la crisis) pueden ajustarsenormalizando para ello los montos totales maximos y mınimas de depositos en el sistemabancario nacional y el tiempo que medio entre la devaluacion y el anuncio de la garantıa delos depositos. Los resultados del modelo y los reales se comparan en la figura 7.6.

El sistema de multiples agentes pasa sucesivamente por estados de orden o coordi-nacion (1), alerta (3), panico (2), un nuevo orden (1) con un mınimo monto de dinerodepositado, un reordenamiento (4), y un nuevo estado coordinado final (1). Es claro que elmodelo no pretende dar cuenta del funcionamiento de un sistema financiero pues prescidnede una enorme cantidad de caracterısticas propias de un sistema de ese tipo. Es sin embargoaleccionador que una metafora tan distante de esa realidad pueda dar de todos modos cuentacualitativamente de muchas de sus caractaerısticas sin tener en cuenta esos elementos.

La diferencia entre el panel de la derecha y el de la izcquierda es la diversa duraciondel estado (4). En el panel de la izquierda se aplico el modelo tal como esta descripto arriba,o sea, sin una “memoria social” de la crisis. En este caso el modelo sugiere que los agentesvuelven a concurrir al sistema bancario como si nada hubiera pasado, hecho que claramenteno se corresponde con la realidad. En el panel de la izquierda se modifico la conducta delos agentes agregando “cautela”. En este caso esta se reduce a asignar una probabilidadmenor que 1 a poner en practica una estrategia que contempla concurrir nuevamente al barque en este caso se corresponde con sumarse nuevamente al sistema bancario. Se logra asıreproducir el incremento gradual de depositos posterior al final de la crisis.

Modelos economicos de multiples agentes 23-06-2011

178 7. Evolucion, adaptacion y aprendizaje

7.4 Coadaptacion

Los ejemplos vistos arriba se pueden asemejar al caso de individuos de una misma especieque deben acomodarse a cambios en su habitat, por ejemplo, debidos al clima. Estos soncasos particulares de otro proceso de adpatacion en que estan involuctradas al menos dosespecies que se influyen mutuamente. Tal puede ser el caso de la convivencia de presas ypredadores en un mismo habitat o el caso mucho mas complejo de sistemas ecologicos en losque muchas especies diferntes interactuan de manera intrincada afectandose mutuamente.A estos procesos se los denomina de coadaptacion y da lugar a equilibrios y compensacionesmucho mas complejas.

En esta seccion consideraremos un ejemplo que puede ser considerado como unaversion estilizada de una “telarana” de ajuste de precios y cantidades entre entre ofertay demanda y se pondra de manifiesto el efecto mutuo de la interaccion entre proveedores yconsumidores y sus respectivas capacidades de adaptacion.

Consideremos un conjunto N de consumidores que deben cotidianamente aprovision-arse de un bien. Puede adquirirlo en una proveedurıa o en una fabrica que lo vende siemprea un precio p. La proveedurıa puede proveer un bien a un precio p o P (con p < p < P ).La idea es permitir que la proveedurıa tenga la libertad de cambiar los precios y que loscompradores tengan la libertad de elegir el lugar donde aprovisionarse.

Para decidir la compra cada consumidor posee una poblacion de “predictores”. Losmismos se representan mediante una funcion booleana F : Lin → Lout, Los espacios Liny Lout son espacios de n-tuplas de longitud Din Dout de variables logicas. En la practicarepresentaremos los valores de las funciones logicas por 1 (verdad) y 0 (falsedad) y especifi-caremos a una funcion booleana por su tabla de verdad que es una lista ordenada de todaslas entradas y sus correspondientes salidas. (ver Tabla IV) Como es facil darse cuenta elnumero de posibles funciones logicas crece exponencialmente. Para funciones de una unicasalida y Din entradas el numero de funciones booleanas es de 22Din

Los predictores de cada agente son funciones booleanas con las que el consumidorpronostica el precio que pondra la proveedurıa. Se supone que los mismos son funcionesbooleanas de tres entradas como la de la tabla IV. La interpretacion de un predictor esla siguiente: las tres entradas corresponden a los precios registrados durante los tres dıasanteriores (con al convencion que a un precio p corresponde un 0 y a un precio P correspondeun 1). La salida (0 o 1) es el precio que el predictor propone para el dıa siguiente. Comopuede verse, si se acepta que el ordenamiento de las tres entradas es siempre el mismo, lafuncion booleana queda integramente caracterizada por la n-tupla de los 8 bits de salida,con lo que esta puede ser considerada el genoma asociado a cada predictor de la poblacion decada agente que puede ser alterado en un proceso de evolucion Darwiniana. La proveedurıatambien debe tener una poblacion de predictores con los que define el precio del dıa siguiente.En este caso se supone que para esta funcion la proveedurıa analiza los 4 dıas anteriorescon lo que el genoma de este predictor posee 16 componentes.

TABLA IV

Modelos economicos de multiples agentes 23-06-2011

7.4 Coadaptacion 179

entrada 1 entrada 2 entrada 3 salida0 0 0 10 0 1 00 1 0 00 1 1 11 0 0 11 0 1 01 1 0 01 1 1 1

Ejemplo de tabla de verdad de una funcion booleana de tres entradas y una salida (Din = 3, Dout = 1)

Resta definir cual es la funcion de fitness asociada a cada individuo de la poblacion. Lafitness se define en todos los casos como la utilidad de la estrategia utilizada. Sin embargola misma solo puede definirse de manera aproximada si se lo hace aisladamente para cadauna de las partes (“especies”) involucradas. Para ello se procede de la manera siguiente:

1. Cada predictor de un agente aumenta (disminuye) su fitness si su prediccion fuecorrecta (incorrecta)

2. Los predictores de cada agente se comparan con la estrategia de precios vigente dela proveedurıa y luego se los ordena segun su fitness. La accion de cada agente esde acuerdo con el predictor de maxima fitness. Despues de Tc pasos de tiempo lapoblacion de predictores se reformula por cruza y mutacion. Los agentes actualizansus predictores de manera asincronica: solo una fraccion de la poblacion invoca elalgortimo genetico al mismo tiempo de modo que la siguiente actualizacion tendralugar Tc pasos de tiempo mas tarde.

3. La proveedurıa posee una poblacion de predictores de 4 entradas (son n-tuplas de 16bits) que se actualiza por cruza y mutacion al cabo de Ts pasos de tiempo invocandoun algoritmo genetico.

4. Todas las estrategias de fijacion de precios son probadas contra las estrategias decompra vigentes de una muestra aleatoria y parcial de la poblacion de agentes com-pradores. Esta prueba se realiza durante Tv pasos de tiempo virtuales.

5. Una vez finalizad la rueda de Tv transacciones virtuales las estrategias de fijacion deprecios pueden ser ordenadas de acuerdo a la utilidad que le produjeron a la provee-durıa (en este caso, el total de ventas producidas durante la rueda de Tv transaccionesvirtuales). La tienda proveedora adopta como la estrategia vigente la de maximafitness.

En las figuras 7.7 y 7.8 se muestran algunos resultados de una simulacion del modeloque se acaba de describir. En la figura 7.7 se ilustra el proceso de tanteo entre los com-pradores y el vendedor al cabo del cual se fija el precio de equilibrio. En el panel superiorse muestra el precio que fija el proveedor, en el siguiente se indica el precio promedio alque compra toda la poblacion. En el panel siguiente se muestra el porcentaje de agentesque estan haciendo una decision equivocada y en el inferior el porcentaje de agentes que seabastecen en el proveedor. Con una flecha roja se muestra un intento del proveedor de fijarun precio elevado. Observese como el numero de agentes equivocados es alto al comienzopero luego decae rapidamente.

Modelos economicos de multiples agentes 23-06-2011

180 7. Evolucion, adaptacion y aprendizaje

Figura 7.7: Co-evolucion entre clientes y proveedores. Con una flechase indica la correspondencia entre la fijacion de un alto precio y unadisminucion del numero de compradores. Ademas son pocos los clientesque actuan equivocados.

En la siguiente figura se muestra, muy ampliado, un breve momento de otra simulacionen la que la condicion de agentes capaces de aprender da lugar a un estado de equilibriosuboptimo que puede prolongarse por mucho tiempo. La proveedurıa alterna entre un precioalto y uno bajo. Los compradores tienden a responder comprando solamente los dıas enque el precio es bajo y se abastecen en la fuente alternativa los otros dıas en que el precioes elevado (los picos y los valles en el panel superior se corresponden con valles y picos enel panel inferior). Adicionalmente, en un panel central se muestra el porcentaje de agentesequivocados. Observese que los picos en cada cambio de precio van decayendo con el tiempomientras que el procentaje de agentes que concurren a la proveedurıa en los dıas acertadosva en aumento. Esto muestra como se va generalizando en la poblacion la estrategia deamoldarse a los cambios de precio. Este es un equilibrio metastable que no esta contempladoen la “telarana” usual. La duracion de estas metastabilidades depende de la fraccion de lapoblacion que se equivoca impidiendo la consolidacion de una estrategia estable de fijacionde precios. Si la totalidad de los agentes se comprometiera en esta estrategia cambiante elsistema se encontrarıa confinado por “barreras entropicas” similares a las que se vieron enel caso del modelo de concurencia la bar.

7.5 El diseno de agentes complejos adaptivos: Los desafıos de la super-vivencia

En el comienzo de este capıtulo hemos asimilado los agentes complejos adaptivos (ACA) auna lista de sentencias del tipo [E] =⇒ [R] que computacionalmente se suponde codificadaen la secuencia genetica a1a2a3 · · · aN. Este concepto conlleva sin embargo la idea que un

Modelos economicos de multiples agentes 23-06-2011

7.5 El diseno de agentes complejos adaptivos: Los desafıos de la supervivencia 181

Figura 7.8: Metaestabilidades en una simulacion de coadaptacion entrelos compradores y el vendedor. Las lineas verticales indican la coincidenciaentre las fluctuaciones en el precio que fija el proveedor y la variacion enla clientela del mismo.

ACA puede construirse a partir de la interaccion de sistemas mas simples o bien considerarla posibiliad de integrarlos como las partes de un meta-agente de mayor complejidad.

Las redes neuronales vistas en el capıtulo anterior pueden considerarse como ACA queson a su vez el agregado de agentes mas simples (neuronas) y que puedan combinarse paradar lugar a agentes mas complejos capaces de una funcion cognitiva superior. El ejemplobiologico mas directo es considerar que una celula puede agregarse para dar lugar a tejidosu organos y estos a su vez pueden agregarse para dar lugar a todo un ser vivo.

En todos los casos suponemos que el proceso adaptativo de los ACA tiene lugar alo largo de diversas generaciones por un mecanismo darwiniano de mutacion, seleccion yherencia. En estas condiciones los ACA tanto naturales como artificiales deben enfrentardesafıos para sobrevivir. El biologo S. Frank redujo la lista a los siguientes 3 elementos:

1. Decaimiento de la informacion: Si las mutaciones y cambios al azar se acumulandemasiado rapidmente, la informacion almacenada en el sistema se deteriora y seimpide el proceso de mejora generacional que surge del proceso de seleccion. Latransmision de informacion entre generaciones debe prever mecanismos de correccionde errores.

2. Desarrollo de la complejidad constructiva: Cuando nace, cada sistema debeser capaz de construir los atributos que le permitan sobrevivir en un medio hostil ycambiante por todo el resto de su subsistencia. Dichos atributos son una consecuenciade su complejidad constructiva. Es imposible codificar toda la que es necesaria parala supervivencia. La informacion almacenada en el sistema y que se transmite por laherencia debe permitir el desarrollo ontogenetico de los patrones complejos que haganposible su subsistencia a partir de un conjunto limitado de instrucciones.

3. Adversidades impredecibles: Es imposible prever estructuras que posean respues-tas pre-elaboradas al elenco de todas las posibles situaciones adversas que se puedan

Modelos economicos de multiples agentes 23-06-2011

182 7. Evolucion, adaptacion y aprendizaje

presentar. El sistema debe poseer suficiente flexibilidad como para ajustarse a situa-ciones imprevistas.

Las respuestas evolutivas que se encuentran en la naturaleza a estos desafıos ha sidoresumida en la siguiente lista:

• Fidelidad de la transmision de la informacion entre generaciones A lo largodel proceso evolutivo han emergido mecanismos que aseguran un cierto grado de re-dundancia y de correccion de errores en la informacion genetica. Tal por ejemplo lasredundancias en el codigo genetico7. Otro ejemplo es el de la diferenciacion sexual yla reproduccion utilizando la informacion genetica de ambos progenitores.(Respondea la amenaza 1)

• Balance entre “exploracion” y “explotacion”. En su interaccion con el medioun organismo adaptivo exitoso debe haber logrado un equilibrio entre su capacidadde explorar nuevas conductas para su supervivencia y la de aprovechar soluciones in-corporadas a su “hardware”. Por ejemplo, un animal puede sobrevivir fugandose deun predador o utilizar la solucion de mimetizarse con el medio que ya tiene incorpo-rada.(Responde a amenazas 1 y 3)

• Emergencia de “reglas generativas” Las “reglas generativas” son reglas simplesque, operando durante la etapa de la morfogenesis son capaces de generar fenotiposcomplejos. El desarrollo de tales reglas y su incoporacion a la informacion heredableapunta a resolver la imposibilidad de codificar una estructura fenotıpica compleja quees necesaria para la supervivencia pues esta informacion puede exceder la capacidad dealmacenamiento de informacion en el sistema genetico. Un ejemplo es la constituciondel Sistema Nervioso Central del ser humano: el genoma carece de suficiente capacidadde almacenamiento de informacion como para codificar todas las ∼ 1015 sinapsisnerviosas que lo conforman. La solucion es transmitir la informacion de la sıntesisquiımica de los factores de crecimiento del mismo que hacen que el mismo crezca, sedesarrolle y conforme de manera adecuada (responde a la amenza 2).

• Genesis de subsistemas flexibles En el diseno de un sistema adaptivo no es dableprever todas las variantes del medio en que se va a desarrollar ni todas las respues-tas posibles a dichas variantes. La manera de asegurar la supervivencia es mediantela genesis de subsistemas flexibles que sean capaces de adaptarse para dar respuestaa problemas circunstanciales. Un ejemplo es el desarrollo de un sistema inmuni-tario. Este sistema es capaz de generar anticuerpos para neutralizar las amenazasbioquımicas del medio. Es inutil transmitir la informacion inmunitaria de los progen-itores por medio de la herencia por cuanto el medio que enfrentaran sus descendientespuede ser muy diferente al que ellos han encontrado. La respuesta evolutiva masexitosa es entonces la de generar un subsistema flexible que sea capaz de generar lasdefensas apropiadas en el momento oportuno. Otro ejemplo es la plastivcidad neu-ronal que permite la genesis de un sistema de aprendizaje (responde a la amenza 3).El sistema educativo de una sociedad cumple con estas mismas funciones.

• Simbiosis La simbiosis es una forma de coopercion entre individuos de una o dediferentes especies que permite una mayor eficacia en la explotacion del medio aun

7El genoma permite codificar el armado de proteınas con los 20 aminoacidos diferentes que hay en lanaturaleza. Estos son codificados utilizando 3 nucleotidos; como hay 4 tipos diferentes de nucleotidos, tresde ellos permitirıan codificar, sin redundancias, 64 alternativas diferentes

Modelos economicos de multiples agentes 23-06-2011

7.6 Asociacion y cooperacion 183

preservando la identidad e informacion genetica de los simbiontes. La subsistenciade los lıquenes es el resultado de la convivencia y ayuda recıproca de las algas yhongos que los forman. Es evidente que en muchısimos casos los recursos necesariospara la supervivencia se tornan mas facilmente accesibles si los agentes cooperan enobtenerlos. En la proxima seccion veremos con algun detalle las causas y consecuenciasde conductas cooperativas entre individuos separados (responde a la amenza 1).

• Genesis de subsistemas instruccionales Cuando el medio ambiente presenta reg-ularidades a lo largo de generaciones, estas pueden dar lugar a respuestas automaticas.Un ejemplo en este sentido son los los ritmos biologicos de numerosos seres vivos ensincronıa con la alternacia del dıa y la noche o las estaciones del ano (responde a lasamenzas 2 y 3)

7.6 Asociacion y cooperacion

La evolucion darwiniana se basa en la competencia para obtener recursos escasos que sonesenciales para la supervivencia. De acuerdo con este mecanismo cada individuo deberıaperseguir sus propios beneficios sin prestar ninguna atencion a las necesidades o requerim-ientos de sus congeneres.

Sin embargo muchos de los beneficios buscados por los seres vivos para su superviven-cia estan mas que generosamente disponibles para grupos que cooperen entre sı. Esta es labase biologica de la vida social. Es debido a esto que existen numerosos ejemplos en que seresvivos de muy diverso nivel de complejidad forman asociaciones en las que la cooperaciones un motor esencial. Como aquel concepto es tambien aplicable a los seres humanos, lasociedad toda es un ejemplo de muy diversas formas de asociacion y complementariedad.

La problematica de una Teorıa de la Cooperacion es de una enorme vastedad por loque en esta y en la proxima seccion nos limitaremos a presentar una breve introduccion altema de la emergencia de la cooperacion entre agentes y sus consecuencias mas importantes.

7.6.1 La Teorıa de la Cooperacion de Axelrod

El abordaje pionero de R. Axelrod8 tuvo por objetivo establecer como es que agentes quepersiguen sus propios intereses pueden dar origen a la cooperacion y cuales deben ser lascondiciones para que emerja y se estabilice una conducta basada en la misma.

A nivel de una especie o de una poblacion los procesos de seleccion son debiles yprevalece una vision individualista darwiniana. Esto justifica que para este analisis Axelrodhaya representado a los agentes sociales como jugadores comprometidos en el Dilema delPrisionero. Este juego involucra a dos participantes cada uno de los cuales puede realizar unade dos movidas que se simbolizan por C (cooperar) o D (defeccionar). La correspondientematriz de pagos es la siguiente

Matriz de pagos

Jug. 1⇓ ;Jug. 2⇒ COOPERAR DEFECCIONAR

COOPERAR R;R S;TDEFECCIONAR T ;S P ;P

8R. Axelrod “The evolution of cooperation” Perseus Books Group (1984)

Modelos economicos de multiples agentes 23-06-2011

184 7. Evolucion, adaptacion y aprendizaje

Si T > R resulta tentadora la actitud de defeccionar. Si R > P > S la defeccionse castiga frente al premio por la mutua cooperacion pero el castigo es mayor cuando sedefecciona cuando el otro coopera.

En las condiciones dadas por una matriz de pago como la que se muestra, dos jugadoresque busquen minimizar el maximo dano que puede efectuar su oponente (solucion minimax)deben optar por la opcion de defeccionar siempre. Axelrod discutio la situacion algo masgeneral que consiste en suponer que el juego se itera. Sin embargo, es facil darse cuentaque si se sabe de antemano cuantas veces se iterara la estrategia que deberıan seguir losjugadores es la de terminar defeccionando con lo que razonando recursivamente, todas susjugadas deberan ser D.

Este sugiere que para que emerja un esquema de cooperacion deben darse al menos lasdos condiciones a) que los agentes interactuen un numero indefinido de veces y b) que futurasinteracciones tengan algun peso en la definicion de la conducta presente. Para cumplir conla segunda premisa se introduce una tasa de descuento w sobre premios futuros. En estascondiciones, si w es suficientemente grande se puede demostrar que para un jugador no hayuna estrategia optima que sea independiente de la utilizada por su oponente.

La emergencia de estrategias puede estudiarse mediante algoritmos geneticos(Holland,1995; Axelrod and Forrest, 1987). Para ello se debe suponer un numero fijo de interacciones.Si todas las combinaciones posibles de acciones de ambos jugadores se ordenan de unamanera estandar se puede definir el genoma de cada agente como el conjunto de resultadosde la funcion booleana que asocia cada secuencia de jugadas a una accion particular delagente del mismo modo que se hizo con los predictores en el ejemplo de coadaptacion.

En el trabajo original de Axelrod se hizo la prueba de realizar numericamente unconcurso entre poblaciones cuyos agentes utilizaran diversas estrategias para reiteradosenfrentamientos segun el dilema del prisionero. Para ello se debieron efectuar diversashipotesis accesorias. En primer lugar el juego se supuso siempre simetrico (ambos jugadorescobran los mismos premios) y los pagos siempre los mismos, ningun agente podıa efectuarcoercion alguna o establecer ningun tipo de compromiso con otros agentes. Ademas ellosdeben poder ”recordar” a oponentes encontrados con anterioridad y como ambos habıanactuado en cada oportunidad. En estas condiciones la poblacion que termino dominandofue la que practicaba una estrategia de comenzar cooperando y actuar de allı en mas en un”ojo por ojo” (”tit for tat” en la version inglesa) o sea responder con la misma actitud queel oponente tuvo en la interaccion anterior.

Esta conducta basada en la cooperacion y la reciprocidad puede emerger como unaalternativa favorable entre agentes que persiguen conductas ”egoıstas”. Su estabilizaciontiene lugar en tres etapas. En la primera la cooperacion emerge aun en un contexto dedefeccion incondicional si la practica un racimo de jugadores que basan su cooperacion enla reciprocidad. En la segunda etapa el uso de esta estrategia prospera basandose en lareciprocidad. En la tercera y ultima etapa una comunidad que practica esta conducta llegaa ser estable frente a la invasion de otras comunidades que practican estrategias menoscooperativas. Con esta ultima caracterıstica la cooperacion se transforma en una estrategia”evolutivamente estable”. En algun sentido se podrıa decir que las ”ruedas” que registranla evolucion no pueden girar ya mas en el otro sentido, es como si poseyeran dientes comolos de un engranaje.

7.6.2 Seleccion basada en la cooperacion

El modelo Axelrod resulta demasiado esquematico para abarcar todas las maneras en lasque se pueden manifestar relaciones de cooperacion entre seres vivos. Si bien en muchos

Modelos economicos de multiples agentes 23-06-2011

7.6 Asociacion y cooperacion 185

casos las interacciones entre individuos se pueden representar por matrices de pago como lasdel dilema del prisionero el enfoque debe ser mas amplio (ver por ejemplo Nowak (Nowak,2006a; Nowak, 2006b)).

La cooperacion entre individuos o una actitud altruista son conceptos muy abarca-tivos. A los efectos del presente an’alisis, un cooperante puede definirse como un organismoque paga por su cooperacion un costo c que redunda en que otro obtiene un beneficio b.Dicho costo y beneficio se mide en perdidas o incrementos de la fitness de los individuosinvolucrados o, de otra manera, en la mayor o menor importancia de su descendencia seaesta biologica o cultural. Un defector no paga costos pero tampoco reparte beneficios.

Por estas razones la proporcion de defectores en una comunidad siempre tendera a au-mentar con el paso delas generaciones y ese aumento se hara a expensas de los cooperantes.Esto es sin embargo cierto solamente si las poblaciones son una mezcla homogenea de coop-erantes y defectores. Como en la realidad eso no sucede, los defectores tienen posibilidadesde sobrevivir en el proceso de seleccion.

Se ha concluido que la cooperacion puede surgir y establecerse por al menos unoscinco diferentes mecanismos (ver (Nowak, 2006b)). En todos los casos es la relacion c/b delcosto de la actitud altruista a su beneficio la que lo determina.

1. Un primer mecanismo de seleccion que favorecen la subsistencia de cooperantes y quefue tempranamente advertido es el de la seleccion por parentesco (kin selection). Laseleccion natural puede favorecer la cooperacion entre individuos si el que realiza elacto altruista y su beneficiario portan informacion genetica semejante. Esta idea secondensa en la regla de Hamilton por la que el acto de cooperacion queda justificadosi el grado r de parentesco genetico (o sea la probabilidad de compartir genes) debesuperar la relacion de costo a beneficio. Por consiguiente debe valer r > c/b. Cuandose evalua la fitness debida a la conducta inducida por algun gen particular se debeincluir su efecto en la parentela ya que esta puede poseer el mismo gen. Con esto laseleccion por parentesco resulta un efecto de “genes egoistas” tal como los proponeR. Dawkins (Dawkins, 1976).

2. Otro mecanismo de seleccion es el que ya vimos en la seccion anterior, basada en lareciprocidad directa. Este mecanismo fue bien establecido por Axelrod, a traves dela robustez de la estrategia “ojo por ojo” en el Dilema del Prisionero iterado. Sinembargo pronto se encontro que no es suficientemente tolerante frente a perturba-ciones: si en algun momento de la iteracion uno de los dos contendientes confundela accion recomendada por esa estrategia por otra, puede desencadenar una cadenade represalias que danan severamente a su perfomance. Existen sin embargo otrasestrategias de reciprocidad directa muy exitosas y capaces de absorber errores. Unaes “si gano sigo si pierdo cambio”. La reciprocidad prospera y se generaliza si laprobabilidad w de futuros encuentros de los mismos individuos (o equivalentementela tasa de descuento para los premios futuros) satisface w > c/b.

3. La reciprocidad directa es un caso particularmente simple de cooperacion en la quelos mismos dos agentes intercambian favores y beneficios. Esto deja fuera las posibili-dades que ofrece un entorno cultural que es particularmente significativo en sociedadeshumanas. En un ambientes ası la actitud cooperativa de un agente contribuye a con-solidar su reputacion que hace a su vez posible que dicho agente reciba beneficios. Estemecanismo de seleccion es por coopeeracion indirecta. La seleccion natural favorecenestrategias que basan la decision de ayudar en la reputacion del receptor de la ayuda.Este hecho esta corroborado por estudios teoricos y empıricos que indican que los

Modelos economicos de multiples agentes 23-06-2011

186 7. Evolucion, adaptacion y aprendizaje

agentes cooperantes tienen una mayor probabilidad de recibir ayuda. La cooperacionindirecta posibilita la emergencia de conductas generalizadas de cooperacion cuandola probabilidad q que se conozca la reputacion de un cooperante verifique q > c/b.

4. El mecanismo de cooperacion indirecta es semejante al que se ha dado en llamar dereciprocidad por la red. Si una comunidad se representan mediante una red, los indi-viduos que la componen se corresponden con los vertices del grafo y sus vınculos a susaristas (ver Capıtulo 5). En estas condiciones cada vertice puede mantener actitudesaltruistas o egoistas con sus vecinos en la red. La generalizacion de una conductacooperativa se puede entonces hacer corresponder directamente con un fenomeno depercolacion. Como es de esperar, la transicion correspondiente se relaciona con elvalor del grado medio k de los vertices del grafo que debe verificar k > c/b.

5. El quinto y ultimo mecanismo de seleccion es la de la seleccion de grupo. Este opera encomunidades en que los cooperantes y defectores no estan homogeneamnete mezcladosy en las que es posible identificar grupos en cuyo seno existen relaciones particular-mente proximas entre individuos (ver (Sober and Wilson, 1998). En este modelo,los cooperantes son altruistas pero solo con sus vecinos de grupo y no con los demasmiembros de la comunidad. Los defectores no cooperan en ningun caso. Todos losindividuos se reproducen proporcionalmente a su fitness dando lugar a una descen-dencia que se suma al grupo al que pertenecen. Si un grupo supera un tamano crıticose divide provocando la extincion de algun otro grupo que no crecio tan de prisa.Observese que si bien los unicos que se reproducen son los individuos la seleccion dehecho opera en dos niveles: tanto sobre los individuos como sobre los grupos. Estoes debido al hecho que algunos grupos pueden ser mas eficientes en crecer que otros.En particular una grupo exclusivamente integrado por cooperantes posee una fitnessmayor que otro de defectors. En algun lımite apropiado la emergencia de una con-ducta generalizada de cooperacion queda vinculada a la relacion ya vista de costo abeneficio. Si nc es el tamano crıtico de los grupos y ng es el numero de grupos de lacomunidad, la condicion es que b/c > 1 + nc/ng

7.7 El aumento de la complejidad

La cooperacion que se discutio en la seccion anterior puede tener lugar entre individuosde la misma y de diversas especies y tiene en realidad lugar en todas las manifestacionesbiologicas y sociales. Las algas y los hongos colaboran en la subsistencia de los lıqueneslos genes cooperan en el seno de los cromosomas y las celulas de un organismo pluricelularcooperan para la subsistencia del mismo de igual modo que las personas lo hacen en unatribu de cazadores y recolectores o en una sociedad mucho mas compleja.

Recientemente se ha consolidado la idea que el proceso evolutivo comprende lo que seha dado en llamar transiciones evolutivas principales (o transiciones evolutivas mayores).Ellas son las que marcan un salto cualitativo de complejidad en la organizacion interna delos seres vivos e involucran la instalacion de un regimen generalizado de cooperacion entrelos individuos involucrados. Todas estas transiciones son una mudanza de lo singular a loplural y son ejemplos particularmente significativo de lo dicho en el capıtulo I acerca de laidea de propiedades emergentes y que “mas es diferente”. Entre esas transiciones se puedenmencionar:

• El cambio de genes aislados a la conformacion de cromosomas

Modelos economicos de multiples agentes 23-06-2011

7.7 El aumento de la complejidad 187

• Conformacion de celulas a partir de organelas separadas.

• El cambio de celulas procariotas y eucariotas9

• Transicion de organismos unicelulares a pluricelulares

• Aparicion de la diferenciacion sexual (y emergencia del mecanismo de reproduccionasociado)

• Transicion de individuos solitarios a la formacion de colonias (castas no reproductivasen insectos sociales)

• Transicion de jaurıas o manadas a sociedades organizadas (surgimiento del lenguajey la comunicacion)

Los cambios que tienen lugar en cada una de estas transiciones han sido resumidosen las siguientes 5 etapas. Las mismas poseen una fuerte semejanza con las etapas en lasque se produce un aumento en la complejidad interna de empresas, organizaciones socialeso sistemas de produccion propios de la actividad economica.

1. Se comienza por una comunidad de organismos capaces de replicarse y respondera los estımulos del medio en que se encuentran. Los denominaremos “replicantes”sin que importe su nivel de complejidad interna. Dichos “replicantes” compiten in-dividualmente por recursos. A traves de sucesivas generaciones ellos optimizan suestructura para hacer un uso mas eficiente de los mismos (o sea replicarse mas conmenos recursos).

2. Algunos agentes adaptan mutuamente sus estructuras, disminuyendo la competenciay consiguiendo de esa manera un beneficio reproductivo. Aprovechan de esta maneraun cierto grado de “complementaridad estrategica”. Hasta este punto los replicantesno han ido mucho mas alla que organizarse en una colectividad, tal como puede seruna manada o cardumen (ver figura 7.9).

Figura 7.9: Los replicantes compiten por recursos, algunos se comple-mentan y consiguen aprovechar mejor las recursos disponibles.

3. Se produce una mas estrecha vinculacion entre individuos complementarios. Entreellos se establece una division del trabajo y se ven afectadas las funciones reproductivasindividuales de los replicantes que se han vinculado. Aparece de este modo una unidadsimbiotica entre los individuos agrupados. Esto quiere decir que la reproduccion dealgunos solo es posible si es ventajosa para los demas. Esta asociacion es con todo

9procariotas corresponden a celulas sin nucleo mientras que las eucariotas poseen un nucleo en el que sealmacena la informacion genetica

Modelos economicos de multiples agentes 23-06-2011

188 7. Evolucion, adaptacion y aprendizaje

vulnerable a la amenaza de parasitos que aprovechan de los recursos obtenidos porel conjunto pero no contribuyen a las funciones que hacen posible su subsistencia yreproduccion. Los parasitos aprovechan de un (free riding) respecto de los esfuerzosde los integrantes del grupo en su interacci”on con el medio. El grupo es asimismopasible de un proceso como el de la ‘‘tragedia de los comunes”: los integrantes tienenla libertad de hacer un uso indiscriminado de recursos compartidos y carecen de todaregulacion para su aprovechamiento (ver figura 7.10).

Figura 7.10: Los replicantes se asocian y compiten exitosamente porrecursos. Sin embargo el sistema es vulnerable a parasitos.

4. Para defenderse de los free riders y evitar la trajedia de los comunes los replicantes(que ya han llegado al nivel de simbiontes se rodean de una frontera que los confinay separa del resto del medio. La transformacion que se opera de esta manera es muyprofunda ya que ası ha surgido una nuevo organismo que es la asociacion de variosmenor complejidad. En su seno el trabajo se divide y los recursos se comparten. Losparasitos no pueden ingresar facilmente al sistema y ninguna de sus partes puedepredar en los bienes comunes. Se impone asimismo una severa limitacion en la re-produccion w los organismos asociados. Por la misma ninguno de los integrantes deorganismo puede reproducirse libremente y sin control. Si alguno lo hace sobrevienela muerte del conjunto (un ejemplo del quiebre de esta restriccion la constituye elcancer: un grupo de celulas de un organo perteneciente a un organismo mas complejose reproducen sin lımites alterando de manera irreparable el funcionamiento de todoel organismo complejo) (ver figura 7.11).

Figura 7.11: Los replicantes simbiontes se rodean de una membrana que impide el ingreso deparasitos

5. Se ha llegado a una situacion en que los “multi-replicantes” , ahora asociados, com-piten entre si por recursos escasos y amoldan su estructura para hacer un mejor usode los mismos: la historia vuelve a comenzar, pero este comienzo tiene lugar en unnivel jerarquico de complejida mayor que el anterior (ver figura 7.12).

La vision Darwiniana mas tradicional considera la competencia como motor principal

Modelos economicos de multiples agentes 23-06-2011

7.7 El aumento de la complejidad 189

Figura 7.12: Los nuevos replicantes con una mayor complejidad interna compiten entre si porrecursos reiniciando el proceso

del proceso evolutivo mientras que la asociacion entre individuos como las que acabamos dever es requiere de una explicacion particular como el dado en la seccion anterior en la quese debe tener en cuenta el interes primario de cada individuos que es su reproduccion.

La vision que surje de los analisis hechos acerca de la emergencia generalizada de con-ductas cooperativas y de las transiciones evolutivas principales correspondientes indica quelos mecanismos de asociacion y cooperacion son un motor tan importante como la compe-tencia en el proceso evolutivo y es el principal responsable en el aumento de la complejidaden organismos biologicos. Esta vision ayuda a comprender mejor la estructura jerarquicade la complejidad organizativa.

Teniendo en cuenta tanto este tipo de asociacion como las respuestas evolutivas que serepasaron arriba es natural que existan procesos evolutivos anidados que afecten los agentescomplejos aun estando asociados en meta-agentes de una jerarquıa mayor. En cada nivelel proceso de adaptacion tiene lugar en escalas propias de tiempo que esta asociada con elritmo con el cual se presentan los estımulos y se valora el desempeno del agente.

Hay diversos ejemplos de esto. Un mecanismo evolutivo anidado dentro de otro es eldel sistema inmunologico. Su respuesta a la presencia de un patogeno se basa en “recono-cerlo” como un elemento extrano y la generacion progresiva de anticuerpos cada vez masapropiados para neutralizarlos. Ese proceso es de cambio y seleccion siguiendo un procesodarwiniano. A su vez, el indovoduo que alberga dicho sistema, en tanto miembro de unaespecie participa de un proceso evolutivo en el que la especie toda se adapta al medio enque vive.

Del mismo modo, el m”as sencillo proceso de aprendizaje (tal como usualmente esconsiderado) en el que esta comprometido las partes plasticas del sistema nervioso, puedeconcebirse como una adaptacion darwiniana de las mismas, para dar respuesta a estımulosque provienen del medio. Por su parte, la especie evoluciona en lapsos mucho mas prolonga-dos. La misma genesis de un subsistema flexible que hace posible ese proceso de aprendizajees el resultado evolutivo en el que esta comprometida la especie y que ha surgido para darrespuesta a un medio ambiente que cambia con el tiempo. En la Tabla I se dan algunosejemplos de procesos evolutivos anidados. En la Tabla II se dan ejemplos de diversos sis-temas y sus correspondientes escalas de tiempo para su adaptacion. Esta coexistencia dediversas escalas es una caracterıstica propia de los sistemas complejos tal como se discutioen el Capıtulo 1.

TABLA I

Modelos economicos de multiples agentes 23-06-2011

190 NOTAS

Ejemplo Proceso evolutivo Niveles de seleccion

Sistema Inmune Variacion aleatoria de anticuerpos nivel superior:especiey posterior seleccion y reproduccion de los nivel inferior: celularque mejor reconocen el agente patogeno

Canto de aves El canto pasa de un gorgeo con gran variedad nivel superior: especiede sılabas a un canto estabilizado nivel inferior: anatomica y celularcon menor numero de sılabas

Desarrollo del Inicialmente se producen conexiones sinapticas nivel superior: especiesistema nervioso supernumerarias y luego se produce una atricion nivel inferior: celularcentral de conexiones y sinapsis inutiles

Si bien los ejemplos dados estan extraıdos de la biologıa no es difıcil extender estasideas a esquemas de organziacion social. Sin animo de profundizar en estas ideas se puedeconsiderar que existen ejemplos de procesos anodados de evolucion y de adaptacionde en elseno de la misma soociedad: una empresa puede abarcar mas funciones asociandose con otray ganando de esa manera en complejidad. Una sociedad puede ganar complejidad creandoinstituciones encargadas de tareas o funciones especıficas constituyendo ası subsistemasespecializados. Este proceso tiene luigar en lapsos que son ciertamente mas prolongadosque aquellos en los que ocurren los cambios en cada uno de esos subsistemas particulares.

Puede pensarse que el marco normativo fundamental que define la organizcion de todala sociedad esta dado por sus documentos constitutivos. Las adaptaciones mas frecuentes deaspectos menos generales que hacen a su funcionamiento tienen lugar con la promulgacion deleyes hcho que tiene lugar mas fecuentemente que la redaccion de un texto constitucional.Por su parte, los aspectos administrativos mas cotidianos se atienden por resoluciones yreglamentos que son suceptibles de cambios mucho mas frecuentes.

TABLA II

Sistema Tiempo de adaptacion

Sistema Inmune De horas a dıas

Canto de aves Dıas

Sstema nervioso central De segundos a anos

Empresas De meses a anos

Epecie De dıas a siglos

Ecosistema De anos a milenios

Sociedad De decadas a siglos

Notas

‡1 La “telarana” con multiples agentes En este ejemplo se muestra un modelo de coordinacion entremultiples agentes que participan descentralizadamente en el mercado y deben ajustar su produccion paracompensar excesos o defectos de demanda. Como se obsevara enseguida, este ejemplo de “telarana” puedereducirse al problema de la concurrencia al Bar que se menciona en la seccion 7.3.2. Supondremos unescenario que consta de los siguientes elementos:

1. Un conjunto de N pescadores (productores) que, cada dıa, salen a pescar.

2. Cada pescador posee un plan de pesca que cubre el presente y los subsiguientes d dıas.

3. Cada dıa la totalidad de pescadores aporta su pesca a un mercado en que todo el volumen es rematadoobteniendo un precio P (no hay acumulacion de stocks).

4. La utilidad de cada pescador es el dinero que recibe por la venta de su produccion menos su propiocosto de produccion.

5. Los pescadores ajustan sus planes de pesca con el objeto de optimizar su utilidad (ajustan su pro-duccion por tanteo)

Modelos economicos de multiples agentes 23-06-2011

NOTAS 191

Los pescadores actuan de manera descentralizada y se supone que desconocen la curva de demanda.Se supone que esta es tal que el precio P tiende a cero con una pesca creciente. Para elaborar el ejemplonumerico se ha supuesto que:

P =Po

QβT(7.11)

donde QT es la cantidad total de pesca y β = 1/2 asegura que P → 0 cuando QT →∞. Se supone ademasque cada pescador recibe una utilidad Ui luego de afrontar una funcion de costo que es creciente con la pescarealizada. Ponemos:

Ui = PQi − Ci (7.12)

donde Qi es la pesca del i−esimo pescador (QT =PQi) y Ci su costo que se toma como Ci = aiQ

αi con ai

una constante propia de cada pescador y α > 0 para asegurar que diverja con Qi →∞.

Para posibilitar el proceso de optimizacion se puede encarar este modelo siguiendo un esquema entera-mente similar al que se describe para resolver el BAM. Para ello se supone que cada pescador posee un plande pesca vigente que es el que pone en practica y posee ademas una poblacion de otros planes alternativos.El cumplimiento de los planes vigentes de todos los pescadores es lo que determina el volumen de pescadoque se remata cada dıa. Esa es la unica informacion que recibe cada uno de los agentes acerca de la conductaseguida por los restantes participantes del mercado.

Los planes de pesca pueden representarse como cadenas de numeros (en el ejemplo numerico se utilizaronenteros) tan largas como el numero de dıas de duracion del plan. La poblacion de planes puede pues adaptarseperiodicamente evocando un algortimo genetico en el que cada genoma esta representado por los planes depesca. La “fitness” del plan de pesca vigente es la utilidad realmente obtenida y la de los planes alternativoses la que el pescador habrıa obtenido de haberlo puesto en practica.

En cada jornada de mercado, cada pescador es seleccionado aleatoriamente y con una probabilidad ppara que evoque un algoritmo genetico y actualice sus planes. Es preferible la seleccion aleatoria de agentespara evitar un efecto irreal de manada como se comento mas arriba con referencia al BAM. En la figura 7.13

Figura 7.13: Equilibrio de oferta y demanda en el mercado de pesca. Seha supuesto 4 pescadores, cada uno con un total de 10 planes de pescade 4 dıas de duracion.

se muestra el equilibrio entre la oferta total y demanda total de pesca, comenzando con agentes con planes depesca aleatorios. En este ejemplo la optimizacion de la utilidad conlleva la coordinacion de planes de pescaentre distintos pescadores. Esta es mas evidente en el caso sencillo en el que se supone una simetrıa totalentre todos los pescadores asignando a todos la misma funcion de costo, esto es ai = a,∀i. Esto hace quela pesca total sea repartida por igual entre todos los pescadores. Este reparto surge del ejemplo numericotal como se puede observar en la figura 7.14. Un argumento para justificar este resultado solo basado enla simetrıa entre agentes puede conducir a equivocaciones. En el BAM existen las mismas condiciones desimetrıa ya que todos los concurrentes al Bar son identicos y poseen iguales funciones de utilidad. A pesarde ello convergen a planes de concurrencia que son diferentes entre si. En el ejemplo presente aun cuando

Modelos economicos de multiples agentes 23-06-2011

192 NOTAS

la simetrıa y las condiciones iniciales son semejantes la convergencia a planes identicos se produce ademaspor la dependencia que posee el precio con la conducta agregada de los agentes (el volumen total de pesca)y la relacion que tiene la utilidad que recibe cada uno con ese precio. El modelo computacional no tiene

Figura 7.14: Panel de la izquierda: reparto de la pesca total entre 4pescadores con la misma funcion de costo. Observe el quiebre de laescala vertical en el eje de la izquierda. Panel de la derecha: reparto dela pesca entre pescadores con distintas funciones de costo Ci = aiQ

2.75i

con ai = (0.10, 0.11, 0.12, 0.13).

requerimientos de ninguna naturaleza sobre la homogeneidad o heterogeneidad de los agentes. En el panelde la derecha de la figura 7.14 se muestran los resultados para el caso en que las constantes ai son diferentesentre si. Tal como es de esperar a mayores costos menor participacion en el mercado.

En la figura 7.15 se muestran algunos resultados adicionales. En el panel de la izquierda se muestra elefecto de incrementar la cantidad de agentes preservando la simetrıa entre todos. Las tres curvas correspon-den a la pesca total obtenida por 1,4 y 8 pescadores. Es interesante el resultado paradojico que el equilibriose alcanza antes justamente cuando el problema de coordinacion involucra a una mayor cantidad de agentes.En el panel de la derecha se muestra el proceso de tanteo para el caso en que todos los pescadores poseen lamisma funcion de costo C = aQαi pero α = 3.0, 2.75, 2.5 y 2.0 respectivamente. Debe observarse que en elcaso en que α = 2.0 el proceso de tanteo no converge. El ejemplo numerico reproduce ese hecho y, ademasla convergencia es tanto mas lenta cuanto mas proximo es el exponente a ese valor.

Bibliografıa

Axelrod, R. and Forrest, S.: 1987, The evolution of strategies in the iterated prisonerdilemma, in L. Davies (ed.), Genetic Algorithms and Simulated Annealing, Los AltosCal. Morgan Kauffmann, pp. 1390–1396.

Dawkins, R.: 1976, The Selfish Gene, Oxford Univ. Press, Oxford.

Holland, J.: 1975, Adaptation in natural and artificial systems, University of MichiganPress, Ann Arbor.

Holland, J.: 1995, Hidden Order: How adaptation builds complexity, Helix Books, AddisonWesley Publishing Company Inc.

Nowak, M.: 2006a, Evolutionary Dynamics, Harvard University Press, Cambridge, MA.

Nowak, M. A.: 2006b, Five rules for the evolution of cooperation, Science 314, 1560–1563.

Modelos economicos de multiples agentes 23-06-2011

7.7 Bibliografıa 193

Figura 7.15: Panel de la izquierda: Equilibrio con un numero crecientede agentes. Resultados con 1, 4 y 8 agentes. Panel de la derecha: Tanteocon diferentes funciones de costo C = aQαi para α variable.

Sober, E. and Wilson, D.: 1998, Unto others, the evolution and psychology of unselfishbehavior, Harvard University Press.

Modelos economicos de multiples agentes 23-06-2011

194 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Capıtulo 8

Modelo de formacion de precios,comportamiento y experimentos

Una de las aplicaciones mas atractivas y estimulantes de los sistemas complejos a la economıa,es el problema de la formacion y funcionamiento de los mercados. Este problema, cen-tral en la economıa, pone en contacto los aspectos estrategicos de toma de decisiones queenfrenta un individuo o firma, con los aspectos sociales de multiples interacciones entreagentes. Visto como un sistema complejo, podemos decir que un ’mercado’ no es mas quela propiedad emergente de las interacciones que realizan un conjunto de agentes utilizandorecursos limitados tanto fısicos como temporales. En este esquema, la ’competencia’ corre-sponde al proceso adaptativo que los individuos ejercitan para permanecer en el mercado yno desaparecer (nuevamente por la finitud de los recursos).

En este capıtulo nos concentraremos en un modelo sobre formacion de precios en unmercado descentralizado, donde los recursos productivos son costosos y finitos. Bajo estascondiciones, se sabe que el mercado no tiene un equilibrio de Nash sencillo (en estrategiaspuras), por lo que queda abierta la pregunta de que es lo que sucede en entornos exper-imentales. En particular, es un caso de estudio de un sistema economico intrınsicamentefuera del equilibrio.

Este capıtulo esta basado en (Heymann, Kawamura, Perazzo and Zimmermann, 2010;Heymann, Kawamura, Perazzo and Zimmermann, 2011).

8.1 Introduccion

Una parte significativa de las compraventas cotidianas de bienes de consumo tienen lugarentre los demandantes y firmas que deciden precios sin ser de gran tamano, y cuyas posi-bilidades de oferta, en lo inmediato, estan limitadas por restricciones de capacidad. Losmodelos usuales de competencia monopolıstica (a la Dixit y Stiglitz, (Dixit and Stiglitz,1977), vease tambien las referencias de (Tirole, 1988)) suponen que el “poder de mercado”de las firmas surge de caracterısticas tecnologicas (en cuanto a la imperfecta sustituibilidadde los bienes, por ejemplo), que generan funciones de demanda cuya elasticidad- precio es unparametro estructural, conocido por las empresas. Por lo tanto, al momento de determinarel margen de precio sobre costo, cada oferente lo harıa con pleno conocimiento de la formaque toma la disyuntiva entre el beneficio por unidad y el volumen de ventas.

En la practica, obtener dicha funcion de demanda no es sencillo. La actividad de losoferentes en situaciones tıpicas implica comportamientos de “busqueda de precios” (Alchian

195

196 8. Modelo de formacion de precios, comportamiento y experimentos

and Allen, 1963) en un entorno en que la configuracion del mercado y el funcionamiento delproceso competitivo se determinan y varıan en funcion de las conductas de los agentes queparticipan en los intercambios. Este tipo de interacciones parece naturalmente abordable apartir de modelos de multiples agentes, cuyos resultados pueden ponerse en correspondenciacon aquellos derivados de experimentos.

A continuacion se presenta un modelo de mercado donde las firmas compiten a travesde la fijacion de precios, y enfrentan restricciones de capacidad. El planteo se reduce altradicional problema de competencia a la Bertrand discutido por (Edgeworth, 1897), yque ha sido objeto de discusion en la literatura, con enfoques teoricos (Maskin, 1986) yexperimentales (vease, por ejemplo, (Kruse, Rassenti and Smith, 1994; Noel, 2004), y lostrabajos resenados en (Davies and Holt, 1992)).

Lo interesante de este problema, es que el juego no admite un equilibrio en estrate-gias puras, donde cada firma elige su precio de venta y es la mejor respuesta dado lo quelos demas competidores jugaron (Tirole, 1988). Bajo estrategias mixtas, (Maskin, 1986)mostraron que el juego si tiene un equilibrio. Estos resultados teoricos, se basan en unainformacion completa sobre lo que juegan los jugadores. Esta variante fue estudiada enentornos experimentales, y varios son los autores que no pudieron confirmar la convergenciadel precio promedio experimental, al equilibrio de Nash en estrategias mixtas (ver (Kruseet al., 1994)).

En este capıtulo exponemos nuestros resultados teoricos y experimentales. Por unlado estudiamos teoricamente el problema bajo estrategias puras, obteniendo un limite a lacompetencia, donde a cada firma le es provechoso reducir precio para maximizar su beneficio.Por el otro, plantemos estudiamos un escenario extremo donde la informacion es parcial ycada firma solo conoce sus precios y no de sus competidores. En este escenario parece quelo mas sensato es que las firmas pongan precios segun alguna heurıstica. Proponemos dosheurısticas que son luego contrastadas experimentalmente.

8.2 Juego de Bertrand-Edgeworth: construccion bottom-up

El funcionamiento del mercado en que se desarrolla el juego esta especificado de la siguientemanera:

• Los intercambios se desarrollan en ”dıas de mercado” o perıodos, autocontenidos. Noexisten activos, reales o financieros, que permitan trasladar recursos de un perıodo aotro.

• La oferta del bien proviene de N firmas, cada una de las cuales puede producir hastaun maximo de y∗ unidades (uniforme para todas las firmas), con un costo marginalunitario estrictamente positivo c. En este ejercicio, (y∗, c) son iguales para todos losoferentes.

• Antes de iniciarse el perıodo de mercado t, cada firma i anuncia un precio pit alcual se compromete a proveer el bien, sujeto al lımite de capacidad. Las firmasproducen “sobre pedido”, es decir que la cantidad producida se determina luego deque se establece la demanda dirigida a cada una de ellas. De esta manera, en estaformulacion prescindimos por el momento de preocuparnos de inventarios y decisionessobre reabastecimiento futuro.

Modelos economicos de multiples agentes 23-06-2011

8.2 Juego de Bertrand-Edgeworth: construccion bottom-up 197

• Se asume que el objetivo de la firma es la maximizacion de beneficios. Si la firma irecibe pedidos por la cantidad zit, sus ventas son: xit = min[zit, y

∗], y los beneficios:bit = (pit − c)xit.

• La demanda agregada por el bien se supone dada, de manera muy simple, por ungasto planeado por perıodo M , constante, independientemente de la historia previa yrealizada por un unico consumidor‡1. En cada perıodo el consumidor intenta gastarla totalidad de su gasto planificado M , visitando las firmas en el orden η(

pit

),comprando la totalidad de la produccion y∗, hasta agotar por completo su gastoplanificado M o visitar todas las firmas. Puede ocurrir que los precios

pit

anunciadospor las firmas no sea posible concretar todo el gasto planeado; el hecho no influye sobrela demanda en perıodos subsiguientes (es decir, por hipotesis, el gasto no realizado nose “traslada” al futuro).

• Al momento de fijar los precios, se supone que el conjunto de informacion de cadafirma consiste en la historia de sus propias transacciones: Ωi

t =piτ , x

iτ , z

τ<t

, in-cluyendo en particular, si los hubiera, a los pedidos no abastecidos por restriccionesde capacidad. No hay informacion global, o conocimiento sobre los precios y ventasde otras firmas.

La aproximacion de un solo comprador utilizada en esta formulacion, descansa enque todos los compradores tienen pleno conocimiento de los precios anunciados

pit

, y quetodos desean visitar a las firmas en el estricto orden de precios ascendentes η(t). Bajo estascircunstancias, no importa como se organicen los consumidores en visitar cada firma (seasincronica, asincronica, aleatoria o orden fijo), el resultado es que la demanda percibidapor las firmas es la equivalente a la de un solo comprador por la totalidad M de la masade dinero que los consumidores disponen como gasto planificado, y en cada perıodo solouna firma vende y < y∗. Esta aproximacion simplifica notablemente el tratamiento de lademanda, ’difiriendo’ el problema de ’quien le compra a quien’ para un futuro refinamientodel modelo original‡2‡3.

Precio de mercado competitivo

En este juego se puede encontrar un precio de mercado competitivo que corresponde sim-plemente al gasto planeado por el comprador dividido la produccion total del mercado:

p∗ =M

Ny∗(8.1)

En lo que sigue suponemos que el costo c > 0 de cada bien, satisface p∗ > c > 0, o

M > cNy∗ > 0 (8.2)

si no estamos en un caso particular no muy interesante.

Ahora, este precio de mercado no es un equilibrio de Nash. Supongamos que todaslas firmas proponen vender al precio p∗, recibiendo su fraccion M

N del gasto planeado delcomprador y un beneficio

b∗ = (p∗ − c)y∗ =M

N− cy∗ (8.3)

Cada una, preferira aumentar su precio p, para disminuir sus ventas y < y∗ tal que obtengala misma fraccion del gasto planificado del comprador M

N = p y, pero que redunda en lafirma en un beneficio (p− c)y > b∗ porque los costos totales c y son menores‡4.

Modelos economicos de multiples agentes 23-06-2011

198 8. Modelo de formacion de precios, comportamiento y experimentos

8.2.1 Precios Bertrand, inexistencia de Nash en estrategias puras

Analizamos con mas detalle el caso de la inexistencia del equilibrio de Nash en estrategiaspuras. Sea p′ el precio (uniforme) fijado por N − 1 firmas, o equivalentemente, p′ el preciopromedio de las N−1 firmas mas baratas del mercado. Se trata de estudiar el precio optimodel N - esimo oferente, dado que conoce p′.

Si las N − 1 firmas venden, la demanda residual sera R ≡ M − (N − 1)p′y∗ =[Np∗ − (N − 1)p′]y∗. De aqui el gasto remante podra ser positivo o negativo:

• Sea R < 0, es decir p′ > NN−1p

∗. En ese caso, las N − 1 firmas mas baratas no todasvan a lograr vender la capacidad maxima, y la firma N -esima, no importa su preciop, obtendra ventas y beneficios nulos. Por lo tanto su mejor estrategia es bajar suprecio p.

• Sea R > 0, o bien, p′ < NN−1p

∗. En este caso la N -esima firma puede realizar ventaspositivas. Tiene que analizar la situacion de poner un precio “infinito” (que implicanventas nulas, por lo tanto costos nulos), frente a poner un precio “algo inferior” a p′.Si comparamos los beneficios respectivos resulta:

π∞ = py = R =(Np∗ − (N − 1)p′

)y∗

πp′ = (p′ − c)y∗ (8.4)

donde para π∞, el valor de todas las ventas py es igual a la demanda residual R.

Para que la N -esima firma obtenga mayores beneficios aumentando el precio, se debecumplir la condicion π∞ > πp′ :(

Np∗ − (N − 1)p′)y∗ > (p′ − c)y∗ (8.5)

o sea:p′ < p∗ +

c

N(8.6)

Entonces, las decisiones optimas del N -esimo oferente dependen crıticamente del pre-cio de sus competidores, p∗, c y N :

• (p, y)→ (∞, 0) si p∗ < p′ < p∗ + cN

• p = p′ − ξ, y = y∗ (ξ ”infinitesimal ”) cuando p′ > p∗ + cN

Es interesante notar que en este escenario de “competencia” con plena informacionde precios entre firmas, la misma tiene un umbral pedge ≡ p∗ + c

N debajo por el cual yano es conveniente seguir rebajando. Estas condiciones generarıan un “ciclo”, introducidoen el duopolio analizado por (Edgeworth, 1897): si los precios del conjunto de las firmasson “altos” (respecto de la cota p∗ + c

N ), habrıa incentivos para “rebajas competitivas” deprecios, que reducirıan el nivel medio por debajo del lımite, e inducirıan a alguna firma a“saltar” a un precio alto, dando lugar a un ciclo. Al respecto, se observa que el precio mediopedge es un lımite para el tipo de ajuste preferido por la firma “residual”, pero no calificacomo posible punto de reposo, porque ahı, el oferente N no prefiere “quedarse”, sino quees indiferente entre una pequena disminucion y un gran aumento.

Modelos economicos de multiples agentes 23-06-2011

8.3 Competencia sin informacion 199

8.3 Competencia sin informacion

La discusion anterior enfatiza la imposibilidad de que firmas informadas, puedan mantenerun estado de reposo donde los precios sean constantes y uniformes. Serıa concebible que loscomportamientos se coordinen en un equilibrio de Nash en estrategias mixtas (que, de todosmodos, estarıa caracterizado observacionalmente por precios heterogeneos y cambiantes enel tiempo por parte de firmas individuales), donde dada una distribucion de probabilidad,las firmas hacen fluctuar sus precios logrando una situacion de precio constante en promedio.

Sin embargo, para un entorno donde los agente no conocen el precio de sus competi-dores, no resulta claro como harıan los agentes para identificar esos (nada simples en estainstancia) comportamientos aleatorios, y converger unanime y automaticamente a aplicar-los, dado que en el juego no tienen la posibilidad de conocer ni los precios ni ventas de suscompetidores. Por otra parte, en una situacion donde no existen “puntos focales” obviospara guiar las conjeturas de los agentes respecto de las conductas de los otros, la busquedade acciones optimizadoras se enfrentarıa a la dificultad para formar expectativas fundadasacerca del entorno (de manera de aproximar la “elasticidad de demanda” que enfrenta lafirma).

A continuacion se exploran formas de representacion del proceso de competencia enel contexto donde los agentes no tienen informacion de sus competidores, a traves de simu-laciones de conjuntos de firmas que aplican reglas de decision simples, o comportamientosheurısticos.

8.3.1 Heurıstica “Brutus”

Entre las heurısticas elementales, un conjunto particularmente sencillo, que denominado“Brutus” serıa el de las reglas que ajustan los precios automaticamente en funcion de losvolumenes de venta observados. Un ejemplo de criterio, con “corta memoria” es el quedeterminarıa una suba de precios, en modulo γ+, cuando las ventas realizadas en el perıodoanterior igualan a la capacidad y∗; y unas baja de precios, en modulo γ−, cuando las ventasrealizadas son inferiores a la capacidad. Se puede ver que un parametro importante vienedado por el cociente entre los modulos de ajuste γ = γ+/γ−. Si cada oferente comienzacon un precio aleatorio mayor a c, la evolucion temporal del sistema lleva a que aquellasfirmas que comenzaron con precios muy altos los disminuyan rapidamente (pues sus ventasson nulas), mientras que aquellas que comenzaron con precios muy bajos los aumentencontinuamente, hasta llegar a un estado estacionario macroscopico donde todas los preciosde las firmas se mueven en una banda de valor medio pm = (1 + γ)p∗, y ancho γ−/2 (comoantes, p∗ es el precio de equilibrio competitivo), y donde una fraccion 1/(1 + γ) de lasfirmas venden la totalidad de su capacidad y∗, mientras que el complemento no realizaventas. Se observa que, dado el caracter mecanico de la regla, para un dado γ, si bien lasfirmas “compiten por ventas”, el precio medio del mercado no depende de la cantidad Nde oferentes.

Para ilustrar el referido estado estacionario sea, por concrecion, un numero naturalγ < 1. Los precios de las firmas se ubicarıan en 1 + γ “capas”: las firmas en las γ capassuperiores no venden, y en el perıodo siguiente, bajan el precio en una cantidad γ−; lacapa inferior vende y∗, y decide un salto de precios +γ+, con lo que “sustituye” a lasfirmas que antes tenıan el precio mas alto. La imagen es la de una “cinta transportadora deprecios”, que genera una distribucion fija aun cuando los precios individuales varıan perıodoa perıodo. Las simulaciones del modelo (ver fig. 8.1) muestran que hay convergencia a un

Modelos economicos de multiples agentes 23-06-2011

200 8. Modelo de formacion de precios, comportamiento y experimentos

estado de esas caracterısticas, donde el precio medio fluctua alrededor del valor estacionarioy los precios individuales siguen el comportamiento recien descrito.

1.00

1.23

1.45

1.68

1.90

0 25 50 75 100

SALES BASED MODEL

t

Pedge P1 Pave Pmax Pmin

Figura 8.1: Evolucion temporal del precio promedio (pave) del mer-cado, su valor maximo (pmax) y mınimo (pmin) utilizando la heurıstica“Brutus”. Tambien se muestra el precio de un solo vendedor (PI),mostrando su comportamiento mecanico, y el pedge = p∗ + c/N . No-tar que p ' 1.20 ' (1 + γ+/γ−). Parametros: N = 10, p∗ = 1, c =0.75, γ+ = 0.02, γ− = 0.10. Los precios iniciales fueron elegidos al azarentre [p∗, 2p∗].

8.3.2 Heurıstica “MaxBene”

La regla de decision utilizada en las simulaciones anteriores condiciona los precios a lasventas realizadas, pero no directamente a los beneficios. Se pueden explorar, como alterna-tiva, criterios adaptativos que inducirıan variaciones de los precios tales que: (a) el signodel cambio se determina de acuerdo a la direccion del gradiente de beneficios que la firmaviene registrando, (b) el modulo del ajuste es proporcional a la variacion pasada en losbeneficios y (c) la regla de formacion de precios incluye un pequeno termino estocastico quepermite a la firma “tantear” en busqueda de oportunidades de incrementos de beneficios.Dicho “tanteo” sera mas importante cuando los modulos de ajuste (b) son casi despreciables(cuando se esta cerca de un maximo local de beneficios). El criterio del gradiente (a) im-plica, por ejemplo, que se subirıan precios si en el perıodo anterior se elevaron los precios yaumentaron los beneficios, o bien los precios se redujeron y tambien los beneficios (en otrosterminos, los ajustes de precios tendrıan el signo del producto de la variacion de precios yde la variacion de beneficios del perıodo anterior).

Habrıa muchas maneras de probar esta regla. Por ahora la especificamos como:

pit+1 = pit + δ(pt − pt−1)|pt − pt−1|

(bt − bt−1) +ε(ξ − 1), si yt = 0, yt−1 = 0ε(ξ − 1/2), caso contrario

(8.7)

Modelos economicos de multiples agentes 23-06-2011

8.3 Competencia sin informacion 201

donde ξ ∈ [0, 1] es una variable aleatoria uniforme. El primer termino es una medida delcambio de beneficio actual, con el cambio de precios realizado; si la cantidad es positiva,indica que el cambio de precios fue efectivo y vuelve a proponer un cambio de preciosproporcional a ese cambio; si en cambio, el cambio no fue efectivo, busco en precios masbajos. La regla tambien resuelve el caso que el agente no perciba cambios en su beneficio,tanto porque ∆bt = 0 o ∆pt = 0. Por lo tanto, agentes que logran obtener un maximo ensus beneficios a un perıodo, no cambiaran de precios. Aca introducimos una variante de’tanteo’ aleatorio que se hace importante cuando el agente esta cercano a su maximo local.

0.9

1.1

1.3

1.5

1.7

1.9

0 75 150 225 300

MAX BENEFIT BASED MODEL

t

Pedge P1 Pave Pmax Pmin

Figura 8.2: Evolucion temporal de los precios de mercado con heurıstica“MaxBene”. La condicion inicial fue aleatoria en el intervalo [p∗, 2p∗].Notar que el precio promedio fluctua por encima de p∗ y cuando superapedge = p∗+ c/N tiende a disminuir, logrando fluctuaciones alrededor depedge. Parametros: N = 10, p∗ = 1, c = 0.75, δ = 0.4, ε = 0.05.

La simulacion numerica del mercado con firmas que aplican esta regla de decisionmostro que, si el termino estocastico es nulo, el sistema tiende a que todos los agentes se“congelan” en un nivel de precios, y no explora situaciones mas ventajosas. La dependenciadel valor numerico del cambio de precios respecto del cambio del valor de los beneficios(elemento (b) de la regla de decision) permite que la firma “calibre” la intensidad de losajustes, lo que se refleja en las utilidades que se obtienen en las simulaciones.

En la fig. 8.2 se muestra la simulacion de agentes utilizando esta heurıstica, partiendode una condicion inicial similar a la de las simulaciones de la fig. 8.1. La traza temporal paraun solo agente, se observa que en terminos generales es muy parecida al caso de formacionde precios “Brutus” (fig. 8.1), donde a medida que logra vender todo, y dado que aumentoprecios, continua aumentando precios. Esto se ve limitado por la restriccion monetaria yde capacidad de las firmas, con los que cuando en un perıodo no vende, la firma obtiene un∆bt < 0 y baja indefectiblemente su precio. En este mercado, los agentes bajan su precioproporcional a δbt−1 = δ(p− c) (si vendieron todo en t− 1).

Una diferencia importante que subyace en el modelo de beneficios, es que la com-binacion de busqueda de maximo local que ofrece el tanteo aleatorio y ∆bt, es que si la

Modelos economicos de multiples agentes 23-06-2011

202 8. Modelo de formacion de precios, comportamiento y experimentos

0.9

1.1

1.3

1.5

1.7

1.9

850 940 1030 1120 1210 1300

t

Pedge P1 Pave Pmax Pmin

0.9

1.1

1.3

1.5

1.7

1.9

0 375 750 1125 1500

MAX BENEFIT BASED MODEL

t

Pedge P1 Pave Pmax Pmin

A

B

Figura 8.3: Evolucion temporal de los precios de mercado con heurıstica“MaxBene” con pocos jugadores. La condicion inicial fue aleatoria enel intervalo [p∗, 2p∗]. Notar que las fluctuaciones con menos firmas sonmas grandes. El panel A muestra la simulacion completa, mientras queel panel B muestra t ∈ [850, 1300], mostrando una escalada de preciosmuy similar a los ciclos de Edgeworth. Parametros: N = 3, p∗ = 1, c =0.75, δ = 0.2, ε = 0.05.

Modelos economicos de multiples agentes 23-06-2011

8.3 Competencia sin informacion 203

cantidad de firmas es suficientemente pequena, se observan fenomenos oligopolicos. En lafig. 8.3 se muestra un experimento numerico donde hay solo 3 firmas. En esta situacion semuestra como 2 agentes pueden vender a toda capacidad y aumentar significativamente suprecio por arriba de p∗, a costa de que el agente de precio mas alto venda menos que sucapacidad maxima. Estas escaladas de precios, y luego sus posteriores caidas, se acemejana los ciclos de Edgeworth.

8.3.3 Competencia entre modelos de formacion de precio

Los dos modelos de formacion de precio descriptos tienen algunas caracterısticas parecidas,y otras no. A priori, resulta tentantivo pensar que las firmas que forman precios con“MaxBene” deberıan poder lograr un mejor beneficio si se encuentran con firmas “Brutus”,debido a que los primeros, en principio, son capaces de detectar una oportunidad de mercadomediante el tanteo que realizan.

Figura 8.4: Comparacion del beneficio promedio de firmas “Brutus”contra firmas “MaxBene”. Se ve que para γ+ ≈ 0.1 ambos beneficios seacercan. Parametros del experimento: N = 40,M = 40, γ− = 0.15, δ =0.10, ε = 0.01, c = 0.15, y∗ = 1

En el siguiente experimento numerico, pusimos a competir una poblacion de firmas,donde la mitad son “Brutus”, y la mitad restante son “MaxBene”. Para este experimento seeligieron los valores de comportamiento de γ+/γ− = 1 de manera que el precio de equilibriotentativo para las firmas “Brutus” sin las firmas de la otra especie, serıa p∗brutus = 2. Elexperimento numerico muestra como el mercado encuentra un precio intermedio entre elde equilibrio competitivo que corresponderıa a firmas solo “MaxBene” y p∗brutus = 2. Lasfirmas “Brutus” mecanicamente forma un precio que siempre se ubica con precios en lamitad mas cara de todo el mercado, ’empujando’ el precio promedio del mismo por arribade lo que serıa si el mercado esta compuesto por firmas “MaxBene”, y por debajo si solohubiera firmas “Brutus”. En la fig. 8.4 se compara los beneficios de cada poblacion comofuncion de γ+. En lineas generales los beneficios de las firmas “MaxBene” son superiores a

Modelos economicos de multiples agentes 23-06-2011

204 8. Modelo de formacion de precios, comportamiento y experimentos

los de “Brutus”.

8.4 Experimentos

Las simulaciones con agentes representados por heurısticas son ilustrativas de compor-tamientos posibles, aunque dependen de parametros cuyos valores no estan especificadosen base a elementos de juicio fuertes, y la relevancia de sus resultados no esta estable-cida. Los experimentos “de laboratorio” con agentes reales en contextos artificiales puedenaportar elementos complementarios de aquellos modelos, y servir como instrumentos paravalidar, o no, la intuicion general de los comportamientos individuales propuestos, consid-erar posibles desvıos y, eventualmente, obtener informacion acerca del orden de magnitud delos parametros involucrados. Anteriormente ya se han realizado experimentos similares, ver(Kruse et al., 1994), donde no se pudo validar la hipotesis que los precios de los jugadoresseguıan una estrategia mixta.

Los resultados que se muestran a continuacion surgen de 10 experimentos realizadoscon hasta doce personas‡5, en que el conjunto de informacion de los participantes (estudi-antes de economıa) era su historia de transacciones dada por el precio y la cantidad vendida.A los participantes se les informo su costo (igual para todos) y el precio de mercado com-petitivo p∗. No conocıan, ni la cantidad de jugadores que participaban en el mercado,ni la cantidad total de iteraciones que jugarıan (100 en total). A diferencia de los otrosexperimentos practicados, los jugadores en ningun momento conocıan el precio de sus com-petidores, lo que hace imposible a los jugadores calcular el equilibrio de Nash en estrategiasmixtas (ejercicio en si mismo sumamente complicado).

0.85

1.06

1.28

1.49

1.70

0 20 40 60 80

EXP. #21

p /

p*

t

Pedge Pave Pmax Pmin

Figura 8.5: Series de tiempos sobre el precio promedio, maximo y mınimoofrecidos en el mercado (rescaleados con el valor de p∗). Tambien semuestra el precio de Edgeworth pedge = p∗ + c/N . Experimento #21,N = 6 jugadores.

Inicialmente se le sugirio a cada participante comenzar el juego con el precio de

Modelos economicos de multiples agentes 23-06-2011

8.4 Experimentos 205

mercado competitivo p∗. Lo que se observo fue que al inicio, todos los jugadores eligieronprecios por encima de p∗, y una gran variaciones de precio entre jugadores; gradualmentefueron convergiendo a un precio medio, siempre en un nivel mayor que competitivo delorden del 20%; las series individuales mostraron que cada jugador una vez encontrado unnivel determinado, fue variando sus precios solo ligeramente.

Durante este perıodo inicial de aprendizaje, los modulos de aumento γi+ y de dismin-ucion γi− de precios medidos sobre cada individuo i sufrieron una drastica reduccion. Engeneral, se observaron dos tipos de comportamientos: los jugadores que tenıan γi− ≈ γi+ yaquellos donde γi− γi+. Pese a la heterogeneidad de conductas, el precio promedio delmercado se mantuvo relativamente constante porque los jugadores convergieron a nivelesde precios alrededor de los cuales realizaban cambios pequenos dentro de un nivel escogido.

8.4.1 “Brutus” es una mejor aproximacion que “MaxBene”

Dado que tenıamos dos heurısticas distintas, nos preguntamos si los experimentos podıanconfirmar alguna de ellas como la potencialmente mas representativa. La prueba consistioen medir en cada sesion experimental cuantos jugadores se comportaron compatible conla heurıstica basada exclusivamente sobre ventas pasadas (“Brutus”) versus la cantidad dejugadores que se comportaron utilizando la heurıstica que combina cambio de beneficio ysigno de precio (“MaxBene”).

A tal fin, se estimaron para cada sesion experimental los coeficientes γ+ y γ− paracada jugador condicionado a ventas totales, o parciales. Se encontro que en las sesionescon mas de 4 jugadores mas del 58% de los jugadores se les pudo estimar los coeficientesestadısticamente significativo (al 10%). Haciendo el mismo ejercicio con el parametro δ de“MaxBene” (8.7), se encontro que a lo sumo 36% se les pudo estimar un coeficiente consignificancia del 10%, y en 6 sesiones de 10, no se encontro ninguna estimacion significativaa ningun jugador. Estas pruebas muestran que la heurıstica “Brutus” es potencialmentemucho mas realista para modelar la formacion de precio individual en el mercado tipoBertrand-Edgeworth.

8.4.2 Patrones generales de comportamiento

El analisis de los patrones de variacion de precios en funcion de las ventas para cada sesionexperimental genero observaciones interesantes. En la tabla 8.1 se muestras las probabili-dades de subir, bajar o mantener el precio en la proxima jugada contingente a que el jugadorvendio todo, una parte o nada en el perıodo anterior. En gran parte de los casos (mas del90%) en que los agentes vendieron menos que la capacidad, la respuesta fue una reduccionde precios. En cambio, con ventas iguales a la capacidad de produccion, se apreciaron subasde precios en 45% de los casos, mientras que los precios se mantuvieron constantes en el42% de esas instancias. Este patron general se observo en todas las sesiones experimen-tales, con variaciones en las probabilidades de aumentar o mantener el precio dado quevendieron todo, mostrando que las ventas del perıodo anterior condicionan fuertemente elcomportamiento de la jugada siguiente.

El experimento sugirio una variante de la heurıstica de precios en funcion de ventasutilizada en las simulaciones con agentes artificiales: cuando los jugadores consideran que suprecio pueda estar cerca del “maximo tolerable” para asegurarse ventas de plena capacidad,mantienen la oferta (una alternativa que “Brutus” carecıa). Una manera de incorporar esaconducta en el criterio de formacion de precios podrıa ser a traves de una regla estocastica,tal que si las ventas igualan y∗, el precio se ajusta hacia arriba con probabilidad h+, y

Modelos economicos de multiples agentes 23-06-2011

206 8. Modelo de formacion de precios, comportamiento y experimentos

∆pt+1 < 0 ∆pt+1 = 0 ∆pt+1 > 0 # of events

qt = q∗ 0.13 0.42 0.45 2000 < qt < q∗ 0.97 0.0 0.03 57qt = 0 0.94 0.02 0.04 43

Tabla 8.1: Promedio sobre jugadores de la probabilidad condicional P (∆pt+1; qt) delcambio de precios de la siguiente ronda ∆pt+1 = pt+1 − pt dado que el jugador vendiotoda su produccion qt = q∗, una cantidad parcial , 0 < qt < q∗, o cero qt = 0. Los eventosconsiderados fueron de las ultimas 50 jugadas del experimento #18 con N = 6 jugadoresy T = 100 jugadas en total.

permanece constante con probabilidad h0, mientras que se reducen si las ventas son masbajas que y∗. Con esta variante, es posible calibrar simulaciones cuyos resultados semejana los experimentales (ver fig. 8.6).

1.00

1.18

1.36

1.54

1.72

1.90

0 25 50 75 100

PROB. SALES BASED MODEL

t

Pedge P1 Pave Pmax Pmin

Figura 8.6: Serie temporal de precio simulando el modelo basado enventas estocastico. Precio promedio (pave), maximo (pmax) and mınimo(pmin) como funcion del tiempo, junto con una trajectoria de un agente(p1) y pedge = p∗ + c/N . Parametros: N = 10, p∗ = 1, c = 0.75, γ+ =0.02, γ− = 0.10, h0 = 0.45, h− = 0.0.

Si bien el analisis agregado nos sugirio que los agentes cuando venden todo, con unadeterminada probabilidad suben o mantienen el precio, analizamos que sucede a lo largo decadasesion experimental con dichas probabilidades. Para esto, se estimo h0(t), h−(t), h+(t)para toda la poblacion, tomando las 5 jugadas anteriores donde los jugadores vendierontoda la capacidad‡6. Lo que se observo en la mayorıa de las sesiones experimentales esque todas comenzaron con h0 cercanas a cero y h+ cercano a uno, pero durante la fase deaprendizaje los jugadores se tornaban mas cautelosos, terminando la mayorıa de las sesionesexperimentales con h0 altos y h+ mas moderados (ver fig. 8.7).

Modelos economicos de multiples agentes 23-06-2011

8.5 Conclusiones 207

0

0.25

0.50

0.75

1.00

0 20 40 60 80

H VS T

t

h- h0 h+

Figura 8.7: Serie temporal de las estimaciones sobre h−(t), h0(t), h+(t),medidas agregando y promediando las ultimas 5 iteraciones sobre aquellosjugadores que vendieron todo. Experimento #21.

8.5 Conclusiones

En este Capıtulo se avanzo sobre un modelo de mercado minimal, cuya principal carac-terıstica era su simplicidad frente al tipo de comportamiento esperado. El problema deformacion de precios formulado plantea preguntas no triviales, no obstante las simplifi-caciones sustanciales que se usaron al definir el contexto de intercambio. Los analisis desimulacion y aquellos basados en experimentos muestran complementariedades, y potencialpara generar resultados utiles.

Algunas heurısticas sencillas parecen aproximar rasgos salientes de los comportamien-tos experimentales; quedan por precisar aspectos de las conductas, como los modulos delos ajustes de precios, que son relevantes para definir las caracterısticas del desempenoagregado.

En el marco del modelo hay varios modos posibles para extender las simulaciones. Unade ellas serıa trabajar con heurısticas adaptativas, tales que los parametros de las reglasde decision son elegidos entre valores alternativos en funcion de los beneficios que generan;las simulaciones informarıan acerca de la evolucion posible de “ecologıas” de estrategiaspresentes en el mercado. Asimismo, son concebibles (a la manera de lo hecho por (Axelrodand Hamilton, 1981; Axelrod, 1984), para el dilema del prisionero repetido) ejercicios quecombinen simulacion y experimentos, en los que se ponen a operar algoritmos de formacionde precios propuestos por los participantes.

Por otro lado, a partir de la formulacion muy simple del mercado, surgen diversasformas de ampliacion, por ejemplo a traves de una representacion de busquedas por partede los consumidores (ver (Varian, 1980), (Llach, 2002) y un review reciente (Hopkins, 2008))lo que podrıa llevar a la configuracion de redes de proveedores y clientes. Esta formulacionpuede poner el foco en que pasa cuando los jugadores venden parcialmente, cosa que enla formulacion actual ocurre solo una vez por cada iteracion. La inclusion de decisionesintertemporales de las firmas (permitiendo produccion para inventario, en particular) ode los consumidores (e.g. si se contemplan acumulaciones o desacumulaciones del activomonetario), sin duda pueden complicar el analisis, y serıa aconsejable avanzar una vez que

Modelos economicos de multiples agentes 23-06-2011

208 NOTAS

se entienda bien todo lo anterior. De este modo, este esquema de analisis en equilibrioparcial se irıa extendiendo hacia uno de equilibrio general, en un “movimiento hacia lamacroeconomıa”, el cual parece un campo natural para el trabajo con modelos de multiplesagentes. De todos modos, parece conveniente que ese movimiento se realice de maneraacumulativa, a partir de resultados parciales obtenidos de formulaciones enfocadas sobreaspectos del problema.

Notas

‡1 Los demandantes se suponen tienen un comportamiento de busqueda super-competitivo. Aquı quelos consumidores acceden a informacion sobre todo el conjunto de los precios fijados antes de formular suspedidos, y no incurren en costos si tienen que visitar a varios negocios porque no fueron abastecidos en susensayos previos de compra. Esto permite que, a los efectos praticos, dicho conjunto de compradores operecomo si fuera un unico agente, que recorre el conjunto de los proveedores en orden de precios ascendenteshasta que, o bien se realiza el gasto deseado, o bien se agota la oferta disponible.

‡2Si se generaliza la aproximacion de un solo comprador a K consumidores que cada uno compra solo a unsubconjunto de las N firmas estableciendose una red bipartita, en este caso puede haber mas de una firmaque haga ventas parciales, como ocurre en la realidad.

‡3La literatura reciente sobre “dispersion de precios” en oligopolios, supone un costo para obtener in-formacion de los proveedores, por lo que los oferentes podran tener distintos precios. Ver (Varian, 1980),(Llach, 2002) y un review reciente (Hopkins, 2008).

‡4Esto muestra la importancia que la produccion tenga costo c > 0, pues si no existirıa un equilibrio deNash donde todos los jugadores venderıan a precio infinito, cantidades despreciables.

‡5Utilizamos una plataforma web desarrollada por nosotros www.elautomaeconomico.com.ar.

‡6Alternativamente se probo otra estimacion basada en cada individuo, y luego promediando las proba-bilidades asi obtenidas sobre todos los jugadores, dando resultados compatibles con el primer caso, aunquemas ruidosas.

Bibliografıa

Alchian, A. and Allen, W.: 1963, University Economics: Elements of Inquiry, WadsworthPublishing Company.

Axelrod, R.: 1984, The Evolution of Cooperation, Basic Books, New York.

Axelrod, R. and Hamilton, W. D.: 1981, The evolution of cooperation, Science 211, 1390–1396.

Davies, D. and Holt, C.: 1992, Experimental Economics, Princeton University Press, NewJersey, NY.

Dixit, K. and Stiglitz, J.: 1977, Monopolistic competition and optimum product diversity,American Economic Review 67, 297–308.

Edgeworth, F. Y.: 1897, La teoria pura del monopolio, Giornale degli Economisti .http://cepa.newschool.edu/het/texts/edgeworth/edgepapers.htm.

Heymann, D., Kawamura, E., Perazzo, R. and Zimmermann, M.: 2010, Modelos demultiples agentes, in O. Chisari (ed.), Macro a Micro.

Heymann, D., Kawamura, E., Perazzo, R. and Zimmermann, M.: 2011, Behavioral heuris-tics and market patterns in a bertrand-edgeworth game. Universidad de San Andres,mimeo.

Modelos economicos de multiples agentes 23-06-2011

8.5 Bibliografıa 209

Hopkins, E.: 2008, Price dispersion, in S. N. Durlauf and L. E. Blume (eds), The NewPalgrave Dictionary of Economics, 2nd Edition, Palgrave Macmillan, Basingstoke.

Kruse, J., Rassenti, S. and Smith, V.: 1994, Bertrand-edgeworth competition in experimen-tal markets, Econometrica 62, 343–372.

Llach, S.: 2002, Existence and persistence of price dispersion: An empirical analysis. Na-tional Bureau of Economic Research, Working Paper #8737.

Maskin, E.: 1986, The existence of equilibrium with price-setting firms, American EconomicReview 76(2), 382–386.

Noel, M.: 2004, Edgeworth price cycles, cost-based pricing and sticky pricing in retailgasoline markets. UCSD mimeo.

Tirole, J.: 1988, The Theory of Industrial Organizations, The MIT Press, Cambridge,Massachusetts.

Varian, H.: 1980, A model of sales, The American Economic Review 70(4), 651–659.

Modelos economicos de multiples agentes 23-06-2011

210 NOTAS

Modelos economicos de multiples agentes 23-06-2011

Bibliografıa

Capıtulo 1

Anderson, P.: 1972, More is different, Science 177(4047), 393–396.

Aoki, M. and Yoshikawa, H.: 2006, Reconstructing Macroeconomics. A perspective from Sta-tistical Physics and Combinatorial Stochastic Processes, Cambridge University Press,Cambridge.

Arthur, W. B.: 1994, Complexity in economic theory: Inductive reasoning and boundedrationality, AEA Papers and Proceedings 84, 406–411.

Axtell, R.: 1999, The emergence of firms in a population of agents: Local increasing returns,unstable nash equilibria, and power law size distributions. Brookings Institute preprintNo. 3.

Bak, P., Chen, K., Scheinkman, J. A. and Woodford, M.: 1993, Aggregate fuctuations fromindependent sectoral shock: Self-organized criticality in a model of production andinventory dynamics, Ricerche Economiche 47, 3–30.

BarYam, Y.: 2003, Dynamics of Complex Systems (Studies in Nonlinearity), Westview,Boulder.

Bonaneau, E., Theraulaz, G. and Dorigo, M.: 1999, Swarm Intelligence: From Natural toArtificial Systems, Santa Fe Institute Studies in the Sciences of Complexity, OxfordUniversity Press.

Camerer, C.: 2003, Behavioral game theory: Experiments on strategic interaction., Prince-ton University Press.

Castellano, C., Fortunato, S. and Loreto, V.: 2009, Statistical physics of social dynamics,Rev. Modern Physics 81(2), 591–646.

Chomsky, N.: 1990, Modular Approaches to the Study of the Mind, San Diego State Uni-versity, San Diego, USA.

Epstein, J. and Axtell, R.: 1996, Growing Artificial Societies: Social Science from theBottom Up, Brookings, Washington.

Gode, D. K. and Sunder, S.: 1993, Allocative efficiency of markets with zero intelligencetraders: Market as a partial substitute for individual rationality, Journal of PoliticalEconomy 101, 119–137.

Gul, F. and Pesendorfer, W.: 2005, The case for mindless economics. Princeton UniversityWorking Paper.

211

212 8. Bibliografıa

Heymann, D.: 2007, Desarrollos y alternativas: Algunas perspectivas del anlisis macroe-conmico, in D. Heymann (ed.), Progresos en Macroeconomıa, Editorial Temas.

Kahneman, D. and Tversky, A.: 2000, Choices, Values and Frames, Cambridge UniversityPress, Cambridge. (ed.).

Leijonhufvud, A.: 1981, Information and coordination: Essays in macroeconomic theory,Oxford University Press.

Lux, T. and Marchesi, M.: 2002, Special issue on heterogeneous interacting agents in financemarkets, Journal of Economic Behavior and Organization .

Mayr, E.: 1999, Towards a New Philosophy of Biology: Observations of an Evolutionist,The Belknap Press of Harvard University Press, Cambridge, UK.

Navarro, A.: 2008, Economıa, biologıa y evolucion. Conferencia Presidencial, AsociacionArgentina de Economıa Polıtica.

Samuelson, P. A.: 1960, Structure of a minimum equilibrium system, in R. W. Pfouts (ed.),Essays in Economics and Econometrics: A Volume in Honor of Harold Hotelling,University of North Carolina Press.

Schelling, T. C.: 1978, Micromotives and Macrobehavior, W. W. Norton & Company.

Smith, E. and Foley, D.: 2008, Classical thermodynamics and economic general equilibriumtheory, Journal of Economic Dynamics and Control 32, 7–65.

Szathmry, E. and Smith, J. M.: 1995, The major evolutionary transitions, Nature 374, 227–231.

Weiss, G.: 1999, Multiagent Systems. A Modern Approach to Distributed Artifical Intelli-gence, The MIT Press.

Capıtulo 2

Axelrod, R.: 1984, The Evolution of Cooperation, Basic Books, New York.

Nowak, M. A., Bonhoeffer, S. and May, R. M.: 1994, Spatial games and the maintenanceof cooperation, Proc. Natl. Acad. Sci. USA 91, 4877–4881.

Nowak, M. A. and May, R. M.: 1992, Evolutionary games and spatial chaos, Nature359, 826–829.

von Neumann, J. and Burks, A. W.: 1966, Theory of Self-Reproducing Automata, Universityof Illinois Press.

Wolfram, S.: 1984, Universality and complexity in cellular automata, Physica D 10, 1–35.

Wolfram, S.: 1986, Theory and applications of Cellular Automata, World Scientific.

Modelos economicos de multiples agentes 23-06-2011

3.5 Capıtulo 3 213

Capıtulo 3

Blume, L. E.: 1993, The statistical mechanics of strategic interaction, Games and StrategicBehavior 5, 387–424.

Castellano, C., Fortunato, S. and Loreto, V.: 2009, Statistical physics of social dynamics,Rev. Modern Physics 81(2), 591–646.

Daniels, M. G., Farmer, J. D., Iori, G. and Smith, E.: 2003, Quantitative model of pricediffusion and market friction based on trading as a mechanistic random process, Phys.Rev. Lett. 90, 108102.

Dragalescu, A. A.: 2003, Applications of physics to economics and finance: Money, income,wealth, and the stock market. e-print arXiv:cond-mat/0307341v2.

Dragalescu, A. and Yakovenko, V.: 2000, Statistical mechanics of money, Eur. Phys. J. B17, 723–729.

Dragalescu, A. and Yakovenko, V.: 2001, Evidence for the exponential distribution of in-come in the usa, Eur. Phys. J. B 20, 585–589.

Gordon, M.: 2003, An introduction to statistical mechanics, in P. Bourgine and J.-P. Nadal(eds), Cognitive Economics, Springer-Verlag.

Ising, E.: 1925, Beitrag zur theorie des ferromagnetismus, Zeitschr. f. Physik 31, 253–258.

Jaynes, M. O.: 1957, Information theory and statistical mechanics, Physical Review106(4), 620–630.

Khinchin, A. I.: 1949, Mathematical foundations of statistical mechanics, Dover, New York.

Kirkpatrick, S., Gelatt, C. D., Jr. and Vecchi, M. P.: 1983, Optimization by simulatedannealing, Science 220, 671–680.

Shannon, C. E.: 1948, A mathematical theory of communication, The Bell Systema Tech-nical Journal 27, 379–423, 623–656.

Silva, A. and Yakovenko, V.: 2005, Temporal evolution of the ”thermal” and ”superthermal”income classes in the usa during 1983-2001, Europhys. Lett. 69(2), 304–310.

Smith, E., Farmer, J. D., Gillemot, L. and Krishnamurthy, S.: 2003, Statistical theory of thecontinuous double auction, Quantitative Finance 3, 481514. e-print cond-mat/0210475.

Capıtulo 4

Bak, P., Chen, K., Scheinkman, J. A. and Woodford, M.: 1993, Aggregate fuctuations fromindependent sectoral shock: Self-organized criticality in a model of production andinventory dynamics, Ricerche Economiche 47, 3–30.

Bak, P., Tang, C. and Wiesenfeld, K.: 1999, Self-organized criticality, Phys. Rev. A38(16), 364–374.

Black, F. and Scholes, M.: 1973, The pricing of options and corporate liabilities, Journalof Political Economy 81(3), 637–654.

Modelos economicos de multiples agentes 23-06-2011

214 8. Bibliografıa

Kadanoff, L.: 1993, From Order to Chaos, Essays: Critical, Chaotic and Otherwise, WorldScientific.

Lintner, J.: 1965, The valuation of risk assets and the selection of risky investments in stockportfolios and capital budgets, Review of Economics and Statistics 47(1), 13–37.

Mantegna, R. N. and Stanley, H. E.: 1995, Scaling behviour in the dynamics of an economicindex, Nature 376(6), 46–49.

Mossin, J.: 1966, Equilibrium in a capital asset market, Econometrica 34, 768–783.

Newman, M. E. J.: 2005, Power laws, pareto distributions and zipf’s law, ContemporaryPhysics 46, 323–351. condmat/0412004v3.

Sharpe, W. F.: 1964, Capital asset prices: A theory of market equilibrium under conditionsof risk, Journal of Finance 19, 425–442.

Capıtulo 5

Adamic, L. A., Lukose, R. M., Puniyani, A. R. and Huberman, B. A.: 2001, Search inpower-law networks, Physica Review E 64, 046135.

Albert, R. and Barabasi, A.-L.: 2002, Statistical mechanics of complex networks, Rev.Modern Physics 4, 47–97.

Barabasi, A.-L.: 2003, Linked: How Everything Is Connected to Everything Else and WhatIt Means, Plume.

Barabasi, A.-L. and Albert, R.: 1999, Emergence of scaling in random networks, Science286, 509–512.

Bikhchandani, S., Hirshleifer, D. and Welch, I.: 1992, A theory of fads, fashion, custom andcultural change as information cascade, Journal of Political Economy 100, 992–1026.

Bikhchandani, S., Hirshleifer, D. and Welch, I.: 1998, Learning from the behavior of others:conformity, fads and informational cascades, The Journal of Economic Perspective12, 151–179.

Dodds, P. S., Muhamad, R. and Watts, D. J.: 2003, An experimental study of search inglobal social networks, Science 301, 827–829.

Granovetter, M.: 1975a, The strength of weak ties, Americal Journal of Sociology78(6), 1360–1380.

Granovetter, M.: 1975b, Threshold models of collective behavior, Americal Journal of So-ciology 83(6), 1420–1443.

Kleinberg, J.: 2000, Navigation in small world, Nature 406, 845.

Newman, M. E. J.: 2005, Power laws, pareto distributions and zipf’s law, ContemporaryPhysics 46, 323–351. condmat/0412004v3.

Pastor-Satorras, R. and Vespignani, A.: 2001, Epidemic spreading in scale-free networks,Phys. Rev. Lett. 86(14), 3200–3203.

Modelos economicos de multiples agentes 23-06-2011

6.5 Capıtulo 6 215

Schelling, T.: 1971, Dynamic models of segregation, Journal of Mathematical Sociology1, 143–186.

T. Gross, C. J. Dommar, D. L. and Blasius, B.: 2006, Epidemic dynamics on an adaptivenetwork, Physical Review Letters 96, 208271.

Watts, D. J.: 2002, A simple model of global cascades on random networks, Proc. NationalAcademy of Science 99(9), 5766–5771.

Watts, D. J. and Strogatz, S. H.: 1998, Collective dynamics of small-world networks, Nature393, 440–442.

Capıtulo 6

Evans, G. and Honkapohja, S.: 2001, Learning and Expectations in Macroeconomics, Prince-ton University Press.

Hertz, J., Krogh, A. and Palmer, R.: 1991, Introduction to the theory of neural computa-tion, in J.-J. Herings, A. Talman and G. van der Laan (eds), Lecture Notes Volume,Santa Fe Institute USA, Addison- Wesley Publ. Co., Reading Mass.

Heymann, D.: 2007, Desarrollos y alternativas: Algunas perspectivas del anlisis macroe-conmico, in D. Heymann (ed.), Progresos en Macroeconomıa, Editorial Temas.

Hopfield, J.: 1982, Neural networks: a physical system with emergent computational abili-ties, Proc. Natl. Acad. Sci. USA 79, 2254.

Keynes, J. M.: 1936, The General Theory of Employment, Interest and Money, MacmillanCambridge University Press.

McCulloch, W. and Pitts, W.: 1943, A logical calculus of the ideas immanent in nervousactivity, Bulletin of Mathematical Biophysics 5, 115–133.

Sargent, T. J.: 1993, Bounded Rationality in Macroeconomics: The Arne Ryde MemorialLecture, Clarendon Pr.

Capıtulo 7

Axelrod, R. and Forrest, S.: 1987, The evolution of strategies in the iterated prisonerdilemma, in L. Davies (ed.), Genetic Algorithms and Simulated Annealing, Los AltosCal. Morgan Kauffmann, pp. 1390–1396.

Dawkins, R.: 1976, The Selfish Gene, Oxford Univ. Press, Oxford.

Holland, J.: 1975, Adaptation in natural and artificial systems, University of MichiganPress, Ann Arbor.

Holland, J.: 1995, Hidden Order: How adaptation builds complexity, Helix Books, AddisonWesley Publishing Company Inc.

Nowak, M.: 2006a, Evolutionary Dynamics, Harvard University Press, Cambridge, MA.

Nowak, M. A.: 2006b, Five rules for the evolution of cooperation, Science 314, 1560–1563.

Sober, E. and Wilson, D.: 1998, Unto others, the evolution and psychology of unselfishbehavior, Harvard University Press.

Modelos economicos de multiples agentes 23-06-2011

216 8. Bibliografıa

Capıtulo 8

Alchian, A. and Allen, W.: 1963, University Economics: Elements of Inquiry, WadsworthPublishing Company.

Axelrod, R.: 1984, The Evolution of Cooperation, Basic Books, New York.

Axelrod, R. and Hamilton, W. D.: 1981, The evolution of cooperation, Science 211, 1390–1396.

Davies, D. and Holt, C.: 1992, Experimental Economics, Princeton University Press, NewJersey, NY.

Dixit, K. and Stiglitz, J.: 1977, Monopolistic competition and optimum product diversity,American Economic Review 67, 297–308.

Edgeworth, F. Y.: 1897, La teoria pura del monopolio, Giornale degli Economisti .http://cepa.newschool.edu/het/texts/edgeworth/edgepapers.htm.

Heymann, D., Kawamura, E., Perazzo, R. and Zimmermann, M.: 2010, Modelos demultiples agentes, in O. Chisari (ed.), Macro a Micro.

Heymann, D., Kawamura, E., Perazzo, R. and Zimmermann, M.: 2011, Behavioral heuris-tics and market patterns in a bertrand-edgeworth game. Universidad de San Andres,mimeo.

Hopkins, E.: 2008, Price dispersion, in S. N. Durlauf and L. E. Blume (eds), The NewPalgrave Dictionary of Economics, 2nd Edition, Palgrave Macmillan, Basingstoke.

Kruse, J., Rassenti, S. and Smith, V.: 1994, Bertrand-edgeworth competition in experimen-tal markets, Econometrica 62, 343–372.

Llach, S.: 2002, Existence and persistence of price dispersion: An empirical analysis. Na-tional Bureau of Economic Research, Working Paper #8737.

Maskin, E.: 1986, The existence of equilibrium with price-setting firms, American EconomicReview 76(2), 382–386.

Noel, M.: 2004, Edgeworth price cycles, cost-based pricing and sticky pricing in retailgasoline markets. UCSD mimeo.

Tirole, J.: 1988, The Theory of Industrial Organizations, The MIT Press, Cambridge,Massachusetts.

Varian, H.: 1980, A model of sales, The American Economic Review 70(4), 651–659.

Modelos economicos de multiples agentes 23-06-2011