158
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS F ´ ISICAS Y MATEM ´ ATICAS DEPARTAMENTO DE INGENIER ´ IA MATEM ´ ATICA Estudios experimentales y de modelaci ´ on en aprendizaje y cognici ´ on matem ´ atica Tesis para optar al grado de Doctor en Ciencias de la Ingenier ´ ıa menci ´ on Modelaci ´ on Matem ´ atica David Maximiliano omez Rojas Profesor Gu ´ ıa P ablo Dartnell Roy Miembros de la Comisi ´ on Servet Mart ´ ınez Aguilera Rafael Correa Fontecilla Roberto Araya Schulz Jorge Soto Andrade Pedro Rosas Henr´ ıquez Santiago de Chile Diciembre 2010

Estudios experimentales y de modelacion en aprendizaje y … · 2011. 5. 10. · CMM: Grecia Galvez, Jorge Soto, y otros que enriquecieron con sus diversos puntos de vista muchas´

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • UNIVERSIDAD DE CHILEFACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICASDEPARTAMENTO DE INGENIERÍA MATEMÁTICA

    Estudios experimentales y de modelaciónen aprendizaje y cognición matemática

    Tesis para optar al grado deDoctor en Ciencias de la Ingenierı́a

    mención Modelación Matemática

    David Maximiliano Gómez Rojas

    Profesor Guı́aPablo Dartnell Roy

    Miembros de la ComisiónServet Martı́nez AguileraRafael Correa Fontecilla

    Roberto Araya SchulzJorge Soto Andrade

    Pedro Rosas Henrı́quez

    Santiago de ChileDiciembre 2010

  • Resumen de la Tesis para optar al grado de Doctoren Ciencias de la Ingenierı́a mención Modelación Matemática

    Autor: David M. GómezFecha Examen: 21 de Diciembre de 2010

    Prof. Guı́a: Pablo Dartnell

    Estudios experimentales y de modelaciónen aprendizaje y cognición matemática

    En este trabajo se presenta una serie de estudios sobre aprendizaje y cognición numérica, desdeun enfoque mixto entre la modelación matemática y la experimentación psicológica.

    Se comienza analizando un modelo sobre memoria y aprendizaje, investigando los efectos deldecaimiento temporal de cada recuerdo en la capacidad de un agente ideal para estimar la probabilidadde ocurrencia α de un evento dado. Para esto, el agente construye un estimador (Qn) en el contextode un proceso estocástico a tiempo discreto, y la velocidad de decaimiento de cada recuerdo está dadapor una llamada función de olvido. El análisis es considerablemente más general que el realizado entrabajos previos, encontrándose clases de funciones de olvido que hacen que (Qn) converja a α conprobabilidades cero o uno. Se extiende algunos de estos resultados a casos en donde el agente debeestimar las probabilidades asociadas a un conjunto finito de eventos.

    Se revisa luego investigaciones sobre la capacidad de animales y humanos para representar mental-mente cantidades de objetos. Se plantea un problema de optimización para estudiar la recta numéricamental propuesta en la literatura como base de estas representaciones numéricas, suponiendo que estarecta numérica ha sido moldeada en un proceso evolutivo que tiende a maximizar la discriminabilidadentre representaciones mentales de números consecutivos. Se demuestra la existencia de una cantidadmáxima discriminable, la cual se discute a la luz de las habilidades numéricas de tribus indı́genas delAmazonas y de bebés de pocos meses.

    Se presenta entonces un primer trabajo experimental, cuyo objetivo es verificar si las proporcionesde cantidades gozan de un status similar a las cantidades simples, en términos perceptuales. La tareaconsistı́a en elegir la mayor de dos proporciones de puntos, presentadas en una pantalla durante unsegundo. Los resultados muestran un porcentaje de acierto por sobre el 70% y, más aún, que la funciónmás apropiada para describir la distancia perceptual entre dos proporciones es su cuociente y no sudiferencia absoluta, tal como ocurre también en la percepción de cantidades enteras.

    Finalmente, se estudia cómo se puede conciliar esta rapidez y naturalidad de la percepción deproporciones con la gran dificultad que tienen niños de enseñanza básica para aprender la operatoriade fracciones. Se realiza un estudio correlacional buscando enlazar aprendizaje de ordenamiento defracciones y capacidad de inhibición de respuestas automáticas, en un grupo de niños que estudiabanfracciones por primera vez. Se encontró una correlación estadı́sticamente significativa entre un ı́ndiceestándar de capacidad inhibitoria y el rendimiento en un cuestionario de comparación de fracciones,controlando ciertas variables exógenas como nivel socioeconómico familiar.

    ii

  • Ouroboros, representación ancestral de procesos cı́clicos(Ilustración de Javiera Constanzo, http://uialwen.deviantart.com/).

    iii

  • A todos quienes, con su ánimo y compañı́a,

    han anónimamente dejado su huella en este trabajo y en mi vida.

    iv

  • Agradecimientos

    Ası́ como una pieza de piano se compone de la contribución de dos manos, una que usualmentelleva la melodı́a y otra que acompaña, este trabajo ha sido moldeado –y podrı́amos decir tambiénescrito– por una multitud de personas, a pesar de que no todas estas influencias han dejado huellasen las lı́neas finalmente impresas: algunas, silenciosas, simplemente pasean entre lı́neas y númerosproporcionando una melodı́a de fondo sin la cual esta obra no serı́a tal.

    Comencemos por la melodı́a: La génesis y el desarrollo de este trabajo se debe en gran parte ami profesor guı́a Pablo Dartnell y a nuestro incondicional colaborador Roberto Araya, quienes com-plementando mutuamente sus conocimientos dieron origen a la chispa inicial de embarcarme en estaruta de modelación y experimentación cognitiva. Gracias por estos años de trabajo juntos, los cualesestoy seguro se multiplicarán hacia adelante. Gracias también a Leonor Varas y su incesante trabajo deorganización del Seminario de Educación del Centro de Modelamiento Matemático (CMM), a travésdel cual me acerqué a mis actuales áreas de interés.

    Gracias a Jorge Soto, Pedro Rosas, Rafael Correa y Servet Martı́nez por darse el trabajo de leer ydiscutir este trabajo. También a varias personas que aportaron sus conocimientos, ideas y trabajo enlos diversos temas que componen esta tesis, como Alejandro Maass, Gonzalo Mena y Jairo Navarre-te, además de los participantes del Seminario de Educognición realizado durante el año 2008 en elCMM: Grecia Gálvez, Jorge Soto, y otros que enriquecieron con sus diversos puntos de vista muchasdiscusiones. Por su parte, Eugenia Dı́az y Rosa Devés me ayudaron desde la Facultad de Medicina adar mis primeros pasos hacia las disciplinas experimentales.

    Gracias a la CONICYT por darme la oportunidad de acercarme al mundo académico, con su esen-cial soporte económico para mi trabajo de estos años; y al Departamento de Ingenierı́a Matemática(DIM) y al Centro de Investigación Avanzada en Educación (CIAE) por sus aportes que me posibili-

    v

  • taron concretar los estudios experimentales presentados en este trabajo.

    Gracias también a muchos funcionarios del DIM y el CIAE: Eterin, Marı́a Rosa, Gladys, Silvia,Verónica, Luis, Óscar, Jaime, Javier, Juan Pablo, y otros, por su ayuda en múltiples ocasiones con unsinfı́n de papeleos y otras yerbas.

    Después de haber escuchado la melodı́a por un rato, usualmente uno suficientemente atento co-mienza a sentir los matices puestos en la música por la mano que acompaña. Notas de humor, com-pañerismo, y del necesario ánimo que me hizo falta en los momentos más complicados se las agradez-co a Jairo, Marcelo, Álvaro, Gonzalo, Daniela, Andrés, y muchas otras personas que en este momentose me escabuyen de entre los dedos. También a Andrea y Silvia, quienes hicieron lo propio en losrincones del Golfo de Trieste.

    A mi familia: Alejandra, Juan Carlos, Carmen, Juan Carlos y Camila, gracias por estar siemprepresentes a través de su preocupación, ayuda, consuelo, y apoyo a toda prueba, sea a 2 o a 12.000kilómetros. También a Marı́a y Ernesto, quienes seguramente también acompañaron este proceso des-de su nueva casa.

    vi

  • Una historia abreviada

    Santiago de Chile, otoño de 2004

    Se acercaba ya el momento de definir el que serı́a el tema de mi memoria de Ingenierı́a CivilMatemática. En ese entonces, y tal como ahora, en el Centro de Modelamiento Matemático de laUniversidad de Chile se organizaba mensualmente el Seminario de Educación. Habiendo estado cercade postular a Pedagogı́a en Matemáticas en lugar de Ingenierı́a, decidı́ asistir a algunas sesiones paraver de qué cosas se hablaba. Al final de una de estas charlas, surgió espontáneamente una plática conPablo Dartnell, quien participaba usualmente de esas reuniones.

    – Ası́ que, ¿te gustan estos temas? –fue la frase que comenzó una conversación sobre el proyectoque Pablo lideraba en ese entonces sobre tutorı́as online para estudiantes de enseñanza media. Mecontó también de un colega suyo, Roberto Araya, quien habı́a trabajado previamente en modelaciónde datos experimentales sobre aprendizaje con alumnos de enseñanza básica. Quedamos de juntarnoslos tres por esos dı́as –en lo que se convertirı́a en nuestra base de operaciones, el Café Universitario–,y discutir la posibilidad de una memoria sobre modelación de este proceso de aprendizaje.

    Santiago de Chile, enero de 2006

    Después de un arduo año y medio de trabajo, la conversación de 2004 se convirtió finalmenteen la memoria que me valió el tı́tulo de Ingeniero. No sin antes haber pasado por una multitud delecturas en un lenguaje absolutamente nuevo: el de la psicologı́a experimental. Debo decir, al menos,que si bien Roberto era versado en estos temas, Pablo estaba emprendiendo este nuevo camino más omenos al mismo tiempo que yo. Y ambos parecı́amos entusiasmados con las posibilidades a futuro queesto abrirı́a, pensando en un grupo de trabajo que integrase los enfoques de modelación matemática y

    vii

  • experimentación cognitiva, aplicados a temas educativos.

    Habı́a ya decidido continuar mis estudios en un programa de Doctorado, y ası́ fue como a partir deese mismo año me inscribı́ en Modelación Matemática en el Departamento de Ingenierı́a Matemática.

    Santiago de Chile, enero de 2008

    Dos años después, el panorama ha cambiado bastante, ası́ como yo mismo. Paralelamente a rea-lizar los cursos matemáticos que el programa requiere, habı́a decidido que necesitaba acercarme mása algunas disciplinas cercanas al aprendizaje, como la psicologı́a y las neurociencias. Esto me llevó atomar cursos en la Escuela de Postgrado de la Facultad de Medicina, donde tuve que partir desdelas cosas más básicas, además de refrescar en mi mente el hecho que “básico” y “simple” no nece-sariamente son sinónimos. Después de estudiar temas como la biologı́a y fisiologı́a celulares, pudeapreciar en toda su amplitud una frase que personas como Eugenia Dı́az me dijeron en su momento:“una de las cosas que más cuesta es habituarse a los distintos modos de trabajo, en la matemática y enlas ciencias experimentales”. Esto se traduce en nociones tan centrales como qué cosa es una verdadválida en estas disciplinas: el Teorema de Pitágoras sigue siendo hoy tan válido como el dı́a en que fuedemostrado por primera vez unos 3,000 años atrás, mientras que nadie tiene la certeza si un artı́culoexperimental publicado hoy será todavı́a considerado válido en tres años más.

    Y finalmente está por llegar el momento de mi examen de calificación, en marzo. El plan es unatesis de modelación sobre fenómenos de cognición, matemática y lenguaje.

    Trieste, Italia, septiembre de 2008

    Convencido de continuar buscando una formación tanto como matemático como cognitivista, meintegré al Sector de Neurociencias Cognitivas de la Scuola Internazionale Superiore di Studi Avanzati,en Italia. Sin embargo, las posibilidades de hacer un trabajo de tesis conjunto entre esta institución yla Universidad de Chile se esfumaron cuando la burocracia gubernamental chilena decidió privilegiarla letra del contrato y cerró las puertas a la idea. Ni siquiera una carta del Papa ayudó.

    Y aquı́ comenzó el mayor giro dramático de esta historia, cuando decidı́ seguir adelante con ambasinstituciones, en programas de Doctorado separados.

    viii

  • Trieste, Italia, octubre de 2010

    Se acerca finalmente el momento de terminar el Doctorado en Modelación Matemática, una fechaque a ratos parecı́a nunca llegar. Esto de tener dos jefes, y dos trabajos, no se lo doy a nadie. Llegó lahora de recoger ecuaciones, modelos, papers, experimentos, camas y petacas, y poner todas las cartassobre la mesa. Definitivamente, la palabra modelación tomó un peso especial a través de este trabajo.Especialmente considerando que otras personas, matemáticos en formación, han mostrado interés enlos temas que me trajeron por este camino. El cual ha resultado ser algo sinuoso, pero profundamentepropio. Y que por lo demás, todavı́a no termina.

    ix

  • Esquema de esta tesis

    En este trabajo, presentamos un enfoque mixto matemático-cognitivo para el estudio de ciertostemas de interés en las áreas de estudio de la memoria, percepción numérica y educación matemática.

    Si bien esta tesis posee una motivación unitaria, los capı́tulos que la componen han sido prepara-dos para ser leı́dos como unidades independientes. Por esta razón, cada uno de ellos posee resumen,introducción y discusión especı́ficos, donde se hace la revisión de la literatura apropiada en detalle.También las referencias bibliográficas son entregadas al final de cada capı́tulo, para facilitar al lec-tor su búsqueda. Asimismo, incluimos al final de la tesis un epı́logo con algunas reflexiones finalesgenerales sobre el trabajo realizado.

    El Capı́tulo 2 es eminentemente teórico: en él presentamos un modelo matemático basado en pro-cesos estocásticos discretos, cuyo objetivo es formalizar un proceso simple de memoria y aprendizajey contestar algunas preguntas que los enfoques clásicos experimentales en el estudio de la memoriano son, por definición, capaces de responder. Este modelo fue propuesto originalmente en la memoriade Ingenierı́a Civil Matemática del mismo autor de esta tesis, sin embargo ahora lo tratamos en ma-yor generalidad y lo enraizamos considerablemente en la literatura apropiada. Este estudio nos llevaademás, al final del capı́tulo y haciendo tributo al sorprendente entramado conceptual de la matemáti-ca, a proponer una fórmula de Monte Carlo de cuadratura para la integración con respecto a medidasbinomiales y ciertas convoluciones de Bernoulli.

    Luego, en el Capı́tulo 3 nos abocamos a un tema más bien perceptual, y que se ubica seguramenteal origen de nuestra capacidad de hacer matemáticas (al menos como las conocemos): presentamos unabreve revisión de lo que la investigación psicocognitiva ha llamado el Sentido Numérico, refiriéndosea nuestra capacidad de percibir cantidades en nuestro entorno, y sus relaciones y operatoria. Dada

    x

  • la vasta evidencia empı́rica sugiriendo que los orı́genes de esta percepción numérica preexiste a laespecie humana, nos dedicamos a tratar de comprender algunas de sus propiedades asumiendo queestos orı́genes corresponden a un proceso evolutivo de optimización de la discriminabilidad entrerepresentaciones de números similares. Traducimos esto en un problema de optimización en variasvariables, el cual estudiamos y resolvemos numéricamente.

    En ese momento también presentamos la primera experiencia empı́rica de esta tesis, cuyo objetivoes estudiar si acaso las reglas del Sentido Numérico se aplican también a las proporciones de canti-dades: ¿Son éstas también rápidamente accesibles? ¿Son sus representaciones mentales afectadas porprincipios similares a los de las representaciones de números enteros?

    En el Capı́tulo 4 nos alejamos relativamente de la matemática en cuanto herramienta y la enfo-camos como objeto de estudio. Basándonos en algunos de los conceptos e ideas presentados en loscapı́tulos previos, nos preguntamos por la gran dificultad que presenta el tema de las fracciones en laeducación matemática. Ponemos a prueba, en este contexto especı́fico, una teorı́a reciente que rela-ciona aprendizaje matemático y un set de habilidades cognitivas llamadas capacidades ejecutivas, através de un estudio experimental correlacional sobre aprendizaje de fracciones con niños de tercerobásico.

    Finalmente, en los apéndices dejamos algunos materiales que podrı́an entorpecer el flujo de pen-samiento de los capı́tulos previos si los hubiéramos dejado allı́: enunciados de ciertos teoremas queutilizamos en nuestro análisis, la demostración de un lema técnico, y una breve descrpción de unatécnica de análisis usada en uno de los estudios experimentales.

    xi

  • ÍNDICE GENERAL

    Índice general

    1. Introducción General 1

    1.1. Análisis matemático de resultados experimentales previos . . . . . . . . . . . . . . . 3

    1.2. Experimentación sobre cognición matemática . . . . . . . . . . . . . . . . . . . . . 4

    1.3. Aplicación a la Educación Matemática . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2. Memoria y Aprendizaje 6

    2.1. Un contexto de aprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.2. Presentación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.2.1. Un modelo clásico: la urna de Pólya . . . . . . . . . . . . . . . . . . . . . . 18

    2.3. Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    2.3.1. Selección de estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    2.3.2. Sobre otros modelos de urnas . . . . . . . . . . . . . . . . . . . . . . . . . 21

    xii

  • ÍNDICE GENERAL

    2.3.3. Convergencia en el caso |S| = 1 . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.3.4. Convergencia en el caso |S| > 1 . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.4. Modificación 1: una estrategia a intervalos irregulares . . . . . . . . . . . . . . . . . 30

    2.5. Modificación 2: varias estrategias, con estabilización . . . . . . . . . . . . . . . . . 32

    2.6. Simulaciones computacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    2.7. Algunos resultados matemáticos relacionados . . . . . . . . . . . . . . . . . . . . . 43

    2.7.1. Integración con respecto a convoluciones de Bernoulli . . . . . . . . . . . . 46

    2.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    2.9. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    3. Número y proporción 56

    3.1. Percepción numérica en animales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    3.2. Percepción numérica en humanos . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    3.2.1. Un paréntesis de la Historia de las Matemáticas . . . . . . . . . . . . . . . . 61

    3.3. Percepción numérica en bebés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    3.4. Modelos sobre percepción numérica . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    3.4.1. Modelo lineal con variabilidad escalar . . . . . . . . . . . . . . . . . . . . . 64

    xiii

  • ÍNDICE GENERAL

    3.4.2. Modelos de escala comprimida . . . . . . . . . . . . . . . . . . . . . . . . . 65

    3.4.3. Crı́ticas a ambos modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    3.5. Posible origen evolutivo de una escala comprimida . . . . . . . . . . . . . . . . . . 66

    3.5.1. El modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    3.5.2. Sobre la secuencia de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    3.5.3. Propiedades generales del modelo . . . . . . . . . . . . . . . . . . . . . . . 70

    3.5.4. Solución del problema de optimización . . . . . . . . . . . . . . . . . . . . 73

    3.5.5. Solución numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    3.6. Una investigación empı́rica sobre proporciones . . . . . . . . . . . . . . . . . . . . 79

    3.6.1. Método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

    3.6.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    3.6.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

    3.7. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

    3.7.1. Sobre el modelo teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

    3.7.2. Sobre el estudio experimental . . . . . . . . . . . . . . . . . . . . . . . . . 95

    4. Una investigación en educación matemática 100

    xiv

  • ÍNDICE GENERAL

    4.1. El aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    4.1.1. Medición de capacidad inhibitoria . . . . . . . . . . . . . . . . . . . . . . . 104

    4.2. Sobre inhibición y aprendizaje de fracciones . . . . . . . . . . . . . . . . . . . . . . 106

    4.2.1. Metodologı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

    4.2.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

    4.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

    4.4. Discusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

    5. Epı́logo 129

    5.1. Estudiar la educación matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

    5.2. Reflexión final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

    A. Convergencia de medias ponderadas 134

    B. Convergencia de distribuciones empı́ricas 135

    C. Un resultado de independencia condicional 137

    D. Técnica de escalamiento unidimensional 139

    xv

  • ÍNDICE DE FIGURAS

    Índice de figuras

    2.1. Simulación de (Qn) para varias funciones de olvido . . . . . . . . . . . . . . . . . . 41

    2.2. Simulación de (Qn) para una función exponencial (30,000 iteraciones) . . . . . . . . 42

    2.3. Simulación de (Qn(s)) (modificación 1) . . . . . . . . . . . . . . . . . . . . . . . . 42

    3.1. Tiempos de reacción en una tarea de comparación numérica . . . . . . . . . . . . . 59

    3.2. Bebés esperan que 1 + 1 sea 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    3.3. Soluciones numéricas al problema (Pw) . . . . . . . . . . . . . . . . . . . . . . . . 78

    3.4. Diseño del material experimental sobre comparación de proporciones . . . . . . . . 82

    3.5. Procedimiento experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    3.6. Resultados generales sobre comparación de proporciones . . . . . . . . . . . . . . . 86

    3.7. Resultados segregados por proporciones comparadas . . . . . . . . . . . . . . . . . 88

    3.8. Representaciones estimadas por escalamiento unidimensional . . . . . . . . . . . . . 90

    xvi

  • ÍNDICE DE FIGURAS

    3.9. Resultados respecto de distancias lineal y logarı́tmica . . . . . . . . . . . . . . . . . 90

    3.10. Frecuencia de uso de numerales en Mundurukú . . . . . . . . . . . . . . . . . . . . 94

    4.1. Ejemplos de ı́temes del test de Stroop numérico . . . . . . . . . . . . . . . . . . . . 106

    4.2. Ejemplos de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . 112

    4.3. Ítemes del cuestionario de comprensión del material instructivo . . . . . . . . . . . . 113

    4.4. Ejemplos de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . 114

    4.5. Resumen de resultados de los cuestionarios . . . . . . . . . . . . . . . . . . . . . . 116

    4.6. Histogramas de los ı́ndices de interferencia y facilitación . . . . . . . . . . . . . . . 118

    4.7. Diagrama de dispersión entre cuestionario de fracciones y facilitación . . . . . . . . 120

    4.8. Distribuciones de puntajes segregados por variables exógenas al estudio . . . . . . . 121

    xvii

  • ÍNDICE DE CUADROS

    Índice de cuadros

    2.1. Notación utilizada en el capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.2. Funciones de olvido simuladas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    4.1. Estı́mulos utilizados en el experimento original de Stroop . . . . . . . . . . . . . . . 105

    4.2. Listado de ı́temes del cuestionario de conocimiento aritmético . . . . . . . . . . . . 111

    4.3. Listado de ı́temes del cuestionario de ordenamiento de fracciones . . . . . . . . . . . 111

    4.4. Errores por condición en el test de Stroop numérico . . . . . . . . . . . . . . . . . . 119

    xviii

  • Capı́tulo 1

    Introducción General

    “Mathematics is the most beautiful

    and most powerful creation of the human spirit.

    Mathematics is as old as Man.”

    — Stefan Banach1

    La historia de las Matemáticas ha estado profundamente ligada a la necesidad de los seres humanos

    de comprender e interactuar eficazmente con nuestro entorno. Varios de los textos dejados por antiguas

    civilizaciones como la babilónica, egipcia o griega (Neugebauer, 1969) dan testimonio de métodos de

    cálculo, contabilidad o predicción de ciertos fenómenos climáticos o astronómicos. En la actualidad, la

    cantidad de aplicaciones de las matemáticas en las ciencias y otros campos es prácticamente imposible

    de cuantificar, haciendo de esta ciencia “pura” la más aplicada de todas.

    Algunas disciplinas como la Fı́sica poseen una relación muy fluida con las Matemáticas. En ella se

    trabaja habitualmente con el planteo y análisis de modelos matemáticos como parte de las teorı́as. En

    1Kałuża (1996, Capı́tulo VIII).

    1

  • otras disciplinas relativamente nuevas, como la Psicologı́a y las Ciencias Cognitivas2, la integración

    con las matemáticas se encuentra en una etapa bastante más rudimentaria, utilizándose principalmente

    para evaluación estadı́stica de datos experimentales. Esto no excluye que ciertos autores, como por

    ejemplo Wickelgren y otros mencionados en el Capı́tulo 2, hayan hecho un uso importante de las

    Matemáticas para ciertos análisis teóricos. No obstante, estos autores constituyen una minorı́a aún en

    la actualidad.

    Un punto que ha influido en esta tendencia parece ser la sobre-especialización del conocimiento

    que hemos vivido en el último siglo: en el pasado era mucho más común que la “gente de ciencia” se

    interesara en varias disciplinas, y muchos de los grandes personajes eran filósofos y matemáticos a la

    vez, además de trabajar en temas relacionados con fı́sica, quı́mica u otras. La tendencia reduccionista

    de dedicarse a un área única del conocimiento ha llevado por una parte a un avance impresionante

    en ciertos temas, pero también ha minado el diálogo entre disciplinas3 y elevado las barreras de en-

    trada entre éstas. En este sentido, las últimas décadas han sido testigo de un redescubrimiento de la

    importancia del trabajo interdisciplinar, el que, sin embargo aún encuentra grandes trabas institucio-

    nales y culturales para su realización (e.g. Gentile & Boehlert, 2010; Illman & Clark, 2008). En este

    contexto se vuelven particularmente relevantes instancias e instituciones que promuevan este tipo de

    investigación, como el mismo Centro de Modelamiento Matemático de la Universidad de Chile4.

    Los enfoques interdisciplinarios con las matemáticas se vuelven particularmente importantes con

    las disciplinas jóvenes, muchas de las cuales nacieron precisamente en la época de la sobre-especiali-

    zación.

    El punto de partida filosófico de esta tesis es un par de convicciones: una de todo matemático, que

    las Matemáticas no son solamente una colección de métodos de cálculo; y otra de todo matemático

    aplicado, que éstas son también un camino para descubrir propiedades de los modelos que se pueda

    plantear en cualquier disciplina y más aún, que la generación y el estudio de estos modelos son un en-

    2Bermúdez (2010) hace una interesante revisión de la “prehistoria” y la historia de las ciencias cognitivas, ubicando losalbores de la primera hacia 1930.

    3Metzger & Zare (1999) comentaron esta situación en el contexto de la biologı́a, reconociendo que excelencia cientı́ficay excelencia disciplinar tienden a ser considerados como sinónimos.

    4A través del cual el autor del presente documento llegó a encontrarse con las temáticas que conformarı́an su tesisdoctoral.

    2

  • 1.1. Análisis matemático de resultados experimentales previos

    granaje esencial para mejorar nuestra comprensión de los elementos involucrados y sus interacciones.

    En este trabajo nos aproximamos a problemas de cognición general y, particularmente, cognición

    numérica desde dos puntos de vista complementarios: el de modelación matemática y el experimental

    cognitivo. Éstos constituyen los dos brazos de esta tesis, a los cuales agregamos también un apartado

    dedicado a la investigación educativa. A continuación detallamos brevemente estas tres temáticas.

    1.1. Análisis matemático de resultados experimentales previos

    Esta rama de la tesis se desarrolla en el Capı́tulo 2 y en la primera parte del Capı́tulo 3. Consiste

    en la generación y análisis de dos modelos matemáticos, basados en procesos estocásticos discretos

    y optimización respectivamente, a partir de la evidencia empı́rica disponible en dos áreas de alto

    interés de las Ciencias Cognitivas. La literatura relevante para sustentar cada modelo se presenta en

    los respectivos capı́tulos.

    La primera temática cognitiva que abordamos en estos modelos es el estudio de la memoria de

    largo plazo, ı́ntimamente ligada con el aprendizaje. Los procesos estocásticos discretos nos permiten

    el modelamiento y la simulación numérica de la deriva temporal de un recuerdo simple, donde además

    estudiamos propiedades asintóticas de esta deriva. Éstas resultan tener consecuencias centrales en la

    capacidad de aprendizaje de un agente ideal dotado de una cierta memoria.

    El segundo tema es el estudio de las representaciones numéricas internas que observamos no

    solamente en seres humanos, sino que también en otros animales, algunos bastante lejanos de nosotros

    en la escala evolutiva. Un modelo de optimización nos permite evaluar cuáles de las propiedades

    observadas empı́ricamente de estas representaciones numéricas podrı́an ser explicadas por un proceso

    de evolución tendiente a maximizar la discriminabilidad entre representaciones distintas.

    Ambos modelos son analizados tanto teórica como numéricamente, discutiendo finalmente la re-

    levancia y conexión de los resultados obtenidos en el contexto amplio de la literatura que los inspiró.

    3

  • 1.2. Experimentación sobre cognición matemática

    1.2. Experimentación sobre cognición matemática

    Esta segunda veta se trabaja en la parte final del Capı́tulo 3 y en el Capı́tulo 4, aunque este último

    lo comentaremos en modo especial en la sección siguiente. En general, el tratamiento de esta parte se

    materializa de forma muy similar a la de una publicación cognitiva, detallando los materiales y méto-

    dos utilizados para luego dar paso a los resultados experimentales y su análisis estadı́stico, finalizando

    con una discusión de éstos.

    El punto de partida son los mismos modelos cognitivos de percepción numérica que inspiraron

    parte del análisis matemático. Estos modelos en la actualidad se limitan a cantidades enteras (es decir,

    números naturales), a pesar de que el formalismo es perfectamente aplicable también a cantidades

    racionales. Nos preguntamos entonces si las razones entre enteros tienen representaciones mentales

    de similares propiedades. Coloquialmente, podemos decir que nos interesamos en saber si los números

    racionales son o no representados en la misma “recta numérica mental” que ha sido propuesta para los

    enteros.

    La propiedad especı́fica que estudiamos en esta tesis es la noción de distancia más apropiada

    entre las representaciones mentales de estas cantidades. En el caso de los enteros, numerosos estudios

    han confirmado que la distancia perceptual más apropiada es logarı́tmica, es decir la mejor variable

    predictora de los procesos automáticos mentales de comparación numérica es el cuociente entre los

    dos comparandos, en lugar de su diferencia. Para evaluar esto en el caso de proporciones de enteros,

    usamos un paradigma experimental de comparación de proporciones presentadas en un formato no

    simbólico (i.e. sin usar numerales) donde los participantes tienen un tiempo limitado para responder.

    1.3. Aplicación a la Educación Matemática

    Finalmente, nos aproximamos a uno de los intereses personales del autor de esta tesis: la inves-

    tigación educativa. El Capı́tulo 4 detalla una experiencia conducida con niños de tercer año básico,

    en la cual tenemos por objetivo evaluar la validez de una teorı́a cognitiva que relaciona la dificultad

    4

  • BIBLIOGRAFÍA

    del aprendizaje de ciertos conceptos y operatorias matemáticas con un set de habilidades cognitivas

    llamadas capacidades ejecutivas. Esta teorı́a dice, esencialmente, que la capacidad de inhibir estrate-

    gias y operatorias aprendidas previamente para dar paso a otras nuevas juega un rol importante en el

    aprendizaje matemático. Nosotros circunscribimos esta teorı́a general a un tema cuya dificultad en el

    currı́culum educativo lo hace especialmente interesante: el aprendizaje de los conceptos básicos y el

    ordenamiento de fracciones.

    Bibliografı́a

    Bermúdez, J. L. (2010). Cognitive Science: An Introduction to the Science of the Mind. Cambridge

    University Press. Pág(s) 2

    Gentile, J., & Boehlert, S. (2010). Nurturing young scientists. Science, 329, 884. Pág(s) 2

    Illman, D. L., & Clark, F. (2008). Visibility of team science: A case study of media coverage of the

    NSF Science and Technology Centers. Science Communication, 30(1), 48–76. Pág(s) 2

    Kałuża, R. (1996). Through a reporter’s eyes: The life of Stefan Banach. Birkhäuser. Traductores A.

    Kostant, W. Woyczyński. Pág(s) 1

    Metzger, N., & Zare, R. N. (1999). Interdisciplinary research: From belief to reality. Science, 283,

    642–643. Pág(s) 2

    Neugebauer, O. (1969). The Exact Sciences in Antiquity. Dover Publications. Pág(s) 1

    5

  • Capı́tulo 2

    Memoria y Aprendizaje

    El presente capı́tulo analiza en detalle un modelo de aprendizaje basado en procesos es-

    tocásticos discretos, discutiéndolo a la luz de la literatura cognitiva relevante, y com-

    parándolo con otros enfoques teóricos previos. Presentamos además simulaciones compu-

    tacionales para ilustrar nuestros principales resultados teóricos.

    El estudio de la memoria y el aprendizaje fue uno de los puntos de partida del enfoque cientı́fi-

    co/experimental en Psicologı́a. Hacia fines del siglo XIX, el alemán Herman Ebbinghaus (Ebbinghaus,

    1885/1913) se propuso buscar regularidades en los procesos de recuerdo y aprendizaje. Para ello desa-

    rrolló un método inusualmente riguroso para su época, el cual aplicó a sı́ mismo como único parti-

    cipante de sus propios estudios1. Para evitar múltiples elementos que podrı́an provocar confusión en

    la interpretación de sus resultados, decidió tomar como medida de aprendizaje y recuerdo la cantidad

    de tiempo requerida para memorizar, en perfecto orden, listas de sı́labas sin sentido como “FAP” y

    “GOK”. Ebbinghaus observó que el tiempo requerido para volver a aprender a perfección una lista era

    1Esta situación es considerada subestándar en nuestros dı́as, aunque Ebbinghaus la justificó argumentando que sus estu-dios requerı́an de una modificación tal de su rutina diaria, y de una cantidad tan grande de repeticiones, que no deseaba hacerpasar a nadie más por semejante proceso. Sin embargo, diseñó ingeniosos mecanismos que le permitı́an reducir el impactode esta limitación.

    6

  • menor que el que tomaba la primera vez, incluso cuando la lista hubiera sido aparentemente olvidada

    entre ambas sesiones.

    La presencia de un cierto patrón en la reducción del tiempo requerido lo llevó a plantear la existen-

    cia de una función de ahorro: ésta relaciona el número de veces que una lista ha sido reestudiada con el

    tiempo requerido para reaprenderla a perfección2. Junto con observar que esta función era bien apro-

    ximada por una potencia de un logaritmo, Ebbinghaus daba el punto de partida para un estudio mucho

    más riguroso y metódico de los fenómenos cognitivos y perceptuales de lo que se acostumbrada en

    aquel entonces.

    Los hallazgos de Ebbinghaus han sido replicados por muchos investigadores, y su explicación

    teórica ha sido refinada en varios aspectos. Con el paso del tiempo, el concepto de función de ahorro

    dio paso al concepto más amplio de función de olvido, utilizada para cuantificar la fortaleza de un

    recuerdo (llamado técnicamente una “traza de memoria”) en un instante dado de tiempo: si f es una

    función de olvido, entonces la fortaleza en el instante t2 de un evento ocurrido en el instante t1 < t2está dada por f (t2− t1).

    La cantidad de investigación experimental acumulada a través de los años en este tema ha sido

    enorme, abarcando diversas escalas de tiempo (por ejemplo, estudios centrados en estudiar retención

    de corto o largo plazo) y diversos tipos de participantes (adultos sanos, personas con sı́ndromes que

    afectan la memoria, palomas, ratas, etc.). Un denominador común de la casi totalidad de estos estudios

    ha sido el buscar la forma más apropiada de “la” función de olvido a través de ajuste estadı́stico de los

    datos experimentales obtenidos. Esto llevó a la proposición de una larga lista de funciones candidatas,

    entre las cuales siempre han sobresalido dos familias en particular: las funciones exponenciales f (t) =

    Aρt (A > 0, ρ ∈ (0,1)), y las funciones potencia f (t) = A(1 + t)−β (A > 0, β ∈ (0,1]).

    Algunos trabajos como el de Wickelgren (1974) tuvieron un enfoque primariamente teórico, tra-

    tando de derivar la forma de la función de olvido a partir de principios básicos y utilizando el ajuste

    estadı́stico de datos como una verificación en lugar de una simple exploración de posibles funciones.

    Sin embargo, este tipo de aproximación al problema ha sido claramente minoritaria, quizás marginal.

    2Más precisamente, la diferencia de este tiempo con respecto al invertido en el primer estudio de la lista.

    7

  • Esto es un problema, debido a que el estudio experimental tı́pico no considera una cantidad suficiente

    de puntos en el eje temporal como para discriminar entre formas funcionales más complejas. Incluso

    el mero hecho de discriminar entre dos familias de funciones basado en ajustes estadı́sticos sobre una

    cantidad reducida de datos parece ser una empresa de dudoso éxito, como ya algunos investigadores

    como White (2001) han hecho notar. White ha sido un abogado de las formas exponenciales para la

    función de olvido, argumentando que el proceso de olvido es markoviano3, es decir independiente de

    la historia previa dado el estado actual. Definiendo la tasa de olvido δ(t) como

    δ(t) =∣∣∣∣∣ f ′(t)f (t)

    ∣∣∣∣∣ ,una función de olvido exponencial se sustenta en el supuesto de que la tasa de olvido es constante en

    el tiempo.

    Si bien el modelo exponencial provee una forma funcional simple apoyada por la proposición

    de un mecanismo convincente (decaimiento markoviano), ciertos hallazgos experimentales ponen en

    duda su uso. Hace más de un siglo, Jost (1897) observó que las memorias pasan por un proceso de

    “fortalecimiento” a través del tiempo, en lo que llegarı́a a ser conocida como su segunda ley:

    “Dadas dos asociaciones de igual fuerza pero de distinta antigüedad,

    la más antigua decae más lentamente durante un intervalo dado de tiempo.” 4

    Simon (1966) volvió a traer este elemento a la discusión, observando que la afirmación de Jost

    implicaba que δ(t) debı́a ser una función decreciente en el tiempo. Simon propuso ante esto una solu-

    ción simple, consistente en tomar funciones de olvido que fuesen combinaciones aditivas de funciones

    3Esta naturaleza markoviana puede concebirse a priori en diversos niveles, por ejemplo el psicológico (proceso mentalde olvido de trazas de memoria) y el biológico (proceso neuronal de regreso a un estado basal previo a una estimulación).Es importante tener en mente que no necesariamente el mejor modelo de olvido para un nivel lo es también para el otro.

    4“Given two associations of the same strength, but of different ages, the older falls off less rapidly in a given length oftime”, según lo citado por Staddon (2001, p. 139).

    8

  • exponenciales con distintas tasas. Por ejemplo5,

    f (t) =n∑

    k=1

    Akρtk con Ak > 0;0 < ρ1 < . . . < ρn < 1.

    Observamos que

    δ′ =

    ∣∣∣∣∣ f ′f∣∣∣∣∣′ = (− f ′f

    )′=

    f ′2− f ′′ ff 2

    . (2.1)

    Calculando las derivadas de f , obtenemos

    f ′(t) =n∑

    k=1

    Akρtk logρk y f′′(t) =

    n∑k=1

    Akρtk[logρk

    ]2 ,de donde se sigue que

    f ′2(t)− f ′′(t) f (t) =∑k, j

    AkA j(ρkρ j)t logρk logρ j−∑k, j

    AkA j(ρkρ j)t[logρk

    ]2=

    ∑k, j

    AkA j(ρkρ j)t logρk(logρ j− logρk).

    Llamando Ck j = AkA j(ρkρ j)t logρk, continuamos este desarrollo:

    f ′2(t)− f ′′(t) f (t) =∑k< j

    Ck j(logρ j− logρk) +∑k> j

    Ck j(logρ j− logρk)

    =∑k< j

    Ck j(logρ j− logρk) +∑j>k

    C jk(logρk − logρ j),

    donde hemos intercambiado los nombres de los ı́ndices en la segunda suma. Ası́,

    f ′2(t)− f ′′(t) f (t) =∑k< j

    (Ck j−C jk)(logρ j− logρk)

    5Simon presentó originalmente el caso con n = 2.

    9

  • = −∑k< j

    AkA j(ρkρ j)t(logρ j− logρk)2 < 0.

    Sustituyendo esto en la Ecuación (2.1), concluimos que δ(t) es una función estrictamente decre-

    ciente. Además,

    lı́mt→∞

    δ(t) =∣∣∣logρn∣∣∣ > 0.

    La solución propuesta por Simon, a pesar de ser eficaz en el proveer una función de olvido con

    tasa de decaimiento decreciente, pareciera pecar de conservadora: varios estudios abogan por la uti-

    lización de funciones cuyo decaimiento sea claramente más lento que el de las exponenciales, como

    es por ejemplo el caso de las funciones potencia. Para éstas, la tasa de olvido (δ(t) = β(1 + t)−1) de-

    crece a cero cuando t → ∞. Wixted & Carpenter (2007) han argumentado que un reanálisis de losdatos originales de Ebbinghaus muestra un buen ajuste de parte tanto de las funciones exponenciales

    como potencias6, pero que si uno repite los ajustes dejando ciertos puntos fuera, los parámetros de

    las funciones exponenciales pueden tener variaciones importantes, mientras que los de las funciones

    potencia muestran una mucho mayor estabilidad7.

    A pesar de esto, un hecho importante a considerar en esta discusión es la influencia que los pro-

    pios métodos de medición y análisis pudieran estar ejerciendo sobre los resultados finales. Anderson

    & Tweney (1997) sugirieron que la práctica común de utilizar medias aritméticas para estimar los

    valores de la función de olvido en diversos instantes de tiempo podrı́a generar sesgos en los ajustes

    estadı́sticos, favoreciendo artificialmente a las funciones potencia. Esencialmente su argumento con-

    sistió en mostrar, teóricamente y a través de simulaciones computacionales, que a pesar de que ni las

    funciones exponenciales ni las potencias son estables bajo promedios aritméticos, las funciones ex-

    ponenciales son las más perjudicadas en este proceso8. De acuerdo a ejemplos presentados por estos

    autores, cabe incluso la posibilidad de que un promedio aritmético de valores generados por un mo-

    delo exponencial sea mejor ajustado por un modelo potencia. Una condición necesaria para que esta

    6Es necesario notar que las funciones exponenciales consideradas por Wixted & Carpenter disponı́an de un parámetroextra: un nivel asintótico c > 0, de modo que la forma funcional discutida en este caso era f (t) = c + Aρt.

    7Los datos originales de Ebbinghaus son una de las pocas buenas fuentes que permiten verificar este hecho, dado queincluyó un amplio rango de valores en el eje temporal, que muy pocos estudios posteriores han utilizado.

    8Ver también los análisis teóricos más avanzados, en la misma lı́nea, hechos por Anderson (2001); Myung et al. (2000).

    10

  • última situación se dé es que en el promedio aritmético incurran funciones exponenciales con diversas

    bases ρ, lo que tiene sentido si uno considera que la práctica estándar involucra promediar valores ob-

    tenidos de los distintos participantes (por ejemplo) de un estudio. Ası́, las funciones potencia habrı́an

    aparecido como un artefacto del método estadı́stico, el cual podrı́a ser subsanado si los datos fuesen

    analizados tomando sus promedios geométricos en vez de aritméticos. Con todo, Wixted & Ebbesen

    (1997) presentaron ajustes de datos separados por cada participante, encontrando que incluso antes de

    promediar valores las funciones potencia proveı́an una mejor explicación de los datos.

    Análisis matemáticos hechos posteriormente, basados en el supuesto de que la retención es el re-

    sultado promedio de una infinitud de procesos elementales de olvido, también sugieren que las funcio-

    nes potencia pueden aparecer como el resultado promedio del decaimiento de trazas exponenciales:

    Kahana & Adler (2002) sugirieron que, si una infinitud de trazas individuales decae siguiendo una

    misma forma funcional pero con diversos niveles de “aceleración”, como es el caso de decaimien-

    tos exponenciales con diferentes tasas, la proporción de trazas de memoria que en un momento dado

    está por sobre un valor umbral decrece asintóticamente como una potencia. Por otra parte, utilizando

    transformadas de Laplace, Murre & Chessa (2009) observaron que si las tasas de decaimiento de una

    población infinita de trazas que decaen exponencialmente tienen una distribución Gamma, entonces

    la fuerza media de la población es exactamente una función potencia. Sin embargo, común a ambos

    argumentos es la necesidad de que existan trazas que decaigan con tasas arbitrariamente cercanas a

    cero: en el caso de Murre & Chessa, la distribución Gamma puede ser modificada en varios aspectos

    manteniendo la validez de sus resultados, excepto el ser truncada en una vecindad de 0; mientras que

    Kahana & Adler asumen distribuciones gaussianas restringidas a R+. La existencia de trazas tan re-

    sistentes al decaimiento como se desee, una hipótesis crı́tica de estos modelos, está motivada más por

    necesidad del argumento que por observaciones biológicas o psicológicas.

    Todo esto nos hace volver a un punto ya mencionado previamente: las limitaciones intrı́nsecas

    a los estudios experimentales. Éstos son conducidos en un intervalo de tiempo acotado, donde es

    difı́cil evaluar verdaderamente el decaimiento de las trazas de memoria9. El trabajo experimental,

    además, involucra decisiones de diseño que no siempre influyen de modo simple en los resultados

    finales (e.g. ¿debe el participante recordar todos los ı́temes en exactamente el mismo orden en que

    9Ver la Figura 5 de Kahana & Adler, 2002, donde se muestra un ajuste casi perfecto de funciones potencia a unaexponencial cuando se considera intervalos de tiempo breves.

    11

  • 2.1. Un contexto de aprendizaje

    los estudió, o puede hacerlo en el orden que le sea más cómodo?), y el proceso de medición posee

    cierto nivel de ruido que le es propio. Una razón de peso a favor de uno u otro modelo difı́cilmente

    provendrá de ese mundo. Es por esto que, en este capı́tulo, presentamos una abstracción matemática

    que nos permitirá estudiar los aspectos estructurales de los modelos en disputa, dejando fuera la mayor

    parte de los aspectos accidentales inherentes a la experimentación.

    2.1. Un contexto de aprendizaje

    Desde los inicios del estudio de la memoria, ésta ha sido considerada como esencialmente unida a

    los procesos de aprendizaje. Continuando en esta lı́nea, consideramos una tarea simple que se conoce

    en la literatura psicológica clásica como “probability learning”. En ésta, un participante observa una

    secuencia finita de tiradas de moneda (cara-sello-cara-cara-sello-. . . ), y debe predecir cuál será el re-

    sultado de una nueva tirada. Si la secuencia fue generada siguiendo un proceso de Bernoulli, entonces

    basta con que el participante estime la probabilidad α de que la moneda caiga ‘cara’ para poder estimar

    de mejor modo el nuevo resultado.

    Es posible complejizar esta tarea, aumentando el número de monedas disponibles y permitiendo

    al participante observar el resultado de sólo una moneda en cada iteración10. En esta situación, la

    elección de qué moneda observar en cada etapa puede ser un proceso aleatorio en sı́ mismo, o ser

    decidido por el participante en la medida que observa la secuencia. Esta última situación permite

    considerar la tarea de probability learning como una abstracción de múltiples procesos de selección

    de alternativas, como por ejemplo un proceso de aprendizaje de un agente que dispone de un conjunto

    de estrategias, de entre las cuales debe seleccionar una en modo recurrente.

    La nomenclatura que usaremos está inspirada en el modelo de resolución estratégico de problemas

    inversos de adición planteado por Siegler & Araya (2005). Ellos trabajaron en la modelación compu-

    tacional de la resolución de problemas del tipo a + b− c por alumnos de tercer año básico. En el casoespecı́fico en que b = c, los niños poseen dos posibles estrategias para resolver estos problemas, las

    10Esta modalidad ha sido efectivamente aplicada en experimentación con personas, y su rendimiento ha sido bastantebueno. Ver por ejemplo Estes (1976, capı́tulo III, experimento 2).

    12

  • 2.1. Un contexto de aprendizaje

    cuales difieren esencialmente en el orden en el cual se realizan las operaciones:

    Cálculo directo Consiste en calcular (a + b)−b. Ésta es la estrategia natural de partida, debido a quelos niños siempre aprenden a efectuar las operaciones de izquierda a derecha.

    Atajo Consiste en calcular a + (b−b). Esta estrategia posee la ventaja de agrupar las operaciones demodo de sólo realizar cálculos de mucha simplicidad11.

    Bisanz & LeFevre (1990) propusieron que el tiempo que le toma a un niño de tercero básico

    resolver un problema del tipo a + b−b es un buen indicador de la estrategia utilizada. De acuerdo conlos datos de Siegler & Stern (1998), usualmente la estrategia de cálculo directo produce tiempos de

    respuesta mayores a 8 segundos, mientras que la estrategia de atajo toma 4 segundos o menos12. Esto

    les permitió una estimación de la estrategia utilizada a pesar de que los niños no pudieran explicitar

    correctamente su procedimiento cuando se les consultaba.

    Si bien con la práctica aritmética la estrategia de atajo se vuelve dominante, tercero básico es

    precisamente una época en la cual los niños aún no descubren en modo robusto sus ventajas, cosa

    que logran en la medida que resuelvan suficientes ejercicios apropiados. Esta transición, sin embargo,

    no es directa: Siegler & Stern (1998) observaron que los niños podı́an descubrir la estrategia de atajo

    durante una sesión de ejercicios, para luego aparentemente haberla olvidado al comenzar la próxima.

    Esto llevó a Siegler (2005) a proponer la teorı́a de “ondas superpuestas” (overlapping waves), según

    la cual la elección de estrategias no se realiza necesariamente en modo optimal, sino que múltiples

    estrategias aplicables a un problema dado conviven durante lapsos de tiempo potencialmente largos,

    siendo sólo algunas de estas estrategias abandonadas definitivamente.

    Considerando que la aritmética mental posee un pequeño margen de error, entonces las estrategias

    11Cabe preguntarse si esta estrategia en efecto involucra cálculos. Resolver b−b probablemente involucra un razonamientoconceptual simple por parte de los niños, evitándose el tener que realizar efectivamente la resta.

    12Según las mediciones de Siegler & Stern (1998), el 92% de los tiempos de respuesta en niños de tercero básico caeen esta clasificación. El resto puede ser explicado, de acuerdo a Siegler & Araya (2005), como estrategias resultantes dealguna combinación de las dos aquı́ presentadas. Cálculo directo y atajo podrı́an ser denominadas las estrategias básicaspara resolver el problema, mientras que las estrategias combinadas son construidas como composición de trozos de lasestrategias básicas, gracias a la posibilidad de ‘interrumpir’ una estrategia durante su ejecución.

    13

  • 2.2. Presentación del modelo

    de cálculo directo y atajo pueden ser vistas como tiradas de monedas cargadas, las cuales con una

    cierta probabilidad dan la respuesta correcta. También, dado que la estrategia de atajo involucra ope-

    raciones (o razonamientos) más simples, es razonable pensar que su probabilidad de error asociada

    sea menor. Esta abstracción nos permite ubicar el problema de aprendizaje estratégico en un contexto

    de probability learning, donde las monedas o estrategias son seleccionadas en base a su efectividad

    estimada. Una primera versión de este modelo fue presentada en la Memoria de Tı́tulo de Ingenierı́a

    Civil Matemática de Gómez (2006). En este trabajo ampliaremos ese modelo y sus resultados.

    2.2. Presentación del modelo

    Sea S un conjunto finito y no vacı́o, cuyos elementos son las estrategias (o monedas) entre lascuales un agente puede elegir para resolver un problema dado. Cada una de estas estrategias s ∈ Sposee una probabilidad de éxito asociada α(s) ∈ (0,1).

    La mecánica del modelo es la siguiente: en cada etapa n ≥ 1, el agente elige una estrategia sn ∈ S,la cual produce un resultado Xn. Éste puede ser 1 (‘éxito’) o 0 (‘fracaso’). Observando este resultado,

    el agente pasa a la etapa n + 1, donde debe elegir nuevamente otra estrategia, incorporando la nueva

    información de que dispone.

    Formalmente, consideraremos dos secuencias aleatorias: (sn : n ≥ 1) ⊆ S la secuencia de estra-tegias elegidas, y (Xn : n ≥ 1) ⊆ {0,1} la secuencia de resultados de la aplicación de las estrategias.Asumiremos que el resultado de la ejecución de una estrategia depende solamente de la estrategia

    elegida, independientemente de la historia previa. Si denotamos la historia hasta el tiempo n por

    Hn = σ(sk,Xk : 1 ≤ k ≤ n), esto significa que

    P(Xn = 1|sn,Hn−1) = P(Xn = 1|sn) = α(sn) (n ≥ 1). (2.2)

    Para poder plantear la ley condicional de elección de estrategias, requerimos dotar a los agentes

    de algún tipo de ı́ndice basado en su historia. Dada una estrategia s ∈ S, un estimador simple de su

    14

  • 2.2. Presentación del modelo

    probabilidad de éxito dada la historiaHn−1 puede ser la media∑n−1k=1 I {sk = s}Xk∑n−1

    k=1 I {sk = s}∈ [0,1], (2.3)

    donde I(A) es la función indicatriz del evento A.

    A pesar de ser simple de analizar y gozar de varias propiedades, esta media simple no responde

    bien a nuestro deseo de modelar un agente real (persona o animal). La razón es que en (2.3) todas las

    observaciones Xk poseen el mismo peso relativo, en tanto que la investigación psicológica y la vida

    diaria nos sugieren que las observaciones más recientes (aquéllas con k ≈ n) debieran tener un mayorpeso relativo que las más lejanas (ésas con k� n).

    Para subsanar este problema recurriremos a medias ponderadas en lugar de la media simple, y es

    aquı́ donde nos ayudará el concepto de función de olvido introducido previamente. Diremos que una

    función suave13 f : R+ → R+ es una función de olvido si es decreciente (no necesariamente decre-cimiento estricto) y, sin pérdida de generalidad, se tiene que f (0) = 1. Como ya hemos mencionado,

    interpretaremos f (n− k) como la fortaleza en la etapa n del recuerdo de una unidad de informaciónadquirida en la etapa k. Nuestro agente, entonces, utilizará el estimador

    Qn(s) =∑n−1

    k=1 f (n− k)I {sk = s}Xk∑n−1k=1 f (n− k)I {sk = s}

    ∈ [0,1], (2.4)

    el cual es una funciónHn−1-medible. Para evitar el problema técnico de que esta expresión se indefinepara las combinaciones (n, s) donde la estrategia s no ha sido elegida antes de la etapa n, modificaremos

    esta definición previa a

    Qn(s) =f (n)α0(s) +

    ∑n−1k=1 f (n− k)I {sk = s}Xk

    f (n) +∑n−1

    k=1 f (n− k)I {sk = s}∈ [0,1]. (2.5)

    Esto equivale a asumir que, antes de ser elegida por primera vez, cada estrategia posee una esti-

    13La gran mayorı́a de los ejemplos dados en la literatura son funciones de clase C∞, aunque también se usa a vecesfunciones derivables por trozos. En cualquier caso, dado que nuestro análisis es a tiempo discreto, los resultados valentambién para funciones más generales dado que la suavidad se vuelve irrelevante.

    15

  • 2.2. Presentación del modelo

    mación basal de efectividad (o nivel basal de ‘confianza’ en la estrategia) dada por α0(s) > 0.

    Basado en estimaciones de efectividad muy similares a la aquı́ propuesta, Gómez (2006) consi-

    deró dos posibles protocolos de selección de estrategias:

    Elegir en cada etapa n la estrategia s cuyo estimador Qn(s) es máximo. Este protocolo responde

    a la suposición de un agente racional, que maximiza la probabilidad condicional de éxito de

    acuerdo a su historia previa.

    Elegir en cada etapa n una estrategia s aleatoriamente, con una probabilidad condicional pro-

    porcional a Qn(s). Este protocolo fue utilizado por Siegler & Araya (2005) como una posible

    implementación de la teorı́a de ondas superpuestas propuesta por Siegler (2005).

    Gómez (2006) realizó un primer análisis de estos modelos. Para nuestro trabajo presente, debido

    a nuestra inspiración estratégica tomada de Siegler & Araya (2005), nos concentraremos sólo en el

    segundo protocolo. Éste dice, más precisamente, que la probabilidad de elegir la estrategia s en la

    etapa n está dada por

    P(sn = s|Hn−1) = Q̂n(s) ≡Qn(s)∑

    z∈SQn(z). (2.6)

    Antes de continuar con el análisis y discusión del modelo, en la Tabla 2.1 damos un resumen de la

    notación utilizada, para facilitar la lectura de esta sección.

    16

  • 2.2. Presentación del modelo

    S Conjunto de estrategiasS∞ Conjunto (aleatorio) de todas las estrategias que son elegidas infinitas vecesα(s) Tasa de éxito asociada a la estrategia s ∈ Sα Valor de α(s) en el caso en que el agente dispone de una sola estrategia

    α0(s) Valor a priori que el agente asume para su estimación de α(s)α0 Valor a priori que el agente asume para su estimación de α (caso de una sola estrategia)

    f Función de olvido (suave, decreciente y f (0) = 1)f (t2− t1) Fortaleza en el instante t2 del recuerdo de un evento ocurrido en el instante t1

    (sn : n ≥ 1) Secuencia de estrategias elegidas por el agente(Xn : n ≥ 1) Secuencia de resultados de la aplicación de las estrategias (0: fracaso, 1:éxito)Hn σ-álgebra generada por la historia del agente hasta la etapa n: σ(s1,X1, . . . , sn,Xn)

    Qn(s) Estimación de α(s) hecha por el agente en la etapa nQn Estimación de α, en el caso en que el agente dispone de una sola estrategia

    Q̂n(s) Estimación normalizada sobre S: Qn(s)/∑

    z∈SQn(z)τk(s) Instante en el cual la estrategia s es usada por la k-ésima vezXk(s) Resultado obtenido en la k-ésima aplicación de la estrategia s: Xτk(s)

    µ [Modificación 1] Probabilidad de utilizar la estrategia dada en un instante de tiempoT [Modificación 2] Instante a partir del cual el agente no continúa actualizando

    sus estimadores Qn(s)

    m∧n Mı́nimo entre m y nI(A) Función indicatriz del evento AP(A) Probabilidad del evento AE(F) Valor esperado de la función F

    Cuadro 2.1: Resumen de la notación utilizada en el capı́tulo.

    17

  • 2.2. Presentación del modelo

    2.2.1. Un modelo clásico: la urna de Pólya

    El modelo de Pólya que presentamos en esta sección es un elemento que no podemos dejar de

    mencionar, ya que podrı́a representar una alternativa para modelar la situación de aprendizaje que

    deseamos trabajar en este capı́tulo. Luego de describirlo brevemente, sin embargo, observaremos cier-

    tas diferencias entre este modelo y el por nosotros presentado, respecto de su idoneidad para nuestra

    aplicación.

    La urna de Pólya es una urna que contiene inicialmente r bolas rojas y a bolas azules. En cada

    etapa, se extrae una bola al azar de la urna. Esta bola se devuelve, y además se añade a la urna una

    bola extra del mismo color de la extraı́da. De este modo, el número de bolas en la urna crece en cada

    etapa. Pólya mostro que si Rn es el número de bolas rojas en la urna después de n iteraciones de este

    proceso, entonces (n + r + a)−1Rn es una martingala cuya distribución converge a una beta.

    Formalmente, hay a priori dos modos principales en los cuales nuestro modelo podrı́a compararse

    a una urna de Pólya, sin embargo veremos que ambas posibilidades presentan dificultades.

    Una opción es considerar el caso en que el agente dispone de sólo una estrategia (es decir el caso

    |S| = 1), la cual podemos asimilar a una urna. El historial de éxitos y fracasos de esta estrategiaserı́a, entonces, la cantidad de bolas rojas y azules que la urna contiene. En la situación que

    modelamos, sin embargo, hemos asumido que la probabilidad de que al historial se agregue un

    éxito o fracaso es un valor constante α, es decir que no depende del historial mismo (i.e. del

    contenido de la urna).

    Otra posibilidad es pensar los colores rojo y azul de la urna de Pólya como dos estrategias

    separadas. De este modo, la elección de una estrategia por sobre la otra en un momento dado se

    realiza proporcionalmente a una función del historial de cada estrategia, como plantea el modelo

    de Pólya. No obstante, esta analogı́a no considera el hecho que en el proceso de aprendizaje que

    estudiamos, cada estrategia contiene en su historial éxitos y fracasos, requiriendo una mayor

    información que la mera cantidad de uso de cada estrategia.

    18

  • 2.3. Análisis

    2.3. Análisis

    Sobre la selección de estrategias, mostramos que el trabajo realizado por Gómez (2006) en su

    Teorema 5.1 se puede extender sin mayores modificaciones a contextos más generales, probando que

    toda estrategia es elegida infinitas veces (Gómez trabajó solamente el caso especı́fico de funciones de

    olvido exponencial y potencia). Luego, ponemos el acento en ampliar los resultados de convergencia

    de los estimadores (Qn(s)).

    2.3.1. Selección de estrategias

    Teorema 1. Supongamos que una de las siguientes condiciones se cumple:

    (I) La función de olvido f satisface ∑n≥0

    f (n)∑nk=0 f (k)

    = +∞.

    (II) La función f es exponencial, es decir existe una constante ρ ∈ (0,1) tal que f (t) = ρt.

    Entonces, todas las estrategias en S son elegidas infinitas veces, con probabilidad 1.

    Demostración. La demostración de la suficiencia de la condición (I) seguirá los mismos pasos que

    el Teorema 5.1 de Gómez (2006). Denotemos por S∞ ⊆ S el conjunto (en principio aleatorio) deestrategias que son elegidas infinitas veces. Entonces, dada s ∈ S:

    P(s < S∞) = P((∃N ≥ 1)sn , s para todo n ≥ N).

    19

  • 2.3. Análisis

    Por la monotonı́a de los eventos involucrados, concluimos que

    P(s < S∞) = lı́mn→∞

    lı́mk→∞P(An,k),

    definiendo An,k como el evento en que sn , s, . . . , sn+k , s.

    Supongamos que la propiedad (I) es cierta. Entonces, en An,k se tiene que

    Qn+k(s) =f (n + k)α0(s) +

    ∑n−1i=1 f (n + k− i)I {si = s}Xi

    f (n + k) +∑n−1

    i=1 f (n + k− i)I {si = s}

    ≥ α0(s)f (n + k)∑n+k

    i=0 f (i).

    Por comodidad de notación, llamemos un = f (n)/∑n

    i=0 f (i).

    Ası́, en el evento An,k:

    Q̂n+k(s) =Qn+k(s)∑

    z∈SQn+k(z)≥ Qn+k(s)

    Qn+k(s) + (|S|−1)

    ≥ α0(s)un+kα0(s)un+k + (|S|−1)

    = 1− (|S|−1)α0(s)un+k + (|S|−1)

    De este modo, podemos calcular

    P(An,k+1) = P({sn+k+1 , s}∩An,k)

    = E(I(An,k)P(sn+k+1 , s|s1, . . . , sn+k)

    )= E

    (I(An,k)E(P(sn+k+1 , s|Hn+k)|s1, . . . , sn+k)

    )= E

    (I(An,k)E(1− Q̂n+k(s)|s1, . . . , sn+k)

    )≤ (|S|−1)

    α0(s)un+k + (|S|−1)P(An,k).

    20

  • 2.3. Análisis

    Con esta cota, obtenemos que

    P(An,k)P(An,0)

    ≤k−1∏i=0

    (|S|−1)α0(s)un+i + (|S|−1)

    =

    k−1∏i=0

    (1− α0(s)un+i

    α0(s)un+i + (|S|−1)

    )

    ≤k−1∏i=0

    (1− α0(s)un+i|S|

    )≤

    k−1∏i=0

    exp(−α0(s)un+i|S|

    )

    = exp

    −α0(s)|S|k−1∑i=0

    un+i

    y concluimos que P(An,k) converge a cero cuando k→∞, lo que implica el resultado deseado.

    (II) es el caso especı́fico de la función exponencial, que fue ya demostrado directamente por

    Gómez (2006). �

    2.3.2. Sobre otros modelos de urnas

    Antes de continuar con el análisis de nuestro modelo, revisitaremos nuestro resultado sobre selec-

    ción de estrategias de la sección anterior a la luz de otros modelos que se encuentran en la literatura,

    especı́ficamente con ciertas generalizaciones de la urna de Pólya presentada en la Sección 2.2.1, como

    lo son los procesos de bolas en urnas con feedback (ver, por ejemplo, Mitzenmacher et al., 2004; Oli-

    veira, 2008, 2009). Estos procesos pueden ser pensados como una urna de Pólya en la cual hay bolas

    de K colores distintos, y donde la probabilidad de extraer una bola de un color dado es proporcional a

    una función F de las cantidades de bolas de cada color en la urna. Es decir, la probabilidad de elegir

    una bola de color c ∈ {1, . . . ,K} está dada por

    F(nc)∑Ki=1 F(ni)

    ,

    donde ni es el número de bolas de color i presentes en la urna.

    Como ya mencionamos al describir la urna de Pólya, una diferencia crucial entre nuestro modelo

    21

  • 2.3. Análisis

    y los aquı́ considerados es que el primero utiliza selección proporcional a una media ponderada de los

    éxitos de la estrategia, mientras que los segundos lo hacen proporcionalmente a la cantidad de veces

    que ésta ha sido utilizada.

    Si bien en este capı́tulo consideramos solamente el caso de proporcionalidad exacta, es decir to-

    mando F la función identidad, Oliveira y otros han estudiado con particular interés el caso en que

    F(x) = xp, con p > 1. En este caso, se sabe que uno de los colores obtiene un monopolio, es decir

    existe casi seguramente un momento a partir del cual siempre se extrae bolas del mismo color. Esta

    conclusión marca una diferencia con nuestros resultados, donde vemos que que toda estrategia es ele-

    gida infinitas veces con probabilidad uno. Observamos, además, que esto no se debe a la presencia de

    la función F especı́fica considerada en la literatura, puesto que podrı́amos modificar la ley condicional

    de (sn) presentada en (2.6) por

    P(sn = s|Hn−1) =F(Qn(s))∑

    z∈SF(Qn(z)),

    y en esta nueva situación la demostración que hemos dado para el Teorema 1 es también válida (casi

    sin modificaciones) para demostrar que toda estrategia se elige infinitas veces con probabilidad uno

    para toda función F tal que cumpla (conjuntamente con la función de olvido f )

    ∑n≥0

    F(

    f (n)∑nk=0 f (k)

    )= +∞. (2.7)

    Para hacer más clara nuestra comparación con los modelos de bolas en urnas con feedback, deja-

    mos de lado nuestra función de olvido, tomando f (n) ≡ 1. De este modo, la Ecuación (2.7) se reducea ∑

    n≥1F(n−1) = +∞,

    lo que es fácil ver que se cumple para toda función F(x) = xp con p ∈ (0,2). Con esto, vemos quepara p ∈ (1,2) se tiene que elegir proporcionalmente a la tasa de éxito de una estrategia implica queésta será elegida infinitas veces casi seguramente, a diferencia de los modelos de bolas en urnas con

    feedback, en los cuales, con probabilidad uno, una urna obtiene el monopolio en el largo plazo.

    22

  • 2.3. Análisis

    2.3.3. Convergencia en el caso |S| = 1

    Cuando hay sólo una estrategia disponible la secuencia (sn) se vuelve trivial, de modo que la única

    ley de probabilidad de importancia en este caso es

    P(Xn = 1|X1, . . . ,Xn−1) = α,

    que se obtiene de la Ecuación (2.2), si denotamos α ≡ α(s) con s el único elemento de S (en lo queresta de esta sección, simplemente omitimos las referencias a s). Esta última expresión muestra inme-

    diatamente que (Xn) es ahora una secuencia i.i.d.de variables aleatorias, lo cual nos permitirá trabajar

    con bastante libertad. Veremos que en este caso, condiciones sobre el decaimiento de la función de

    olvido f nos permiten obtener conclusiones directas respecto de la convergencia de los estimadores

    (Qn), los cuales se reducen a la expresión

    Qn =f (n)α0 +

    ∑n−1k=1 f (n− k)Xk

    f (n) +∑n−1

    k=1 f (n− k)=

    f (n)α0 +∑n−1

    k=1 f (n− k)Xk∑nk=1 f (k)

    (2.8)

    El siguiente Teorema presenta un primer par de resultados, válidos para cualquier función de

    olvido f .

    Teorema 2. Se tiene que:

    1. El valor esperado de (Qn) converge a α.

    2. La probabilidad de que (Qn) converja es o bien 0, o bien 1.

    Demostración. A través de un cálculo simple, obtenemos que E(Qn) puede escribirse como λnα0 +

    (1−λn)α, conλn =

    f (n)∑nk=1 f (k)

    .

    Observamos que si∑

    k≥1 f (k) = L < +∞, entonces f (n) converge a cero cuando n→∞, y lo mismo

    23

  • 2.3. Análisis

    ocurre con λn. Por el contrario, si∑

    k≥1 f (k) = +∞, entonces nuevamente obtenemos que λn convergea cero, ya que f (n) ≤ f (0) = 1. De esto se sigue directamente la afirmación (1).

    La propiedad (2) se demuestra en modo análogo a la Ley 0-1 clásica de Kolmogorov, notando que

    el argumento del párrafo anterior nos permite también demostrar que, para cualquier n0 fijo,

    lı́mn→∞

    f (n)α0 +∑n0

    k=1 f (n− k)Xk∑nk=1 f (k)

    ≤ lı́mn→∞

    n0∑k=0

    λn−k = 0.

    De esto se desprende que la convergencia de (Qn) es un evento de la σ-álgebra cola de la secuencia

    (Xk), la cual es i.i.d.. Ası́, este evento debe tener probabilidad o 0 ó 1. �

    Dados estos primeros resultados, observamos que el espacio de funciones de olvido puede ser

    particionado en las funciones que aseguran, y las que impiden, la convergencia de (Qn) (es decir, las

    funciones f para las cuales la probabilidad de convergencia vale 1 ó 0, respectivamente). Los siguien-

    tes resultados nos darán luces acerca de cuál situación es la que corresponde para ciertas familias de

    funciones.

    Funciones de olvido de serie finita

    Teorema 3. Supongamos que la función de olvido f es tal que∑k≥0

    f (k) = L < +∞.

    Entonces 0 y 1 son, casi seguramente, puntos de acumulación de (Qn).

    Demostración. Sea δ > 0 pequeño, y elijamos p > 1 tal que∑

    k>p f (k) < δ. Gracias a la independencia

    24

  • 2.3. Análisis

    de (Xk), el Lema de Borel-Cantelli nos asegura que con probabilidad uno, para infinitos valores de

    n > p se tiene

    Xn−p = . . . = Xn−1 = 1. (2.9)

    Para cada uno de estos valores de n, se cumple

    Qn =f (n)α0 +

    ∑n−1k=1 f (n− k)X(n− k)∑n

    k=1 f (k)

    =f (n)α0 +

    ∑n−p−1k=1 f (n− k)X(n− k) +

    ∑pk=1 f (k)∑n

    k=1 f (k)

    ≥ 1L

    p∑k=1

    f (k) >L−δ

    L= 1− δ

    L.

    De aquı́, concluimos que (Qn) se acumula en 1. La acumulación en 0 se demuestra análogamente,

    tomando una subsecuencia de valores de n para los cuales Xn−p, . . . ,Xn−1 valgan todos cero (cuya

    existencia está garantizada, nuevamente, por el Lema de Borel-Cantelli). �

    Observación 1. Hemos elegido esta forma de enunciar el teorema de modo de poder extenderlo singrandes modificaciones a otras situaciones que estudiaremos en las próximas secciones. Sin embargo,

    la demostración del Teorema 3 aquı́ presentada puede ser ajustada fácilmente de modo de ver que a =1L∑n0

    k=0 akρk es también un punto de acumulación de (Qn), para cualquier n0 ≥ 0 y cualquier secuencia

    a0, . . . ,an0 de ceros y unos. La demostración consiste en tomar en la Ecuación (2.9) una secuencia no

    de unos, sino una secuencia compuesta que inicie con ceros y luego continúe con an0 ,an0−1, . . . ,a1,a0.

    El largo de la secuencia de ceros establecerá cuán cerca de a se encontrará el valor ası́ construido

    de Qn.

    Funciones de olvido de lento decaimiento

    Diremos que una función de olvido f es de lento decaimiento si existe un C > 0 tal que f (t) ≥C(1 + t)−1 para todo t ≥ 0.

    25

  • 2.3. Análisis

    Lema 1. Si f es una función de lento decaimiento, el cuociente

    Rn =∑n

    k=1 f (k)2 · logn(∑n

    k=1 f (k))2

    converge a cero cuando n→∞.

    Demostración. El caso en que lı́mt→∞ f (t) = µ > 0 es directo, ya que en este caso

    Rn ≈nµ2 logn

    (nµ)2=

    lognn

    .

    Supongamos ahora que f decrece a cero. A partir de la definición de lento decaimiento, obtenemos

    que para todo t ≥ 0 ∫ t0

    f ≥C log(1 + t) (2.10)

    y, en particular, que∫ ∞

    0 f = +∞.

    Supongamos que∫ ∞

    0 f2 = K < +∞. Entonces, usando la Ecuación (2.10) vemos que

    lı́mt→∞

    ∫ t0 f

    2 log t(∫ t0 f

    )2 ≤ lı́mt→∞ KC ∫ t0 f = 0.

    Si, por el contrario, tuviéramos que∫ ∞

    0 f2 =∞, entonces tenemos

    lı́mt→∞

    ∫ t0 f

    2 log t(∫ t0 f

    )2 ≤C−1 lı́mt→∞∫ t

    0 f2∫ t

    0 f,

    donde este último lı́mite es una forma indeterminada, la cual podemos calcular usando la regla de

    26

  • 2.3. Análisis

    L’Hôpital:

    lı́mt→∞

    ∫ t0 f

    2∫ t0 f

    = lı́mt→∞

    f 2(t)f (t)

    = lı́mt→∞

    f (t) = 0.

    Con esto, y haciendo uso de las desigualdades∫ n0

    g−1 ≤n∑

    k=1

    g(k) ≤∫ n

    0g

    válidas para cualquier función de olvido g, calculamos finalmente

    lı́mn→∞

    Rn ≤ lı́mn→∞

    ∫ n0 f

    2 logn(∫ n0 f −1

    )2 ≤ lı́mn→∞∫ n

    0 f2 logn(∫ n

    0 f)2 ·

    ∫ n

    0 f∫ n0 f −1

    2

    = 0,

    gracias a la Ecuación (2.10) y el hecho que el segundo factor de la última expresión es acotado. �

    Teorema 4. Supongamos que la función de olvido f es de lento decaimiento. Entonces (Qn) convergea α casi seguramente.

    Demostración. Sea ank = f (n− k)/∑n

    k=1 f (k). Podemos, entonces, escribir

    Q̃n ≡ Qn−E(Qn) =n−1∑k=1

    ank(Xk −E(Xk)).

    Para demostrar la convergencia casi segura de (Q̃n) a cero, utilizaremos el Teorema 1 de Giuliano

    Antonini et al. (2001), cuyo enunciado presentamos en el Apéndice A. Las condiciones que no se

    siguen directamente del hecho que (Xk −E(Xk)) es una secuencia uniformemente acotada, son:

    i. El conjunto {ank logn : n ≥ 1,1 ≤ k ≤ n} debe ser acotado. Esto es consecuencia directa de que fsea una función de lento decaimiento, ya que en tal caso ank logn está acotado por una constante.

    27

  • 2.3. Análisis

    ii. La sucesión (∑n−1

    k=1 a2nk logn) debe converger a cero. Notamos, sin embargo, que esta sucesión es

    igual a (Rn), la cual hemos definido y demostrado su convergencia a cero en el Lema 1.

    Con esto, Giuliano Antonini et al. (2001) nos asegura que la sucesión (Q̃n) converge completa-

    mente a cero14. Es sabido que la convergencia completa implica la convergencia casi segura (gracias

    al Lema de Borel-Cantelli, ver también Chung, 2001, Teoremas 4.2.1 y 4.2.2), y uniendo esto al hecho

    que E(Qt) −→ α cuando t→∞ gracias al Teorema 2, hemos completado la demostración. �

    2.3.4. Convergencia en el caso |S| > 1

    En este caso general, la secuencia (Xk) ya no es i.i.d., debido a que X1, . . . ,Xn inciden en el valor

    de sn+1, quien influirá a su vez en el valor de Xn+1. Sin embargo Gómez (2006) mostró, usando una

    técnica que utilizaba tiempos de parada, que ciertas subsucesiones aleatorias de (Xk) son en efecto

    i.i.d., lo cual le permitió extender parte de sus resultados a este caso.

    Definamos, entonces, dada una estrategia s ∈ S,

    τ1(s) = mı́n{k ≥ 1 : sk = s},τn+1(s) = mı́n{k > τn(s) : sk = s}.

    Es bien sabido que para cada n≥ 1 y s ∈ S, τn(s) es un tiempo de parada con respecto a la filtraciónZn = σ(s1, . . . , sn). Si s es elegida infinitas veces, entonces τn(s) es finito para todo n ≥ 1, y podemosdefinir Xk(s) = Xτk(s) para todo k ≥ 1.

    Gómez (2006, Sección 4.1) demostró que, bajo la hipótesis de que s ∈ S es elegida infinitas vecescon probabilidad uno, entonces (Xk(s)) es una secuencia infinita, i.i.d., con distribución Bernoulli de

    parámetro α(s). En esta sección, veremos que un argumento casi idéntico al del caso |S| = 1 permite14Decimos que una secuencia aleatoria (Wk) converge completamente a cero si y solamente si para cualquier ε > 0, la

    suma∑

    k P(|Wk | > ε) es convergente. Esta definición fue introducida por Hsu & Robbins (1947).

    28

  • 2.3. Análisis

    demostrar la no-convergencia de (Qn(s)) en esta situación más general. Recordemos que S∞ es elconjunto de estrategias que son elegidas infinitas veces.

    Teorema 5. El Teorema 3 (no-convergencia para las funciones de olvido de suma finita) es tambiénválido en el caso |S| > 1, para cada estrategia s tal que s ∈ S∞ casi seguramente. Es decir, si s ∈ S esuna tal estrategia, entonces tanto 0 como 1 son puntos de acumulación de (Qt(s)) con probabilidad

    uno.

    Demostración. Sea s una estrategia tal que s ∈ S∞ con probabilidad uno. Definamos N(n) como elnúmero de veces que s ha sido elegida hasta la etapa n, es decir N(n) = ∑nk=1 I {sk = s}. Haciendo usode esta notación, observamos que Qn(s) puede ser escrito como

    Qn(s) =α0(s) f (n) +

    ∑N(n−1)j=1 f (n−τ j(s))X j(s)

    f (n) +∑N(n−1)

    j=1 f (n−τ j(s)).

    Siguiendo el mismo hilo conductor del Teorema 3, dado cualquier p > 1 aplicamos el Lema de

    Borel-Cantelli a la secuencia i.i.d. (Xk(s)) para obtener que con probabilidad uno, y para infinitos

    valores de n > p: Xn−p(s) = . . . = Xn−1(s) = 1.

    Sea entonces m = 1 +τn−1(s). Con esto, como N(m−1) = n−1, se tiene que

    Qm(s) =α0(s) f (m) +

    ∑n−p−1j=1 f (m−τ j(s))X j(s) +

    ∑n−1j=n−p f (m−τ j(s))

    f (m) +∑n−p−1

    j=1 f (m−τ j(s)) +∑n−1

    j=n−p f (m−τ j(s))

    ≥α0(s) f (m) +

    ∑n−1j=n−p f (m−τ j(s))

    f (m) +∑n−p−1

    j=1 f (m−τ j(s)) +∑n−1

    j=n−p f (m−τ j(s))

    ≥ f (1)f (m) +

    ∑n−p−1j=1 f (m−τ j(s)) + f (1)

    .

    29

  • 2.4. Modificación 1: una estrategia a intervalos irregulares

    Notamos también que si l ≥ k entonces τl(s)−τk(s) ≥ l− k, con lo cual

    f (m) +n−p−1∑

    j=1

    f (m−τ j(s)) ≤ f (m) +n−p−1∑

    j=1

    f (n− j) ≤∑j>p

    f ( j).

    Ası́, recordando que f (1) ≤ 1, concluimos que si p es elegido de modo que esta última sumatoriasea menor que un δ > 0 dado, se tiene que para infinitos valores de m

    Qm(s) ≥1

    δ+ 1≥ 1−δ,

    lo que concluye la demostración. De modo análogo se demuestra la acumulación en 0. �

    En las siguientes secciones, abordaremos dos modificaciones del modelo que hemos presentado,

    con las cuales perseguimos aproximarnos más a ciertas situaciones psicológicamente comunes: por

    una parte, en el dı́a a dı́a las aplicaciones de una estrategia dada no suelen estar separadas por lapsos

    de tiempo de igual duración. Siendo una suposición válida para entornos experimentales pero no tanto

    para la realidad cotidiana donde se desenvuelve casi la totalidad de nuestro aprendizaje, cabe pregun-

    tarse si nuestros resultados de aprendizaje siguen siendo válidos al relajarla. La segunda modificación

    concierne el hecho sabido que, al dedicarnos continuamente a una tarea repetitiva, nuestro nivel de

    recursos cognitivos dedicados a la misma decae (es decir, la tarea se automatiza). Dado esto, estu-

    diaremos qué ocurre en el modelo con varias estrategias cuando el agente detiene su mecanismo de

    actualización de las variables (Qn(s)) en un instante dado, manteniendo sus probabilidades de elección

    constantes a partir de ese momento.

    2.4. Modificación 1: una estrategia a intervalos irregulares

    Para revisar la validez de nuestros resultados en el caso en que las aplicaciones de una estrategia

    no se encuentran equiespaciadas en el tiempo, en esta sección consideraremos que no en toda etapa

    30

  • 2.4. Modificación 1: una estrategia a intervalos irregulares

    n el agente puede observar el resultado Xn. Esto le estará permitido sólo en una selección de valores

    para n.

    Para lograr esto, modificamos levemente nuestro modelo de varias estrategias del modo siguiente.

    Tomemos S = {s, s̄}, donde s es la estrategia cuya efectividad α(s) deseamos estimar, y s̄ es un ele-mento de juguete, que utilizamos simplemente para representar la no elección de s. En este contexto,

    consideramos que más que elegir o no la estrategia s, el agente observa una nueva observación (Xk), o

    se le presenta la necesidad de usar esa estrategia, cada vez que sn = s. En este tratamiento, suponemos

    que la secuencia (sn) es i.i.d.e independiente de Hn−1, con P(sn = s) = µ ∈ (0,1). Esto tiene sentido sise considera que la oportunidad de observar una nueva variable (Xk) es dependiente del contexto, en

    lugar que del agente.

    Definamos Yn = I {sn = s}Xn. Tenemos que

    P(Yn = 1|Y1, . . . ,Yn−1) = E(P(Yn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}P(Xn = 1|sn,Hn−1)|Y1, . . . ,Yn−1)= E(I {sn = s}α(sn)|Y1, . . . ,Yn−1)= α(s)P(sn = s|Y1, . . . ,Yn−1)= α(s)µ.

    por lo que (Yn) es también una secuencia i.i.d., con distribución Bernoulli de media α(s)µ.

    Con esto, en el caso en que la función de olvido f es de lento decaimiento, podemos aplicar el

    Teorema 4 a las secuencias (Yn) e (I {sn = s}), obteniendo que con probabilidad uno

    lı́mn→∞

    f (n)α0(s) +∑n−1

    k=1 f (n− k)Yn∑nk=1 f (n)

    = α(s)µ

    lı́mn→∞

    f (n) +∑n−1

    k=1 f (n− k)I {sn = s}∑nk=1 f (n)

    = µ

    y, dividiendo ambas expresiones, concluimos que (Qn(s)) converge casi seguramente a α(s).

    31

  • 2.5. Modificación 2: varias estrategias, con estabilización

    Con respecto al resultado de no-convergencia para funciones de olvido de suma finita, hacemos

    notar que podemos aplicar exactamente el mismo argumento ya dado en la Sección 2.3.4 para el caso

    |S| > 1. En efecto, la secuencia (τk(s)) es precisamente el conjunto de etapas en las que el agenteobserva Xn. Esto genera una secuencia (Xk(s)) efectivamente infinita, gracias a la Ley de los Grandes

    Números que nos dice que con probabilidad uno

    lı́mn→∞

    1n

    n∑k=1

    I {sk = s} = µ > 0,

    es decir s ∈ S∞ casi seguramente.

    Con esto, Gómez (2006, Sección 4.1) nos asegura que nuevamente (Xk(s)) es una secuencia i.i.d.,

    y ası́ la demostración del Teorema 5 se aplica sin modificaciones.

    2.5. Modificación 2: varias estrategias, con estabilización

    Para comenzar, observamos que si modificamos la ley condicional de elección de estrategias dada

    en la Ecuación (2.6) a

    P(sn = s|Hn−1) = µ(s)

    donde µ(s) > 0,∑

    z∈Sµ(z) = 1, son probabilidades fijas, entonces la secuencia (sn) se vuelve inmedia-

    tamente i.i.d., con lo cual nos podemos reducir al caso de la Modificación 1 presentado en la sección

    anterior si consideramos separadamente cada estrategia s ∈ S, elegida con probabilidad µ(s) y no ele-gida con probabilidad 1− µ(s). Esto nos dice que valen en esta situación tanto el Teorema 3 sobrefunciones de olvido sumables, como el Teorema 4 sobre funciones de olvido de lento decaimiento, y

    esta vez para todos los elementos de S (además, S∞ =S casi seguramente). Es decir, si asumimos quela ley condicional de (sn) es constante, reobtenemos los buenos resultados de los casos con una única

    estrategia.

    En lo que resta de esta sección vemos que éste es también el caso cuando suponemos que la ley

    condicional de (sn) se estabiliza, es decir se hace constante, a partir de un tiempo T aleatorio. Este

    32

  • 2.5. Modificación 2: varias estrategias, con estabilización

    tiempo T lo podemos considerar como un instante decidido por el a