Control Aversivo

Embed Size (px)

Citation preview

  • - 235 -

    Asignatura: Aprendizaje (6 crditos). Obl. de 2 curso Grado Psicologa, Curso 2010/2011

    Profesores: Dr. Agustn Romero Medina ([email protected]) y Ldo. Pedro Jara Vera ([email protected]). Dept Ps. Bsica y Metodologa. Univ. de Murcia. Fac. Psicologa; En Aula Virtual Fac. Psicologa en http://avpsi.inf.um.es/moodle/ (usuario: dni sin letra; contrasea: dni sin letra); y en SUMA campus virtual

    Tema 5

    Condicionamiento instrumental:

    Control de estmulos y

    condicionamiento con estimulacin aversiva

    Bloque 2: Aprendizaje asociativo mediante condicionamiento Tema 3: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO CLSICO Tema 4: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO INSTRUMENTAL DE RECOMPENSA Tema 5: CONDICIONAMIENTO INSTRUMENTAL: CONTROL DE ESTMULO Y CONDICIONAMIENTO CON ESTIMULACIN AVERSIVA

    Indice del Captulo

    1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES237 1.1. Introduccin ...................................................................................................................................................................... 237

    1.1.1. El aprendizaje de seal en el condicionamiento instrumental .................................................................................. 237 1.1.2. El aprendizaje de seal como control de estmulos .................................................................................................. 238 1.1.3. Variaciones en las condiciones antecedentes y resultados de generalizacin y discriminacin .............................. 238 1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado ............................................................................. 238

    1.2. Tcnicas experimentales .................................................................................................................................................. 240 1.2.1. Tcnicas simples: el refuerzo diferencial .................................................................................................................. 240 1.2.2. El gradiente de generalizacin / discriminacin ........................................................................................................ 240

    2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS ................................................ 241 2.1. Procedimientos de estudio de la generalizacin .............................................................................................................. 241 2.2. Tipos de generalizacin .................................................................................................................................................... 242

    2.2.1. Generalizacin de estmulo ....................................................................................................................................... 242 2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas .............................................................. 242

    2.3. Por qu la generalizacin (teoras explicativas) ............................................................................................................... 243 3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS .................................................................. 244

    3.1. Tcnicas simples: Refuerzo diferencial discriminativo ..................................................................................................... 244 3.2. Tcnicas complejas de adquisicin de discriminacin ..................................................................................................... 245

    3.2.1. Atenuacin o desvanecimiento del estmulo ............................................................................................................. 245 3.2.2. Comparacin con la muestra .................................................................................................................................... 246 3.2.3. Combinacin de ED y refuerzo secundario: el encadenamiento .............................................................................. 246

    3.3. Por qu ocurre la discriminacin (teoras explicativas) .................................................................................................... 247 4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS ....................................................................... 248

    4.1. Condiciones durante la adquisicin .................................................................................................................................. 248 4.2. Condiciones de entrenamiento previo en discriminacin ................................................................................................. 249

    5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO .................................. 251 5.1. Aplicacin de instigadores y desvanecimiento ................................................................................................................. 251

    5.1.1. Dificultades con el refuerzo diferencial ..................................................................................................................... 251 5.1.2. Los instigadores como facilitadores de la discriminacin ......................................................................................... 252 5.1.3. Desvanecimiento de los instigadores ....................................................................................................................... 253 5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje .................................................................. 253

    5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente ...................................................................... 254 6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO ........................................................................................................... 254

    6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva ........................................................... 254 6.1.1. Tipos de aversividad ................................................................................................................................................. 254 6.1.2. Tipos de condicionamiento con estimulacin aversiva ............................................................................................. 255

    6.2. Condicionamiento de escape ........................................................................................................................................... 256 6.2.1. Definicin .................................................................................................................................................................. 256 6.2.2. Condiciones o factores en la adquisicin de la conducta de escape ........................................................................ 257

    6.3. Aprendizaje de evitacin ................................................................................................................................................... 258 6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos ...................................................................................... 258 6.3.2. Condiciones para la adquisicin de la respuesta de evitacin ................................................................................. 261 6.3.3. Por qu ocurre la evitacin (teoras explicativas) ..................................................................................................... 262 6.3.4. Extincin de la respuesta de evitacin ...................................................................................................................... 264

    6.4. Castigo ............................................................................................................................................................................. 267 6.4.1. Definicin, caractersticas y lneas de investigacin ................................................................................................. 267 6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin ......................................................................................... 268 6.4.3. Condiciones para la efectividad del castigo .............................................................................................................. 269

    6.5. La prdida del control de la accin: Indefensin aprendida ............................................................................................. 273 6.5.1. Concepto y tcnicas experimentales ........................................................................................................................ 273 6.5.2. Efectos o resultados de la indefensin aprendida .................................................................................................... 274 6.5.3. Condiciones para la adquisicin de la indefensin aprendida .................................................................................. 275

  • 236 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas) ................................................................................ 276 6.5.5. Repercusiones aplicadas de la indefensin aprendida ............................................................................................ 278

    7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5 ............................................................................................................. 279

    Resumen del tema

    En cuanto al control de estmulo en el condicionamiento instrumental, en mayor o menor medida, hay variedades de aprendizaje me-diante condicionamiento que combinan aspectos del condicionamiento clsico y del instrumental. As, en este captulo se analizan las po-sibilidades de los EC que se asocian no a EIs sino a respuestas reforzadas, o sea, los estmulos antecedentes de la respuesta instrumen-tal. En lo referente al condicionamiento instrumental aversivo, trataremos en este captulo aquellas tareas y procedimientos de aprendiza-je en donde se utilice estimulacin aversiva, sobre todo condicionamiento instrumental. En captulos anteriores estudiamos procesos y ta-reas de aprendizaje en los cuales los eventos significativos eran positivos (gratificantes o reforzantes). Sin embargo, una gran parte de la conducta que se aprende va dirigida no ya a obtener consecuencias positivas sino a eliminar, reducir o evitar situaciones desagradables. Analizaremos el condicionamiento instrumental con refuerzo negativo (escape y evitacin), tanto en sus aspectos de adquisicin como de extincin. Tambin estudiaremos procedimientos aversivos inhibitorios o que reducen la tasa de respuesta (castigo) y por ltimo, el efecto

    de la estimulacin aversiva no contingente en lo que se denomina indefensin aprendida.

    Lecturas complementarias

    Referente al control de estmulo, vanse los manuales de Hilgard y Bower (1966; trad. 1976, pp. 562-585), Hulse et al. (1980; trad. 1982, cap. 7), Kimble (1961; trad. 1969; 377-452), Marx (1969; trad. 1976; pp. 297-424), Rachlin (1976; trad. 1979, pp. 456-483), Tarpy (1981; trad. 1986, cap. 9), Wittig (1982, pp 119-136), y el captulo de Arias Holgado, Benjumea y Fernndez Serra (1997). Sobre control de estmulos desde un punto aplicado es til Sulzer-Azaroff y Mayer (1977; trad. 1983) y tambin el captulo de Navarro Guzmn (1994). Para cuestiones de escape, evitacin y castigo hay buenos captulos en Hulse et al. (1980; trad. 1982, pp. 167-207), Mackintosh (1983; trad. 1988, caps. 5 y 6), Pelechano (1980), Rachlin (1976; trad. 1979, caps. 5 y 9), Tarpy (1975; trad. 1977), pp. 125-186), Fernn-dez Castro (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) sobre indefensin es imprescindible la lectura del libro de Se-ligman (1975; trad. 1980) y las revisiones de Vazquez-Valverde y Polaino (1982), de Ferrndiz (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) . Tambin es muy ilustrativo el texto de Gray (1988; trad. cast. 1993) y el manual de Klein (1991; trad. cast. 1994, pp. 201-250)

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 237

    1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE

    CLAVES CONTEXTUALES ANTECEDENTES

    1.1. Introduccin

    1.1.1. El aprendizaje de seal en el condicionamiento instrumental

    En los temas precedentes de aprendizaje mediante condicionamiento hemos analizado situaciones en las que los resultados externos del aprendizaje (cambios conductuales) se hacan depender de las

    consecuencias estimulares (condicionamiento clsico) o de la accin (condicionamiento instrumental)

    pero en fenmenos separados y diferentes de aprendizaje. Sin embargo, es un hecho que la conducta

    no se da "en el vaco" (Mackintosh, 1977; p. 643, trad. esp., 1983) sino en un determinado contexto

    que est presente en el momento de emitir la respuesta y que puede influir en ella. Estos componentes

    del contexto que influyen en la respuesta se denomina, en la terminologa conductista, condiciones an-

    tecedentes. Estas condiciones pueden ser de dos tipos: motivacionales y estimulares:

    - Las primeras tienen, como sabemos (ver Tema 1), un valor activador (por ejemplo, es necesaria una

    cierta privacin de comida para que la rata inicie el condicionamiento) y no se van a tratar aqu.

    - Las condiciones antecedentes estimulares forman parte del contexto, ambiente o estimulacin previa

    o concomitante a la respuesta. As, la correlacin accin-consecuencia, necesaria para el aprendizaje

    de respuestas (condicionamiento instrumental) se convierte en un aprendizaje ms completo si consi-

    deramos la correlacin ANTECEDENTES - ACCION - CONSECUENCIA o, lo que es lo mismo, E-R-C (estmulo

    - respuesta - consecuencia). Es ms completo pues combina condicionamiento clsico y condiciona-

    miento instrumental, o sea,

    (ESTMULO CONSECUENCIA) + (RESPUESTA CONSECUENCIA) = ESTMULO RESPUESTA CONSECUENCIA

    En el condicionamiento clsico se produca un aprendizaje de seal, es decir, el EC activaba expec-

    tativas de consecuencia estimular favorable o desfavorable y con ello desencadenaba ms o menos au-

    tomticamente la respuesta. Tambin en el condicionamiento instrumental con estmulos discriminati-

    vos -es decir, en el aprendizaje de respuestas sealizadas o tambin aprendizaje instrumental seali-

    zado-, se hace un aprendizaje de seal (donde el EC se denomina ahora estmulo discriminativo o ED),

    pero la seal activa en la memoria no la representacin aislada de la consecuencia sino la representa-

    cin conjunta de accin - consecuencia (R-C). El esquema de esta comparacin es el siguiente:

    Tipo de condicionamiento Seal observable Representacin activada

    Condicionamiento clsico: EC EI

    Condicionamiento instrumental: ED (R-C)

    El aprendizaje instrumental sealizado tiene pues dos niveles de complejidad:

    - Que la respuesta se desencadene tras la aparicin del estmulo antecedente, es decir, que un estmulo

    ambiental cualquiera se convierta en seal predictiva para R-C. Esto es lo que podramos llamar ad-

    quisicin inicial del control de estmulo.

    - Que, una vez sealizada la conducta, sta se pueda realizar ante otras seales ms o menos parecidas.

    Se trata de adquirir la sealizacin especfica (discriminacin) o la sealizacin amplia (generaliza-

    cin). En cualquier caso, se adquiere control de estmulos: en un caso control de estmulos discri-minativos y en otro, control de estmulos generalizados o extensin del control a otros estmulos si-

    milares.

  • 238 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    1.1.2. El aprendizaje de seal como control de estmulos

    En los manuales de psicologa del aprendizaje, este aprendizaje instrumental sealizado aparece en

    temas con epgrafes del tipo "generalizacin y discriminacin" y tambin "control de estmulos". Esta

    ltima denominacin, si bien procede del enfoque operante skinneriano -Terrace (1966) fue el primero

    en utilizarla- , aqu, siguiendo entre otros a Rilling (1977) y Mackintosh (1977), va a tener un sentido

    ms amplio, neutro e integrador de los anteriores. Procederemos en este apartado a una delimitacin

    conceptual de estos trminos.

    Desde un punto de vista estrictamente skinneriano, se dice que una respuesta est bajo el control de

    un estmulo (generalmente denominado estmulo discriminativo, ED) cuando la probabilidad de que

    ocurra dicha respuesta es mayor en presencia de dicho estmulo que en su ausencia. Naturalmente, esta

    mayor probabilidad de respuesta ante el estmulo ocurre siempre que se establezca una experiencia

    previa de correlacin entre estmulo antecedente - accin - consecuencia positiva. Por tanto "control"

    aqu se entiende como mayor posibilidad de prediccin de que se emitir la respuesta en presencia de

    ese estmulo (y no como obligatoriedad o necesidad de emitir la respuesta ante ese estmulo). La forma

    de comprobar que se ha producido la adquisicin de control de estmulo es si existe diferente tasa o

    probabilidad de respuesta en presencia de distintos estmulos (mayor ante ED que ante otros estmu-

    los).

    1.1.3. Variaciones en las condiciones antecedentes y resultados de gene-ralizacin y discriminacin

    Una vez establecida la correlacin estmulo-accin-consecuencia (si estamos en el con-

    dicionamiento instrumental) o la correlacin estmulo-consecuencia (si se trata del condicionamiento

    clsico), el control de estmulo puede darse ante ms o menos estmulos en funcin del tipo, cualidad o

    magnitud de los estmulos antecedentes y de las consecuencias que tenga la conducta ante cada uno de

    ellos. As es como se puede lograr la especificidad (discriminacin) o la extensin de la capacidad se-

    alizadora a otros estmulos (generalizacin). Estas dos posibilidades deben entenderse como resulta-

    dos conductuales de dichas manipulaciones.

    Ambos conceptos se configuran como dos extremos de un continuo. En un extremo, el incremento

    de respuesta ante diversos estmulos parecidos (generalizacin) y, en otro, ante estmulos muy espe-

    cficos (discriminacin). En cualquier punto del continuo siempre se tenemos estmulos antecedentes

    que controlan (predicen) respuestas, es decir, que son capaces de predecir una alta probabilidad de ocurrencia de las mismas en su presencia. En cierto sentido, la adquisicin del control de estmulo sue-

    le requerir una discriminacin de estmulos. Ahora bien, lo que se trata de aprender es el grado en que

    varios (generalizacin) o un solo estmulo (discriminacin) son capaces de sealizar la respuesta (y

    por tanto responsables del control de estmulo). Obviamente, entendemos que a medida que aumenta la

    generalizacin, disminuye la discriminacin, y viceversa. Discriminacin y generalizacin son fen-

    menos opuestos porque mantienen una relacin inversa.

    El control de estmulos, y sus aspectos de discriminacin y generalizacin, es un proceso con un

    gran valor adaptativo para el hombre (y otras especies). Se trata de aprender a responder selectivamen-

    te ante determinados estmulos (por sus consecuencias gratificantes) y a no responder ante otros (por

    sus repercusiones aversivas o simplemente por su falta de repercusiones).

    1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado

    La palabra "antecedentes" aqu tiene una dimensin temporal amplia en cuanto al momento del es-

    tablecimiento de la correlacin con la accin y/o con la consecuencia. En cualquier caso, una vez re-

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 239

    presentada en la memoria esta expectativa de relacin triple (estmulo antecedente, accin, consecuen-

    cia), la mera aparicin del antecedente servir para desencadenar la accin, convirtindose as en seal

    o indicio de que la accin tendr una consecuencia positiva y permitiendo una proximidad temporal

    entre el antecedente y la accin.

    Como dicen Domjan y Burkhard (1986), es tan habitual el control de estmulos que no pensamos

    en la cantidad de veces que lo aplicamos y lo raro que resultara -por no decir anormal o patolgico- el

    mostrar conductas que no estn bajo el control de estmulos. Citan cuatro ejemplos y contraejemplos

    interesantes:

    - La conducta de desnudarse para cambiarse de ropa se hace en la intimidad del dormitorio y no en

    medio de la calle,

    - se mira la TV si est encendido el aparato y no si est apagado,

    - se tiene una interaccin cariosa (caricias, besos) con familiares prximos y no con desconocidos,

    - se grita en un partido de ftbol y no en clase o en la biblioteca.

    En todos estos casos, la conducta se hace cuando se est en el contexto adecuado y no en otros

    momentos. Eso es control de estmulos o aprendizaje instrumental sealizado.

    Pero hay ms ejemplos: Al circular en coche por la carretera, una seal de STOP es ED, antecedente

    o indicio inmediato de que si se realiza la respuesta (parar) se obtendr una consecuencia (no peligro);

    en este caso (que aunque es ms bien de evitacin sirve igualmente en este momento), la conexin en-

    tre ese estmulo, la respuesta y la consecuencia pudo aprenderse hace tiempo (al estudiar para la ob-

    tencin del carnet de conducir, por ejemplo) pero es obvio que la aparicin del estmulo genera inme-

    diatamente una mayor probabilidad de respuesta.

    El tema es pues de gran importancia terica y sobre todo prctica. La conducta adaptativa se carac-

    teriza, entre otras cosas, por producirse "en el momento oportuno" (Hulse, Egeth y Deese, 1982; p.

    206) y el momento oportuno para responder slo lo puede anticipar el sujeto si aparecen las corres-

    pondientes seales de ello. Ser ms probable que una accin tenga consecuencias adaptativas cuando

    se sabe cundo y en qu lugar y en presencia de qu eventos se debe realizar. Por citar ms ejemplos,

    en clase el alumno no habla (respuesta de "estar atento y en silencio") cuando-el-profesor-expone-el-

    tema (ED), cruzamos la calle (respuesta) cuando el-semforo-est-en-verde (ED), escribimos (respues-

    ta) cuando observamos salir la tinta (ED) del bolgrafo al rozar su punta sobre el papel. Ahora bien, co-

    gemos el telfono (respuesta) cuando omos el timbre (ED) pero no si omos el timbre de la puerta (dis-

    criminacin) y decimos "mesa" (respuesta) cuando dicho conjunto de letras lo vemos escrito con

    maysculas o con minsculas o en cursiva (generalizacin).

    El situar la accin bajo el control del o de los estmulos es un aprendizaje bsico. En la mayora de

    situaciones cotidianas es una conducta o hbito sobreaprendido (o aprendido hace mucho tiempo), pe-

    ro en otras tenemos que activar continuamente estrategias que logren un control del estmulo. Por

    ejemplo, ante un aparato no muy conocido (video, ordenador, equipo de msica, etc. ), su manejo ini-

    cial (respuesta) es dificultoso y debe ponerse bajo el control de estmulo para aprenderlo, y para ello

    ponemos en marcha distintas estrategias (leer las instrucciones, buscar a un experto y que nos explique

    el manejo, mtodo de ensayo y error, etc.). Pero hay conductas muy complejas para cuya realizacin

    se requiere un sofisticado y laborioso control de estmulo que tarda tiempo en establecerse. As, la

    conducta lectora exige situarse ante un texto escrito, fijar los ojos en los smbolos grficos adecuados

    y emitir los sonidos correspondientes. El lector maduro tiene un adecuado control de estmulo pero el

    nio que aprende a leer necesita ayuda (profesores, mtodos especiales de presentacin de estmulos

    en cartillas, dosificacin de dificultad, etc. ). Hay una serie de mtodos generales desarrollados para instigar inicialmente el hecho de que la conducta se site bajo el control del estmulo.

    As pues dedicaremos este captulo al aprendizaje instrumental sealizado o control de estmulos,

    para lo cual estudiaremos los procedimientos de adquisicin, las condiciones, teoras y procesos y

    tcnicas aplicadas.

  • 240 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    1.2. Tcnicas experimentales

    1.2.1. Tcnicas simples: el refuerzo diferencial

    As como el caso de un estmulo reforzante su efectividad es casi automtica para aumentar la pro-

    babilidad de emisin de la respuesta, no ocurre as con los ED. Estos inicialmente no sealizan nada y

    por tanto se necesita un perodo de adquisicin de dicha funcin. Para conseguir que un estmulo ad-

    quiera la funcin de ED, el procedimiento ms usado es el refuerzo diferencial discriminativo. Se lleva

    a cabo mediante dos operaciones bsicas:

    - reforzar una respuesta emitida en presencia del estmulo o estmulos particulares, que queremos que

    se conviertan en ED .

    - no reforzar dicha respuesta si ocurre en ausencia de dichos estmulos o ante otros diferentes (E ).

    Un ejemplo es el experimento original de Guttman y Kalish (1956) en palomas. El procedimiento

    inclua dos fases:

    I) Fase de entrenamiento: Al picotear un disco iluminado las palomas reciban refuerzo continuo. Se

    vari la intensidad de luz del disco y as se hicieron cuatro grupos de palomas, uno para cada inten-

    sidad -530, 550, 580 y 600 nanmetros (nm, medida de longitud de onda)-.

    II) Fase de prueba: Para cada grupo, el disco se iluminaba con 11 diferentes longitudes de onda (de

    470 a 640 nm.), con una duracin en cada caso de 30 segs. La respuesta era reforzada slo tras uno

    de los 11 estmulos presentados (convirtindose as en ED). Hubo 12 ensayos para cada estmulo. El

    resultado fue una mayor probabilidad de respuesta ante el ED que ante los otros estmulos y una

    fuerza de respuesta en forma de U invertida (el pico de respuesta mxima ante ED), formando as lo

    que denominaron un gradiente de generalizacin.

    1.2.2. El gradiente de generalizacin / discriminacin

    La mejor tcnica para evaluar el grado de generalizacin o discriminacin que se produce en la ad-

    quisicin del aprendizaje instrumental sealizado es la del gradiente de generalizacin / discrimina-

    cin. Es un procedimiento iniciado por Guttman y Kalish (1956) que presenta los resultados en trmi-

    nos de representacin grfica de la fuerza (intensidad o frecuencia) de la respuesta dada al estmulo

    original y a otros estmulos semejantes. El grado de generalizacin de estmulo se aprecia en la magni-

    tud o frecuencia de respuesta. Cuanto menos similar sea el nuevo estmulo al estmulo original menor

    ser la fuerza de la respuesta, y esto ocurre de forma graduada siguiendo un patrn determinado que se

    presenta grficamente en forma de U invertida.

    Adems, como ya dijimos que generalizacin y discriminacin son extremos opuestos de un conti-

    nuo, ambos fenmenos pueden evaluarse en un mismo gradiente. En la Figura 1 tenemos un ejemplo

    de gradiente de generalizacin en dos de sus manifestaciones extremas: cuando se da mucha generali-

    zacin (a) y cuando es escasa, y por tanto hay una gran discriminacin (b).

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 241

    Figura 1: Representacin grfica de dos tipos de gradientes de generalizacin.

    En el grfico (a) de la figura anterior, se produce una amplia dispersin de la generalizacin de

    estmulo como forma de responder a diversos estmulos. En el caso del grfico (b) se produce una res-

    puesta diferenciada y por tanto una escasa generalizacin de estmulo. La representacin grfica (c) es

    otra forma de exponer grficamente el gradiente de generalizacin.

    Adems de estos gradientes excitatorios, tambin es posible lograr gradientes inhibitorios o gra-

    diente de extincin. Un ejemplo es el experimento de Honig (1961) con palomas. Tena tres fases:

    I) Fase preliminar, en la que se estableca una lnea base de adquisicin mediante refuerzo de una res-

    puesta de picoteo de un disco iluminado con 13 longitudes de onda diferentes (de 490 a 630 nm). El

    animal responda pues ante los 13 estmulos.

    II) Fase de extincin: ante uno (E ) de los 13 estmulos (570 nm) la respuesta nunca era reforzada.

    III) Prueba de generalizacin: Se volvan a presentar los 13 estmulos. Los resultados, presentados

    grficamente en el correspondiente gradiente muestran una funcin en U, siendo el pico inferior la

    respuesta ante E .

    2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS

    GENERALIZADOS

    2.1. Procedimientos de estudio de la generalizacin

    El procedimiento bsico es tambin de refuerzo diferencial, midiendo las tasas de respuesta que se

    dan tras cada estmulo, antes y despus de ser reforzada la respuesta. Se trata pues de comparar tasas

    de respuesta en presencia de diferentes estmulos.

    Hay dos grupos de tcnicas diferentes: las que suponen presentar estmulos diferentes a los mismos

    sujetos y las que hacen presentar el mismo estmulo a distintos grupos de sujetos:

    - El primer tipo de tcnica es la del estmulo repetido, segn la cual se presentan estmulos distintos

    (pero similares al condicionado) en orden aleatorio. Tiene el inconveniente de que la respuesta ante

    uno de los estmulos puede verse muy influida por las consecuencias de las respuestas ante los otros.

    - El segundo tipo de tcnica se llama tcnica del estmulo nico: se divide al grupo experimental en

    subgrupos y cada uno de ellos recibe slo un estmulo (diferente para cada grupo); se comparan las

    tasas de respuestas de los distintos grupos entre s.

    Fuerza de la

    respuesta

    E original

    (a) E original (b)

    Intensidad o

    frecuencia

    E1 E2 E3 E4

    (c)

  • 242 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    2.2. Tipos de generalizacin

    La generalizacin puede ser, en general, de dos tipos: generalizacin de estmulo y de respuesta. En

    la primera es la misma respuesta la que surge ante otros estmulos distintos del inicialmente condicio-

    nado; en la segunda es una primera respuesta reforzada la que provoca que aparezcan respuestas pare-

    cidas.

    2.2.1. Generalizacin de estmulo

    Mediante procedimientos de la generalizacin de estmulo, una misma respuesta podr realizarse

    ante situaciones o contextos no idnticos pero similares a aquellos en que tuvo lugar el entrenamiento.

    Es decir, el reforzamiento de una respuesta ocurrida siempre en presencia de un mismo estmulo, pro-

    voca que dicha respuesta se pueda producir ante parecidos estmulos. Por ejemplo, un nio puede mos-

    trar temor como respuesta a un mdico, debido a una asociacin del mdico con el dolor producido por

    una inyeccin y luego tendr miedo ante cualquiera que lleve bata blanca.

    El grado de generalizacin del estmulo principalmente depende del grado de similaridad del nuevo

    estmulo bajo el cual tambin se emiti la respuesta.

    Algn autor (Wittig, 1982, p. 119) distingue dos tipos de generalizacin del estmulo:

    - Generalizacin primaria, en la que el organismo responde no slo al estmulo original sino a otros

    con propiedades fsicas similares. Por ejemplo, una rata entrenada a responder al tic-tac del metr-

    nomo puede responder tambin al golpeteo de una varilla en un bloque de madera.

    - Generalizacin secundaria, segn la cual un organismo responde a un estmulo debido a alguna

    equivalencia aprendida entre los dos. Por ejemplo, un sujeto entrenado a responder a la palabra "alto"

    puede tambin responder a la palabra "pare". Es algo similar al condicionamiento de segundo orden

    en el condicionamiento clsico.

    La generalizacin de estmulos es un fenmeno conductual omnipresente. Gracias a l no tenemos

    que aprender constantemente una respuesta ante cada estmulo nuevo sino que ante estmulos similares

    damos una respuesta semejante. De este modo, un maestro puede pretender que el alumno aprenda a

    leer, por ejemplo la letra A, no slo con la grafa propia de la cartilla escolar sino en cualquier otra

    grafa.

    La generalizacin tiene pues ventajas para el aprendizaje pero tambin algn inconveniente. En

    trminos positivos, proporciona estabilidad al comportamiento y tiene por tanto gran valor adaptativo.

    En trminos negativos y segn las condiciones especficas, puede entenderse como una mala discrimi-

    nacin o una discriminacin todava mal lograda.

    2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas

    La generalizacin de respuesta consiste en un aumento de probabilidad de ocurrencia de otras res-

    puestas parecidas a la reforzada. El reforzamiento de una respuesta aumenta la probabilidad de otras

    respuestas similares. En esto se basa el mtodo de moldeamiento (shaping), muy utilizado en modifi-

    cacin de conducta -y tambin como procedimiento experimental para la adquisicin rpida del condi-

    cionamiento de recompensa; vase aptdo. 1.4.2.a del Tema 4)-.

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 243

    Se basa en el refuerzo de cada respuesta que se parezca o aproxime a una "respuesta terminal" o

    conducta objetivo seleccionada de antemano. Se emplea el moldeamiento o mtodo de aproximacio-nes sucesivas cuando la respuesta terminal no se da habitualmente en el repertorio comportamental del

    sujeto. As, si uno es reforzado por sonrer, aumenta la frecuencia de la risa y quizs de otras res-

    puestas tales como la conversacin. O sea, la alteracin en la frecuencia de una respuesta puede influir

    de forma inadvertida en otras. En resumen el esquema que corresponde a ambos tipos de generaliza-

    cin sera el que se muestra en la Figura 2.

    GENERALIZACION DE GENERALIZACION DE ESTIMULO RESPUESTA

    E1 R1 Eref E1 R1 Eref E1 R1

    E2 R1 E1 R2

    E3 R3

    Figura 2: Esquema sobre los tipos de generalizacin.

    2.3. Por qu la generalizacin (teoras explicativas)

    Las tres teoras explicativas ms clsicas son las siguientes:

    a) Teora de Hull: Segn Hull (1943), la generalizacin es un proceso primario inherente al condicio-

    namiento. Las respuestas durante la adquisicin son condicionadas no a un simple estmulo sino a

    lo que l llama una "zona" de estmulos. Todos los estmulos en la zona son similares, esto es, se

    relacionan a travs de un continuum sensorial particular de diversas intensidades pero dentro de una

    misma modalidad sensorial y todos se vinculan a la respuesta. El hecho de que ms de un estmulo

    sea capaz de elicitar una respuesta se hace evidente en una prueba de generalizacin donde se pre-

    sente una variedad de estmulos a travs de un continuum sensorial.

    b) Teora de Lashley y Wade: Para Lashley y Wade (1946), la generalizacin ocurre porque el sujeto

    no consigue discriminar entre estmulos; la generalizacin resulta pues de una discriminacin im-

    perfecta. Las respuestas se daban meramente porque los sujetos no discriminaban adecuadamente

    entre el estmulo original y los estmulos generalizados. Si el sujeto puede distinguir entre estmu-

    los, no los confunde y consecuentemente no puede generalizar.

    c) Teora de la generalizacin mediada de Osgood: Segn Osgood (1953), pueden hacerse equiva-

    lentes ciertos estmulos diferentes (es decir, evocar la misma respuesta) si suscitan la misma res-

    puesta mediadora. Esta respuesta es un eslabn intermedio e interno de la cadena general de even-

    tos que comienza con el estmulo y acaba con la respuesta. El aprendizaje perceptivo temprano

    produce estas respuestas mediadoras implcitas. Es claro que los estmulos fsicamente similares

    suscitan la misma respuesta mediadora en mayor medida que los estmulos diferentes. La hiptesis

    de la mediacin viene representada en la Figura 3.

    Ambos estmulos evocan la misma respuesta mediadora (rm), acompaada a su vez de un est-

    mulo mediador interno (em). Durante la adquisicin, em es el ltimo eslabn antes de R, al igual que

    ante el estmulo generalizado.

  • 244 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    1. Desarrollo de la EC1 rm em

    respuesta mediadora EC2 rm em

    2. Adquisicin EC1 rm em R1

    3. Prueba de generalizacin EC2 rm em

    Figura 3: Hiptesis de la generalizacin mediada de Osgood.

    3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS

    3.1. Tcnicas simples: Refuerzo diferencial discriminativo

    Segn Millenson y Leslie (1979, pp. 247-248), el paradigma bsico de discriminacin consta de

    una respuesta (R) y dos condiciones de estmulo (ED y E ). La R es reforzada en presencia de uno de

    los estmulos, el ED, y no es reforzada en presencia de la otra condicin estimular, el E (con lo cual se

    extinguir dicha R). El resultado es que la probabilidad de responder ante ED se hace mayor que ante

    E . Dichas condiciones podran representarse del siguiente modo:

    ED - R Eref

    E - R / no Eref

    donde = "es seguida por"; / = "no hay consecuencias programadas". E se usa tam-

    bin para denotar condiciones no slo de ausencia de refuerzo (extincin) sino de menor refuerzo que

    para ED.

    El refuerzo diferencial tiene en el contexto experimental dos variantes: La tcnica de discrimina-

    cin simultnea y la de discriminacin sucesiva:

    TCNICA DE DISCRIMINACIN SIMULTNEA

    Se presentan los dos estmulos (ED y E ) al mismo tiempo y se refuerza la eleccin correcta. Es la

    tcnica usada por Lashley (1930) en su trampoln de saltos con ratas: La rata salta a una u otra de las

    puertas, si la eleccin es correcta se abre la puerta y el animal llega a la comida, si no lo es, al saltar no

    se abrir la puerta. En la Figura 4 podemos apreciar dicho dispositivo.

    DISCRIMINACIN SUCESIVA

    Se presentan sucesiva y alternativamente ambos estmulos y se refuerza la respuesta slo ante ED y

    no ante E . Tanto en el caso de la discriminacin simultnea como de la sucesiva, se consigue un au-

    mento de la tasa de respuesta en presencia de ED y un cese progresivo y desaparicin de la respuesta

    ante E . As es como el sujeto ha aprendido a dar respuesta selectiva ante un estmulo, o lo que es lo

    mismo, ha aprendido a "discriminar" dicho estmulo, lo distingue de otros, da ante l una respuesta

    distinta que ante otros estmulos.

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 245

    Figura 4: Dibujo esquemtico del dispositivo de discriminacin de Lashley.

    3.2. Tcnicas complejas de adquisicin de discriminacin

    En el estudio de la discriminacin se han utilizado otros procedimientos ms complejos, algunos de

    los cuales tienen aplicaciones prcticas importantes. Citaremos slo tres de ellos:

    3.2.1. Atenuacin o desvanecimiento del estmulo

    El desvanecimiento (fading) implica que se deben hacer desaparecer progresivamente a lo largo del

    entrenamiento determinadas caractersticas de un ED (forma, color, situacin, tamao) que el sujeto

    discriminaba desde el principio con facilidad. stas van desapareciendo, "atenundose" poco a poco, a

    la vez que se produce un aumento de intensidad de otras caractersticas del mismo estmulo, las cuales

    hacen de nuevo ED. Este procedimiento permite obtener aprendizajes discriminativos muy complica-

    dos. Se parte de caractersticas estimulares que un sujeto ya conoce y se llega a otras que antes no dis-

    criminaba. As, por ejemplo, cuando el nio empieza a escribir traza las letras por encima de los pun-

    teados y dentro de los renglones marcados en su libreta de aprendizaje. Poco a poco, se irn eliminan-

    do los punteados de las letras y tambin los renglones que delimitan el tamao y ordenamiento de la

    escritura, hasta que la simple instruccin del profesor para escribir una letra o palabra sobre un folio en

    blanco sea un ED suficiente.

    Una variante compleja de desvanecimiento es la tcnica de discriminacin sin error.

    Se trata de un fenmeno descubierto por Terrace (1964). Para lograr esa discriminacin sin error, a

    los sujetos se les presenta ED y E , generalmente el ED con la mayor fuerza posible y el E con una in-

    tensidad muy dbil. Las respuestas al ED se refuerzan y se incrementan pero se logra que el sujeto no

    d ninguna respuesta no reforzada al otro estmulo, puesto que, al principio, E no tiene igual fuerza

    que ED sino mucho menor, de modo que el E empieza por ser irrelevante en el medio ambiente del su-

    jeto, y aunque despus vaya aumentando en intensidad, ya ser muy difcil responder ante E si a la

    vez se ha reforzado la respuesta ante ED.

    Es pues un procedimiento gradual mediante el cual se vigoriza la fuerza de la respuesta a un ED, a

    la vez que no se permiten respuestas no reforzadas al E . Terrace lo consigui en palomas "desvane-

    ciendo" el E al principio y hacindolo cada vez ms fuerte a lo largo del entrenamiento. Hay pues una

    presentacin progresiva del E : al principio muy distinto del ED y conforme avanza el proceso de

    aprendizaje se parece ms al ED (por ejemplo, de presentarse durante dcimas de segundo pasa a durar

    lo mismo que ED). Siendo todas las respuestas correctas y reforzadas ante ED se consigue que no apa-

  • 246 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    rezca ninguna respuesta ante E (no hay frustracin al no haber errores, al no darse respuestas que no

    vayan seguidas de recompensa) y se puede llegar a un grado de discriminacin muy elevado.

    En el mbito aplicado la utilizacin de desvanecimiento es fundamental cuando se aplican instiga-

    dores (vase apartado 5).

    3.2.2. Comparacin con la muestra

    Es una tcnica de discriminacin que tiene dos variantes: igualacin y diferenciacin de la muestra.

    - Igualacin a la muestra: Consiste en utilizar, en primer lugar, el estmulo objetivo que se tiene que

    discriminar (denominado estmulo de muestra) y despus presentarlo junto a otros estmulos pareci-

    dos. La recompensa se dar cuando el sujeto elija precisamente el idntico al de muestra.

    - Diferenciacin de la muestra: Se presenta un estmulo muestra y una serie de alternativas que son to-

    das iguales a la muestra excepto una que es la que se refuerza cuando es elegida.

    Son procedimientos que suele emplearse en la reeducacin de "dficits perceptivos" y trastornos

    asociados con la percepcin. La Figura 5 nos muestra un ejemplo de aplicacin de estas tcnicas en

    el aprendizaje de la lectura.

    Figura 5: Ejemplos de aplicacin de tcnicas de igualacin y diferenciacin a la muestra

    3.2.3. Combinacin de ED y refuerzo secundario: el encadenamiento

    Otro caso en el que interviene la discriminacin es en el procedimiento de encadenamiento. Esta es

    una tcnica experimental y tambin aplicada (en modificacin de conducta), utilizada en la adquisicin

    b

    b

    d

    b

    p

    d

    q

    b

    b

    b

    h

    b

    Estmulo de muestra

    Estmulo de muestra

    Igualacin con la muestra

    Diferenciacin de la muestra

    1 se presenta:

    1 se presenta:

    2 se presentan:

    2 se presentan:

    Si seala este E, se da refuerzo muestra

    Si seala este E, se da refuerzo muestra

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 247

    de conductas nuevas. Es un procedimiento basado en el concepto de refuerzo condicionado o secunda-

    rio, ya explicado en el Tema 4.

    El encadenamiento es un procedimiento que consiste en ordenar secuencias o cadenas continuas de

    estmulos y respuestas mantenidos en unin por estmulos que tienen una doble funcin: como refuer-

    zo secundario y como ED.

    Una cadena de este tipo est compuesta de eslabones, cada uno de los cuales consta de una secuen-

    cia de ED - RESPUESTA - REFUERZO CONDICIONADO. Se exige tambin que el primer elemento de la ca-

    dena sea un ED, que el resto de estmulos discriminativos sean a su vez refuerzos condicionados y que

    el ltimo refuerzo de la cadena sea primario.

    Un ejemplo sera el siguiente: Un chimpanc opera una mquina mediante la cual recibe una ficha

    que cambia a continuacin por alimento. La cadena sera la que encontramos en la Figura 6.

    E1D R1 E

    D (mquina) (operar

    mquina) Ref. cond. 1 R2 Eref

    (ficha) (cambiar (uva) ficha por uva)

    Figura 6: Ejemplo de encadenamiento

    Otro ejemplo sera la secuencia de respuestas para ir a un restaurante:

    1) ED (llamada telefnica de un amigo, hora del da, hambre).

    2) Varias respuestas secuenciadas (levantarnos, abrir la puerta, salir de casa, entrar al coche, conducir,

    aparcarlo, entrar al restaurante, sentarnos, leer el men, pedir la comida, comerla). El estmulo am-

    biental que sigue a cada respuesta da ocasin a la siguiente respuesta de la cadena.

    3) La cadena total est mantenida por la comida que finalmente comemos.

    As pues en resumen, el encadenamiento sigue los siguientes pasos:

    1) Presentacin de un ED

    2) Respuesta en presencia de ED

    3) Aparicin consiguiente de otro E que es refuerzo condicionado respecto al paso anterior y ED para...

    4) ... una nueva respuesta

    5) Estmulo nuevo que es refuerzo condicionado y ED ... etc.

    ...

    n) El ltimo estmulo que forma la cadena es un reforzador primario o innato.

    Para un uso aplicado de este procedimiento vase el libro de Sulzer-Azaroff y Mayer (1977).

    3.3. Por qu ocurre la discriminacin (teoras explicativas)

    Hay dos teoras clsicas fundamentales:

    a) Teora de la continuidad de Hull-Spence. Elaborada por Hull (1943) y Spence (1936), puede con-

    siderarse la ms antigua y tradicional teora en torno a la discriminacin. Tiene tres principios bsi-

    cos:

    1, el refuerzo conduce a un incremento de la fuerza excitatoria del ED;

    2, el refuerzo aumenta la fuerza inhibitoria del ED;

    3, ambas tendencias (excitatorias e inhibitorias) se generalizan a otros estmulos similares y los

    gradientes se suman para producir la respuesta diferencial.

    Esta teora ha sido criticada recientemente dando paso a otra ms actual: la teora atencional.

  • 248 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    b) Teora atencional. Es original de Sutherland y Mackintosh (1971). Segn dicha teora, el aprendi-

    zaje discriminativo implica dos procesos discretos: el refuerzo de la atencin a una o ms dimen-

    siones relevantes del estmulo y la concesin de una respuesta particular al estmulo relevante.

    El sujeto aprende dos cosas durante los experimentos de discriminacin:

    1, aprende a atender a las dimensiones particulares del ambiente sobre la base de que las conse-

    cuencias de dicha atencin predicen correctamente importantes eventos (posible refuerzo ulte-

    rior a la respuesta); y

    2, aprende a responder en funcin del refuerzo.

    4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS

    Varios autores (Tarpy y Mayer, 1978; Wittig, 1982) sealan diversas condiciones importantes para

    la adquisicin del control de estmulos. Dado que generalizacin y discriminacin son extremos de un

    continuo, lo normal es que la condicin que favorece a una dificulte a la otra. Por eso, aunque los ma-

    nuales separan las condiciones para un tipo u otro de control de estmulos, creemos preferible unirlas

    agrupndolas en: condiciones durante la adquisicin y condiciones de entrenamiento previo en discri-

    minacin.

    4.1. Condiciones durante la adquisicin

    a) Grado de adquisicin o nmero de ensayos de aprendizaje

    Cuanto menor sea el grado de adquisicin, es decir, el nmero de presentaciones del estmulo, ms

    fcil es la generalizacin. Si prosiguen los ensayos el gradiente se hace ms puntiagudo y por tanto

    hay mayor discriminacin.

    b) Intervalo entrenamiento-prueba

    Cuanto mayor es el perodo de tiempo entre la adquisicin de la respuesta ante un estmulo y la

    prueba ante otros estmulos, mayor es la generalizacin, es decir, los estmulos generalizados se elici-

    tan relativamente ms siempre que se responda inmediatamente despus de un descanso tras el entre-

    namiento. De alguna manera, la recencia del entrenamiento aumenta el aprendizaje discriminativo, fa-

    vorece el recuerdo especfico de los estmulos discriminativos.

    c) Topografa de los estmulos

    Cuanto mayor semejanza exista entre el estmulo original y los estmulos con los que queremos que

    haya generalizacin mayor intensidad y frecuencia de la respuesta ante stos, lo cual resulta bastante

    lgico si tenemos en cuenta que la generalizacin consiste precisamente en esa extensin de la res-

    puesta ante estmulos semejantes al ED original.

    d) Dificultad del problema

    El aprendizaje discriminativo ocurre rpidamente cuando se usan estmulos que se distinguen

    fcilmente, pero es ms lento cuando son muy parecidos. As, un nio encontrar ms fcil distinguir

    entre "O" e "I" que entre "F" y "E" o entre b y d (vase Figura 7).

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 249

    La habilidad para responder diferencialmente a dos estmulos est limitada por las capacidades per-

    ceptivas del sujeto para distinguir entre ambos. De este modo, si los estmulos son demasiado pareci-

    dos como para que los pueda distinguir un determinado organismo, puede llegarse a lo que desde Pav-

    lov se viene llamando "neurosis experimental" (al exigir discriminaciones entre estmulos con propie-

    dades cada vez ms similares) con sntomas en perros debidos a la incapacidad de discriminacin, tales

    como angustia, confusin, etc. El experimento tpico de la escuela de Pavlov -Shenger-Krestovnika

    (1921; cit. por Gray, 1988; 1993, trad. cast., p. 152)- consista en mostrarle al perro un crculo (EC) y

    luego darle comida, obteniendo as una RC de salivacin; se le muestra tambin una elipse pero no se

    le da comida y no se obtiene RC; cuando el cociente de los ejes de la elipse se redujo a 9:8, el perro no

    diferenciaba entre el crculo y la elipse; durante tres semanas su ejecucin fue correcta en otros casos

    pero luego cambi, cometiendo errores en discriminaciones ms simples e incluso mostrando signos

    de angustia (ladridos, agitacin, etc.).

    e) Informacin estimular

    Nos referimos con ello a las propiedades informativas del estmulo, es decir, si el estmulo produce

    informacin sobre la recompensa o la no recompensa. Cuanto mayor valor informativo tenga el est-

    mulo mejor se producir la discriminacin.

    f) Aprendizaje observacional

    O sea, la oportunidad para el aprendiz de observar a otro sujeto (el modelo) cmo ejecuta la res-

    puesta ante el estmulo. Si se da esta oportunidad, mejor se producir el aprendizaje discriminativo.

    4.2. Condiciones de entrenamiento previo en discriminacin

    a) Experiencia sensorial temprana

    Diversos estudios (como sealan Tarpy y Mayer, 1978; p. 149) han demostrado que los estmulos

    generalizados elicitan respuestas incluso en sujetos que tuvieron experiencia previa del estmulo muy

    limitada, desde un ao despus de su nacimiento. Este hallazgo es importante pues sugiere que la ex-

    posicin previa a los estmulos generalizados no es condicin necesaria para la respuesta a aquellos

    estmulos. No obstante, si la experiencia previa de dichos estmulos es muy reciente la generalizacin

    es menor.

    b) Dificultad de la generalizacin por entrenamiento previo en discriminacin

    El efecto del entrenamiento previo en discriminacin sobre la generalizacin ha sido estudiado ex-

    tensamente. Una razn para el inters en dicha rea fue el hallazgo de que los gradientes de generali-

    zacin pueden predecirse a partir de las capacidades discriminativas del sujeto; un mayor gradiente de

    discriminacin representa mayor habilidad para distinguir entre estmulos, y a la inversa, lo cual sugie-

    re que el entrenamiento explcito en discriminacin, previo a la prueba de generalizacin, debe agudi-

    zar el gradiente, esto es, produce menor generalizacin de respuesta.

  • 250 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    c) Transferencia del entrenamiento en discriminacin

    Se trata de situaciones en las cuales el aprendizaje de una tarea influye en la adquisicin posterior

    de alguna otra. Se ha demostrado que si se aprende una discriminacin relativamente fcil antes de

    aprender otra relacionada ms difcil, la discriminacin facilitar la adquisicin de la segunda tarea.

    d) Entrenamiento previo ED - E : El fenmeno de desviacin del vrtice

    Tambin denominado "cambio de pico" (peak shift), fue descubierto inicialmente por Hanson

    (1959) y se refiere al hecho de que tras un entrenamiento en discriminacin seguido por un entrena-

    miento inhibitorio con E , la fuerza de una respuesta puede desplazarse lejos de la direccin de un E

    y ms all de un ED original, aun cuando el ED contine manteniendo sus propiedades. En la Figura 8

    podemos apreciar que las respuestas reforzadas ante el ED y de extincin al E generan un gradiente de

    generalizacin del estmulo que no es simtrico, teniendo la mayor parte de la fuerza de respuesta des-

    plazada a lo largo de la dimensin del estmulo en el sentido de ED y alejndose de E . O sea, al ir

    hacia la izquierda de la dimensin de estmulo, en la Figura 8 se observa que se eleva la curva para la

    fuerza neta de respuesta, alcanzando un pico no en el ED original sino en un punto situado a la iz-

    quierda de l. Dicho desplazamiento se obtiene despus del adiestramiento de discriminacin que in-

    cluye un reforzador diferencial a los estmulos ED y E . Implica:

    1 entrenamiento con ED (ED- R- Ref),

    2 entrenamiento con E (E - R- no Ref) y

    3 vuelta a ED mayor R ante ED+n

    Citemos un ejemplo (Wittig, 1982, p. 125) sacado de la poltica: supongamos que un hombre apoya

    a una candidata que es ligeramente ms conservadora que el candidato que normalmente ha apoyado

    en otras ocasiones. Al salir elegida dicha candidata, los proyectos de ley por los cuales trabaja y vota a

    favor, son en extremo conservadores -hecho que sirve como una fuerte condicin para el votante-. En

    las siguientes elecciones, el hombre puede cambiar y no volver a su posicin original sino ir mucho

    ms all apoyando a un candidato a quien inicialmente hubiera juzgado muy liberal.

    Otro ejemplo de tipo deportivo: Un habitual seguidor del Real Madrid traslada sus simpatas al

    Atltico de Madrid. Tras el fracaso futbolstico de ste ltimo vuelve a simpatizar ms que nunca con el equipo blanco.

    Figura 8: Representacin grfica del fenmeno de desviacin del vrtice.

    Debe notarse que el fenmeno de la desviacin del vrtice no se refiere a una intensificacin en la

    magnitud de la respuesta debido a la experiencia previa, lo cual nos remitira al fenmeno de contraste

    ya estudiado en el captulo anterior. En este caso, lo que se produce es una traslacin de la respuesta

    ED E

    Gradiente en la prueba poste-rior al establecimiento de las propiedades del estmulo

    Gradiente original

    Dimensin del estmulo

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 251

    en el espectro de los potenciales estmulos discriminativos, una radicalizacin de la respuesta original

    del sujeto en una direccin debido a una experiencia frustrante (no reforzada) cuando coyunturalmente

    el sujeto da respuesta ante otros estmulos situados en la direccin contraria del espectro.

    e) Discriminacin de relaciones: La transposicin

    La transposicin es la capacidad que tienen los organismos para llevar a cabo discriminacin de re-

    laciones. El E de una prueba pasa a ser ED de la segunda. El experimento clsico consiste en presentar

    dos crculos, el mayor hace de ED y el menor de E . Khler (1925) utiliz pollos para que discrimina-

    ran entre dos superficies grises circulares (una ms grande que la otra), de tal modo que se aprenda a

    discriminar entre ellos (reforzando cuando se responda ante el crculo mayor). A continuacin, se pre-

    sentaba el crculo menor junto con otro ms pequeo, haciendo reforzar al sujeto ante el mayor de am-

    bos (que en la primera prueba era el E ), como vemos en la Figura 9.

    Figura 9: Ejemplo de transposicin.

    De este modo se aprende a responder a la relacin (en este caso "ser menor que") entre estmulos,

    prescindiendo de los valores absolutos de los mismos.

    En situaciones de la vida real, el fenmeno de transposicin se produce, por ejemplo, cuando el en-

    trenador de un equipo de baloncesto coloca como pivot titular al jugador "ms alto" de la plantilla. El

    criterio de seleccin es por tanto comparativo y el jugador ms alto en un momento dado puede no ser-

    lo en la temporada siguiente.

    5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CON-

    TROL DE ESTIMULO

    5.1. Aplicacin de instigadores y desvanecimiento

    5.1.1. Dificultades con el refuerzo diferencial

    Sabemos pues que existe control de estmulo cuando en presencia de un estmulo antecedente parti-

    cular hay mayor probabilidad de que ocurra una respuesta particular. Est claro que lo que se aprende

    en este caso no es una respuesta nueva sino a producirla en las condiciones apropiadas, en cuyo caso

    estas condiciones (estos estmulos antecedentes) provocan esa respuesta. Es decir, el estmulo antece-

    dente es significativo para el sujeto y, a la manera del EC, activa en el aprendiz la expectativa de que

    determinada respuesta ser reforzada en su presencia. No son pues los estmulos los que controlan al sujeto (a los estmulos no se le pueden atribuir funciones humanas) sino el sujeto quien controla pues la situacin en funcin del significado atribuido al estmulo antecedente.

    El control de estmulo generalmente se adquiere con procedimientos de refuerzo diferencial. Para

    que ste sea eficaz en el control de estmulos, deben darse una serie de condiciones ptimas:

    ED

    ED E E

    1 Prueba 2 Prueba

  • 252 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    - debe ocurrir la respuesta deseada,

    - los estmulos esenciales deben controlar alguna conducta de atencin del sujeto,

    - los dos sucesos (estmulo y atencin focalizada) deben ocurrir simultneamente para que se suminis-

    tre el refuerzo.

    No obstante, hay veces en que no resulta efectivo. No es fcil que el estmulo controle (adquiera el significado pertinente para provocar...) la respuesta y ello puede ser debido, segn Sulzer-Azaroff y

    Mayer (1977), a varios factores:

    - porque la respuesta no se hallaba en el repertorio de respuestas del sujeto (por ejemplo, en el nio

    que no sabe leer, al ver la letra p (ED) no sabr pronunciarla),

    - porque la respuesta est bajo el control de otros estmulos o el estmulo controle otras respuestas (en

    nios pequeos se dan muchos ejemplos: responde pap al ver personas con gafas, al ver un peridi-

    co a mano le induce la respuesta de despedazarlo, al ver a su madre coger el bolso de paseo le motiva

    a levantarse e irse a la puerta para salir, etc.),

    - porque el estmulo sea difcil de percibir por problemas sensoriales o motores,

    - porque la respuesta haya tenido en el pasado un control de estmulo diferente (por ejemplo, con un

    nuevo procesador de textos, centrar un ttulo se hace combinando las teclas Ctrl y T, pero con el an-

    terior procesador se haca con Alt + C).

    Por todo ello, es preciso utilizar mtodos adicionales, sobre todo instigadores y desvanecimiento

    posterior.

    5.1.2. Los instigadores como facilitadores de la discriminacin

    Cuando el refuerzo diferencial es insuficiente para conseguir el control de estmulo se utilizan ins-

    tigadores o incitadores. Los instigadores son estmulos adicionales que se presentan conjuntamente

    con los estmulos que queremos que sean discriminativos. Se trata de estmulos inicialmente ms sig-

    nificativos (ya poseen un significado, una funcionalidad conductual) y que es til usarlos temporal-

    mente para facilitar la emisin de respuesta cuando el control de estmulo no es completo.

    Las funciones del instigador en relacin con el estmulo que queremos que se convierta en discri-

    minativo, se entienden bien al comparar esta situacin con lo que ocurra en el condicionamiento

    clsico: El instigador tendra una funcin similar al EI y el EC es el estmulo que queremos que ad-

    quiera fuerza sealizadora (que sea ED). Por eso, el procedimiento consiste en emparejar el estmulo

    nuevo con el instigador (igual que EC-EI). Obviamente, un instigador no necesariamente elicita res-

    puestas reflejas; basta con que sea un EC excitatorio previamente condicionado a un EI o un estmulo

    discriminativo ya consolidado (por anterior entrenamiento ED-R-Eref).

    Se distinguen varios tipos de instigadores:

    a) Instigadores verbales. Se trata de las tpicas instrucciones verbales, o sea, decirle al sujeto lo que

    debe hacer. Por ejemplo, el maestro que quiere ensear a sus alumnos a escribir la letra "a" les dice

    nios, escribid la letra a

    b) Demostracin. Es el conocido aprendizaje observacional utilizando modelos (modelado): Alguien

    realiza ante el sujeto la conducta que ste debe aprender. Se trata por tanto de un procedimiento de

    imitacin. En el ejemplo anterior, el maestro escribe la letra a. Si combinase instrucciones verba-les y demostracin, el maestro dira escribir la letra a, tal y como lo hago yo. Cuando fallan las instrucciones verbales se utiliza este mtodo.

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 253

    c) Gua fsica. Consiste en guiar el movimiento correcto de la respuesta y se utiliza cuando fallan los

    anteriores. En el ejemplo citado, el maestro cogera la mano del nio y se la movera para escribir

    la letra "a".

    Estos tres instigadores se pueden ordenar en una escala de mayor a menor intrusividad, es decir, en

    cuanto al menor o mayor grado de importancia del instigador o probabilidad de que sea seguido por el

    aprendiz. El ms intrusivo es la gua fsica, le sigue la demostracin y por ltimo las instrucciones ver-

    bales.

    d) Otros tipos de instigadores. Otros instigadores muy usados en la prctica son los perceptivos, por

    ejemplo, para lectura o escritura, magnificacin de los rasgos crticos de estmulo, el punteado de

    las letras en los cuadernos de caligrafa, etc.

    En la enseanza o en procedimientos de adiestramiento, se suele comenzar por los instigadores me-

    nos intrusivos. Por ejemplo, en una tabla de gimnasia, el monitor da las explicaciones pertinentes so-

    bre los movimientos que han de hacer los alumnos. Si estos instigadores no son vlidos para que se lo-

    gre el control de estmulos, entonces habr que recurrir al siguiente: la demostracin (el monitor reali-

    za el movimiento o el ejercicio tal y como lo deben hacer sus alumnos). Si tampoco funciona entonces

    habr que recurrir a la gua fsica (el monitor coge el brazo o la pierna del sujeto y se la mueve en la

    direccin correcta).

    Normalmente se suelen combinar los instigadores (instruccin verbal con demostracin, etc.). En

    cualquier caso, es importante que los instigadores se vayan retirando mediante desvanecimiento, tal y

    como se explica en el siguiente apartado.

    5.1.3. Desvanecimiento de los instigadores

    Si no se retirasen los instigadores nunca se establecera un adecuado control de estmulo, es decir,

    difcilmente el sujeto sabra emitir la respuesta en presencia slo del ED y siempre requerir el instiga-

    dor. Por ejemplo, si siempre que el nio escriba le vamos a guiar la mano cmo aprender a realizar

    los movimientos precisos que corresponden a la escritura?. De igual manera, no sera correcto que el

    sujeto slo hiciera las cosas cuando se le dan las instrucciones verbales para ello (escribir cuando se le

    diga que escriba, etc.); si as fuera, tendramos sujetos pasivos, con muy escasa autonoma e iniciativa

    propia.

    As pues, hay que desvanecer progresivamente los instigadores de modo que si se utiliza un insti-

    gador muy intrusivo, ste debe ir sustituyndose por otro menos intrusivo y as sucesivamente hasta

    que desaparezcan totalmente los instigadores. Adems, hay que usarlos el mnimo tiempo posible.

    5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje

    La aportacin del enfoque de condicionamiento para la adquisicin del control de estmulos puede

    ser til para el enseante o reeducador. Un sector al que se aplican con gran xito es al de los nios

    discapacitados en algn rea concreta del aprendizaje: retrasos o deficiencia intelectual, lenguaje, lec-

    to-escritura y aritmtica (Hallahan y Kauffman, 1976; Worell y Nelson, 1982, Valls, 1986). Los

    mtodos ms usuales son los basados en el control de estmulo mediante el uso de instigadores y des-

    vanecimiento, aunque por supuesto tambin se utilizan procedimientos de refuerzo. La estrategia prin-

    cipal es la de las intervenciones multimodales, donde los procedimientos operantes sean una parte o

    componente ms de los mismos.

  • 254 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente

    En ocasiones un aprendizaje instrumental sealizado puede ser problemtico, es decir, la exposi-

    cin a determinados estmulos discriminativos puede provocar respuestas no deseadas. La televisin

    provoca la respuesta de entretenerse con ella e impedir que hagamos otras cosas ms necesarias (por

    ejemplo, estudiar un examen); el contexto habitual en el que comemos mucho puede ser perjudicial si

    queremos adelgazar puesto que esos estmulos "controlan" esa conducta.

    Una tcnica aplicada en modificacin de conducta para lograr cambiar un control de estmulo no

    deseado es el cambio estimular: si queremos cambiar algn tipo de conducta o hacer que una conduc-

    ta deseable (pero difcil de conseguir) sea ms frecuente, conviene rodearse de otro contexto estimular

    y disponer otros estmulos discriminativos para la nueva conducta objetivo. As, para la deseable con-

    ducta de estudiar, Domjan y Burkhard (1986; p. 319 trad. cast.) proponen los siguientes nuevos est-

    mulos discriminativos: "1. Seleccionar un lugar adecuado para estudiar, con iluminacin adecuada y libre de distracciones.

    2. Estudiar en ese lugar y slo en ese lugar (no estudiar en la cama pues esto lleva probablemente a dormir antes que a

    estudiar).

    3. Permanecer en el rea de estudio slo durante el tiempo que estamos estudiando. Si nos empezamos a distraer, nos te-

    nemos que disponer a abandonar el rea de estudio.

    4. Antes de abandonar de hecho el rea, completar una pequea unidad de trabajo. Terminar de leer la pgina o comple-

    tar un problema".

    Se trata pues de convertir el rea de estudio en el nuevo estmulo discriminativo de la conducta de

    estudiar.

    En esta misma lnea, puede interesar que la respuesta no est controlada por muchos estmulos sino

    por uno en particular. El obeso que come mientras ve la televisin o escucha la radio, o habla con

    otros, etc. debera comer exclusivamente en la mesa del comedor, a ciertas horas, sin televisin ni ra-

    dio, etc.

    En definitiva, estos planteamientos permitiran al sujeto un mayor autocontrol y no tanta dependen-

    cia de los estmulos y de personas o servicios que proporcionen instigadores.

    6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO

    6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin

    aversiva

    6.1.1. Tipos de aversividad

    El condicionamiento, sea clsico o instrumental, se realiza muchas veces con estmulos aversivos.

    Un estmulo aversivo es lo que en lenguaje cotidiano llamamos estmulo "molesto", "incmodo", "do-

    loroso", "desagradable", "nocivo", etc., es decir, su aplicacin al sujeto tiene para l consecuencias ne-

    gativas. La aversividad es pues cualquier evento que produzca una percepcin de malestar o desagra-

    do.

    Proponemos cinco criterios para clasificar o caracterizar los eventos aversivos:

    1) Criterio estimulacin aversiva primaria secundaria: Una cosa es la estimulacin que produce do-lor o malestar fsicos directos y otra las seales o EC o ED previamente asociados a estimulacin

    aversiva primaria (enchufes, fuego en la cocina, dedos puestos en el quicio de la puerta, nube oscu-

    ra que amenaza lluvia, etc.).

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 255

    2) Criterio estimulacin aversiva directa indirecta: Una cosa es la aplicacin directa de estimulacin aversiva primaria que produzca dolor o malestar fsico (descarga elctrica en el animal, agresin,

    tortura, malos tratos fsicos, hambre, sed, enfermedad, problema irresoluble, etc.) y otra es la au-

    sencia del refuerzo esperado.

    3) Criterio contingencia o dependencia estimulacin aversiva respuesta: Se trata de la contigidad o proximidad espacio temporal de una con respecto a la otra, en contraposicin a una relacin con-

    tingente o no necesaria, es decir, sin aparente relacin entre un evento y otro. En este caso de la no

    dependencia, tenemos la situacin de indefensin aprendida

    4) Criterio orden temporal de ocurrencia entre estimulacin aversiva respuesta. Esto ocurre sobre todo cuando dependencia entre estimulacin aversiva y respuesta, y tenemos dos claras opciones:

    - Eav R (primero estimulacin aversiva y despus la respuesta): Si primero se aplica estimula-cin aversiva y su cese es contingente con (dependiente de) la aparicin de una respuesta, en-

    tonces aumentar la probabilidad de ocurrencia de dicha respuesta. Segn sto, y siguiendo la tra-

    dicin skinneriana, esta situacin conlleva refuerzo negativo (refuerza el cese -contingente a la

    respuesta- de la estimulacin aversiva, lo cual fortalece y mantiene la respuesta) y es tpico para-

    digma de escape. Estas condiciones de refuerzo negativo las podramos simbolizar del siguiente

    modo:

    Eav - R No Eav (Ref. neg.)

    - R Eav (primero respuesta y despus estimulacin aversiva): Si primeramente aparece la res-

    puesta y tras ella se aplica contingentemente estimulacin aversiva, entonces disminuir la proba-

    bilidad de ocurrencia o incluso se eliminar la respuesta. Esta acepcin sigue la tradicin de

    Thorndike y ms tarde se denomin, para distinguirlo del anterior, estimulacin punitiva y se in-

    serta en el paradigma de castigo. Se simbolizara:

    R Eav

    5) Criterio efectos en la respuesta: En psicologa del aprendizaje, un estmulo aversivo se define en

    funcin del efecto que produce en la conducta. En general, hay tres efectos en la conducta relacio-

    nada con dicha estimulacin:

    - Incremento de la tasa de respuesta por refuerzo negativo. Suele ocurrir en situaciones Eav - R y

    por tanto en casos de escape y evitacin

    - Disminucin de la tasa de respuesta por estimulacin punitiva contingente. Se trata de situaciones

    R - Eav y es el caso del castigo.

    - Aparicin de alteraciones conductuales, emocionales o conductuales, ligadas a la aplicacin de es-

    timulacin punitiva contingente y sobre todo no contingente. El efecto de esta modalidad se co-

    noce desde Seligman (a mediados de los 60) como indefensin o impotencia aprendida (difcil

    traduccin del ingls learned helplessness), en la cual el sujeto recibe estimulacin aversiva ines-

    capable. Sera una situacin del tipo:

    R - Eav no conting.

    6.1.2. Tipos de condicionamiento con estimulacin aversiva

    Como ya se dijo en el Tema 4, los paradigmas o tareas experimentales en los que se ha usado esti-

    mulacin aversiva, al menos en el condicionamiento instrumental, son esencialmente cuatro: escape,

    evitacin, castigo e indefensin aprendida. En los dos primeros se ha utilizado estimulacin aversiva

    en su acepcin de refuerzo negativo; en el tercero se trata ms bien de estimulacin punitiva; en el

  • 256 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    cuarto la estimulacin punitiva no es contingente a la respuesta. Los tres primeros pueden incluir di-

    versas variantes, sobre todo si se utilizan estmulos discriminativos. En cuanto a la indefensin apren-

    dida, algunos manuales de aprendizaje lo citaban como una variedad del castigo (Pelechano, 1980),

    aunque desde hace tiempo (Wittig, 1982; Hulse et al., 1982) lo consideran como otro paradigma ms

    de aprendizaje con estimulacin aversiva. Algunos han tratado tambin la aversividad resultante de

    suprimir o disminuir un reforzador. En estos casos se habla del castigo por supresin, extincin sim-

    ple y entrenamiento de omisin. Aunque estos dos ltimos tipos no los trataremos aqu, los esquemas

    de las Tablas 1 (adaptada de la expuesta en el Tema 4) y 2 nos resumen todo esto.

    Tabla 1: Tipos de condicionamiento con estimulacin aversiva en funcin de los tipos de consecuencias

    sobre la conducta y del tipo de relacin R-C.

    C O N S E C U E N C I A S / r e s u l t a d o s

    P O S I T I V A S a d q u I s I c I n

    N E G A T I V A S (aversivas) e x t I n c I n

    Por cese de estimulacin aversiva

    (ref. negativo)

    Por aplicacin Por omisin del Reforzador

    Relacin de

    contingencia R - C

    SI - Escape - Evitacin

    - Castigo por aplicacin (cast. positivo)

    - Castigo por supresin (cast. negativo)

    NO - - Indefensin aprendida

    -

    Tabla 2: Presencia de los criterios de clasificacin de los eventos aversivos en los tipos de condiciona-

    miento con estimulacin aversiva (Eav).

    Criterios

    Escape Evitacin Castigo por aplicacin

    Castigo por supresin

    Extincin Indefensin aprendida

    Eav. Primaria Eav. Secundaria

    Si

    Si

    Si Si

    Si

    Eav. directa Eav. indirecta

    Si Si Si Si

    Si

    Si

    Eav. contingente Eav. no contingente

    Si Si Si Si Si Si

    Orden temp. Eav.-R Orden temp. R-Eav.

    Si Si Si

    Si

    Incremento de R Disminucin de R Alteraciones de R

    Si Si Si Si

    Si

    Si

    Si Si

    6.2. Condicionamiento de escape

    6.2.1. Definicin

    En el procedimiento de escape, ante la aparicin de estimulacin aversiva, el organismo emite una

    respuesta que logra el cese de dicha estimulacin. O sea, la respuesta del organismo hace que cese el

    estmulo aversivo. Por tanto, dicho cese es contingente o dependiente de la realizacin de la respuesta

    y con ello, tras repetidas presentaciones de estimulacin aversiva, se logra usualmente un aumento de

    frecuencia de la respuesta. El cese del estmulo aversivo (gracias a la respuesta) es el evento crucial

    que se convierte en un reforzador negativo. La representacin simblica del procedimiento de escape

    es la siguiente:

    Eav - R No Eav

    Ms en detalle, supondra una secuencia con dos fases seguidas:

    1) Una R1 provoca la Eav y la consecuencia 1 de dao o dolor

    2) Una R2 de escape provoca una consecuencia 2 de cese de Eav y alivio

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 257

    En el futuro, el sujeto aprende a no hacer R1. Es un tipo de aprendizaje que se logra con rapidez y

    es muy adaptativo. Todos escapamos de circunstancias aversivas y procuramos que esa experiencia

    desagradable no nos vuelva a ocurrir: un nio aprende a no tocar una estufa encendida si alguna vez se

    quem con ella, o sea R1 (tocar estufa encendida) Eav (calor fuerte) Consecuencia 1 (de dao o dolor) R2 escape (retirar mano) Consecuencia 2 de cese Eav (alivio). Ms ejemplos: una perso-na que se encuentra en un ambiente donde hay excesivos ruidos presenta comportamiento de escape

    simplemente alejndose del lugar donde se emite el ruido; si empieza a llover y te mojas rpidamente

    abres el paraguas (y si no lo tienes te resguardas en un portal), con lo cual cesa la estimulacin aversi-

    va, la respuesta tiene una consecuencia positiva y se refuerza para el futuro.

    Los procedimientos y tcnicas experimentales ms utilizados en la investigacin de la conducta de

    escape aparecen resumidos en el Cuadro 1.

    6.2.2. Condiciones o factores en la adquisicin de la conducta de escape

    Citaremos slo dos de los ms importantes:

    1) Intensidad del estmulo aversivo: Cuanto ms fuerte sea la estimulacin aversiva mejor se aprende

    la conducta de escape. Esto se relaciona directamente con la magnitud del reforzador: como aqu es

    un refuerzo negativo, lo importante es la disminucin relativa de intensidad del estmulo aversivo

    tras la respuesta.

    2) Retraso en la eliminacin del estmulo aversivo: Cuando se elimina el estmulo aversivo poco des-

    pus de que el sujeto emita la respuesta, esta demora en la aparicin del refuerzo negativo produce

    una disminucin en el rendimiento de los sujetos en la conducta de escape.

    Cuadro 1: Procedimientos experimentales de adquisicin de la conducta de escape.

    En animales

    Aparatos Un primer procedimiento con animales fue el utilizado por Muenzinger y Fletcher en 1936. Se trata de un laberinto en forma de T con el suelo electrificable. Se coloca al animal (normalmente ratas) en la base de la T y se le dan shocks hasta que gire por el brazo deseado (izquierdo o derecho). En cada ensayo se mide o bien el tiempo que tarda o el nmero de elecciones incorrectas de brazo. Despus de 100 ensayos se consigue un ptimo entrenamiento de escape con este pro-cedimiento. Posteriores estudios llevaron a otros procedimientos usando aparatos en los que pueden presentarse series largas de ensayos (presentaciones de Eav) en intervalos apropiados sin que se tenga que sustituir al sujeto. Dos han sido los ms usuales: - La caja de Skinner con suelo electrificado, de forma que la presin de la barra (R) haga que cesen los shocks elctricos. - El aparato ms usado para el estudio del condicionamiento de escape es la caja de saltos o lanzadera (shuttle box), que

    ya se encuentra en los experimentos clsicos de Mowrer (1938, 1939). Dicha caja (como se puede apreciar en la Figura 10a, o en una versin actual en la Figura 10b) es una cmara con dos compartimentos donde la respuesta operante que se mide es el movimiento desde un compartimiento a otro (usualmente el movimiento en cualquiera de las dos direccio-nes cuenta como una respuesta). Una variante ms actual es una sola cmara con la rejilla basculante: cuando el animal est en un lado, la rejilla toca el suelo y cierra el circuito elctrico para administrar la descarga, que cesar cuando salte al otro lado. Este aparato tambin se utiliza en el aprendizaje de evitacin.

    Estmulos

    El estmulo aversivo es usualmente shock elctrico aplicado a travs de la parrilla de alambre del suelo. La conducta de escape se adquiere rpidamente en dicho aparato, posiblemente porque la respuesta operante requerida (saltar) est rela-cionada directamente con la conducta incondicionada elicitada por el shock. Tipos de medida

    La medida del escape suele ser, segn Fernndez Castro (1989), o bien latencia (tiempo desde el inicio del estmulo aversivo al inicio de la respuesta) o magnitud de respuesta (velocidad de carrera o presin de palanca en caja de Skinner).

    En humanos

  • 258 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    Con humanos la respuesta elegida suele ser de tipo manipulativo (a menudo enmascarada la tarea con problemas de discriminacin) y como estimulacin aversiva, adems de la descarga elctrica de baja intensidad, se utilizan ruidos fuertes y molestos o incluso alguna tcnica similar a las del castigo por supresin de reforzador (vase el apartado correspondien-te de este captulo).

    Figura 10: Lanzadera o caja de saltos, en versin antigua (a) o actual (b)

    6.3. Aprendizaje de evitacin

    6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos

    La evitacin es uno de los fenmenos ms estudiados en el condicionamiento con estimulacin

    aversiva. Una conducta se llama de evitacin cuando impide la confrontacin del sujeto con un acon-

    tecimiento que tiene caractersticas aversivas. Es decir, el efectuar una respuesta pospone o elimina la

    estimulacin aversiva. De otro modo podemos decir que ocurrir un Eav a no ser que aparezca la res-

    puesta. Se producir el aprendizaje de evitacin si dicha contingencia lleva a un aumento de la fre-

    cuencia de respuesta, con lo cual el cese del estmulo tiene propiedades de reforzador negativo para la

    respuesta.

    Los primeros estudios sobre evitacin provienen, segn Domjan y Burkhard (1986), de Bechterev

    (1913) dentro del condicionamiento pavloviano. Su experimento se realiz con humanos y consista en

    pedirles que introdujeran un dedo (R instrumental) en un recipiente de metal. Al hacerlo se haca sonar

  • Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 259

    un zumbido de aviso (EC) y al estar el agua electrificada sufran una descarga elctrica (EI). Lgica-

    mente la retirada del dedo (R de evitacin) era inmediata y en sucesivos ensayos el inicio del EC per-

    mita no sufrir EI. Parece condicionamiento clsico pero no lo es puesto que en aqul el EI ocurre in-

    dependientemente de la respuesta mientras que aqu la respuesta instrumental impide su aparicin.

    La diferencia entre escape y evitacin estara en que en sta ltima la respuesta pospone o elimina

    una estimulacin aversiva que todava no ha ocurrido. En la conducta de escape siempre se aplica es-

    timulacin aversiva al sujeto mientras que en la evitacin basta con la presentacin de un ED (EC en

    trminos de condicionamiento clsico) que de alguna manera evoque (por asociacin previa EC-EI

    aversivo) la estimulacin aversiva. Adems, en la situacin de escape, la supresin de estimulacin

    aversiva ocurre tan pronto como se emite la respuesta, mientras que en la evitacin se previene la apli-

    cacin de estimulacin aversiva mediante la respuesta.

    As, por ejemplo:

    - un baista se aplicar bronceador (R) para evitar quemaduras en la piel (Eav) por el sol al llegar a la

    playa (ED);

    - los conductores obedecen las seales de trfico para evitar accidentes o multas;

    - ED (da nuboso): R (llevar sombrilla) No Eav (evitacin de la lluvia). O sea, no es necesario que nos mo-

    jemos por la lluvia al salir de casa (Eav) para que cojamos la sombrilla (R); basta con que veamos el

    da muy nuboso (ED).

    As pues, en la evitacin tenemos seales del entorno que por aprendizaje previo son aversivas; se

    podra decir, por tanto, que la evitacin es una conducta motivada por el miedo (Gray, 1988; trad. cast.

    1993, p. 132). El sujeto aprende a darle un significado atemorizante a determinadas seales del entor-

    no. Podemos decir que en el paradigma de evitacin, el sujeto "escapa" o reacciona no ante la presen-

    cia de la estimulacin aversiva en s, sino ante los estmulos discriminativos (EC) que sealizan la pos-

    terior presencia de estimulacin aversiva (EI), y por tanto el miedo (RC) provocado por esos estmulos

    sealizadores es la emocin que motiva la conducta de evitacin. Al emitir esa conducta, el miedo se

    reducir, lo cual supone un refuerzo negativo para esa conducta de evitacin. Hay que notar que el

    miedo tiene un doble valor aqu: es una respuesta del sujeto condicionada a una determinada situacin

    estimular, pero tambin es en s un estmulo aversivo del que el sujeto hace por escapar (con lo cual

    evita el estmulo posterior que el miedo anticipa).

    Aunque se explica ms adelante en la teora bifactorial de Mowrer, parece evidente que el estable-

    cimiento de la conducta de evitacin necesita dos fases:

    - Una fase previa, en la que un determinado estmulo adquiere un significado aversivo de algo que an-

    tes no tena. Puede ser un escape sealizado, esto es, tener la experiencia del par ED- Eav, o, si se

    quiere en la terminologa del condicionamiento clsico, la experiencia EC-EIav; o puede ser una res-

    puesta castigada (R- Eav). Si es el primer caso, tendremos la evitacin activa (hago algo tras la seal

    para evitar Eav) y si es el segundo, la evitacin pasiva (no vuelvo a hacer R para evitar Eav), como

    analizaremos enseguida. En cualquier caso, es caracterstico de la evitacin que se adquiere con muy

    pocos ensayos de este tipo, incluso basta con un aprendizaje vicario u observacional.

    - La fase propiamente de evitacin, en la que el evento (estmulo o respuesta) con significado aversi-

    vo, por s solo y sin necesidad de que aparezca la estimulacin aversiva, produce la respuesta de evi-

    tacin.

    Se han descrito (Gray, 1988; Klein, 1991) dos tipos de aprendizaje de evitacin: la evitacin activa

    y la pasiva.

    a) Evitacin activa

  • 260 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

    Se trata de realizar una conducta que, ante la correspondiente seal atemorizante, impida o preven-

    ga la estimulacin aversiva. Abrir el paraguas ante seales de lluvia, el nio que hace los deberes para

    no suspender el examen, pagar el alquiler para evitar que nos echen del piso, caminar por la acera para

    que no me atropellen los coche