PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
1
ESQUEMAS DE LA ASIGNATURA
“PSICOLOGÍA DEL APRENDIZAJE”.
CURSO 1º DEL GRADO DE PSICOLOGÍA DE LA UNED.
AUTORA:
ALICIA PEÑALVA VÉLEZ.
PROFESORA TUTORA DEL CENTRO ASOCIADO DE LA
UNED EN TUDELA (NAVARRA).
NOTA IMPORTANTE:
Estos esquemas han sido realizados por la profesora en base a la información presentada
en el libro de texto de la asignatura. Son resúmenes que sirven de orientación al
alumnado para el estudio de la asignatura. En ningún caso sustituyen a los temas
desarrollados en el libro. Para su elaboración se ha consultado así mismo los resúmenes
de la asignatura que se pueden encontrar en el link: psicologiauned.com
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
2
CAPÍTULO 1.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
3
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 1: INTRODUCCIÓN.
INTRODUCCIÓN.
Las personas siempre se han interesado por entender la conducta, ya sea la propia o
la de los demás.
Cualquier esfuerzo sistemático para entender la conducta debe tomar en
consideración qué aprendemos y cómo lo aprendemos.
El aprendizaje es uno de los procesos biológicos que facilitan la adaptación al
ambiente.
Normalmente, pensamos que el aprendizaje conlleva la adquisición de nuevas
conductas. Pero el aprendizaje también puede consistir en la disminución o pérdida
de una respuesta.
Aprender a no ejecutar determinadas respuestas es tan importante como aprender a
realizar respuestas, o quizá más.
Cuando consideramos el aprendizaje, tenemos tendencia a pensar en formas de
aprendizaje que requieren un entrenamiento especial. Sin embargo, también
aprendemos todo tipo de cosas en el curso de nueStra interacción rutinaria con
nuestro ambiente social y físico sin un profesor experto o un entrenador.
Gran parte de la investigación descrita en este libro pertenece a la tradición
conductista, que trata de analizar e! comportamiento en términos de estímulos
antecedentes y consecuentes.
La reflexión y el razonamiento conscientes quedan deliberadamente fuera del
análisis conductual. Se da mayor importancia al aprendizaje procedimental de
carácter automático, que no requiere conciencia, que al aprendizaje de tipo
declarativo, más accesible a la conciencia.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
4
1. ANTECEDENTES HISTÓRICOS.
Las aproximaciones teóricas al estudio del aprendizaje tienen sus raíces en la
filosofía de René Descartes. Antes de Descartes, se pensaba que e! comportamiento
humano estaba enteramente determinado por la intención consciente y por el libre
albedrío.
No se consideraba que las acciones de las personas pudieran estar controladas por
estímulos externos o por las leyes naturales. Se suponía que lo que una persona
hacía era el resultado de su voluntad o de su intención deliberada.
Descartes fue la excepción a esta interpretación de la naturaleza humana, ya que
reconoció que muchas de las cosas que hacen las personas son respuestas
automáticas a estímulos externos.
Sin embargo, no estaba preparado para abandonar por completo la idea del libre
albedrío y del control consciente. Por tanto, formuló una visión dualista del
comportamiento humano conocida como dualismo cartesiano.
De acuerdo con el dualismo cartesiano, existen dos tipos de conducra humana:
voluntaria e involuntaria.
Descartes propuso que la conducta involuntaria consiste en respuestas automáticas a
los estímulos externos y está mediada por un mecanismo especial denominado
reflejo.
La conducta voluntaria, por el contrario, no requiere de la intervención de estímulos
externos, sino que se debe a la voluntad consciente de actuar de una determinada
forma.
El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones
intelectuales: una, el mentalismo, se ocupaba de los contenidos y funcionamiento de
la mente; la otra, la refIexología, del mecanismo de la conducta involuntaria.
Estas dos tradiciones intelectuales constituyen la base del estudio del aprendizaje
moderno.
1.1 DESARROLLO HISTÓRICO DEL ESTUDIO DE LA MENTE.
NATIVISMO. (contenido de la mente) Concepción de la mente según la cual nacemos
con ideas innatas acerca de ciertas cosas. DESCARTES. (funcionamiento de la
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
5
mente) la mente no funciona de forma predecible y ordenada, de acuerdo con reglas
estrictas o leyes que se puedan identificar. Descartes distingue entre conductas
voluntarias e involuntarias, y afirma que la conducta voluntaria está controlada por
la mente.
EMPIRISMO. (contenido de la mente) LOCKE: todas las ideas de las personas son
aprendidas directa o indirectamente a través de experiencias posteriores al
nacimiento. El ser humano nace sin ninguna idea preconcebida acerca del mundo.
(funcionamiento de la mente) HOBBES: al contrario que Descartes cree que la
mente al igual que los reflejos, opera de forma predecible y conforme a leyes.
propone que la conducta voluntaria está gobernada por el principio del
HEDONISMO (las personas tratan de lograr el placer y evitar el dolor; la conducta
está controlada por las consecuencias positivas y negativas). EL CONCEPTO DE
ASOCIACIÓN, es otro aspecto importante del funcionamiento de la mente, ya que
se asume que todas las ideas tienen su origen en experiencias sensoriales.
1.2 DESARROLLO HISTÓRICO DEL ESTUDIO DE LOS REFLEJOS.
Al formular el concepto de reflejo, Descartes hizo una contribución significativa a
la comprensión de la conducta. La idea básica de que la conducta puede ser el
reflejo de un estímulo desencadenante permanece como un importante pilar de la
teoría del comportamiento.
Sin embargo, Descartes se equivocaba en sus ideas acerca de los detalles del acto
reflejo. Creía que los mensajes sensoriales que iban de los órganos de los sentidos al
LEYES DE LA ASOCIACIÓN.
LEYES PRIMARIAS: contigüidad, similitud y
contraste.
LEYES SECUNDARIAS: intensidad, frecuencia y
recencia.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
6
cerebro y los mensajes motores que iban del cerebro a los músculos viajaban por
los mismos nervios.
Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos
eran responsables únicamente de reacciones sencillas a estímulos externos.
En el siglo XIX los procesos fisiológicos responsables de los reflejos se
comprendieron mejor y el reflejo pasó a aplicarse a la explicación de un mayor
rango de componamienros. Dos fisiólogos rusos, Sechenov (1829-1905) y Pavlov
(1849-1936), fueron los principales responsables de esros avances.
De acuerdo con Sechenov, la conducta volumaria y los pensamientos están en
realidad elicitados por estímulos débiles y apenas visibles. Las ideas de Sechenov
acerca de la conducta voluntaria extendieron enormemente el uso de mecanismos
reflejos para dar cuenta de una gran variedad de aspectos del comportamiento.
Sechenov no tomó en consideración que la conducta de los organismos no permanecía fija e invariable a lo largo de su vida, sino que podía verse alterada por
la experiencia.
Pavlov demostró experimentalmente que no todos los reflejos son innatos. Mediante
mecanismos asociativos se pueden establecer nuevos reflejos para los estímulos.
Gran parte de la teoría moderna de la conducta se ha construido sobre el concepto
de reflejo estímulo-respuesta, o unidad E-R, y el concepto de asociación.
Las unidades E-R y las asociaciones continúan teniendo una función destacada en la
teoría conductual contemporánea.
2. EL AMANECER DE UNA NUEVA ERA.
Los estudios experimentales sobre los principios básicos de aprendizaje se realizan
frecuentemente con animales no humanos y dentro de la tradición reflexológica. La
investigación del aprendizaje animal comenzó a tomar vigor hace algo más de 100
años. Esta investigación recibió su impulso principalmente de tres fuentes.
(1) el interés por la cognición comparada y la evolución de la mente. (2) el interés
por el funcionamiento del sistema nervioso (neurología funcional). (3) el interés por
desarrollar modelos animales de la conducta humana.
La cognición comparada, la neurología funcional y los modelos animales de la
conducta humana continúan dominando la investigación actual en aprendizaje.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
7
2.1 LA COGNICIÓN COMPARADA Y LA EVOLUCIÓN DE LA
INTELIGENCIA.
El interés por la cognición comparada y por la evolución de la mente surgió como
consecuencia de los escritos de Charles Darwin, que llevó las ideas de Descartes
sobre la naturaleza humana un pasó más allá.
Descartes había empezado a socavar la antigua idea según la cual los seres humanos
ocupaban un lugar único y privilegiado en el reino animal, proponiendo que al
menos algunos aspectos del comportamiento humano (los reflejos) eran similares a
los de los animales. Sin embargo, Descartes había mantenido ciertos privilegios a
los seres humanos al asumir que los humanos (y sólo los humanos) poseían mente.
2.2 NEUROLOGÍA FUNCIONAL.
La nueva era en el estudio de los procesos de aprendizaje fue también en gran
medida producto de los esfuerzos por utilizar los estudios de aprendizaje animal
como medio para estudiar el funcionamiento del sistema nervioso.
Esta línea de investigación fue iniciada por el fisiólogo ruso Ivan Pavlov, con cierta
independencia de los trabajos de Darwin, Romanes y otros estudiosos de la
cognición comparada.
Siendo estudiante de medicina, Pavlov se comprometió con el principio del
nervismo. De acuerdo con el nervismo, las principales funciones fisiológicas están
gobernadas por el sistema nervioso.
2.3 MODELOS ANIMALES DE LA CONDUCTA HUMANA.
La tercera fuente de esta nueva era en el estudio del ;1prendizaje animal fue la
creencia según la cual la investigación con animales podría proporcionar
información útil para la comprensión del comportamiento humano. Los modelos
animales de conducta humana tienen un origen más reciente que la cognición
comparada o la neurología funcional.
2.4 MODELOS ANIMALES Y ROBÓTICA.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
8
3. DEFINICIÓN DE APRENDIZAJE.
El aprendizaje es una experiencia humana tan común que las personas rara vez
reflexionan sobre lo que realmente significa decir que se ha aprendido algo. No
existe una definición de aprendizaje universalmente aceptada.
El aprendizaje es un cambio duradero en los mecanismos de conducta que implica
estímulos y/o respuestas específicas y que es resultado de la experiencia previa con
esos estímulos y respuestas con otros similares.
3.1 LA DISTINCIÓN ENTRE APRENDIZAJE Y EJECUCIÓN.
¿Cuál es la razón para definir el aprendizaje partiendo de un cambio en los
mecanismos de la conducta? La principal razón es que el comportamiento está
determinado por muchos otros factores distintos del aprendizaje.
La ejecución se refiere a las acciones de un organismo en un momento concreto. La
ejecución está determinada por la oportunidad, la motivación y las capacidades
sensoriales y motoras, además del aprendizaje. Esto significa por lo tanto, que un
cambio en la actuación no puede ser automáticamente considerado como una
manifestación de aprendizaje.
3.2 EL APRENDIZAJE Y OTRAS FUENTES DE CAMBIO CONDUCTUAL.
Existen varios mecanismos que dan lugar a cambios en la conducta que son
excesivamente breves como para ser considerados como ejemplos de aprendizaje.
La fatiga, cambios en las condiciones estimulares, alteraciones del estado
fisiológico o motivacional del organismo, la maduración…
3.3 DIFERENTES TIPOS DE MECANISMOS CAUSALES.
Al discutir los mecanismos causales, es importante tener en mente qué tipo de causa
nos concierne. Killeen (2001) ha alentado a los psicólogos del aprendizaje a pensar
en función de los cuatro tipos de causas descritos por Aristóteles: causa eficiente,
causa material, causa formal y causa final.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
9
4. ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE.
La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgos
metodológicos principales.
(1) Uno de estos es una consecuencia directa de la definición de aprendizaje y
requiere el uso de métodos de investigación experimentales, en lugar de métodos
observacionales. Los fenómenos del aprendizaje no pueden investigarse sin una
metodología experimental.
(2) El segundo rasgo metodológico -la confianza en una perspectiva de proceso
general- es más una cuestión de preferencia que de necesidad.
4.1 EL APRENDIZAJE COMO CIENCIA EXPERIMENTAL.
Los estudios sobre el aprendizaje hacen hincapié en identificar los factores causales
responsables de los cambios persistentes en la conducta que resultan de la
experiencia previa.
De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su
atención en las causas eficientes, materiales y formales.
Independientemente del tipo de causa, este énfasis prescribe que las investigaciones
de aprendizaje utilicen una metodología experimental. Las causas no pueden
observarse directamente. Tan solo pueden ser inferidas a partir de los resultados de
las manipulaciones experimentales.
4.2 LA PERSPECTIVA DE PROCESO GENERAL EN EL ESTUDIO DEL
APRENDIZAJE.
El segundo rasgo metodológico destacable de los estudios de aprendizaje es una
perspectiva basada en procesos generales. Ésta es más una cuestión de preferencia
que de necesidad. Sin embargo, al adoptar una perspectiva de proceso general, los
investigadores del aprendizaje animal siguen una antigua tradición científica.
A. ELEMENTOS DE LA PERSPECTIVA DEL PROCESO GENERAL.
Un presupuesto fundamental de la perspectiva de proceso general es que los
fenómenos estudiados son el resultado de procesos más elementales. Además, se
asume que esos procesos elementales operan de forma similar independientemente
de dónde se encuentren.
Los investigadores del condicionamiento y el aprendizaje se han adherido a la
perspectiva de proceso general desde los comienzos de esta área de estudio en
psicología. Se han centrado en los aspectos comunes de los diversos tipos de
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
10
aprendizaje y han asumido que los fenómenos de aprendizaje son producto de
procesos elementales que operan de forma similar en diversas situaciones de
aprendizaje.
B. IMPLICACIONES METODOLÓGICAS DE LA PERSPECTIVA DEL
PROCESO GENERAL.
Si asumimos que existen principios universales de aprendizaje, entonces
deberíamos ser capaces de descubrir esos principios en cualquier situación en la que
el aprendizaje tenga lugar. Por tanto, una importante implicación metodológica de
la perspectiva de proceso general es que se pueden descubrir los principios del
aprendizaje estudiando cualquier especie o sistema de respuesta que muestre
aprendizaje.
C. DEMOSTRACIÓN DE LA GENERALIDAD DE LOS FENÓMENOS DE
APRENDIZAJE.
La verificación empírica de la existencia de tales mecanismos comunes en diversas
situaciones sigue siendo necesaria para construir una explicación verdaderamente
general del aprendizaje.
Una teoría general del aprendizaje no puede verificarse empíricamente utilizando
sólo unos pocos paradigmas experimentales estandarizados. La generalidad del
aprendizaje debe probarse realizando estudios en distintas especies y situaciones.
5. USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIÓN SOBRE
APRENDIZAJE.
5.1 RAZONES DEL USO DE ANIMALES NO HUMANOS EN LA
INVESTIGACIÓN SOBRE APRENDIZAJE.
5.2 LOS ANIMALES DE LABORATORIO Y LA CONDUCTA NORMAL.
5.3 EL DEBATE PÚBLICO SOBRE LA INVESTIGACIÓN CON ANIMALES
NO HUMANOS.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
11
CAPÍTULO 2
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
1
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 2: CONDUCTA ELICITADA, HABITUACIÓN
Y SENSIBILIZACIÓN.
IDEAS CLAVE
Gran parte de la conducta tiene lugar como respuesta a los estímulos; es decir,
ocurre de forma elicitada.
La forma más sencilla de conducta elicitada es la conducta refleja.
Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante
y su correspondiente respuesta.
En los vertebrados (incluidos los seres humanos) los reflejos simples suelen estar
mediados por tres neuronas:
- una neurona sensorial (también llamada neurona aferente) que transmite el
mensaje sensorial a la médula espinal.
- El impulso neuronal que se transmite a la neurona motora (también llamada
neurona eferente) que activa el músculo involucrado en la respuesta refleja.
- Las neuronas sensorial y motora rara vez se comunican directamente. Los
impulsos que se dirigen de una a otra pasan al menos por una interneurona.
El conjunto formado por la neurona aferente, la interneurona y la neurona eferente
constituye el arco reflejo.
En los vertebrados, el arco reflejo representa el número mínimo de conexiones
neuronales necesarias para que tenga lugar el acto reflejo.
A las secuencias de respuestas típicas de especies particulares, se las denomina
pautas de acción modal o PAMs
El estímulo responsable de una pauta de acción modal puede ser más difícil de
aislar si la respuesta tiene lugar en el curso de interacciones sociales complejas.
Los rasgos específicos que se requieren para elicitar la conducta de picoteo reciben
colectivamente el nombre de estímulo señal o estímulo desencadenante.
Toda conducta motivada, o dirigida a metas, ya sea buscar comida, defender el
territorio o alimentar a los vástagos, involucra secuencias de acciones
sistemáticameme organizadas. Los etólogos denominaron conducta apetitiva a los
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
2
primeros componentes de la secuencia de comportamiento y conducta consumatoria
a los últimos.
En general, las respuestas consumatorias son altamente estereotipadas, conductas
específicas de cada especie que tienen estímulos e1icitantes o desencadenantes
específicos.
Las conductas apetitivas son menos estereotipadas y pueden tomar formas muy
diversas, dependiendo de la situación.
Las respuestas consumatorias tienden a ser pautas de acción modal específicas de la
especie. Las conductas apetitivas, por el contrario, son más variables dependiendo
del entorno.
Las disminuciones de la tendencia a responder producidas por la estimulación
repetida reciben el nombre técnico de efecto de habituación. Los incrementos de la
tendencia a responder se llaman efecto de sensibilización.
Los efectos de habituación y sensibilización son dos tipos básicos de cambios
conductuales que resultan de la experiencia previa.
Habituación: La principal característica del efecto de habituación es una
disminución en la respuesta inicialmente elicitada por un estímulo.
En un reflejo existen tres componentes: un estímulo que activa un órgano sensorial,
la transmisión de los mensajes sensoriales a los nervios motores, los impulsos
nerviosos que activan los músculos dando lugar a la respuesta observable. Según
esto hay varias razones por las que una respuesta elicitada puede no ocurrir:
- Adaptación sensorial: pérdida temporal de la sensibilidad de los órganos
sensoriales, disminución de la sensibilidad (no es habituación).
- Fatiga: incapacidad de los músculos involucrados para realizar la conducta o
respuesta al estímulo.
La adaptación sensorial y la fatiga impiden la respuesta a nivel de los órganos
sensoriales y de los músculos, sin la intervención del sistema nervioso. Por tanto,
pueden distinguirse de la habituación.
Las características de la habituación y la sensibilización no son uniformes en todas
las especies, pero hay muchos aspectos comunes:
- El curso temporal: de la sensibilización y de la habituación (recuperación
espontánea).
- La especificidad del estímulo: en la habituación (generalización del estímulo de
la habituación) y en la sensibilización.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
3
- El efecto de un estímulo externo intenso (deshabituación).
Los estímulos también pueden provocar emociones complejas, por lo que los
conceptos de habituación y sensibilización también se aplican a cambios en
emociones más complejas, y a varios tipos de conducta motivada.
La teoría del proceso oponente de la motivación se diseñó para explicar los tres
rasgos característicos de las emociones:
- Las reacciones emocionales son bifásicas.
- La reacción primaria se debilita con la estimulación repetida.
- El debilitamiento de la reacción primaria va acompañado por un fortalecimiento
del postefecto.
1. LA NATURALEZA DE LA CONDUCTA ELICITADA.
1.1 EL CONCEPTO DE REFLEJO.
Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante
y su correspondiente respuesta. La presentación del estímulo va seguida de la
respuesta, y la respuesta rara vez tiene lugar en ausencia del estímulo.
La especificidad de la relación entre un estímulo y su respuesta refleja es una
consecuencia de la organización del sistema nervioso. En los vertebrados (incluidos
los seres humanos) los reflejos simples suelen estar mediados por tres neuronas:
(1) El estímulo ambiental de un reflejo activa una neurona sensorial (también
llamada neurona aferente) que transmite el mensaje sensorial a la médula espinal.
(2) Allí el impulso neuronal se transmite a la neurona motora (también llamada
neurona eferente) que activa el músculo involucrado en la respuesta refleja. (3) Sin
embargo las neuronas sensorial y motora rara vez se comunican directamente. Los
impulsos que se dirigen de una a otra pasan al menos por una interneurona.
El conjunto formado por la neurona aferente, la interneurona y la neurona eferente
constituye el arco reflejo.
En los vertebrados el arco reflejo representa el número mínimo de conexiones
neuronales necesarias para que tenga lugar el acto reflejo, pero pueden verse
involucradas estructuras neuronales adicionales.
1.2 PAUTAS DE ACCIÓN MODAL.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
4
Las respuestas reflejas simples, tales como la contracción de la pupila ante una luz
brillante o la respuesta de sobresalto ante un sonido fuerte y repentino, pueden verse
en muchas especies. Por el contrario, otras formas de conducta elicitada tienen lugar
únicamente en una especie o en un grupo reducido de especies relacionadas.
A las secuencias de respuestas típicas de especies particulares, tales como las que
aparecen en la alimentación de las crías, se las denomina pautas de acción modal o
PAMs (Baerends, 1988).
Se han identificado pautas de acción modal específicas de cada especie en muchos
aspectos de la conducta animal, incluidos el comportamiento sexual, la defensa del
territorio, la agresión y la captura de presas.
Una característica importante de la pautas de acción modal es que el umbral de
estimulación necesario para que éstas se pongan en marcha varía en función de las
circunstancias
1.3 ESTIMULOS ELICITANTES DE LAS PAUTAS DE ACCIÓN MODAL
Los estímulos elicitantes pueden identificarse fácilmente cuando se trata de reflejos
simples, como la respuesta de sobresalto ante un ruido fuerte. El estímulo
responsable de una pauta de acción modal puede ser más difícil de aislar si la
respuesta tiene lugar en el curso de interacciones sociales complejas.
Los rasgos específicos que se requieren por ejemplo para e1icitar la conducta de
picoteo reciben colectivamente el nombre de estímulo señal o estímulo
desencadenante.
Un estimulo señalo desencadenante es suficiente para elicitar una pauta de acción
modal. Sin embargo, una determinada pauta de acción puede estar controlada por
varios rasgos de! Estímulo de forma aditiva.
Además, el estímulo que elicita con mayor efectividad la pauta de acción no tiene
por qué ser el que ocurra con mayor probabilidad en condiciones naturales.
1.4 LA ORGANIZACIÓN SECUENCIAL DE LA CONDUCTA
Las respuestas no tienen lugar aisladas unas de otras. Más bien, las acciones
individuales se organizan en secuencias de comportamiento funcionalmente
efectivas.
Toda conducta motivada, dirigida a metas, ya sea buscar comida, encontrar una
pareja potencial, defender el territorio alimentar a los vástagos, involucra secuencias
de acciones sistemáticamente organizadas. Los etólogos denominaron conducta
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
5
apetitiva a los primeros componentes de la secuencia de comportamiento y
conducta consumatoria a los últimos.
las respuestas consumatorias son acciones que concluyen una secuencia de
respuestas típica de una especie. Por el contrario, las respuestas apetitivas tienen
lugar en las primeras fases de la secuencia de conducta y sirven para poner al
organismo en contacto con los estímulos que desencadenan la conducta
consumatoria.
Las respuestas consumatorias tienden a ser pautas de acción modal específicas de la
especie. Las conductas apetitivas, por el contrario, son más variables dependiendo
del entorno.
La organización secuencial de las conductas que tienen lugar en condiciones
naturales es muy importante para los científicos interesados en entender cómo el
comportamiento se ve alterado por el aprendizaje, ya que los fenómenos de
aprendizaje dependen a menudo de qué componente de la secuencia de conducta se
ve modificado.
2. EFECTOS DE LA ESTIMULACIÓN REPETIDA.
Un supuesto común es que una respuesta elicitada -en concreto, una respuesta
refleja simple- ocurre automáticamente de la misma forma siempre que se presenta
el estímulo elicitante. Esto es exactamente lo que pensaba Descartes.
Pero contrariamente a los presupuestos de Descartes, la conducta elicitada no es
inmutable. Uno de los rasgos más característicos de la conducta elicitada es su
plasticidad.
2.1 ATENCIÓN VISUAL EN LOS BEBÉS HUMANOS.
Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma
de obtener información es observar las cosas del enromo. Las claves visuales
elicitan una respuesta de observación, que puede medirse por el tiempo que los
bebés mantienen sus ojos en un objeto antes de mirar a otra parte.
2.2 SALIVACIÓN Y EVALUACIÓN DEL SABOR EN HUMANOS.
El sabor de la comida e1icita la salivación como respuesta refleja. Esto puede
observarse tan claramente en las personas como en los perros de Pavlov.
2.3 RESPUESTA DE SOBRESALTO EN RATAS.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
6
La respuesta de sobresalto es una respuesta defensiva que aparece en muchas
especies incluida la humana. Si alguien hace sonar una bocina a nuestra espalda, es
probable que mostremos una respuesta de sobresalto. Consiste en un salto repentino
y una contracción de los músculos de la parte superior del cuerpo, con frecuencia
acompañado de una elevación de los hombros.
3. LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN.
Los estudios descritos en la sección previa muestran que la presentación repetida de
un estímulo elicitante puede provocar tamo disminuciones como incrementos en la
respuesta.
Las disminuciones de la tendencia a responder producidas por la estimulación
repetida reciben el nombre técnico de efecto de habituación. Los incrementos de la
tendencia a responder se llaman efecto de sensibilización.
Los efectos de habituación y sensibilización son dos tipos básicos de cambios
conductuales que resultan de la experiencia previa. Son rasgos tan fundamentales
del ajuste de los organismos al entorno que tienen lugar en todas las especies y en
todos los sistemas de respuesta.
Los efectos de habituación y sensibilización pueden ocurrir en cualquier situación
que conlleve la exposición repetida a un estímulo.
3.1 ADAPTABILIDAD Y GENERALIDAD DE LA HABITUACIÓN Y LA
SENSIBILIZACIÓN.
Los fenómenos de habituación y sensibilización son el producto final de procesos
que ayudan a organizar y focalizar la conducta en el caótico mundo de estimulos en
el que los organismos viven.
3.2 DIFERENCIAS ENTRE HABITUACIÓN, ADAPTACIÓN SENSORIAL Y
FATIGA.
La principal característica del efecto de habituación es una disminución en la
respuesta inicialmente elicitada por un estímulo.
La habituación no es el único efecto que da lugar a una disminución en la respuesta.
Para entender otras fuentes alternativas de disminuciones en la respuesta, volvamos
al concepto de reflejo. Un reflejo consta de tres componentes. Primero, un estímulo
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
7
activa uno de los órganos sensoriales, como los ojos o los oídos. Esto genera
impulsos neuronales que se envían al sistema nervioso central (médula espinal y
cerebro). El segundo componente es la transmisión de los mensajes sensoriales a los
nervios motores a través de las interneuronas. Tercero, los impulsos nerviosos de
los nervios motores activan los músculos dando lugar a la respuesta observable.
Dados estos tres componentes de un reflejo, existen varias razones por las cuales
una respuesta elicitada puede no ocurrir.
(1) Las disminuciones en la sensibilidad reciben el nombre de adaptación sensorial,
que es distinta de la habituación. (2) La respuesta tampoco tendrá lugar si los
músculos involucrados quedan incapacitados por la fatiga. La adaptación sensorial
y la fatiga impiden la respuesta a nivel de los órganos sensoriales y de los músculos,
sin la intervención del sistema nervioso. Por tanto, pueden distinguirse de la
habituación.
Se asume que la habituación y la sensibilización conllevan cambios
neurofisiológicos que dificultan o facilitan la transmisión de los impulsos
neuronales desde las neuronas sensoriales a las motoras.
En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que
existe evidencia de que la habituación es específica de la respuesta. La fatiga
también puede descartarse como causa de la habituación por medio de evidencia
que muestra que la habituación es específica del estímulo. Una respuesta habituada
se recupera rápidamente cuando se introduce un estímulo novedoso.
3.3 TEORÍA DEL PROCESO DUAL DE LA HABITUACIÓN Y LA
SENSIBILIZACIÓN.
Los efectos de habituación y sensibilización son cambios en la conducta o en la
ejecución. Se trata de la manifestación o el resultado conductual observable de la
presentación de los estímulos. ¿Cuáles son los factores responsables de tales
cambios?
La teoría del proceso dual propuesta por Groves yThompson (1970) continúa siendo
la principal teoría sobre la habituación y la sensibilización.
La teoría del proceso dual presupone que los incrementos y disminuciones en la
tendencia a responder a un estímulo son producto de procesos neurales diferentes.
Uno de estos procesos neurales el proceso de habituación, provoca una disminución
en la tendencia a responder. Otro, el proceso de sensibilización, produce un
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
8
incremento en la tendencia a responder. Estos procesos no son mutuamente
excluyentes. Ambos pueden estar activos al mismo tiempo. El resultado conductual
de estos procesos subyacentes depende de qué proceso sea más fuerte.
4. CARACTERÍSTICAS DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN.
Aunque las características de la habituación y la sensibilización no son
perfectamente uniformes en todas las especies y sistemas de respuesta, hay muchos
aspectos comunes.
4.1 CURSO TEMPORAL.
CURSO TEMPORAL DE LA SENSIBILIZACIÓN. El incremento en la tendencia
a responder tiene normalmente una vida corta. En todos los sistemas de respuesta la
duración de los efectos de sensibilización está determinada por la intensidad del
estímulo. Los estímulos más intensos producen mayores incrementos en la
tendencia a responder y una sensibilización más persistente.
CURSO TEMPORAL DE LA HABITUACIÓN. La persistencia de la habituación
también es variable. Hay dos tipos de efecto de habituación cualitativamente
distintos: la habituación a corto plazo se parece a la mayoría de los casos de
sensibilización en que se disipa relativamente rápido -en segundos o minutos-; ek
otro tipo, la habituación a largo plazo persiste durante muchos días.
4.2 ESPECIFICIDAD DEL ESTÍMULO.
ESPECIFICIDAD DEL ESTÍMULO EN LA HABITUACIÓN. La habituación es
específica del estímulo que ha sido presentado repetidamente (Thompson y
Spencer, 1966). Una respuesta a un estímulo previamente habituada puede
manifestarse plenamente alterando alguna característica importante del estímulo.
ESPECIFICIDAD DEL ESTÍMULO EN LA SENSIBILIZACIÓN. A diferencia de
la habituación, la sensibilización no es muy específica del estímulo. Si un animal se
activa o sensibiliza por alguna razón, su reactividad se incrementará para toda una
variedad de estímulos.
4.3 EFECTO DE UN ESTÍMULO EXTERNO INTENSO
Como ya se ha señalado, un cambio en la naturaleza del estímulo elicitante puede
dar lugar a la recuperación de una respuesta habituada. Sin embargo, ésta no es la
única forma de restablecer rápidamente la respuesta tras la habituación.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
9
La respuesta habituada también puede restablecerse sensibilizando al organismo
con la exposición a un estímulo externo. Este fenómeno recibe el nombre de
deshabituación.
Es importante tener presente que la deshabituación hace referencia a la recuperación
de la respuesta al estímulo previamente habituado.
5. APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA.
La exposición de los cambios producidos por la repetición de un estímulo elicitante
se ha limitado hasta ahora a respuestas relativamente sencillas. Los estimulas
también pueden provocar emociones complejas, tales como amor, miedo, euforia,
terror o satisfacción.
Ya hemos descrito la habituación de una respuesta emocional debida a la
presentación repetida de un sabor (Figura 2.8), pero los conceptos de habituación y
sensibilización también se han aplicado a cambios en emociones más complejas
(Hoffman y Solomon, 1974; Solomon y Corbit, 1974) y a varios tipos de conducta
motivada, como la alimentación, la ingestión de líquido, la exploración,
la agresión, el cortejo y la conducta sexual (McSweeney y Swindell, 1999), así
como a la adicción a las drogas
5.1 REACCIONES EMOCIONALES Y SUS EFECTOS POSTERIORES.
En su revisión de ejemplos de respuestas emocionales a varios estímulos,
incluyendo drogas, Solomon y Corbit (1974) destacaron dos rasgos llamativos:
(1) Primero, las reacciones emocionales intensas a menudo constan de dos fases.
Una emoción tiene lugar durante la presentación del estímulo elicitante, y la opuesta
se observa cuando el estímulo desaparece. (2) Otra característica común de las
reacciones emocionales es que cambian con la experiencia. La reacción primaria se
hace más débil y su post efecto se hace más fuerte.
5.2 LA TEORÍA DEL PROCESO OPONENTE.
Los ejemplos anteriores ilustran tres características comunes de las reacciones
emocionales:
(1) Las reacciones emocionales son bifásicas; a una reacción primaria sigue un post
efecto opuesto. (2) La reacción primaria se debilita con la estimulación repetida. (3)
El debilitamiento de la reacción primaria va acompañado por un fortalecimiento del
post efecto.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
10
La teoría del Proceso oponente de la motivacidn (Solomon y Corbit, 1973, 1974) se
diseñó para explicar estos tres rasgos característicos de las emociones.
La teoría del proceso oponente asume que los mecanismos neurofisiológicos
involucrados en la conducta emocional tratan de mantener la estabilidad emocional.
Así pues, la teoría del proceso oponente es una teoría homeostática. Se basa en la
premisa de que una función importante de los mecanismos que controlan la
conducta emocional es minimizar las desviaciones con respecto a la neutralidad o
estabilidad emocional.
La teoría del proceso oponente asume que la presentación de un estímulo emocional
activador elicita inicialmente lo que se denomina el proceso primario, o proceso a,
que es el responsable de la naturaleza del estado emocional (por ejemplo, felicidad)
que tiene lugar en presencia del estímulo. El proceso primario o a elicita a su vez un
proceso oponente, o proceso b, que genera la reacción emocional opuesta.
Los procesos primario y oponente son mecanismos internos cuyos efectos son los
cambios emocionales observados.
Un presupuesto adicional básico para la teoría del proceso oponente es que el
proceso oponente es ligeramente ineficiente. Al principio permanece a la zaga de la
alteración emocional primaria y, por tanto, no es lo suficientemente fuerte para
compensar por completo la emoción primaria. Sin embargo, el proceso oponente se
hace más rápido y potente con la práctica o con la experiencia repetida con el
estímulo que activa la emoción.
MECANISMOS OPONENTES DURANTE LA EXPOSICIÓN INICIAL AL
ESTÍMULO. Cuando el estímulo se presenta por primera vez, el proceso a tiene
lugar sin la oposición del proceso b. Esto permite que la reacción emocional
primaria alcance su nivel más alto. Después se activa el proceso b y comienza a
oponerse al proceso a.
MECANISMOS OPONENTES TRAS LA EXPOSICIÓN PROLONGADA AL
ESTÍMULO. Un estímulo familiar no elicita reacciones emocionales fuertes, pero el
post efecto afectivo tiende a ser más fuerte cuando termina un estímulo familiar. La
teoría del proceso oponente explica este resultado asumiendo que el proceso b se
fortalece con la exposición prolongada al estímulo.
MOTIVACIÓN Y POSTEFECTO OPONENTE. Hay dos formas de reducir los
post efectos oponentes aversivos de las drogas. Una de ellas es esperar el tiempo
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
11
necesario para que se disipen -lo que se conoce como "pasar el mono"-. Para los
consumidores habituales de droga, el "mono" puede durar mucho tiempo y puede
ser muy duro. El post efecto oponente puede reducirse mucho más rápidamente
tomando de nuevo la droga. Esto reactivará el proceso primario y acabará con la
agonía de la abstinencia.
5.3 VARIACIONES EN LA CONDUCTA DIRIGIDA A METAS.
Responder para escapar de la molestia producida por la retirada de un estímulo es
sólo uno de los tipos de conducta motivada o dirigida a metas. Un objeto meta
gratificante recibe el nombre técnico de reforzador.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
12
CAPÍTULO 3.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
13
ESQUEMA-RESUMEN TEMA 3. ESQUEMA BÁSICO DEL CONDICIONAMIENTO CLÁSICO
ESTÍMULO CONDICIONAL (E.C)
Sonido de campana
ESTÍMULO INCONDICIONAL (E.I)
Comida
RESPUESTA CONDICIONAL (R.C)
Salivación asociada al sonido
RESPUESTA INCONDICIONAL (R.I)
salivación
Estímulos y respuestas cuyas propiedades
aparecen sólo tras el entrenamiento.
Estímulos y respuestas cuyas propiedades
no dependen de ningún entrenamiento
previo.
PROCESO DE CONDICIONAMIENTO:
1. E.I R.I
2. ENTRENAMIENTO E.C+E.I+R.I
3. ASOCIACIÓN E.C (no E.I) R.C
ALGUNOS CONCEPTOS QUE HAY QUE CONOCER:
Respuesta emocional condicionada o supresión condicionada Razón de supresión Ensayo de condicionamiento Sesión de entrenamiento Intervalo entre ensayos Intervalo entre estímulos o intervalo EC-EI Intervalo de huella Ensayo de prueba Procedimiento de control pseudocondicionamiento
En este caso el estímulo (sonido de campana) no provoca salivación hasta que por entrenamiento sucesivo se asocia con
algo que sí provocaba esta salivación desde el primer momento (comida).
En este caso el estímulo provoca la salivación con su sola presencia y
desde el primer momento.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
14
1. SITUACIONES EXPERIMENTALES PARA EL ESTUDIO DEL CONDICIONAMIENTO CLÁSICO.
1. CONDICIONAMIENTO DEL MIEDO: condicionamiento de las reacciones
emocionales. Procedimientos para ampliar el rango de estímulos que pueden
despertar una emoción. Se trata de elicitar una reacción emocional de miedo
ante un estímulo que en principio no la elicitaba.
2. CONDICIONAMIENTO DEL PARPADEO: sirve para demostrar aspectos
importantes del aprendizaje, como que el condicionamiento clásico implica
emparejar EC y EI. Y que el aprendizaje inicial puede no ser directamente
observable.
3. SEGUIMIENTO DEL SIGNO: o automoldeamiento. Paradigma que
contribuye a la nueva concepción actual del condicionamiento pavloviano. Es
una herramienta útil para el estudio del aprendizaje asociativo. La paloma
aprende a considerar la tecla iluminada como un “signo” de la comida (de ahí
el nombre de la técnica), y desarrolla una RC hacia ella que es similar a la RI
de comer.
4. APRENDIZAJE DE AVERSIÓN AL SABOR: es el resultado del
emparejamiento de un EC con un EI y sigue las mismas leyes de aprendizaje
que el condicionamiento clásico. Pero tiene dos características especiales:
un aprendizaje tan rápido es poco común, puede tener lugar de forma
demorada.
2. PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO
EXCITATORIO. - En el condicionamiento excitatorio los organismos aprenden una asociación
entre los estímulos condicionado e incondicionado.
- Como resultado de esta asociación la presentación del EC activa la actividad
conductual y neuronal relacionada con el EI, sin la presentación real del EI.
- En todos estos casos el EC adquiere la capacidad de activar la conducta
relacionada con el EI asociado.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
15
2.1 PROCEDIMIENTOS TÍPICOS DE CONDICIONAMIENTO PAVLOVIANO
- Uno de los factores críticos que determinan cómo se desarrolla el
condicionamiento clásico es la ordenación temporal del EC y del EI.
- En la mayoría de situaciones variaciones pequeñas en la forma de emparejar
EC y EI puede tener importantes efectos en la intensidad de la RC.
- Cada configuración del EC y del EI representa un único ensayo de
condicionamiento.
- Un procedimiento típico de condicionamiento clásico implica que a lo largo
de una sesión de entrenamiento se repiten varios episodios de
emparejamiento del EC-EI.
- Dentro de cada entrenamiento, el tiempo entre el final de un ensayo y el
comienzo de otro se llama intervalo entre ensayos.
- Dentro de cada ensayo, el tiempo entre el comienzo del EC y el comienzo del
EI se llama intervalo entre estímulos o intervalo EC-EI
- Para que se desarrolle la respuesta condicionada el intervalo entre
estímulos debe ser mucho más corto que el intervalo entre ensayos.
1. CONDICIONAMIENTO DE DEMORA CORTA: en cada ensayo se va
retrasando ligeramente el comienzo del EI tras el EC. Comienza siempre
antes de que termine el EC, y con una separación de 1 minuto.
2. CONDICIONAMIENTO DE HUELLA: se presenta primero el EC y luego el
EI (como en el anterior), pero con un intervalo de huella. Este intervalo es el
espacio que se deja tras el fin del EC y el inicio del EI.
3. CONDICIONAMIENTO DE DEMORA LARGA: se presenta primero el EC y
luego el EI. Pero el EI tarda no sólo un minuto en aparecer, sino entre 5 y
10. Pero no hay intervalo, puesto que aparece siempre antes de terminar el
EC.
4. CONDICIONAMIENTO SIMULTÁNEO: ambos estímulos se presentan a la
vez.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
16
5. CONDICIONAMIENTO HACIA ATRÁS: el EI ocurre un poco antes, y no
después del EC.
2.2 CÓMO MEDIR LAS RESPUESTAS CONDICIONADAS
- De qué modo el condicionamiento de un EC depende de la relación temporal
entre EC y EI.
- La forma de medir es mediante un ensayo de prueba, que consiste en la
presentación del EC aislado, es decir, sin el EI. Así se puede observar la
repuesta que provoca el EC sin la interferencia de las respuestas provocadas
por el EI.
- La respuesta que tiene lugar durante el EC se puede cuantificar de varias
maneras: la magnitud (o cantidad de respuesta que se da), la probabilidad (o
fuerza de la respuesta), la latencia (o cantidad de tiempo entre el principio
del EC y la aparición de la RC).
2.3 PROCEDIMIENTOS DE CONTROL EN EL CONDICIONAMIENTO CLÁSICO.
No es suficiente realizar un ensayo de prueba válido, para tener evidencia de que
se haya producido condicionamiento clásico. Para estar seguros de que un proceso
de condicionamiento es la causa de cambios en la conducta, se deben comparar
estos cambios con los efectos sobre un procedimiento de control.
Cómo realizar un procedimiento de control:
- una asociación entre un EC y un EI implica que los dos eventos han quedado
conectados de alguna forma.
- Después de establecida la asociación el EC tiene capacidad para activar
procesos relacionados con el EI
- Una asociación implica más que la mera familiaridad con el EC y el EI.
Dependerá de que los dos estímulos se hayan experimentado con alguna
conexión entre ellos
- Para concluir que se ha establecido una asociación hay que asegurarse de
que el cambio conductual observado no podría haberse producido por la
mera presentación del EC o del EI por separado
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
17
Los casos en los que la simple exposición al EI da lugar a respuestas similares a la
respuesta condicionada reciben el nombre de pseudocondicionamiento.
- para determinar si las respuestas que se dan ante el EC representan una
asociación en entre el EC y el EI, y no un efecto de sensibilización, se
requieren procedimientos de control.
- Un procedimiento de control debería tener el mismo número y distribución
de presentaciones del EC y del EI que el procedimiento experimental, y
disponer el EC y el EI sin que queden asociados.
- Para no asociarlos se pueden presentar de forma aleatoria durante una
sesión experimental, mediante un procedimiento de control aleatorio.
- Otra forma de presentarlos es mediante el procedimiento de control
desemparejado explícito, en el que EC y EI se presentan lo suficientemente
separados como para que no se asocien.
3. CONDICIONAMIENTO PAVLOVIANO INHIBITORIO (INHIBIR: impedir o reprimir, suspender transitoriamente una función o actividad
del organismo mediante la acción de un estímulo adecuado).
- Hasta ahora se ha estudiado el condicionamiento pavloviano en términos de
aprendizaje, para predecir cuándo va a aparecer un evento significativo o EI.
- Existe otro tipo de condicionamiento, en el que los participantes aprenden a
predecir la ausencia del EI.
- El condicionamiento inhibitorio es aquel en el que se logra que la
presentación de un EC inhiba una respuesta. Para ello, durante la fase de
adquisición se implanta una contingencia negativa: cada vez que aparece EC, va
seguido de un periodo de ausencia de EI.
- La inhibición resulta especialmente difícil de estudiar, ya que en muchos
casos no hay una medida directa. Y entonces resulta complicado distinguir si
el organismo se ha condicionado inhibitoriamente o, por el contrario,
simplemente no ha aprendido nada.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
18
- En el condicionamiento excitatorio el EC sirve para predecir el EI. EC se
asocia a EI porque siempre le precede.
- En el condicionamiento inhibitorio el EC sirve para predecir la ausencia de
EI. EC se asocia con ausencia de EI porque éste EI aparece en cualquier
momento, excepto en los casos en los que se presenta el EC.
- Para que se produzca el condicionamiento inhibitorio se necesita una
contingencia negativa entre el EC y el EI. La contingencia negativa implica que
cuando el EC está presente nunca sucede EI. Si sucede el EI es porque el EC
no está presente.
ESTÍMULO CONDICIONAL (E.C)
Profesor/a
ESTÍMULO INCONDICIONAL (E.I)
Actitud de acoso por parte de alguien
hacia mí
RESPUESTA CONDICIONAL (R.C)
RESPUESTA INCONDICIONAL (R.I)
CONTINGENCIA NEGATIVA: presencia del EC para que no se de el
EI.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
19
CAPÍTULO 4.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
20
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 4: CONDICIONAMIENTO CLÁSICO: MECANISMOS.
1. A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS? 1.1 RESPUESTA INICIALES A LOS ESTÍMULOS
Pavlov hizo hincapié en los criterios de eficacia de los estímulos condicionados e
incondicionados al definir los términos condicionado e incondicionado.
De acuerdo con estas definiciones, el estímulo condicionado (EC) inicialmente no
provoca la respuesta condicionada, pero adquiere la capacidad de hacerlo como
resultado del desarrollo de una asociación con el estímulo incondicionado (El).
Por el contrario, el EI elicita eficazmente la respuesta en cuestión desde el principio,
sin ningún entrenamiento especial. Las definiciones de Pavlov estaban formuladas
en términos de elicitación de una respuesta particular -aquella que se trataba de
condicionar-.
Debido a esto, la identificación de ECs y EIs potenciales requiere que se comparen
las respuestas provocadas por cada uno de ellos antes del condicionamiento.
Tal comparación hace que la identificación de los ECs y de los EIs sea relativa. Un
evento particular puede servir de EC respecto a un estímulo y de El respecto a otro
(sacarina en aversión al sabor como EC y en seguimiento del signo como EI).
1.2 LA NOVEDAD DE LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADO
El efecto conductual de un estímulo depende de su novedad.
Los estímulos familiares no suscitan reacciones tan intensas como los estímulos
novedosos. El aprendizaje se desarrolla con mayor lentitud que si el EC y el El son
novedosos.
La familiarización inicial con un estímulo presentado aisladamente suele retrasar el
condicionamiento posterior de dicho estímulo. Este fenómeno se denomina efecto
de preex:posición al EC o efecto de inhibición latente.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
21
La función del efecto de preexposición al EC es similar a la función de la
habituación. Ambos fenómenos sirven para limitar la cantidad de procesamiento y
atención a los estímulos que se sabe carecen de consecencias.
La habituación sirve para sesgar la conducta elicitada a favor de los estímulos
novedosos. La inhibición latente sirve para sesgar el aprendizaje en favor de los
estímulos novedosos.
Los sujetos familiarizados con un EI antes de su emparejamiento con un EC
desarrollan la respuesta condicionada al EC más lentamente que los participantes
para los cuales el EI es novedoso durante los emparejamientos EC-EI. Este resultado
se denomina efecto de preexposición al EI.
De momento no hay ninguna teoría que haya sabido explicar satisfactoriamente
todos los datos relativos a los mecanismos de los efectos de preexposición al EC y al
EI: (1) una posición es que son varios los mecanismos involucrados. Uno de los
mecanismos conllevaría cierta interferencia asociativa (que implica que las
preexposiciones al EC o al EI disminuyen la capacidad de estos estímulos para
participar en nuevas asociaciones). (2) otra explicación de los efectos de
preexposición es la interferencia de memoria. De acuerdo con esta perspectiva la
respuesta condicionada resulta alterada debido a que los participantes recuerdan lo
sucedido en ambas fases del experimento.
1.3 INTENSIDAD Y SALIENCIA DEL E.C Y DEL E.I
Otra variable importante para el condicionamiento clásico es la intensidad de los EC
y EI. La mayor parte de los efectos biológicos y fisiológicos de la estimulación se
relacionan con la intensidad del estímulo.
Es decir, la respuesta condicionada es más fuerte cuando se utilizan estímulos
condicionados e incondicionados más intensos.
La intensidad del estímulo es uno de los factores que contribuyen al concepto más
general de saliencia del estímulo.
El concepto de saliencia no tiene una definición clara, pero sí se puede decir que
viene a significar “significación” o “perceptibilidad”. Es decir, las teorías del
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
22
aprendizaje suelen asumir que el apendizaje tendrá lugar de forma más rápida si se
utilizan estímulos más salientes.
Un estímulo puede adquirir saliencia o significación aumentando su intensidad, lo
que hace que despierte mayor atención.
Otra forma de incrementar la saliencia de un EC es hacer que el EC del laboratorio
se parezca más al tipo de estímulos que el animal puede encontrar en su ambiente
natural.
1.4 RELEVANCIA O PERTINENCIA EC-EI
Otra variable que afecta al ritmo de desarrollo del condicionamiento clásico es el
grado en que el EC es relevante o pertinente con respecto al EI.
(Experimento de García y Koelling). Ilustra el principio de la relevancia o
pertinencia del EC-EI. El aprendizaje dependía de la relevancia o adecuación del EC
con respecto al EI que se administraba. El aprendizaje tiene lugar rápidamente sólo
si el EC se combina con el EI apropiado (El “Efecto García” (García y Koelling,
1966): Grupos de ratas sometidos a varios ECs (sabor, sonido y luz) y a varios EI:
rayos X, cloruro de litio inyectado (que producen RIs de nauseas y trastornos
viscerales), y descargas eléctricas. Se comprueba que los animales que han recibido
descargas dan RCs a la luz y al sonido, mientras los animales "intoxicados" dan
RCs al sabor. Interpretación: los organismos tienen una predisposición innata a
aprender relaciones entre ciertas clases de estímulos, y no entre otras clases. Así,
un organismo asocia fácilmente un sabor con un malestar interno, o un sonido con
un dolor externo (descarga), pero a la inversa la asociación es mucho más difícil).
1.5 EL CONCEPTO DE FUERZA BIOLÓGICA
Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza
biológica menor que la del estímulo incondicionado con el que se emparejaba.
El concepto de “menor fuerza biológica” se refería a que inicialmente el EC debía
elicitar menos respuestas y más débiles que el EI.
CONDICIONAMIENTO DE ORDEN SUPERIOR. Una implicación del criterio
pavloviano de fuerza biológica es que un estímulo puede hacer de EI tras haber sido
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
23
fuertemente condicionado. (un tono emparejado de forma repetida con comida
terminará elicitando la salivación y fuertes respuestas de seguimiento del signo. En
este momento el tono debería ser efectivo a la hora de codicionar la salivación a una
luz, estímulo novedoso que no elicita en principio respuestas intensas).
Los emparejamientos del tono previamente condicionado con la luz deberían
dar como resultado un progresivo condicionamiento de la salivación ante la
luz. Este efecto se observa con frecuencia y recibe el nombre de
condicionamiento de orden superior.
Al denominarse de orden superior se considera el condicionamiento como si
operase en diferentes niveles.
En el ejemplo, el emparejamiento del tono con la comida se considera
condicionamiento de primer orden. El emparejamiento de la luz con el tono
previamente condicionado se considera condicionamiento de segundo orden.
Si tras estar condicionada la luz se usara para condicionar otro estímulo se
trataría de condicionamiento de tercer orden.
CONTRACONDICIONAMIENTO. En el contracondicionamiento dos estímulos
pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente
respuestas intensas. (como técnica de modificación de la conducta consiste en
presentar el objeto que provoca una conducta que queremos eliminar, de tal modo
que el sujeto lo experimente como poco amenazante y junto con un estímulo muy
positivo, como puede ser la comida).
Según la definición convencional el EC es un estímulo neutro en el sentido de
que no provoca una respuesta potente y definida, ni posee un especial
significado motivacional. Sin embargo es posible utilizar estímulos que no
son neutros como ECs.
El contracondicionamiento es cualquier procedimiento de condicionamiento
clásico en el que se emplea como EC un estímulo que previamente tiene para
el organismo un signo motivacional opuesto. Es decir, se trata de usar un EC
asociado a una respuesta apetitiva como EC en una nueva adquisición en la
que se asocia a un EI aversivo, o a la inversa.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
24
PRECONDICIONAMIENTO SENSORIAL. También pueden aprenderse
asociaciones entre dos estímulos que tan sólo elicitan una débil respuesta de
orientación antes del condicionamiento.
En términos operativos el procedimiento consiste en emparejar dos estímulos
neutros (A y B) en una situación que sería idéntica a una fase de adquisición
normal, salvo porque no hay ningún EI propiamente dicho. Después el EC
(A) se empareja con el EI y adquiere la capacidad de elicitar la respuesta
condicionada (RC). En una sesión de prueba posterior se encuentra que el EC
(B) también elicita el RC a pesar de que el EC (B) nunca se ha emparejado
con el EI.
2. ¿QUÉ DETERMINA LA NATURALEZA DE LA RESPUESTA
CONDICIONADA? 2.1 EL MODO DE SUSTITUCION DEL ESTÍMULO
La primera y más duradera explicación acerca de la naturaleza de la respuesta
condicionada (RC) es el modelo de sustitución del estímulo de Pavlov. De acuerdo
con este modelo, el EC adquiere la capacidad de funcionar de forma similar a como
el El lo hacía previamente. Se asume que el EC activa los circuitos neuronales que
previamente activaba sólo el EI y elicita respuestas similares a las del El.
Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos
enlaces neuronales. En el curso de los emparejamientos repetidos de los estímulos
condicionado e incondicionado, se desarrolla una nueva conexión entre los circuitos
que previamente activaba el EC y los circuitos que previamente activaba sólo el EI.
Una vez que esta nueva conexión se ha establecido, la presentación del EC da lugar
a la activación de los circuitos del El, que a su vez generan la respuesta
incondicionada.
Por lo tamo, de acuerdo con e! modelo de Pavlov, el condicionamiento permite al
EC e1icitar la respuesta incondicionada. El EC se convierte en un sustituto del EI.
EL E.I COMO FACTOR DETERMINANTE DE LA RC. Estímulos
incondicionados diferentes elicitan repuestas condicionadas diferentes. La
comida elicita salivación y aproximación, las descargas elicitan aversión y
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
25
alejamiento. Si el condicionamiento convierte el EC en un sustituto del EI,
entonces los ECs condicionados con diferentes EIs deberían provocar
diferentes tipos de respuesta condicionada.
2.2 APRENDIZAJE Y HOMEOSTASIS: UN CASO ESPECIAL DE SUSTITUCION DEL ESTÍMULO
Walter Cannon introdujo el concepto de homeostasis para referirse a los
mecanismos fisiológicos que mantienen los aspectos críticos del cuerpo dentro de
los límites aceptables.
¿Cómo se logra y se mantiene el nivel homeostático ideal? Para lograr la
homeostasis se requiere que cualquier amenaza al nivel homeostático ponga en
marcha una reacción compensatoria que neutralice la alteración (ejemplo de
descenso de temperatura corporal en animales de sangre caliente. La exposición al
frío acciona de forma refleja reacciones compensatorias que ayudan a conservar e
incrementar la temperatura. Estas reacciones incluyen la vasoconstricción periférica
y los escalofríos).
Los mecanismos homeostáticos, tal y como los concebía Cannon, funcionaban por
procesos de retroalimentación negativa que servían para contrarrestar las
alteraciones una vez que éstas ya habían provocado una desviación con respecto al
nivel homeostático. Esto puede resultar ineficiente, especialmente si el proceso de
corrección o compensación tarda en activarse. Dwokin (1993) señaló que las
alteraciones en la homeostasis pueden compensarse más efectivamente si pueden
anticiparse. El condicionamiento pavloviano proporciona los medios necesarios para
tal anticipación.
En el caso del frío los procesos de retroalimentación necesitan que haya una
disminución de la temperatura corporal antes de que se pongan en marcha las
reacciones compensatorias. Pero si los sujetos pueden aprender qué claves señalan
cuándo va a tener frío, pueden realizar ajustes compensatorios que se anticipan al
frío, evitando sufrir una disminución de la temperatura corporal.
De acuerdo con esta perspectiva, la respuesta condicionada a una alteración
fisiológica es igual que la respuesta compensatoria a dicha alteración. Por tanto, la
respuesta condicionada es la misma que la respuesta incondicionada, sólo que esta
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
26
vez la respuesta incondicionada es una reacción compensatoria a una alteración
fisiológica.
Las RESPUESTAS HOMEOSTÁTICAS CONDICIONADAS se han examinado
con más detenimiento en los estudios sobre la forma en que los organismos
responden a la administración de drogas psicoactivas. Las drogas suelen provocar
alteraciones fisiológicas de la homeostasis que activan reacciones compensatorias
condicionadas. Las claves que se asocian con la alteración fisiológica inducida por
la droga pueden llegar a elicitar estas reacciones compensatorias como respuestas
condicionadas anticipatorias.
Por ejemplo, la ansiedad por consumir droga que suelen mostrar los consumidores
habituales de droga es una manifestación de estas respuestas condicionadas
anticipatorias. La cafeína por ejemplo es una droga de consumo habitual cuyos
efectos farmacológicos van normalmente precedidos por el sabor y el olor del café.
Por lo tanto éstos pueden funcionar como estímulos condicionados que predicen los
efectos fisiológicos de la cafeína.
EL MODELO DE CONDICIONAMIENTO DE TOLERANCIA A LAS
DROGAS.
Quizá sea en lo referente al desarrollo de la tolerancia a las drogas donde más
extensamente se ha estudiado el papel del condicionamiento pavloviano. Se
considera que se ha desarrollado tolerancia a la droga cuando las administraciones
repetidas de la misma tienen un efecto cada vez menor. Se requieren dosis cada vez
mayores para producir el mismo efecto. Tradicionalmente se ha considerado que la
tolerancia a la droga se debía a procesos farmacológicos. En contraste con esta
visión tradicional, Shepard Siegel ha propuesto un modelo de tolerancia a la droga
basado en el condicionamiento clásico.
El modelo de condicionamiento utiliza el concepto de homeostasis aprendida. De
acuerdo con este concepto, la administración de una droga psicoactiva provoca
cambios fisiológicos que afectan a la homeostasis. Esos cambios fisiológicos
constituyen el estímulo incondicionado que a su vez pone en marcha ajustes
compensatorios incondicionados para contrarrestar la alteración.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
27
Estos ajustes compensatorios reflejos son la respuesta incondicionada a las drogas.
Mediante el condicionamiento pavloviano, los estímulos que acompañan a la
administración de la droga se asocian con el EI Estos estímulos condicionados
pueden ser la hora del día, las sensaciones involucradas en la preparación de la
jeringuilla o el lugar donde la droga se consume habitualmente.
Debido a que las respuestas condicionadas contrarrestan los efectos de la droga, la
reacción que ésta produciría en condiciones normales se reduce, dando lugar a la
tolerancia a la droga.
El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a
las respuestas compensatorias condicionadas a los estímulos del entorno que se
emparejan con la administración de la droga. Una importante predicción del modelo
es que la tolerancia a la droga se verá atenuada si los sujetos reciben la droga en
condiciones novedosas o en ausencia de las claves que normalmente predicen su
consumo.
El modelo también predice que varios factores que atenúan el desarrollo de las
respuestas condicionadas (como la preexposición al EC) también deberían atenuar el
desarrollo de la tolerancia a la droga.
2.3 EL E.C COMO DETERMINANTE DE LA FORMA DE LA R.C
Hasta el momento hemos considerado cómo la forma de la respuesta condicionada
está determinada por el estímulo incondicionado. Sin embargo el El no es el único
factor importante. La forma de la RC también está influida por la naturaleza del EC.
Este aspecto pudo contemplarse por vez primera en un experimento poco común
realizado por Timberlake y Grane.
Los autores estudiaron el condicionamiento clásico en ratas utilizando comida como
EI. En vez de la luz o el tono habituales, el EC fue la presentación de otra rata justo
antes de la administración de la comida. Tras el procedimiento usado se establece a
través del MODELO DE SUSTITUCIÓN DEL ESTÍMULO que éste va a predecir
que los emparejamientos EC-EI harán que las respuestas producidas por el EC sean
similares a las respuestas elicitadas por la comida (roer y morder).
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
28
Contrariamente a esta predicción el EC no provocó las conductas de roer y morder
que sí provocaba la comida. En vez de eso, a medida que la rata que servía de EC se
iba emparejando repetidamente con la comida, se vio que elicitaba respuestas de
orientación, aproximación y olfateo, así como contactos de tipo social. Estas
respuestas sin embargo no se daban si la rata que servía de EC no se emparejaba con
comida o se presentaba sin guardar relación alguna con la comida.
El resultado de este experimento no apoya a ningún modelo que explique la forma
de la respuesta condicionada únicamente en términos del estímulo incondicionado
utilizado. El patrón de respuestas condicionadas, particularmente la conducta social
elicitada por la rata EC, estuvo sin duda determinado por la naturaleza del EC.
2.4 CONDUCTA CONDICIONADA Y SISTEMA DE CONDUCTA
Las perspectivas sobre la forma de la respuesta condicionada discutidas hasta el
momento tienen sus raíces en el método empleado por Pavlov pata el estudio de!
aprendizaje. En este método, se aíslan una o dos respuestas y se utilizan como índice
del aprendizaje asociativo. Este método continúa proporcionando aportaciones al
conocimiento, pero cada vez está más claro que se requiere una perspectiva más
amplia para comprender completamente la naturaleza de la respuesta condicionada.
Holland (1984), por ejemplo, ha comentado que la comprensión de la conducta
condicionada requerirá un mayor conocimiento "de las funciones normales de los
sistemas de conducta activados por diferentes ECs, de la organización natural de
dichos sistemas independientemente del aprendizaje y de su desarrollo
ontogenético".
Los diversos sistemas de conducta han evolucionado para permitir a los animales
llevar a cabo varias tareas críticas, como obtener y comer alimento, defender su
territorio…. Cada sistema de conducta consiste en una serie de modos de respuesta,
cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos con
determinado orden espacial y/o secuencial.
La TEORÍA DE LOS SISTEMAS DE CONDUCTA asume que la presentación del
EI en un procedimiento de condicionamiento pavloviano activa el sistema de
conducta relevante para ese EI (los EI relacionados con la comida activan los
sistemas de búsqueda y alimentación). Los procedimientos de condicionamiento
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
29
clásico superponen una relación EC-EI sobre el sistema conductual activado por el
EI.
Cuando un EC se asocia con el EI, se integra en su sistema conductual y adquiere la
capacidad de elicitar las respuestas que forman parte de dicho sistema. Por tanto, los
estímulos condicionados con comida elicitan componentes del sistema de
alimentación y los estímulos condicionados sexualmente elicitan componentes del
sistema de conducta sexual.
Una predicción provocadora de la teoría de los sistemas de conducta es que la forma
de la RC dependerá del intervalo EC-EI que se utilice. La razón es que este intervalo
determina el lugar en el que se va a incorporar el EC dentro de la secuencia
“ordinaria” de respuestas del sistema de conducta.
Ejemplo de superposición de un procedimiento de condicionamiento
pavloviano sobre el sistema de conducta sexual. El EI es el acceso a la
hembra, y activa RI de cortejo y copulación que son el final de la secuencia
de la conducta sexual. Si el intervalo EC-EI es corto, el EC (por ejemplo una
luza) ocurrirá poco antes del acceso a la hembra. Si el EC se incorpora al
sistema de conducta de búsqueda de la hembra en ese momento, debería
elicitar una conducta de búsqueda focalizada (mediada por el EC), el macho
debería aproximarse y permanecer cerca del EC.
Si el intervalo EC-EI es largo, la RC debería ser diferente. En este caso el EC
se incorporaría en una fase previa del sistema de conducta y debería elicitar
una conducta de búsqueda general, no focalizada (o mediada por el EC). La
conducta de búsqueda general se mostraría en forma de un aumento en la
conducta motora pero sin una dirección precisa.
Estos resultados son los que predicen la TEORÍA DE LOS SISTEMAS DE
CONDUCTA. De acuerdo con ella el EC no sustituye ni compensa al EI. En vez de
eso sustituye a un estímulo en un punto del sistema de conducta que está
determinado por el intervalo que se dé entre EC-EI.
La teoría es compatible con el hecho de que la forma de la respuesta
condicionada está determinada (1) por la naturaleza del EI, porque diferentes
EIs activan diferentes sistemas de conducta. (2) por la naturaleza del EC, ya
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
30
que ciertos tipos de estímulos son más efectivos que otros a la hora de elicitar
un componente particular del sistema de conducta.
Es decir, se espera que la naturaleza del EC determine cómo se incorpora el
EC al sistema de conducta. Y finalmente, la teoría hace predicciones únicas
acerca de las diferencia en la conducta condicionada en función del intervalo
EC-EI.
2.5 APRENDIZAJE E-R FRENTE A APRENDIZAJE E-E
¿EN QUE FORMA EL EC PRODUCE UNA RESPUESTA?
Históricamente, la conducta condicionada se veía como una respuesta elicitada
directamente por el EC. De acuerdo con la perspectiva del aprendizaje E-R, el
condicionamiento establece una nueva conexión estímulo-respuesta o E-R entre el
EC y la RC.
Una visión alternativa más moderna es que los sujetos aprenden una asociación
estímulo-estímulo o E-E entre el EC y el EI. De acuerdo con la perspectiva del
aprendizaje E-E los sujetos responden al EC, no porque éste elicite directamente la
RC, sino porque el EC activa una representación del EI. En cieno sentido, la
presentación del EC hace que el sujeto "piense en" el EI, Y estos pensamientos son
los causantes de la conducta condicionada. Desde esta perspectiva se asume que la
conducta condicionada refleja el estado de la representación del El activada por el
EC.
En resúmen:
APRENDIZAJE E-R: establece una nueva conexión entre el EC y la RC
APRENDIZAJE E-E: visión más moderna. Los sujetos aprenden una
asociación entre el EC y el EI. Responden al EC no porque elicite
directamente la RC sino porque el EC piense en el EI.
Un investigador decide entre ambas interpretaciones mediante la TECNICA
DE LA DEVALUACIÓN DEL E.I: consiste en la reducción del atractivo de
un EI, normalmente obtenida a través de la aversión o la saciedad.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
31
3. ¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E INCONDICIONADO?
El tema de cómo se asocian los estímulos condicionado e incondicionado es crítico.
¿Cuáles son los mecanismos del aprendizaje de asociaciones -los procesos
subyacentes que activan los procedimientos de condicionamiento y que producen el
aprendizaje? Esta cuestión ha sido objeto de un intenso trabajo académico. La
evolución de las teorías sobre el condicionamiento clásico continúa en nuestros días,
ya que los investigadores se esfuerzan por formular explicaciones de los
mecanismos del aprendizaje asociativo que puedan abarcar toda la diversidad de
resultados obtenidos en la investigación.
3.1 EL EFECTO DE BLOQUEO
La era moderna de las teorías del condicionamiento pavloviano comenzó hace
aproximadamente 35 años con el descubrimiento de varios fenómenos provocadores
que estimularon la aplicación de ideas sobre el procesamiento de la información al
análisis del condicionamiento clásico. Uno de los fenómenos más destacados fue el
EFECTO DE BLOQUEO.
Ejemplo: Luisa siempre come pastel de arroz y le sienta mal. No puede dejar de
comerlo y adquiere aversión hacia él. Cuando lo come en compañía de pastas, a
pesar de que se siente mal a causa del pastel de arroz, no asocia que el malestar se
deba a las pastas, sino a lo ya conocido, el pastel de arroz.
El EFECTO DE BLOQUEO sigue una secuencia de eventos similar. Primero se
establece una asociación entre un EC (A) y el EI. Una vez que el EC (A) está bien
condicionado, se añade un segundo EC (B) al EC (A) y se presentan los dos juntos
en los ensayos de condicionamiento.
El HALLAZGO básico es que el condicionamiento previo de A interfiere o bloquea
el desarrollo de la RC al estímulo añadido B.
Desde los tiempos de Aristóteles, se consideraba que la contigüidad temporal era el
medio principal por el cual se asociaban los estímulos. El efecto de bloqueo se ha
convertido en un fenómeno clave del condicionamiento clásico debido a que puso en
duda el presupuesto de que la contigüidad temporal es suficiente para el aprendizaje.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
32
El efecto de bloqueo muestra claramente que no es suficiente emparejar un EC con
un El para que se desarrolle la respuesta condicionada.
3.2 EL MODELO DE RESCORLA Y WAGNER
PDF ADJUNTO.
APARTADOS A TENER EN CUENTA: (1) aplicación al efecto de bloqueo, (2)
pérdida de valor asociativo a pesar de los emparejamientos con el EI, (3) inhibición
condicionada, (4) extinción de la excitación y la inhibición, (5) problemas del
modelo.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
33
CAPÍTULO 5.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
34
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 5: CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS.
4. PRIMERAS INVESTIGACIONES SOBRE EL CONDICIONAMIENTO INSTRUMENTAL. 4.1 RESPUESTA INICIALES A LOS ESTÍMULOS
En el capítulo se aborda el análisis del condicionamiento instrumental y la
conducta dirigida a una meta. Es un tipo de condicionamiento en el que las
presentaciones de los estímulos dependen de la ocurrencia previa de
respuestas específicas.
Los análisis teóricos y de laboratorio del condicionamiento instrumental
comenzaron formalmente con el trabajo de Thorndike. La intención original
de Thorndike era estudiar la inteligencia animal.
La teoría de la evolución de Darwin estimuló a la gente a especular acerca de
qué capacidades intelectuales humanas estaban presentes en los animales.
Thorndike estudió esta cuestión mediante investigación empírica. Inventó una
serie de cajas problema para sus experimentos. Su procedimiento de
entrenamiento consistía en situar un gato hambriento (o un perro o un pollo)
en la caja problema con algo de comida fuera a la vista del animal. La tarea
del gato era aprender cómo salir de la caja y obtener la comida. Las diferentes
cajas problema requerían diferentes respuestas para salir, y algunas eran más
fáciles que otras.
La cuidadosa aproximación empírica de Thorndike fue un avance
significativo en el estudio de la "inteligencia animal". Otra contribución
importante fue la estricta evitación de interpretaciones antropomórficas de la
conducta observada. Aunque Thorndike tituló su tratado "Inteligencia
animal", pensaba que muchos aspectos de la conducta de sus sujetos parecían
no ser inteligentes. No consideraba que los sujetos fuesen más rápidos en
escapar de una caja problema debido a que adquiriesen una comprensión de la
tarea o a que se imaginasen cómo estaba diseñado el mecanismo de
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
35
liberación. En lugar de ello, Thorndike interpretó los resultados de sus
estudios como el reflejo del aprendizaje de una asociación E-R.
Thorndike interpretó los resultados de sus estudios como el reflejo del
aprendizaje de una asociación E-R. Cuando un gato se situaba inicialmente en
una caja, desplegaba una variedad de respuestas típicas de un animal
confinado. Algunas de estas respuestas eventualmente daban como resultado
la apertura de la puerta. Thorndike creía que estos escapes con éxito
conducían al aprendizaje de una asociación entre los estímulos del interior de
la caja problema y la respuesta de escape. A medida que la asociación entre
las claves de la caja y la respuesta con éxito se hacía más fuerte, el gato
llegaba a realizar esta respuesta de forma más rápida. La consecuencia de la
respuesta exitosa, escapar de la caja, fortalecía la asociación entre los
estímulos de la caja y la respuesta.
Sobre la base de esta investigación el autor formula la LEY DEL EFECTO.
En ella se establece que si una respuesta en presencia de un estímulo es
seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la
respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la
asociación E-R se debilita.
Es importante destacar que la consecuencia de la respuesta no es un elemento
que forme parte de la asociación. La consecuencia satisfactoria o molesta sólo
sirve para fortalecer o debilitar la asociación entre la respuesta y el estímulo
(o situación estimular). ES DECIR, LA LEY DEL EFECTO IMPLICA UN
APRENDIZAJE E-R.
5. APROXIMACIONES MODERNAS AL ESTUDIO DEL
CONDICIONAMIENTO INSTRUMENTAL 5.1 PROCEDIMIENTOS DE ENSAYO DISCRETO
Los procedimientos de ensayo discreto son similares al método que
Thorndike utilizó, en el que cada ensayo de entrenamiento acaba con la
retirada del animal del aparato, y la respuesta instrumental se realiza sólo una
vez durante cada ensayo. Las investigaciones de ensayo discreto de la
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
36
conducta instrumental a menudo se han llevado a cabo en algún tipo de
laberinto.
La conducta en el laberinto puede cuantificarse midiendo la VELOCIDAD
DE LA CARRERA, o rapidez con que se desplaza el animal desde la caja de
salida hasta la caja de meta. La velocidad de la carrera normalmente aumenta
con ensayos de entrenamiento repetidos.
Otra medida común de la conducta en laberintos en las LATENCIA, o tiempo
que tarda el animal en abandonar la caja de salida y empezar a desplazarse
por el pasadizo. Las latencias suelen ser más cortas a medida que progresa el
entrenamiento.
5.2 PROCEDIMIENTOS DE OPERANTE LIBRE
Estos procedimientos permiten al animal que, dentro del laberinto, repita la
respuesta instrumental una y otra vez sin restricciones. En los laberintos T
después de alcanzar la caja de meta el animal es retirado del aparato un
momento antes de ser devuelto a la caja de salida para el próximo ensayo; es
decir, tiene oportunidades limitadas para responder y además están
programadas por el experimentador.
El método de operante libre fue ideado por Skinner, interesado por analizar en
el laboratorio una forma de conducta que fuese representativa de toda la
actividad en curso que ocurría de forma natural. Reconoció que antes de que
la conducta pueda ser analizada experimentalmente, debe definirse una
unidad de conducta medible.
Propone el CONCEPTO DE OPERANTE como forma de dividir la conducta
en unidades de medida con significado, ya que de forma natural no se puede
dividir nítidamente en unidades, sino que forma un continuo.
En los procedimientos de operante libre hay otro concepto importante, el de
RESPUESTA OPERANTE. En sus experimentos ponía una caja con una
palanca y una rata dentro, para así estudiar la conducta de operante libre que
mostraban. La palanca se puede empujar hacia abajo repetidamente, y tiene
un mecanismo que puede dar un reforzador como comida o agua. El
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
37
experimento más simple es que una rata hambrienta se coloque en la cámara y
apriete la palanca hacia abajo, haciendo que caiga automáticamente una bolita
de comida.
La RESPUESTA OPERANTE en este caso es presionar la palanca, y se
define a partir del efecto que produce en el ambiente. Las actividades que
provocan el mismo efecto ambiental se consideran ejemplos de la misma
respuesta operante. El elemento fundamental no son los músculos que
permiten la conducta (presión de la palanca), sino la forma en que la conducta
opera en el ambiente. Puede haber diferentes formas de presionar la palanca,
pero siempre que tengan el mismo efecto en el medio (sale la comida), son
funcionalmente equivalentes.
ENTRENAMIENTO Y MOLDEAMIENTO AL COMEDERO.
Es una fase preliminar de condicionamiento, necesario para que las ratas
sepan que para obtener la comida deben presionar la palanca con frecuencia.
Esto es normal, puesto que una rata puesta en una caja, debe aprender que la
palanca que ahí se encuentra sirve para obtener comida, pero también debe
aprender qué tiene que hacer con la palanca para lograr que salga la comida.
Todos estos aprendizajes se adquieren a través de un proceso de
condicionamiento clásico como el que ya conocemos: el sonido del
dispensador de comida se asocia repetidamente con la entrega de la bolita de
comida. Tras varias asociaciones se elicita una respuesta de seguimiento del
signo, ya que tras oir el sonido el animal corre a buscar la comida.
Después del entrenamiento al comedero el organismo está preparado para
aprender la respuesta instrumental requerida. Esto sucede así porque si la
respuesta no es algo que el animal haga ocasionalmente, nunca sucederá por
sí misma la respuesta que produce el reforzador (la comida).
Para facilitar la adquisición de una nueva respuesta operante se emplea una
estrategia: al principio se entrega la comida si el animal hace cualquier cosa
remotamente relacionada con la respuesta deseada (levantarse sobre las patas
traseras). Una vez establecida una pauta de comportamiento se “perfecciona”,
dejando de reforzarla a no ser que esté acompañada de detalles más
trabajados (levantarse sobre las patas al lado de la palanca, no en cualquier
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
38
lado de la cámara). Por último se va más al detalle y sólo se refuerza la
conducta buscada: levantarse sobre las patas al lado de la palanca y
presionarla. Esta secuencia de pasos de entrenamiento se denomina
MOLDEAMIENTO, e incluye dos tácticas complementarias: el
reforzamiento de aproximaciones sucesivas a la respuesta requerida, y el no
reforzamiento de las formas de respuesta más tempranas.
MOLDEAMIENTO Y NUEVA CONDUCTA.
Los procesos de moldeamiento son utilizados a menudo para generar una
nueva conducta, pero hay que plantearse hasta qué punto son nuevas las
respuestas que se derivan de esta nueva conducta.
En el caso de la rata presionando la palanca, toda la secuencia de
movimientos que usa para poder acabar ejerciendo presión, seguramente son,
por separado, movimientos que realiza de forma normal (explorando la jaula,
interaccionando con otra rata, manipulando trozos de comida…). Esto quiere
decir que cuando el investigador enseña a la rata a presionar la barra no le
enseña nuevos componentes de respuesta, sólo le muestra cómo combinar de
una determinada manera respuestas que le son familiares, con el objetivo de
lograr realizar una nueva actividad.
Esto significa que el condicionamiento instrumental incluye a menudo la
construcción o síntesis de una nueva unidad conductual a partir de
componentes de respuesta preexistentes que ya se encuentran en el repertorio
del sujeto. Pero también puede emplearse para producir nuevas respuestas que
no se parecen en nada a lo que el individuo es probable que haga sin
entrenamiento (aprender a tocar un instrumento musical, o a practicar un
deporte).
LA TASA DE RESPUESTA COMO MEDIDA DE LA CONDUCTA
OPERANTE.
Frente a las técnicas de ensayo discreto los métodos de operante libre
permiten una observación continuada durante largos períodos de tiempo. Al
tener una oportunidad continua de respuesta el organismo (no tanto el
experimentador), determina la frecuencia de su respuesta instrumental.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
39
Es decir, las técnicas de operante libre dan una ocasión buena para observar
cambios en la probabilidad de la conducta a lo largo del tiempo.
Pero las medidas de la latencia de respuesta y de la velocidad que se emplean
normalmente en procedimientos de ensayo discreto no permiten que se repita
la respuesta. Por eso Skinner propuso la TASA DE OCURRENCIA de una
conducta operante (por ejemplo con qué frecuencia ocurre la respuesta en un
minuto) se usase como una medida de probabilidad de la respuesta. En
consecuencia: las respuesta más probables ocurren con frecuencia y muestran
una tasa alta. Las respuesta improbables ocurren esporádicamente y muestran
una tasa baja.
6. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL
En todas las situaciones de condicionamiento instrumental, el sujeto realiza
una respuesta y por tanto produce una consecuencia. Pagar al chico de la
puerta de al lado por cortar el césped cerrar una ventana para evitar que entre
la lluvia, y quitarle las llaves de! coche a un joven por llegar tarde a casa son
formas de condicionamiento instrumental. Algunas veces las consecuencias
son sucesos placenteros, pero otras veces las consecuencias incluyen
estímulos molestos.
Una consecuencia placentera se denomina técnicamente estímulo apetitivo.
Una consecuencia molesta se denomina técnicamente estímulo aversivo. La
respuesta instrumental puede proporcionar el estímulo, como cuando al chico
de la puerta de al lado se le paga por cortar el césped. En este caso se dice que
surte efecto una contingencia positiva entre la respuesta y su estímulo
consecuente.
De forma alternativa, la respuesta instrumental puede retirar o eliminar un
estímulo, como cuando se cierra una ventana para evitar la entrada de la
lluvia. En ese caso se dice que existe un efecto de contingencia negativa entre
la respuesta y su consecuencia.
Que el resultado de un procedimiento de condicionamiento sea un aumento o
una disminución en la tasa de respuesta depende tanto de la contingencia
respuesta-consecuencia como de la naturaleza de la consecuencia.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
40
TABLA. Procedimiento comunes de condicionamiento instrumental (en
función de qué tipo de estímulo es controlado por la respuesta instrumental –
el apetitivo o el aversivo- y en función de si la respuesta produce o elimina el
estímulo.
NOMBRE DEL
PROCEDIMIENTO.
CONTINGENCIA
RESPUESTA-
CONSECUENCIA
RESULTADO
REFORZAMIENTO
POSITIVO
POSITIVO: la respuesta produce
un estímulo apetitivo
REFORZAMIENTO O
INCREMENTO EN LA TASA
DE RESPUESTA
CASTIGO (CASTIGO
POSITIVO)
POSITIVO: la respuesta produce
un estímulo aversivo
SUPRESIÓN O
DISMINUCIÓN EN LA TASA
DE RESPUESTA
REFORZAMIENTO
NEGATIVO (ESCAPE O
EVITACIÓN)
NEGATIVO: la respuesta
elimina o previene la ocurrencia
de un estímulo aversivo
REFORZAMIENTO O
INCREMENTO EN LA TASA
DE RESPUESTA
ENTRENAMIENTO DE
OMISIÓN
NEGATIVO: la respuesta
elimina o previene la ocurrencia
de un estímulo apetitivo
SUPRESIÓN O
DISMINUCIÓN EN LA TASA
DE RESPUESTA
Reforzamiento positivo. Un padre da a su hija una galleta cuando
recoge sus juguetes; un profesor felicita a un estudiante cuando éste
entrega un buen trabajo; un empleado recibe un cheque extra cuando
realiza bien su trabajo. Todos éstos son ejemplos de reforzamiento
positivo. El reforzamiento positivo es un procedimiento en que la
respuesta instrumental aproxima o produce un estímulo apetitivo. Si
se da la respuesta, el estímulo apetitivo se presenta; si no se da la
respuesta, e! estímulo apetitivo no se presenta. Por tanto, existe una
contingencia positiva entre la respuesta instrumental y el estímulo
positivo. El reforzamiento positivo produce un incremento en la tasa
de respuesta. Dar a una rata hambrienta una bolita de comida siempre
y cuando presione una palanca de respuesta, pero no cuando no
presione la palanca, es un ejemplo Común de reforzamiento positivo
en el laboratorio.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
41
Castigo. Una madre da una reprimenda a su hijo por cruzar la calle;
su jefe le critica por llegar tarde a una reunión; el profesor le
suspende por contestar de forma incorrecta demasiadas preguntas de
un examen. Éstos son ejemplos de castigo. En un procedimiento de
castigo, la respuesta instrumental produce o aproxima un estímulo
molesto o aversivo. Hay una contingencia positiva entre la respuesta
instrumental y el estímulo consecuente, pero el resultado es un
estímulo aversivo. Los procedimientos de castigo producen una
disminución en la respuesta instrumental.
Reforzamiento negativo. Tamo el reforzamiento positivo como el
castigo incluyen una contingencia positiva entre la respuesta
instrumental y el estímulo resultante. En una contingencia negativa,
la respuesta retira o previene la presentación de un suceso ambiental.
Un procedimiento en el que la respuesta instrumental finaliza o
previene la entrega de un estímulo aversivo se denomina
reforzamiento negativo. Hay dos tipos de procedimientos de
reforzamiento negativo: escape y evitación. En el escape, el
estímulo aversivo se presenta pero puede ser eliminado por la
respuesta instrumental. Se puede escapar del sonido molesto de una
radio apagándola. La gente puede abandonar una obra de teatro para
"escapar" de presenciar una mala representación. En todos estos
casos, la presencia de un estímulo aversivo establece la ocasión para
la ocurrencia de la respuesta instrumental. La respuesta instrumental
entonces es reforzada por la terminación del estímulo aversivo. La
evitación implica la programación de un estímulo aversivo para ser
presentado en algún momento del futuro. En este caso la respuesta
instrumental previene la entrega del estímulo aversivo. La gente hace
muchas cosas para prevenir la ocurrencia de algo malo. Los alumnos
estudian antes de un examen para evitar recibir una mala calificación;
los trabajadores de una fábrica pueden evitar un accidente si
responden a una alarma de incendio; la gente pone a punto
regularmente su coche para evitar averías inesperadas.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
42
Entrenamiento de omisión. Otro tipo de procedimiento que incluye
una contingencia negativa entre la respuesta instrumental y un suceso
ambiental se denomina entrenamiento de omisión. En este caso, la
respuesta instrumental previene la presentación de un estímulo
apetitivo o placentero. El entrenamiento de omisión a menudo es el
método preferido para disuadir la conducta humana debido a que, al
contrario que el castigo, no implica la presentación de un estímulo
aversivo. Se está utilizando entrenamiento de omisión cuando se le
dice a un niño que se vaya a su habitación después de haber hecho
algo malo. El niño no recibe un estímulo aversivo cuando se le dice
que se vaya a su habitación. No hay nada aversivo en relación con la
habitación del niño. En su lugar, enviando al niño a la habitación, el
padre está retirando fuentes de reforzamiento positivo, como jugar
con los amigos o ver la televisión. Los procedimientos de
entrenamiento de omisión se denominan en ocasiones
reforzamiento diferencial de otras conductas, o RDO. Este
término refleja el hecho de que el individuo recibe un estímulo
apetitivo periódicamente a condición de que se dedique a realizar otra
conducta diferente de la respuesta especificada por el procedimiento.
La realización de la respuesta crítica deviene en la omisión de la
recompensa que podría haber sido obtenida si el individuo hubiese
llevado a cabo alguna "otra" conducta. Por tanto, el entrenamiento de
omisión implica el reforzamiento de "otras" conductas.
Los términos utilizados para describir los procedimientos de
condicionamiento instrumental son algo confusos. Por ejemplo, la gente
tiende a confundir el reforzamiento negativo y el castigo. A pesar de que se
utiliza un estímulo aversivo en ambos procedimientos, la relación de la
respuesta instrumental con el estímulo aversivo en cada caso es
completamente distinta.
En lo que comúnmente se denomina castigo, existe una contingencia
positiva entre la respuesta instrumental y el estímulo aversivo. (La
respuesta da como resultado la administración de un estímulo
aversivo).
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
43
Por el contrario, en el reforzamiento negativo hay una contingencia
negativa respuesta-consecuencia. (La respuesta finaliza o previene la
administración de un estímulo aversivo).
Esta diferencia en las contingencias produce resultados muy
diferentes. La respuesta instrumental disminuye por el castigo y
aumenta por el reforzamiento negativo.
7. ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL. 7.1 LA RESPUESTA INSTRUMENTAL
El resultado de los procedimientos de condicionamiento instrumental depende
en parte de la naturaleza de la respuesta que se esté condicionando. El cómo
sea la respuesta, su naturaleza, determina los resultados de los procedimientos
de reforzamiento, ya que algunas respuestas son más fácilmente modificables
que otras.
VARIABILIAD CONDUCTUAL VERSUS ESTEREOTIPIA.
Thorndike describió la conducta instrumental como incluyendo el "sellado"
de una asociación E-R. Skinner escribió acerca de la conducta como
reforzada o fortalecida. Ambos pioneros enfatizaron que el reforzamienro
incrementa la probabilidad de que la respuesta instrumental se repita en el
futuro. Este énfasis alentó la creencia de que los procedimientos de
condicionamiento instrumental producían repeticiones de la misma respuesta
(que producían uniformidad o estereotipia en la conducta).
Esto no significa que el condicionamiento instrumental no pueda también
verse involucrado en la producción de respuestas creativas o variables.
Estamos acostumbrados a pensar que la respuesta requerida para el
reforzamiento ha de ser una acción observable, corno un movimiento de la
pierna de un individuo, el torso o una mano. No obstante, los criterios para el
reforzamiento pueden también definirse en términos de dimensiones de la
conducta más abstractas, como su variabilidad.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
44
Por ejemplo, los organismos pueden aprender a obtener reforzamiento en una
situación donde se requiere hacer algo nuevo, algo distinto de lo que hicieron
en los cuatro o cinco ensayos precedentes.
La VARIABILIDAD DE LA RESPUESTA puede ser la base para el
reforzamiento instrumental.
(Estudio sobre picotazos de palomas sin frecuencia establecida) Es un estudio
que muestra dos hechos interesantes sobre el condicionamiento instrumental:
(1) la variabilidad de la respuesta puede mantenerse e incrementarse
por reforzamiento. Por lo tanto, la variabilidad de la respuesta puede
establecerse como una operante.
(2) en ausencia de un reforzamiento explícito de la variabilidad, la
respuesta llegar a ser más estereotipada con un condicionamiento
instrumental continuado. Es decir, el resultado típico del
reforzamiento instrumental es una disminución de la variabilidad de
la respuesta.
RELEVANCIA O PERTINENCIA DEL CONDICIONAMIENTO INSTRUMENTAL.
El condicionamiento instrumental puede actuar sobre componentes
manifiestos de la respuesta o sobre dimensiones abstractas de la conducta
(como la variabilidad). ¿Hasta qué punto se extienden estos principios? ¿Hay
límites en los tipos de nuevas unidades conductuales o dimensiones de la
respuesta que pueden ser modificados por condicionamiento instrumental?
Evidencias reciemes indican que hay importantes limitaciones.
En el Capítulo 4 se describió cómo el condicionamiento clásico se daba a
diferentes tasas dependiendo de la combinación del EC y el EI que se utilice.
Para que el condicionamiento ocurra rápidamente, el EC tiene que "competer"
al EI, o ser "relevante" para el EI. En el condicionamiento instrumental tienen
lugar relaciones análogas de pertinencia o relevancia.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
45
Thorndike fue el primero en observar diferencias en la facilidad de
condicionamiento de varias respuestas.
Thorndike propuso el concepto de pertinencia para explicar los fallos
en el entrenamiento del rascado y el bostezo. De acuerdo con este
concepto, ciertas respuestas "se correspondían" de forma natural con
el reforzador debido a la historia evolutiva del animal.
Manipular un picaporte y empujar un anillo son respuestas
manipulativas que están relacionadas de forma natural con escapar
del confinamiento.
Por contra, rascar y bostezar no ayudan normalmente a los animales a
escapar del confinamiento y, en consecuencia, no "se corresponden"
con escapar de una caja problema.
Presumiblemente, ésta es la razón por la que el rascado y el bostezo
no persisten como respuestas instrumentales vigorosas en sentido
estricto cuando se refuerzan con la salida de la caja.
Breland y Breland (1961) observaron varias limitaciones en el
condicionamiento instrumental al intentar condicionar respuestas
instrumentales con reforzamiento de comida en varias especies. Su meta era
entrenar a los animales para realizar cadenas de respuesta entretenidas como
para ser exhibidos como entretenimiento en parques y zoos. Durante el
desarrollo de este trabajo, observaron cambios notables de la conducta que no
eran consecuentes con los procedimientos de reforzamiento que estaban
empleando. Por ejemplo, describieron un mapache que fue reforzado por
coger una moneda y depositarla en una hucha.
Los Breland llamaron DERIVA INSTINTIVA al desarrollo de respuestas
como la de hozar en los cerdos y frotar las monedas en los mapaches. Como
el término implica, las respuestas extras que desarrollaban en estas
situaciones de reforzamiento con comida eran actividades que los animales
realizaban instintivamente cuando obtenían comida. Los cerdos hozan por el
suelo en conexión con la alimentación, y los mapaches frotan y lavan objetos
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
46
relacionados con la comida. Estas respuestas naturales relacionadas con la
comida eran aparentemente muy fuertes y competían con las respuestas
requeridas por el experimentador. Los Breland pusieron de relieve que estas
tendencias de respuesta instintivas debían tenerse en cuenta en el análisis del
comportamiento.
SISTEMAS DE CONDUCTA Y LIMITACIONES EN EL CONDICIONAMIENTO INSTRUMENTAL.
Las limitaciones de respuesta en el condicionamiento instrumental que se han
descrito son consecuentes con la teoría de los sistemas de conducta, que se
describió en el Capítulo 4, en relación con la naturaleza de la respuesta
condicionada.
De acuerdo con la teoría de los sistemas de conducta, cuando un animal está
privado de comida y se encuentra en una situación donde podría encontrarla,
su sistema de alimentación se activa, y se dedica al forrajeo y otras
actividades relacionadas con la comida. Sobre este sistema de conducta se
superpone un procedimiento de condicionamiento instrumental. La
efectividad del procedimiento para el incremento de una respuesta
instrumental dependerá de la compatibilidad de esa respuesta con la
organización preexistente del sistema de alimentación.
Es más, la naturaleza de otras respuestas que emergen durame el curso del
entrenamiento (o deriva instintiva) depende de los componentes conductuales
del sistema de alimentación que se activen debido al procedimiento de
condicionamiento instrumental.
De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser
capaces de predecir qué respuestas se incrementarán con un reforzamiento de
comida mediante el estudio de lo que los animales hacen cuando su sistema
de alimentación está activado en ausencia de condicionamiento instrumental.
Ante estos hallazgos, la teoría de los sistemas de conducta predice que el
reforzamiento de comida podría producir incrementos en actividades como
cavar, escarbar y erguirse, pero no en actividades corno lavarse la cara y
rascarse.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
47
Este patrón de resultados es precisamente el que se ha observado en estudios
de condicionamiento instrumental. Por tamo, la susceptibilidad de varias
respuestas al reforzamiento con comida puede predecirse observando cómo se
alteran esas respuestas con la privación de comida, lo que presumiblemente
refleja su compatibilidad con el sistema de alimentación.
7.2 EL REFORZADOR INSTRUMENTAL CANTIDAD Y NATURALEZA DEL REFORZADOR
Aunque la cantidad y la naturaleza del reforzador son lógicamente
características diferentes, a veces es difícil separarlas experimentalmente. Un
cambio en la cantidad del reforzador puede también hacer al reforzador
cualitativamente distinto.
Los incrementos en la calidad o la cantidad del reforzador produjeron
mayores tasas de respuesta.
En situaciones de operante libre, no obstante, los efectos de la magnitud del
reforzador son más complejos y dependen del programa de reforzamiento
utilizado y de otros factores.
CAMBIOS EN LA NATURALEZA Y LA CANTIDAD DEL REFORZADOR
En el estudio de Hun (1954), un grupo dado de ratas recibió sólo una cantidad
y tipo paticular de comida líquida a lo largo del experimento. ¿Qué pasaría si
la cantidad o la naturaleza del reforzador modificaran su valor para el mismo
individuo? Esta pregunta resulta interesante porque plantea la posibilidad de
que la efectividad de un reforzador dependa no sólo de sus propiedades sino
también de cómo ese reforzador se compara con otros que el individuo ha
experimentado.
En el Capítulo 4 se resaltó que la efectividad de un estímulo incondicionado
en el condicionamiento clásico depende de cómo se compare el EI con las
expectativas del individuo basadas en la experiencia previa, Esta idea sirve
como fundamentación del modelo de Rescorla-Wagner.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
48
Si el EI es mayor (o más intenso) de lo esperado, producirá condicionamiento
excitatorio. Por el contrario, si el EI es menor (o más débil) de lo esperado,
producirá condicionamiento inhibitorio. ¿Hay efectos análogos en el
condicionamiento instrumental? La experiencia común sugiere
definitivamente que sí.
Numerosos estudios han mostrado que los efectos de una cantidad y tipo de
reforzador particular dependen de la cantidad y naturaleza de los reforzadores
que el individuo ha experimentado previamente. Dicho vagamente, una
recompensa favorable se trata como especialmente buena tras el
reforzamiento con una recompensa mala, y una recompensa desfavorable se
trata como especialmente mala después de una buena recompensa.
El contraste positivo se refiere a una elevada respuesta por una recompensa
favorable resultado de una experiencia anterior con una consecuencia menos
atractiva. De un modo más informal, la recompensa favorable les parece
especialmente buena a los individuos que experimentaron previamente una
consecuencia peor.
El contraste negativo se refiere a una respuesta disminuida por una
recompensa desfavorable debido a una experiencia anterior con una
consecuencia mejor. En este caso, la recompensa desfavorable les parece
especialmente mala a los individuos que han experimentado previamente una
recompensa mejor.
Los efectos de contraste también se dan si las condiciones de recompensa se
modifican una y otra vez, con una clave diferente señalando cada condición
de recompensa. Estos efectos son ejemplos de contraste conductual
simultáneo.
Los diferentes efectos de contraste están mediados por diferentes
mecanismos. Sin embargo, todos los efectos de contraste ilustran que la
efectividad de un reforzador en una situación está determinada en parte por
las experiencias del organismo con reforzadores en otras situaciones.
7.3 LA RELACIÓN RESPUESTA-REFORZADOR.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
49
La conducta instrumental produce y es controlada por sus consecuencias. En
algunos casos, hay una fuerte relación entre lo que una persona hace y la
consecuencia que sigue.
La relación entre la conducta y sus consecuencias puede ser también
probabilística.
Un organismo debe organizar su conducta para enfrentarse con varios retos, y
debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energía.
Es inútil esforzarse para hacer que el sol salga cada mañana, porque ocurrirá
de cualquier modo. Tiene más sentido dedicar la energía a preparar el
desayuno o trabajar para conseguir un cheque (cosas que no están disponibles
sin esfuerzo). Para ser eficiente, se tiene que saber cuando se debe hacer algo
para obtener un reforzador y cuándo el reforzador es probable que sea
entregado independientemente de cualquier acción.
La conducta instrumental eficiente requiere sensibilidad a la relación
respuesta-reforzador.
Existen dos tipos de relaciones entre una respuesta y un reforzador:
Una es la relación temporal, que se refiere al tiempo que transcurre
entre la respuesta y el reforzador. Un tipo especial de relación
temporal es la contigüidad temporal, la cual se refiere a la entrega del
reforzador inmediatamente después de la respuesta.
El segundo tipo de relación entre una respuesta y el reforzador es la
re/ación causal o la contingencia respuesta-reforzador. La
contingencia respuesta-reforzador se refiere al hecho de que la
respuesta instrumental es necesaria y suficiente para la ocurrencia del
reforzador.
Los factores temporales y causales son independientes unos de otros. Una
relación temporal fuerte no requiere una relación causal fuerte, y viceversa.
EFECTOS DE LA CONTIGÜIDAD TEMPORAL
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
50
Tanto la sabiduría popular como la evidencia experimental nos dice que el
reforzamiento inmediato es preferible al demorado. Además, desde el trabajo
pionero de Grice (1948), los psicólogos del aprendizaje han resaltado que el
condicionamiento instrumental requiere proporcionar el reforzador
inmediatamente después de la ocurrencia de la respuesta insrrumental. Grice
informó de que el aprendizaje instrumental puede deteriorarse con demoras
tan cortas como 0,5 segundos. La investigación más reciente indica que el
condicionamiento instrumental es posible con demoras de hasta 30 segundos.
El hecho recurrente es que el aprendizaje instrumental se altera demorando el
reforzador tras la ocurrencia de la respuesta instrumental.
¿Por qué es el condicionamiento instrumental tan sensible a la demora del
reforzamiento? Hay varios factores que pueden contribuir. Uno se resiste al
hecho de que una demora haga difícil imaginarse qué respuesta merece la
oportunidad de que el reforzador se entregue. Como se apuntó con
anterioridad, la conducta consiste en un flujo continuo de actividades. Cuando
el reforzamiento es demorado tras la realización de una respuesta específica,
Rl, el organismo no para de hacer cosas. Tras la realización de R1, el
organismo puede realizar R2, R3, R4, y así sucesivamente. Si el reforzador se
establece en R1 pero no se entrega hasta algún tiempo después, el reforzador
puede ocurrir inmediatamente después de alguna otra respuesta, por ejemplo,
R6. Para asociar Rl con el reforzador, el organismo tiene que poder distinguir
de alguna forma R1de otras respuestas que realiza durante el intervalo de
demora.
Hay dos formas de resolver este problema. La primera técnica, utilizada
durante siglos por entrenadores de animales y adiestradores, es proporcionar
un reforzador secundario o condicionado inmediatamente después de la
respuesta instrumental, incluso si el reforzador primario no puede ocurrir
hasta algún tiempo después. Un reforzador condicionado o secundario es un
estímulo condicionado que ha sido previamente asociado con el reforzador.
Las confirmaciones verbales en el adiestramiento, como "bueno" y "eso es",
son reforzadores condicionados que pueden proporcionar reforzamiento
inmediato para la conducta adecuada. Los buenos adiestradores proporcionan
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
51
constantemente retroalimentación verbal inmediata o reforzamiento
condicionado.
Otra técnica que facilita el aprendizaje con reforzamiento demorado es
marcar la respuesta instrumental criterio de alguna manera para hacerla
distinguible de otras actividades del organismo. Esto se conoce como un
procedimiento de marcado.
Tanto el reforzamiento secundario como los procedimientos de marcado se
centran en conectar mejor la respuesta instrumental crítica con el reforzador
demorado. Otra forma de abordar este tema es considerar que cuando el
reforzamiento es demorado, el reforzador sucede independientemente de la
conducta. Cuando se presenta un reforzador independientemente de la
conducta, el sujeto no puede fácilmente decir cuándo será reforzado.
Otra consecuencia del reforzamiento independiente de la respuesta es el
condicionamiento de claves contextuales. Si hay una demora entre la
respuesta crítica y la entrega del reforzador, el reforzador ocurrirá en el
contexto experimental sin ser señalado por la respuesta. Esto permitirá
condicionar las claves contextuales.
LA CONTINGENCIA RESPUESTA-REFORZADOR
La contingencia respuesta-reforzador se refiere al hecho de que la entrega del
reforzador es dependiente de la ocurrencia previa de la respuesta
instrumental.
La contigüidad respuesta-reforzador más que la contingencia era el factor
crítico que producía el aprendizaje instrumental. No obstante, esta visión ha
resultado injustificada por la investigación posterior. La contingencia
respuesta-reforzador es también importante.
EL EFECTO DE SUPERSTICIÓN DE SKINNER
La explicación de Skinner de la conducta supersticiosa descansa en la idea de
reforzamiento accidental, o adventicio. El reforzamiento adventicio se refiere
al emparejamiento accidental de una respuesta con la entrega del reforzador.
Los animales siempre están haciendo algo, incluso si no se requieren
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
52
respuestas particulares para obtener comida. Skinner sugirió que cualquier
respuesta que un sujeto realizase por casualidad justo antes de conseguir la
comida llegaría a fortalecerse y posteriormente incrementaría su frecuencia
debido al reforzamiento adventicio.
Un emparejamiento accidental de una respuesta con la comida incrementa la
oportunidad de que la misma respuesta ocurra justo antes de la próxima
entrega de comida. Un segundo emparejamiento accidental respuesta-
reforzador aumenta aún más la probabilidad de la respuesta. De esta forma,
cada emparejamiento accidental ayuda a "estampar" una respuesta particular.
Después de un tiempo, la respuesta ocurrirá frecuentemente, de forma
suficiente para ser identificada como conducta supersticiosa.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
53
CAPÍTULO 6.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
54
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN.
INDICE DEL CAPÍTULO.
8. PROGRAMAS DE REFORZAMIENTO INTERMITENTE
8.1 PROGRAMAS DE RAZÓN
8.2 PROGRAMAS DE INTERVALO
8.3 COMPARACIÓN DE LOS PROGRAMAS DE RAZÓN Y DE INTERVALO
8.4 PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA
9. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
9.1 MEDIDAS DE LA CONDUCTA DE ELECCIÓN
9.2 LA LEY DE LA IGUALACION
9.3 MECANISMOS DE LA LEY DE LA IGUALACIÓN
10. ELECCIÓN CON COMPROMISO
10.1 PROGRAMAS CONCURRENTES ENCADENADOS
10.2 ESTUDIOS DE “AUTOCONTROL”
INTRODUCCIÓN GENERAL AL CAPÍTULO.
Un PROGRAMA DE REFORZAMIENTO es un programa o regla que
determina la forma en que se relacionan las presentaciones del reforzador con
las ocurrencias de la respuesta instrumental.
La importancia de los programas de reforzamiento reside en que determinan
la tasa y el patrón de las respuestas instrumentales.
ATENCIÓN: es importante tener en cuenta que un procedimiento de
condicionamiento instrumental no implica que cada respuesta instrumental
lleve asociada la entrega de un reforzador, no existe normalmente esa
contingencia perfecta (no siempre está el autobús cuando llegamos a la
parada).
Esto nos lleva constatar que normalmente la relación entre las respuestas
instrumentales y el reforzamiento posterior es bastante compleja, razón por la
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
55
que los programas de reforzamiento se han llevado al estudio en el
laboratorio. Esto ayuda a analizar y constatar cómo las diferentes relaciones
respuestas instrumentales-reforzador, controlan la ocurrencia o no de
respuestas instrumentales.
Es decir, un programa de reforzamiento se puede establecer de muchas
formas, en base a que es un programa (o regla) que determina cómo y cuándo
un reforzador apoyará una respuesta instrumental concreta.
Es bastante manejable catalogar y registrar los efectos conductuales que
pueden llegar a producir los distintos programas de reforzamiento, debido
sobre todo a que el patrón de resultados en un programa y otro puede ser
bastante predecible, si se establecen (en los distintos programas) relaciones
similares entre los estímulos, las respuestas y los reforzadores. Las relaciones
similares entre estos elementos producen patrones de conducta similares.
Un programa de reforzamiento influye en la forma de aprender una respuesta
instrumental y en la forma en que se mantiene esa respuesta por el
reforzamiento. La investigación se suele centrar en los factores que hacen que
se mantengan las respuestas instrumentales adquiridas, y en cómo se pueden
realizar de manera continuada. Sin embargo no ha habido tanto interés es
cómo esa conducta instrumental se adquiere.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
56
PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE.
PROGRAMAS DE RAZÓN:
- el reforzamiento depende sólo del número de respuestas que el organismo realiza.
- Sólo requiere contar el número de respuestas que han ocurrido y entregar el reforzador cada vez que se alcance el número requerido.
- Técnicamente se denominan PROGRAMAS DE REFORZAMIENTO CONTINUO (RFC)
- El reforzamiento continuo no suele suceder nunca fuera del laboratorio, y suele darse de forma ocasional. Las situaciones en las que la
respuestas se refuerza sólo alguna vez incluyen un REFORZAMIENTO PARCIAL O INTERMITENTE.
PROGRAMAS DE RAZÓN FIJA (RF).
- Es necesario un número fijo de respuestas para conseguir el reforzamiento.
- Los programas de reforzamiento continuo son también programas de razón
fija.
- El patrón típico de los programas de razón fija es: una tasa constante de
respuestas una vez que se ha iniciado la conducta, aunque se puede tardar
un tiempo hasta que se consigue el número fijo de respuestas que se
necesitan para obtener el reforzador.
- Estas características de la respuesta se ven con claridad en un registro
acumulativo de la conducta, que es el instrumento para representar la forma
PROGRAMAS DE RAZÓN VARIABLE (RV).
- Procedimiento en el que se necesita un número de respuestas
distinto para la entrega de cada recompensa.
- Las pausas predecibles en la tasa de respuesta son menos
probables con los programas de RV que con los programas de
RF, ya que el número de respuestas necesario para conseguir el
reforzamiento no es predecible.
1 Si el requerimiento de la razón se incrementa un poco, de 120 picotazos a 150 picotazos para conseguir un refuerzo por ejemplo, la tasa de respuesta puede permanecer igual durante la carrera de la razón. Con mayores requerimientos de tasa tienden a ocurrir pausas de reforzamiento más largas.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
57
de repetirse una respuesta a lo largo del tiempo.
- El registro muestra el número total de respuestas que han ocurrido hasta un
momento determinado en el tiempo. Da una imagen visual de cuándo y con
qué frecuencia responde el sujeto durante la sesión.
- PAUSA POSREFORZAMIENTO: tasa cero de respuesta que se observa
justo después del reforzamiento.
- CARRERA DE LA RAZÓN: tasa de respuesta alta y estable que completa
cada requerimiento de la razón1.
- TENSIÓN DE LA RAZÓN: efecto que se produce si el requerimiento de la
razón sufre un incremento súbito y significativo, es probable que el animal
realice una pausa periódica cada vez que complete la razón requerida.
PROGRAMAS DE INTERVALO:
- las respuestas son reforzadas sólo si ocurren cuando ha transcurrido cierta cantidad de tiempo. En los programas de razón el reforzamiento
dependía sólo del número de respuestas que el organismo ha realizado.
- En un programa simple de intervalo una respuesta se refuerza sólo si se da después de que haya transcurrido un tiempo desde la última
entrega del reforzador.
- PROGRAMAS DE INTERVALO Y ESPERA LIMITADA: en los programas de intervalo simples, una vez que está disponible el
reforzador, permanece disponible hasta que se realiza la respuesta requerida, no importa cuánto tiempo cueste. Cuando se hace lo mismo
fuera de laboratorio, lo común es que los reforzadores estén disponibles sólo durante periodos de tiempo limitados. Esta restricción en el
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
58
tiempo durante el que permanece disponible el reforzador, se denomina ESPERA LIMITADA.
- Las restricciones que se pueden añadir a través de la espera limitada se pueden aplicar tanto a los programas de intervalo fijo como a los
programas de intervalo variable.
PROGRAMAS DE INTERVALO FIJO (IF).
- el tiempo establecido para la entrega del reforzador no varía de una ocasión
a la siguiente.
- Se dan en situaciones en las que se necesita una cantidad fija de tiempo
para dispensar el reforzador.
- Las respuestas se refuerzan sólo si ocurren después de que haya
transcurrido una cantidad fija de tiempo desde la administración del
reforzador previo, o desde el comienzo del programa.
- FESTÓN DE INTERVALO FIJO: es el patrón de respuesta que se
desarrolla con los programas de reforzamiento de IF.
- Es importante tener en cuenta que un programa de IF no garantiza que el
reforzador se dará en algún momento a lo largo del intervalo de tiempo. Se
necesitan respuestas instrumentales para conseguir el reforzador.
- El intervalo determina cuándo el reforzador está disponible, no cuándo se
entrega, eso vendrá determinado por la ocurrencia de la respuesta
instrumental.
PROGRAMAS DE INTERVALO VARIABLE (IV).
- las respuestas se refuerzan si se dan tras haber transcurrido un
intervalo variable desde la administración del reforzador previo,
o desde el comienzo del programa.
- El sujeto tiene que realizar la respuesta instrumental para
obtener el reforzador. Los reforzadores se dan sólo si el
organismo responde tras un intervalo variable.
- Son programas que mantienen tasas de respuesta constantes y
estables sin pausas regulares.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
59
COMPARACIÓN PROGRAMAS DE RAZÓN Y PROGRAMAS DE INTERVALO
- RAZÓN FIJA E INTERVALO FIJO: producen una pausa posreforzamiento después de la administración de cada reforzador.
- RAZÓN FIJA E INTERVALO FIJO: producen tasas altas de respuesta justo antes de la administración del siguiente reforzador.
- RAZÓN VARIABLE E INTERVALO VARIABLE: mantienen tasas estables de respuesta, sin pausas predecibles.
- INTERVALO Y RAZÓN: activan diferentes cambios neuroquímicos en el cerebro.
- INTERVALO: la conducta que mantienen está mediada por el sentido temporal del organismo.
- RAZÓN: la actuación que provocan no contiene influencia de los mecanismos temporales.
PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA.
- Necesitan de forma específica que el organismo responda a una tasa particular para obtener el reforzador.
- Los programas de razón producen tasas de respuesta mayores que los programas de intervalo, pero ni el uno ni el otro requieren una tasa
específica de respuesta para conseguir el reforzamiento.
- En Tasas de respuesta el reforzamiento de una respuesta particular depende de cuánto de pronto ocurre la respuesta precedente. Es un
procedimiento que fomenta tasas altas de respuesta y se denomina REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS (RDA).
- En los RDA una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente.
Se consigue el resultado opuesto si se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo
desde la respuesta previa. Este procedimiento se denomina REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS (RDB), y fomenta
que los sujetos respondan lentamente.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
60
2. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES.
- Son programas que al contrario que los anteriores incluyen más de una única
respuesta reforzable.
- Los psicólogos realizan investigaciones experimentales sobre los mecanismos
de elección mediante el estudio de situaciones de elección simples. La
situación más simple consta de dos respuestas alternativas, cada una de ellas
seguida por un reforzador de acuerdo con su propio programa de
reforzamiento.
- Implica que los dos programas de reforzamiento funcionen al mismo tiempo
o concurrentemente, y el sujeto es libre de cambiar de alternativa cada vez. Es
un procedimiento que se llama PROGRAMA CONCURRENTE. Permite una
medición continua de la elección porque el organismo es libre de cambiar
entre una y otra opción de respuesta en cualquier momento.
2.1 MEDIDAS DE LA CONDUCTA DE ELECCIÓN:
- TASA RELATIVA DE RESPUESTA DE CADA ALTERNATIVA: se
calcula dividiendo la tasa de respuesta a la alternativa correspondiente, entre
la tasa total de respuestas en ambas alternativas.
- TASA RELATIVA DE REFORZAMIENTO conseguido para cada
alternativa de respuesta: se calcula dividiendo la tasa de reforzamiento de la
alternativa correspondiente, entre la tasa total de reforzamiento de ambas
alternativas.
2.2 LA LEY DE LA IGUALACIÓN:
- ley de la conducta establecida por Hernstein, que establece el principio básico
de que las tasas relativas de respuesta se igualan con las tasas relativas de
reforzamiento.
- Indica que las elecciones no se hacen de forma caprichosa, sino que son una
función ordenada de las tasas de reforzamiento.
- INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y SESGO DE
RESPUESTA: A pesar del éxito de la Ley de la Igualación, se comprueba
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
61
que las tasas relativas de respuesta no siempre se igualan con las tasas
relativas de reforzamiento.
- INFRAIGUALACIÓN: un tipo de desviación de la igualación perfecta,
incluye una sensibilidad reducida de la conducta de elección a las tasas
relativas de reforzamiento.
- SUPRAIGUALACIÓN: la tasa relativa de respuestas es más sensible a
la tasa relativa de reforzamiento de lo que se predice para una igualación
perfecta.
- SESGO DE RESPUESTA: influyen en la elección cuando las
alternativas de respuesta son diferentes, o cuando el reforzador
proporcionado para las dos respuestas es diferente.
- LEY DE IGUALACIÓN Y VALOR DEL REFORZADOR: las
características de un reforzador como su cantidad o palatabilidad y demora,
pueden considerarse aspectos de su valor general.
- LEY DE IGUALACIÓN Y PROGRAMAS SIMPLES DE
REFORZAMIENTO: incluso las situaciones de respuesta única pueden
conllevar una elección, entre realizar la respuesta especificada u ocuparse de
otras posibles actividades. En un programa simple el sujeto recibe no sólo
reforzamiento explícito por realizar una respuesta operante específica, sino
también recompensas intrínsecas de las otras actividades que pueda realizar.
2.3 MECANISMOS DE LA LEY DE LA IGUALACIÓN:
- MAXIMIZACIÓN MOLECULAR: los organismos siempre eligen
cualquier alternativa de respuesta con mejores probabilidades de que sea
reforzada en ese momento.
- MAXIMIZACIÓN MOLAR: el organismo distribuye sus respuestas entre
las varias alternativas a fin de maximizar la cantidad de reforzamiento que
consiguen a la larga.
- MEJORAMIENTO: no es ni un mecanismo molar ni uno molecular. Opera
en una escala temporal que está entre la escala temporal de las teorías molar y
molecular. Muchos aspectos de la conducta no son óptimos a largo plazo, en
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
62
algún momento de la conducta se determinan con nuestras elecciones
situaciones futuras. Son elecciones inocentes que trata de caracterizar el
mejoramiento.
3. ELECCIÓN CON COMPROMISO.
- El AUTOCONTROL influye en las elecciones importantes de la vida, que
implican a veces un beneficio pequeño a corto plazo, frente a un beneficio
más demorado, más a largo plazo, pero mayor. Este es el problema
fundamental del autocontrol.
- PROGRAMAS CONCURRENTES ENCADENADOS: a nivel de
investigación experimental en laboratorio es complicado plantear
experimentos que impliquen directamente elecciones importantes (decidir
seguir estudiando o dejarlo y empezar a trabajar). La técnica básica en esta
área de investigación es el PROGRAMA CONCURRENTE ENCADENADO
DE REFORZAMIENTO. Involucra al menos dos fases o eslabones, el de
elección y el terminal. Implican una elección con compromiso.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
63
CAPÍTULO 7.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
64
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 7: CONDICIONAMIENTO INSTRUMENTAL. MECANISMOS MOTIVACIONALES.
11. LA ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO
INSTRUMENTAL
- Thorndike: el condicionamiento instrumental incluye algo más que una respuesta
y un reforzador. La respuesta instrumental se da en presencia de estímulos
particulares.
- En un análisis del condicionamiento instrumental se deben tener en cuenta tres
sucesos: el contexto estimular (E), la respuesta instrumental (R) y la
consecuencia de la respuestas o reforzador (C)
- Para Skinner también se localizan tres sucesos, y el condicionamiento
instrumental lo describe como una contingencia de tres términos que incluía E,
R y C.
11.1 LA ASOCIACIÓN E-R Y LA LEY DEL EFECTO
- La estructura básica de un procedimiento de condicionamiento instrumental
permite el desarrollo de varios tipos diferentes de asociaciones. El primero de
ellos es una asociación entre los estímulos contextuales E y la respuestas
instrumental R. Es decir, una asociación E-R.
- Para Thorndike esta asociación es la clave del aprendizaje instrumental en su
Ley del Efecto. De acuerdo con esta ley el papel del reforzador (la consecuencia
de la respuesta) es establecer una asociación entre las claves contextuales E y la
respuesta instrumental R. Según el autor una vez establecida la asociación ella
sería la única responsable de la ocurrencia de la respuesta instrumental.
- Una implicación importante es que el condicionamiento instrumental no incluye
el aprendizaje acerca del reforzador, o relación entre la respuesta y la
consecuencia reforzante. La ley asume que el único papel del reforzador es crear
una asociación E-R, y que no es un parte de la asociación.
11.2 EXPECTATIVA DE RECOMPENSA Y LA ASOCIACIÓN E-C
- La clave es cómo captar la noción de que los sujetos aprenden a esperar el
reforzador durante el curso del condicionamiento instrumental.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
65
- Una de las explicaciones más influyentes del papel del condicionamiento clásico
en la conducta instrumental fue propuesta por Hull. Asume que durante el curso
del condicionamiento instrumental la respuesta instrumental llega a ser motivada
por dos factores. El primero: la presencia de E evoca la respuesta instrumental
directamente por asociación con R mediante la asociación E-R. El segundo: la
actividad instrumental llega a realizarse en respuesta a la expectativa de
recompensa debido al establecimiento de una asociación R-C (la forma concreta
en que esta asociación llega a motivar la conducta instrumental ha sido tema de
debate e investigación).
LA TEORÍA MODERNA DE LOS DOS PROCESOS.
- Asume que hay dos tipos de aprendizaje distintos: el condicionamiento
pavloviano y el instrumental.
- Asume además que estos dos procesos están relacionados de una forma especial:
durante el curso del condicionamiento instrumental los estímulos E se cree que
llegan a asociarse con la consecuencia de la respuesta C a través del
condicionamiento pavloviano para establecer una asociación E-C. A través de
ella el estímulo E llega a motiva la conducta instrumental mediante la activación
de un Estado Emocional Central. Su naturaleza dependerá de la naturaleza del
reforzador.
- RESULTADOS CONSECUENTES CON LA TEORÍA MODERNA DE
LOS DOS PROCESOS: los estudios que evalúan la teoría utilizan para ello un
diseño experimental que se llama Experimento de Transferencia de Control, que
consta de tres fases. La primera incluye un condicionamiento instrumental de
una respuesta operante utilizando algún programa de reforzamiento positivo o
negativo. En la fase 2 se entrena a los participantes con un condicionamiento
clásico en el que se asocia un EC explícito con la presencia o ausencia de un
estímulo incondicionado. La fase 3 es la de transferencia crítica, y en ella se
permite a los participantes que realicen la respuesta instrumental y se presenta
periódicamente el EC de la fase 2 para observar su efecto en la tasa de conducta
instrumental.
- INTERACCIONES DE RESPUESTA EN LOS EXPERIMENTOS DE
TRANSFERENCIA DE CONTROL: los estímulos condicionados
clásicamente elicitan no solo estados emocionales, sino también respuestas
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
66
abiertas. Es decir, un estímulo clásicamente condicionado puede influir sobre la
conducta instrumental a través de las respuestas abiertas que elicita.
- ¿ESTADOS EMOCIONALES CENTRALES CONDICIONADOS E
EXPECTATIVAS ESPECÍFICAS DE RECOMPENSA?: la teoría moderna
de los dos procesos asume que el condicionamiento clásico media la conducta
instrumental a través del condicionamiento de estados emocionales centrales
como la esperanza. Los animales también adquieren expectativas específicas de
recompensa en lugar de estados emocionales centrales más generales durante el
condicionamiento instrumental y clásico. Las asociaciones E-C parecen ser
fundamentales para la motivación de la conducta instrumental.
11.3 RELACIÓN R-C Y E(R-C) EN EL CONDICIONAMIENTO
INSTRUMENTAL
- Se ha visto que hay dos asociaciones que pueden motivar la conducta
instrumental: la asociación de Thorndike E-R y la asociación E-C que activa una
expectativa específica de recompensa o un estado emocional. No se puede
explicar toda la motivación de la conducta instrumental en términos de estas dos
asociaciones.
- Primero por que ninguna incluye una conexión directa entre la respuesta R y el
reforzador o consecuencia de la respuesta C. A pesar de que las explicaciones
informales de la conducta instrumental enfatizan las asociaciones R-C estas no
existen en los modelos de los dos procesos.
- Segundo, la estructura asociativa del condicionamiento instrumental asumida por
las teorías de los dos procesos es que E se supone que llega a estar asociado
directamente con C en la idea de que el emparejamiento de E con C es suficiente
para la ocurrencia de condicionamiento clásico. Sin embargo los
emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones
pavlovianas.
- EVIDENCIA DE ASOCIACIONES R-C. Algunas investigaciones indican
que el condicionamiento instrumental lleva al aprendizaje de asociaciones
respuesta-consecuencia, y se han obtenido evidencias que apoyan esta
posibilidad. Una técnica común incluye devaluar el reforzador después del
condicionamiento para ver si esto disminuye la respuesta instrumental. Es una
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
67
estrategia análoga a la estrategia de la devaluación del EI en los estudios de
condicionamiento pavloviano.
- EVIDENCIA DEL APRENDIZAJE DE UNA RELACIÓN JERÁRQUICA
E-(R-C): la evidencia anterior muestra de forma clara que los organismos
aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo
las asociaciones R-C no pueden actuar aisladamente para producir la conducta
instrumental. El hecho de que la respuesta instrumental active una expectativa
del reforzador no es suficiente para clarificar lo que produce la respuesta. Se
necesita un factor adicional para activar la asociación R-C. Una posibilidad es
que la asociación R-C sea activada por los estímulos E que están presentes
cuando la respuesta es reforzada. De acuerdo con esto E no activa R
directamente, sino que activa la asociación R-C.
12. REGULACIÓN CONDUCTUAL
12.1 ANTECEDENTES DE LA REGULACIÓN CONDUCTUAL
- Los reforzadores eran inicialmente considerados como tipos especiales de
estímulos. Los teóricos estaban de acuerdo en que los reforzadores eran
estímulos especiales que fortalecían la conducta instrumental.
- LA TEORÍA DE LA RESPUESTA CONSUMATORIA: la idea básica es que
los reforzadores son estímulos. Muchos reforzadores elicitan respuestas
incondicionadas propias de la especie. La teoría de la respuesta consumatoria
atribuye el reforzamiento a estas conductas típicas de la especie. Se establece
que las respuestas consumatorias típicas de la especie son en sí mismas el rasgo
crítico de los reforzadores.
- EL PRINCIPIO DE PREMACK: el autor indicó que las respuestas incluidas
en los reforzadores normalmente utilizados eran actividades que es muy
probable que realicen los animales. Por el contrario las respuestas instrumentales
son actividades que normalmente ocurren a una baja probabilidad. Este principio
se centra en la diferencia de la probabilidad de las respuestas instrumental y
reforzadora, por eso se llama también PRINCIPIO DE LA PROBABILIDAD
DIFERENCIAL. El principio de Premack fue un avance importante ya que
promovió la consideración de los reforzadores como respuestas más que como
estímulos, y amplió mucho el rango de cosas que se empezaron a utilizar como
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
68
reforzadores. Cualquier actividad podía servir como un reforzadote siempre y
cuando fuera más probable que la respuesta instrumental.
- LA HIPÓTESIS DE LA PRIVACIÓN DE RESPUESTA: da un nuevo
principio para predecir lo que servirá como reforzador efectivo. También da un
nuevo procedimiento para crear reforzadores, restringir el acceso a la respuesta
reforzadora. Esta hipótesis defiende que la restricción del acceso a una respuesta
por debajo de su línea base de ocurrencia es suficiente para hacer que la
oportunidad de ejecutar esa respuesta actúe como un reforzador positivo
efectivo.
12.2 REGULACIÓN CONDUCTUAL Y EL PUNTO DE DELEITE
CONDUCTUAL
- los organismos tienen una distribución de actividades preferida u óptima que
luchan por mantener frente a los cambios o interrupciones. Las teorías de la
regulación conductual se centran en el grado en que la contingencia instrumental
respuesta-reforzador rompe la estabilidad conductual y empuja al individuo
fuera de su distribución de actividades preferida u óptima.
- EL PUNTO DE DELEITE CONDUCTUAL: cada situación da varias
oportunidades de respuesta. La teoría de la regulación conductual asume que si
los organismos son libres para distribuir sus respuestas entre las alternativas
posibles, lo harán de la forma en que sea más cómodo o en algún sentido óptimo
para ellos. Esta distribución de respuesta define el punto de deleite conductual.
Esta distribución variará de una situación a otra. El punto de deleite conductual
puede identificarse mediante la frecuencia relativa de ocurrencia de todas las
respuestas de un organismo en una situación sin restricciones.
- IMPOSICIÓN DE UNA CONTINGENCIA INSTRUMENTAL: cómo
afectaría la introducción de una contingencia instrumental entre estudiar y ver la
televisión al deleite conductual del estudiante, dependerá de la naturaleza de la
contingencia, programa mediante el que se pide al estudiante que estudie la
misma cantidad de tiempo que dedica a ver la televisión. Una contingencia
instrumental no permite volver al punto de deleite. Standon propuso un
MODELO DE DESVIACIÓN MÍNIMA que indica que la introducción de
una contingencia respuesta-reforzador provoca que los organismos redistribuyan
sus conductas entre las respuestas instrumentales y contingentes de manera que
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
69
se minimice la desviación total de las dos respuestas con respecto al punto
óptimo o de deleite.
- EXPLICACIÓN DE LOS EFECTOS DEL REFORZAMIENTO: el efecto
de reforzamiento se identifica por un incremento en la ocurrencia de una
respuesta instrumental sobre el nivel de esa conducta en ausencia de la
contingencia respusta-reforzador.
- UNA VISIÓN SOBRE LAS CONTINGENCIAS DE REFORZAMIENTO
EN UN CONTEXTO CONDUCTUAL MÁS AMPLIO: el contexto influye
en el sentido de que las contingencias instrumentales no suceden en vacío sino
en un entorno en el que se pueden dar una variedad amplia de respuestas y
reforzadores.
PROBLEMAS CON LAS APROXIMACIONES DE REGULACIÓN
CONDUCTUAL.
- el punto de deleite es una característica molar de la conducta. Se basa en una
medida de cada respuesta acumulada a lo largo de un bloque temporal amplio.
- Otro problema es que las respuestas durante un periodo de línea de base libre no
siempre tienen el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta.
- La regulación conductual no estudia los procesos conductuales moleculares, por
lo tanto no dice nada acerca de cómo los organismos defienden una combinación
preferida de bienes o actividades.
CONTRIBUCIONES DE LA REGULACIÓN CONDUCTUAL:
1. La regulación conductual y el principio de Premack nos alejó de la consideración
de los reforzadores como tipos especiales de estímulos o como tipos especiales de
respuestas.
2. Los procedimientos de condicionamiento instrumental ya no se considera que
“estampan” o “fortalecen” la conducta instrumental, en su lugar es visto como una
nueva distribución de respuestas.
3. No existe una distinción fundamental entre las respuestas instrumentales y las
reforzadoras. Se distinguen únicamente por los papeles asignados a ellas mediante
un procedimiento de condicionamiento instrumental.
4. La regulación conductual y la economía conductual aceptan la idea de que los
organismos responden para maximizar sus beneficios.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
70
5. La regulación conductual y la economía conductual han proporcionado caminos
nuevos para describir las restricciones que imponen varios procedimientos de
condicionamiento instrumental en el repertorio de conducta de un organismo.
12.3 CONCEPTOS ECONÓMICOS Y DISTRIBUCIÓN DE RESPUESTAS
- Economía: La economía es el estudio de la distribución de la conducta dentro de
un sistema de restricciones. Las restricciones de la conducta se imponen por los
ingresos de un individuo y el precio de los bienes que se quiere obtener.
- Psicología: En las situaciones de condicionamiento instrumental, las
restricciones están proporcionadas por el número de respuestas que un
organismo es capaz de realizar y el número de respuestas requerido para obtener
el reforzador.
- Demanda del consumidor: Es fundamental la relación entre el precio de una
comodidad y cuánto se obtiene, esto se denomina curva de la demanda.
- Elasticidad de la demanda: Grado en el cual el precio influye en el consumo.
La demanda de caramelos es muy elástica, quiere decir que conforme más suba
el precio de los caramelos más descenderá su compra.
- Esto se relaciona con el condicionamiento instrumental mediante el
establecimiento de analogías.
a. El número de respuestas (o tiempo dedicado a responder) es el dinero.
b. El “precio” de un reforzador es el tiempo o número de respuestas requeridas
para obtener (adquirir) el reforzador.
- La meta es comprender cómo la conducta instrumental (gasto) está controlada
por las contingencias instrumentales (precios).
- Determinantes de la elasticidad de la demanda: Existen 3 factores que
influyen en cómo las restricciones de un programa moldean la redistribución de
la conducta:
1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un
artículo producen una disminución en el consumo depende de la disponibilidad
(y precio) de otros bienes que puedan utilizarse en sustitución del artículo
original. La disponibilidad de sustitutos aumenta la sensibilidad del artículo
original a los precios altos.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
71
2. Rango de precios: Un aumento en el precio tiene menos efecto en precios
bajos que en precios altos. En un rango de precios bajos, la demanda de comida
no es elástica.
3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor
con los incrementos del precio. Extrapolando esto a los programas de
reforzamiento, el número de respuestas o el tiempo disponible para responder
corresponde a los ingresos, por lo tanto cuantas más respuestas o tiempo tengan
disponibles los animales, menos estará su conducta influida por los aumentos en
el coste del reforzador.
12.4 PROBLEMAS CON LAS APROXIMACIONES DE REGULACIÓN
CONDUCTUAL
- Están basadas en la asunción de que los individuos buscan la defensa de una
combinación de actividades “óptima” o preferida, o punto de deleite
(redistribución de las conductas entre las respuestas instrumentales y
reforzadores u optando por sustituir los reforzadores)punto de vista molar.
Una adecuada caracterización del punto del “deleite conductual” requiere
información sobre las pautas de elección moleculares.
- Hacer algo cuando no hay requerimientos expuestos externamente (correr por
placer por ejemplo) parece ser diferente de hacer lo mismo cuando se requiere
por una contingencia instrumental impuesta (correr en la clase de E. Física).
- Proporcionan una aproximación para entender los intercambios que hacen los
animales entre conjuntos alternativos de bienes, pero no trata sobre los procesos
que están involucrados en hacer esos intercambios.
12.5 CONTRIBUCIÓN DE LA REGULACIÓN CONDUCTUAL
- Los reforzamientos dependen de las preferencias en la línea base. No considera
que los reforzadores que son eficaces en una situación lo van a ser en otras
(teoría de la reducción del impulso).
- El condicionamiento instrumental no “estampa” una conducta instrumental, sino
que crea una nueva distribución o reparto de las respuestas.
- No hace distinción entre respuestas instrumentales y reforzadoras (se distinguen
solo por los papeles que les son asignados por una contingencia instrumental).
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
72
- Concibe los efectos del reforzamiento como una manifestación de la forma en
que los animales se esfuerzan por distribuir sus respuestas entre las alternativas
para alcanzar la posibilidad mejor (adaptación del organismo a su ambiente).
- Todas las opciones de respuesta del organismo que se dan en un momento dado
deben ser consideradas como un sistema. Los cambios en una parte del sistema
influyen en otras partes.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
73
CAPÍTULO 8.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
74
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO.
13. IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO
13.1 RESPUESTA DIFERENCIAL Y DISCRIMINACIÓN DE ESTÍMULOS
- Se dice que un organismo muestra discriminación de estímulos si responde de
forma diferente a dos o más estímulos. La discriminación de estímulos y el
control por el estímulo constituyen dos maneras de considerar el mismo
fenómeno: una no existe sin la otra. Si un organismo no discrimina entre dos
estímulos, su conducta no está bajo el control de esas claves.
- En ausencia de procedimientos especiales (que se describen más adelante en este
capítulo), los investigadores no siempre pueden predecir cuál de varios
estímulos de aquellos que un organismo experimenta adquirirá control sobre su
conducta instrumental.
13.2 GENERALIZACIÓN DE ESTÍMULOS
- Un organismo muestra generalización de estímulos si responde de forma similar
a dos o más estímulos. En el caso de Pavlov se muestra al comprobar cómo
variantes del EC pueden elicitar una respuesta condicionada igual que el EC
inicial.
13.3 LOS GRADIENTES DE GENERALIZACIÓN DEL ESTÍMULO
COMO MEDIDAS DE CONTROL POR EL ESTÍMULO
- Los gradientes dan información sobre el grado de sensibilidad de una conducta
antes de la variación de un aspecto particular del ambiente. Esto ayuda a los
investigadores a determinar de manera exacta el grado en que tiene que
modificarse el estímulo para producir un cambio en la conducta.
- Unido a la cuestión anterior de generalización del estímulo, el gradiente es el
intervalo (de onda, de color, de sonido, de intensidad….) donde se generalizan
las respuestas.
- Si un gradiente es muy plano el rasgo que se varía en la conducta instrumental
en dependencia de este gradiente no controla la conducta instrumental; sin
embargo, si el gradiente es muy acusado, el organismo responde en mayor
medida a algunos estímulos de prueba que a otros. LO ACUSADO DEL
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
75
GRADIENTE DE GENERALIZACIÓN DE UN ESTÍMULO PROPORCIONA
UNA MEDIDA PRECISA DEL GRADO DE CONTROL DEL ESTÍMULO.
14. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL
ESTÍMULO
- ¿Qué es lo que determina que una de las muchas características de una situación
estimular adquiera control sobre la conducta instrumental?
14.1 CAPACIDAD SENSORIAL Y ORIENTACIÓN
- La capacidad sensorial y de orientación determinan qué estímulos se incluyen en
el mundo sensorial de un organismo. Lo que esté fuera de su rango sensorial no
existe para un él (los seres humanos no podemos oir los ultrasonidos, sin
embargo los perros sí).
14.2 FACILIDAD RELATIVA DEL CONDICIONAMIENTO DE VARIOS
ESTÍMULOS
- Además de tener la capacidad sensorial, la intensidad con que los organismos
aprenden sobre un estímulo determinado depende de la facilidad relativa de
condicionamiento de otras claves presentes en la situación. Esto se conoce como
ENSOMBRECIMIENTO (un niño aprende a leer viendo los dibujos y sin hacer
caso a las frases. Cuando describa los dibujos parecerá que lee, aunque no sea
así).
- Cuanto más intenso sea el estímulo más rápido se condicionará y ensombrecerá
el aprendizaje del estímulo más débil.
14.3 TIPO DE REFORZAMIENTO
- Para una misma combinación de estímulos se pueden dar respuestas diferentes
dependiendo del tipo de condicionamiento usado, debido al sistema de conducta
que se activa en cada caso. Esto se puede explicar por los sistemas de conducta
que se estén activando: para la alimentación son más dominantes las claves
visuales, y para la evitación del peligro los tonos.
- Las palomas reforzadas de forma positiva con comida responden más a una luz
roja que a un tono. Reforzadas de forma negativa con una descarga responden
más al tono que a la luz roja.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
76
14.4 TIPO DE RESPUESTA INSTRUMENTAL
- Otro factor importante es el tipo de respuesta que se esté requiriendo para el
reforzamiento. En respuestas de localización (levantar pata derecha o izquierda)
el control se encuentra en la localización de la clave auditiva; en respuestas de
acción (hacer o no hacer algo) el control se encuentra en el tipo de clave
auditiva. ESTO ES EL EFECTO DE LA NATURALEZA-LOCALIZACIÓN.
- Este efecto es un ejemplo de asociación selectiva, como pueden serlo las claves
relacionadas con el sabor y asociadas a la enfermedad, y las claves audiovisuales
asociadas con la descarga eléctrica (p.226-228).
14.5 ELEMENTOS DEL ESTÍMULO FRENTE A CLAVES
CONFIGURACIONALES EN LOS ESTÍMULOS COMPUESTOS
- APROXIMACIÓN ELEMENTAL DEL ESTÍMULO: los distintos elementos
que forman un estímulo (localización, color, sonido…) son tratados por el
organismo como rasgos distintivos y separados del ambiente.
- APROXIMACIÓN DE LA CLAVE CONFIGURACIONAL: los estímulos son
percibidos como un todo integral y no se dividen en partes más pequeñas..
15. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO
- El hecho de que ciertos estímulos puedan percibirse no asegura que llegarán a
controlar la conducta. Para que lo hagan, el organismo debe haber aprendido de
ellos. Según Pavlov, la generalización del estímulo se da porque el aprendizaje
sobre el EC llega a transferirse a otros estímulos. Lashley y Wade afirman sin
embargo que la generalización del estímulo ocurre si los organismos no han
aprendido a distinguir las diferencias entre estímulos. Es decir, la generalización
del estímulo para ellos refleja ausencia de aprendizaje.
15.1 ENTRENAMIENTO EN DISCRIMINACIÓN DE ESTÍMULOS
- Los participantes se exponen a dos estímulos diferentes (luz roja y otra verde)
pero solo se les refuerza en uno de los dos colores. Figura 8.7 p. 231: la luz roja
señala la disponibilidad de reforzamiento para la respuesta. La luz verde señala
que la respuesta no será reforzada.
- El estímulo que señala disponibilidad de reforzamiento se denomina E+ o ED (e
de) El estímulo que señala la falta de reforzamiento se denomina E- o EΔ (e
delta)
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
77
- A medida que progresa el entrenamiento, la respuesta de los organismos en
presencia de E+ aumenta mientras que la respuesta en presencia de E- declina.
Cuando tanto E+ como E- han adquirido control sobre la conducta del
organismo, se llaman estímulos discriminativos.
- PROGRAMA MÚLTIPLE DE REFORZAMIENTO: en un programa múltiple
funcionan diferentes programas de reforzamiento en presencia de diferentes
estímulos.
15.2 EFECTOS DEL ENTRENAMIENTO EN DISCRIMINACIÓN
SOBRE EL CONTROL POR EL ESTÍMULO
- Para poder hacernos una idea de la precisión de control que el E+ adquiere sobre
la conducta instrumental no basta con solamente observar la respuesta
diferencial ante E+ y E-. Se debe también determinar lo acusado del gradiente de
generalización.
15.3 RANGO DE POSIBLES ESTÍMULOS DISCRIMINATIVOS
- Los procedimientos de discriminación pueden ser utilizados para situar la
conducta instrumental de un organismo bajo el control de una amplia variedad
de estímulos. Estos procedimientos se utilizan a menudo para evaluar la
capacidad sensorial de los animales.
- También se realizaron experimentos inyectando cocaína a Palomas para ver si
podían distinguir las sensaciones internas que les provocaba esa droga. La
conclusión fue que efectivamente el entrenamiento en discriminación sí que
aumentó el control de la conducta por las sensaciones internas creadas por la
cocaína.
15.4 ¿QUÉ SE APRENDE EN EL ENTRENAMIENTO DE
DISCRIMINACIÓN?
- Tenemos un E+ (luz roja) y un E- (tono intenso). Un organismo puede aprender
3 cosas diferentes con prácticamente los mismos resultados:
Responder sólo ante la presencia de E+ y no aprender nada acerca de E-
Aprender a suprimir la respuesta durante E- pero no aprender nada acerca
del E+
Aprender el significado tanto de E+ como de E
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
78
- TEORÍA DE SPENCE DEL APRENDIZAJE DE DISCRIMINACIÓN (se basa
en la tercera opción):
La mera observación de que los organismos responden más al E+ que al
E- no es suficiente para probar que han aprendido algo acerca de ambos
estímulos. Se harán experimentos donde se utilicen los gradientes de
generalización del estímulo.
Gradiente de generalización del estímulo excitatorio: si se condiciona una
tendencia excitatoria al E+, debe observarse un gradiente de generalización
acusado con la mayor cantidad de respuesta ante el E+.
Gradiente de generalización del estímulo inhibitorio: si se condiciona una
tendencia inhibitoria al E-, entonces los estímulos que difieran
progresivamente del E- deberían ser cada vez menos efectivos en inhibir la
respuesta instrumental.
Algunos experimentos relacionados con esto muestran que el
entrenamiento en discriminación puede producir tanto condicionamiento
excitatorio al E+ como condicionamiento inhibitorio al E-.
15.5 INTERACCIONES ENTRE EL E+ Y EL E-: DESPLAZAMIENTO
DEL MÁXIMO
- Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y
viceversa, sobre todo si ambos se encuentran relacionados de alguna manera.
- Discriminación intradimensional: se produce cuando el E+ y el E- son
semejantes excepto por un rasgo o atributo. La discriminación intradimensional
es una forma de ejecución experta. (cuando dos cosas son muy parecidas, hace
falta ser un experto para poder captar las diferencias sutiles)
- Explicación de Spence del desplazamiento del máximo: considera que,
independientemente de los estímulos que se presenten en la prueba de
generalización, es posible calcular el valor del rasgo del estímulo hacia el que va
a desplazarse el máximo de respuestas atendiendo exclusivamente a los valores
netos de los E+ y E- originales.
15.6 ENTRENAMIENTO DE EQUIVALENCIA DE ESTÍMULOS
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
79
- De la misma forma que el entrenamiento en discriminación potencia la respuesta
diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada
o equivalencia de estímulos.
- El emparejamiento de estímulos diferentes con la misma consecuencia crea
equivalencia funcional entre esos estímulos con la consecuencia de que una
respuesta condicionada a uno de ellos se generalizará a los otros.
16. CLAVES CONTEXTUALES Y RELACIONALES CONDICIONALES
- El estímulo discreto es el que se presenta durante un breve período de tiempo y
tiene un comienzo y un final claros.
16.1 CONTROL POR CLAVES CONDUCTUALES
- Las claves contextuales (sin reforzador) pueden llegar a controlar la conducta de
varias formas. El control conductual por el estímulo puede ocurrir sin que un
contexto esté más fuertemente asociado con el reforzamiento que otro.
16.2 CONTROL POR LAS RELACIONES CONDICIONALES
- Las relaciones entre dos eventos (EC-EI, o una respuesta con un reforzador) son
RELACIONES BINARIAS. En ciertas circunstancias la naturaleza de una
relación binaria está determinada por un tercer suceso, denominado
MODULADOR. La relación de un modulador con la relación binaria que señala
se denomina una RELACIÓN CONDICIONAL.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
80
CAPÍTULO 9.
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
81
PSICOLOGÍA DEL APRENDIZAJE.
CAPÍTULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA.
17. INTRODUCCIÓN
- Hasta ahora, las descripciones del condicionamiento clásico e instrumental se
han centrado en varios aspectos de la adquisición y mantenimiento de
asociaciones y respuestas nuevas. Los mecanismos de aprendizaje son
importantes porque proporcionan la flexibilidad necesaria a la forma en que los
organismos interactúan con su entorno.
- Los mecanismos de aprendizaje resultan más útiles que los procesos de respuesta
incondicionada porque la plasticidad conductual que proporcionan promueve los
ajustes necesarios al ambiente cambiante.
- Pero si la conducta aprendida es una adaptación al ambiente cambiante, la
pérdida de la conducta condicionada debería ser tan relevante como su
adquisición.
- La adquisición de la conducta condicionada implica procedimeintos en los que
se presenta una consecuencia reforzante. En el condicionamiento pavloviano, la
consecuencia reforzante o estímulo incondicionado se presenta como
consecuencia de un estímulo condicionado. En el condicionamiento
instrumental, la consecuencia reforzante se presenta como una consecuencia de
la respuesta instrumental.
- La extinción implica la omisión del El o reforzador. Por tanto, la extinción en el
condicionamiento clásico incluye presentaciones repetidas del estímulo
condicionado por sí solo. La extinción en el condicionamiento instrumental
implica no volver a presentar el reforzador como una consecuencia de la
respuesta instrumental.
- El resultado típico es que la respuesta condicionada, sea clásica o instrumental,
disminuye. Por tanto, el cambio conductual que se da en la extinción es el
opuesto al que se observaba en la adquisición.
- Debido a que este cambio conductual opuesto se produce mediante la omisión
del reforzador o EI que motivaba el aprendizaje original, la extinción parece ser
lo contrario de la adquisición. Es importante puntualizar que la pérdida de la
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
82
respuesta condicionada que sucede como resultado de la extinción no es lo
mismo que la pérdida de conducta que puede suceder debido al olvido.
- La extinción se produce por la omisión del EI que sigue a las presentaciones del
EC o la omisión de! reforzador que sigue a la respuesta instrumental. El olvido,
por el contrario, es una disminución de la respuesta condicionada que se da
simplemente con el paso del tiempo.
- La extinción sucede como una consecuencia de las presentaciones repetidas del
EC por sí solo o por la ocurrencia repetida de la respuesta instrumental por sí
sola. El olvido se da con la ausencia prolongada de experiencia con el estímulo
condicionado o con la respuesta instrumental.
18. EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCIÓN
- ¿Qué haría si de forma inesperada no puede abrir la puerta de su apartamento
con la llave? Probablemente no desistiría desde el primer momento, sino que lo
intentaría varias veces, tal vez introduciendo la llave de varias maneras. Pero, si
ninguna de esas variaciones de respuesta funciona, terminaría desistiendo. Esto
ilustra dos efectos conductuales de la extinción. El efecto conductual más obvio
es que la respuesta disminuye cuando no vuelve a producir reforzamiento.
- Éste es el efecto principal de la extinción, al que los científicos han prestado
mayor atención. Las investigaciones sobre la extinción se han centrado en la tasa
o la probabilidad de la respuesta instrumental durante el curso de la extinción y
se han interesado en la rapidez con que disminuye esta respuesta. Si la llave de
su apartamento no vuelve a abrir la puerta, cesará en el intento. Pero antes de
desistir por completo, es probable que introduzca la llave de varias formas en un
esfuerzo por hacerla funcionar. Esto ejemplifica el segundo efecto conductual
básico de la extinción, a saber, que aumenta la variabilidad de la respuesta.
- En un estudio reciente de Neuringer y col., participaron dos grupos de ratas.
Durante la primera fase, ambos grupos fueron reforzados por la realización de
respuestas instrumentales, pero sólo se requirió que un grupo variase su
conducta instrumental. Entonces se observó a los dos grupos en la extinción,
para ver cómo se alteraría la tasa y la variabilidad de sus respuestas por la
ausencia de reforzamiento.
- La cámara experimental tenía dos palancas de respuesta en una de las paredes y
una tecla redonda de respuesta en la de enfrente. Durante la fase de
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
83
reforzamiento, las ratas tenían que realizar tres respuestas consecutivas para
obtener una bolita de comida. El Grupo 1 tenía que variar sus secuencias de
respuesta para obtener reforzamiento. Cada sujeto del Grupo 2 estaba acoplado a
un sujeto del grupo de variabilidad (Grupo 1), y recibió reforzamiento en un
ensayo particular sólo si su compañero acoplado obtenía reforzamiento. Los
sujetos del grupo acoplado también tenían que realizar tres respuestas para
conseguir reforzamiento, pero el hecho de que obtuviesen una bolita de comida
no dependía de la variabilidad de sus secuencias de respuesta. Después de que se
estableciese la conducta mediante las contingencias de reforzamiento, ambos
grupos pasaron a la fase de extinción.
- La extinción produjo una disminución en la tasa de respuesta en ambos grupos.
Esta disminución en la respuesta se dio frente a un aumento en la variabilidad de
las secuencias de respuesta que los sujetos ejecutaban. Ambos grupos mostraron
un incremento significativo en la variabilidad de las secuencias de respuesta que
ejecutaron durante la extinción. EI aumento en la variabilidad de la respuesta fue
evidente durante la primera sesión de extinción y se incrementó durante las
sesiones siguientes.
- el incremento en la variabilidad de la respuesta que hubo durante la extinción no
se dio porque los sujetos repitiesen las secuencias que habían realizado durante
la fase de reforzamiento. Este último resultado confirma que la estructura básica
de la conducta instrumental se altera muy poco por el hecho de introducir la
extinción. La extinción disminuye la tasa de respuesta e incrementa la
variabilidad de la respuesta, pero no altera de otro modo la estructura de la
conducta.
19. EXTINCIÓN Y APRENDIZAJE ORIGINAL
- Aunque la extinción produce importantes efectos conductuales y emocionales,
no revierte los efectos de la adquisición. La evidencia de que la extinción no
elimina lo que se aprendió originalmente se ha obtenido a través de estudios
sobre la recuperación espontánea, la renovación, el restablecimiento y los
efectos de la devaluación del reforzador.
- La extinción en el condicionamiento clásico implica que cuando el EC aparece
reiteradamente pero no le sigue el EI la RC desaparece. Disminuye la fuerza o
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
84
frecuencia de una respuesta adquirida porque no se continúa asociando con el EI
y con el EC.
- La extinción en el condicionamiento operante implica que disminuye la fuerza o
frecuencia de una respuesta porque no sigue produciéndose el reforzamiento de
la conducta. La extinción se debe a la retención del refuerzo. La disminución no
siempre es inmediata.
19.1 RECUPERACIÓN ESPONTÁNEA
- TRAS EL CONDICIONAMIENTO PAVLOVIANO. El retorno de la respuesta
condicionada tras un periodo de descanso, o lo que es lo mismo, un intervalo de
tiempo en el que no se presenta ningún estímulo. La extinción se disipa con el
tiempo. Es decir, la RC original vuelve a presentarse si el sujeto se pone a
prueba tras una demora que siga al procedimiento de extinción. Pavlov
descubrió que tras extinguir la RC debido a la presentación única del EC, si se
dejaba pasar un tiempo sin presentar el EC, cuando lo volvía a presentar también
se daba la RC. Esto es la recuperación espontánea. Finalmente Pavlov concluye
que la extinción reprime la RC pero no la elimina.
- TRAS EL CONDICIONAMIENTO INSTRUMENTAL. La extinción aquí
tampoco suprime la respuesta para siempre. Una respuesta (e.j. presión de
palanca) primero serefuerza con la presentación de un estímulo apetitivo o
reforzador (e.j. entrega de una bolita de comida). Cuando la respuesta ya no va
seguida por el reforzador deja de emitirse, es decir, se extingue al no presentar el
reforzador como consecuencia de la respuesta. En esta situación, el paso del
tiempo después de la extinción, también promueve una recuperación espontánea
de la respuesta a la palanca.
19.2 RENOVACIÓN DEL CONDICIONAMIENTO EXCITATORIO
ORIGINAL
- La renovación se refiere a la recuperación de la ejecución propia de la
adquisición que se da cuando se cambian las claves contextuales que estaban
presentes durante la extinción.
- El cambio puede consistir en una vuelta al contexto de la adquisición original o
en un cambio a un contexto “neutral”. La renovación es especialmente
problemática para la terapia de conducta porque significa que los miedos
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
85
irracionales que se extinguieron en el contexto de la consulta de un terapeuta
pueden retornar con facilidad cuando los sujetos se trasladan a un contexto
diferente.
- EI efecto de renovación tiene importantes, (y problemáticas) implicaciones para
la terapia de conducta. Se sugiere que, aunque un procedimiento terapéutico sea
efectivo extinguiendo un miedo patológico o fobia en la seguridad relativa de la
consulta del terapeuta, el miedo condicionado puede volver a presentarse fá-
cilmente cuando el cliente se enfrente con un EC de miedo en un contexto
diferente. Igualmente problemático resulta el hecho de que los efectos del
condicionamiento excitatorio se suelen generalizar de un contexto a otro. Por
tanto, si se adquiere un miedo patológico en una situación dada, es probable que
se sufra en otros contextos. Pero si se supera el miedo en un contexto concreto,
no será tan fácil que esto se generalice a otras situaciones. EI efecto de
renovación sugiere que los problemas creados por el condicionamiento tendrán
efectos mucho más amplios que las soluciones o remedios para esos problemas.
19.3 RESTAURACIÓN DE LA EJECUCIÓN DE LA EXTINCIÓN
- EI efecto de renovación implica la reactivación de la memoria del
condicionamiento excitatorio original mediante la retirada del sujeto de las
claves contextuales presentes durante la extinción. Esto implica reactivar una
conducta aprendida previamente mediante el cambio del contexto a condiciones
más aproximadas a las presentes cuando la conducta se adquirió con
anterioridad. La estrategia puede aplicarse a la extinción; es decir, la ejecución
propia de la extinción puede restaurarse introduciendo claves contextuales que
reactiven la memoria de la extinción. Esto se ha investigado dentro del marco
del fenómeno de la recuperación espontánea.
- La recuperación espontánea implica la recuperación de la conducta condicionada
originalmente que sigue a la extinción si transcurre un período suficiente de
tiempo tras la fase de extinción. La conducta propia de la extinción puede
restaurarse (contrarrestando, por tanto, la recuperación espontánea) presentando
las claves que estaban presentes durante la fase de extinción.
19.4 RESTABLECIMIENTO DE LA EXCITACIÓN CONDICIONADA
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
86
- Otro procedimiento que sirve para restaurar la respuesta a un estímulo
condicionado extinguido recibe el nombre de restablecimiento. EI
restablecimiento se refiere a la recuperación de la respuesta excitatoria a un
estímulo extinguido producida por exposiciones al estímulo incondicionado.
- Como sucedía con la renovación, el restablecimiento constituye un fenómeno
problemático para la terapia de conducta. La terapia de conducta a menudo
implica intentar que los clientes dejen de hacer cosas que les resultan
problemáticas. Debido al restablecimiento, las respuestas que se extinguen con
éxito durante el curso de la intervención terapéutica pueden recuperarse si el in-
dividuo se enfrenta de nuevo con el estímulo incondicionado. EI miedo y la
ansiedad que se adquieren durante el curso de una relación con malos tratos o de
una vida con un padre maltratador pueden reaparecer incluso tras años de terapia
si el individuo se enfrenta a formas semejantes de maltrato en otro momento de
su vida.
- Al igual que ocurría con el efecto de renovación, es importante considerar si el
efecto del restablecimiento puede ser un resultado del condicionamiento
contextual. El condicionamiento contextual es un posible factor contribuyente
debido a que las presentaciones del EI que se dan durante la fase de
restablecimiento pueden producir un condicionamiento de las claves
contextuales de la situación experimental.
- Diversos estudios han demostrado que el papel del contexto en estos casos es
suprimir la ambigüedad de significado de un estímulo que tiene una historia
mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño
en los estímulos que tienen una historia sólo de condicionamiento.
- En realidad se considera el restablecimiento como una forma de renovación: las
claves contextuales condicionadas proporcionan algunas de las claves
contextuales para la respuesta excitatoria en circunstancias normales. Estas
claves contextuales se extinguen cuando se presenta el EC por sí solo durante la
extinción.
19.5 SENSIBILIDAD A LA DEVALUACIÓN DEL REFORZADOR
- La persistencia del aprendizaje original a pesar de la extinción puede también
investigarse analizando los efectos de la devaluación del reforzador. La deva-
luación del reforzador o EI en el condicionamiento pavloviano altera la
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
87
ejecución de la respuesta condicionada si ésta era el producto de un aprendizaje
E-E más que de un aprendizaje E-R. Rescorla ha utilizado la técnica de
devaluación del EI para determinar si la asociación EC-EI establecida a través de
condicionamiento pavloviano persiste a lo largo de la extinción. Si la extinción
no deteriora la asociación EC-EI, entonces la devaluación del EI alterará la
respuesta a un EC extinguido, como lo hace con la respuesta a un EC que no ha
sido sometido a extinción.
- En una contingencia operante (instrumental), el procedimiento de devaluación
de un reforzador consiste en asociar de forma pavloviana el estímulo que se está
usando para reforzar una conducta (comida, por ejemplo) con algún otro
estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo).
El efecto resultante es una disminución de la respuesta operante que ha sido
reforzada con el reforzador devaluado aunque esta respuesta nunca haya sido
contingente con el estímulo aversivo, ni siquiera con el reforzador tras el
proceso de devaluación.
- En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy
similar y consiste en asociar el EI (con el que se estaba condicionando el EC)
con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una
disminución de la RC ante el EC, aunque el EC nunca se haya relacionado
directamente con el EI aversivo.
- Lo relevante para el capítulo que nos ocupa (Extinción de la conducta
condicionada) es que este efecto (el de la devaluación del reforzador) se observa
también en estímulos (en el caso del condicionamiento clásico) y respuestas (en
el caso del condicionamiento operante) que han sido sometidas a procedimientos
de extinción. Es decir, que después de extinguir un EC, por ejemplo, si
devaluamos el EI con el que se condicionó, la RC ante ese EC será todavía
menor que si simplemente lo hubiésemos extinguido.
- Este fenómeno se usa como evidencia para defender que los procesos de
extinción no eliminan las asociaciones realizadas durante el condicionamiento.
Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje
no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.
20. ¿QUÉ SE APRENDE EN LA EXTINCIÓN?
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
88
- La extinción no implica “desaprendizaje” y deja las asociaciones R-C y E-C en
gran medida intactas. ¿Por qué disminuye la respuesta en los procedimientos de
extinción? Al tratar sobre el condicionamiento pavloviano, se revisó la evidencia
que indicaba que las asociaciones E-E o el aprendizaje E-E son más importantes
que el aprendizaje E-R. En el condicionamiento instrumental, se comentó la
evidencia que indicaba que las asociaciones E-C y R-C son más importantes que
la asociación E-R destacada por Thorndike. Estas discusiones reflejan el
abandono de los mecanismos E-R que ha ocurrido en la teoría contemporánea
del aprendizaje durante el último cuarto del siglo XX. Pero la importancia
otorgada al papel de las asociaciones E-E y R-C constituye un reto para las
teorías de la extinción.
20.1 ASOCIACIONES E-R INHIBITORIAS
- La falta de reforzamiento produce una asociación E-R inhibitoria.
- En realidad la extinción implica un tipo especial de ausencia de reforzamiento,
es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento.
La ausencia de reforzamiento sin esta historia previa no es extinción, sino más
bien habituación. La ausencia de reforzamiento resulta aversiva sólo después de
darse una historia de reforzamiento. Por lo tanto los efectos emocionales de la
ausencia de reforzamiento dependen de forma crítica de la historia previa del
sujeto.
- Los efectos de la extinción son tanto conductuales como emocionales. Los
efectos emocionales se originan en la frustración que se desencadena cuando un
reforzador esperado no llega. Se supone que la ausencia de reforzamiento
cuando se espera recompensa desencadena una reacción frustrante aversiva
incondicionada. Esta emoción aversiva sirve para que se deje de responder
durante el curso de la extinción mediante el establecimiento de una asociación
E-R inhibitoria.
20.2 EFECTOS “PARADÓJICOS” DE LA RECOMPENSA
- Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la
expectativa de recompensa, y en consecuencia más fuerte será la frustración que
se da cuando se introduce la extinción.
- Efecto de sobreentrenamiento en la extinción: Si la disminución en la
respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
89
entrenamiento más extenso debería producir una extinción más rápida. Es
paradójico ya que el sentido común nos diría que un entrenamiento más extenso
debería crear una respuesta más fuerte y más resistente a la extinción, pero
sucede lo contrario.
- Efecto de la magnitud del reforzamiento en la extinción: La respuesta
disminuye más rápido durante la extinción que sigue a un reforzamiento con un
reforzador mayor. La ausencia de reforzamiento resulta más frustrante si el
individuo espera una gran recompensa que si espera una pequeña.
- Efecto del reforzamiento parcial en la extinción (ERPE): (es el efecto más
estudiado). Los efectos de la extinción serán diferentes dependiendo del
programa de reforzamiento usado. La extinción es más lenta y produce menos
reacciones de frustración si había un programa de reforzamiento parcial (o
intermitente) en lugar de uno continuo.
20.3 MECANISMOS DEL EFECTO DEL REFORZAMIENTO PARCIAL DE
LA EXTINCIÓN
- Tal vez la explicación más evidente del ERPE es que la introducción de la
extinción es más fácil de detectar tras el reforzamiento continuo que tras el
reforzamiento parcial. Si no se recibe el reforzador tras cada respuesta durante el
entrenamiento, puede no notarse inmediatamente cuándo los reforzadores se
omiten por completo. La ausencia de reforzamiento es mucho más fácil de
detectar tras el reforzamiento continuo. Esta explicación del efecto del
reforzamiento parcial en la extinción se denomina hipótesis de la discriminación.
- Hay dos teorías a través de las que se puede explicar qué aprenden los sujetos
durante el reforzamiento parcial que les hace más persistentes al enfrentarse a
una racha de mala suerte o fracasos: la TEORÍA DE LA FRUSTRACIÓN (los
sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa
durante el entrenamiento de reforzamiento parcial). La TEORÍA
SECUENCIAL (los sujetos aprenden sobre la memoria de la ausencia de
recompensa).
- Teoría de la frustración. Fue desarrollada por Abram Amsel. Según este
planteamiento, la persistencia en la extinción es resultado del aprendizaje de
algo paradójico, es decir, continuar respondiendo cuando se espera no ser
reforzado o ser frustrado. La teoría de la frustración asume que el reforzamiento
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
90
intermitente da como resultado aprender a responder a pesar de esperar la
ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable
experiencia con reforzamiento intermitente.
- La teoría de la frustración caracteriza el aprendizaje que se produce durante el
curso del reforzamiento intermitente en términos de estadios. El reforzamiento
intermitente incluye ensayos reforzados y no reforzados. Los ensayos
recompensados animan a los individuos a espera reforzamiento, y los ensayos no
recompensados les llevan a esperar la ausencia de recompensa. En consecuencia,
el reforzamiento intermitente produce el aprendizaje de expectativas tanto de
recompensa como de no recompensa. Al principio, la expectativa de recompensa
alienta a los sujetos a responder, y la anticipación de la ausencia de
reforzamiento desalienta la respuesta. Por tanto, al principio del entrenamiento,
los sujetos entrenados con reforzamiento intermitente están en conflicto con lo
que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas.
Sin embargo, a medida que el entrenamiento continúa, el conflicto se resuelve a
favor de responder.
- Teoría secuencial. La teoría secuencial fue propuesta por Capaldi y está
formulada en términos de conceptos de memoria. Asume que los sujetos pueden
recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. Recuerdan los ensayos recientes tanto recompensados como no
recompensados. Se asume además que durante el entrenamiento en
reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser
una clave para la realización de la respuesta instrumental. De acuerdo con la
teoría secuencial, esto produce persistencia en la extinción. La forma exacta en
que esto ocurre depende en gran medida de la secuencia de ensayos
recompensados (R) y no recompensados (N) que se administran en el programa
de reforzamiento intermitente. Por esta razón la teoría está etiquetada como
“secuencial”.
21. RESISTENCIA A LA EXTINCIÓN Y MOMENTO CONDUCTUAL
- Momento conductual: Este concepto se basa en el concepto de momento de la
física newtoniana. El momento de un objeto físico es el producto de su peso (o
masa) por su velocidad. Esta hipótesis dice que la conducta que posee un
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.
91
momento elevado también será difícil de “parar” o interrumpir por las
manipulaciones.
- La investigación sobre el momento conductual se ha llevado a cabo utilizando
programas múltiples de reforzamiento ya que capacitan a los investigadores para
comparar la susceptibilidad de la conducta a la interrupción bajo dos
condiciones diferentes en la misma sesión.