Upload
luis-serna
View
248
Download
2
Embed Size (px)
Citation preview
El Condicionamiento Operante
Fernanda RubalcavaAna Paula BustamanteManuel GarciaJuan Pablo VelazcoJonathan AlapizcoJoel Castillo
¿ Que es el Condicionamiento Operante
•El Condicionamiento Operante comenzó a estudiarse en el
siglo XX. Es un tipo de aprendizaje que tiene que
ver con el desarrollo de nuevas conductas en función
de sus consecuencias.
• El condicionamiento operante o instrumental es el aprendizaje en el que una respuesta voluntaria se refuerza o debilita según sus consecuencias sean positivas o negativas.
A diferencia del condicionamiento clásico, donde los comportamientos son las respuestas biológicas naturales a la presencia de estímulos como el alimento, el agua, el dolor, etc., en el condicionamiento operante, un organismo opera en su ambiente y efectúa respuestas voluntarias para producir un resultado deseable: los organismos tienden a repetir las respuestas que se acompañen de consecuencias favorables.
Primeras investigaciones…
• El psicólogo Edward Thorndike (1874-1949) fue uno de los pioneros en el estudio del
condicionamiento instrumental. Para ello, ideó sus denominadas
“cajas de solución de problemas”, que eran jaulas de las que los gatos (que eran los animales con los que
trabajaba) podían escapar mediante acciones simples como manipular un cordón, presionar
una palanca o pisar una plataforma.
‘’Cajas de solución de problemas”
Coloco un gato hambriento en espacios estrechos de la caja problema, con comida fuera donde el gato podía olerla y verla para obtenerla debía encontrar la manera de abrir el cerrojo de la puerta, mientras el cronometraba, al inicio el gato tardaba mucho y poco a poco lo lograba en menos tiempo, hasta lograr una respuesta casi inmediata.
Nació en Susquehanna el 20 de marzo de 1904 y murió en
Cambridge el 18 de agosto de 1990. Fue
un psicólogo, filósofo social y autor estadounidense.
Condujo un trabajo pionero en psicología experimental y defendió el conductismo que
considera el comportamiento como una
función de las historias ambientales de refuerzo.
Burrhus Frederic Skinner
• El autor más importante en el estudio del condicionamiento operante es B.F. Skinner. A finales de la década de 1920 empezó a trabajar con palomas.
La superstición de la paloma
La superstición de la paloma• En este experimento
participaron ocho palomas hambrientas, las cuales
fueron introducidas en la llamada caja de Skinner En ésta, las palomas disponían
de comida a intervalos regulares con independencia
de la respuesta que emitieran. No obstante, en este
experimento se observó un condicionamiento evidente
en todas las palomas.
La superstición de la paloma es un experimento ya clásico de Skinner fue llevado a cabo en 1948
Elementos del condicionamiento operante (reforzador)positivo: es un objeto, evento o conducta que incrementa la frecuencia de la respuesta. El reforzamiento positivo ocurre cuando una respuesta se fortalece porque se acompaña de un estímulo reforzante.• A mayor cantidad de
recompensa mayor esfuerzo realizado. Entre el refuerzo y la conducta reforzada debe haber una proximidad temporal
• El nivel de motivación es fundamental en el aprendizaje
• Negativo: Se produce cuando una respuesta se fortalece porque se acompaña de la eliminación de un estímulo aversivo (desagradable).
Castigo
En términos generales podemos decir que el castigo reviste dos
cualidades principales (que a su vez lo diferencian del refuerzo positivo y
del negativo).
El castigo es en sí un evento que resulta desagradable (doloroso,
lastimoso) a quien lo recibe.
El propósito fundamental del castigo es evitar que una conducta se repita.
Nótese entonces que el castigo se diferencia del refuerzo positivo y del
negativo en que:
El evento no es agradable al organismo.
No incentiva conductas sino que quiere reprimirlas.
Programas de reforzamiento
• ¿Qué es un programa de reforzamiento?
• Los programas de reforzamiento son patrones o reglas que indican el momento y la forma en que la aparición de una respuesta va a ir seguida de un reforzador. Estos programas incluyen en el aprendizaje de la conducta y en como ésta se mantiene.
Tipos de reforzamiento
Continuo • cada una de las respuestas da
lugar a la aparición de un reforzador, como en el caso de una paloma que recibe comida cada vez que picotea una tecla. Este tipo de reforzamiento parece ser el modo más eficaz para condicionar inicialmente la conducta. Sin embargo, cuando el refuerzo cesa (por ejemplo, cuando desconectamos la entrega de alimento)
intermitente• las respuestas solo se
refuerzan algunas veces, como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de programa produce un patrón máspersistente de respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible o cesa
• Una combinación de reforzamiento intermitente y de refuerzo continuo es muy eficaz cuando se trata de enseñar a los sujetos mediante condicionamiento operante: al principio se utiliza un reforzamiento continuo, para que se adquiera la respuesta, y luego se pasa a un reforzamiento intermitente, para que sea más difícil que se extinga.
• El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable
razonamiento intermitente
• Razón fija: El refuerzo se obtiene después de un número fijo de respuestas. Los individuos responden con una tasa relativamente mayor de respuestas cuando operan bajo programas de razón fija superior (dependerá del caso aplicar la razón más adecuada), pero por lo general hacen una pausa para descansar después de recibir el reforzamiento, antes de proseguir con la respuesta.
• Razón variable: En este caso, el número de respuestas para conseguir el reforzador varía aleatoriamente, aunque siempre dentro de un promedio determinado. Muchos reforzadores naturales, como el logro o el reconocimiento, se acercan mucho a este tipo de programas. Los programas de razón variable producen una global elevada sostenida, y los individuos no hacen pausa después del refuerzo. Aparentemente, la incertidumbre de no saber cuándo va a llegar el siguiente reforzador mantiene a los organismos produciendo la respuesta constantemente.
• Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad de tiempo, siempre que durante el intervalo se haya dado la respuesta. Los problemas de intervalo fijo producen una tasa de respuestas desigual. Una vez que se administra el refuerzo, la tasa de respuestas tiende a ser baja. Durante el intervalo, la conducta aumenta típicamente hasta alcanzar un nivel elevado inmediatamente antes del siguiente reforzador programado. La cantidad global de respuestas en un programa de intervalos fijos es moderada.
• Intervalo variable: El refuerzo está disponible después de un tiempo que varía aleatoriamente, pero alrededor de un promedio. Un ejemplo es el de un profesor que realiza exámenes sorpresa aproximadamente cada semana. Este tipo de programa por lo general produce una tasa de respuesta constante, pero moderada.
Actividad: selecciona verdadero o falso• Según el Condicionamiento Operante• Lo fundamental es la contiguidad entre la conducta y el
reforzador (v/f)• La probabilidad de una respuesta depende de sus
consecuencias.(v/f)• La respuesta depende exclusivamente de la intensidad del
reforzador.(v/f)• El sujeto emite respuestas involuntarias. (v/f)
Selecciona la correcta • ¿Cuál de los siguientes no es un ejemplo de conducta
operante? • A) Una rata que presiona una palanca después de recibir
comida por esa conducta.• B) Una rata que presiona una palanca para evitar
una descarga eléctrica por esa conducta.• C) Un parpadeo después de un destello de luz.• D) Un niño que estudia para obtener la aprobación del
maestro
•GRACIAS POR SU ATENCION