El aprendizaje en la vida cotidiana (segunda parte)

blog_6_1_aprendizaje_2.png

En la primera parte del presente artículo dimos un repaso al condicionamiento clásico, a nuestro don de adaptabilidad y te introdujimos al condicionamiento operante . Vamos a seguir un poco más...

El modo de actuación del condicionamiento instrumental

Recordemos que el condicionamiento instrumental u operante es una forma de aprendizaje, mediante el cual tenemos más probabilidades de repetir las formas de conducta que nos traerán consecuencias positivas y menos probabilidad de repetir las que nos traerán negativas. Es pues un tipo de aprendizaje asociativo, y este tiene que ver con el desarrollo de nuevas conductas en función de sus consecuencias, y no con la asociación entre estímulos y conductas como ocurre en el condicionamiento clásico.

El proceso del condicionamiento instrumental u operante requiere la siguiente secuencia:

  1. Estímulo, al que llamaremos a partir de ahora Estímulo Discriminativo (ED), porque va a discriminar con otros la respuesta

  2. Respuesta, a la que denominaremos Respuesta Operante (RO)

  3. Refuerzo, que se trata de un Estímulo Reforzante (ER), lo que implica una asociación con la respuesta operante para potenciarla

Un ejemplo típico es:

Examen (ED)    =>    Estudio (RO)    =>    Apruebo (ER)

O el que puede explicar, en parte, la adicción al juego:

Ruleta (ED)    =>    Juego (RO)    =>    Premio (ER)

 

Repetimos lo que nos gusta

La ley del efecto descubierta por Thorndike, afirma un principio muy sencillo que consta de dos partes. La primera afirma que las respuestas que producen consecuencias satisfactorias se consolidan, y por consiguiente, se emiten con frecuencia creciente. La segunda presupone que los organismos aprenden respuestas que permiten evitar o evadir estímulos desagradables.

Los padres utilizan recompensas para moldear los buenos modales en la mesa, elogian el comportamiento que se asemeja al de los adultos ¿no?, pues esto es un ejemplo claro del condicionamiento operante.

 

Motivar para proseguir: el reforzamiento

blog_6_2_aprendizaje_2.png

¿Qué es el reforzador? Es todo lo que aumenta la frecuencia de respuesta. Hay dos tipos de reforzadores: los positivos y los negativos. Un refuerzo es positivo cuando consolida una repuesta al ser presentado después de ella y al ser considerado por el sujeto como un premio (alimento, aprobación, dinero, expresiones de cariño…). Es negativo cuando tiende a ser eliminado después de la respuesta, lo cual puede ser así consolidarla.

El alimento o la supresión del dolor son  reforzadores primarios, entendidos así porque son innatos. En cambio el dinero, el éxito, los halagos, las calificaciones, el tono agradable de voz, etc., son secundarios y se aprenden en general relacionados con los primarios. 

La inmediatez de un reforzador influye en muchas conductas. De esto saben muchos los fumadores o consumidores de drogas. En esto se basa el uso de analgésicos que alivian el dolor. Pero, en general, aprendemos a responder a reforzadores más demorados: el sueldo al terminar el mes, el triunfo al final de una lucha, las calificaciones trimestrales…y si bien el reforzador instantáneo acostumbra a ser muy eficaz, para funcionar sólidamente debemos aprender a postergar las recompensas inmediatas a favor de las de largo plazo, que suelen ser más contundentes. Se ha comprobado que los niños que aprenden ya de pequeños a aplazar premios importantes, en contra de recompensas inmediatas, se convierten en adolescentes más competentes.

Programar es progresar

En la vida cotidiana hay reglas bien definidas que rigen la existencia de cada uno de nosotros, que programan nuestros premios o castigos. Así, nuestros padres solían decirnos que nos darían apoyo económico o algún privilegio deseado (por ejemplo, salir de noche) a condición de que cumpliéramos con nuestros deberes. Estamos sometidos a normas que podemos denominar programas de reforzamiento parcial o intermitente y que aseguran la persistencia de una conducta, mucho más que los reforzamientos constantes, que acaban por extinguir la respuesta por cansancio o rutina. A la larga, el reforzamiento parcial determina una mayor resistencia a la extinción. 

  • Los programas de intervalo fijo están regulados por un tiempo determinado de antemano, con una pausa igual después de cada refuerzo. Durante este periodo no se dispone de reforzadores, reforzándose la respuesta siguiente en el momento de concluir el intervalo fijo. Los ejemplos más claros son nuestro sueldo o los regalos ofrecidos en un tiempo específico por la tradición, como las Navidades.

  • En los programas de intervalo variable, el lapso está marcado por un valor medio sometido en parte al azar. Se refuerza la primera respuesta después de intervalos variables. Por ejemplo, cuando cedemos a las rabietas de los niños en pos de una tranquilidad que a la larga, puede volverse contra nosotros. Estos programas tienden a producir una respuesta lenta pero regular.

  • Los programas de razón fija se basan en un refuerzo que aparece después de un número determinado y prefijado de respuestas. Por ejemplo, los trabajos a destajo: por cada cincuenta unidades de producción se recibe una prima. Puede considerarse un sistema eficaz porque suele producir tasas altas de respuesta, con pausas breves y momentáneas tras cada refuerzo.

  • Los programas de razón variable brindan recompensa después de un número determinado pero previsible de respuestas. Son los más utilizados en el juego y responsables de un buen número de adicciones compulsivas, ya que determinan elevados índices de respuesta, porque los reforzadores aumentan a medida que se incrementa la respuesta.

La indefensión aprendida

blog_6_3_aprendizaje_2.png

Los organismos sujetos a procesos que estiman incontrolables desarrollarían aprendizajes de no control, de sucesos considerados independientes de la propia voluntad. La gente puede resignarse ante condiciones ambientales que indiquen la imposibilidad de controlar los resultados de sus propias acciones. Entramos en expectativa de indefensión, ya que recibimos castigo (muchas veces autoinfligido por nuestros propios pensamientos negativos), sea cual fuese nuestro comportamiento. Ya no escapamos aunque la situación lo permita; incluso desestimamos las posibilidades de recompensa posible en caso de adoptar una estrategia adecuada, con lo que caemos en una situación de paralización que a su vez provoca alteraciones emocionales de desesperanza.

 

El castigo

El castigo nos dice qué no debemos hacer; el refuerzo lo que debemos hacer. Lo más efectivo es combinar el castigo con el refuerzo positivo, con lo que se incrementará la eficacia del método. Si se aplica el castigo, éste debe cumplir con ciertas condiciones para conseguir una cierta efectividad: 

  • Debe estar subordinado a la conducta específica

  • No alternar nunca premio y castigo por la misma conducta (evitar las distorsiones entre padre y madre o entre padres y maestros)

  • Proporcionar a los sujetos medios alternativos para conseguir la recompensa

  • No debe generalizarse a rasgos personales (“eres un estúpido”)

  • Tenemos que evitar los castigos prolongados

Ciertos autores sostienen además que el castigo prolongado y excesivo puede desencadenar la agresividad en el sujeto que lo padece, y ponen como ejemplo la correlación existente entre delincuentes agresivos con la infancia que tuvieron en hogares demasiado aversivos y castigadores.

 

Aprendizaje por imitación

blog_6_4_aprendizaje_2.png

Desde que somos bebés observamos e imitamos las formas de conductas de otros, lo que recibe el nombre de modelado o aprendizaje vicario. Este proceso es increíblemente eficaz, pues permite evitar los tediosos procedimientos de tanteo y ensayo-error que acompañan al condicionamiento instrumental. Gracias a esto también aprendemos sin intentos previos y nos facilita el amplio repertorio de nuestra conducta social.

El modelado permite explicar las conductas psicosociales que provocan efectos positivos y solidarios, marcados por nuestros padres, entorno social  o por los medios de comunicación.

 

Superstición

blog_6_5_aprendizaje_2.png

Buena parte de nuestras supersticiones se aprenden al darse un reforzamiento positivo o negativo de manera casual. En el famoso experimento de Skinner con palomas, a las que se les reforzaba con comida por picotear en un disco, observó que si una paloma se giraba casualmente antes de picotear, creía que el giro le servía para obtener comida y, a pesar de que la comida se le daba por picoteo, independientemente del giro, la paloma aprendía una conducta supersticiosa y seguía efectuando el giro aunque no le servía para nada. Así es como aprendemos a  atribuir una causa incorrecta a un efecto, porque nuestra mente es así, necesita tener todo en orden.

Esperamos que os haya quedado un poquito más claro y os recomendamos los siguientes vídeos (son muy cortitos). 

Por Karemi Rodríguez Batista

Fuentes: 

  • Aprendizaje y capacidad de adaptación (2007). En Enciclopedia de la Psicología (Vol. 2, 77-92 pp). España: Océano.

  • Domjan, M. (2012). Principios de aprendizaje y conducta. (5ªed) Madrid: Paraninfo.

Karemi Rodríguez Batista