Explicación sencilla de los condicionamientos clásico y operante

03-08-202303-08-2023 Thomas Sullivan

Tabla de contenido

A muchas personas, incluidos estudiantes de psicología, profesores y profesionales, los conceptos de condicionamiento clásico y condicionamiento operante les resultan confusos. Por eso he decidido ofrecer una explicación sencilla de los procesos de condicionamiento clásico y condicionamiento operante. No puede ser más sencillo que lo que está a punto de leer.

El condicionamiento clásico y el condicionamiento operante son dos procesos psicológicos básicos que explican cómo aprenden los seres humanos y otros animales. El concepto fundamental que subyace a estos dos modos de aprendizaje es asociación .

En pocas palabras, nuestros cerebros son máquinas de asociar. Asociamos cosas entre sí para poder aprender sobre nuestro mundo y tomar mejores decisiones.

Si no tuviéramos esta capacidad básica de asociación, no podríamos funcionar con normalidad en el mundo y sobrevivir. La asociación nos permite tomar decisiones rápidas basadas en una información mínima.

Por ejemplo, cuando tocas accidentalmente una estufa caliente, sientes dolor y retiras el brazo rápidamente. Cuando esto ocurre, aprendes que "tocar una estufa caliente es peligroso". Como tienes esta capacidad de aprendizaje, asocias la "estufa caliente" con el "dolor" e intentas por todos los medios evitar este comportamiento en el futuro.

Si no hubieras formado esa asociación (cocina caliente = dolor), lo más probable es que hubieras vuelto a tocar una cocina caliente, exponiéndote a un mayor riesgo de quemarte la mano.

El condicionamiento clásico y el condicionamiento operante son dos formas de establecer estas conexiones.

¿Qué es el condicionamiento clásico?

El condicionamiento clásico se demostró científicamente en los famosos experimentos realizados por Ivan Pavlov con perros que salivaban. Observó que sus perros no sólo salivaban cuando se les presentaba comida, sino también cuando sonaba una campana justo antes de que se les presentara la comida.

¿Cómo es posible?

La salivación resultante de ver u oler comida tiene sentido. Nosotros también lo hacemos, pero ¿por qué salivarían los perros al oír sonar una campana?

Resulta que los perros habían asociado el sonido de la campana con la comida porque, cuando les daban comida, la campana sonaba casi al mismo tiempo. Y esto había ocurrido el suficiente número de veces como para que los perros relacionaran "comida" con "campana sonando".

Pavlov, en sus experimentos, descubrió que cuando presentaba comida y hacía sonar la campana simultáneamente muchas veces, los perros salivaban cuando sonaba la campana aunque no se presentara comida.

De este modo, se había "condicionado" a los perros para que salivaran al oír el timbre. En otras palabras, los perros adquirida una respuesta condicionada.

Empecemos desde el principio para que se familiarice con los términos.

Antes del acondicionamiento

Inicialmente, los perros salivaban cuando se les presentaba la comida, una respuesta normal que suele generar la presentación de comida. En este caso, la comida es el estímulo incondicionado (US) y la salivación es el respuesta incondicionada (UR).

Por supuesto, utilizar el término "incondicionado" indica que aún no se ha producido ninguna asociación/condicionamiento.

Dado que el condicionamiento aún no se ha producido, tocar el timbre es una estímulo neutro (NS) porque no produce ninguna respuesta en los perros, por ahora.

Durante el acondicionamiento

Cuando el estímulo neutro (el timbre) y el estímulo incondicionado (la comida) se presentan juntos repetidamente a los perros, se emparejan en sus mentes.

Tanto es así, que el estímulo neutro (timbre sonoro) produce por sí solo el mismo efecto (salivación) que el estímulo incondicionado (comida).

Tras el condicionamiento, el timbre (antes NS) se convierte en el estímulo condicionado (EC) y la salivación (antes UR) se convierte en la respuesta condicionada (RC).

La fase inicial durante la cual el alimento (US) se empareja con la campana sonora (NS) se denomina adquisición porque el perro está en proceso de adquirir una nueva respuesta (RC).

Después del acondicionamiento

Con el tiempo, esta respuesta tiende a disminuir porque el timbre y la comida ya no están emparejados.

En otras palabras, el emparejamiento se hace cada vez más débil, lo que se denomina el extinción de la respuesta condicionada.

Obsérvese que el timbre, por sí solo, es impotente para provocar la salivación a menos que se combine con alimentos que la provoquen de forma natural y automática.

Así, cuando se produce la extinción, el estímulo condicionado vuelve a ser un estímulo neutro. En esencia, el emparejamiento permite al estímulo neutro "tomar prestada" temporalmente la capacidad de un estímulo incondicionado para inducir una respuesta incondicionada.

Una vez extinguida una respuesta condicionada, puede reaparecer de nuevo tras una pausa, lo que se denomina recuperación espontánea .

Más ejemplos de condicionamiento clásico.

Generalización y discriminación

En el condicionamiento clásico, la generalización del estímulo es la tendencia de los organismos a provocar la respuesta condicionada cuando se exponen a estímulos que son similar al estímulo condicionado.

Piénselo de este modo: la mente tiende a percibir cosas similares como si fueran iguales. Así, los perros de Pavlov, aunque estaban condicionados a salivar al oír sonar una campana determinada, también pueden salivar en respuesta a otros objetos de sonido similar.

Si, tras el condicionamiento, los perros de Pavlov salivaran al ser expuestos al sonido de una alarma de incendios, al timbre de una bicicleta o incluso al golpeteo de unas hojas de cristal, se trataría de un ejemplo de generalización.

Todos estos estímulos, aunque diferentes, suenan similares entre sí y al estímulo condicionado (timbre sonoro). En resumen, la mente del perro percibe estos estímulos diferentes como iguales, generando la misma respuesta condicionada.

Esto explica por qué, por ejemplo, puede sentirse incómodo con un desconocido al que no conoce de antes. Puede que sus rasgos faciales, su forma de andar, su voz o su manera de hablar le recuerden a una persona a la que odiaba en el pasado.

La capacidad de los perros de Pavlov para distinguir entre estos estímulos generalizados y otros estímulos irrelevantes del entorno se denomina discriminación De ahí que los estímulos no generalizados se discriminen de todos los demás estímulos.

Fobias y condicionamiento clásico

Si consideramos los miedos y las fobias como respuestas condicionadas, podemos aplicar los principios del condicionamiento clásico para hacer que estas respuestas se extingan.

Por ejemplo, una persona que teme hablar en público puede haber tenido algunas malas experiencias al principio cuando se levantó para hablar en público.

El miedo y la incomodidad que sintieron y la acción de "levantarse para hablar" se emparejaron de tal manera que ahora la sola idea de levantarse para hablar genera la respuesta de miedo.

Si esta persona se levanta a hablar más a menudo, a pesar del miedo inicial, con el tiempo el "hablar en público" y la "respuesta de miedo" se desenredarán. La respuesta de miedo se extinguirá.

En consecuencia, la persona se deshará del miedo a hablar en público. Hay dos formas de hacerlo.

En primer lugar, exponer a la persona a la situación temida de forma continuada hasta que el miedo disminuya y finalmente desaparezca, lo que se denomina inundaciones y es un acontecimiento único.

Alternativamente, la persona puede someterse a lo que se denomina desensibilización sistemática La persona se expone gradualmente a los distintos grados de miedo durante un largo periodo de tiempo, siendo cada nueva situación más desafiante que la anterior.

Ver también: ¿Quién es una persona narcisista y cómo identificarla?

Limitaciones del condicionamiento clásico

El condicionamiento clásico puede llevarte a pensar que puedes emparejar cualquier cosa con cualquier cosa. De hecho, esta fue una de las primeras suposiciones de los teóricos que trabajaban en el área. Lo llamaron equipotencialidad Sin embargo, más tarde se supo que ciertos estímulos se emparejan más fácilmente con otros.1

En otras palabras, no se puede emparejar cualquier estímulo con cualquier otro. Es probable que estemos "biológicamente preparados" para generar respuestas a ciertos tipos de estímulos más que a otros.2

Por ejemplo, la mayoría de nosotros tememos a las arañas y esta respuesta de miedo también puede desencadenarse cuando vemos un manojo de hilo, confundiéndolo con una araña (generalización).

La explicación evolutiva es que nuestros antepasados tenían más motivos para temer a los objetos animados (depredadores, arañas, serpientes) que a los inanimados.

Esto significa que a veces puede confundir un trozo de cuerda con una serpiente, pero casi nunca confundirá una serpiente con un trozo de cuerda.

Condicionamiento operante

Mientras que el condicionamiento clásico habla de cómo asociamos los acontecimientos, el condicionamiento operante habla de cómo asociamos nuestro comportamiento con sus consecuencias.

El condicionamiento operante nos dice hasta qué punto es probable que repitamos un comportamiento basándonos exclusivamente en sus consecuencias.

La consecuencia que hace más probable que su comportamiento se produzca en el futuro se denomina refuerzo y la consecuencia que hace menos probable que su comportamiento se produzca en el futuro se denomina castigo .

Ver también: 3 Grupos de gestos habituales y su significado

Por ejemplo, supongamos que un niño saca buenas notas en el colegio y sus padres le premian comprándole su videoconsola favorita.

Esto se debe a que la videoconsola es un refuerzo que fomenta la repetición de un determinado comportamiento (sacar buenas notas).

Cuando algo deseable es dado al realizador de un comportamiento para aumentar la probabilidad de ese comportamiento en el futuro, se denomina refuerzo positivo .

Así, en el ejemplo anterior, la videoconsola es un reforzador positivo y dársela al niño es un refuerzo positivo.

Sin embargo, el refuerzo positivo no es la única forma de aumentar la frecuencia de un determinado comportamiento en el futuro. Hay otra forma en la que los padres pueden reforzar el comportamiento de "sacar buenas notas" del niño.

Si el chico promete hacerlo bien en futuros exámenes, puede que sus padres se vuelvan menos estrictos y le levanten algunas restricciones que le habían impuesto anteriormente.

Una de estas normas indeseables podría ser "jugar a los videojuegos una vez a la semana". Los padres pueden suprimir esta norma y decirle al niño que puede jugar a los videojuegos dos o quizá tres veces a la semana.

El niño, a cambio, tiene que seguir rindiendo bien en la escuela y seguir "sacando buenas notas".

Este tipo de refuerzo, en el que algo indeseable (norma estricta) se quitado del realizador de un comportamiento, se denomina refuerzo negativo .

Puedes recordarlo así: "positivo" siempre significa que algo es dado al autor de un comportamiento y "negativo" siempre significa que algo es quitado de ellos.

Obsérvese que en los dos casos anteriores de refuerzo positivo y negativo, el objetivo final del refuerzo es el mismo, es decir, aumentar la probabilidad futura de un comportamiento o reforzar el comportamiento (sacar buenas notas).

Lo que ocurre es que podemos proporcionar el refuerzo dando algo (+) o quitando algo (-). Por supuesto, quien realiza la conducta quiere obtener algo deseable y quiere deshacerse de algo indeseable.

Hacerles uno o ambos favores hace más probable que te cumplan y repitan el comportamiento que quieres que repitan en el futuro.

Hasta ahora hemos visto cómo funciona el refuerzo, pero hay otra forma de pensar en las consecuencias del comportamiento.

Castigo

Cuando la consecuencia de un comportamiento hace que éste menos probable que se produzca en el futuro, la consecuencia se denomina castigo Así, el refuerzo aumenta la probabilidad de un comportamiento en el futuro, mientras que el castigo la disminuye.

Siguiendo con el ejemplo anterior, digamos que, al cabo de un año más o menos, el chico empieza a sacar malos resultados en los exámenes. Se dejó llevar y dedicó más tiempo a los videojuegos que a estudiar.

Ahora bien, este comportamiento (sacar malas notas) es algo que los padres quieren que se reduzca en el futuro. Quieren disminuir la frecuencia de este comportamiento en el futuro, así que tienen que recurrir al castigo.

Una vez más, los padres pueden utilizar el castigo de dos formas, dependiendo de si dan algo (+) o quitan algo (-) al niño para motivarle a disminuir su comportamiento (sacar malas notas).

Esta vez, los padres intentan desalentar el comportamiento del niño, por lo que tienen que darle algo indeseable o quitarle algo que es deseable para él.

Si los padres vuelven a imponer las normas estrictas al niño, están dando algo que le parece indeseable. Así que esto será castigo positivo .

Si los padres le quitan la videoconsola al niño y la encierran en una cabaña, están quitar algo que el niño encuentra deseable. Esto es un castigo negativo.

Para recordar qué tipo de refuerzo o castigo se está llevando a cabo, hay que tener siempre presente al realizador de la conducta. Es su conducta la que queremos aumentar o disminuir utilizando refuerzos o castigos respectivamente.

Además, ten en cuenta lo que desea el que realiza un comportamiento. De este modo, podrás saber si darle algo y quitarle algo es un refuerzo o un castigo.

Aproximación sucesiva y conformación

¿Ha visto alguna vez a perros y otros animales realizar trucos complejos a las órdenes de sus amos? A esos animales se les adiestra utilizando el condicionamiento operante.

Puedes hacer que un perro salte un obstáculo si después de saltar (comportamiento), el perro recibe una golosina (refuerzo positivo). Se trata de un truco sencillo. El perro ha aprendido a saltar a tu orden.

Puede continuar este proceso dando sucesivamente al perro más recompensas hasta que el perro se acerque cada vez más al comportamiento complejo deseado. Esto se denomina aproximación sucesiva .

Supongamos que quiere que el perro haga un sprint justo después de saltar. Tiene que recompensar al perro después de que salte y después de que haga el sprint. Con el tiempo, puede descartar la recompensa inicial (después del salto) y recompensar al perro sólo cuando realice la secuencia de comportamiento de salto + sprint.

Repitiendo este proceso, puedes entrenar al perro a saltar + esprintar + correr y así sucesivamente de una sola vez. Este proceso se llama dando forma a .3

Este vídeo muestra la formación de un comportamiento complejo en un Husky siberiano:

Horarios de refuerzo

En el condicionamiento operante, el refuerzo aumenta la intensidad de una respuesta (mayor probabilidad de que se produzca en el futuro). La forma en que se proporciona el refuerzo (programa de refuerzo) influye en la intensidad de la respuesta.4

Se puede reforzar un comportamiento cada vez que se produce (refuerzo continuo) o se puede reforzar parte del tiempo (refuerzo parcial).

Aunque el refuerzo parcial lleva tiempo, la respuesta desarrollada es bastante resistente a la extinción.

Dar un caramelo a un niño cada vez que saca buena nota en un examen sería un refuerzo continuo. En cambio, darle un caramelo algunas veces pero no cada vez que el niño saca buena nota constituiría un refuerzo parcial.

Existen diferentes tipos de programas de refuerzo parcial o intermitente en función del momento en que proporcionemos el refuerzo.

Cuando proporcionamos el refuerzo tras un número fijo de veces que se realiza una conducta se denomina relación fija .

Por ejemplo, dar un caramelo al niño cada vez que saque buenas notas en tres exámenes. Luego, recompensarle de nuevo después de que saque buenas notas en tres exámenes y así sucesivamente (número fijo de veces que se realiza un comportamiento = 3).

Cuando el refuerzo se proporciona tras un intervalo de tiempo fijo, se denomina intervalo fijo programa de refuerzo.

Por ejemplo, dar caramelos al niño todos los domingos sería un programa de refuerzo de intervalo fijo (intervalo de tiempo fijo = 7 días).

Estos son ejemplos de programas de refuerzo fijos. El programa de refuerzo también puede ser variable.

Cuando el refuerzo se da después de que una conducta se repita un número impredecible de veces, se denomina relación variable programa de refuerzo.

Por ejemplo, dar al niño un caramelo después de puntuar bien 2, 4, 7 y 9 veces. Tenga en cuenta que 2, 4, 7 y 9 son números aleatorios. No ocurren después de un intervalo fijo como en el programa de refuerzo de proporción fija (3, 3, 3, etc.).

Cuando el refuerzo se administra tras intervalos de tiempo impredecibles, se denomina intervalo variable programa de refuerzo.

Por ejemplo, dar al niño un caramelo al cabo de 2 días, luego al cabo de 3 días, al cabo de 1 día, etc. No hay un intervalo de tiempo fijo como en el caso del programa de refuerzo a intervalos fijos (7 días).

En general, los refuerzos variables generan una respuesta más fuerte que los refuerzos fijos. Esto puede deberse a que no hay expectativas fijas sobre la obtención de recompensas, lo que nos hace pensar que podemos obtener la recompensa en cualquier momento, lo que puede resultar altamente adictivo.

Las notificaciones de las redes sociales son un buen ejemplo de refuerzo variable: no sabes cuándo (intervalo variable) y después de cuántas comprobaciones (proporción variable) vas a recibir una notificación (refuerzo).

Así que es probable que sigas comprobando tu cuenta (comportamiento reforzado) con la expectativa de recibir una notificación.

Referencias:

Öhman, A., Fredrikson, M., Hugdahl, K., & Rimmö, P. A. (1976). La premisa de equipotencialidad en el condicionamiento clásico humano: respuestas electrodérmicas condicionadas a estímulos potencialmente fóbicos. Revista de Psicología Experimental: General , 105 (4), 313.
McNally, R. J. (2016). el legado de Seligman" fobias y preparación"(1971). Terapia conductual , 47 (5), 585-594.
Peterson, G. B. (2004), Un día de gran iluminación: el descubrimiento del moldeamiento por BF Skinner. Revista de análisis experimental del comportamiento , 82 (3), 317-328.
Ferster, C. B., & Skinner, B. F. (1957) Schedules of reinforcement.