Unha explicación sinxela do condicionamento clásico e operante

03-08-202303-08-2023 Thomas Sullivan

Táboa de contidos

Moitas persoas, incluídos estudantes de psicoloxía, profesores e profesionais, consideran confusos os conceptos de condicionamento clásico e operante. Así que decidín ofrecer unha explicación sinxela dos procesos de condicionamento clásico e operante. Non pode ser máis sinxelo que o que estás a piques de ler.

O condicionamento clásico e o operante son dous procesos psicolóxicos básicos que explican como aprenden os humanos e outros animais. O concepto fundamental que subxace a ambos os dous modos de aprendizaxe é a asociación .

Simplemente, os nosos cerebros están asociando máquinas. Asociamos cousas entre si para que poidamos coñecer o noso mundo e tomar mellores decisións.

Se non tivésemos esta habilidade básica para asociarnos, non poderiamos funcionar normalmente no mundo e sobrevivir. A asociación permítenos tomar decisións rápidas baseándose nunha información mínima.

Por exemplo, cando tocas accidentalmente unha cociña quente, sentes dor e tiras o brazo para atrás rapidamente. Cando isto ocorre, aprendes que "tocar unha cociña quente é perigoso". Como tes esta capacidade de aprender, asocias a "cocina quente" coa "dor" e intentas evitar este comportamento no futuro.

Se non formara tal asociación (estufa quente = dor), moi probablemente terías tocado unha cociña quente de novo, poñendo en maior risco de queimarche a man.

Por iso, é útil para nós conectar cousasestán dándolle algo que lle parece indesexable. Polo tanto, este será un castigo positivo .

Se os pais quítanlle a consola de xogos do neno e a encerran nunha cabina, están quitándolle algo que o neno considera desexable. Este é un castigo negativo.

Para lembrar que tipo de reforzo ou castigo se está a levar a cabo, ten sempre presente o autor do comportamento. É o seu comportamento o que queremos aumentar ou diminuír mediante reforzos ou castigos respectivamente.

Ten en conta tamén o que desexa o que fai un comportamento. Deste xeito, podes saber se dar algo e quitar algo é un reforzo ou un castigo.

Aproximación e conformación sucesivas

Viches cans algunha vez. e outros animais realizan trucos complexos ás ordes dos seus amos? Eses animais adestran mediante o condicionamento operante.

Podes facer que un can salte sobre un obstáculo se despois de saltar (comportamento), o can recibe unha golosina (reforzo positivo). Este é un truco sinxelo. O can aprendeu a saltar ao teu comando.

Podes continuar este proceso dándolle máis recompensas sucesivamente ata que este se achegue cada vez máis ao comportamento complexo desexado. Isto chámase aproximación sucesiva .

Digamos que queres que o can faga un sprint xusto despois de que salte. Tes que recompensar ao can despois de que saltee logo despois de correr. Finalmente, podes descartar a recompensa inicial (despois do salto) e só premiar ao can cando realice a secuencia de comportamento salto + sprint.

Repetindo este proceso, podes adestrar o can para que salte + sprint + correr e así sucesivamente dunha soa vez. Este proceso chámase shaping .3

Este vídeo demostra a conformación dun comportamento complexo nun husky siberiano:

Horarios de reforzo

No condicionamento operante, o reforzo aumenta a forza dunha resposta (é máis probable que se produza no futuro). A forma en que se proporciona o reforzo (programa de reforzo) inflúe na forza da resposta.4

Podes ou ben reforzar un comportamento cada vez que se produce (reforzo continuo) ou podes reforzalo algunha vez (reforzo parcial) .

Aínda que o reforzo parcial leva tempo, a resposta desenvolvida é bastante resistente á extinción.

Darlle doces a un neno cada vez que obtén unha boa puntuación nun exame sería un reforzo continuo. Por outra banda, darlle golosinas algunhas veces pero non cada vez que o neno obtén unha boa puntuación constituiría un reforzo parcial.

Hai diferentes tipos de horarios de reforzo parciais ou intermitentes dependendo de cando lle proporcionemos o reforzo.

Cando proporcionamos o reforzo despois dun número determinado de veces que se fai un comportamento chámase proporción fixa .

Por exemplo, darlle doces ao neno cada vez que obtén boa puntuación en tres exames. Despois, recompensándoo de novo despois de que obtén unha boa puntuación en tres exames e así sucesivamente (número fixo de veces que se fai un comportamento = 3).

Ver tamén: Fallar un polígrafo ao dicir a verdade

Cando se proporciona reforzo despois dun intervalo de tempo determinado, chámase intervalo fixo calendario de reforzo.

Por exemplo, darlle doces ao neno todos os domingos sería un programa de reforzo a intervalos fixos (intervalo de tempo fixo = 7 días).

Estes foron exemplos de horarios de reforzo fixos. O calendario de reforzo tamén pode ser variable.

Cando se dá un reforzo despois de que un comportamento se repita un número imprevisible de veces, denomínase programa de reforzo de proporción variable .

Por exemplo, darlle caramelos ao neno despois de marcar ben 2, 4, 7 e 9 veces. Teña en conta que 2, 4, 7 e 9 son números aleatorios. Non se producen despois dunha brecha fixa como no programa de reforzo de proporción fixa (3, 3, 3, etc.).

Cando o reforzo se dá despois de intervalos de tempo imprevisibles, chámase programa de reforzo de intervalo variable .

Por exemplo, dándolle doces ao neno despois de 2 días, despois de 3 días, despois de 1 día e así por diante. Non existe un intervalo de tempo fixo como no caso do programa de reforzo de intervalo fixo (7 días).

En xeral, os reforzos variables xeran unha resposta máis forte que os reforzos fixos. Istopode deberse a que non hai expectativas fixas sobre a obtención de recompensas o que nos fai pensar que podemos conseguir a recompensa en calquera momento. Isto pode ser moi adictivo.

As notificacións das redes sociais son un bo exemplo de reforzos variables. Non sabes cando (intervalo variable) e despois de cantas comprobacións (ratio variable) recibirás unha notificación (reforzo).

Polo que é probable que sigas revisando a túa conta (comportamento reforzado) coa expectativa de recibir unha notificación.

Referencias:

Öhman, A., Fredrikson, M., Hugdahl, K., & Rimmö, P. A. (1976). A premisa da equipotencialidade no condicionamento clásico humano: respostas electrodérmicas condicionadas a estímulos potencialmente fóbicos. Revista de Psicoloxía Experimental: Xeral , 105 (4), 313.
McNally, R. J. (2016). O legado das fobias e a preparación de Seligman (1971). Terapia conductual , 47 (5), 585-594.
Peterson, G. B. (2004). Un día de gran iluminación: o descubrimento do moldeado de BF Skinner. Revista da análise experimental do comportamento , 82 (3), 317-328.
Ferster, C. B., & Skinner, B. F. (1957). Horarios de reforzo.

para poder aprender. O condicionamento clásico e o operante son dúas formas nas que formamos estas conexións.

Que é o condicionamento clásico?

O condicionamento clásico demostrouse cientificamente nos famosos experimentos realizados por Ivan. Pavlov con cans salivados. Notou que os seus cans non só salivaban cando lles presentaban a comida, senón tamén cando soaba unha campá xusto antes de que se lles presentase a comida.

Como podería ser iso?

A salivación resultante de ver ou cheirar alimentos ten sentido. Nós tamén o facemos, pero por que os cans salivarían ao escoitar un timbre?

Resulta que os cans tiñan asociado o son do timbre coa comida porque cando lles daban comida, a campá soaba case ao ó mesmo tempo. E isto ocorrera un número suficiente de veces para que os cans conectasen a "comida" coa "campá que soa".

Pavlov, nos seus experimentos, descubriu que cando presentaba comida e tocaba a campá ao mesmo tempo moitas veces, os cans salivaban cando soaba a campá aínda que non se presentase ningunha comida.

Deste xeito, os cans foran "acondicionados" para que saliven en resposta ao escoitar o timbre. Noutras palabras, os cans adquiriron unha resposta condicionada.

Imos comezar todo dende o principio para que poidas familiarizarte cos termos implicados.

Antes do acondicionamento

Inicialmente, os cans salivaban cando se lles presentaba a comida.resposta normal que normalmente xera a presentación dos alimentos. Aquí, a comida é o estímulo incondicionado (EUA) e a salivación é a resposta incondicionada (UR).

Por suposto, usar o termo "incondicionado" indica que aínda non se produciu ningunha asociación/condicionamento.

Xa que aínda non se produciu o condicionamento, o timbre é un estímulo neutro (NS) porque non produce ningunha resposta nos cans, polo momento.

Durante o acondicionamento

Cando o estímulo neutro (campá de timbre) e o estímulo incondicionado (comida) se presentan repetidamente xuntos aos cans, emparéllanse na mente dos cans.

Tanto é así, que só o estímulo neutro (campá de timbre) produce o mesmo efecto (salivación) que o estímulo incondicionado (alimento).

Despois do condicionamento, a campá de timbre (anteriormente NS) convértese agora no estímulo condicionado (CS) e a salivación (anteriormente UR) convértese na resposta condicionada (CR).

A etapa inicial durante que o alimento (US) está emparejado coa campá (NS) chámase adquisición porque o can está en proceso de adquirir unha nova resposta (CR).

Despois do acondicionamento

Despois do acondicionamento, só o timbre de campá induce a salivación. Co paso do tempo, esta resposta tende a diminuír porque o timbre e a comida xa non están emparellados.

Noutras palabras, o emparellamento faise cada vez máis débil.Isto chámase extinción da resposta condicionada.

Ten en conta que a campá, por si mesma, é impotente para desencadear a salivación a menos que se combine con alimentos que desencadean a salivación de forma natural e automática.

Entón, cando se produce a extinción, o estímulo condicionado volve ser un estímulo neutro. En esencia, o emparellamento permite que o estímulo neutro "tome prestado" temporalmente a capacidade dun estímulo incondicionado para inducir unha resposta incondicionada.

Despois de extinguirse unha resposta condicionada, pode reaparecer de novo despois dunha pausa. Isto chámase recuperación espontánea .

Exemplos de condicionamento máis clásicos.

Xeneralización e discriminación

No condicionamento clásico, a xeneralización do estímulo é a tendencia dos organismos a provocar a resposta condicionada cando están expostos a estímulos que son semellantes ao estímulo condicionado.

Pénsao deste xeito: a mente tende a percibir cousas similares como iguais. Polo tanto, os cans de Pavlov, aínda que estaban condicionados para salivar ao escoitar un toque de campá en particular, tamén poden salivar en resposta a outros obxectos que sonan semellantes.

Se, despois do acondicionamento, os cans de Pavlov salivan ao exporse a un lume que soa. alarma, un anel de bicicleta ou mesmo golpes de follas de vidro, este sería un exemplo de xeneralización.

Todos estes estímulos, aínda que diferentes, soan similares a cada un.outro e ao estímulo condicionado (campá de repique). En resumo, a mente do can percibe estes estímulos diferentes como iguais, xerando a mesma resposta condicionada.

Isto explica por que, por exemplo, podes sentirte incómodo ao redor dun descoñecido que nunca antes coñeceses. Pode ser que os seus trazos faciais, a súa forma de andar, a voz ou a forma de falar che lembren a unha persoa que odiaches no pasado.

A capacidade dos cans de Pavlov para distinguir entre estes estímulos xeneralizados e outros estímulos irrelevantes no ambiente. chámase discriminación . Polo tanto, os estímulos que non están xeneralizados están discriminados de todos os demais.

Fobias e condicionamentos clásicos

Se consideramos os medos e as fobias como respostas condicionadas, podemos aplicar principios de condicionamento clásico para que estas respostas se extingan.

Por exemplo, unha persoa que teme falar en público pode ter sufrido algunhas malas experiencias inicialmente cando se levantou para falar en público.

O medo e a incomodidade que sentía e a acción de "conseguir" ata falar" emparejouse de tal xeito que a idea de levantarse para falar só xera agora a resposta de medo.

Se esta persoa se ergue para falar con máis frecuencia, a pesar do medo inicial, finalmente "falar en público". ' e a "resposta ao medo" desenredarase. A resposta ao medo extinguirase.

En consecuencia, a persoa librarase do medo aofalar en público. Hai dúas formas de facelo.

En primeiro lugar, expón á persoa á situación temida continuamente ata que o medo diminúe e, finalmente, desaparece. Isto chámase inundación e é un evento único.

Como alternativa, a persoa pode sufrir o que se chama desensibilización sistemática . A persoa exponse gradualmente aos distintos graos de medo durante un longo período de tempo, sendo cada nova situación máis desafiante que a anterior.

Limitacións do condicionamento clásico

O condicionamento clásico pode levarche a pensar que podes emparellar calquera cousa con calquera cousa. De feito, esta foi unha das primeiras suposicións dos teóricos que traballaban na zona. Chamáronlle equipotencialidade . Non obstante, soubo máis tarde que certos estímulos se emparejan máis facilmente con certos estímulos.1

Noutras palabras, non se pode emparellar calquera estímulo con calquera outro estímulo. É probable que esteamos "bioloxicamente preparados" para xerar respostas a certos tipos de estímulos sobre outros.2

Por exemplo, a maioría de nós temos medo ás arañas e esta resposta de medo tamén pode activarse cando vemos un feixe de fío. confundíndoo cunha araña (xeneralización).

Este tipo de xeneralización ocorre raramente para obxectos inanimados. A explicación evolutiva é que os nosos antepasados tiñan máis motivos para temer aos obxectos animados (predadores, arañas, serpes) que aos obxectos inanimados.obxectos.

Isto significa que ás veces podes confundir un anaco de corda cunha serpe, pero case nunca confundiras unha serpe cun anaco de corda.

Acondicionamento operante

Mentres o condicionamento clásico fala de como asociamos os acontecementos, o condicionamento operante fala de como asociamos o noso comportamento coas súas consecuencias.

O condicionamento operante indícanos a probabilidade que temos de repetir un comportamento baseándose unicamente nas súas consecuencias.

A consecuencia que fai que o teu comportamento se produza no futuro chámase reforzo e a consecuencia que fai que o teu comportamento sexa menos probable que se produza no futuro chámase castigo .

Ver tamén: Cuestionario de ansiedade social (LSASSR)

Por exemplo, digamos que un neno obtén boas notas na escola e que os seus pais o recompensan mercándolle a súa consola de xogos favorita.

Agora, é máis probable que teña un bo rendemento nas probas futuras. . Isto débese a que a consola de xogos é un reforzo para fomentar máis aparicións futuras dun determinado comportamento (sacar boas notas).

Cando se dalle algo desexable ao autor dun comportamento para aumentar a probabilidade dese comportamento no futuro, denomínase reforzo positivo .

Entón, no exemplo anterior, a consola de xogos é un reforzo positivo e darlla ao neno é un reforzo positivo.

Porén, o reforzo positivo non é a única forma en que a frecuencia dunun comportamento particular pode aumentar no futuro. Hai outra forma na que os pais poden reforzar o comportamento do neno de "sacar boas notas".

Se o neno promete facelo ben nas probas futuras, os seus pais poden facerse menos estritos e levantar algunhas restricións que estaban previamente imposta sobre el.

Unha destas regras indesexables podería ser "xogar aos videoxogos unha vez por semana". Os pais poden acabar con esta regra e dicirlle ao neno que pode xogar aos videoxogos dúas ou quizais tres veces por semana.

O neno, a cambio, ten que seguir saíndo ben na escola e seguir "sacando boas notas".

Este tipo de reforzo, onde se toma algo indesexable (regra estrita) lonxe do autor dunha conduta, chámase reforzo negativo .

Podes lembralo deste xeito: "positivo" sempre significa que se dá algo ao autor dun comportamento e "negativo" sempre significa que se lle quita algo

Teña en conta que nos dous casos anteriores de reforzo positivo e negativo, o obxectivo final do reforzo é o mesmo, é dicir, aumentar a probabilidade futura dun comportamento ou reforzar o comportamento (obter boas notas).

É só que podemos proporcionar o reforzo dándolle algo (+) ou quitándolle algo (-). Por suposto, o que fai o comportamento quere conseguir algo desexable e quere desfacerse de algoindesexable.

Facerlles un ou ambos estes favores fai máis probable que cumpran contigo e repitan o comportamento que queres que repitan no futuro.

Ata agora, nós" discutimos como funciona o reforzo. Hai outra forma de pensar sobre as consecuencias do comportamento.

Castigo

Cando a consecuencia dun comportamento fai que o comportamento menos se produza no futuro, a consecuencia chámase castigo . Polo tanto, o reforzo aumenta a probabilidade dun comportamento no futuro mentres que o castigo a diminúe.

Continuando co exemplo anterior, digamos, despois dun ano máis ou menos, o neno comeza a ter un mal rendemento nas probas. Deixouse levar e adicou máis tempo aos videoxogos que ao estudo.

Agora, este comportamento (sacar malas notas) é algo que os pais queren menos no futuro. Queren diminuír a frecuencia deste comportamento no futuro. Así que teñen que usar o castigo.

De novo, os pais poden usar o castigo de dúas formas dependendo de se lle dan algo (+) ou quitan algo (-) ao neno para motivalo a diminuír o seu comportamento ( sacar malas notas).

Esta vez, os pais tratan de desalentar o comportamento do neno para que teñan que darlle algo indesexable ou quitarlle algo que sexa desexable para o neno.

Se os pais volven impoñer o regras estritas sobre o neno, eles