Una explicació senzilla del condicionament clàssic i operant

03-08-202303-08-2023 Thomas Sullivan

Taula de continguts

Moltes persones, inclosos estudiants de psicologia, professors i professionals, troben confusos els conceptes de condicionament clàssic i operant. Així que vaig decidir donar una explicació senzilla dels processos de condicionament clàssic i operant. No pot ser més senzill que el que estàs a punt de llegir.

El condicionament clàssic i el condicionament operant són dos processos psicològics bàsics que expliquen com aprenen els humans i altres animals. El concepte fonamental que subjau aquests dos modes d'aprenentatge és associació .

En poques paraules, els nostres cervells estan associant màquines. Associem les coses entre si per poder conèixer el nostre món i prendre millors decisions.

Si no tinguéssim aquesta habilitat bàsica d'associació, no podríem funcionar amb normalitat al món i sobreviure. L'associació ens permet prendre decisions ràpides a partir d'una informació mínima.

Per exemple, quan toqueu accidentalment una estufa calenta, sents dolor i tires el braç enrere ràpidament. Quan això passa, aprens que "tocar una estufa calenta és perillós". Com que tens aquesta capacitat d'aprendre, associes l'"estufa calenta" amb el "dolor" i fas tot el possible per evitar aquest comportament en el futur.

Si no haguéssiu format aquesta associació (estufa calenta = dolor), probablement hauríeu tornat a tocar una estufa calenta, exposant-vos a un major risc de cremar-vos la mà.

Per tant, ens és útil connectar cosesli estan donant alguna cosa que li sembla indesitjable. Per tant, aquest serà un càstig positiu .

Vegeu també: La trampa ‘Comença des de demà’

Si els pares s'emporten la consola de jocs del nen i la tanquen en una cabina, s'estan emportant alguna cosa que el nen consideri desitjable. Aquest és un càstig negatiu.

Per recordar quin tipus de reforç o càstig s'està duent a terme, tingueu sempre present l'autor de la conducta. És el seu comportament el que volem augmentar o disminuir mitjançant reforços o càstigs respectivament.

També, tingues en compte el que desitja l'autor d'un comportament. D'aquesta manera, podeu saber si donar alguna cosa i treure alguna cosa és un reforç o un càstig.

Aproximació i modelació successives

Has vist mai gossos. i altres animals fan trucs complexos a les ordres dels seus amos? Aquests animals s'entrenen mitjançant condicionament operant.

Podeu fer saltar un gos per sobre d'un obstacle si després de saltar (comportament), el gos rep una delícia (reforç positiu). Aquest és un truc senzill. El gos ha après a saltar a les teves ordres.

Pots continuar aquest procés donant-li successivament més recompenses fins que el gos s'acosti cada cop més al comportament complex desitjat. Això s'anomena aproximació successiva .

Diguem que vols que el gos faci un esprint just després de saltar. Heu de recompensar el gos després que saltii després després d'esprintar. Finalment, podeu descartar la recompensa inicial (després del salt) i només recompensar el gos quan duu a terme la seqüència de comportament salt + sprint.

Repetint aquest procés, podeu entrenar el gos perquè salti + sprint + córrer i així successivament d'una vegada. Aquest procés s'anomena shaping .3

Aquest vídeo demostra la configuració d'un comportament complex en un husky siberià:

Horaris de reforç

En el condicionament operant, el reforç augmenta la força d'una resposta (més probable que es produeixi en el futur). La manera com es proporciona el reforç (programa de reforç) influeix en la força de la resposta.4

Podeu reforçar una conducta cada vegada que es produeix (reforç continu) o bé podeu reforçar-la alguna vegada (reforç parcial) .

Tot i que el reforç parcial requereix temps, la resposta desenvolupada és bastant resistent a l'extinció.

Donar llaminadures a un nen cada vegada que obté una bona nota en un examen seria un reforç continu. D'altra banda, donar-li llaminadures una part del temps però no cada cop que el nen puntua bé constituiria un reforç parcial.

Hi ha diferents tipus d'horaris de reforç parcials o intermitents en funció de quan proporcionem el reforç.

Quan proporcionem el reforç després d'un nombre determinat de vegades que es fa un comportament s'anomena proporció fixa .

Per exemple, donar llaminadures al nen cada cop que treu bé en tres exàmens. Llavors, recompensant-lo de nou després d'haver obtingut una bona puntuació en tres exàmens i així successivament (nombre fix de vegades que es fa una conducta = 3).

Vegeu també: Tinc TDAH? (qüestionari)

Quan es proporciona un reforç després d'un interval de temps determinat, s'anomena interval fix programa de reforç.

Per exemple, donar caramels al nen cada diumenge seria un programa de reforç d'interval fix (interval de temps fix = 7 dies).

Aquests eren exemples d'horaris de reforç fix. El calendari de reforç també pot ser variable.

Quan es dóna un reforç després de repetir un comportament un nombre impredictible de vegades, s'anomena programa de reforç de ràtio variable .

Per exemple, donar caramels al nen després d'haver marcat bé 2, 4, 7 i 9 vegades. Tingueu en compte que 2, 4, 7 i 9 són nombres aleatoris. No es produeixen després d'un buit fix com en el programa de reforç de proporció fixa (3, 3, 3, etc.).

Quan el reforç es dóna després d'intervals de temps impredictibles, s'anomena programa de reforç d'interval variable .

Per exemple, donar caramels al nen després de 2 dies, després de 3 dies, després d'1 dia i així successivament. No hi ha un interval de temps fix com en el cas del programa de reforç d'interval fix (7 dies).

En general, els reforços variables generen una resposta més forta que els reforços fixos. Aixòpot ser perquè no hi ha expectatives fixes sobre l'obtenció de recompenses, la qual cosa ens fa pensar que podem obtenir la recompensa en qualsevol moment. Això pot ser molt addictiu.

Les notificacions a les xarxes socials són un bon exemple de reforços variables. No saps quan (variable-interval) i després de quantes comprovacions (variable-ratio) rebràs una notificació (reforç).

Per tant, és probable que continuïs comprovant el teu compte (comportament reforçat) a l'espera de rebre una notificació.

Referències:

Öhman, A., Fredrikson, M., Hugdahl, K., & Rimmö, P. A. (1976). La premissa de l'equipotencialitat en el condicionament clàssic humà: respostes electrodèrmiques condicionades a estímuls potencialment fòbics. Journal of Experimental Psychology: General , 105 (4), 313.
McNally, R. J. (2016). El llegat de les fòbies i la preparació de Seligman (1971). Teràpia conductual , 47 (5), 585-594.
Peterson, G. B. (2004). Un dia de gran il·luminació: el descobriment del modelatge de BF Skinner. Diari de l'anàlisi experimental del comportament , 82 (3), 317-328.
Ferster, C. B., & Skinner, B. F. (1957). Horaris de reforç.

per poder aprendre. El condicionament clàssic i operant són dues maneres en què formem aquestes connexions.

Què és el condicionament clàssic?

El condicionament clàssic es va demostrar científicament en els famosos experiments realitzats per Ivan. Pavlov amb gossos salivadors. Es va adonar que els seus gossos no només salivaven quan se'ls presentava menjar, sinó també quan sonava una campana just abans de presentar-los.

Com podria ser això?

La salivació resultant de mirar o olorar els aliments té sentit. Nosaltres també ho fem, però per què els gossos salivarien en sentir un timbre?

Resulta que els gossos havien associat el so de la campana amb el menjar perquè quan els donaven menjar, la campana tocava gairebé al mateix temps. I això havia passat prou vegades perquè els gossos connectessin el "menjar" amb la "campana que sona".

Pavlov, en els seus experiments, va trobar que quan presentava menjar i feia tocar la campana simultàniament moltes vegades, els gossos salivaven quan sonava la campana encara que no es presentava cap menjar.

D'aquesta manera, els gossos havien estat "condicionats" perquè salivin en resposta a sentir la campana. És a dir, els gossos adquiriren una resposta condicionada.

Comencem tot des del principi perquè pugueu familiaritzar-vos amb els termes implicats.

Abans de condicionar

Inicialment, els gossos salivaven quan es presentava el menjar- unresposta normal que normalment genera la presentació dels aliments. Aquí, el menjar és l' estímul incondicionat (EUA) i la salivació és la resposta no condicionada (UR).

Per descomptat, utilitzar el terme "incondicionat" indica que encara no s'ha produït cap associació/condicionament.

Com que encara no s'ha produït el condicionament, el timbre és un estímul neutre (NS) perquè, de moment, no produeix cap resposta en els gossos.

Durant el condicionament

Quan l'estímul neutre (campana que sona) i l'estímul no condicionat (menjar) es presenten repetidament junts als gossos, s'aparellen a la ment dels gossos.

Tant és així, que l'estímul neutre (campana que sona) per si sol produeix el mateix efecte (salivació) que l'estímul no condicionat (aliment).

Després del condicionament, el timbre de campana (anteriorment NS) es converteix ara en l'estímul condicionat (CS) i la salivació (anteriorment UR) es converteix ara en la resposta condicionada (CR).

L'etapa inicial durant que el menjar (EUA) s'aparella amb la campana que sona (NS) s'anomena adquisició perquè el gos està en procés d'adquirir una nova resposta (CR).

Després del condicionament

Després del condicionament, només el timbre de campana indueix la salivació. Amb el pas del temps, aquesta resposta tendeix a disminuir perquè el timbre i el menjar ja no estan emparellats.

En altres paraules, l'aparellament es fa cada cop més feble.Això s'anomena extinció de la resposta condicionada.

Tingueu en compte que la campana, en si mateixa, és impotent a l'hora de provocar la salivació tret que s'acompanyi amb aliments que desencadenen la salivació de manera natural i automàtica.

Per tant, quan es produeix l'extinció, l'estímul condicionat torna a ser un estímul neutre. En essència, l'aparellament permet que l'estímul neutre "prestingui" temporalment la capacitat d'un estímul incondicionat per induir una resposta incondicionada.

Després d'una resposta condicionada s'ha extingit, pot reaparèixer de nou després d'una pausa. Això s'anomena recuperació espontània .

Exemples de condicionament més clàssics.

Generalització i discriminació

En el condicionament clàssic, la generalització d'estímuls és la tendència dels organismes a provocar la resposta condicionada quan estan exposats a estímuls que són similars a l'estímul condicionat.

Penseu-ho d'aquesta manera: la ment tendeix a percebre coses semblants com a iguals. Així doncs, els gossos de Pavlov, tot i que estaven condicionats per salivar en escoltar una campana en particular, també poden salivar en resposta a altres objectes que sonen similars.

Si, després del condicionament, els gossos de Pavlov saliven en exposició a un foc sonor. alarma, un anell de bicicleta o fins i tot toc de làmines de vidre, aquest seria un exemple de generalització.

Tots aquests estímuls, encara que diferents, sonen semblants a cadascun.altres i a l'estímul condicionat (campana). En resum, la ment del gos percep aquests diferents estímuls com el mateix, generant la mateixa resposta condicionada.

Això explica per què, per exemple, pot ser que et sentis incòmode al costat d'un desconegut a qui no has conegut mai abans. Pot ser que els seus trets facials, la marxa, la veu o la manera de parlar et recordin a una persona que odiaves en el passat.

La capacitat dels gossos de Pavlov per distingir entre aquests estímuls generalitzats i altres estímuls irrellevants de l'entorn. s'anomena discriminació . Per tant, els estímuls que no estan generalitzats estan discriminats de tots els altres.

Fòbies i condicionament clàssic

Si considerem les pors i les fòbies com a respostes condicionades, podem aplicar principis de condicionament clàssic per fer que aquestes respostes s'extingeixin.

Per exemple, una persona que té por de parlar en públic pot haver tingut algunes males experiències inicialment quan es va aixecar per parlar en públic.

La por i el malestar que va sentir i l'acció de "conseguir" per parlar" es va emparellar de manera que la idea d'aixecar-se per parlar sol genera ara la resposta de por.

Si aquesta persona s'aixeca per parlar més sovint, malgrat la por inicial, finalment "parlar en públic". " i la "resposta a la por" es desenredarà. La resposta de la por s'extingirà.

En conseqüència, la persona s'eliminarà de la por deparlar en públic. Hi ha dues maneres de fer-ho.

En primer lloc, exposa la persona a la situació temuda contínuament fins que la por disminueixi i, finalment, desapareix. Això s'anomena inundació i és un esdeveniment puntual.

Com a alternativa, la persona pot patir el que s'anomena desensibilització sistemàtica . La persona s'exposa gradualment als diferents graus de por durant un període de temps prolongat, cada nova situació és més difícil que l'anterior.

Limitacions del condicionament clàssic

El condicionament clàssic et pot portar a pensar que pots combinar qualsevol cosa amb qualsevol cosa. De fet, aquesta va ser una de les primeres suposicions dels teòrics que treballaven a la zona. L'anomenaven equipotencialitat . No obstant això, més tard es va saber que determinats estímuls s'aparellen més fàcilment amb determinats estímuls.1

En altres paraules, no es pot emparellar qualsevol estímul amb qualsevol altre estímul. És probable que estem "preparats biològicament" per generar respostes a certs tipus d'estímuls sobre d'altres.2

Per exemple, la majoria de nosaltres tenim por a les aranyes i aquesta resposta de por també es pot activar quan veiem un paquet de fils. confondre'l amb una aranya (generalització).

Aquest tipus de generalització rarament es produeix per als objectes inanimats. L'explicació evolutiva és que els nostres avantpassats tenien més motius per témer els objectes animats (depredadors, aranyes, serps) que els objectes inanimats.objectes.

El que això significa és que de vegades pots confondre un tros de corda amb una serp, però gairebé mai no confondràs una serp amb un tros de corda.

Condicionament operant

Mentre que el condicionament clàssic parla de com associem els esdeveniments, el condicionament operant parla de com associem el nostre comportament amb les seves conseqüències.

El condicionament operant ens indica la probabilitat que tenim de repetir un comportament basant-nos exclusivament en les seves conseqüències.

La conseqüència que fa que el teu comportament sigui més probable que es produeixi en el futur s'anomena reforç i la conseqüència que fa que el teu comportament sigui menys probable que es produeixi en el futur s'anomena càstig .

Per exemple, suposem que un nen treu bones notes a l'escola i els seus pares el recompensen comprant-li la seva consola de jocs preferida.

Ara, és més probable que també tingui un bon rendiment en proves futures. . Això es deu al fet que la consola de jocs és un reforç per fomentar més ocurrències futures d'un comportament determinat (treure bones notes).

Quan es ofereix alguna cosa desitjable a l'autor d'un comportament per augmentar la probabilitat d'aquest comportament en el futur, s'anomena reforç positiu .

Per tant, en l'exemple anterior, la consola de jocs és un reforç positiu i donar-la al nen és un reforç positiu.

No obstant això, el reforç positiu no és l'única manera en què la freqüència d'unun comportament particular es pot augmentar en el futur. Hi ha una altra manera en què els pares poden reforçar el comportament del nen per "treure bones notes".

Si el nen promet fer-ho bé en proves futures, els seus pares poden tornar-se menys estrictes i aixecar algunes restriccions que estaven imposada prèviament a ell.

Una d'aquestes regles indesitjables podria ser "jugar a videojocs un cop per setmana". Els pares poden suprimir aquesta regla i dir-li al nen que pot jugar a videojocs dues o potser tres vegades per setmana.

El nen, a canvi, ha de continuar rendint bé a l'escola i seguir "treu bones notes".

Aquest tipus de reforç, on es pren alguna cosa indesitjable (regla estricta) lluny de qui fa una conducta, s'anomena reforç negatiu .

Ho pots recordar d'aquesta manera: "positiu" sempre vol dir que se ofereix alguna cosa a l'autor d'un comportament i "negatiu" sempre significa que se treu alguna cosa

Tingueu en compte que en els dos casos anteriors de reforç positiu i negatiu, l'objectiu final del reforç és el mateix, és a dir, augmentar la probabilitat futura d'una conducta o reforçar la conducta (treure bones notes).

És només que podem proporcionar el reforç donant alguna cosa (+) o traient alguna cosa (-). Per descomptat, qui fa el comportament vol obtenir alguna cosa desitjable i vol desfer-se d'alguna cosaindesitjable.

Fer-los un d'aquests favors o els dos fa que sigui més probable que et compleixin i repeteixin el comportament que vols que repeteixin en el futur.

Fins ara, nosaltres" Hem comentat com funciona el reforç. Hi ha una altra manera de pensar sobre les conseqüències del comportament.

Càstig

Quan la conseqüència d'una conducta fa que la conducta menys es produeixi en el futur, la conseqüència s'anomena càstig . Per tant, el reforç augmenta la probabilitat d'un comportament en el futur mentre que el càstig la disminueix.

Continuant amb l'exemple anterior, per exemple, després d'un any més o menys, el nen comença a tenir un mal rendiment a les proves. Es va deixar portar i va dedicar més temps als videojocs que a estudiar.

Ara, aquest comportament (treure males notes) és una cosa que els pares volen menys en el futur. Volen disminuir la freqüència d'aquest comportament en el futur. Així que han d'utilitzar el càstig.

Un cop més, els pares poden utilitzar el càstig de dues maneres segons si donen alguna cosa (+) o li lleven alguna cosa (-) al nen per motivar-lo a disminuir el seu comportament ( treure males notes).

Aquesta vegada, els pares intenten desanimar el comportament del nen perquè li hagin de donar alguna cosa indesitjable o treure-li alguna cosa que sigui desitjable per al nen.

Si els pares tornen a imposar la regles estrictes sobre el nen, ells