Une explication simple du conditionnement classique et du conditionnement opérant

03-08-202303-08-2023 Thomas Sullivan

Table des matières

De nombreuses personnes, y compris des étudiants en psychologie, des enseignants et des professionnels, trouvent les concepts de conditionnement classique et opérant déroutants. J'ai donc décidé de fournir une explication simple des processus de conditionnement classique et opérant. Il n'y a rien de plus simple que ce que vous êtes sur le point de lire.

Le conditionnement classique et le conditionnement opérant sont deux processus psychologiques fondamentaux qui expliquent comment les êtres humains et les autres animaux apprennent. association .

En d'autres termes, notre cerveau est une machine à associer. Nous associons les choses les unes aux autres afin d'apprendre à connaître notre monde et de prendre de meilleures décisions.

Si nous n'avions pas cette capacité fondamentale d'association, nous ne pourrions pas fonctionner normalement dans le monde et survivre. L'association nous permet de prendre des décisions rapides sur la base d'un minimum d'informations.

Par exemple, lorsque vous touchez accidentellement une cuisinière chaude, vous ressentez une douleur et retirez rapidement votre bras. Vous apprenez alors que "toucher une cuisinière chaude est dangereux". Parce que vous avez cette capacité d'apprentissage, vous associez la "cuisinière chaude" à la "douleur" et vous faites de votre mieux pour éviter ce comportement à l'avenir.

Si vous n'aviez pas fait cette association (cuisinière chaude = douleur), vous auriez probablement touché à nouveau une cuisinière chaude, vous exposant ainsi à un risque accru de brûlure de la main.

Le conditionnement classique et le conditionnement opérant sont deux façons d'établir de telles connexions.

Qu'est-ce que le conditionnement classique ?

Le conditionnement classique a été scientifiquement démontré par les célèbres expériences menées par Ivan Pavlov sur des chiens salivants. Il a remarqué que ses chiens salivaient non seulement lorsqu'on leur présentait de la nourriture, mais aussi lorsqu'une cloche retentissait juste avant la présentation de la nourriture.

Comment cela est-il possible ?

La salivation résultant de l'observation ou de l'odeur de la nourriture est logique. Nous le faisons aussi, mais pourquoi les chiens saliveraient-ils en entendant une cloche sonner ?

Il s'est avéré que les chiens avaient associé le son de la cloche à la nourriture, car lorsqu'on leur donnait de la nourriture, la cloche sonnait presque en même temps. Et cela s'était produit suffisamment de fois pour que les chiens associent la "nourriture" au "son de la cloche".

Dans ses expériences, Pavlov a constaté que lorsqu'il présentait de la nourriture et faisait sonner la cloche simultanément à plusieurs reprises, les chiens salivaient lorsque la cloche sonnait, même si aucune nourriture ne leur était présentée.

Ainsi, les chiens ont été "conditionnés" à saliver en entendant la cloche. En d'autres termes, les chiens acquis une réponse conditionnée.

Reprenons tout depuis le début afin de vous familiariser avec les termes utilisés.

Avant le conditionnement

Au départ, les chiens salivaient lors de la présentation de la nourriture, une réaction normale que la présentation de la nourriture entraîne généralement. stimulus non conditionné (US) et la salivation est le réponse inconditionnelle (UR).

Bien entendu, l'utilisation du terme "non conditionné" indique qu'aucune association/conditionnement n'a encore eu lieu.

Puisque le conditionnement n'a pas encore eu lieu, la sonnerie est une stimulus neutre (NS) parce qu'il ne produit aucune réaction chez les chiens, pour l'instant.

Pendant le conditionnement

Lorsque le stimulus neutre (la sonnerie) et le stimulus non conditionné (la nourriture) sont présentés de manière répétée aux chiens, ils sont associés dans l'esprit des chiens.

À tel point que le stimulus neutre (la sonnerie) produit à lui seul le même effet (salivation) que le stimulus non conditionné (la nourriture).

Après le conditionnement, la sonnerie de la cloche (précédemment NS) devient le stimulus conditionné (CS) et la salivation (précédemment UR) devient la réponse conditionnée (CR).

L'étape initiale au cours de laquelle la nourriture (US) est associée à la cloche qui sonne (NS) est appelée acquisition parce que le chien est en train d'acquérir une nouvelle réponse (CR).

Après conditionnement

Après le conditionnement, la sonnerie seule induit la salivation. Avec le temps, cette réponse tend à diminuer parce que la sonnerie et la nourriture ne sont plus associées.

En d'autres termes, l'appariement devient de plus en plus faible, c'est ce que l'on appelle la extinction de la réponse conditionnée.

Il est à noter que le son de la cloche, en soi, ne peut déclencher la salivation que s'il est associé à un aliment qui déclenche naturellement et automatiquement la salivation.

Voir également: Test de personnalité addictive : découvrez votre score

Ainsi, lors de l'extinction, le stimulus conditionné redevient un stimulus neutre. En substance, l'appariement permet au stimulus neutre d'"emprunter" temporairement la capacité d'un stimulus non conditionné à induire une réponse non conditionnée.

Une fois qu'une réponse conditionnée a disparu, elle peut réapparaître après une pause. C'est ce qu'on appelle la récupération spontanée .

Autres exemples de conditionnement classique.

Généralisation et discrimination

Dans le conditionnement classique, la généralisation du stimulus est la tendance des organismes à susciter la réponse conditionnée lorsqu'ils sont exposés à des stimuli qui sont similaire au stimulus conditionné.

Ainsi, les chiens de Pavlov, même s'ils ont été conditionnés pour saliver en entendant une cloche particulière, peuvent également saliver en réponse à d'autres objets à la sonorité similaire.

Si, après conditionnement, les chiens de Pavlov salivaient à la vue d'une alarme incendie qui retentit, d'une sonnerie de vélo ou même de feuilles de verre qui claquent, il s'agirait d'un exemple de généralisation.

Tous ces stimuli, bien que différents, sont similaires les uns aux autres et au stimulus conditionné (la sonnerie). En bref, l'esprit du chien perçoit ces différents stimuli comme étant les mêmes, ce qui génère la même réponse conditionnée.

Cela explique pourquoi, par exemple, vous pouvez vous sentir mal à l'aise en présence d'un inconnu que vous n'avez jamais rencontré, parce que les traits de son visage, sa démarche, sa voix ou sa façon de parler vous rappellent une personne que vous avez détestée dans le passé.

La capacité des chiens de Pavlov à faire la distinction entre ces stimuli généralisés et d'autres stimuli non pertinents dans l'environnement est appelée discrimination Ainsi, les stimuli qui ne sont pas généralisés sont discriminés de tous les autres stimuli.

Phobies et conditionnement classique

Si nous considérons les peurs et les phobies comme des réponses conditionnées, nous pouvons appliquer les principes du conditionnement classique pour faire disparaître ces réponses.

Par exemple, une personne qui a peur de parler en public peut avoir eu quelques mauvaises expériences lorsqu'elle s'est levée pour parler en public.

La peur et l'inconfort qu'ils ont ressentis et l'action de "se lever pour parler" ont été associés de telle sorte que l'idée de se lever pour parler à elle seule génère maintenant une réaction de peur.

Si cette personne se lève plus souvent pour prendre la parole, malgré sa peur initiale, la "prise de parole en public" et la "réaction de peur" finiront par se démêler. La réaction de peur s'éteindra.

En conséquence, la personne se débarrassera de sa peur de parler en public. Il y a deux façons d'y parvenir.

Premièrement, exposer la personne à la situation redoutée de manière continue jusqu'à ce que la peur diminue et finisse par disparaître. C'est ce que l'on appelle inondation et est un événement unique.

La personne peut également subir ce que l'on appelle une désensibilisation systématique La personne est progressivement exposée aux différents degrés de peur sur une longue période, chaque nouvelle situation étant plus difficile que la précédente.

Limites du conditionnement classique

Le conditionnement classique peut vous amener à penser que l'on peut associer n'importe quoi avec n'importe quoi. C'est d'ailleurs l'une des premières hypothèses des théoriciens travaillant dans ce domaine. Ils l'ont appelée équipotentialité Cependant, on a appris plus tard que certains stimuli sont plus facilement associés à d'autres stimuli.1

En d'autres termes, il n'est pas possible d'associer n'importe quel stimulus à n'importe quel autre stimulus. Nous sommes probablement "biologiquement préparés" à réagir à certains types de stimuli plutôt qu'à d'autres.2

Par exemple, la plupart d'entre nous ont peur des araignées et cette réaction de peur peut également se déclencher lorsque nous voyons un faisceau de fils, le prenant pour une araignée (généralisation).

Ce type de généralisation se produit rarement pour les objets inanimés. L'explication évolutive est que nos ancêtres avaient plus de raisons de craindre les objets animés (prédateurs, araignées, serpents) que les objets inanimés.

Cela signifie que vous pouvez parfois confondre un morceau de corde avec un serpent, mais que vous ne confondrez presque jamais un serpent avec un morceau de corde.

Conditionnement opérant

Alors que le conditionnement classique traite de la manière dont nous associons des événements, le conditionnement opérant traite de la manière dont nous associons notre comportement à ses conséquences.

Le conditionnement opérant nous indique dans quelle mesure nous sommes susceptibles de répéter un comportement en fonction de ses seules conséquences.

La conséquence qui rend votre comportement plus probable à l'avenir est appelée renforcement et la conséquence qui rend votre comportement moins probable à l'avenir est appelée punition .

Par exemple, si un enfant obtient de bonnes notes à l'école et que ses parents le récompensent en lui achetant sa console de jeux préférée.

En effet, la console de jeu est un renforcement qui encourage la répétition d'un comportement particulier (obtenir de bonnes notes).

Lorsque quelque chose de désirable est donné à l'auteur d'un comportement afin d'augmenter la probabilité de ce comportement à l'avenir, il est appelé le renforcement positif .

Ainsi, dans l'exemple ci-dessus, la console de jeu est un renforçateur positif et le fait de la donner à l'enfant est un renforcement positif.

Toutefois, le renforcement positif n'est pas le seul moyen d'augmenter la fréquence d'un comportement particulier à l'avenir. Il existe une autre façon pour les parents de renforcer le comportement "obtenir de bonnes notes" de l'enfant.

Si l'enfant promet de bien réussir les prochains tests, ses parents peuvent devenir moins stricts et lever certaines restrictions qui lui étaient imposées auparavant.

L'une de ces règles indésirables pourrait être "jouer aux jeux vidéo une fois par semaine". Les parents peuvent supprimer cette règle et dire à l'enfant qu'il peut jouer aux jeux vidéo deux ou trois fois par semaine.

En contrepartie, l'enfant doit continuer à bien travailler à l'école et à obtenir de bonnes notes.

Ce type de renforcement, où quelque chose d'indésirable (règle stricte) est enlevé de l'auteur d'un comportement, est appelé le renforcement négatif .

Vous pouvez vous en souvenir de la manière suivante : "positif" signifie toujours que quelque chose est... donné à l'auteur d'un comportement et "négatif" signifie toujours qu'il y a quelque chose qui ne va pas. enlevé de leur part.

Il convient de noter que dans les deux cas de renforcement positif et négatif mentionnés ci-dessus, l'objectif final du renforcement est le même, à savoir augmenter la probabilité future d'un comportement ou renforcer le comportement (obtenir de bonnes notes).

Bien entendu, l'auteur du comportement souhaite obtenir quelque chose de désirable et se débarrasser de quelque chose d'indésirable.

En leur accordant l'une ou l'autre de ces faveurs, vous augmentez les chances qu'ils vous obéissent et qu'ils adoptent le comportement que vous souhaitez qu'ils adoptent à l'avenir.

Nous avons vu jusqu'à présent comment fonctionne le renforcement, mais il existe une autre façon d'envisager les conséquences d'un comportement.

La punition

Lorsque la conséquence d'un comportement rend le comportement moins susceptible de se produire dans le futur, la conséquence est appelée punition Ainsi, le renforcement augmente la probabilité d'un comportement à l'avenir, tandis que la punition la diminue.

Pour reprendre l'exemple précédent, disons qu'au bout d'un an environ, l'enfant commence à avoir de mauvais résultats aux examens. Il s'est laissé emporter et a consacré plus de temps aux jeux vidéo qu'à l'étude.

Or, ce comportement (avoir de mauvaises notes) est quelque chose que les parents veulent voir diminuer à l'avenir. Ils veulent réduire la fréquence de ce comportement à l'avenir. Ils doivent donc recourir à la punition.

Là encore, les parents peuvent utiliser la punition de deux manières, selon qu'ils donnent quelque chose (+) ou retirent quelque chose (-) à l'enfant pour le motiver à diminuer son comportement (avoir de mauvaises notes).

Cette fois, les parents essaient de décourager le comportement de l'enfant et doivent donc lui donner quelque chose d'indésirable ou lui retirer quelque chose de désirable.

Si les parents réimposent des règles strictes à l'enfant, ils sont donner Il s'agira donc d'un moyen d'améliorer la qualité de la vie de l'enfant. punition positive .

Si les parents retirent la console de jeux de l'enfant et l'enferment dans une cabane, ils sont enlèvement Il s'agit d'une punition négative.

Pour savoir quel type de renforcement ou de punition est appliqué, il faut toujours garder à l'esprit l'auteur du comportement. C'est son comportement que nous voulons augmenter ou diminuer à l'aide de renforcements ou de punitions respectivement.

Gardez également à l'esprit ce que l'auteur d'un comportement désire. De cette façon, vous pouvez déterminer si le fait de donner ou de retirer quelque chose constitue un renforcement ou une punition.

Voir également: Test du complexe d'infériorité (20 questions)

Approximation et mise en forme successives

Avez-vous déjà vu des chiens ou d'autres animaux exécuter des tours complexes sur l'ordre de leur maître ? Ces animaux sont entraînés par le biais du conditionnement opérant.

Vous pouvez faire sauter un chien par-dessus un obstacle si, après avoir sauté (comportement), le chien reçoit une friandise (renforcement positif). Il s'agit d'une astuce simple. Le chien a appris à sauter sur votre ordre.

Vous pouvez poursuivre ce processus en donnant successivement plus de récompenses au chien jusqu'à ce qu'il se rapproche de plus en plus du comportement complexe souhaité. C'est ce qu'on appelle approximation successive .

Supposons que vous vouliez que le chien fasse un sprint juste après avoir sauté. Vous devez récompenser le chien après qu'il ait sauté, puis après qu'il ait fait un sprint. Finalement, vous pouvez supprimer la récompense initiale (après le saut) et ne récompenser le chien que lorsqu'il exécute la séquence de comportement saut + sprint.

En répétant ce processus, vous pouvez entraîner votre chien à sauter, sprinter, courir, etc. en une seule fois. Ce processus est appelé façonnage .3

Cette vidéo montre l'élaboration d'un comportement complexe chez un Husky sibérien :

Calendrier de renforcement

Dans le conditionnement opérant, le renforcement augmente la force d'une réponse (plus susceptible de se produire à l'avenir). La manière dont le renforcement est fourni (calendrier de renforcement) influe sur la force de la réponse.4

Vous pouvez renforcer un comportement à chaque fois qu'il se manifeste (renforcement continu) ou le renforcer de temps en temps (renforcement partiel).

Bien que le renforcement partiel prenne du temps, la réponse développée est assez résistante à l'extinction.

Donner un bonbon à un enfant chaque fois qu'il obtient une bonne note à un examen constituerait un renforcement continu, tandis que lui donner un bonbon quelquefois, mais pas chaque fois qu'il obtient une bonne note, constituerait un renforcement partiel.

Il existe différents types de programmes de renforcement partiel ou intermittent en fonction du moment où le renforcement est fourni.

Lorsque nous fournissons le renforcement après un nombre fixe de fois qu'un comportement est adopté, on parle de rapport fixe .

Par exemple, donner des bonbons à l'enfant chaque fois qu'il obtient de bons résultats à trois examens, puis le récompenser à nouveau après qu'il a obtenu de bons résultats à trois examens, et ainsi de suite (nombre fixe de fois qu'un comportement est adopté = 3).

Lorsque le renforcement est fourni après un intervalle de temps fixe, on parle de intervalle fixe calendrier de renforcement.

Par exemple, donner des bonbons à l'enfant tous les dimanches serait un programme de renforcement à intervalle fixe (intervalle de temps fixe = 7 jours).

Il s'agit là d'exemples de programmes de renforcement fixes. Le programme de renforcement peut également être variable.

Lorsqu'un renforcement est accordé après qu'un comportement a été répété un nombre imprévisible de fois, on parle de rapport variable calendrier de renforcement.

Par exemple, donner un bonbon à l'enfant qui a obtenu un bon score 2, 4, 7 et 9 fois. Notez que 2, 4, 7 et 9 sont des nombres aléatoires. Ils ne se produisent pas après un intervalle fixe comme dans un programme de renforcement à ratio fixe (3, 3, 3, et ainsi de suite).

Lorsque le renforcement est donné après des intervalles de temps imprévisibles, on parle de variable-intervalle calendrier de renforcement.

Par exemple, donner un bonbon à l'enfant après 2 jours, puis après 3 jours, puis après 1 jour et ainsi de suite. Il n'y a pas d'intervalle de temps fixe comme dans le cas d'un schéma de renforcement à intervalle fixe (7 jours).

En général, les renforcements variables génèrent une réponse plus forte que les renforcements fixes. Cela peut s'expliquer par le fait qu'il n'y a pas d'attentes fixes quant à l'obtention des récompenses, ce qui nous fait penser que nous pouvons obtenir la récompense à tout moment. Cela peut créer une forte dépendance.

Les notifications des médias sociaux sont un bon exemple de renforcements variables. Vous ne savez pas quand (intervalle variable) et après combien de vérifications (ratio variable) vous recevrez une notification (renforcement).

Il est donc probable que vous continuiez à consulter votre compte (comportement renforcé) dans l'espoir de recevoir une notification.

Références :

Öhman, A., Fredrikson, M., Hugdahl, K., & ; Rimmö, P. A. (1976). The premise of equipotentiality in human classical conditioning : conditioned electrodermal responses to potentially phobic stimuli. Journal of Experimental Psychology : Général , 105 (4), 313.
McNally, R. J. (2016), The legacy of Seligman's "phobias and preparedness" (1971). Thérapie comportementale , 47 (5), 585-594.
Peterson, G. B. (2004), A day of great illumination : BF Skinner's discovery of shaping (Un jour de grande illumination : la découverte du façonnage par BF Skinner). Journal de l'analyse expérimentale du comportement , 82 (3), 317-328.
Ferster, C. B., & ; Skinner, B. F. (1957), Schedules of reinforcement.