Просте пояснення класичного та операторного кондиціонування

03-08-202303-08-2023 Thomas Sullivan

Зміст

Багато людей, включаючи студентів психології, викладачів і професіоналів, вважають концепції класичного і оперантного обумовлення заплутаними. Тому я вирішив надати просте пояснення процесів класичного і оперантного обумовлення. Це не може бути простіше, ніж те, що ви зараз прочитаєте.

Класичне та оперантне обумовлення - це два основні психологічні процеси, які пояснюють, як навчаються люди та інші тварини. Фундаментальна концепція, яка лежить в основі обох цих способів навчання, полягає в наступному об'єднання .

Простіше кажучи, наш мозок - це машина-асоціація. Ми пов'язуємо речі одна з одною, щоб пізнавати наш світ і приймати кращі рішення.

Якби у нас не було цієї базової здатності асоціювати, ми не змогли б нормально функціонувати у світі і вижити. Асоціація дозволяє нам швидко приймати рішення на основі мінімальної інформації.

Наприклад, коли ти випадково торкаєшся гарячої плити, ти відчуваєш біль і швидко відсмикуєш руку назад. Коли це відбувається, ти дізнаєшся, що "торкатися гарячої плити небезпечно". Оскільки ти маєш здатність до навчання, ти асоціюєш "гарячу плиту" з "болем" і намагаєшся з усіх сил уникати такої поведінки в майбутньому.

Якби у вас не виникла така асоціація (гаряча плита = біль), ви б, швидше за все, знову доторкнулися до гарячої плити, піддаючи себе більшому ризику обпекти руку.

Отже, нам корисно пов'язувати речі, щоб мати можливість вчитися. Класичне та оперантне обумовлювання - два способи, за допомогою яких ми формуємо такі зв'язки.

Що таке класичне кондиціонування?

Класичне обумовлювання було науково продемонстровано в знаменитих експериментах Івана Павлова, який проводив досліди зі слинотечею у собак. Він помітив, що його собаки виділяли слину не тільки тоді, коли їм давали їжу, але й тоді, коли дзвонили в дзвіночок безпосередньо перед тим, як їм давали їжу.

Як таке могло статися?

Слиновиділення, що виникає при вигляді або запаху їжі, має сенс. Ми теж так робимо, але чому собаки виділяють слину, коли чують дзвін дзвіночка?

Виявилося, що собаки асоціювали звук дзвіночка з їжею, тому що коли їм давали їжу, дзвіночок дзвонив майже одночасно. І це відбувалося достатню кількість разів, щоб собаки пов'язали "їжу" з "дзвіночком".

Дивіться також: 5 Різні типи дисоціації

У своїх експериментах Павлов виявив, що коли він давав їжу і дзвонив у дзвіночок одночасно багато разів, у собак виділялася слина, коли дзвонив дзвіночок, навіть якщо їжа не давалася.

Таким чином, собаки були "навчені" виділяти слину у відповідь на дзвінок. Іншими словами, собаки придбано умовна реакція.

Давайте почнемо все з самого початку, щоб ви могли ознайомитися з відповідними термінами.

Перед кондиціонуванням

Спочатку у собак виділялася слина, коли їм давали їжу - це нормальна реакція, яку зазвичай викликає пред'явлення їжі. Тут їжа - це безумовний стимул (США), а слиновиділення - це безумовна відповідь (UR).

Звичайно, використання терміну "безумовний" означає, що асоціація/обумовленість ще не відбулася.

Оскільки кондиціонування ще не відбулося, дзвінкий дзвіночок - це нейтральний стимул (НС), тому що він не викликає жодної реакції у собак, поки що.

Під час кондиціонування

Коли нейтральний стимул (дзвіночок) і безумовний стимул (їжа) повторюються разом, вони об'єднуються у свідомості собак.

Настільки, що нейтральний стимул (дзвіночок) сам по собі викликає такий самий ефект (слиновиділення), як і безумовний стимул (їжа).

Дивіться також: Пояснення формування стереотипів

Після того, як відбувається обумовлювання, дзвінок (раніше НС) стає умовним стимулом (УС), а слиновиділення (раніше УР) - умовною реакцією (УР).

Початковий етап, під час якого їжа (US) поєднується з дзвіночком (NS), називається придбання тому що собака перебуває в процесі набуття нової реакції (CR).

Після кондиціонування

Після привчання дзвіночок сам по собі викликає слиновиділення. З часом ця реакція має тенденцію до зменшення, оскільки дзвіночок і їжа більше не пов'язані між собою.

Іншими словами, зв'язок стає все слабшим і слабшим. Це називається вимирання умовної реакції.

Зверніть увагу, що сам по собі дзвін не здатен викликати слиновиділення, якщо він не поєднується з їжею, яка природно і автоматично викликає слиновиділення.

Отже, коли умовний стимул згасає, він знову стає нейтральним. По суті, спарювання дозволяє нейтральному стимулу тимчасово "запозичити" здатність безумовного стимулу викликати безумовну реакцію.

Після того, як умовна реакція згасла, вона може з'явитися знову після паузи. Це називається спонтанне відновлення .

Більш класичні приклади умов.

Узагальнення та дискримінація

У класичному обумовлення узагальнення стимулу - це тенденція організмів викликати умовну реакцію, коли вони піддаються впливу стимулів, які є подібний на умовний подразник.

Подумайте про це так: розум схильний сприймати схожі речі як однакові. Тому собаки Павлова, навіть якщо вони були навчені слинитись, коли чули дзвін дзвіночка, можуть також слинитись у відповідь на інші об'єкти зі схожим звучанням.

Якби після навчання у собак Павлова виділялася слина на дзвін пожежної сигналізації, велосипедне кільце або навіть на постукування по скляному листу, це було б прикладом узагальнення.

Всі ці стимули, хоч і різні, звучать схоже один на одного і на умовний стимул (дзвін дзвіночка). Коротше кажучи, мозок собаки сприймає ці різні стимули як один і той самий, викликаючи одну і ту ж умовну реакцію.

Це пояснює, чому, наприклад, ви можете почуватися некомфортно поруч із незнайомцем, якого ніколи раніше не зустрічали. Можливо, риси його обличчя, хода, голос або манера говорити нагадують вам людину, яку ви ненавиділи в минулому.

Здатність собак Павлова відрізняти ці узагальнені стимули від інших нерелевантних стимулів у навколишньому середовищі називається дискримінація Таким чином, стимули, які не є узагальненими, дискримінуються від усіх інших стимулів.

Фобії та класичне кондиціонування

Якщо ми розглядаємо страхи і фобії як умовні реакції, ми можемо застосувати класичні принципи навчання, щоб ці реакції зникли.

Наприклад, людина, яка боїться публічних виступів, можливо, спочатку мала кілька невдалих спроб виступити перед публікою.

Страх і дискомфорт, які вони відчували, і дія "встати, щоб говорити" об'єдналися таким чином, що тепер сама думка про те, щоб встати і говорити, викликає реакцію страху.

Якщо ця людина буде частіше виступати, незважаючи на початковий страх, то врешті-решт "виступати на публіці" і "реакція страху" будуть розплутані. Реакція страху відійде на другий план.

Отже, людина позбудеться страху публічних виступів. Зробити це можна двома способами.

По-перше, постійно піддавайте людину ситуації, якої вона боїться, до тих пір, поки страх не зменшиться і, зрештою, не зникне. Це називається затоплення і є одноразовою подією.

Крім того, людина може пройти так звану систематична десенсибілізація Людина поступово піддається різним ступеням страху протягом тривалого періоду часу, причому кожна нова ситуація є складнішою за попередню.

Обмеження класичного кондиціонування

Класичне обумовлення може наштовхнути вас на думку, що ви можете поєднати будь-що з будь-чим. Насправді, це було одним з перших припущень теоретиків, які працювали в цій галузі. Вони називали це еквіпотенційність Однак пізніше стало відомо, що певні стимули легше поєднуються з певними стимулами.1

Іншими словами, ви не можете просто поєднати будь-який стимул з будь-яким іншим стимулом. Ми, ймовірно, "біологічно підготовлені" до того, щоб генерувати реакції на певні види стимулів, а не на інші.2

Наприклад, більшість з нас боїться павуків, і ця реакція страху може також спрацьовувати, коли ми бачимо моток ниток, приймаючи його за павука (узагальнення).

Такий тип узагальнення рідко трапляється для неживих об'єктів. Еволюційне пояснення полягає в тому, що наші предки мали більше причин боятися живих об'єктів (хижаків, павуків, змій), ніж неживих.

Це означає, що іноді ви можете сплутати шматок мотузки зі змією, але ви навряд чи коли-небудь сплутаєте змію зі шматком мотузки.

Операторське кондиціонування

У той час як класичне обумовлення говорить про те, як ми пов'язуємо події, оперантне обумовлення говорить про те, як ми пов'язуємо нашу поведінку з її наслідками.

Оперантне обумовлення показує нам, наскільки ймовірно, що ми повторимо поведінку, ґрунтуючись виключно на її наслідках.

Наслідок, який робить вашу поведінку більш імовірною в майбутньому, називається армування а наслідок, який робить вашу поведінку менш імовірною в майбутньому, називається покарання .

Наприклад, скажімо, дитина отримує гарні оцінки в школі, і батьки заохочують її, купуючи їй улюблену ігрову приставку.

Тепер він з більшою ймовірністю буде добре виконувати майбутні тести. Це тому, що ігрова приставка є підкріпленням, яке заохочує більше проявів певної поведінки в майбутньому (отримання хороших оцінок).

Коли щось бажане є з огляду на до виконавця певної поведінки, щоб підвищити ймовірність такої поведінки в майбутньому, називається позитивне підкріплення .

Отже, у наведеному вище прикладі ігрова приставка є позитивним підкріпленням, і дарування її дитині є позитивним підкріпленням.

Однак позитивне підкріплення - не єдиний спосіб, за допомогою якого можна збільшити частоту певної поведінки в майбутньому. Існує ще один спосіб, за допомогою якого батьки можуть підкріпити поведінку дитини, що полягає в тому, щоб вона отримувала гарні оцінки.

Якщо дитина пообіцяє добре впоратися з майбутніми тестами, батьки можуть стати менш суворими і зняти деякі обмеження, які були накладені на неї раніше.

Одним з таких небажаних правил може бути "грати у відеоігри один раз на тиждень". Батьки можуть відмовитися від цього правила і сказати дитині, що вона може грати у відеоігри двічі або тричі на тиждень.

Натомість дитина повинна продовжувати добре вчитися в школі і продовжувати "отримувати хороші оцінки".

Цей тип підкріплення, коли щось небажане (суворе правило) є забрали від виконавця поведінки, називається негативне підкріплення .

Ви можете запам'ятати це так: "позитивний" завжди означає, що щось є з огляду на до виконавця поведінки, а "негативний" завжди означає, що щось є забрали від них.

Зауважте, що в обох наведених вище випадках позитивного і негативного підкріплення кінцева мета підкріплення однакова, тобто збільшення ймовірності поведінки в майбутньому або посилення поведінки (отримання хороших оцінок).

Просто ми можемо забезпечити підкріплення, або даючи щось (+), або забираючи щось (-). Звичайно, виконавець поведінки хоче отримати щось бажане і хоче позбутися чогось небажаного.

Надаючи їм одну або обидві ці послуги, ви підвищуєте ймовірність того, що вони підкорятимуться вам і повторюватимуть поведінку, яку ви хочете, щоб вони повторювали в майбутньому.

Досі ми обговорювали, як працює підкріплення. Але є й інший спосіб подумати про наслідки поведінки.

Покарання

Коли наслідок поведінки робить поведінку поведінкою менше ймовірно, відбудеться в майбутньому, то наслідок називається покарання Таким чином, підкріплення збільшує ймовірність поведінки в майбутньому, тоді як покарання зменшує її.

Продовжуючи наведений вище приклад, скажімо, через рік або близько того дитина починає погано виконувати тести. Вона захопилася і приділяє більше часу відеоіграм, ніж навчанню.

Тепер така поведінка (отримання поганих оцінок) - це те, чого батьки не хочуть бачити в майбутньому. Вони хочуть зменшити частоту такої поведінки в майбутньому. Тому їм доводиться застосовувати покарання.

Знову ж таки, батьки можуть використовувати покарання двома способами, залежно від того, чи дають вони щось (+), чи забирають (-) у дитини, щоб мотивувати її покращити свою поведінку (отримання поганих оцінок).

Цього разу батьки намагаються перешкодити поведінці дитини, тому їм доводиться давати їй щось небажане або забирати щось бажане для малюка.

Якщо батьки повторно нав'язують дитині суворі правила, вони дарування щось, що він вважає небажаним. Отже, це буде позитивне покарання .

Якщо батьки забирають у дитини ігрову приставку і замикають її в кабіні, вони забираючи те, що дитина вважає бажаним. Це негативне покарання.

Щоб пам'ятати, який тип заохочення чи покарання застосовується, завжди тримайте в голові виконавця поведінки. Саме його поведінку ми хочемо покращити чи погіршити, застосовуючи заохочення чи покарання відповідно.

Крім того, пам'ятайте про те, чого бажає виконавець тієї чи іншої поведінки. Таким чином, ви зможете визначити, чи є давання чогось і забирання чогось підкріпленням або покаранням.

Послідовне наближення та формування

Ви коли-небудь бачили, як собаки та інші тварини виконують складні трюки за командами своїх господарів? Ці тварини навчаються за допомогою оперантного обумовлення.

Ви можете змусити собаку перестрибнути перешкоду, якщо після стрибка (поведінки) собака отримає ласощі (позитивне підкріплення). Це простий трюк. Собака навчився стрибати за вашою командою.

Ви можете продовжувати цей процес, послідовно даючи собаці все більше заохочень, доки він не наблизиться до бажаної складної поведінки. Це називається послідовне наближення .

Припустимо, ви хочете, щоб собака зробив спринт відразу після стрибка. Ви повинні винагородити собаку після стрибка, а потім після спринту. Зрештою, ви можете відмовитися від початкової винагороди (після стрибка) і винагороджувати собаку тільки тоді, коли він виконує послідовність стрибок + спринт.

Повторюючи цей процес, ви можете навчити собаку стрибати + спринт + бігти і так далі за один раз. Цей процес називається шейпінг .3

Це відео демонструє формування складної поведінки у сибірського хаскі:

Графіки посилення

В оперантному обумовлення підкріплення збільшує силу реакції (з більшою ймовірністю, що вона відбудеться в майбутньому). Спосіб надання підкріплення (графік підкріплення) впливає на силу реакції.4

Ви можете підкріплювати поведінку щоразу, коли вона відбувається (безперервне підкріплення), або підкріплювати її час від часу (часткове підкріплення).

Хоча часткове підкріплення потребує часу, вироблена реакція є досить стійкою до вимирання.

Давати дитині цукерку щоразу, коли вона добре склала іспит, буде постійним підкріпленням. З іншого боку, давати їй цукерку час від часу, але не щоразу, коли вона добре склала іспит, буде частковим підкріпленням.

Існують різні типи графіків часткового або переривчастого армування, залежно від того, коли ми надаємо армування.

Коли ми надаємо підкріплення після фіксованої кількості повторень певної поведінки, це називається фіксоване співвідношення .

Наприклад, давати дитині цукерку щоразу, коли вона добре склала три іспити. Потім знову винагороджувати її після того, як вона добре склала три іспити, і так далі (фіксована кількість разів, коли поведінка здійснюється = 3).

Коли підкріплення надається через фіксований проміжок часу, це називається з фіксованим інтервалом графік підкріплень.

Наприклад, давати дитині цукерки щонеділі буде графіком підкріплення з фіксованим інтервалом (фіксований часовий інтервал = 7 днів).

Це були приклади фіксованих графіків армування. Графік армування також може бути змінним.

Коли підкріплення дається після того, як поведінка повторюється непередбачувану кількість разів, це називається співвідношення змінних графік підкріплень.

Наприклад, давати дитині цукерку після того, як вона добре набрала 2, 4, 7 і 9 разів. Зверніть увагу, що 2, 4, 7 і 9 - це випадкові числа. Вони не з'являються через фіксований проміжок часу, як у графіку підкріплення з фіксованим співвідношенням (3, 3, 3 і так далі).

Коли підкріплення дається через непередбачувані проміжки часу, воно називається змінна-інтервал графік підкріплень.

Наприклад, дати дитині цукерку через 2 дні, потім через 3 дні, через 1 день і т.д. Тут немає фіксованого часового інтервалу, як у випадку з графіком підкріплення з фіксованим інтервалом (7 днів).

Загалом, змінні підкріплення викликають сильнішу реакцію, ніж фіксовані. Це може бути пов'язано з відсутністю фіксованих очікувань щодо отримання винагороди, що змушує нас думати, що ми можемо отримати винагороду в будь-який час. Це може викликати сильне звикання.

Сповіщення в соціальних мережах є гарним прикладом змінного підкріплення. Ви не знаєте, коли (змінна-інтервал) і після скількох перевірок (змінна-співвідношення) ви отримаєте сповіщення (підкріплення).

Тож ви, швидше за все, продовжуватимете перевіряти свій акаунт (підкріплена поведінка), очікуючи на сповіщення.

Посилання:

Оман, А., Фредріксон, М., Гугдал, К., Рімме, П. А. (1976). Передумова еквіпотенційності в класичному обумовлення людини: умовні електродермальні реакції на потенційно фобічні стимули. Журнал експериментальної психології: Загальні питання , 105 (4), 313.
Макнеллі, Р. Дж. (2016). Спадщина "фобій і готовності" Селігмана (1971). Поведінкова терапія , 47 (5), 585-594.
Петерсон, Г. Б. (2004) День великого осяяння: відкриття шейпінгу Б. Ф. Скіннера. Журнал експериментального аналізу поведінки , 82 (3), 317-328.
Ферстер, К. Б. та Скіннер, Б. Ф. (1957). Графіки армування.