Простое объяснение классического и оперантного обусловливания

03-08-202303-08-2023 Thomas Sullivan

Оглавление

Многие люди, включая студентов-психологов, преподавателей и профессионалов, находят понятия классического и оперантного обусловливания запутанными. Поэтому я решил дать простое объяснение процессов классического и оперантного обусловливания. Это не может быть проще, чем то, что вы сейчас прочитаете.

Классическое и оперантное обусловливание - два основных психологических процесса, объясняющих, как человек и другие животные обучаются. Фундаментальная концепция, лежащая в основе обоих этих способов обучения, - это ассоциация .

Проще говоря, наш мозг - это ассоциативная машина. Мы связываем вещи друг с другом, чтобы познавать наш мир и принимать лучшие решения.

Если бы у нас не было этой базовой способности к ассоциации, мы не смогли бы нормально функционировать в мире и выжить. Ассоциация позволяет нам быстро принимать решения на основе минимальной информации.

Например, когда вы случайно прикасаетесь к горячей плите, вы чувствуете боль и быстро отдергиваете руку. Когда это происходит, вы узнаете, что "прикасаться к горячей плите опасно". Поскольку вы обладаете такой способностью к обучению, вы ассоциируете "горячую плиту" с "болью" и стараетесь изо всех сил избегать такого поведения в будущем.

Если бы у Вас не сформировалась такая ассоциация (горячая плита = боль), Вы, скорее всего, снова прикоснулись бы к горячей плите, подвергая себя большему риску обжечь руку.

Классическое и оперантное обусловливание - два способа формирования таких связей.

Что такое классическое обусловливание?

Классическое обусловливание было научно продемонстрировано в знаменитых экспериментах И.П. Павлова со слюноотделением у собак. Он заметил, что у его собак слюна выделялась не только при предъявлении им пищи, но и при звонке в колокольчик непосредственно перед ее предъявлением.

Как такое может быть?

Слюноотделение, возникающее при виде или запахе пищи, вполне логично. Мы тоже так делаем, но зачем собакам слюноотделение при звонке?

Оказалось, что собаки ассоциировали звук звонка с едой, потому что когда им давали еду, колокольчик звонил почти одновременно. И это происходило достаточное количество раз, чтобы собаки связали "еду" со "звонком".

Павлов в своих экспериментах обнаружил, что при одновременном многократном предъявлении пищи и звонке в колокольчик у собак выделялось слюноотделение при звонке, даже если пища не предъявлялась.

Таким образом, собаки были "обусловлены" слюноотделением в ответ на звонок. Другими словами, собаки приобретено условная реакция.

Давайте начнем все с самого начала, чтобы вы могли ознакомиться с соответствующими терминами.

Перед кондиционированием

Вначале у собак выделялось слюноотделение при предъявлении корма - нормальная реакция, которую обычно вызывает предъявление корма. В данном случае корм - это необусловленный стимул (США), а слюноотделение - это необусловленная реакция (UR).

Конечно, использование термина "необусловленный" означает, что никаких ассоциаций/обусловленности еще не произошло.

Поскольку кондиционирование еще не наступило, звон колокольчика - это нейтральный стимул (NS), поскольку пока не вызывает у собак никакой реакции.

Во время кондиционирования

Когда нейтральный стимул (звонок) и необусловленный стимул (пища) многократно предъявляются собакам вместе, в их сознании возникает пара.

Настолько, что нейтральный стимул (звонок) сам по себе вызывает такой же эффект (слюноотделение), как и необусловленный стимул (пища).

После обусловливания звонок (ранее NS) становится условным стимулом (CS), а слюноотделение (ранее UR) - условной реакцией (CR).

Начальный этап, на котором пища (US) сопрягается со звонком (NS), называется приобретение потому что собака находится в процессе приобретения новой реакции (CR).

После кондиционирования

После обусловливания один только звонок вызывает слюноотделение. Со временем эта реакция уменьшается, поскольку звонок и пища перестают быть парой.

Другими словами, пара становится все слабее и слабее. Это называется вымирание условной реакции.

Заметим, что звонок сам по себе бессилен вызвать слюноотделение, если он не используется в паре с пищей, которая естественно и автоматически вызывает слюноотделение.

Таким образом, когда происходит угасание, условный стимул снова становится нейтральным. По сути, сопряжение позволяет нейтральному стимулу временно "заимствовать" способность безусловного стимула вызывать безусловную реакцию.

После того как условная реакция угасла, она может появиться вновь после паузы. Это называется спонтанное восстановление .

Другие примеры классического обусловливания.

Обобщение и дискриминация

В классическом обусловливании генерализация стимулов - это тенденция организмов вызывать условную реакцию при воздействии на них стимулов, которые аналогичный на условный стимул.

Подумайте об этом так: разум склонен воспринимать схожие вещи как одинаковые. Так, собаки Павлова, даже если они были приучены выделять слюну, услышав определенный звонок, могут также выделять слюну в ответ на другие схожие по звучанию предметы.

Если бы после кондиционирования у собак Павлова слюна выделялась при воздействии на них звонка пожарной сигнализации, велосипедного звонка или даже стука стеклянных листов, то это было бы примером генерализации.

Все эти стимулы, несмотря на их различие, похожи друг на друга и на условный стимул (звонок). Короче говоря, мозг собаки воспринимает эти разные стимулы как один и тот же, порождая одну и ту же условную реакцию.

Это объясняет, почему, например, вы можете чувствовать себя неуютно рядом с незнакомым человеком, который вам никогда не встречался. Возможно, его черты лица, походка, голос или манера говорить напоминают вам человека, которого вы ненавидели в прошлом.

Способность собак Павлова отличать эти обобщенные стимулы от других нерелевантных стимулов в окружающей среде называется дискриминация Следовательно, стимулы, не являющиеся обобщенными, отличаются от всех других стимулов.

Фобии и классическое обусловливание

Если рассматривать страхи и фобии как обусловленные реакции, то можно применить принципы классического обусловливания для того, чтобы эти реакции исчезли.

Например, человек, который боится публичных выступлений, может иметь несколько неудачных опытов, когда ему приходилось выступать на публике.

Страх и дискомфорт, которые они испытывали, и действие "встать, чтобы выступить" объединились в пару таким образом, что теперь одна только мысль о том, чтобы встать, чтобы выступить, вызывает реакцию страха.

Если этот человек будет чаще выступать, несмотря на первоначальный страх, то в конце концов "выступление на публике" и "реакция страха" будут распутаны, а реакция страха исчезнет.

Следовательно, человек избавится от страха публичных выступлений. Это можно сделать двумя способами.

Во-первых, постоянно подвергать человека воздействию ситуации, вызывающей страх, до тех пор, пока страх не уменьшится и не исчезнет. Это называется наводнение и является разовым мероприятием.

В качестве альтернативы человек может пройти так называемую процедуру систематическая десенсибилизация Человек постепенно подвергается воздействию различных степеней страха в течение длительного времени, причем каждая новая ситуация оказывается более сложной, чем предыдущая.

Ограничения классического обусловливания

Классическое обусловливание может привести вас к мысли, что вы можете сочетать что угодно с чем угодно. На самом деле, это было одним из первых предположений теоретиков, работающих в этой области. Они называли это эквипотенциальность Однако впоследствии стало известно, что определенные стимулы лучше воспринимаются в паре с определенными стимулами1.

Другими словами, нельзя просто взять и сопоставить любой стимул с любым другим стимулом. Скорее всего, мы "биологически подготовлены" к тому, чтобы генерировать реакцию на одни виды стимулов, а не на другие2.

Например, большинство из нас боятся пауков, и эта реакция страха может срабатывать и при виде пучка ниток, когда мы принимаем его за паука (обобщение).

Эволюционное объяснение состоит в том, что у наших предков было больше причин бояться одушевленных (хищников, пауков, змей) объектов, чем неодушевленных.

Это означает, что иногда вы можете принять кусок веревки за змею, но вряд ли вы когда-нибудь примете змею за кусок веревки.

Оперантное обусловливание

Если классическое обусловливание говорит о том, как мы связываем события, то оперантное обусловливание говорит о том, как мы связываем свое поведение с его последствиями.

Оперантное обусловливание говорит о том, насколько вероятно, что мы повторим то или иное поведение, основываясь исключительно на его последствиях.

Последствия, которые повышают вероятность того, что ваше поведение будет иметь место в будущем, называются арматура а последствие, которое снижает вероятность возникновения вашего поведения в будущем, называется наказание .

Например, ребенок получает хорошие оценки в школе, и родители награждают его покупкой любимой игровой приставки.

Теперь он с большей вероятностью будет хорошо сдавать тесты и в будущем. Это происходит потому, что игровая приставка является подкреплением, стимулирующим большее количество будущих проявлений определенного поведения (получение хороших оценок).

Когда что-то желаемое данная для исполнителя поведения, чтобы увеличить вероятность такого поведения в будущем, называется положительное подкрепление .

Так, в приведенном выше примере игровая приставка является положительным подкреплением, а передача ее ребенку - положительным подкреплением.

Однако положительное подкрепление - это не единственный способ, с помощью которого можно увеличить частоту определенного поведения в будущем. Существует еще один способ, с помощью которого родители могут подкрепить поведение ребенка "получать хорошие оценки".

Если ребенок пообещает, что в будущем будет хорошо справляться с тестами, родители могут стать менее строгими и снять с него некоторые ограничения, которые были наложены ранее.

Одним из таких нежелательных правил может быть "играть в видеоигры раз в неделю". Родители могут отказаться от этого правила и сказать ребенку, что он может играть в видеоигры два, а то и три раза в неделю.

Ребенок, в свою очередь, должен продолжать хорошо учиться в школе и получать "хорошие оценки".

Этот тип подкрепления, когда нечто нежелательное (строгое правило) отнятый от исполнителя поведения, называется отрицательное подкрепление .

Вы можете запомнить это так: "позитив" всегда означает, что что-то есть данная к исполнителю поведения, а "отрицательный" всегда означает, что что-то отнятый от них.

Заметим, что в обоих приведенных выше случаях положительного и отрицательного подкрепления конечная цель подкрепления одна и та же - повышение вероятности поведения в будущем или закрепление поведения (получение хороших оценок).

Просто мы можем обеспечить подкрепление, либо давая что-то (+), либо отнимая что-то (-). Конечно, исполнитель поведения хочет получить что-то желаемое и избавиться от чего-то нежелательного.

Оказание им одной или обеих этих услуг повышает вероятность того, что они будут подчиняться вам и повторять то поведение, которого вы от них хотите в будущем.

До сих пор мы обсуждали, как работает подкрепление. Есть и другой способ думать о последствиях поведения.

Наказание

Когда последствие поведения делает поведение меньше вероятность наступления в будущем, то такое последствие называется наказание Таким образом, подкрепление увеличивает вероятность поведения в будущем, а наказание уменьшает ее.

Продолжая пример, скажем, что через год или около того ребенок начал плохо сдавать тесты, увлекся и стал больше времени уделять видеоиграм, чем учебе.

Теперь родители хотят, чтобы такого поведения (получения плохих оценок) в будущем было меньше. Они хотят уменьшить частоту такого поведения в будущем. Поэтому они должны применить наказание.

Опять же, родители могут использовать наказание двумя способами, в зависимости от того, дают ли они что-то (+) или отнимают что-то (-) у ребенка, чтобы мотивировать его на снижение своего поведения (получение плохих оценок).

На этот раз родители пытаются препятствовать поведению ребенка, поэтому им приходится давать ему что-то нежелательное или отнимать что-то желанное для него.

Если родители вновь навязывают ребенку строгие правила, то они предоставление ему что-то, что он считает нежелательным. Таким образом, это будет позитивное наказание .

Если родители забирают у ребенка игровую приставку и запирают ее в домике, то они отбирающий то, что ребенок считает желательным. Это негативное наказание.

Чтобы помнить, какой тип подкрепления или наказания применяется, всегда помните об исполнителе поведения. Именно его поведение мы хотим увеличить или уменьшить, используя подкрепление или наказание соответственно.

Кроме того, следует помнить о том, чего желает исполнитель того или иного поведения. Таким образом, можно определить, является ли дача чего-то и отнятие чего-то подкреплением или наказанием.

Последовательная аппроксимация и формообразование

Вы когда-нибудь видели, как собаки и другие животные выполняют сложные трюки по командам своих хозяев? Эти животные обучаются с помощью оперантного обусловливания.

Вы можете заставить собаку прыгать через препятствие, если после прыжка (поведение) она получит лакомство (положительное подкрепление). Это простой трюк. Собака научилась прыгать по вашей команде.

Вы можете продолжать этот процесс, последовательно давая собаке все больше и больше вознаграждений, пока она не приблизится к желаемому сложному поведению. Это называется последовательная аппроксимация .

Допустим, вы хотите, чтобы собака делала спринт сразу после прыжка. Вы должны поощрять собаку после прыжка, а затем после спринта. В конце концов, вы можете отказаться от первоначального поощрения (после прыжка) и поощрять собаку только тогда, когда она выполняет последовательность поведения "прыжок + спринт".

Повторяя этот процесс, можно за один раз научить собаку прыгать + спринтовать + бегать и т.д. Этот процесс называется формирование .3

В данном видеоролике демонстрируется формирование сложного поведения у сибирского хаски:

Графики армирования

При оперантном обусловливании подкрепление увеличивает силу реакции (вероятность ее возникновения в будущем возрастает). Способ подкрепления (график подкрепления) влияет на силу реакции.4

Вы можете либо подкреплять поведение каждый раз, когда оно проявляется (непрерывное подкрепление), либо подкреплять его частично (частичное подкрепление).

Хотя частичное подкрепление требует времени, выработанная реакция достаточно устойчива к угасанию.

С другой стороны, если давать ребенку конфеты каждый раз, когда он хорошо сдал экзамен, то это будет непрерывное подкрепление. С другой стороны, если давать конфеты иногда, но не каждый раз, когда ребенок хорошо сдал экзамен, то это будет частичное подкрепление.

Существуют различные типы графиков частичного или прерывистого подкрепления в зависимости от того, когда мы предоставляем подкрепление.

Когда мы даем подкрепление после фиксированного количества раз, когда поведение выполнено, это называется фиксированный коэффициент .

Например, давать ребенку конфеты каждый раз, когда он хорошо сдаст три экзамена, затем снова награждать его после того, как он хорошо сдаст три экзамена, и так далее (фиксированное количество раз, когда поведение выполняется = 3).

Если усиление производится через определенный промежуток времени, это называется фиксированный интервал график подкрепления.

Например, если давать ребенку конфеты каждое воскресенье, то это будет фиксированный интервальный график подкрепления (фиксированный интервал времени = 7 дней).

Это примеры фиксированных графиков подкрепления. График подкрепления может быть и переменным.

Когда подкрепление дается после того, как поведение повторяется непредсказуемое количество раз, это называется с переменным коэффициентом график подкрепления.

Например, дать ребенку конфету после того, как он показал хорошие результаты 2, 4, 7 и 9 раз. Обратите внимание, что 2, 4, 7 и 9 - это случайные числа, они не возникают через определенный промежуток времени, как в графике подкрепления с фиксированным соотношением (3, 3, 3 и т.д.).

Когда подкрепление дается через непредсказуемые промежутки времени, это называется переменная-интервал график подкрепления.

Например, давать ребенку конфеты через 2 дня, затем через 3 дня, через 1 день и т.д. Здесь нет фиксированного временного интервала, как в случае расписания подкрепления с фиксированным интервалом (7 дней).

В целом переменное подкрепление вызывает более сильную реакцию, чем фиксированное. Это может быть связано с отсутствием фиксированных ожиданий относительно получения вознаграждения, что заставляет нас думать, что мы можем получить вознаграждение в любой момент. Это может вызвать сильное привыкание.

Уведомления в социальных сетях являются хорошим примером переменного подкрепления. Вы не знаете, когда (переменная-интервал) и через сколько проверок (переменная-отношение) вы получите уведомление (подкрепление).

Поэтому вы, скорее всего, будете продолжать проверять свой счет (усиленное поведение) в расчете на получение уведомления.

Ссылки:

Öhman, A., Fredrikson, M., Hugdahl, K., & Rimmö, P. A. (1976). Предпосылка эквипотенциальности в классическом обусловливании человека: обусловленные электродермальные реакции на потенциально фобические стимулы. Журнал экспериментальной психологии: общее , 105 (4), 313.
Макнелли, Р. Дж. (2016). Наследие книги Селигмана "Фобии и готовность" (1971). Поведенческая терапия , 47 (5), 585-594.
Петерсон, Г.Б. (2004). День великого озарения: открытие Б.Ф. Скиннером шейпинга. Журнал экспериментального анализа поведения , 82 (3), 317-328.
Ферстер, К. Б., & Скиннер, Б. Ф. (1957). Графики подкрепления.