Uma explicação simples do condicionamento clássico e operante

 Uma explicação simples do condicionamento clássico e operante

Thomas Sullivan

Muitas pessoas, incluindo estudantes de psicologia, professores e profissionais, consideram os conceitos de condicionamento clássico e operante confusos. Por isso, decidi fornecer uma explicação simples dos processos de condicionamento clássico e operante. Não pode ser mais simples do que o que está prestes a ler.

O condicionamento clássico e o condicionamento operante são dois processos psicológicos básicos que explicam como os seres humanos e outros animais aprendem. O conceito fundamental subjacente a estes dois modos de aprendizagem é associação .

Em termos simples, os nossos cérebros são máquinas de associação: associamos coisas umas às outras para podermos aprender sobre o nosso mundo e tomar melhores decisões.

Se não tivéssemos esta capacidade básica de associação, não poderíamos funcionar normalmente no mundo e sobreviver. A associação permite-nos tomar decisões rápidas com base em informações mínimas.

Por exemplo, quando tocamos acidentalmente num fogão quente, sentimos dor e puxamos rapidamente o braço para trás. Quando isto acontece, aprendemos que "tocar num fogão quente é perigoso". Como temos esta capacidade de aprendizagem, associamos o "fogão quente" à "dor" e tentamos evitar este comportamento no futuro.

Se não tivesse formado essa associação (fogão quente = dor), o mais provável é que voltasse a tocar num fogão quente, pondo-se em maior risco de queimar a mão.

O condicionamento clássico e o condicionamento operante são duas formas de estabelecer essas ligações.

O que é o condicionamento clássico?

O condicionamento clássico foi demonstrado cientificamente nas famosas experiências realizadas por Ivan Pavlov com cães que salivavam, tendo verificado que os seus cães não só salivavam quando lhes era apresentada comida, mas também quando uma campainha tocava imediatamente antes de a comida ser apresentada.

Como é que isso é possível?

A salivação resultante da observação ou do cheiro dos alimentos faz sentido. Nós também o fazemos, mas porque é que os cães salivariam ao ouvir uma campainha tocar?

Acontece que os cães tinham associado o som da campainha à comida porque, quando lhes davam comida, a campainha tocava quase ao mesmo tempo. E isto tinha acontecido um número suficiente de vezes para os cães associarem "comida" à "campainha".

Pavlov, nas suas experiências, descobriu que quando apresentava comida e tocava a campainha simultaneamente várias vezes, os cães salivavam quando a campainha tocava, mesmo que não fosse apresentada comida.

Desta forma, os cães tinham sido "condicionados" a salivar em resposta à audição da campainha. Por outras palavras, os cães adquirido uma resposta condicionada.

Vamos começar tudo desde o início para que se possa familiarizar com os termos envolvidos.

Antes do condicionamento

Inicialmente, os cães salivavam quando a comida era apresentada - uma resposta normal que a apresentação de comida normalmente gera. Aqui, a comida é o estímulo incondicionado (US) e a salivação é a resposta incondicionada (UR).

É claro que a utilização do termo "incondicionado" indica que ainda não ocorreu qualquer associação/condicionamento.

Como o condicionamento ainda não ocorreu, tocar a campainha é uma estímulo neutro (NS) porque, para já, não produz qualquer resposta nos cães.

Durante o condicionamento

Quando o estímulo neutro (campainha a tocar) e o estímulo incondicionado (comida) são repetidamente apresentados em conjunto aos cães, estes ficam emparelhados na mente dos cães.

De tal forma que o estímulo neutro (campainha a tocar), por si só, produz o mesmo efeito (salivação) que o estímulo incondicionado (comida).

Após o condicionamento, o toque da campainha (anteriormente NS) passa a ser o estímulo condicionado (CS) e a salivação (anteriormente UR) passa a ser a resposta condicionada (CR).

A fase inicial durante a qual o alimento (US) é emparelhado com o toque da campainha (NS) é chamada aquisição porque o cão está a adquirir uma nova resposta (CR).

Veja também: Pessoas demasiado sensíveis (10 traços-chave)

Após o condicionamento

Após o condicionamento, apenas o toque da campainha induz a salivação. Com o tempo, esta resposta tende a diminuir porque o toque da campainha e a comida já não estão emparelhados.

Por outras palavras, o emparelhamento torna-se cada vez mais fraco, o que se designa por extinção da resposta condicionada.

Note-se que o toque da campainha, por si só, é impotente para desencadear a salivação, a menos que seja acompanhado de um alimento que desencadeie natural e automaticamente a salivação.

Assim, quando ocorre a extinção, o estímulo condicionado volta a ser um estímulo neutro. Essencialmente, o emparelhamento permite que o estímulo neutro "tome emprestada" temporariamente a capacidade de um estímulo incondicionado para induzir uma resposta incondicionada.

Depois de uma resposta condicionada se ter extinguido, pode reaparecer novamente após uma pausa, o que se designa por recuperação espontânea .

Mais exemplos de condicionamento clássico.

Generalização e discriminação

No condicionamento clássico, a generalização de estímulos é a tendência dos organismos para provocar a resposta condicionada quando são expostos a estímulos que são semelhante ao estímulo condicionado.

Por isso, os cães de Pavlov, apesar de terem sido condicionados a salivar ao ouvirem um determinado sino, podem também salivar em resposta a outros objectos com sons semelhantes.

Se, após o condicionamento, os cães de Pavlov salivassem quando expostos ao toque de um alarme de incêndio, ao toque de uma bicicleta ou mesmo ao bater de folhas de vidro, este seria um exemplo de generalização.

Todos estes estímulos, embora diferentes, são semelhantes entre si e ao estímulo condicionado (campainha a tocar). Em suma, a mente do cão percepciona estes diferentes estímulos como sendo os mesmos, gerando a mesma resposta condicionada.

Isto explica, por exemplo, o facto de se sentir desconfortável ao pé de um desconhecido que nunca viu antes, porque as suas características faciais, o seu andar, a sua voz ou a sua maneira de falar lhe fazem lembrar uma pessoa que detestou no passado.

A capacidade dos cães de Pavlov para distinguir entre estes estímulos generalizados e outros estímulos irrelevantes no ambiente é designada por discriminação Assim, os estímulos que não são generalizados são discriminados de todos os outros estímulos.

Fobias e condicionamento clássico

Se considerarmos os medos e as fobias como respostas condicionadas, podemos aplicar os princípios do condicionamento clássico para extinguir essas respostas.

Por exemplo, uma pessoa que tem medo de falar em público pode ter tido algumas más experiências no início, quando se levantou para falar em público.

O medo e o desconforto que sentiram e a ação de "levantar-se para falar" foram emparelhados de tal forma que a ideia de se levantar para falar por si só gera agora a resposta de medo.

Se essa pessoa se levantar para falar mais vezes, apesar do medo inicial, então, eventualmente, o "falar em público" e a "reação de medo" vão-se desemaranhar. A reação de medo vai extinguir-se.

Consequentemente, a pessoa livrar-se-á do medo de falar em público. Há duas formas de o fazer.

Primeiro, expor a pessoa à situação temida continuamente até que o medo diminua e acabe por desaparecer. inundações e é um acontecimento único.

Em alternativa, a pessoa pode submeter-se ao que se designa por dessensibilização sistemática A pessoa é gradualmente exposta a diferentes graus de medo durante um longo período de tempo, sendo cada nova situação mais desafiante do que a anterior.

Limitações do condicionamento clássico

O condicionamento clássico pode levá-lo a pensar que pode combinar qualquer coisa com qualquer coisa. De facto, este foi um dos primeiros pressupostos dos teóricos que trabalham nesta área. Chamaram-lhe equipotencialidade No entanto, soube-se mais tarde que certos estímulos são mais facilmente emparelhados com certos estímulos.1

Por outras palavras, não se pode emparelhar qualquer estímulo com qualquer outro estímulo. É provável que estejamos "biologicamente preparados" para gerar respostas a certos tipos de estímulos em detrimento de outros.2

Por exemplo, a maioria de nós tem medo de aranhas e esta resposta de medo também pode ser despoletada quando vemos um feixe de fios, confundindo-o com uma aranha (generalização).

Este tipo de generalização raramente ocorre para objectos inanimados. A explicação evolutiva é que os nossos antepassados tinham mais razões para temer objectos animados (predadores, aranhas, cobras) do que objectos inanimados.

Isto significa que, por vezes, se pode confundir um pedaço de corda com uma cobra, mas dificilmente se confundirá uma cobra com um pedaço de corda.

Condicionamento operante

Enquanto o condicionamento clássico fala da forma como associamos os acontecimentos, o condicionamento operante fala da forma como associamos o nosso comportamento às suas consequências.

O condicionamento operante diz-nos qual a probabilidade de repetirmos um comportamento com base apenas nas suas consequências.

A consequência que torna mais provável que o seu comportamento ocorra no futuro chama-se reforço e a consequência que torna menos provável a ocorrência do seu comportamento no futuro é designada por punição .

Por exemplo, digamos que uma criança tem boas notas na escola e os pais recompensam-na comprando-lhe a sua consola de jogos preferida.

Isto porque a consola de jogos é um reforço para encorajar mais ocorrências futuras de um determinado comportamento (ter boas notas).

Quando algo desejável é dado ao autor de um comportamento para aumentar a probabilidade desse comportamento no futuro, designa-se por reforço positivo .

Assim, no exemplo acima, a consola de jogos é um reforçador positivo e dá-la à criança é um reforço positivo.

No entanto, o reforço positivo não é a única forma de aumentar a frequência de um determinado comportamento no futuro. Existe uma outra forma de os pais reforçarem o comportamento de "tirar boas notas" da criança.

Se a criança prometer que se vai sair bem nos testes futuros, os pais podem tornar-se menos rigorosos e levantar algumas restrições que lhe eram anteriormente impostas.

Uma dessas regras indesejáveis pode ser "jogar jogos de vídeo uma vez por semana". Os pais podem eliminar esta regra e dizer à criança que pode jogar jogos de vídeo duas ou três vezes por semana.

A criança, em contrapartida, tem de continuar a ter um bom desempenho escolar e a "tirar boas notas".

Este tipo de reforço, em que algo indesejável (regra rígida) é retirado do executor de um comportamento, chama-se reforço negativo .

Pode lembrar-se da seguinte forma - "positivo" significa sempre que algo é dado para o autor de um comportamento e "negativo" significa sempre que algo é retirado deles.

Note-se que em ambos os casos acima referidos de reforço positivo e negativo, o objetivo final do reforço é o mesmo, ou seja, aumentar a probabilidade futura de um comportamento ou reforçar o comportamento (obter boas notas).

É que podemos fornecer o reforço dando algo (+) ou retirando algo (-). É claro que o executor do comportamento quer obter algo desejável e quer livrar-se de algo indesejável.

Se lhes fizer um ou ambos os favores, é mais provável que o obedeçam e repitam o comportamento que pretende que repitam no futuro.

Até agora, falámos sobre como funciona o reforço, mas há outra forma de pensar sobre as consequências do comportamento.

Punição

Quando a consequência de um comportamento faz com que o comportamento menos provável de ocorrer no futuro, a consequência é designada por punição Assim, o reforço aumenta a probabilidade de um comportamento no futuro, enquanto o castigo a diminui.

Continuando com o exemplo anterior, digamos que, passado um ano ou mais, o miúdo começa a ter um mau desempenho nos testes, deixando-se levar e dedicando mais tempo aos jogos de vídeo do que aos estudos.

Ora, este comportamento (tirar más notas) é algo que os pais querem que se repita menos no futuro. Querem diminuir a frequência deste comportamento no futuro. Por isso, têm de usar o castigo.

Mais uma vez, os pais podem utilizar o castigo de duas formas, dependendo se dão algo (+) ou tiram algo (-) à criança para a motivar a diminuir o seu comportamento (ter más notas).

Desta vez, os pais estão a tentar desencorajar o comportamento da criança, pelo que têm de lhe dar algo indesejável ou tirar-lhe algo que é desejável para a criança.

Se os pais voltarem a impor regras rígidas à criança, são doação Portanto, isto será punição positiva .

Se os pais tirarem a consola de jogos da criança e a fecharem numa cabina, estão a retirar É o castigo negativo.

Para se lembrar do tipo de reforço ou de castigo que está a ser aplicado, tenha sempre em mente o autor do comportamento, pois é o seu comportamento que queremos aumentar ou diminuir através de reforços ou castigos, respetivamente.

Além disso, tenha em mente o que o executor de um comportamento deseja. Desta forma, pode saber se dar algo e tirar algo é um reforço ou um castigo.

Aproximação sucessiva e modelação

Já alguma vez viu cães e outros animais fazerem truques complexos às ordens dos seus donos? Esses animais são treinados através do condicionamento operante.

Pode fazer um cão saltar sobre um obstáculo se, depois de saltar (comportamento), o cão receber uma guloseima (reforço positivo). Este é um truque simples: o cão aprendeu a saltar à sua ordem.

Pode continuar este processo, dando sucessivamente mais recompensas ao cão até que ele se aproxime cada vez mais do comportamento complexo desejado. A isto chama-se aproximação sucessiva .

Se quisermos que o cão faça um sprint logo depois de saltar, temos de o recompensar depois de ele saltar e depois de fazer o sprint. Eventualmente, podemos eliminar a recompensa inicial (depois do salto) e apenas recompensar o cão quando ele executa a sequência de comportamento salto + sprint.

Repetindo este processo, pode treinar o cão para saltar + sprint + correr e assim por diante de uma só vez. Este processo chama-se modelação .3

Este vídeo demonstra a modelação de um comportamento complexo num Husky Siberiano:

Calendários de reforço

No condicionamento operante, o reforço aumenta a força de uma resposta (maior probabilidade de ocorrer no futuro). A forma como o reforço é fornecido (esquema de reforço) influencia a força da resposta.4

Pode reforçar um comportamento sempre que ele ocorre (reforço contínuo) ou pode reforçá-lo algumas vezes (reforço parcial).

Embora o reforço parcial leve tempo, a resposta desenvolvida é bastante resistente à extinção.

Dar um rebuçado a uma criança sempre que ela tem um bom resultado num exame seria um reforço contínuo. Por outro lado, dar um rebuçado algumas vezes, mas não sempre que a criança tem um bom resultado, constituiria um reforço parcial.

Existem diferentes tipos de esquemas de reforço parcial ou intermitente, consoante o momento em que fornecemos o reforço.

Quando fornecemos o reforço após um número fixo de vezes que um comportamento é efectuado, chama-se taxa fixa .

Por exemplo, dar um rebuçado à criança sempre que ela tiver um bom resultado em três exames, recompensá-la novamente depois de ter tido um bom resultado em três exames e assim por diante (número fixo de vezes que um comportamento é feito = 3).

Quando o reforço é fornecido após um intervalo de tempo fixo, é chamado de intervalo fixo programação de reforço.

Por exemplo, dar doces à criança todos os domingos seria uma programação de reforço de intervalo fixo (intervalo de tempo fixo = 7 dias).

Estes são exemplos de esquemas de reforço fixos. O esquema de reforço também pode ser variável.

Quando o reforço é dado depois de um comportamento ser repetido um número imprevisível de vezes, chama-se rácio variável programação de reforço.

Por exemplo, dar um rebuçado à criança depois de ela ter obtido uma boa pontuação 2, 4, 7 e 9 vezes. Note-se que 2, 4, 7 e 9 são números aleatórios, não ocorrem após um intervalo fixo, como acontece no esquema de reforço de razão fixa (3, 3, 3, e assim por diante).

Quando o reforço é dado após intervalos de tempo imprevisíveis, é designado por variável-intervalo programação de reforço.

Por exemplo, dar um rebuçado à criança ao fim de 2 dias, depois ao fim de 3 dias, depois ao fim de 1 dia e assim por diante. Não há um intervalo de tempo fixo como no caso do esquema de reforço de intervalo fixo (7 dias).

Em geral, os reforços variáveis geram uma resposta mais forte do que os reforços fixos, o que pode dever-se ao facto de não existirem expectativas fixas quanto à obtenção de recompensas, o que nos faz pensar que podemos obter a recompensa a qualquer momento, o que pode ser altamente viciante.

As notificações das redes sociais são um bom exemplo de reforços variáveis. Não se sabe quando (intervalo variável) e após quantas verificações (rácio variável) se vai receber uma notificação (reforço).

Assim, é provável que continue a verificar a sua conta (comportamento reforçado) na expetativa de receber uma notificação.

Veja também: Teste do mentiroso patológico (auto-teste)

Referências:

  1. Öhman, A., Fredrikson, M., Hugdahl, K., & Rimmö, P. A. (1976). A premissa da equipotencialidade no condicionamento clássico humano: respostas electrodérmicas condicionadas a estímulos potencialmente fóbicos. Jornal de Psicologia Experimental: Geral , 105 (4), 313.
  2. McNally, R. J. (2016): O legado de "fobias and preparedness" de Seligman (1971). Terapia comportamental , 47 (5), 585-594.
  3. Peterson, G. B. (2004). Um dia de grande iluminação: a descoberta da modelação por BF Skinner. Jornal de análise experimental do comportamento , 82 (3), 317-328.
  4. Ferster, C. B., & Skinner, B. F. (1957) - Schedules of reinforcement.

Thomas Sullivan

Jeremy Cruz é um psicólogo experiente e autor dedicado a desvendar as complexidades da mente humana. Apaixonado por compreender as complexidades do comportamento humano, Jeremy esteve ativamente envolvido em pesquisa e prática por mais de uma década. Ele possui um Ph.D. em Psicologia por uma instituição renomada, onde se especializou em psicologia cognitiva e neuropsicologia.Por meio de sua extensa pesquisa, Jeremy desenvolveu uma visão profunda de vários fenômenos psicológicos, incluindo memória, percepção e processos de tomada de decisão. Sua experiência também se estende ao campo da psicopatologia, com foco no diagnóstico e tratamento de transtornos de saúde mental.A paixão de Jeremy por compartilhar conhecimento o levou a criar seu blog, Understanding the Human Mind. Ao selecionar uma vasta gama de recursos de psicologia, ele pretende fornecer aos leitores informações valiosas sobre as complexidades e nuances do comportamento humano. De artigos instigantes a dicas práticas, Jeremy oferece uma plataforma abrangente para quem busca aprimorar sua compreensão da mente humana.Além de seu blog, Jeremy também dedica seu tempo ao ensino de psicologia em uma importante universidade, alimentando as mentes de aspirantes a psicólogos e pesquisadores. Seu estilo de ensino envolvente e desejo autêntico de inspirar os outros fazem dele um professor altamente respeitado e procurado na área.As contribuições de Jeremy para o mundo da psicologia vão além da academia. Ele publicou vários artigos de pesquisa em revistas conceituadas, apresentando suas descobertas em conferências internacionais e contribuindo para o desenvolvimento da disciplina. Com sua forte dedicação ao avanço de nossa compreensão da mente humana, Jeremy Cruz continua a inspirar e educar leitores, aspirantes a psicólogos e colegas pesquisadores em sua jornada para desvendar as complexidades da mente.