0% acharam este documento útil (0 voto)
16 visualizações13 páginas

Autocontrole Uma Anc3a1lise Dos Modelos Experimentais Do Compromisso e Do Atraso Da Gratificac3a7c3a3o

Este documento descreve três modelos experimentais de autocontrole: o modelo de Skinner, o paradigma de compromisso de Rachlin e o paradigma do atraso da gratificação de Mischel. O texto analisa especificamente o modelo de compromisso, descrevendo experimentos iniciais com pombos variando o tempo entre escolhas para influenciar a preferência por reforçadores maiores e atrasados.

Enviado por

João Rodrigues
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
16 visualizações13 páginas

Autocontrole Uma Anc3a1lise Dos Modelos Experimentais Do Compromisso e Do Atraso Da Gratificac3a7c3a3o

Este documento descreve três modelos experimentais de autocontrole: o modelo de Skinner, o paradigma de compromisso de Rachlin e o paradigma do atraso da gratificação de Mischel. O texto analisa especificamente o modelo de compromisso, descrevendo experimentos iniciais com pombos variando o tempo entre escolhas para influenciar a preferência por reforçadores maiores e atrasados.

Enviado por

João Rodrigues
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 13

Autocontrole: uma análise dos modelos experimentais do compromisso e

do atraso da gratificação

Daniel Carvalho de Matos1


[email protected]
Luiz Antonio Bernardes

Pontifícia Universidade Católica de São Paulo

Analistas do comportamento demonstram interesse pelo estudo de comportamentos denominados


autocontrole. Hanna e Todorov (2002) conduziram uma sistematização de três importantes
“influenciadores” nas investigações desses comportamentos:
1. Skinner, que descreve, especialmente no capítulo 15 de seu livro Ciência e Comportamento
Humano (Skinner, 1953/2003) contingências que deveriam ser analisadas para compreender
esses comportamentos;
2. Rachlin, que propõe um modelo experimental (apresentado inicialmente em Rachlin & Green,
1972) chamado compromisso; E
3. Mischel (Mischel & Ebbesen, 1970; Mischel, Ebbesen & Zeiss, 1972), que não é analista do
comportamento, mas propõe um modelo (cognitivista) que posteriormente também gerou
interesse em analistas do comportamento, que conduziram replicações sobre o mesmo
(Bernardes, 2011; Grosh & Neuringer, 1981; Kerbauy, 1981; Kerbauy & Buzzo, 1991).

Hanna e Todorov (2002) apresentam o modelo de Skinner como não experimental e sendo
parcialmente contemplado nos outros dois modelos que são experimentais (Rachlin e Mischel). Os
autores descrevem também que esses modelos experimentais não são suficientes para dar conta de
muitos comportamentos que podem também ser considerados casos de autocontrole.
Skinner (1953/2003) foi o primeiro analista do comportamento a apresentar uma análise de
comportamentos que são chamados de autocontrole. Para esse autor, o autocontrole refere-se a
Comportamento em Foco 1 | 2011

comportamentos que envolvem algum conflito de contingências. Uma mesma resposta (controlada)
pode produzir duas consequências conflitantes: reforçador positivo (SR+) e reforçador negativo (SR-).
Skinner (1953/2003) descreve que outra resposta (controladora ou de autocontrole) pode ser emitida
pelo próprio indivíduo, diminuindo assim a probabilidade de emissão da resposta (controlada) que
gera as conseqüências conflitantes.

1 Texto baseado em Simpósio apresentado no XIX Encontro da Associação de Psicoterapia e Medicina Comportamental e Cognitiva de
2010 em Campos do Jordão, São Paulo. Os autores agradecem pelo apoio e ajuda da professora Dra. Nilza Micheletto na organização
do trabalho.

387
Um exemplo que Skinner (1953/2003) apresenta para ilustrar seu modelo é o caso de um alcoolista.
A ação de beber gera conseqüências conflitantes: SR+ (prazer, euforia) e SR- (ressaca). Para
apresentar autocontrole, é necessário que a pessoa emita uma resposta controladora que diminua a
probabilidade do beber (resposta controlada).
As considerações de Skinner (1953/2003) sobre os comportamentos chamados de autocontrole
antecederam os trabalhos sobre os modelos experimentais de dois pesquisadores e seus colaboradores
(dentro e fora da Análise do Comportamento) já mencionados: o paradigma de compromisso de
Rachlin e colaboradores, contemplado em vários de seus artigos (Rachlin & Green, 1972; Rachlin,
Castrogiovanni & Cross, 1987; Siegel & Rachlin ,1995; Green & Rachlin, 1996) e o paradigma do
atraso da gratificação de Mischel e colaboradores (Mischel & Ebbesen, 1970; Mischel et al, 1972). O
objetivo do presente trabalho foi analisar os modelos experimentais desses autores, estabelecendo
relações entre os mesmos e analisando as características de variáveis que influenciam as tomadas de
decisão de não-humanos (pombos) e humanos.

O modelo de compromisso

A apresentação das pesquisas sobre compromisso obedeceu a uma sequência cronológica com o
intuito de avaliar como o modelo é trabalhado através do tempo, assim como discutir as variáveis
manipuladas. O modelo ilustrado pelo artigo de Rachlin e Green (1972) consistiu no primeiro
modelo experimental de analistas do comportamento que se interessaram pelo estudo sobre
comportamentos de autocontrole. Representa o primeiro artigo no tema publicado no JEAB (Journal
of the Experimental Analysis of Behavior) e, após o mesmo, uma série de pesquisas experimentais foi
e continua sendo produzida. Vale destacar, ainda, que todas as pesquisas sobre compromisso aqui
relatadas foram publicadas no JEAB.
A pesquisa de Rachlin e Green (1972) trabalhou com esquemas concorrentes encadeados. Cinco
pombos foram sujeitos em uma câmara experimental com dois discos em uma de suas paredes. Cada
esquema era representado por uma cadeia com dois elos (Ver Figura 1).

4s
R2 4s
FR25 T
A
6s
R1 2s

4s
B 4s
T R2
FR25

Figura 1
Esquemas concorrentes encadeados da pesquisa de Rachlin e Green (1972). Durante o
Comportamento em Foco 1 | 2011

primeiro elo, os dois discos concorrentes (A e B) estavam inativos. Os discos apresentados


no segundo elo (R2 e R1) representam as cores verde e vermelha, respectivamente.
Matos . Bernardes

Como se vê na Figura 1, o primeiro elo representa uma condição de escolha entre dois discos nos
quais os pombos poderiam bicar. Para cada disco nesse elo estava em vigor um esquema de razão
fixa (FR25). Após a vigésima quinta bicada em um dos discos, cada pombo passaria para o segundo
elo. Se a vigésima quinta bicada fosse feita no disco A, após a passagem de T segundos, começaria, no
segundo elo, uma nova condição de escolha. Cada pombo deveria escolher entre dois discos (cada

388
um sob esquema de CRF): R2, que permitiria o acesso a um reforçador maior (04 segundos de acesso
a alimento) e atrasado (após 04 segundos); e R1 que permitiria o acesso a um reforçador menor
(02 segundos de acesso a alimento) e imediato (nenhum atraso). Os 06 segundos que se seguiam
ao acesso ao reforçador imediato foram manipulados para que o tempo total em cada condição
fosse aproximadamente o mesmo. Do contrário, os pombos poderiam ter acesso a uma taxa total de
reforços (ao final da sessão) em R1 que poderia superar a taxa total de reforços obtidos a partir de R2.
No primeiro elo de escolha entre os discos A e B, se a vigésima quinta bicada fosse feita no disco
B, após a passagem de T segundos, começava o segundo elo que não representava uma condição de
escolha. Havia apenas um disco, o R2 (sob esquema de CRF), que permitia o acesso ao reforçador
maior e atrasado. Selecionar o disco B no primeiro elo da cadeia, para Rachlin e Green (1972)
significava comprometer-se com o reforçador de R2.
Para que fosse possível estabelecer o compromisso com o reforçador maior e atrasado, Rachlin
e Green (1972) variaram os valores de T (tempo entre os elos das duas possíveis cadeias, expresso
em segundos). Os autores manipularam os seguintes valores de T: 0.5, 1, 2, 4, 8, 16, 8, 4, 2, 1 e 0.5 s
(apresentados nessa ordem para cada pombo). Como resultados, Rachlin e Green (1972) verificaram
que, quando T tinha um baixo valor (por exemplo, 0.5 s), os pombos preferiam o disco A no primeiro
elo, o que levava a um segundo elo com a escolha entre R1 e R2 e uma forte preferência por R1,
que permitia o acesso ao reforçador menor e imediato. Caso T tivesse um alto valor (por exemplo,
16 s), acontecia o que os autores chamaram de “reversão da preferência” (fenômeno discutido
inicialmente em Rachlin, 1970) no primeiro elo, sendo que os pombos passavam a preferir o disco B,
comprometendo-se, portanto, com o reforçador maior e atrasado no segundo elo.
Segundo Rachlin e Green (1972), a preferência pelo disco B no primeiro elo justificava-se pelo
fato de o acesso aos dois tipos de reforçadores (4s e 2s de acesso a alimento) ser atrasado em função
do alto valor de T (16s) nas duas possibilidades de cadeia. Relacionando esse experimento com a
escolha de humanos na vida real, pode-se descrever o seguinte exemplo: suponha que se pergunte a
uma criança se a mesma prefere um biscoito agora ou dois amanhã. Certamente, a mesma preferirá
o reforçador menor e mais imediato, dada a sensibilidade da escolha a conseqüências imediatas. No
entanto, caso se pergunte à criança se prefere um biscoito daqui a nove dias ou dois daqui a dez dias,
possivelmente preferirá dois biscoitos após dez dias (maior sensibilidade à magnitude do reforço),
dado que, nesse caso, os dois reforçadores estarão atrasados. No entanto, conforme o tempo passa, a
criança poderá reverter sua preferência no momento em que puder ter acesso a um biscoito agora e
ainda faltar um dia para ter os dois biscoitos. A criança certamente preferiria novamente um biscoito
agora. Seria necessário, portanto, que a criança de alguma maneira se comprometesse (resposta de
compromisso) com o reforçador maior no momento em que ambos os reforçadores (com maior e
menor magnitude) ainda seriam atrasados, eliminando, assim, a possibilidade de reversão para a
escolha do reforçador menor e imediato (Green & Rachlin, 1996; Rachlin, 2000).
É importante destacar que, para Rachlin (2000), na vida real, as pessoas freqüentemente quebram os
seus compromissos. Os pombos da pesquisa de Rachlin e Green (1972) não tinham essa possibilidade
ao se comprometerem com o reforçador maior e atrasado no momento em que as duas opções de
Comportamento em Foco 1 | 2011

escolha envolviam reforçadores atrasados (primeiro elo da cadeia). Esse tipo de compromisso tão
estrito seria possível na vida real de humanos, para Rachlin (2000), em situações muito específicas.
Considere, por exemplo, o caso de um alcoolista que quer parar de beber. A pessoa opta por internar-
se em uma clínica de reabilitação onde não teria, diga-se, a menor possibilidade de acesso ao álcool.
Matos . Bernardes

Rachlin (2000) descreve essa situação do alcoolista como um caso de compromisso estrito
semelhante ao que aconteceu com os pombos da pesquisa de Rachlin e Green (1972). Neste
sentido, é interessante destacar que (conforme o tempo passa) a reversão da preferência para o
que seria o caminho mais imediato ou impulsivo (acesso ao álcool para o alcoolista ou alimento de
menor magnitude e imediato no caso dos pombos) não seria possível porque o compromisso foi

389
estabelecido no momento em que a preferência por aquela que seria a opção de autocontrole (não
beber, ficar sóbrio para o alcoolista ou alimento de maior magnitude e maior atraso dos pombos)
era significativamente maior, e a reversão posterior da preferência não seria mais uma possibilidade.
Entretanto, casos como o do alcoolista que decide se internar para comprometer-se com o não beber,
conforme descreve o próprio Rachlin (2000), são raros e as pessoas que querem parar de beber
normalmente não necessariamente se retiram do ambiente no qual o álcool está presente.
A pesquisa de Rachlin e Green (1972) representou o ponto de partida para outras pesquisas
que exploraram o paradigma do compromisso. Rachlin et al. (1987) trabalharam esse paradigma
em sujeitos adultos humanos. Nesse caso, os autores ainda manipulavam a variável magnitude do
reforço. O atraso, no entanto, foi substituído pela variável probabilidade do reforço. A decisão de se
trabalhar com uma variável como probabilidade teria sido influenciada pelo trabalho de psicólogos
cognitivistas que apregoavam que os parâmetros de probabilidade e atraso do reforço seriam
funcionalmente semelhantes (Rachlin et al., 1987). Isso significaria que um reforçador atrasado
seria equivalente a um reforçador pouco provável e que um reforçador imediato seria equivalente
a um reforçador com alta probabilidade. Rachlin et al. (1987), a princípio, estavam interessados em
demonstrar que isso não seria verdadeiro e que unicamente o atraso do reforço seria o parâmetro
crítico para o autocontrole. A Figura 2 representa a pesquisa delineada por Rachlin et al. (1987) e
suas variáveis manipuladas.

$4
R2 1-5
q
A
$1
R1 1 - 17

$5
B 1-4
q R2

Figura 2
Esquemas concorrentes encadeados da pesquisa de Rachlin et al. (1987) com adultos
humanos manipulando probabilidade de reforço.

A Figura 2 é bastante semelhante à Figura 1 que retrata a pesquisa de Rachlin e Green (1972). No
entanto, os reforçadores primários foram substituídos por reforçadores condicionados (dinheiro)
com diferentes magnitudes e diferentes probabilidades de ocorrência. A variável que representaria
a passagem entre os elos da cadeia (t) foi também substituída pela variável (q) que significa
probabilidade.
A maneira como a pesquisa de Rachlin et al. (1987) foi conduzida (com estudantes universitários)
pode ser observada na Figura 3.
Comportamento em Foco 1 | 2011

A Figura 3 representa a seguinte situação. Cada participante (individualmente) ficaria diante de


uma mesa com cinco cartões e uma roleta com 18 números (de 01 a 18). Além disso, cada participante
recebia 20 fichas (10 vermelhas e 10 azuis).
O delineamento apresenta claras semelhanças com o trabalho de Rachlin e Green (1972). Cada
Matos . Bernardes

participante, após receber as 20 fichas, deveria distribuir as fichas entre os dois primeiros cartões
de escolha (A e B). Cada participante deveria colocar uma ficha por vez. Seria possível distribuir as
fichas na sequência que quisesse. Ao colocar cada ficha em A ou B, o experimentador girava uma
roleta que permitiria, ao participante, avançar para um segundo elo a depender do número no qual
o ponteiro da roleta parasse e da probabilidade da ficha apostada.

390
Probabilidade do Reforço

14 13 12
11
15
16 10
17 9
18 8
1 7
2 6
3 4 5

$1 $4 $5
1 - 17 1-5 1-4

1 - 15 1 - 15
A B
1-3 1-3

10
CRF 11 universitários
10

Figura 3
Configuração da situação de coleta à qual os participantes da pesquisa de Rachlin et
al. (1987) foram submetidos. Os círculos preenchidos com preto representam fichas
vermelhas. Os círculos preenchidos com cinza representam fichas azuis.

Se, por exemplo, um participante tivesse apostado uma ficha vermelha em A ou B, sendo que a ficha
vermelha era de alta probabilidade (01-15), o experimentador girava a roleta e, se o ponteiro parasse,
por exemplo, no número 10, então o participante poderia passar para o segundo elo (uma nova
condição de escolha, no caso). Nessa nova condição, a depender do cartão escolhido no primeiro elo,
o participante recebia uma ficha branca que poderia ser apostada em dois outros cartões (caso tivesse
escolhido A no início). O participante escolhia um dos cartões e o experimentador girava a roleta.
Esse momento representava a escolha entre reforçador menor e com alta probabilidade (01 dólar se
o ponteiro da roleta parasse em um número de 01 a 17) e reforçador maior com baixa probabilidade
(04 dólares caso o ponteiro parasse em um número de 01 a 5).
Se no princípio, entretanto, o participante tivesse apostado a ficha vermelha em B, haveria a
possibilidade de passagem para o segundo elo que seria uma condição de comprometimento com
o reforçador maior e menos provável (ganhar 5 dólares caso o ponteiro da roleta, nesse momento,
parasse em um número de 01 a 04).
Os exemplos ilustrados, nos dois últimos parágrafos também valiam para as fichas azuis. A
diferença está no fato de que as fichas azuis eram fichas de baixa probabilidade (01-03). No primeiro
elo (independentemente de escolher A ou B), após a roleta ser girada pela primeira vez, o participante
apenas poderia passar para o segundo elo (nova escolha após A ou compromisso após B) se o ponteiro
da roleta parasse em um número de 01 a 03.
Os resultados da pesquisa de Rachlin et al. (1987) revelaram que os participantes tenderam
a apostar primeiramente cada uma das fichas vermelhas (alta probabilidade). Essas fichas foram
Comportamento em Foco 1 | 2011

consistentemente apostadas em A e, quando ocorria a passagem para o segundo elo (nova escolha)
que era bastante provável, os participantes recebiam a ficha branca e apostavam no cartão que permitia
o acesso a 01 dólar com alta probabilidade (ponteiro parando nos números de 01 a 17 na roleta).
Por outro lado, os participantes apostaram as fichas azuis (baixa probabilidade) consistentemente
Matos . Bernardes

em B no primeiro elo. A probabilidade de passagem para o segundo elo era baixa (o ponteiro teria
que parar em um número de 01 a 03), mas quando isso eventualmente ocorria, os participantes
tinham acesso ao reforçador maior e menos provável (05 dólares caso o ponteiro agora parasse em
um número de 01 a 04 na roleta). A escolha de B, no primeiro elo, representava o compromisso com
o reforçador maior e menos provável no segundo elo.

391
Rachlin et al. (1987) discutem seus resultados relacionando-os com os dados da pesquisa de
Rachlin e Green (1972) da seguinte maneira: as fichas vermelhas tiveram uma função semelhante ao
T (tempo entre os elos) da pesquisa de Rachlin e Green (1972) quando T consistia, por exemplo, em
0.5 segundo. Os pombos preferiam A no primeiro elo e preferiam o reforçador menor imediato na
segunda condição de escolha. Os participantes humanos da pesquisa de Rachlin et al. (1987) apostavam
cada ficha vermelha em A. Por serem fichas com alta probabilidade, passavam frequentemente para
o segundo elo (nova condição de escolha) e escolhiam consistentemente o reforçador menor e mais
provável (01 dólar).
As fichas azuis de Rachlin et al. (1987), por outro lado, seriam semelhantes ao T longo (16
segundos) de Rachlin e Green (1972). Nesta pesquisa, quando isso acontecia, os pombos escolhiam
principalmente B (primeiro elo), comprometendo-se (no segundo elo) com o reforçador de maior
magnitude e maior atraso. Em Rachlin et al., as fichas azuis eram sistematicamente apostadas em
B (primeiro elo). Essa escolha representava (quando ocorria a passagem de um elo para o outro) o
compromisso com o reforçador maior e menos provável do segundo elo (05 dólares).
Ainda que as duas pesquisas tenham sido desenvolvidas com diferentes participantes ou sujeitos
(pombos X seres humanos), Rachlin et al. (1987) concluem que o atraso e a probabilidade seriam
parâmetros funcionalmente semelhantes. Um reforçador atrasado é como um reforçador pouco
provável, e um reforçador imediato (ou menos atrasado) é como um reforçador muito provável. Os
dados reforçam o argumento de que a sensibilidade a reforçadores imediatos ou altamente prováveis é
significativamente maior em comparação à sensibilidade a reforçadores atrasados ou pouco prováveis
em uma situação de escolha com esquemas concorrentes. Aumentar a sensibilidade a reforçadores
atrasados ou pouco prováveis em uma situação de escolha implica, para Rachlin e Green (1972) e
Rachlin et al. (1987), a necessidade de algum tipo de compromisso quando ambos os reforçadores
de cada esquema são atrasados ou pouco prováveis. No caso de Rachlin et al. (1987), a partir do
momento em que os participantes contavam unicamente com fichas azuis (de baixa probabilidade)
para distribuir entre A e B no primeiro elo, ambos os reforçadores do momento que se seguia a A ou o
reforçador do momento que se seguia a B tornavam-se menos prováveis, o que, nesse caso, foi crítico
para a escolha de B no primeiro elo, quando se apostavam as fichas azuis.
A próxima pesquisa a ser relatada (Siegel & Rachlin, 1995) apresenta características distintas
quando comparadas com as duas outras pesquisas sobre compromisso. Não se fala mais, nesse
momento, sobre respostas de compromisso e o procedimento não envolveu esquemas concorrentes
encadeados com dois elos. Autocontrole é ainda definido como a escolha de um reforçador maior
atrasado sobre outro menor imediato. No entanto, não se fala aqui sobre um tipo de compromisso
que elimine a possibilidade futura de escolha do reforçador menor imediato no momento em que
ambos os reforçadores (maior e menor) ainda são atrasados.
Conforme já foi discutido, um alcoolista, por exemplo, não necessariamente tem que se encarcerar
em uma clínica para eliminar a possibilidade de controle pelo imediato (bebida agora). As pessoas
podem demonstrar comportamentos de autocontrole mesmo quando estão inseridas no ambiente
em que a “tentação” (álcool, por exemplo) se faz disponível. O autocontrole em casos como esse não
Comportamento em Foco 1 | 2011

envolve um tipo de compromisso estrito, mas parte do princípio de que, quando nos comportamos
frequentemente de outras maneiras, tendemos a formar padrões comportamentais bastante
resistentes à mudança.
Tome-se outro caso: alguém pode claramente preferir chocolate à salada. Comer chocolate
Matos . Bernardes

em vez de salada envolve, nesse caso, uma mera questão de preferência. No entanto, alguém que
declare preferir chocolate, mas come a salada, está se autocontrolando. Na medida em que a pessoa
passa a comer alimentos saudáveis como salada tão sistematicamente, isso tende a formar padrões
de comportamento muito fortalecidos. Romper com os mesmos envolve um custo. O padrão
eventualmente pode ser quebrado (a pessoa eventualmente come o chocolate), mas isso envolve um

392
custo. O autocontrole estabelecido a partir de padrões de comportamento representa uma forma
de compromisso (Rachlin, 2000). Não é uma forma de compromisso estrito como a apresentada
inicialmente por Rachlin e Green (1972) e, depois, por Rachlin et al. (1987). Trata-se de uma forma
de compromisso suave (soft commitment). Na vida real, as pessoas quebram seus compromissos. O
estabelecimento de padrões comportamentais, no entanto, pode tornar isso menos provável.
Siegel e Rachlin (1995) demonstraram o soft commitment experimentalmente no laboratório, tendo
pombos como sujeitos. O delineamento envolveu o que corresponderia ao segundo elo da cadeia de
Rachlin e Green (1972) em que autocontrole implica escolha de reforçador maior e atrasado sobre
um reforçador menor e mais imediato, sem a presença de qualquer forma de compromisso explícito
(ver Figura 4).

Figura 4
Autocontrole como escolha entre reforçador maior e atrasado (autocontrole) e
reforçador menor e imediato (impulsividade). A pesquisa de Siegel e Rachlin (1995) está
representada pela área delimitada pelo círculo. Representa basicamente aquele que seria
o segundo elo da cadeia de Rachlin e Green (1972).

O que marca uma diferença entre o segundo elo do trabalho de Rachlin e Green (1972) e a pesquisa
sobre o estabelecimento do autocontrole pela formação de padrões comportamentais (Siegel &
Rachlin, 1995), é o fato de, nesse caso, os autores terem manipulado diferentes tipos de esquemas de
reforçamento (CRF, FI30, FR31 e SigFR31). Os resultados do trabalho de Siegel e Rachlin envolveram
maior frequência de respostas de escolha por reforçador maior e atrasado quando o esquema
manipulado em cada um dos dois discos foi o FR31 e o SigFR31.
Esquemas de razão fixa que contam com altas razões tendem a gerar uma preferência por um dos
componentes de escolha, produzindo padrões comportamentais bastante rígidos (Rachlin, 2000).
Uma vez que cada pombo começava a bicar no disco correlacionado com reforçador maior atrasado,
dificilmente mudava para o outro disco (o que era possível nessa pesquisa e eventualmente ocorria).
Para Siegel e Rachlin (1995), o que teria favorecido a preferência pelo reforçador maior atrasado
seria o fato de os dois reforçadores (dos dois componentes) se tornarem atrasados por causa do
FR31 (em vigor em cada componente). O tempo necessário para um pombo emitir 31 bicadas é
longo e favorece maior sensibilidade ao reforçador com maior magnitude. Na condição com FR31, o
Comportamento em Foco 1 | 2011

reforçador maior atrasado foi obtido em 64% das vezes.


O esquema chamado SigFR31 era quase idêntico ao FR31, tendo produzido altas frequências de
seleção do componente de autocontrole. A diferença está no fato de que, após a trigésima bicada
de cada pombo, havia um breve blackout de 1 segundo. O objetivo disso era justamente tentar
Matos . Bernardes

interromper um padrão de seleção de reforçador maior e atrasado gerado pelo esquema de FR31.
Como resultado, os autores verificaram que, apesar da breve interrupção do blackout, o padrão foi
mantido. O reforçador maior atrasado foi obtido em 50% das vezes.
Por fim, Siegel e Rachlin (1995) manipularam um esquema de intervalo fixo de 30 segundos
(FI 30 segundos) em cada componente de escolha. Os autores verificaram que, nessa condição, os

393
pombos tiveram maior preferência pelo reforçador menor e imediato. Um esquema de FI reforça
a primeira resposta após a passagem de um período de tempo determinado. Tende a gerar breves
pausas no responder, seguidas por longos jorros de responder rápido (Rachlin, 2000). Como, nesse
esquema, houve várias interrupções em função das pausas, os pombos de Siegel e Rachlin (1995)
tinham muitas oportunidades para alternarem o responder entre os dois componentes de escolha.
Ainda que os pombos tivessem uma forte tendência a bicar o disco correlacionado com reforçador
maior atrasado, eles frequentemente mudavam para o disco correlacionado com reforçador menor
imediato. Em função disso, os pombos de Siegel e Rachlin (1995) escolheram o reforçador maior
atrasado em, aproximadamente, 25% das vezes. O esquema de FI eficazmente interrompeu o padrão
(de selecionar reforçador maior atrasado) que tinha sido estabelecido pelo FR31 e mantido pelo
SigFR31.
A pesquisa de Green e Rachlin (1996) representou um novo retorno ao paradigma do compromisso
inaugurado pelo trabalho de Rachlin e Green (1972). Envolveu esquemas concorrentes encadeados
com dois elos e respostas de compromisso. O delineamento é quase o mesmo, mas tem uma diferença
que está ilustrada na Figura 5 pela segunda condição de escolha que se segue à opção B do
primeiro elo.

4s
FR3 T
A

2s

B 4s
T
FR3
30 s de blackout
(punição)
2s

Figura 5
Esquemas concorrentes encadeados da pesquisa de Green e Rachlin (1996). A e B
representam os discos concorrentes do primeiro elo. O segundo elo representa uma
nova condição de escolha tanto quando se segue a A como quando se segue a B.

O primeiro elo é representado pela escolha entre os discos A e B. Em cada um deles, está em
vigor um esquema FR3. Quando T (tempo entre os elos) era curto, os pombos preferiam A e, após
a passagem para o segundo elo, escolhiam entre reforçador maior atrasado versus reforçador menor
imediato. Nesses casos, os pombos preferiam o reforçador menor imediato (como em Rachlin &
Green, 1972). Quando T era longo, os pombos preferiam B no primeiro elo e, após a passagem para
Comportamento em Foco 1 | 2011

o segundo elo, diferente do que ocorria com Rachlin e Green (1972) (compromisso com reforçador
maior atrasado), havia uma nova condição de escolha entre reforçador maior atrasado versus
reforçador menor imediato. Neste caso, no entanto, escolher o reforçador menor imediato implicava
um tipo de punição. Esta consistia em um blackout (com 30 segundos de duração) após o acesso ao
Matos . Bernardes

reforçador imediato.
Green e Rachlin (1996) descreveram que os pombos tendiam a escolher o reforçador maior atrasado
com maior frequência nesses casos. Seria um tipo de compromisso estabelecido pela punição. No
entanto, os autores descreveram que os pombos eventualmente selecionavam o reforçador menor
imediato apesar da punição. Em função disso, é possível estabelecer uma relação com o trabalho

394
de Siegel e Rachlin (1995): parece que, em ambas as pesquisas, deixar de responder sob controle do
reforçador maior atrasado envolve um custo. Em Siegel e Rachlin trata-se do custo de interromper
um padrão comportamental (de seleção de reforçador maior atrasado). Em Green e Rachlin (1996),
trata-se da possibilidade do responder ser punido, caso mude para o disco correlacionado com
reforçador menor imediato, que era seguido por punição.
Rachlin (2000) discute que, assim como o caso do compromisso estrito (Rachlin & Green, 1972), o
compromisso pela punição (Green & Rachlin, 1996) na vida real dos seres humanos é bastante raro.
Considere, por exemplo, o caso de um alcoolista que deseja parar de beber. Ele poderia comprometer-
se com o não beber na medida em que ingeriria uma substância (antabuse) que resultaria em forte
desconforto físico caso a pessoa bebesse depois. No entanto, poderia acontecer de a pessoa, em algum
momento, beber a despeito de sentir-se mal (punição). O compromisso então, nesse caso, poderia ser
eventualmente quebrado.
Pôde-se verificar que as pesquisas do JEAB (Journal of the Experimental Analysis of Behavior)
sobre o modelo de autocontrole pelo compromisso sofreram alterações através do tempo. A primeira
pesquisa do modelo de compromisso (Rachlin & Green, 1972) foi feita com pombos e caracterizou
um tipo de compromisso estrito (strict commitment), em que a possibilidade de escolha de um
reforçador menor imediato seria eliminada em função do comprometimento com o reforçador
maior atrasado, no momento em que ambos os reforçadores seriam atrasados. Em seguida, Rachlin
et al. (1987) trabalharam com o modelo de compromisso estrito em humanos adultos universitários.
A variável de atraso foi substituída por probabilidade, e os autores buscaram verificar se esses dois
parâmetros (atraso e probabilidade) seriam funcionalmente semelhantes. Os dados dos autores
sugeriram que sim.
A pesquisa na sequência (Siegel & Rachlin, 1995) trabalhou com um modelo de compromisso que
os autores chamaram de suave (soft commitment), tendo pombos como sujeitos. Não se trabalhou
nesse estudo com esquemas concorrentes encadeados da maneira como aconteceu nas duas outras
pesquisas (Rachlin & Green 1972; Rachlin et al., 1987). Não se tinha um primeiro elo onde se emitia
uma resposta de compromisso. Autocontrole, agora, simplesmente passava a implicar a escolha de
reforçador maior atrasado sobre reforçador menor imediato, sem qualquer compromisso explícito.
O modelo de Siegel e Rachlin (1995) foi chamado de compromisso suave em função da manipulação
de esquemas concorrentes de razão fixa com alta razão (FR31). Esse tipo de esquema tende a gerar
forte preferência por um dos componentes de escolha. Os pombos poderiam variar o responder
entre os componentes (com reforçador maior atrasado X com reforçador menor imediato), mas uma
vez que começava a responder sob controle de um deles, formava-se um padrão que dificilmente
seria quebrado em função simplesmente do custo de interromper-se um padrão. Além disso, o fato
de se ter esquemas de razão fixa com alta razão tornava ambos os reforçadores de cada esquema mais
atrasados em função de os pombos levarem tempo para cumprirem com o critério de cada esquema.
Sendo assim, os autores argumentaram que isso foi crítico no estabelecimento da preferência pelo
reforçador maior atrasado, representando uma forma de compromisso (Siegel & Rachlin, 1995;
Rachlin, 2000).
Comportamento em Foco 1 | 2011

Por fim, a pesquisa de Green e Rachlin (1996) representou um retorno ao modelo de compromisso
estrito, tendo pombos como sujeitos. A diferença ficou por conta do segundo elo que se seguia à
escolha da opção de compromisso (do primeiro elo). Diferentemente do que aconteceu com Rachlin
e Green (1972) e Rachlin et al. (1987), esse segundo elo representou uma nova condição de escolha
Matos . Bernardes

entre reforçador maior atrasado versus reforçador menor e imediato. No entanto, nessa pesquisa, a
escolha do reforçador menor imediato era seguida por um tipo de punição (blackout de 30 segundos),
o que acabou por estabelecer a preferência pelo reforçador maior atrasado. Isso representou um tipo
de compromisso que, assim como na pesquisa de Siegel e Rachlin (1995), poderia ser quebrado, mas
isso envolveria um custo. No caso da pesquisa de Green e Rachlin o custo significaria uma punição.

395
A sessão seguinte discutirá um modelo de autocontrole cognitivista, mas que tem semelhanças
com o modelo de autocontrole que envolve escolha de reforçador maior atrasado sobre reforçador
menor imediato. Além disso, esse modelo influenciou e tem influenciado trabalhos de analistas do
comportamento, dentro e fora do Brasil, que se propuseram a conduzir replicações desse modelo
(Bernardes, 2011; Grosh & Neuringer, 1981; Kerbauy, 1981; Kerbauy & Buzzo, 1991). Esse modelo
refere-se ao paradigma do atraso da gratificação das pesquisas de Mischel e seus colaboradores
(Mischel & Ebbesen, 1970; Mischel et al., 1972).

O modelo do atraso da gratificação

Outras pesquisas de analistas do comportamento, após o trabalho de Rachlin e Green (1972),


abordaram o tema do autocontrole de modo diferente. O autocontrole, nesse caso, envolve a escolha
entre reforçador maior e atrasado (autocontrole) e reforçador menor e imediato (impulsividade)
(ver, por exemplo, Mazur & Logue, 1978). Já se discutiu que isso corresponderia à escolha entre
R1 e R2 no segundo elo da cadeia de Rachlin e Green (1972), ver Figura 4. O modelo do atraso
da gratificação também se encaixa nesse caso. Nas pesquisas do grupo de Mischel e colaboradores
(Mischel & Ebbesen, 1970; Mischel et al., 1972), no entanto, originalmente foi manipulada a variável
qualidade do reforço (reforçador mais preferido X menos preferido) em vez de magnitude.
O procedimento geral característico das pesquisas do grupo de Mischel (Mischel & Ebbesen,
1970; Mischel et al., 1972) envolveu as seguintes características. Os participantes foram crianças com
idade média de seis anos e o processo pelo qual passaram foi: primeiramente, um experimentador
apresentava duas guloseimas (reforçadores) a cada criança (um pretzel e um marshmallow). O
ambiente consistia de uma sala com mesa (sobre a qual ficavam os reforçadores) e duas cadeiras.
O experimentador então perguntava à criança qual dos dois reforçadores era o seu favorito. Com
isso estabelecido, o experimentador explicava a cada criança que deixaria a sala e que, se a criança
aguardasse seu retorno, poderia ficar com o reforçador preferido. O experimentador não especificava
quanto tempo cada criança teria que aguardar até seu retorno (nas duas pesquisas o tempo era de 15
minutos). O tempo de espera dependia de cada criança: poderia encerrar a espera tocando um sino
que se encontrava na mesa, caso não quisesse aguardar o retorno do experimentador.
Diferentes condições foram manipuladas. Em uma das pesquisas, os reforçadores poderiam estar
cobertos ou não. Os autores observaram que as crianças esperavam mais na condição em que pelo
menos um dos reforçadores estava coberto (Mischel & Ebbesen, 1970). Observaram, durante a
espera, que as crianças se engajavam em uma série de atividades (cobrir os olhos, dançar e brincar
com as mãos, entre outras) que podem ter favorecido o aumento no tempo de espera pelo reforçador
mais preferido.
Na outra pesquisa (Mischel et al., 1972), os autores manipularam sistematicamente atividades
durante o período de espera. Em um primeiro momento, algumas crianças recebiam um brinquedo
com o qual poderiam interagir. Outras crianças eram instruídas pelo experimentador a pensar em
algo divertido durante a espera, mas que não tivesse qualquer relação com os reforçadores. Nessa
primeira manipulação, ambos os reforçadores encontravam-se descobertos (podiam ser vistos
Comportamento em Foco 1 | 2011

pelas crianças). Em ambos os casos (brinquedo, pensar em algo divertido) as crianças esperaram
mais tempo pelo retorno do experimentador do que nos casos em que tais variáveis não foram
manipuladas.
Os autores também, em outro momento, analisaram os efeitos de diferentes instruções sobre a
Matos . Bernardes

espera (Mischel et al., 1972). Algumas crianças foram instruídas a pensar em algo divertido, outras
a pensar em algo triste e outras a pensar nos próprios reforçadores. Tanto no caso em que os
reforçadores estavam cobertos como no caso em que estavam descobertos, a instrução de pensar
em algo divertido produziu o maior tempo de espera. As outras instruções diminuíram o tempo de
espera das crianças.

396
A partir do que foi discutido sobre as pesquisas do grupo de Mischel (Mischel & Ebbesen,1970;
Mischel et al., 1972), torna-se válido enfatizar que o contexto da escolha de seres humanos é complexo
no sentido que não se deve simplesmente levar em conta parâmetros do reforço como atraso e
magnitude no caso de humanos, mas deve-se atentar ao fato de que, em função da sensibilidade dos
seres humanos a descrições verbais, as descrições de contingências (regras) também representam um
importante parâmetro nas situações de escolhas (Rachlin, 1994).
Como já se tinha destacado, o paradigma do atraso da gratificação foi também de interesse para
analistas do comportamento, ainda que se tenha configurado como uma proposta cognitivista de
escolhas em situações de autocontrole. E isso se verifica em trabalhos tanto fora como dentro do
Brasil. Grosh e Neuringer (1981), por exemplo, delinearam replicações dos experimentos do grupo
de Mischel com pombos, manipulando variáveis semelhantes as dos estudos de Mischel (Mischel &
Ebbesen,1970; Mischel et al., 1972). A coleta foi feita em uma câmara experimental contendo um
disco. Bicar no disco levava ao acesso a um grão menos preferido e imediato e, não bicar, implicava
o acesso a um grão mais preferido e mais atrasado. Grosh e Neuringer (1981) investigaram, por
exemplo, os efeitos de atividades, realizadas durante o período de espera, sobre o tempo de espera,
introduzindo um novo disco sob esquema de FR20 em que o bicar sobre o mesmo resultaria no
acesso a outro tipo de grão. Bicar nesse disco adicional era possível durante o período de atraso do
reforço (espera pelo grão preferido) cujo acesso seria possível se o pombo não bicasse o primeiro
disco. O resultado disso foi que os pombos de Grosh e Neuringer (2002) esperaram mais nessa
condição, replicando, portanto, o trabalho de Mischel et al. (1972).
Grosh e Neuringer (1981) manipularam ainda outras condições igualmente semelhantes às
condições de Mischel et al. (1972), gerando resultados semelhantes. Entretanto, houve diferenças
metodológicas como, por exemplo, o fato de Grosh e Neuringer terem colocado seus pombos em
contato com a contingência de espera pelo reforçador preferido por mais de uma vez.
Dentro do Brasil, Kerbauy (1981) e Kerbauy e Buzzo (1991) produziram replicações das pesquisas
de Mischel et al. com crianças. No primeiro estudo, manipularam-se as variáveis de qualidade e
atraso do reforço (Kerbauy, 1981). As crianças escolhiam entre diferentes tipos de chocolate. No
segundo estudo, manipularam-se as variáveis de magnitude (definida como quantidade) e atraso
do reforço (Kerbauy & Buzzo, 1991). As crianças escolhiam entre seis e três balas. Nesse estudo, as
crianças foram submetidas à contingência de espera por mais de uma vez e os efeitos disso, sobre o
tempo de espera, foram avaliados pelas autoras. Foi verificado que as crianças esperaram mais sob
essas circunstâncias.
Mais recentemente, Bernardes (2011) também conduziu replicações do modelo de atraso da
gratificação em crianças. Uma vez que esse autor também manipulou as variáveis de magnitude e
atraso do reforço, sua pesquisa teve, por objetivo, avaliar o tempo de espera pelo reforçador maior
atrasado quando outra criança ou um fantoche estavam presentes na sala onde se deveria esperar. Ao
todo, foram três as condições experimentais de Bernardes (2011):
1. avaliar o tempo de espera com apenas uma criança presente na sala;
2. avaliar se a presença de um fantoche aumentaria o tempo de espera e se serviria para evocar
Comportamento em Foco 1 | 2011

verbalizações de eventos encobertos;


3. avaliar se o tempo de espera aumentaria quando duas crianças estivessem presentes na sala,
considerando a possibilidade de que uma manipulasse variáveis de modo a controlar o
comportamento da outra (Skinner, 1953/2003).
Matos . Bernardes

Bernardes (2011) chegou aos seguintes resultados: das 15 crianças que participaram na pesquisa,
11 esperaram os 15 minutos pelo reforçador maior atrasado. Na condição “sozinho”, duas das quatro
crianças que participaram esperaram; na condição “fantoche”, todas as três crianças que participaram
esperaram. Os dados sugerem que o fantoche não funcionou como audiência para a emissão de

397
descrições de eventos encobertos; na condição “duplas”, seis das oito crianças (formando duplas)
esperaram e, nas duplas que esperaram, uma criança pode ter servido a função de agente controlador
sobre a outra, manipulando variáveis (verbais, por exemplo) para controlar o comportamento
da outra de esperar. Diferentemente dos dados obtidos no estudo de Kerbauy e Buzzo (1991), os
participantes que esperaram emitiram um número maior de respostas por minuto do que os que não
esperaram.
As pesquisas do grupo de Mischel (Mischel & Ebbesen, 1970; Mischel et al., 1972), assim como
suas replicações por analistas do comportamento (Bernardes; 2011; Grosh & Neuringer, 1981;
Kerbauy, 1981; Kerbauy & Buzzo, 1991) sobre o modelo de autocontrole pelo atraso da gratificação,
portanto, apresenta semelhanças com o que se tem na literatura de Análise do Comportamento sobre
comportamentos de autocontrole, na medida em que, em ambos os casos, tais comportamentos
podem ser definidos como escolha do reforçador maior (ou mais preferido) atrasado sobre o
reforçador menor (ou menos preferido) imediato. O fato de o grupo de Mischel (Mischel & Ebbesen,
1970; Mischel et al., 1972) ter manipulado qualidade do reforço em vez de magnitude é importante
por ilustrar possíveis outras variáveis que podem estar envolvidas (além de magnitude e atraso) nas
investigações experimentais sobre comportamentos denominados de autocontrole.
Além disso, certas pesquisas relatadas (Kerbauy, 1981; Kerbauy & Buzzo, 1991; Bernardes, 2011)
servem para ilustrar como o contexto da tomada de decisão de seres humanos é mais complexo do
que o que se verifica nos contextos experimentais das pesquisas com animais não-humanos como
pombos (Rachlin, 1994). Neste sentido, vale destacar que as descrições de contingências (regras)
influenciam bastante a tomada de decisão de humanos. Diferentes descrições podem controlar
diferentes escolhas e contingências relevantes derivadas da história de vida exercem bastante
influência sobre a tomada de decisão em humanos (Rachlin, 1994).
É possível, ainda, outra consideração importante referente ao modelo de autocontrole pelo atraso
da gratificação: a descrição de contingência por parte do experimentador sobre pedir às crianças
que pensassem em como uma guloseima como um pretzel é crocante e salgadinho, salientando
suas características reais (Mischel, Shoda & Rodriguez, 1989), serviria a função de uma operação
estabelecedora que aumentaria o valor reforçador do pretzel e do outro reforçador ao qual as crianças
poderiam ter acesso caso esperassem 15 minutos (marshmallow) (Mallot & Mallot, 1991).
Em suma, o tema do autocontrole tem sido explorado por autores dentro e fora da análise do
comportamento. Investigações sobre os modelos discutidos até aqui (experimentais ou não)
influenciaram e influenciam pesquisadores com interesse no tema. Como, por exemplo, a discussão
realizada por Matos e Bernardes (2010) sobre uma série de variáveis manipuladas nas situações
de autocontrole com humanos (especialmente crianças) através do levantamento de pesquisas
experimentais sobre comportamentos de autocontrole (dissertações e qualificações de mestrado)
de um programa de pós-graduação em Psicologia Experimental. A importância desse tipo de
estudo se apoia na proposta de Hanna e Todorov (2002), em que o estudo de comportamentos de
autocontrole implica análises de muitos parâmetros (variáveis) e o que tem sido feito (no laboratório)
parece insuficiente para dar conta do conceito de autocontrole e de tudo que Skinner (1953/2003)
Comportamento em Foco 1 | 2011

considerou como comportamentos de autocontrole. Neste sentido, o presente artigo apresenta-se


como mais uma contribuição para o entendimento das variáveis envolvidas no autocontrole.
Matos . Bernardes

Referências Bibliográficas

Bernardes, L. A. (2011). O que acontece durante o período de espera? Contribuições para o estudo
do autocontrole. Dissertação de mestrado, Programa de Estudos Pós-Graduados em Psicologia
Experimental: Análise do Comportamento, Pontifícia Universidade Católica de São Paulo, São Paulo.

398
Green, L., & Rachlin, H. (1996). Commitment using punishment. Journal of the Experimental
Analysis of Behavior, 65, 593-601.
Grosh, J. & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the
Experimental Analysis of Behavior, 35, 3-21.
Hanna, E. S. & Todorov, J. C. (2002). Modelos de Autocontrole na Análise Experimental do
Comportamento: Utilidade e Crítica. Psicologia: Teoria e Pesquisa, 18 (3), 337-343.
Kerbauy, R. R. (1981). Um estudo sobre espera de recompensa: possibilidades que essa situação
apresenta. Boletim de Psicologia, 33, 52-57.
Kerbauy, R. R. & Buzzo, M. P. (1991). Descrição de algumas variáveis no comportamento de esperar
por recompensas previamente escolhidas. Psicologia USP, 2, 77-84.
Malott, R.W. & Malott, M.E. (1991). Private Events and Rule-Governed Behavior. In: S.C. Hayes, L.J.
Hayes, M. Sato & K. Ono (Ed.), Dialogues on Verbal Behavior. (pp. 237-254). Reno: Context Press.
Matos, D.C. & Bernardes, L.A. (2010). Uma análise das pesquisas de autocontrole do PEXP: variáveis
manipuladas e sua relação com modelos no estudo do autocontrole. Behaviors, 14, 57–68.
Mazur, J. E. & Logue, A.W. (1978). Choice in a self-control paradigm: Effects of a fading procedure.
Journal of the Experimental Analysis of Behavior, 30, 11-17.
Mischel, W. & Ebbesen, E. (1970). Attention in delay of gratification. Journal of Personality and Social
Psychology, 16, 329-337.
Mischel, W., Ebbesen, E. & Zeiss, A. R. (1972). Cognitive and attentional mechanisms in delay of
gratification. Journal of Personality and Social Psychology, 21, 204-218.
Mischel, W., Shoda, Y., & Rodriguez, M.L. (1989). Delay of gratification in children. Science, 244,
933-938.
Rachlin, H. (1970) Introduction to modern behaviorism. San Francisco: W. H. Freeman and Co.
Rachlin, H. & Grenn, L. (1972). Commitment, choice and self-control. Journal of Experimental
Analysis of Behavior, 17, 15-22.
Rachlin, R., Castrogiovanni, A.,& Cross, D. (1987). Probability and delay in commitment. Journal of
the Experimental Analysis of Behavior, 48, 347-353.
Rachlin, H. (1994). The Context of Pigeon and Human Choice. In: S.C. Hayes, L.J. Hayes, M. Sato
(Ed.), Behavior Analysis of Language and Cognition. (pp. 301-319). Reno: Context Press.
Rachlin, H. (2000). The Science of Self-Control. Cambridge; London: Harvard University Press.
Siegel, E. & Rachlin, H. (1995). Soft commitment: Self-control achieved by response persistence.
Journal of the Experimental Analysis of Behavior, 64, 117-128.
Skinner, B. F. (2003). Ciência e comportamento humano. Tradução organizada por J.C. Todorov & R.
Azzi. São Paulo: Edart (trabalho original publicado em 1953).
Comportamento em Foco 1 | 2011
Matos . Bernardes

399

Você também pode gostar