Autocontrole Uma Anc3a1lise Dos Modelos Experimentais Do Compromisso e Do Atraso Da Gratificac3a7c3a3o
Autocontrole Uma Anc3a1lise Dos Modelos Experimentais Do Compromisso e Do Atraso Da Gratificac3a7c3a3o
do atraso da gratificação
Hanna e Todorov (2002) apresentam o modelo de Skinner como não experimental e sendo
parcialmente contemplado nos outros dois modelos que são experimentais (Rachlin e Mischel). Os
autores descrevem também que esses modelos experimentais não são suficientes para dar conta de
muitos comportamentos que podem também ser considerados casos de autocontrole.
Skinner (1953/2003) foi o primeiro analista do comportamento a apresentar uma análise de
comportamentos que são chamados de autocontrole. Para esse autor, o autocontrole refere-se a
Comportamento em Foco 1 | 2011
comportamentos que envolvem algum conflito de contingências. Uma mesma resposta (controlada)
pode produzir duas consequências conflitantes: reforçador positivo (SR+) e reforçador negativo (SR-).
Skinner (1953/2003) descreve que outra resposta (controladora ou de autocontrole) pode ser emitida
pelo próprio indivíduo, diminuindo assim a probabilidade de emissão da resposta (controlada) que
gera as conseqüências conflitantes.
1 Texto baseado em Simpósio apresentado no XIX Encontro da Associação de Psicoterapia e Medicina Comportamental e Cognitiva de
2010 em Campos do Jordão, São Paulo. Os autores agradecem pelo apoio e ajuda da professora Dra. Nilza Micheletto na organização
do trabalho.
387
Um exemplo que Skinner (1953/2003) apresenta para ilustrar seu modelo é o caso de um alcoolista.
A ação de beber gera conseqüências conflitantes: SR+ (prazer, euforia) e SR- (ressaca). Para
apresentar autocontrole, é necessário que a pessoa emita uma resposta controladora que diminua a
probabilidade do beber (resposta controlada).
As considerações de Skinner (1953/2003) sobre os comportamentos chamados de autocontrole
antecederam os trabalhos sobre os modelos experimentais de dois pesquisadores e seus colaboradores
(dentro e fora da Análise do Comportamento) já mencionados: o paradigma de compromisso de
Rachlin e colaboradores, contemplado em vários de seus artigos (Rachlin & Green, 1972; Rachlin,
Castrogiovanni & Cross, 1987; Siegel & Rachlin ,1995; Green & Rachlin, 1996) e o paradigma do
atraso da gratificação de Mischel e colaboradores (Mischel & Ebbesen, 1970; Mischel et al, 1972). O
objetivo do presente trabalho foi analisar os modelos experimentais desses autores, estabelecendo
relações entre os mesmos e analisando as características de variáveis que influenciam as tomadas de
decisão de não-humanos (pombos) e humanos.
O modelo de compromisso
A apresentação das pesquisas sobre compromisso obedeceu a uma sequência cronológica com o
intuito de avaliar como o modelo é trabalhado através do tempo, assim como discutir as variáveis
manipuladas. O modelo ilustrado pelo artigo de Rachlin e Green (1972) consistiu no primeiro
modelo experimental de analistas do comportamento que se interessaram pelo estudo sobre
comportamentos de autocontrole. Representa o primeiro artigo no tema publicado no JEAB (Journal
of the Experimental Analysis of Behavior) e, após o mesmo, uma série de pesquisas experimentais foi
e continua sendo produzida. Vale destacar, ainda, que todas as pesquisas sobre compromisso aqui
relatadas foram publicadas no JEAB.
A pesquisa de Rachlin e Green (1972) trabalhou com esquemas concorrentes encadeados. Cinco
pombos foram sujeitos em uma câmara experimental com dois discos em uma de suas paredes. Cada
esquema era representado por uma cadeia com dois elos (Ver Figura 1).
4s
R2 4s
FR25 T
A
6s
R1 2s
4s
B 4s
T R2
FR25
Figura 1
Esquemas concorrentes encadeados da pesquisa de Rachlin e Green (1972). Durante o
Comportamento em Foco 1 | 2011
Como se vê na Figura 1, o primeiro elo representa uma condição de escolha entre dois discos nos
quais os pombos poderiam bicar. Para cada disco nesse elo estava em vigor um esquema de razão
fixa (FR25). Após a vigésima quinta bicada em um dos discos, cada pombo passaria para o segundo
elo. Se a vigésima quinta bicada fosse feita no disco A, após a passagem de T segundos, começaria, no
segundo elo, uma nova condição de escolha. Cada pombo deveria escolher entre dois discos (cada
388
um sob esquema de CRF): R2, que permitiria o acesso a um reforçador maior (04 segundos de acesso
a alimento) e atrasado (após 04 segundos); e R1 que permitiria o acesso a um reforçador menor
(02 segundos de acesso a alimento) e imediato (nenhum atraso). Os 06 segundos que se seguiam
ao acesso ao reforçador imediato foram manipulados para que o tempo total em cada condição
fosse aproximadamente o mesmo. Do contrário, os pombos poderiam ter acesso a uma taxa total de
reforços (ao final da sessão) em R1 que poderia superar a taxa total de reforços obtidos a partir de R2.
No primeiro elo de escolha entre os discos A e B, se a vigésima quinta bicada fosse feita no disco
B, após a passagem de T segundos, começava o segundo elo que não representava uma condição de
escolha. Havia apenas um disco, o R2 (sob esquema de CRF), que permitia o acesso ao reforçador
maior e atrasado. Selecionar o disco B no primeiro elo da cadeia, para Rachlin e Green (1972)
significava comprometer-se com o reforçador de R2.
Para que fosse possível estabelecer o compromisso com o reforçador maior e atrasado, Rachlin
e Green (1972) variaram os valores de T (tempo entre os elos das duas possíveis cadeias, expresso
em segundos). Os autores manipularam os seguintes valores de T: 0.5, 1, 2, 4, 8, 16, 8, 4, 2, 1 e 0.5 s
(apresentados nessa ordem para cada pombo). Como resultados, Rachlin e Green (1972) verificaram
que, quando T tinha um baixo valor (por exemplo, 0.5 s), os pombos preferiam o disco A no primeiro
elo, o que levava a um segundo elo com a escolha entre R1 e R2 e uma forte preferência por R1,
que permitia o acesso ao reforçador menor e imediato. Caso T tivesse um alto valor (por exemplo,
16 s), acontecia o que os autores chamaram de “reversão da preferência” (fenômeno discutido
inicialmente em Rachlin, 1970) no primeiro elo, sendo que os pombos passavam a preferir o disco B,
comprometendo-se, portanto, com o reforçador maior e atrasado no segundo elo.
Segundo Rachlin e Green (1972), a preferência pelo disco B no primeiro elo justificava-se pelo
fato de o acesso aos dois tipos de reforçadores (4s e 2s de acesso a alimento) ser atrasado em função
do alto valor de T (16s) nas duas possibilidades de cadeia. Relacionando esse experimento com a
escolha de humanos na vida real, pode-se descrever o seguinte exemplo: suponha que se pergunte a
uma criança se a mesma prefere um biscoito agora ou dois amanhã. Certamente, a mesma preferirá
o reforçador menor e mais imediato, dada a sensibilidade da escolha a conseqüências imediatas. No
entanto, caso se pergunte à criança se prefere um biscoito daqui a nove dias ou dois daqui a dez dias,
possivelmente preferirá dois biscoitos após dez dias (maior sensibilidade à magnitude do reforço),
dado que, nesse caso, os dois reforçadores estarão atrasados. No entanto, conforme o tempo passa, a
criança poderá reverter sua preferência no momento em que puder ter acesso a um biscoito agora e
ainda faltar um dia para ter os dois biscoitos. A criança certamente preferiria novamente um biscoito
agora. Seria necessário, portanto, que a criança de alguma maneira se comprometesse (resposta de
compromisso) com o reforçador maior no momento em que ambos os reforçadores (com maior e
menor magnitude) ainda seriam atrasados, eliminando, assim, a possibilidade de reversão para a
escolha do reforçador menor e imediato (Green & Rachlin, 1996; Rachlin, 2000).
É importante destacar que, para Rachlin (2000), na vida real, as pessoas freqüentemente quebram os
seus compromissos. Os pombos da pesquisa de Rachlin e Green (1972) não tinham essa possibilidade
ao se comprometerem com o reforçador maior e atrasado no momento em que as duas opções de
Comportamento em Foco 1 | 2011
escolha envolviam reforçadores atrasados (primeiro elo da cadeia). Esse tipo de compromisso tão
estrito seria possível na vida real de humanos, para Rachlin (2000), em situações muito específicas.
Considere, por exemplo, o caso de um alcoolista que quer parar de beber. A pessoa opta por internar-
se em uma clínica de reabilitação onde não teria, diga-se, a menor possibilidade de acesso ao álcool.
Matos . Bernardes
Rachlin (2000) descreve essa situação do alcoolista como um caso de compromisso estrito
semelhante ao que aconteceu com os pombos da pesquisa de Rachlin e Green (1972). Neste
sentido, é interessante destacar que (conforme o tempo passa) a reversão da preferência para o
que seria o caminho mais imediato ou impulsivo (acesso ao álcool para o alcoolista ou alimento de
menor magnitude e imediato no caso dos pombos) não seria possível porque o compromisso foi
389
estabelecido no momento em que a preferência por aquela que seria a opção de autocontrole (não
beber, ficar sóbrio para o alcoolista ou alimento de maior magnitude e maior atraso dos pombos)
era significativamente maior, e a reversão posterior da preferência não seria mais uma possibilidade.
Entretanto, casos como o do alcoolista que decide se internar para comprometer-se com o não beber,
conforme descreve o próprio Rachlin (2000), são raros e as pessoas que querem parar de beber
normalmente não necessariamente se retiram do ambiente no qual o álcool está presente.
A pesquisa de Rachlin e Green (1972) representou o ponto de partida para outras pesquisas
que exploraram o paradigma do compromisso. Rachlin et al. (1987) trabalharam esse paradigma
em sujeitos adultos humanos. Nesse caso, os autores ainda manipulavam a variável magnitude do
reforço. O atraso, no entanto, foi substituído pela variável probabilidade do reforço. A decisão de se
trabalhar com uma variável como probabilidade teria sido influenciada pelo trabalho de psicólogos
cognitivistas que apregoavam que os parâmetros de probabilidade e atraso do reforço seriam
funcionalmente semelhantes (Rachlin et al., 1987). Isso significaria que um reforçador atrasado
seria equivalente a um reforçador pouco provável e que um reforçador imediato seria equivalente
a um reforçador com alta probabilidade. Rachlin et al. (1987), a princípio, estavam interessados em
demonstrar que isso não seria verdadeiro e que unicamente o atraso do reforço seria o parâmetro
crítico para o autocontrole. A Figura 2 representa a pesquisa delineada por Rachlin et al. (1987) e
suas variáveis manipuladas.
$4
R2 1-5
q
A
$1
R1 1 - 17
$5
B 1-4
q R2
Figura 2
Esquemas concorrentes encadeados da pesquisa de Rachlin et al. (1987) com adultos
humanos manipulando probabilidade de reforço.
A Figura 2 é bastante semelhante à Figura 1 que retrata a pesquisa de Rachlin e Green (1972). No
entanto, os reforçadores primários foram substituídos por reforçadores condicionados (dinheiro)
com diferentes magnitudes e diferentes probabilidades de ocorrência. A variável que representaria
a passagem entre os elos da cadeia (t) foi também substituída pela variável (q) que significa
probabilidade.
A maneira como a pesquisa de Rachlin et al. (1987) foi conduzida (com estudantes universitários)
pode ser observada na Figura 3.
Comportamento em Foco 1 | 2011
participante, após receber as 20 fichas, deveria distribuir as fichas entre os dois primeiros cartões
de escolha (A e B). Cada participante deveria colocar uma ficha por vez. Seria possível distribuir as
fichas na sequência que quisesse. Ao colocar cada ficha em A ou B, o experimentador girava uma
roleta que permitiria, ao participante, avançar para um segundo elo a depender do número no qual
o ponteiro da roleta parasse e da probabilidade da ficha apostada.
390
Probabilidade do Reforço
14 13 12
11
15
16 10
17 9
18 8
1 7
2 6
3 4 5
$1 $4 $5
1 - 17 1-5 1-4
1 - 15 1 - 15
A B
1-3 1-3
10
CRF 11 universitários
10
Figura 3
Configuração da situação de coleta à qual os participantes da pesquisa de Rachlin et
al. (1987) foram submetidos. Os círculos preenchidos com preto representam fichas
vermelhas. Os círculos preenchidos com cinza representam fichas azuis.
Se, por exemplo, um participante tivesse apostado uma ficha vermelha em A ou B, sendo que a ficha
vermelha era de alta probabilidade (01-15), o experimentador girava a roleta e, se o ponteiro parasse,
por exemplo, no número 10, então o participante poderia passar para o segundo elo (uma nova
condição de escolha, no caso). Nessa nova condição, a depender do cartão escolhido no primeiro elo,
o participante recebia uma ficha branca que poderia ser apostada em dois outros cartões (caso tivesse
escolhido A no início). O participante escolhia um dos cartões e o experimentador girava a roleta.
Esse momento representava a escolha entre reforçador menor e com alta probabilidade (01 dólar se
o ponteiro da roleta parasse em um número de 01 a 17) e reforçador maior com baixa probabilidade
(04 dólares caso o ponteiro parasse em um número de 01 a 5).
Se no princípio, entretanto, o participante tivesse apostado a ficha vermelha em B, haveria a
possibilidade de passagem para o segundo elo que seria uma condição de comprometimento com
o reforçador maior e menos provável (ganhar 5 dólares caso o ponteiro da roleta, nesse momento,
parasse em um número de 01 a 04).
Os exemplos ilustrados, nos dois últimos parágrafos também valiam para as fichas azuis. A
diferença está no fato de que as fichas azuis eram fichas de baixa probabilidade (01-03). No primeiro
elo (independentemente de escolher A ou B), após a roleta ser girada pela primeira vez, o participante
apenas poderia passar para o segundo elo (nova escolha após A ou compromisso após B) se o ponteiro
da roleta parasse em um número de 01 a 03.
Os resultados da pesquisa de Rachlin et al. (1987) revelaram que os participantes tenderam
a apostar primeiramente cada uma das fichas vermelhas (alta probabilidade). Essas fichas foram
Comportamento em Foco 1 | 2011
consistentemente apostadas em A e, quando ocorria a passagem para o segundo elo (nova escolha)
que era bastante provável, os participantes recebiam a ficha branca e apostavam no cartão que permitia
o acesso a 01 dólar com alta probabilidade (ponteiro parando nos números de 01 a 17 na roleta).
Por outro lado, os participantes apostaram as fichas azuis (baixa probabilidade) consistentemente
Matos . Bernardes
em B no primeiro elo. A probabilidade de passagem para o segundo elo era baixa (o ponteiro teria
que parar em um número de 01 a 03), mas quando isso eventualmente ocorria, os participantes
tinham acesso ao reforçador maior e menos provável (05 dólares caso o ponteiro agora parasse em
um número de 01 a 04 na roleta). A escolha de B, no primeiro elo, representava o compromisso com
o reforçador maior e menos provável no segundo elo.
391
Rachlin et al. (1987) discutem seus resultados relacionando-os com os dados da pesquisa de
Rachlin e Green (1972) da seguinte maneira: as fichas vermelhas tiveram uma função semelhante ao
T (tempo entre os elos) da pesquisa de Rachlin e Green (1972) quando T consistia, por exemplo, em
0.5 segundo. Os pombos preferiam A no primeiro elo e preferiam o reforçador menor imediato na
segunda condição de escolha. Os participantes humanos da pesquisa de Rachlin et al. (1987) apostavam
cada ficha vermelha em A. Por serem fichas com alta probabilidade, passavam frequentemente para
o segundo elo (nova condição de escolha) e escolhiam consistentemente o reforçador menor e mais
provável (01 dólar).
As fichas azuis de Rachlin et al. (1987), por outro lado, seriam semelhantes ao T longo (16
segundos) de Rachlin e Green (1972). Nesta pesquisa, quando isso acontecia, os pombos escolhiam
principalmente B (primeiro elo), comprometendo-se (no segundo elo) com o reforçador de maior
magnitude e maior atraso. Em Rachlin et al., as fichas azuis eram sistematicamente apostadas em
B (primeiro elo). Essa escolha representava (quando ocorria a passagem de um elo para o outro) o
compromisso com o reforçador maior e menos provável do segundo elo (05 dólares).
Ainda que as duas pesquisas tenham sido desenvolvidas com diferentes participantes ou sujeitos
(pombos X seres humanos), Rachlin et al. (1987) concluem que o atraso e a probabilidade seriam
parâmetros funcionalmente semelhantes. Um reforçador atrasado é como um reforçador pouco
provável, e um reforçador imediato (ou menos atrasado) é como um reforçador muito provável. Os
dados reforçam o argumento de que a sensibilidade a reforçadores imediatos ou altamente prováveis é
significativamente maior em comparação à sensibilidade a reforçadores atrasados ou pouco prováveis
em uma situação de escolha com esquemas concorrentes. Aumentar a sensibilidade a reforçadores
atrasados ou pouco prováveis em uma situação de escolha implica, para Rachlin e Green (1972) e
Rachlin et al. (1987), a necessidade de algum tipo de compromisso quando ambos os reforçadores
de cada esquema são atrasados ou pouco prováveis. No caso de Rachlin et al. (1987), a partir do
momento em que os participantes contavam unicamente com fichas azuis (de baixa probabilidade)
para distribuir entre A e B no primeiro elo, ambos os reforçadores do momento que se seguia a A ou o
reforçador do momento que se seguia a B tornavam-se menos prováveis, o que, nesse caso, foi crítico
para a escolha de B no primeiro elo, quando se apostavam as fichas azuis.
A próxima pesquisa a ser relatada (Siegel & Rachlin, 1995) apresenta características distintas
quando comparadas com as duas outras pesquisas sobre compromisso. Não se fala mais, nesse
momento, sobre respostas de compromisso e o procedimento não envolveu esquemas concorrentes
encadeados com dois elos. Autocontrole é ainda definido como a escolha de um reforçador maior
atrasado sobre outro menor imediato. No entanto, não se fala aqui sobre um tipo de compromisso
que elimine a possibilidade futura de escolha do reforçador menor imediato no momento em que
ambos os reforçadores (maior e menor) ainda são atrasados.
Conforme já foi discutido, um alcoolista, por exemplo, não necessariamente tem que se encarcerar
em uma clínica para eliminar a possibilidade de controle pelo imediato (bebida agora). As pessoas
podem demonstrar comportamentos de autocontrole mesmo quando estão inseridas no ambiente
em que a “tentação” (álcool, por exemplo) se faz disponível. O autocontrole em casos como esse não
Comportamento em Foco 1 | 2011
envolve um tipo de compromisso estrito, mas parte do princípio de que, quando nos comportamos
frequentemente de outras maneiras, tendemos a formar padrões comportamentais bastante
resistentes à mudança.
Tome-se outro caso: alguém pode claramente preferir chocolate à salada. Comer chocolate
Matos . Bernardes
em vez de salada envolve, nesse caso, uma mera questão de preferência. No entanto, alguém que
declare preferir chocolate, mas come a salada, está se autocontrolando. Na medida em que a pessoa
passa a comer alimentos saudáveis como salada tão sistematicamente, isso tende a formar padrões
de comportamento muito fortalecidos. Romper com os mesmos envolve um custo. O padrão
eventualmente pode ser quebrado (a pessoa eventualmente come o chocolate), mas isso envolve um
392
custo. O autocontrole estabelecido a partir de padrões de comportamento representa uma forma
de compromisso (Rachlin, 2000). Não é uma forma de compromisso estrito como a apresentada
inicialmente por Rachlin e Green (1972) e, depois, por Rachlin et al. (1987). Trata-se de uma forma
de compromisso suave (soft commitment). Na vida real, as pessoas quebram seus compromissos. O
estabelecimento de padrões comportamentais, no entanto, pode tornar isso menos provável.
Siegel e Rachlin (1995) demonstraram o soft commitment experimentalmente no laboratório, tendo
pombos como sujeitos. O delineamento envolveu o que corresponderia ao segundo elo da cadeia de
Rachlin e Green (1972) em que autocontrole implica escolha de reforçador maior e atrasado sobre
um reforçador menor e mais imediato, sem a presença de qualquer forma de compromisso explícito
(ver Figura 4).
Figura 4
Autocontrole como escolha entre reforçador maior e atrasado (autocontrole) e
reforçador menor e imediato (impulsividade). A pesquisa de Siegel e Rachlin (1995) está
representada pela área delimitada pelo círculo. Representa basicamente aquele que seria
o segundo elo da cadeia de Rachlin e Green (1972).
O que marca uma diferença entre o segundo elo do trabalho de Rachlin e Green (1972) e a pesquisa
sobre o estabelecimento do autocontrole pela formação de padrões comportamentais (Siegel &
Rachlin, 1995), é o fato de, nesse caso, os autores terem manipulado diferentes tipos de esquemas de
reforçamento (CRF, FI30, FR31 e SigFR31). Os resultados do trabalho de Siegel e Rachlin envolveram
maior frequência de respostas de escolha por reforçador maior e atrasado quando o esquema
manipulado em cada um dos dois discos foi o FR31 e o SigFR31.
Esquemas de razão fixa que contam com altas razões tendem a gerar uma preferência por um dos
componentes de escolha, produzindo padrões comportamentais bastante rígidos (Rachlin, 2000).
Uma vez que cada pombo começava a bicar no disco correlacionado com reforçador maior atrasado,
dificilmente mudava para o outro disco (o que era possível nessa pesquisa e eventualmente ocorria).
Para Siegel e Rachlin (1995), o que teria favorecido a preferência pelo reforçador maior atrasado
seria o fato de os dois reforçadores (dos dois componentes) se tornarem atrasados por causa do
FR31 (em vigor em cada componente). O tempo necessário para um pombo emitir 31 bicadas é
longo e favorece maior sensibilidade ao reforçador com maior magnitude. Na condição com FR31, o
Comportamento em Foco 1 | 2011
interromper um padrão de seleção de reforçador maior e atrasado gerado pelo esquema de FR31.
Como resultado, os autores verificaram que, apesar da breve interrupção do blackout, o padrão foi
mantido. O reforçador maior atrasado foi obtido em 50% das vezes.
Por fim, Siegel e Rachlin (1995) manipularam um esquema de intervalo fixo de 30 segundos
(FI 30 segundos) em cada componente de escolha. Os autores verificaram que, nessa condição, os
393
pombos tiveram maior preferência pelo reforçador menor e imediato. Um esquema de FI reforça
a primeira resposta após a passagem de um período de tempo determinado. Tende a gerar breves
pausas no responder, seguidas por longos jorros de responder rápido (Rachlin, 2000). Como, nesse
esquema, houve várias interrupções em função das pausas, os pombos de Siegel e Rachlin (1995)
tinham muitas oportunidades para alternarem o responder entre os dois componentes de escolha.
Ainda que os pombos tivessem uma forte tendência a bicar o disco correlacionado com reforçador
maior atrasado, eles frequentemente mudavam para o disco correlacionado com reforçador menor
imediato. Em função disso, os pombos de Siegel e Rachlin (1995) escolheram o reforçador maior
atrasado em, aproximadamente, 25% das vezes. O esquema de FI eficazmente interrompeu o padrão
(de selecionar reforçador maior atrasado) que tinha sido estabelecido pelo FR31 e mantido pelo
SigFR31.
A pesquisa de Green e Rachlin (1996) representou um novo retorno ao paradigma do compromisso
inaugurado pelo trabalho de Rachlin e Green (1972). Envolveu esquemas concorrentes encadeados
com dois elos e respostas de compromisso. O delineamento é quase o mesmo, mas tem uma diferença
que está ilustrada na Figura 5 pela segunda condição de escolha que se segue à opção B do
primeiro elo.
4s
FR3 T
A
2s
B 4s
T
FR3
30 s de blackout
(punição)
2s
Figura 5
Esquemas concorrentes encadeados da pesquisa de Green e Rachlin (1996). A e B
representam os discos concorrentes do primeiro elo. O segundo elo representa uma
nova condição de escolha tanto quando se segue a A como quando se segue a B.
O primeiro elo é representado pela escolha entre os discos A e B. Em cada um deles, está em
vigor um esquema FR3. Quando T (tempo entre os elos) era curto, os pombos preferiam A e, após
a passagem para o segundo elo, escolhiam entre reforçador maior atrasado versus reforçador menor
imediato. Nesses casos, os pombos preferiam o reforçador menor imediato (como em Rachlin &
Green, 1972). Quando T era longo, os pombos preferiam B no primeiro elo e, após a passagem para
Comportamento em Foco 1 | 2011
o segundo elo, diferente do que ocorria com Rachlin e Green (1972) (compromisso com reforçador
maior atrasado), havia uma nova condição de escolha entre reforçador maior atrasado versus
reforçador menor imediato. Neste caso, no entanto, escolher o reforçador menor imediato implicava
um tipo de punição. Esta consistia em um blackout (com 30 segundos de duração) após o acesso ao
Matos . Bernardes
reforçador imediato.
Green e Rachlin (1996) descreveram que os pombos tendiam a escolher o reforçador maior atrasado
com maior frequência nesses casos. Seria um tipo de compromisso estabelecido pela punição. No
entanto, os autores descreveram que os pombos eventualmente selecionavam o reforçador menor
imediato apesar da punição. Em função disso, é possível estabelecer uma relação com o trabalho
394
de Siegel e Rachlin (1995): parece que, em ambas as pesquisas, deixar de responder sob controle do
reforçador maior atrasado envolve um custo. Em Siegel e Rachlin trata-se do custo de interromper
um padrão comportamental (de seleção de reforçador maior atrasado). Em Green e Rachlin (1996),
trata-se da possibilidade do responder ser punido, caso mude para o disco correlacionado com
reforçador menor imediato, que era seguido por punição.
Rachlin (2000) discute que, assim como o caso do compromisso estrito (Rachlin & Green, 1972), o
compromisso pela punição (Green & Rachlin, 1996) na vida real dos seres humanos é bastante raro.
Considere, por exemplo, o caso de um alcoolista que deseja parar de beber. Ele poderia comprometer-
se com o não beber na medida em que ingeriria uma substância (antabuse) que resultaria em forte
desconforto físico caso a pessoa bebesse depois. No entanto, poderia acontecer de a pessoa, em algum
momento, beber a despeito de sentir-se mal (punição). O compromisso então, nesse caso, poderia ser
eventualmente quebrado.
Pôde-se verificar que as pesquisas do JEAB (Journal of the Experimental Analysis of Behavior)
sobre o modelo de autocontrole pelo compromisso sofreram alterações através do tempo. A primeira
pesquisa do modelo de compromisso (Rachlin & Green, 1972) foi feita com pombos e caracterizou
um tipo de compromisso estrito (strict commitment), em que a possibilidade de escolha de um
reforçador menor imediato seria eliminada em função do comprometimento com o reforçador
maior atrasado, no momento em que ambos os reforçadores seriam atrasados. Em seguida, Rachlin
et al. (1987) trabalharam com o modelo de compromisso estrito em humanos adultos universitários.
A variável de atraso foi substituída por probabilidade, e os autores buscaram verificar se esses dois
parâmetros (atraso e probabilidade) seriam funcionalmente semelhantes. Os dados dos autores
sugeriram que sim.
A pesquisa na sequência (Siegel & Rachlin, 1995) trabalhou com um modelo de compromisso que
os autores chamaram de suave (soft commitment), tendo pombos como sujeitos. Não se trabalhou
nesse estudo com esquemas concorrentes encadeados da maneira como aconteceu nas duas outras
pesquisas (Rachlin & Green 1972; Rachlin et al., 1987). Não se tinha um primeiro elo onde se emitia
uma resposta de compromisso. Autocontrole, agora, simplesmente passava a implicar a escolha de
reforçador maior atrasado sobre reforçador menor imediato, sem qualquer compromisso explícito.
O modelo de Siegel e Rachlin (1995) foi chamado de compromisso suave em função da manipulação
de esquemas concorrentes de razão fixa com alta razão (FR31). Esse tipo de esquema tende a gerar
forte preferência por um dos componentes de escolha. Os pombos poderiam variar o responder
entre os componentes (com reforçador maior atrasado X com reforçador menor imediato), mas uma
vez que começava a responder sob controle de um deles, formava-se um padrão que dificilmente
seria quebrado em função simplesmente do custo de interromper-se um padrão. Além disso, o fato
de se ter esquemas de razão fixa com alta razão tornava ambos os reforçadores de cada esquema mais
atrasados em função de os pombos levarem tempo para cumprirem com o critério de cada esquema.
Sendo assim, os autores argumentaram que isso foi crítico no estabelecimento da preferência pelo
reforçador maior atrasado, representando uma forma de compromisso (Siegel & Rachlin, 1995;
Rachlin, 2000).
Comportamento em Foco 1 | 2011
Por fim, a pesquisa de Green e Rachlin (1996) representou um retorno ao modelo de compromisso
estrito, tendo pombos como sujeitos. A diferença ficou por conta do segundo elo que se seguia à
escolha da opção de compromisso (do primeiro elo). Diferentemente do que aconteceu com Rachlin
e Green (1972) e Rachlin et al. (1987), esse segundo elo representou uma nova condição de escolha
Matos . Bernardes
entre reforçador maior atrasado versus reforçador menor e imediato. No entanto, nessa pesquisa, a
escolha do reforçador menor imediato era seguida por um tipo de punição (blackout de 30 segundos),
o que acabou por estabelecer a preferência pelo reforçador maior atrasado. Isso representou um tipo
de compromisso que, assim como na pesquisa de Siegel e Rachlin (1995), poderia ser quebrado, mas
isso envolveria um custo. No caso da pesquisa de Green e Rachlin o custo significaria uma punição.
395
A sessão seguinte discutirá um modelo de autocontrole cognitivista, mas que tem semelhanças
com o modelo de autocontrole que envolve escolha de reforçador maior atrasado sobre reforçador
menor imediato. Além disso, esse modelo influenciou e tem influenciado trabalhos de analistas do
comportamento, dentro e fora do Brasil, que se propuseram a conduzir replicações desse modelo
(Bernardes, 2011; Grosh & Neuringer, 1981; Kerbauy, 1981; Kerbauy & Buzzo, 1991). Esse modelo
refere-se ao paradigma do atraso da gratificação das pesquisas de Mischel e seus colaboradores
(Mischel & Ebbesen, 1970; Mischel et al., 1972).
pelas crianças). Em ambos os casos (brinquedo, pensar em algo divertido) as crianças esperaram
mais tempo pelo retorno do experimentador do que nos casos em que tais variáveis não foram
manipuladas.
Os autores também, em outro momento, analisaram os efeitos de diferentes instruções sobre a
Matos . Bernardes
espera (Mischel et al., 1972). Algumas crianças foram instruídas a pensar em algo divertido, outras
a pensar em algo triste e outras a pensar nos próprios reforçadores. Tanto no caso em que os
reforçadores estavam cobertos como no caso em que estavam descobertos, a instrução de pensar
em algo divertido produziu o maior tempo de espera. As outras instruções diminuíram o tempo de
espera das crianças.
396
A partir do que foi discutido sobre as pesquisas do grupo de Mischel (Mischel & Ebbesen,1970;
Mischel et al., 1972), torna-se válido enfatizar que o contexto da escolha de seres humanos é complexo
no sentido que não se deve simplesmente levar em conta parâmetros do reforço como atraso e
magnitude no caso de humanos, mas deve-se atentar ao fato de que, em função da sensibilidade dos
seres humanos a descrições verbais, as descrições de contingências (regras) também representam um
importante parâmetro nas situações de escolhas (Rachlin, 1994).
Como já se tinha destacado, o paradigma do atraso da gratificação foi também de interesse para
analistas do comportamento, ainda que se tenha configurado como uma proposta cognitivista de
escolhas em situações de autocontrole. E isso se verifica em trabalhos tanto fora como dentro do
Brasil. Grosh e Neuringer (1981), por exemplo, delinearam replicações dos experimentos do grupo
de Mischel com pombos, manipulando variáveis semelhantes as dos estudos de Mischel (Mischel &
Ebbesen,1970; Mischel et al., 1972). A coleta foi feita em uma câmara experimental contendo um
disco. Bicar no disco levava ao acesso a um grão menos preferido e imediato e, não bicar, implicava
o acesso a um grão mais preferido e mais atrasado. Grosh e Neuringer (1981) investigaram, por
exemplo, os efeitos de atividades, realizadas durante o período de espera, sobre o tempo de espera,
introduzindo um novo disco sob esquema de FR20 em que o bicar sobre o mesmo resultaria no
acesso a outro tipo de grão. Bicar nesse disco adicional era possível durante o período de atraso do
reforço (espera pelo grão preferido) cujo acesso seria possível se o pombo não bicasse o primeiro
disco. O resultado disso foi que os pombos de Grosh e Neuringer (2002) esperaram mais nessa
condição, replicando, portanto, o trabalho de Mischel et al. (1972).
Grosh e Neuringer (1981) manipularam ainda outras condições igualmente semelhantes às
condições de Mischel et al. (1972), gerando resultados semelhantes. Entretanto, houve diferenças
metodológicas como, por exemplo, o fato de Grosh e Neuringer terem colocado seus pombos em
contato com a contingência de espera pelo reforçador preferido por mais de uma vez.
Dentro do Brasil, Kerbauy (1981) e Kerbauy e Buzzo (1991) produziram replicações das pesquisas
de Mischel et al. com crianças. No primeiro estudo, manipularam-se as variáveis de qualidade e
atraso do reforço (Kerbauy, 1981). As crianças escolhiam entre diferentes tipos de chocolate. No
segundo estudo, manipularam-se as variáveis de magnitude (definida como quantidade) e atraso
do reforço (Kerbauy & Buzzo, 1991). As crianças escolhiam entre seis e três balas. Nesse estudo, as
crianças foram submetidas à contingência de espera por mais de uma vez e os efeitos disso, sobre o
tempo de espera, foram avaliados pelas autoras. Foi verificado que as crianças esperaram mais sob
essas circunstâncias.
Mais recentemente, Bernardes (2011) também conduziu replicações do modelo de atraso da
gratificação em crianças. Uma vez que esse autor também manipulou as variáveis de magnitude e
atraso do reforço, sua pesquisa teve, por objetivo, avaliar o tempo de espera pelo reforçador maior
atrasado quando outra criança ou um fantoche estavam presentes na sala onde se deveria esperar. Ao
todo, foram três as condições experimentais de Bernardes (2011):
1. avaliar o tempo de espera com apenas uma criança presente na sala;
2. avaliar se a presença de um fantoche aumentaria o tempo de espera e se serviria para evocar
Comportamento em Foco 1 | 2011
Bernardes (2011) chegou aos seguintes resultados: das 15 crianças que participaram na pesquisa,
11 esperaram os 15 minutos pelo reforçador maior atrasado. Na condição “sozinho”, duas das quatro
crianças que participaram esperaram; na condição “fantoche”, todas as três crianças que participaram
esperaram. Os dados sugerem que o fantoche não funcionou como audiência para a emissão de
397
descrições de eventos encobertos; na condição “duplas”, seis das oito crianças (formando duplas)
esperaram e, nas duplas que esperaram, uma criança pode ter servido a função de agente controlador
sobre a outra, manipulando variáveis (verbais, por exemplo) para controlar o comportamento
da outra de esperar. Diferentemente dos dados obtidos no estudo de Kerbauy e Buzzo (1991), os
participantes que esperaram emitiram um número maior de respostas por minuto do que os que não
esperaram.
As pesquisas do grupo de Mischel (Mischel & Ebbesen, 1970; Mischel et al., 1972), assim como
suas replicações por analistas do comportamento (Bernardes; 2011; Grosh & Neuringer, 1981;
Kerbauy, 1981; Kerbauy & Buzzo, 1991) sobre o modelo de autocontrole pelo atraso da gratificação,
portanto, apresenta semelhanças com o que se tem na literatura de Análise do Comportamento sobre
comportamentos de autocontrole, na medida em que, em ambos os casos, tais comportamentos
podem ser definidos como escolha do reforçador maior (ou mais preferido) atrasado sobre o
reforçador menor (ou menos preferido) imediato. O fato de o grupo de Mischel (Mischel & Ebbesen,
1970; Mischel et al., 1972) ter manipulado qualidade do reforço em vez de magnitude é importante
por ilustrar possíveis outras variáveis que podem estar envolvidas (além de magnitude e atraso) nas
investigações experimentais sobre comportamentos denominados de autocontrole.
Além disso, certas pesquisas relatadas (Kerbauy, 1981; Kerbauy & Buzzo, 1991; Bernardes, 2011)
servem para ilustrar como o contexto da tomada de decisão de seres humanos é mais complexo do
que o que se verifica nos contextos experimentais das pesquisas com animais não-humanos como
pombos (Rachlin, 1994). Neste sentido, vale destacar que as descrições de contingências (regras)
influenciam bastante a tomada de decisão de humanos. Diferentes descrições podem controlar
diferentes escolhas e contingências relevantes derivadas da história de vida exercem bastante
influência sobre a tomada de decisão em humanos (Rachlin, 1994).
É possível, ainda, outra consideração importante referente ao modelo de autocontrole pelo atraso
da gratificação: a descrição de contingência por parte do experimentador sobre pedir às crianças
que pensassem em como uma guloseima como um pretzel é crocante e salgadinho, salientando
suas características reais (Mischel, Shoda & Rodriguez, 1989), serviria a função de uma operação
estabelecedora que aumentaria o valor reforçador do pretzel e do outro reforçador ao qual as crianças
poderiam ter acesso caso esperassem 15 minutos (marshmallow) (Mallot & Mallot, 1991).
Em suma, o tema do autocontrole tem sido explorado por autores dentro e fora da análise do
comportamento. Investigações sobre os modelos discutidos até aqui (experimentais ou não)
influenciaram e influenciam pesquisadores com interesse no tema. Como, por exemplo, a discussão
realizada por Matos e Bernardes (2010) sobre uma série de variáveis manipuladas nas situações
de autocontrole com humanos (especialmente crianças) através do levantamento de pesquisas
experimentais sobre comportamentos de autocontrole (dissertações e qualificações de mestrado)
de um programa de pós-graduação em Psicologia Experimental. A importância desse tipo de
estudo se apoia na proposta de Hanna e Todorov (2002), em que o estudo de comportamentos de
autocontrole implica análises de muitos parâmetros (variáveis) e o que tem sido feito (no laboratório)
parece insuficiente para dar conta do conceito de autocontrole e de tudo que Skinner (1953/2003)
Comportamento em Foco 1 | 2011
Referências Bibliográficas
Bernardes, L. A. (2011). O que acontece durante o período de espera? Contribuições para o estudo
do autocontrole. Dissertação de mestrado, Programa de Estudos Pós-Graduados em Psicologia
Experimental: Análise do Comportamento, Pontifícia Universidade Católica de São Paulo, São Paulo.
398
Green, L., & Rachlin, H. (1996). Commitment using punishment. Journal of the Experimental
Analysis of Behavior, 65, 593-601.
Grosh, J. & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the
Experimental Analysis of Behavior, 35, 3-21.
Hanna, E. S. & Todorov, J. C. (2002). Modelos de Autocontrole na Análise Experimental do
Comportamento: Utilidade e Crítica. Psicologia: Teoria e Pesquisa, 18 (3), 337-343.
Kerbauy, R. R. (1981). Um estudo sobre espera de recompensa: possibilidades que essa situação
apresenta. Boletim de Psicologia, 33, 52-57.
Kerbauy, R. R. & Buzzo, M. P. (1991). Descrição de algumas variáveis no comportamento de esperar
por recompensas previamente escolhidas. Psicologia USP, 2, 77-84.
Malott, R.W. & Malott, M.E. (1991). Private Events and Rule-Governed Behavior. In: S.C. Hayes, L.J.
Hayes, M. Sato & K. Ono (Ed.), Dialogues on Verbal Behavior. (pp. 237-254). Reno: Context Press.
Matos, D.C. & Bernardes, L.A. (2010). Uma análise das pesquisas de autocontrole do PEXP: variáveis
manipuladas e sua relação com modelos no estudo do autocontrole. Behaviors, 14, 57–68.
Mazur, J. E. & Logue, A.W. (1978). Choice in a self-control paradigm: Effects of a fading procedure.
Journal of the Experimental Analysis of Behavior, 30, 11-17.
Mischel, W. & Ebbesen, E. (1970). Attention in delay of gratification. Journal of Personality and Social
Psychology, 16, 329-337.
Mischel, W., Ebbesen, E. & Zeiss, A. R. (1972). Cognitive and attentional mechanisms in delay of
gratification. Journal of Personality and Social Psychology, 21, 204-218.
Mischel, W., Shoda, Y., & Rodriguez, M.L. (1989). Delay of gratification in children. Science, 244,
933-938.
Rachlin, H. (1970) Introduction to modern behaviorism. San Francisco: W. H. Freeman and Co.
Rachlin, H. & Grenn, L. (1972). Commitment, choice and self-control. Journal of Experimental
Analysis of Behavior, 17, 15-22.
Rachlin, R., Castrogiovanni, A.,& Cross, D. (1987). Probability and delay in commitment. Journal of
the Experimental Analysis of Behavior, 48, 347-353.
Rachlin, H. (1994). The Context of Pigeon and Human Choice. In: S.C. Hayes, L.J. Hayes, M. Sato
(Ed.), Behavior Analysis of Language and Cognition. (pp. 301-319). Reno: Context Press.
Rachlin, H. (2000). The Science of Self-Control. Cambridge; London: Harvard University Press.
Siegel, E. & Rachlin, H. (1995). Soft commitment: Self-control achieved by response persistence.
Journal of the Experimental Analysis of Behavior, 64, 117-128.
Skinner, B. F. (2003). Ciência e comportamento humano. Tradução organizada por J.C. Todorov & R.
Azzi. São Paulo: Edart (trabalho original publicado em 1953).
Comportamento em Foco 1 | 2011
Matos . Bernardes
399