Operant betinging – en innføring

Se for deg at du en lørdag ringer to venner for å spørre om dere skal gjøre noe gøy. Vi kaller dem Håvard og Hanne.

Når Håvard svarer, får du huden full av kjeft. For du må jo skjønne at han ikke kan finne på noe med deg i helgene, nå som han har fått seg både dame og splitter ny TV! Dette synes du er så ubehagelig at du slutter å ringe Håvard på lørdager.

Hanne blir derimot kjempeglad for at du ringer. For det er jo akkurat i dag hun skal på fest med mange interessante folk, og skulle så gjerne hatt en å gå dit med. Dette synes du er så stas at du begynner å ringe Hanne oftere på lørdager.

I begge disse tilfellene ser vi at konsekvensene av atferden din har betydning for om atferden skjer igjen senere.

Dette er det som kalles operant betinging.

Med andre ord er operant betinging det som skjer når atferd endres som følge av den konsekvensen atferden har. Det er en form for læring.

Gjelder alle dyr

Operant betinging skjer hele tiden. Ikke bare i oss mennesker, i alle dyr. B.F. Skinner sine rotter er kjent for mange. Men også virvelløse dyr, som insekter, har evnen til å lære på denne måten.

Det at egenskapen er å finne over hele dyreriket, er veldig logisk hvis man ser det fra et evolusjonshistorisk perspektiv. For evnen til å endre atferd etter de konsekvensene atferden har, er selvsagt avgjørende for overlevelse i mange sammenhenger. Det dreier seg hele tiden om å justere atferden sin etter de konsekvensen den har, slik at man kan oppføre seg på den gunstigste måten. Selv sugemønsteret til nyfødte menneskebarn kan operant betinges, noe som betyr at de kan lære seg å suge pupp og få i seg melk mest mulig effektivt. Kjempesmart for overlevelse!

Forsterkning og straff

Konsekvensene som etterfølger atferd, kan ha to forskjellige effekter på den fremtidige atferden: Konsekvensene kan gjøre at atferden skjer oftere, eller konsekvensene kan gjøre at atferden skjer sjeldnere. Vi snakker om henholdsvis forsterkning og straff.

I eksemplene vi begynte med, ringer du Håvard sjeldnere. Det er med andre ord snakk om straff. Men Hanne begynner du derimot å ringe oftere. Altså er atferden forsterket.

Forsterkning og straff kan foregå på to måter: Enten ved at noe tilføres etter en atferd, eller at noe fjernes eller reduseres etter en atferd.

Det gir oss fire forskjellige konsekvenser som kan ha effekt på atferden:

  • Positiv forsterkning: Noe tilføres (+) etter en atferd, som resulterer i at atferden skjer oftere.
  • Positiv straff: Noe tilføres (+) etter en atferd, som resulterer i at atferden skjer sjeldnere.
  • Negativ forsterkning: Noe fjernes (-) etter en atferd, som resulterer i at atferden skjer oftere.
  • Negativ straff: Noe fjernes (-) etter en atferd, som resulterer i at atferden skjer sjeldnere.

Konsekvensen av å ringe Håvard var at du fikk kjeft, kjeft be tilført, noe som resulterte i at du ringer ham sjeldnere. Altså er det snakk om en positiv straff.

Konsekvensen av å ringe Hanne er at du fikk deg en god fest, en god opplevelse ble tilført, noe som resulterte i at du ringer henne oftere. Altså er det en positiv forsterker.

Her ser vi hvordan de fire konsekvensene kan fungere i praksis, idet fire forskjellige følgere på Facebook skal trene opp meg til å skrive innlegg:

Det er effekten som avgjør, ikke vår intensjon

Det er viktig å merke seg at det er effekten av konsekvensen som avgjør om det er en forsterker/straff, ikke vår intensjon. Vi snakker med andre ord egentlig om to forskjellige ting i denne sammenheng: En eksperimentell prosedyre og en atferdsmessig prosess.

  • En eksperimentell prosedyre: Det å administrere en konsekvens når en ønsket/uønsket atferd inntreffer.
  • Atferdsmessig prosess: At atferd øker/minker i frekvens.

I eksempelet med følgerne som trener meg opp til å skrive blogginnlegg, er det hele tiden snakk om det første. For det kommer jo aldri fram hvordan dette faktisk påvirker atferden min! Kun leserens prosedyrer og intensjoner.

Hvis jeg f.eks. ikke hadde sluttet å skrive slike innlegg som den blonde damen forsøker å straffe bort i det andre bildet, hadde så hadde det heller ikke foregått en atferdsmessig prosess i meg. Hun hadde kanskje greid å få utløp for litt frustrasjon, men min atferd har hun ikke greid å endre. Eventuelt kunne det «backfired». Dvs. at det som var ment å være en straff, fungerte som en forsterker ved at det fikk meg til å ville skrive enda flere slike innlegg.

Likeledes er det ikke alle atferder som ros fungerer som en positiv forsterker på. På min atferd vil rosende ord prelle av hvis jeg merker at det er påtatt hyggelighet, at vedkommende ikke helt mener det. Med andre ord har ikke den type konsekvens betydning for atferden min, det virker verken forsterkende eller straffende. (Tror jeg, da …)

Veldig ofte er det ikke samsvar mellom prosedyre og atferdsmessig prosess. Derav det klassiske utsagnet «jeg har prøvd å bruke positiv forsterkning på hunden min, men det funker ikke på ham, altså». Joda! Det er bare ikke samsvar mellom prosedyre og prosess, man får det ikke helt til.

Vi velger prosedyrer bevisst

I virkeligheten benytter vi oss av alle de fire prosedyrene, om det så er snakk om å oppdra oss selv, hverandre eller dyrene våre. Men de som er bevisste på læringsprinsippene satser på en av dem eller noen av dem.

F.eks. vil de av oss som bruker belønningsbaserte metoder når vi trener hunder, hele tiden fokusere på positiv forsterkning. Vi tilrettelegger miljøet slik at hundene sannsynligvis oppfører seg slik vi ønsker de skal gjøre, slik at vi får mulighet til å gi positive forsterkere. I noen tilfeller bruker vi også negativ straff. Men positiv straff og negativ forsterkning forsøker vi å holde utenfor. Det kommer av flere årsaker, deriblant fordi bruk av aversive stimuli (ubehag), som både positiv straff og negativ forsterkning som regel innebærer, kan bringe med seg en rekke uheldige effekter, som frykt og aggresjon. Også negativ straff kan ha slike effekter, så det er derfor vi forsøker å holde oss til positiv forsterkning. Vi vil at hunden skal utføre rett atferd fordi han oppnår velbehag, ikke fordi han unngår ubehag.

I denne sammenheng er det enda en ting til som er verdt å merke seg: Straff, både negativ og positiv har den svakheten at det ofte gjør det vanskelig å vite hva som er den riktige atferden. Vil leseren at jeg skal skrive mer om valper? Mer om læring? Hva vil han egentlig? Jeg kan kun forstå hva han ikke vil jeg skal gjøre.

Det gjelder fremtidig atferd

Husk at det alltid dreier seg om hvordan konsekvensen påvirker atferden i fremtiden, uansett hvordan den virker her og nå. Det er en forutsetning for at det kan kalles læring.  

Hvis man sier et hardt «nei» når hunden tigger ved middagsbordet, og hunden går og legger seg i kurven sin, men fortsetter å tigge like mye de kommende middagene, har man bare avbrutt atferden, ikke straffet den: Hunden har ikke lært å ikke tigge ved middagsbordet. Samme hvis du hadde lagt på røret når Håvard begynte å kjefte, men fortsatte å ringe ham like ofte, uansett hvor ubehagelig det var mens det holdt på. Kanskje hadde du sluttet like ham så godt, du kunne til og med blitt så sur at du trekker tilbake løftet om å bli med på fotballtur til England neste sommer (i et forsøk på å endre denne frekke atferden hans med negativ straff …). Men hadde du fortsatt å ringe ham like ofte, ville ikke kjeftingen ha fungert som en straff på atferden «å ringe til Håvard».

Kilde: 

Anvendt atferdsanalyse. Teori og praksis (2010). Av: Svein Eikeseth og Frode Svartdal (Bok)

Facebook
Twitter
LinkedIn