Ellen - Natural Horsemanship

Mine svar på hest.no
Hva er positiv / negativ forsterkning eller positiv / negativ straff?
Hei!
Hva er forskjellen på positiv og negativ forsterkning, og hva er en positiv eller negativ straff?

Vennlig hilsen
Ellen

Ellens svar :
Hei Ellen

 

I innlærings teorien (Dette har jeg skrevet om i en annen artikkel) kaller man "noe kan begynne eller bli gitt" for positiv. Det har ingenting med hva noen syntes er vondt eller godt å gjøre, det refererer kun til at noe blir lagt til dyrets omgivelse, positivt som i et pluss tegn (+)

Man kaller "noe kan slutte eller bli tatt bort" for negativt. Igjen, dette har ikke med godt eller vondt å gjøre, kun med at noe blir fjernet fra dyrets omgivelse, negativt som i et minus tegn (-)

Alt som øker en oppførsel; får det til å skje oftere, gjør det sterkere, eller mer sannsynlig at det skjer igjen blir kalt for en forsterkning. Ofte vil et dyr betrakte "noe godt kan begynne eller gitt" eller "noe vondt kan bli slutte eller fjernes" som noe den ønsker at skal skje igjen, og den vil gjerne gjenta den oppførselen som forårsaket denne konsekvensen. 

Disse konsekvensene vil derfor gjøre det mer sannsynlig at dyret gjentar handlingen fordi den vil ha den samme konsekvensen en gang til. De styrker oppførselen. 

Alt som minsker en oppførsel; gjør at den skjer sjeldnere, gjør den svakere eller mindre sannsynlig å hende igjen, er en straff. Vanligvis vil et dyr anse "Noe godt kan slutte eller bli tatt bort" eller "Noe vondt kan begynne eller bli gitt" som noe den ikke ønsker, og de vil derfor unngå å gjenta handlingen som førte til denne konsekvensen. Straff i denne definisjonen er alt som gjør at hestens oppførsel minsker eller slutter. 

Dette betyr at i innlærings teorien bruker man disse begrepene:

Positiv = noe blir lagt til.
Negativ = noe blir trukket fra.
Forsterkning = noe som øker sannsynligheten for at handlingen skjer igjen.
Straff = noe som minsker sannsynligheten for at handlingen skjer igjen.

Noe godt kan begynne eller bli gitt = positiv forsterkning
Noe godt kan slutte eller bli tatt bort = negativ straff
Noe vondt kan begynne eller bli gitt = positiv straff
Noe vondt kan slutte eller bli tatt bort = negativ forsterkning
 

 

Forsterkning

(Oppførsel/ handling øker)

Straff

(Oppførsel/ handling minsker)

Positiv

(Noe blir lagt til)

positiv forsterkning

Noe som begynner eller blir gitt øker sannsynligheten for at handlingen gjentas.

positiv straff

Noe som begynner eller blir gitt minsker sannsynligheten for at handlingen gjentas.

Negativ

(Noe blir trukket fra)

negativ forsterkning

Noe som slutter eller blir tatt bort øker sannsynligheten for at handlingen gjentas.

negativ straff

Noe som slutter eller blir tatt bort minsker sannsynligheten for at handlingen gjentas.

Disse definisjonene er basert på den effekten det har på oppførselen man vil påvirke; de må ha en effekt. Enten styrke eller minske oppførselen. Først da er de regnet som en konsekvens og kan defineres som straff eller forsterkning. Dessuten er det den effekten som faktisk er resultatet som definerer hva som skjedd, ikke hva treneren ønsket å oppnå

Gode ting som er ment som belønninger/forsterkninger, men som ikke styrker oppførselen er ikke forsterkninger. Det vi kaller for straff og som er ment til å minske oppførsel, men ikke gjør det er ikke straff i denne sammenheng, men mishandling..

La meg forklare dette litt nærmere; 

Eksempel: Du rir en hest og hesten gjør et bra galoppbytte. Som belønning får han ekstra godbiter når han kommer til stallen. Disse godbitene vil ikke føre til at hesten gjentar galopp byttet en annen gang (fordi hesten ikke aner at det var dette du belønnet). Dette kan derfor ikke regnes som en forsterkning (selv om hesten sikkert syntes at det var deilig med litt ekstra godt). Konsekvensen kom for sent til at dyret skal kunne koble det til handlingen i dette tilfellet. 

Eksempel: Du kommer til stallen og hesten biter deg. Du tar den ut på stallgangen, binder den og slår til den. Dette er mishandling og ikke straff fordi hesten ikke vil koble slaget til handlingen. For at en konsekvens skal ha en effekt er det derfor viktig at den kommer øyeblikkelig, og det er resultatet som avgjør hva som er hva.

Positiv forsterkning:

Dette er kanskje den enkleste, og mest effektive konsekvensen for en trener å kontrollere og forstå. Det innebærer at noe godt (som hesten vil ha/ vil jobbe for å oppnå) blir gitt, eller at noe godt skjer. Siden hesten vil at dette gode skal skje igjen vil den gjenta handlingen som den oppfattet at førte til konsekvensen. 

Eksempler på positiv forsterkning: 

Hesten får havre for å ha gjort et triks. 
Hesten får fri etter å ha gjort et vellykket galoppbytte. 
Hesten får oppmerksomhet fordi den skraper i bakken når den sto bundet.
Hingsten kom inn til hoppen etter å slitt seg løs fra treneren. 
Hesten får gå på lange tøyler etter å ha utført en øvelse. 
Hesten får mat etter at den har lagt på ørene. 
Føllet får melk av hoppen etter å ha kommet når hun kallet. 
Hesten får høyet til en annen hest etter å jaget bort den andre. 

Legg merke til at det ikke nødvendig vis er ønskelig oppførsel man forsterker. 

Innlærte positive forsterkende signaler (stimuli) og "broer". 

En naturlig positiv forsterker er noe hesten ikke trenger å lære å like. Det kan være alt mulig; mat, å bli klødd, hvile, rulle seg, sex, samvær med andre hester osv. Den naturlige forsterkeren som det er lettest å bruke i forbindelse med trening er mat, hvile, ros og klapping. 

En naturlig positiv forsterker er noe som hesten må lære å like. Dette kan man gjøre ved klassisk innlæring. Å si "bra" er en innlært positiv forsterker dersom man har lært hesten at dette betyr at den vil få en belønning i en eller annen form. Ros fra eieren er noe en hest ikke setter pris på instinktivt, men som den lærer å like (forhåpentligvis). 

Kort sagt, en belønning er hva som helst som hesten liker og setter pris på, og dette vil variere fra hest til hest. (Noen hester elsker å bli klødd i pannen, og andre hester liker ikke at man tar på hodet deres i det hele tatt. ) Hestene vil kunne lære å reagere på ordet "bra" på omtrent samme måte som den gjør på belønningen som følger (husk Pavlovs hundeeksperiment). I tillegg vil hestene ofte lære å sette stor pris på denne lyden for dens egen skyld fordi denne lyden forteller hesten at den har rett, noe hester (som oss) liker å få bekreftet. 

Ting man må være oppmerksom på i forbindelse med positiv forsterking.

Dersom hesten handlet ut ifra frykt risikerer man å forsterke frykt reaksjonen. For eksempel dersom hesten skvetter for en traktor på jordet, og du klapper den og gir den en pause for å roe den ned igjen. Når dere begynner å jobbe igjen ser hesten etter en traktor slik at den kan få samme reaksjon igjen !

Tidspunktet må for forsterkningen må være helt riktig, ellers risikerer du å belønne feil ting. Eksempel; om du renser høvene på en ung hest, og etter at du har satt foten ned får den en belønning. Da har du faktisk belønnet at den satte ned foten, ikke at du fikk løftet den. Ros hesten samtidig som du renser høvene, ikke etterpå (dersom du har lært hesten at "bra!" betyr at "belønning kommer" så kan belønningen i seg selv komme etter at du har satt ned foten fordi ordet "bra!" fortalte hesten hva du belønnet. Det er på denne måten ordet fungerer som en "bro". 

Belønningen må være god nok til å motivere en repetisjon. Det er ikke alle belønninger som hesten syntes er verdt å jobbe for. Noen hester kan gjøre "hva som helst" for et godt ord og en vennlig klapp, mens andre trenger sterkere motivasjon som for eksempel mat. (Dette gjelder for å få hesten til å ville gjøre oppgaven igjen, det er helt klart at man kan trene hester til å gjøre ting som de ikke har lyst til å gjøre.)

Belønningen kan bli forbundet med mennesket som gir den. Dersom hesten innser at den bare blir belønnet av deg og ingen andre vil den ikke være motivert til å gjøre de samme tingene for andre mennesker. Igjen er dette snakk om motivering av hesten, og når man har lært en hest et signal for noe vil alle kunne bruke dette signalet til å kommunisere med hesten hva de ønsker. Hesten vet at sjenkelen betyr "gå frem", men den kan svare mer villig for treneren enn for andre. 

Man kan også overdrive belønninger slik at de mister sin motivasjons verdi. Belønninger må varieres og brukes i spesielle sammenhenger slik at de ikke blir en vane. Man gir ikke en belønning for hver ting som hesten gjør riktig, men man oppmuntrer visse ting. Spesielt når hesten skal lære noe nytt, eller den har utført noe spesielt bra. 

Positive forsterkninger øker oppførselen… dette er viktig å være klar over. Dersom du ikke vil at hesten skal utføre en ting må du ikke forsterke den. Når du bruker en sterkt motiverende belønning vil hesten ofte gjenta handlingen om og om igjen for å oppnå belønningen på nytt. 

Negativ forsterkning

En negativ forsterkning øker/forsterkning en oppførsel ved å fjerne noe vondt eller som dyret vil unngå. Ved å gjøre ting bedre for dyret blir dyret belønnet, og dette øker sjansen for at det vil gjenta den oppførselen/handlingen den gjorde da du fjernet ubehaget. 

For å kunne bruke en negativ forsterkning må treneren kunne kontrollere og kunne ta bort "det vonde", og det betyr i praksis at treneren som oftest er den som gir "det vonde" (ikke alltid). 

En av de vanligste tingene i å "ta bort det vonde" er ettergift. Så en annen måte å tenke på negativ forsterkning er at du gir dyret ettergift. 

Eksempler på negativ forsterkning 

Hesten får ettergift fra tøylene når den stopper. 
Sjenkel trykket slutter når hesten går frem. 
Treneren slutter å riste i tauet når hesten rygger. 
Hesten får være i fred etter å ha flyktet fra en annen hest som truer den. 

Positiv straff

Positiv straff er noe som begynner eller bli gitt og blir brukt for å minske/eliminere oppførsel. Ikke bli forvirret over bruken av ordet "positiv", det betyr i denne sammenhengen bare at noe blir lagt til, ikke at det hele er "bra". Husk også at det er handlingen og ikke individet som straffes.

Eksempler på positiv straff:

Hesten blir slått på mulen for å bite. 
Hesten får et elektrisk sjokk av gjerdet når den biter i strømgjerdet.
Hesten får et spark fra en annen hest fordi den ikke vek unna for en advarsel. 
Hingsten biter føllet som forsøker å leke med den. 

Innlærte positive straff signaler (stimuli) og "broer".

Fordi en positiv straff, som alle konsekvenser, må skje øyeblikkelig etter eller være tydelig knyttet til handlingen du vil stoppe er et innlært signal som forteller hesten at "dette likte jeg IKKE" viktig. Mange hestetrenere bruker en lyd "Nei!" eller noe tilsvarende for å fortelle hesten at de ikke likte dens oppførsel. For at signalet/lyden skal kunne ha en effekt må den brukes bare i denne forbindelse, og den må også følges opp av et ubehag med jevne mellomrom (på samme måte som "Ja!" må forsterkes med en belønning for at hesten skal fortsette å reagere på den).

I forbindelse med klikker trening blir positiv straff ikke brukt som et trenings middel, men dette er fremdeles et vanlig trenings middel blant mange trenere. 

Ting man må være oppmerksom på i forbindelse med positiv straff. 

Straff vil være effektivt bare dersom den er sterkere enn motivasjonen til å gjøre handlingen som du vil eliminere. Et eksempel på hvordan dette kan være vanskelig er med en ung hingst som lekebiter. Unge hingster har lekeslåssing som et sterkt instinkt, og dersom den ikke får utløp for dette på en naturlig måte (ved å være sammen med andre hester som den kan leke med) kan den begynne å "leke med eieren" på denne måten. Dersom man straffer hesten for dette kan det hende (dersom du klarte å straffe hardt nok) at den sluttet å bite. Imidlertid sier ikke straffen noe om hva du vil at den skal gjøre i stedet, og oppførselen som erstatter bitingen kan for eksempel være at den begynner å steile eller sparke. 

De fleste straffer ikke hardt nok til å være effektive nok med en gang. Hesten kan venne seg til å bli straffet og dermed må man hele tiden straffe hardere og hardere. Dersom man vil bruke straff må man gjøre det tilstrekkelig hardt med en gang, ellers kan man like godt la det være. Problemet da er selvfølgelig om hesten assosierer straffen med handlingen eller med deg. Jeg har sett mange hester som folk har fortalt meg at de har hatt problemer med for eksempel at den biter i flere år. Hver gang hesten biter slår de til den. Resultatet er ikke at hesten har sluttet å bite, men at den som oftest har lært å bite og deretter dukke unna slaget som den vet at kommer. I mange tilfeller blir hesten redd for hodet sitt fordi den forventer et slag hver gang noen hever hånden. Likevel fortsetter folk å straffe på samme måte som før. Dersom du har straffet tre ganger for samme ting har ikke straffen fungert som en straff (straff pr. definisjon er noe som eliminerer/minsker handling) men som mishandling isteden.

Straffen kan bli forbundet med den som straffer isteden for handlingen. Det betyr at dersom du straffer en hest kan den lære at det er best å unngå deg, men ikke slutte med det du straffer for likevel. Med mindre du er tilstede selvsagt. Jeg har sett eksempler på dette på rideskoler hvor hestene ikke gjorde noe galt så lenge instruktøren var til stede, men så fort han var ute av syne ville hesten begynne å bite igjen. 

Straffen kan bli forbundet med det du straffer den med i stedet for handlingen. Det finnes nok av hester som er redde for pisken. De har dermed ikke lært hva treneren mente å oppnå med pisken (å minske en bestemt oppførsel), men hesten ble redd for redskapet (pisken) isteden. 

Straffen kan føre til fysisk og mental skade på hesten. 

Straff kan gjøre at hesten blir nervøs, og nervøse hester er farlige, de vil gjøre det som de føler er nødvendig for å forsvare seg. 

Negativ straff: 

Negativ straff er å minske/fjerne oppførsel ved å "ta bort noe godt". Dersom dyret koste seg med eller trengte "noe godt" vil det jobbe for å forhindre at det blir fjernet. Det er mindre sannsynlig at de gjentar en handling som førte til at noe godt ble fjernet. Denne konsekvensen er litt vanskeligere å kontrollere for treneren.

Eksempler på negativ straff :

Hesten blir drevet bort fra høyet sitt av treneren fordi den la på ørene når treneren kom. 
Føllet får ikke drikke mer melk av moren fordi den bet henne i juret. 
Den ene hesten slutter å klø manke med den andre fordi den andre hesten bet. 
Hesten kommer når du roper og du tar den bort fra beitet og flokken.

Dersom man kan trene hesten på en måte som hesten blir veldig motivert av vil det å kunne gå ifra hesten under treningen kunne virke som en negativ straff. Dette er noe som brukes som straff i forbindelse med klikker trening fordi hestene blir så veldig motiverte av denne treningen og de vil ikke at treneren skal gå. Men dersom hesten ikke syntes noe særlig om treningen man holder på med vil den ikke oppfatte det at treneren får som noen straff, tvert imot, det vil den kunne se på som en forsterker

Innlærte negative straff signaler (stimuli) og "broer".

Det er sjeldent at trenere lager et signal som forbindes bare med negativ straff. Men de finnes. Som oftest blir disse signalene/ stimuli assosiert med en negativ straff uten at treneren er klar over det, eller har det som hensikt. Et eksempel er å rope på hesten "kom hit" når den er på jordet, og alltid gi den konsekvensen at man tar den bort fra flokken for å jobbe. Etter hvert lærer hesten å forbinde "kom hit" med å fjernes fra flokken, og vil derfor ikke komme når den blir ropt på. Den blir med andre ord straffet for å komme på innkalling! Dette kan man unngå ved å gi hesten en positiv forsterker etter å ha ropt på hesten slik at du forsterker handlingen å komme (du assosierer det med noe godt, isteden med at du bare tar i fra den noe godt)

Ingen konsekvens/endring

Den siste konsekvensen en oppførsel kan ha er "ingenting". 

Dette betyr rett og slett at dyret gjør noe, og ingenting skjer. Dersom dette er konsekvensen vil oppførselen som oftest slutte av seg selv etter en stund, rett og slett fordi den ikke oppnår noe. 

Dette kan også brukes i trening; hesten skraper i gulvet for å få oppmerksomhet, og treneren overser den helt. Etter en stund slutter hesten fordi ingenting skjer. 
Dersom treneren i dette tilfellet irettesatte hesten vil to konsekvenser kunne skje; hesten kan føle at den ble belønnet (med oppmerksomhet) og vil derfor gjenta oppførselen (positiv forsterkning), eller hesten kan føle irettesettelsen som en straff og slutte å gjøre det (positiv straff). 

Siden hester er sosiale dyr er sjansen for at en irettesettelse i dette eksempelet virker som en forsterkning og ikke som en straff ganske stor. Man vil ha en større sjanse for å lykkes i å eliminere en slik oppførsel ved å ignorere den helt, og så gi hesten oppmerksomhet når den slutter. (positiv forsterkning for å stå stille med bena). 

Jeg vet at dette er mange begreper å holde styr på, men om man forsøker å sette seg litt inn i dette så vil man lettere kunne analysere hva som skje, og hvilken effekt ens trening faktisk har.
Vennlig hilsen
Ellen

 




 Plats för copyright- eller annat juridiskt meddelande.
Om du har problem med eller frågor om den här webbplatsen skickar du ett e-postmeddelande till [Projektepost].
Senast uppdaterad: 15 June 2007.