Definisjonene her er de offisielle
terminologiene som blir brukt i innlærings teorien.
Det er fire mulige
konsekvenser en oppførsel kan ha:
-
Noe godt kan begynne eller bli gitt.
-
Noe godt kan slutte eller bli tatt bort.
-
Noe vondt kan begynne eller bli gitt.
-
Noe vondt kan slutte eller bli tatt bort.
Hva som er godt eller
vondt avhenger hva den/det som blir trent mener. (Ikke hva treneren
mener). For en hest er det godt å bli klødd på manken, men det ville ikke
være godt for meg. Hva som er godt vil også avhenge av individet.
Konsekvenser
må være øyeblikkelige for å ha en mulighet til å påvirke, i alle
fall med dyr. Et menneske kan man forklare med ord at "siden du gjorde
slik og sånn, så kommer dette til å skje", men dette går ikke med en
hest.
Med hester må man enten reagere med en
gang, eller man kan bruke klikker trening, hvor man bruker et innlært
signal til hesten som forteller den at "det du gjorde var bra, belønning
vil komme".
Dette innlærte
signalet blir kalt for en "bro" fordi
det skal "bygge en bro mellom oppførselen og belønningen". Signalet
eller broen kan være hva som helst, poenget er at hesten må forbinde det
med belønningen.
Hva uttrykkene står for:
I innlærings teorien
kaller man "noe kan begynne eller bli gitt" for
positiv. Det har ingenting med hva
noen syntes er vondt eller godt å gjøre, det refererer kun til at noe blir
lagt til dyrets omgivelse, positivt som i et
pluss tegn (+)
Man kaller "noe
kan slutte eller bli tatt bort" for negativt.
Igjen, dette har ikke med godt eller vondt å gjøre, kun med at noe blir
fjernet fra dyrets omgivelse, negativt som i et
minus tegn (-)
Alt som øker en
oppførsel; får det til å skje oftere, gjør det sterkere, eller mer
sannsynlig at det skjer igjen blir kalt for en
forsterkning. Ofte vil et dyr betrakte "noe godt kan begynne
eller gitt" eller "noe vondt kan bli slutte eller fjernes" som
noe den ønsker at skal skje igjen, og den vil gjerne gjenta den
oppførselen som forårsaket denne konsekvensen.
Disse konsekvensene
vil derfor gjøre det mer sannsynlig at dyret gjentar handlingen fordi den
vil ha den samme konsekvensen en gang til. De styrker oppførselen.
Alt som minsker en
oppførsel; gjør at den skjer sjeldnere, gjør den svakere eller mindre
sannsynlig å hende igjen, er en straff.
Vanligvis vil et dyr anse "Noe godt kan slutte eller bli tatt bort"
eller "Noe vondt kan begynne eller bli gitt" som noe den ikke
ønsker, og de vil derfor unngå å gjenta handlingen som førte til denne
konsekvensen. Straff i denne definisjonen er alt som gjør at hestens
oppførsel minsker eller slutter.
Dette betyr at i innlærings teorien
bruker man disse begrepene:
- Positiv
= noe blir lagt til.
Negativ = noe blir trukket fra.
Forsterkning = noe som øker
sannsynligheten for at handlingen skjer igjen.
Straff = noe som minsker
sannsynligheten for at handlingen skjer igjen.
|
Forsterkning
(Oppførsel/ handling øker) |
Straff
(Oppførsel/ handling minsker) |
Positiv
(Noe blir lagt til) |
positiv
forsterkning
Noe som begynner eller blir gitt
øker sannsynligheten for at handlingen gjentas. |
positiv straff
Noe som begynner eller blir gitt
minsker sannsynligheten for at handlingen gjentas. |
Negativ
(Noe blir trukket fra) |
negativ
forsterkning
Noe som slutter eller blir tatt
bort øker sannsynligheten for at handlingen gjentas. |
negativ straff
Noe som slutter eller blir tatt
bort minsker sannsynligheten for at handlingen gjentas. |
Disse definisjonene er basert på den
effekten det har på oppførselen man vil påvirke; de må ha en effekt.
Enten styrke eller minske oppførselen. Først da er de regnet som en
konsekvens og kan defineres som straff eller forsterkning. Dessuten er det
den effekten som faktisk er resultatet som definerer hva som skjedd, ikke
hva treneren ønsket å oppnå
Gode ting som er ment som
belønninger/forsterkninger, men som ikke styrker oppførselen er ikke
forsterkninger. Det vi kaller for straff og som er ment til å minske
oppførsel, men ikke gjør det er ikke straff i denne sammenheng, men
mishandling..
La meg forklare dette litt nærmere;
Eksempel: Du rir en hest og
hesten gjør et bra galoppbytte. Som belønning får han ekstra godbiter når
han kommer til stallen. Disse godbitene vil ikke føre til at hesten
gjentar galopp byttet en annen gang (fordi hesten ikke aner at det var
dette du belønnet). Dette kan derfor ikke regnes som en forsterkning (selv
om hesten sikkert syntes at det var deilig med litt ekstra godt).
Konsekvensen kom for sent til at dyret skal kunne koble det til handlingen
i dette tilfellet.
Eksempel: Du kommer til stallen
og hesten biter deg. Du tar den ut på stallgangen, binder den og slår til
den. Dette er mishandling og ikke straff fordi hesten ikke vil koble
slaget til handlingen. For at en konsekvens skal ha en effekt er det
derfor viktig at den kommer øyeblikkelig, og det er resultatet som avgjør
hva som er hva.
Den neste siden viser
forklaringer og eksempler på
forsterkninger.