Miksi hevonen kieltää esteelle?

Esteratsastus on ratsastuksen muoto, jossa perustaidoista ja avuista eteenpäin liikkuminen korostuu. Hevonen koulutetaan liikkumaan avuista eteen ja esteiden yli, riippumatta siitä millaisia tai kuinka pelottavia esteet ovat.

Kun hevonen kieltäytyy hyppäämästä, kannattaa aluksi sulkea pois mahdolliset kiputilat tai epäsopivat varusteet. Hevonen muistaa varsinkin epämiellyttävät tilanteet todella pitkään, siksi olisi hyvä, ettei se saa huonoja kokemuksia hyppäämisestä. Kieltäminen voi johtua siitä, että hevonen tietää hypystä seuraavan kivuliaan alastulon – on ymmärrettävää ettei hevonen halua tässä tilanteessa hyppiä.

Toinen asia, joka kannattaa tarkistaa kun ongelmana on kieltäminen, on perustaidot. Osaako hevonen avut? Osaako se mennä vihjeestä eteenpäin? Kokeeko se eteen liikkumisen riittävän palkitsevaksi? Esteiden ylittäminen on lopulta melko yksinkertaista.

Hevonen voi saada myös huonoja kokemuksia hyppäämisestä. Se voi mennä esteen sekaan tai satuttaa jalkansa esteellä. Se voi pelästyä tai ratsastaja voi nykäistä sitä suusta. Varovaisena eläimenä hevonen ei halua joutua ikävään tilanteeseen uudelleen.

Kun kipu on suljettu pois ongelman syistä, kannattaa lähteä madaltamaan tai helpottamaan estettä. Kannattaa etsiä sellainen korkeus ja estetyyppi,  jonka hevonen ylittää mielellään. On syytä pysyä tässä korkeudessa jonkin aikaa, jotta saa onnistumisia pohjalle. Kannattaa myös ottaa käyttöön palkitseminen, jotta hyppääminen tulisi taas mahdollisimman mukavaksi hevosenkin kannalta. Hypyn jälkeen kannattaa tehdä jotain, joka on hevoselle kivaa, näin se yhdistää hyppäämisen ja mukavan tunteen.

Esteen edessä kieltävän hevosen rökittäminen ei tuota toivottua lopputulosta – se saattaa säikäyttää hevosen kerran tai pari, mutta ei lainkaan helpota varsinaista ongelmaa.

Tämä teksti syntyi, kun pohdin kuinka ajankohdalla on väliä hevosten koulutuksessa. Ja nimen omaan ratsain tehtynä.

Palkkio eli vahviste ratsailla on ensisijaisesti paineen poisto eli pyytävän avun lopettaminen juuri oikealla hetkellä. Negatiivisen vahvisteen määritelmän mukaan hevonen oppii välttämään epämukavaa ärsykettä, kun toivottu käytös aikaansaa ärsykkeen poistamisen. En ole itse ollut yhdelläkään ratsastustunnilla, jossa olisi keskitytty apujen oikea-aikaiseen lopettamiseen. Pääpaino on ollut apujen antamisen ajoituksessa: milloin käytetään pohjetta, milloin ohjaa ja niin edelleen. Ohjeet painottuvat yleensä jonkin lisäämiseen; enemmän kättä, enemmän jalkaa tai enemmän asetusta. Ehkä pysähtymisessä selkeiten huomaa vahvisteen ajoituksen: kun hevonen pysähtyy, ratsastaja myötää ohjista. Tämä on selkeä tilanne. Sen sijaan muissa liikkeissä palkkion ajoitus voi olla haastavampaa. Jos hevonen vaikkapa väistää, mikä on oikea hetki lopettaa pohkeella vaikuttaminen? Silloinko, kun väistäminen halutaan lopettaa? Silloinko kun väistö alkaa? Annetaanko apu joka askeleella ja höllätään joka askeleella? Miten toimitaan, jos hevonen ei reagoi halutulla tavalla? Miten ratsastaja kykenee säilyttämään pyytävän avun päällä ja samanlaisena tai jopa voimistuvana liikkuvan hevosen selässä jopa kymmenien metrien ajan, kunnes hevonen reagoi?

Tutkimuksessa testattiin, miten hevonen oppi väistämään lautaseen kohdistettua painetta. Hevosia painettiin lautasesta, ja kun ne väistivät pois paineesta, eli siirsivät vähintään yhtä takajalkaa toiseen suuntaan, paine poistettiin välittömästi. Avustaja esti hevosia liikkumasta eteen ja taakse. Havaittiin, että väistäminen tarvittava paine väheni ensimmäisen harjoittelupäivän jälkeen ja että oikealta puolelta painetta jouduttiin käyttämään enemmän kuin vasemmalta. Keskimääräinen paine, joka tarvittiin liikkeen aikaansaamiseksi oli vajaat 20 Newtonia. Ensimmäisen päivän aikana tarvittava paine aleni, mikä paljasti, että oppimista oli tapahtunut. Se kai on apujenkin idea – jos hevonen osaa avut, se reagoi yhä pienempään ja pienempään vihjeeseen. Maastakäsin toteutettuna tämä on yksinkertaista. Pidetään sormi kiinni, kunnes hevonen reagoi. Miten ratsain? Väitän, että taitavallekin ratsastajalle on hankalaa pitää pohje kiinni samassa paikassa ravaavan hevosen kyydissä. Yleensä ratsastajan jalat heiluvat hevosen liikkeen mukana, jolloin apu tulee ja irtoaa, tulee ja irtoaa ja tulee ja irtoaa eikä hevonen välttämättä reagoi. Tämä vesittää herkkyyttä. Se taas johtaa siihen, että voimaa tarvitaan yhä enemmän ja lisäksi apu annetaan ylläpitävässä merkityksessä. Jos katsoo omaa tai kenen tahansa ratsastusta, on mahdotonta sanoa milloin ratsastaja hellittää avun, varsinkin jos kyseessä on pohje tai ns. istunta-apu. Käytännössä ratsastajan palkkion ajoitusta on siis melko mahdotonta arvioida ulkopuolelta. Eikä se oikeasti kiinnosta ketään, jos hevonen näyttää tekevän haluttuja asioita.

Vahvisteiden tarkoituksena on lisätä toivottujen käytösten todennäköisyyttä. Jos vahviste annetaan väärään aikaan, haluttu käytös ei vahvistu. Mikäli edellä mainitussa tutkimuksessa hevosia olisi painettu sormella ja painaminen olisi lopetettu, kun hevonen peruuttaa, eivät hevoset olisi oppineet väistämään paineesta vaan tulemaan päin sitä. Jos taas tutkimuksessa olisi käytetty tupla- tai positiivista vahvistetta ja vielä lisäksi sekundäärivahvistetta (eli äänimerkillä merkitty haluttu käytös), olisivat hevoset saaneet jotain hyvää (kuten niin muodikkaan rapsutuksen) kun ne siirtyvät. Tai ne olisivat siirtyessä kuulleet äänimerkin, jonka jälkeen niille olisi annettu jotain mieluisaa. Vastaavasti, ne eivät olisi oppineet väistämään, jos vahviste olisi tullut väärästä asiasta, kuten peruuttamisesta. Miten sitten ratsain? Oma mielipiteeni on se, että jos ratsastaja tietää mitä haluaa ja tuntee, milloin hevonen niin toimii, on tuplavahvisteen käyttö ajoituksellisesti helpompaa kuin negatiivisen. Tarvitsee vain sanoa sana tai painaa nappia ja muu tapahtuu itsestään. Koska äänimerkin jälkeen täytyy valmistautua kaivamaan herkkua taskusta, käytössä ollut apu loppuu luonnollisesti. 

Tuplavahvisteen ajoituksessa jokaisella on yhtäkkiä näkemys. Palkkion ajoitus on väärä ja palkkion suuntakin saa monesti kritiikkiä. Kun koulutukseen sotketaan mukaan ruokapalkkio, täytyy ratsastajan olla superammattilainen ja olla käynyt erinäisiä kursseja palkitsemisen tekniikkaan liittyen. Kuinka moni negatiivista vahvistetta käyttävä treenaa tekniikkaa ja motoriikkaa, joilla voisi varmistaa oikean ajoituksen? Arvaan, ettei kukaan. Ehkä simulaattorilla tätä voisi harjoitella. Samalla tavalla, kuin teknisesti taitava ratsastaja kehittyy apujen käytössä negatiivisen vahvisteen taituriksi toistojen myötä, voi ratsastaja kehittyä tuplavahvisteen taituriksi harjoittelemalla. Mitä sitten, jos palkkion ajankohta on väärä? Toivottu käytös ei tule todennäköisemmäksi. Hevonen syö paljon herkkuja ja oppii asioita, joita ei ollut tarkoitus opettaa. Eli tapahtuu aivan sama asia kuin silloin, jos ratsastaja ei osaa lopettaa apua oikeaan aikaan. Missä vaiheessa on syntynyt käsitys siitä, että paineen poiston osaa jokainen ja ruualla palkitsemisen vain harvat? Miksi ruualla palkitseminen vaatisi enemmän osaamista kuin oikein tehty paineen poisto? Oikeastaan paineen poistamisesta ja käyttämisestä pitäisi olla enemmän huolissaan, koska paine voi uhata eläintä ja aiheuttaa epämukavan tunteen. Palkkion ennakointi voi toki aiheuttaa turhautumista, mutta harvoin pelkoreaktioita, kuten paine.

Itse olen sitä mieltä, että ruokapalkkiota käyttävä ratsastaja ei tarvitse vierelleen suu viivana seisovaa totista kouluttajaa, joka kontrolloi sekä sekundääri- että primäärivahvistetta. Tällöin ratsastaja joutuu passiivisen matkustajan rooliin, eikä välttämättä itse ole kouluttajan kanssa samoilla fiiliksillä ajoituksesta. Suosittelen, että jokainen ratsastaja vastaa itse palkitsemisestaan ja oppii tekemällä. Hevosia on vuosituhansien ajan onnistuttu enemmän tai vähemmän menestyksekkäästi kouluttamaan sekä leivällä että paineella. On hyvä tietää, mitä tekee ja vielä tärkeämpää on tietää mitä haluaa. Vain silloin voi saavuttaa halutun lopputuloksen. Ja sekin on hyvä pitää mielessä, että jos vahvistaa väärää asiaa, kyseessä ei ole maailmanloppu.

Ahrendt et al., 2015

Kun hevoselle koulutetaan jotain uutta asiaa, pitää ensin aikaansaada haluttu tai oikeansuuntainen käytös. Tätä vahvistamalla käytös yleistyy ja hevonen oppii kyseisen asian sekä sitä edeltävän vihjeen.

Vahviste voi olla mitä tahansa, mistä hevonen pitää. Negatiivinen vahviste on paineen vapauttaminen. Positiivinen vahviste voi olla hevosesta riippuen ruokapalkkio, rapsutus tai vaikkapa jokin palkkioliike, joka on hevoselle koulutettu jo aiemmin hyvin palkitsevaksi. Positiiviseen vahvisteeseen kannattaa yhdistää jokin sekundäärivahviste, joka edeltää varsinaista palkkiota.

Tutkimusten mukaan kiltti äänensävy ei ole vahviste sinänsä. Ääntä voi käyttää sekndäärivahvisteena, jolloin se toistuvasti ja hyvin luotettavasti ennakoi primäärivahvistetta, joka on se varsinainen kiva asia. Yhteys äänen ja varsinaisen palkkion välillä katkeaa, jos ääntä käytetään ilman oikeaa palkkiota. Käytös sammuu vähitellen, jos varsinaista vahvistetta ei tulekaan. Yli sadan hevosen otoksella tutkittiin, parantaako kauniilla äänensävyllä kehuminen hevosten suoritusta. Se ei parantanut.

Toisessa tutkimuksessa verrattiin taputtamista ja rapsuttamista ratsastuksen aikana. Lontoon olympialaisissa seurattiin 16 ratsukkoa. 15 ratsastajaa taputti hevosta suorituksen jälkeen. Lisäksi tehtiin testi, jossa taputtamista ja säästä rapsuttamista verrattiin. Rapsuttaminen tuotti hevosessa enemmän positiivisia merkkejä kuin taputtaminen. Tutkijat epäilevät, että säästä rapsuttaminen voi olla tehokkaampi vahviste, kuin yleisesti käytetty taputus. Rapsuttaminen voi jopa vahvistaa ratsukon välistä suhdetta.

Vahvisteen määrittelee aina eläin. Mitä tahansa käyttääkin, tehoa ja toimivuutta on helppo mitata: yleistyykö haluttu käytös? Ellei yleisty, kannattaa tarkistaa vahvisteen laatu, palkitsemisen ajoitus, tuleeko vahvisteita riittävän usein ja onko vaatimustaso sopiva. Koiraan verrattuna hevonen oppii todella nopeasti.

 

Positiivisen vahvisteen merkitys ymmärretään usein väärin. Kuvitellaan esimerkiksi, että jos käyttää makupaloja, niin seuraavat asiat tapahtuvat: 1) eläin on ihmisen kanssa vääristä syistä eli pelkkien herkkujen takia, 2) sitten joutuu kantamaan herkkusäkkiä mukana seuraavat vuodet, 3) eläin ei tee asioita oikeista (?) syistä, vaan ahneena seuraa makupalaa, 4) eläin tulee ahneeksi ja ajattelee vain ruokaa, 5) eläin alkaa kerjätä ja vaatia ruokaa, 6) eläin ajattelee, että hän on päällikkö, koska ihminen vain kantaa hänelle ruokaa.

Osa ihmisistä kammoksuu herkkujen antamista, vaikka menetelmänä positiivinen vahvistaminen on ollut laajasti ja pitkään käytössä mm. laboratorioeläimillä ja tutkimuksessa. Meillä on jokin outo ajatus siitä, että ruuan antaminen eläimelle olisi jotenkin paheksuttavaa – varsinkin koulutustilanteissa. Muuten kyllä annamme niille ruokaa useita kertoja päivässä. Pikku alaiset kantavat johtajahevosille ruokaa keskimäärin kolmesti päivässä, mutta koulutustilanteessa siitä tulee paheksuttavaa, vaarallista ja tuomittavaa.

Yksi varsin usein kuultu peruste sille, miksi juuri minä en käytä makupaloja, on se, ettei eläin pidä niistä tai ruuasta ylipäänsä. Tällainen eläin kannattaa toimittaa mahdollisimman nopeasti eläinlääkäriin, koska ne harvoin elävät pitkään syömättä tai juomatta (nesteitäkin voi käyttää vahvisteina). Usein kuulen myös, ettei makupala toimi. Hevonen ei mennyt traileriin edes kauraämpärillä. Aasi-porkkana-systeemillä ei ole mitään tekemistä positiivisen vahvistamisen kanssa. Systeemiä yleensä käytetään kerran ja todetaan ettei se toimi. Ehkä kuvitellaan, että eläin oppii jonkin asian jos se tekee sen kerran ja vahingossa.

Tyypillisiä esimerkkejä aasi-porkkana-systeemin sekoittamisesta positiiviseen vahvistamiseen ovat lastaus, pelottavien paikkojen ylittäminen, pesuboksi tai koirilla pesuhuone, kissoilla kuljetuslaatikkoon meno ja koirilla esim. tottis tai esteiden ylittäminen. Aasi-porkkana-systeemissä eläintä houkutellaan johonkin paikkaan niin, että eläin keskittyy herkkuihin ja seuraa niitä. Eläimen houkuttelulla ja kouluttamisella on iso ero. Positiivisena vahvisteena käytetty herkku taas toimii niin, että toistojen myötä eläin menee haluttuun paikkaan, koska uskoo kokemusten perusteella että siellä saa porkkanaa. Ja kun siellä on saatu porkkanaa tarpeeksi monta kertaa, paikkaa kohtaan muodostuu myönteinen asenne.

aasi_porkkana

Positiivinen vahvistaminen kuuluu kouluttajan työkalupakkiin siinä missä negatiivinen vahvistaminenkin. Ja rankaisut myös. Ensin pitää tuntea työkalut ja vasta sitten valita niistä tilanteeseen ja tavoitteeseen sopivat.

Eläin on aina se, joka määrittelee vahvisteen. Kannattaa käyttää sitä mikä toimii.

 

 

 

Haluatko hyväntuulisen vai pahantuulisen hevosen?

Hevosilla on huonoja päiviä ja hyviä päiviä. Tämä on yksi lause, joka mantran lailla toistuu artikkeleissa ja haastatteluissa. Jos halutaan, että hevosella on enemmän hyviä kuin huonoja päiviä, siihen on mahdollista vaikuttaa. Jokainen tietää, että eläimen muistiin tallentuu opitun käytöksen lisäksi tunnetila, jossa käytös on opittu.

Tutkijat testasivat, voiko koulutusmenetelmällä vaikuttaa hevosten mielialaan pidemmällä tähtäimellä. 12 tammaa koulutettiin tunnistamaan palkittava ja ei-palkittava paikka tarhasta. Hevoset jaettiin tämän jälkeen kahteen ryhmään, joista toiselle koulutettiin viiden päivän ajan erilaisia asioita käyttäen joko negatiivista vahvistetta tai positiivista vahvistetta. Sen jälkeen hevosten piti valita palkittavan ja ei-palkittavan paikan välillä olevista ”epäselvistä paikoista”.

Tammat, joita oli koulutettu positiivisesti vahvistamalla, kokivat enemmän positiivisia tunteita kuin toinen ryhmä. (Mitattavia asioita olivat: motivaatio eli nopeus suorittaa tehtävä, asenne käsittelijää kohtaan, pään asento, korvien asento.)

Kaikissa testeissä PV-hevoset olivat rennompia, motivoituneempia ja pitivät omaehtoisesti kontaktia käsittelijään. Negatiivisesti vahvistetut välttelivät käsittelijää, olivat kireitä ja suorittivat tehtävät hitaammin.

Käsittelytavalla on tutkijoiden mukaan yhtä suuri vaikutus eläimen hyvinvointiin kuin elinolosuhteilla. Tutkijat kannustavat käyttämään koulutusmenetelmänä positiivista vahvistamista tai positiivista ja negatiivista vahvistetta yhdessä.

Positiivisen vahvisteen avulla vaikutetaan ihmisen ja eläimen väliseen suhteeseen. Lisäksi sillä vaikutetaan eläimen senhetkiseen tunnetilaan ja pidemmällä aikavälillä eläimen ”tuuleen”, asenteeseen ja sitä kautta mielenterveyteen.

Valinta on meidän.

Behaviourof horses in a judgment bias test associated with positive or negative reinforcement 2014.

Vahvisteväli tarkoittaa kahden palkkion välistä aikaa. Vahviste voi olla jotain eläimen mielestä kivaa tai se voi olla paineen poistamista. Kun uutta käytöstä harjoitellaan, jokaisesta kerrasta kannattaa palkita – tällöin käytös vahvistuu nopeasti. Kun käytös on opittu, vahvisteväliä voidaan pidentää, eikä jokaisella kerralla tarvita palkkiota.
Vahvistamistapa vaikuttaa merkittävästi 1) siihen, kuinka nopeasti käytös omaksutaan ja 2) siihen, kuinka voimakas reaktio on.  Käytöksestä voidaan palkita jatkuvasti tai epäsäännöllisesti. Jatkuvan palkitsemisen etuna on nopea omaksuminen, mutta haittapuolena alttius sammumiselle, kun palkkaaminen loppuu. Sammuminen tarkoittaa sitä, että eläin lopettaa käytöksen tarjoamista kannattamattomana – esim. paine ei poistu tai herkkua ei tipu. Epäsäännöllinen palkitseminen tuottaa hitaammin tuloksia, mutta ei ole yhtä altis sammumiselle.
Käytännössä kun eläimelle opetetaan uutta, se ei voi mitenkään tietää mitä sen odotetaan tekevän. Vertaisin tilannetta siihen, kun yrittää löytää radiokanavaa vääntämällä nuppia – pelkkää kohinaa ja aina välissä vilahtaa jotain ymmärrettävää. Näitä välissä vilahtavia asioita pitäisi pystyä vahvistamaan, jotta ne yleistyisivät.
Koulutuksen tavoitteena on tehdä halutuista asioista sekä mahdollisimman helppoja että mahdollisimman kannattavia. Useat tutkimukset keetovat, että positiiviset muistot säilyvät pidempään kuin negatiiviset. Palkkioiden avulla koulutetut asiat säilyvät muistissa pidempään kuin paineen poiston avulla koulutetut asiat – tämä on todettu mm. banaanikärpäsillä.
Hevosten kanssa käytetään usein negatiivista vahvistetta. Siinäkin kannattaisi kiinnittää huomiota vahvisteväliin muistijäljen muodostumiseksi. Myötääminen kerran puolessa tunnissa ei riitä, vaan paine pitäisi poistaa mieluummin useita kertoja minuutissa, jotta oppimista tapahtuisi. Vahvisteväli on yksi asia, jonka negatiivinen vahviste voisi oppia positiiviselta vahvisteelta.

Millä tavalla hevoselle voi selittää mitä siltä halutaan? Itse käytän varsinkin ongelmatilanteissa, kuten lastaamisessa tai kengitysongelmissa positiivista vahvistamista. Tämä tarkoittaa, että hevonen palkitaan, kun se tekee oikeansuuntaisia asioita, mielellään oikeassa mielentilassa. Negatiivinen vahviste toimii samalla periaatteella – kun hevonen tekee halutun asian, paine poistetaan.

Olen huomannut, että positiivisen vahvistamisen etuna on ympäristön hallittavuus. Minun ei tarvitse ehtiä joka paikkaan tekemään hevosen oloa epämiellyttäväksi. Voin keskittyä siihen paikkaan, mihin haluan hevosen menevän.

Mikä on sinun tapasi?