Comportamenti e gratificazioni
27 luglio 2011
9 min

Comportamenti e gratificazioni

Uno degli aspetti della relazione tra cane e proprietario è rappresentato dal fatto che reciprocamente tentano di “condizionare” il comportamento dell’interlocutore. Molti cani apprendono rituali che inducono il compagno umano a reagire in un determinato modo, che spesso porta eventi piacevoli per il cane. La maggior parte degli organismi viventi ripresentano in natura azioni, mosse e risposte comportamentali, che come esito hanno eventi vantaggiosi per chi emette quella determinata azione o responso. Lo studio condotto dalla scienza comportamentale offre ampie e costruttive riflessioni sull’uso del cosiddetto “rinforzo”, come potente strumento di condizionamento dei comportamenti degli animali.
dog-treat1

Il rinforzo rappresenta qualsiasi cosa che, avvenendo contemporaneamente a un’azione, tende ad aumentare la probabilità che questa azione si ripeta. Il rinforzo è un evento che indica al soggetto che esprime una determinata azione, che proprio quel movimento è la causa dell’arrivo di qualcosa di piacevole; ciò può avvenire durante il comportamento (rinforzo intermedio) oppure a comportamento completato. Il rinforzo aumenta, dunque, la probabilità che il comportamento venga di nuovo proposto in futuro; questa condizione è identificata come “vantaggio del comportamento.”

Se si desidera usare rinforzi per condizionare i comportamenti dei cani e sviluppare con loro percorsi di apprendimento, è necessario entrare in un’ottica didattica ben definita, dove il proprietario che insegna deve trovarsi in una condizione che gli consenta di “accelerare i pensieri e anticipare gli esiti”. Il rinforzo deve essere percepito dal cane proprio sull’azione che si intende “moltiplicare”. Il tempismo, nella concessione del rinforzo, risulta, quindi, essere determinante.

È come praticare uno sport che richieda di pensare velocemente, dove lo schema di azione deve essere gratificato con assoluta velocità. Per questo motivo, il soggetto che insegna utilizzando i rinforzi deve essere ben consapevole di ciò che sta avvenendo ed essere sempre attento a ciò che si sta facendo. In chi insegn la pianificazione degli step di apprendimento deve essere ben chiara ae deve prevedere di identificare con certezza le azioni o segmenti di esse, che andranno a essere rinforzate. È la scienza comportamentale che fornisce i protocolli di applicazione didattica del rinforzo.

Per comprendere nei dettagli la potenzialità dell’insegnamento utilizzando i rinforzi, è importante considerare due elementi chiave: i due eventi (comportamento/azione e rinforzo) sono collegati in tempo reale “Il comportamento provoca il rinforzo”, l’azione/comportamento che si intende “celebrare” e in tempi successivi “modellare” deve essere collegata in tempi reali al rinforzo e alla soddisfazione che tale evento provoca nel soggetto che sta apprendendo. Con questa esperienza, il cane comprende con precisione che è proprio una determinata azione/comportamento che provoca il rinforzo.

Il rinforzo positivo R+ rappresenta una ricompensa o gratificazione diretta. Il rinforzo negativo R – rappresenta la sospensione di uno stimolo avversivo. Il rinforzo positivo vale per il cane la concessione di un premio apprezzato. Risulta essere molto importante, ai fini dell’apprendimento e del condizionamento dei comportamenti, che il cane capisca con certezza quale è l’azione che gli consente di provare il piacere che la gratificazione implica. È giusto, quindi, che l’insegnante si preoccupi di capire se il cane ha ricevuto “l’informazione giusta”.

Il rinforzo negativo rappresenta, invece, la sospensione di uno stimolo che in un certo qual modo irrita il cane, dove tale sospensione porta al cane soddisfazione. Molti addestratori che usano metodi di addestramento superati insegnano al cane ad assumere la posizione del seduto, dispensando al cane strattoni con guinzaglio. Seguendo tale metodo, dopo un numero imprecisato di colpi, l’animale “impara” che il comportamento che gli evita tali fastidi è rappresentato dall’assunzione della posizione del seduto.

L’applicazione del rinforzo positivo o del rinforzo negativo ha portato nel tempo alla identificazione della forma mentis che caratterizza le scuole di educazione cinofila, con l’applicazione del metodo gentile (rinforzo positivo) o il metodo coercitivo (rinforzo negativo). Per mia estrazione culturale, per indole caratteriale e per il fatto che ritengo il metodo gentile del rinforzo positivo sia la strada giusta per avere un buon rapporto con i cani, applico da sempre e diffondo da anni insieme agli istruttori del Centro Studi del Cane Italia i protocolli educativi che prevedono l’uso esclusivo del rinforzo positivo.

Per il cane esistono rinforzi positivi primari. Il cibo, che fa capo all’istinto di mantenimento, o ancora la pallina, che è rappresentativa dell’istinto predatorio, sono esempi di rinforzi primari, cioè di immediato e spontaneo apprezzamento per il cane. È possibile, con un minimo di abilità, creare in modo associativo nella mente del cane un rinforzo positivo condizionato. La parola “bravo” per il cane inizialmente non significa nulla: è un suono come un altro. Se però a quella parola si fa seguire, con tempismo e costanza, un rinforzo primario, quel suono acquisirà una valenza speciale e diventerà l’annuncio della gratificazione oggettiva in arrivo.

Un rinforzo positivo condizionato che viene dispensato con tempismo comunica al cane: “Bingo!!! Ciò che stai facendo ora va bene e ti farà guadagnare qualcosa, quindi ripetilo”. Il cane che percepisce il rinforzo positivo condizionato ripeterà l’azione sulla quale ha percepito la parola “Bravo!!”, perché mostrerà la consapevolezza che proprio quel gesto è la causa del rinforzo. È importante comprendere come il comportamento che il cane esprime può essere intensificato con il rinforzo positivo. Del resto, è chiaro come non sia possibile rinforzare un’azione che non avviene (è questo il principale problema dei cani paurosi, timidi, o apatici).

La gratificazione, per essere considerata un rinforzo deve rappresentare qualcosa di positivo, che in un certo qual modo vada a soddisfare le aspettative del soggetto operante. Il cibo, ad esempio, può non rappresentare un rinforzo per un cane sazio. Gli istruttori del Centro Studi del Cane Italia utilizzano diversi rinforzi positivi condizionati, perché ben sanno che è utile avere una varietà di rinforzi per ogni situazione di addestramento. Analizziamo ora brevemente le difficoltà che possono presentarsi nel lavoro basato sull’utilizzo del rinforzo positivo per la costruzione di comportamenti.

Nel caso in cui il comportamento non fosse espresso con maggiore frequenza, nonostante sia stato gratificato, è molto probabile che il rinforzo non sia stato presentato con tempismo oppure che la ricompensa utilizzata non venga considerata un rinforzo dal soggetto operante. Particolare cura va, quindi, rivolta al tempismo e alla qualità dei rinforzi. Per il soggetto operante risulta essere di determinante importanza il fatto di percepire con chiarezza qual è il comportamento che ha portato al rinforzo. Il cane deve poter comprendere che ciò che sta facendo in un preciso momento (informazione), è la causa della vincita del premio.

Nel soggetto che sta cercando di imparare, l’informazione coerente di un rinforzo diventa, anche, molto più importante del rinforzo stesso. Nella mente del cane l’“informazione” deve risultare chiara, percepibile, onesta, coerente, distinta. I proprietari alle prime esperienze di insegnamento devono cercare comportamenti piacevoli e spontanei nei loro cani e rinforzarli: ciò conduce all’apprendimento fluido e dispone l’allievo a una grande carica motivazionale, inoltre evita espressioni perniciose, mantenendo un clima umorale piacevole. Se il rinforzo non è dato con il giusto tempismo (rinforzi tardivi) non si avrà esito. Il cane non sarà messo in grado di percepire l’informazione corretta e, quindi, non si arriverà all’obiettivo programmato.

I rinforzi tardivi sono il più grande problema che assilla proprietari di cani e istruttori alle prime armi. Anche il rinforzo anticipato non conduce a centrare l’obiettivo, infatti, rinforzare troppo presto non produce nessun effetto. Alcuni istruttori neofiti tendono a rinforzare troppo frequentemente o ancora a presentare i rinforzi anzitempo; a volte, addirittura, il rinforzo viene usato come stimolo. Se così si opera, non si avranno processi di “modellaggio” dei comportamenti. Non è logico “corrompere” chi deve apprendere e anticipare lo “stipendio” per un’azione ancora da esprimere.

Anche nell’applicazione del rinforzo negativo (sospensione stimolo avversivo), del resto, è necessario essere tempisti. Il cavallo gira a destra quando sente il morso che comprime e capisce che la cessazione del rinforzo negativo avviene girando a destra. Vi sono istruttori equestri che spronano il cavallo con calci al costato per favorire la “rottura dell’andatura” dal passo al trotto. Se l’azione del dare colpi (rinforzo negativo) non viene sospesa quando il cavallo “rompe il passo”, l’equino non avrà l’informazione che è proprio il trotto che induce la sospensione del rinforzo negativo. Risultato: il cavallo procede ad andatura lenta e il fantino continua a scalciare.

L’addestramento di un cane neofita deve sempre iniziare, instaurando un rinforzo condizionato. I rinforzi positivi condizionati possono essere rappresentati dal clicker, dal fischio, dalla luce, dalla parola di lode. I rinforzi positivi condizionati diventano incredibilmente potenti. I miei cani lavorano ben oltre il punto di sazietà e, grazie ai rinforzi condizionati, mantengono alta la motivazione nelle espressioni delle loro performance.

Personalmente ritengo che sia una buona idea rendere un rinforzo condizionato ancora più potente, associandolo a molti rinforzi primari. Per i miei cani il suono “Bravo!” risulta essere un rinforzo positivo condizionato e loro, quando sentono quel suono, pensano all’arrivo immediato di cibo o della pallina o della carezza, o di quello che piace a loro; credo sia per loro interessante “scoprire” quale rinforzo primario è di volta in volta associato al rinforzo positivo condizionato.

Nel processo di costruzione di un comportamento, possiamo notare tre fasi differenti: una prima fase di apprendimento è seguita da una fase intermedia di approfondimento, cui fa seguito la fase terminale di mantenimento. Soltanto nella prima fase è necessario rinforzare il comportamento ogni volta che questo avviene: un rinforzo positivo costante deve venire dispensato soltanto durante la fase di apprendimento. Al cane principiante andranno, dunque, dispensati molti rinforzi, ma, quando il comportamento è acquisito, sarà buona regola rinforzare ogni tanto il comportamento appreso, casualmente, di sorpresa.

Per mantenere vivo il comportamento appreso e mantenere freschezza di espressione, è necessario variare frequentemente il momento del rinforzo, piuttosto che mantenerlo costante e prevedibile. Per mantenere “fresco” un comportamento appreso è, quindi, necessario basarsi su un programma di concessione di rinforzi intermittenti. La variabilità dell’arrivo del rinforzo porta l’animale a esprimere il comportamento in modo più vigoroso, dando la possibilità all’operatore di migliorare le performance gestendo bene le ricompense. Non è, quindi, necessario ricompensare continuamente il comportamento corretto.

Nelle fasi iniziali dell’insegnamento di un nuovo comportamento occorre, dunque, applicare un rinforzo costante, nella fase di approfondimento seguire un programma di rinforzo variabile a intermittenza e per la fase di mantenimento di un comportamento appreso usare il rinforzo variabile a sorpresa.