Premiare il cane: come, quanto e perchè

La programmazione del premio

Spesso mi viene chiesto quando bisogna smettere di premiare il cane.

In realtà questa domanda mi lascia sempre perplesso in quanto colgo la pretesa, in chi la pone, che il cane faccia le cose che gli chiediamo come se il suo comportamento ci fosse dovuto o come se fosse una vergogna “pagare” il cane quando ha fatto un buon lavoro.

La risposta, quindi, è Mai.

(Ma anche quando si lavora “dovere”, la risposta è la medesima, in quanto la disciplina, ogni tanto, va ricordata.) 

Tornando al lavoro basato sul premio, non è che dobbiamo smettere di premiare il cane, ma per migliorare l’esecuzione del comportamento possiamo programmare il premio, migliorando le risposte.

Se in fase di apprendimento dobbiamo premiare tutte le risposte corrette, superata questa fase, quando siamo certi che il cane sappia quello che gli stiamo dicendo e abbia anche generalizzato il comportamento, possiamo procedere a trasformare il premio da continuo a parziale, decidendo di premiare il cane secondo il Rapporto (Ratio) o secondo l’Intervallo.

Sia Rapporto sia Intervallo possono essere variabili o fissi. 

Questo schema dovrebbe chiarire il concetto:

  • Programmazione del premio
    • continuo
    • parziale
      • Intervallo
        • fisso
        • variabile
      • Rapporto
        • fisso
        • variabile

Premio continuo: il premio continuo, dicevamo, si utilizza in fase di apprendimento. Insegniamo al cane a fare qualcosa e premiamo ogni azione corretta che questi compia. Il premio continuo consente una curva di apprendimento rapido ma ha una bassa resistenza all’estinzione. Finita questa fase, dobbiamo cambiare metodo, sia per migliorare la risposta, sia per preparare i cani per quegli sport in cui non è possibile usare il premio durante la gara, sia per la gestione quotidiana, se non vogliamo andare in giro ogni giorno con le tasche piene di wurstel.

Nella programmazione del premio parziale, solo una parte delle risposte corrette viene premiata. Il fatto che la curva di apprendimento potrebbe risultare meno rapida non ci preoccupa perché passiamo a questo tipo di programmazione solo dopo che il comportamento è stato appreso. Con il premio parziale si ha anche un’elevata resistenza all’estinzione del comportamento.

Il principio su cui si basa è quello del gioco d’azzardo: per fare sei al super enalotto ci sono le stesse probabilità che uno digiti sei numeri al telefono e gli risponda Sharon Stone.

Le persone però continuano a giocare o perché sanno di qualcuno che ha vinto o perché in precedenza, giocando d’azzardo, hanno vinto una qualche somma.

Ma vediamo, nel dettaglio, la programmazione con vantaggi e svantaggi che ne derivano:

I modelli di programmazione del premio possono essere in funzione delle risposte (a rapporto Fisso e Variabile) ed in funzione del tempo (a intervallo Fisso o Variabile).

Programmazione a Rapporto Fisso: il numero delle risposte che deve essere dato per provocare l’erogazione del premio è fisso. Ad esempio, premio il cane ogni 5 volte che mi fa il comportamento.

Programmazione a Rapporto Variabile: il premio viene dato in base alla media delle risposte date. Ad esempio se programmiamo un premio a rapporto variabile 40, significa che il cane riceve in media un premio ogni 40 risposte.

Programmazione ad Intervallo Fisso: il tempo che deve trascorrere tra un premio e un altro è fisso. Ad esempio, ad intervallo fisso 40, verrà premiato il primo comportamento corretto del cane dopo che dal premio precedente siano trascorsi almeno 40 secondi. 

Programmazione ad Intervallo Variabile: il tempo tra un premio e un altro è variabile. Ad esempio, ad intervallo variabile 40, il premio arriva dopo che siano trascorsi in media 40 secondi dalla precedente ricompensa.

Nella programmazione secondo il Rapporto, la frequenza di risposta è superiore rispetto ai programmi a Intervalli, perché solo in un programma a rapporto un’elevata frequenza di risposta fa aumentare il numero di premi, in quanto il premio stesso è maggiormente controllabile.

Nei programmi fissi, sia Rapporto Fisso sia Intervallo Fisso, si osserva una “pausa della risposta” subito dopo ogni premio perché è prevedibile che le risposte immediatamente successive a un premio non vengono mai rinforzate, mentre nei programmi variabili non ci sono pause perché è imprevedibile quanto lontano sia il prossimo premio

La pausa è maggiore nella programmazione ad Intervallo Fisso, anche se la frequenza di risposta aumenta verso la fine dell’intervallo, ossia quando ci si aspetta che il premio stia per arrivare.

In conclusione, non affrettiamo i tempi.

Assicuriamoci che il comportamento venga appreso correttamente, quindi programmiamo il premio con l’obiettivo di migliorare la risposta attesa, scongiurando il processo di estinzione.

Davide Cardia

addestratore ENCI Sezione 1° Dog Trainer Professional riconosciuto FCC Direttore Tecnico del centro cinofilo Gruppo Cinofilo Debù Docente in diversi stage con argomenti legati alla cinofilia e alla sua diffusione Docente corsi di formazione ENCI per addestratori sezione 1 Ospite in radio e trasmissioni televisive regionali Preparatore/Conduttore IPO e Mondioring Autore del libro “Addestramento con il premio” edizioni De Vecchi Curatore del libro “Io e il mio Bullgod” edizioni De Vecchi

Davide Cardia

Cosa ne pensi?

Copy Protected by Chetan's WP-Copyprotect.
%d blogger hanno fatto clic su Mi Piace per questo: