Renforcement et extinction

Ce qu’on appelle « l’extinction » d’un comportement c’est sa cessation (en clair : le fait qu’un comportement disparaisse, cesse, s’arrête définitivement); la psychologie du comportement nous apprend qu’un renforcement intermittent (qui n’arrive pas à chaque fois que le comportement se produit) rend cette extinction infiniment plus improbable.

Voyons ça de plus près…  ;-)

Dans leurs expériences avec les rats, les scientifiques décident d’un schéma de renforcement : une récompense arrive tous les 15 (ou 20 ou 50) bons comportements ou toutes les deux minutes ou parfois toutes les deux réponses réussies, puis toutes les sept ou toute les dix fois. Ou encore, quand le chercheur est présent dans la pièce uniquement et rien quand il est absent… dans tous les cas de figure, la récompense n’arrive pas à chaque essai mené à bien. N’importe quel schéma qui ne renforce pas toutes les réponses correctes est défini comme « intermittent ».

Exemple de la vie courante : quand un enfant réclame un bonbon avant le repas et qu’on le lui refuse dix fois et que — parce qu’on est fatigué et qu’on n’a pas envie d’assumer la partie explications déjà données cent fois — on le lui accorde la onzième… on a mis en place un schéma de renforcement intermittent : on peut être certain que l’enfant redemandera encore cent fois, en espérant voir réapparaître l’exception ;-)

Revenons au chien… :-D

Le contraire d’un renforcement intermittent est un renforcement continu…  en clair (bis),à chaque fois que votre chien produit un comportement, revient vers vous par exemple, il reçoit une friandise – toujours et invariablement (c’est le schéma de renforcement le plus efficace en apprentissage). Il est évident qu’un chien qui voit apparaître sa friandise à chaque rappel, s’apercevra très vite de la différence si celle-ci n’arrive plus du tout… et le comportement s’éteindra relativement vite. Tout ou rien, c’est facile à différencier.

A contrario, quel que soit le schéma « intermittent »,  celui-ci complique la tâche pour l’animal : il ne peut pas, ou difficilement, déterminer si et quand une récompense va arriver… il va donc continuer d’essayer en espérant voir arriver le renforcement(l’espoir fait vivre ou le principe de la machine à sous… on joue, on joue car une fois on a gagné).

Avec tout schéma de renforcement intermittent…. l’extinction aura beaucoup de peine à se faire la période sans renforcement peut durer longtemps : l’animal s’habitue à des périodes (parfois longues) sans renforcement…

A nous, d’utiliser ce schéma de renforcement intermittent (post période d’apprentissage) pour renforcer certains comportements que l’on souhaite voir échapper à l’extinction(comme le rappel notamment)en récompensant de temps en temps ce comportement,  pendant toute la vie du chien.

A nous d’en prendre également conscience quand nous souhaitons voir arriver l’extinction d’un comportement quel qu’il soit (quémander à table, par exemple) : tout relâchement à votre ligne de conduite, aussi rare soit-ilvous catapulte dans un schéma de renforcement intermittent et donc contribue à faire perdurer le comportementà le rendre hyper résistant à l’extinction.

  • En résumé : en période apprentissage — récompensez chaque réponse correcte.
  • Pour voir perdurer un comportement — renforcez de manière intermittente.
  • Pour voir disparaître un comportement — ne le renforcez plus jamais (ou gérez l’environnement afin de rendre ce renforcement impossible).

Et ne vous étonnez plus de voir ce qui marche « de temps en temps » s’installer solidement ou de voir ce qui n’est plus jamais récompensé, s’éteindre :-D

Vous devez être connecté pour poster un commentaire