Le conditionnement opérant, pilier du béhaviorisme, étudie la manière dont les conséquences influencent les comportements. Proposé par B.F. Skinner, cette méthode d'apprentissage démontre l'impact du renforcement et de la punition dans le façonnement et la modification des comportements.
L'approche objective de Skinner se concentrait sur le comportement, en le classant en deux types :
Comportements réflexifs : ce sont des réponses involontaires déclenchées par des stimuli spécifiques, comme la salivation en présence de nourriture.
Comportements opérants : ce sont des actions volontaires, dirigées vers un but et influencées par leurs conséquences, préparant le terrain pour le conditionnement opérant.
Le conditionnement opérant implique un renforcement et une punition systématiques :
Renforcement : ce sont des forces positives qui augmentent ou maintiennent les comportements souhaités :
Punition : ce sont des forces négatives qui diminuent ou éliminent les comportements indésirables :
En l'absence de renforcement ou de punition, les comportements diminuent progressivement et finissent par disparaître par un processus appelé extinction. Cela souligne l'importance d'une application cohérente des techniques comportementales.
Le moment et la fréquence du renforcement influencent la rapidité et la force de l'apprentissage. Skinner a identifié différents programmes de renforcement :
Renforcement continu : chaque comportement souhaité est renforcé, ce qui accélère l'apprentissage mais accélère également l'extinction.
Programme à taux fixe : renforcement après un nombre spécifique de réponses, ce qui se traduit par un taux de réponse stable.
Programme à intervalle fixe : renforcement uniquement après qu'un intervalle de temps spécifique se soit écoulé, ce qui entraîne une augmentation des taux de réponse juste avant que le renforcement ne soit dû.
Programme à taux variable : renforcement après un nombre variable de réponses, ce qui conduit à un taux de réponse élevé et constant.
Programme à intervalle variable : renforcement après qu'une durée variable se soit écoulée, ce qui donne un taux de réponse modéré et stable.