Cet article fait partie de mes travaux quand je réfléchissais sur les intérêts possibles des psychanalystes à s’intéresser aux théories d’apprentissage.
Titre originel de la publication
De l’apprentissage par observation à la protoculture
RESUME
L’auteur propose une revue bibliographique de la question de l’apprentissage par observation chez les animaux. Il est possible d’envisager que ces mécanismes puissent être une base phylogénétique (des espèces) de l’identification et de la formation du moi. Si déjà un animal est perméable aux conduites de ses congénères, que dire alors de l’Homme doué de capacités cognitives extraordinaires ?
RIASSUNTO
L’autore propone una rassegna bibliografica sul problema dell’apprendimento tramite osservazione presso gli animali. Si può pensare che tali mecanismi siano un supporto filogenetico dell’identificazione e della formazione dell’io. Se l’animale è permeabile alle condotte dei suoi congeneri, che dire dell’ uomo, dotato di capacità cognitive straordinarie ?
SUMMARY
The author presents a bibliographical review about observational learning of animals. Those mechanisms could be considered as a phylogenetic (of the species) basis of the identification and formation of the ego. If as it is, an animal is permeable to the behaviors of its congeners, what could we say then about the human being endowed with extraordinary cognitive abilities ?
_________________________________________________________________________________________________________________________________
SOMMAIRE
Préambule
I- INTRODUCTION ET BREF HISTORIQUE
II- DEUX APPROCHES METHODOLOGIQUE DE L’APPRENTISSAGE D’UNE TACHE
PAR UN SUJET-ANIMAL SUITE A L’OBSERVATION D’UN CONGENERE-
MODELE
1- L’APPRENTISSAGE VICARIANT
11. Définition (d’après M. Robert, 1970)
12. Quelques expériences d’apprentissage vicariant
121. Apprentissage instrumental
1211. Avec renforcement positif
1212. Avec renforcement positif et stimulus dis-
criminatif
122. Situations d’évitement
1221. Avec renforcement négatif seul
1222. Avec renforcement négatif et stimulus discri-
minatif
123. Discrimination d’objets
124. Apprentissage vicariant – Façonnement et Auto-
façonnement
2- L’APPRENTISSAGE PAR OBSERVATION
21. Définition
22. L’extinction
23. Apprentissage par observation entre espèces différentes
d’animaux
24. Les habitudes alimentaires
25. Apprentissage par observation en situation sociale
3- QUELQUES HYPOTHESES EXPLICATIVES DE L’APPRENTISSAGE PAR
OBSERVATION
31. » The matched dependant behavior »
32. L’hypothèse de l’accentuation locale
33. Hypothèse de Bandura (1965)
34. Hypothèse de la médiation
III- DE L’APPRENTISSAGE PAR OBSERVATION A LA PROTOCULTURE CHEZ
LES ANIMAUX
1- L’USAGE D’OUTIL
2- LES NOUVELLES HABITUDES ALIMENTAIRES
IV- CONCLUSION
REFERENCES BIBLIOGRAPHIQUES
Préambule
Freud fit souvent des mises en garde destinées aux psychanalystes dont celle-ci, à savoir qu’ils devaient se prémunir contre un respect excessif d’un « mystérieux inconscient ».
Il est certain que la pratique analytique met le praticien devant des observations « étonnantes », qu’il ne peut d’ailleurs pas toujours expliquer, ni comprendre. Ces faits observés, qui pourraient tenir du mystère, ne doivent pas lui faire perdre de vue son objectivité scientifique quant aux explications théoriques qu’il pourrait tirer des manifestations psychiques observées en séance.
Essayer de théoriser les mécanismes qui sous-tendent le psychisme humain n’est pas une mince affaire : il faut savoir être d’une logique à toute épreuve dans les raisonnements tout en ayant l’esprit suffisamment libre pour saisir toute les subtilités de l’irrationnel humain – ou si l’on préfère, la logique de l’inconscient.
Il faut dire que les psychanalystes qui tentent de comprendre ce qui se joue derrière les apparences (le comportement observable) travaillent sur une matière qui n’est observable que par ses manifestations, qui plus est, déformées. Un peu à la manière du paléontologue, qui à partir de quelques fragments d’os, va tenter de reconstituer le squelette d’un animal disparu (puis de son mode de vie, puis de sa niche écologique, etc …) qu’il n’a jamais vu et ne verra jamais, le psychanalyste fera de même avec les signes en provenance de l’inconscient sans jamais pouvoir l’observer directement.
Il suppose, il émet des hypothèses, il tente d’accumuler des preuves qui viennent appuyer la justesse de ses hypothèses. En allant d’hypothèses en hypothèses, il en arrive à élaborer un modèle théorique qui est sensé expliquer le maximum de faits psychiques. Cependant, il ne faut jamais perdre de vue qu’il s’agit précisément d’un modèle d’une dynamique qui, par définition, nous échappe. C’est dans ce sens par exemple que Freud soulignait souvent que ses élaborations étaient faites par défaut et que la biologie permettraient probablement un jour de mieux comprendre ce que lui-même essayait de démêler. C’est dans cet esprit qu’il qualifiait sa théorie des pulsions, en s’adressant aux psychanalystes, de « notre mythologie », ce qui illustre à quel point il fit toujours montre d’une prudente honnêteté scientifique.
On comprend alors que tout modèle psychanalytique peut très vite devenir une spéculation qui n’a plus beaucoup de rapport avec les faits de la réalité observée. Si il faut savoir s’affranchir de ces derniers pour pouvoir espérer permettre des progrès à toute théorie psychanalytique, il ne faut pas tomber non plus dans le piège d’une construction totalement imaginaire qui expliquerait tout et arrangerait des concepts entre eux à seule fin de prouver des postulats proposés à priori. Ce danger existe en psychanalyse précisément parce que la matière étudiée n’est saisissable que par des signes déformés.
Ajoutons que cette dérive – qui existe de tout temps en psychanalyse (citons Reich avec son » orgone « , certaines dérives dans la topologie lacanienne) – est humaine et compréhensible compte tenu de l’infinie complexité des phénomènes psychiques inconscients. Les chercheurs de sciences dites exactes sont plus favorisés en ce sens que les faits qu’ils cherchent à expliquer sont directement observables, encore qu’il faille relativiser cette assertion dans la mesure où c’est de moins en moins vrai compte tenu de l’intimité de ce que l’on cherche à comprendre (il suffit de penser par exemple à la physique quantique ou encore à la biologie moléculaire).
Pour éviter cette perte de la réalité et ne pas tomber dans le piège de « l’adoration » du « mystérieux inconscient », il me semble que les psychanalystes doivent relier leurs observations à celles qui sont faites dans des disciplines qui se basent sur des faits concrètement observables.
Dans le cadre de la présente publication, il s’agira de proposer au lecteur une revue bibliographique sur les mécanismes d’apprentissage dits « vicariants » et « par observation » chez les animaux.
Sans vouloir généraliser abusivement de l’animal à l’homme, il ne semble pas déraisonnable de penser que ces formes d’apprentissage très spécifiques puissent être à la base des mécanismes d’identification (donc d’introjection, d’internalisation, d’incorporation et d’intériorisation). Il est évident que ces recherches de psychologie expérimentale et d’éthologie sur ces formes d’apprentissage ne nous apprendront rien sur l’identification d’un point de vue psychanalytique. Mais elles permettent de visualiser certaines formes d’apprentissage qui sous-tendent le mécanisme de l’identification qui est à l’origine de la formation du moi.
Dans la mesure où, comme nous le verrons, les études sur l’apprentissage par observation mènent les chercheurs à se poser la question d’une protoculture chez les primates (donc à la transmission de traditions), ces travaux nous renvoient également à la notion de transmission phylogénétique : peut-être que des éléments d’identification phylogénétique ne sont rien d’autre que le résultat d’apprentissages par observation intergénérationnels extrêmement subtils.
I- INTRODUCTION ET BREF HISTORIQUE
Si il y a un domaine de la Psychologie dans lequel les débats sont souvent passionnés, les prises de position très partisanes, c’est bien celui de l’Apprentissage, et pour cause : quiconque est confronté à ce sujet est amené implicitement à essayer de comprendre notre propre pensée et ses contradictions. Si il y a un secteur de ce domaine qui renvoie complètement à ce que nous sommes, à savoir des animaux fondamentalement culturels, c’est bien celui de l’Imitation. Qu’un animal ait la capacité d’imiter un congénère en acquérant des nouveaux types de comportements ou en modifiant des unités comportementales déjà existantes, c’est la base de la transmission d’un » savoir ». L’Homme, compte tenu de son développement phylogénétique qui l’a doté d’un cerveau possédant d’importantes capacités cognitives, est certainement le meilleur » imitateur » que la nature a produit. L’idée selon laquelle un animal observateur apprend par observation (ou imite) en intégrant une » image psychologique » de ce que fait un congénère-acteur afin de la restituer plus tard, est très séduisante. Je pense qu’un chercheur qui travaille sur l’imitation est obligé, un jour ou l’autre, d’émettre l’hypothèse selon laquelle un animal (à condition qu’il ait des capacités cérébrales suffisantes) aurait des capacités à la représentation.
Cela dit, de nombreux auteurs voient les choses différemment et peut-être faut-il réserver cette idée uniquement aux primates, et bien sûr à l’Homme. Pour Piaget par exemple, la capacité d’imitation à l’état différé annonce précisément la représentation et la capacité symbolique ; mais l’imitation est aussi possible pour cet auteur avant ce stade de la pensée préconceptuelle (ou intuitive) du début du langage (donc au moment de la primauté de l’intelligence sensori-motrice sans représentation imagée que l’être humain partage avec l’Animal) ; en d’autres termes, et de façon extrêmement simplifiée, pour cet auteur il y aurait imitation avec représentation chez l’enfant dés qu’il commence à parler et imitation sans représentation pendant la période pré-verbale.
Pour en revenir à notre sujet, l’apprentissage par observation chez l’animal, la logique plutôt cognitiviste d’envisager l’apprentissage par observation pourrait, peut-être, permettre de comprendre pourquoi les travaux dans ce domaine sont quasiment abandonnés à l’apparition des théories associationnistes (Watson, 1913). L’abandon a pratiquement été total jusque dans les années trente. Puis les études sur l’imitation ont alors été fortement
imprégnées des principes des théories S-R (Miller et Dollard, 1941, sont représentatifs de ce courant) et ce n’est que vers les années 1950 qu’il y a eu à nouveau un regain d’intérêt pour ce domaine. D’après Mackintosh (1974), ce serait justement l’échec de Thorndike (1911) à mettre en évidence un comportement d’imitation chez le Singe qui l’aurait conduit à être à l’origine des théories associationnistes, et ceci, en émettant l’hypothèse que le renforcement de l’association S-R par une récompense était suffisante pour expliquer l’apprentissage d’une réponse instrumentale.
Avant cette période d’ostracisme concernant l’apprentissage par imitation, il y avait eu de nombreuses études dans une perspective d’approche comparative. Certains auteurs pensaient avoir mis en évidence des capacités d’imitation chez les animaux (Berry, 1906, chez le Rat ; Kinnaman, 1902, Haggerty, 1909, Pfungst, 1912, chez le Singe) alors que d’autres avaient des résultats négatifs (Small, 1899, chez le Rat ; Thorndike, 1898/1901, chez l’oiseau, le chien, le chat et le Singe ; Watson, 1908, chez le singe ; Sherpherd, 1915, chez le chimpanzée). Ce fut les théories de Darwin (De l’Origine des Espèces, 1859) qui a été le catalyseur de ce type d’approche. Dans la mesure où Darwin disait qu’il y a une évolution phylogénétique des capacités cérébrales (au même titre que la morphologie, la physiologie, etc.), il semblait normal, pour les chercheurs de l’époque, qu’on puisse trouver des éléments « d’intelligence » chez l’animal. L’espoir de ces chercheurs était celui de comprendre le fonctionnement de la pensée humaine. Cet état d’esprit impliquait que l’animal le plus étudié était le Singe car le plus proche de l’Homme dans l’échelle taxinomique. Ces études n’ont pas donné des résultats probants parce que trop anecdotiques du point de vue méthodologique et trop anthropomorphistes du point de vue de l’approche théorique.
Une deuxième période d’approche comparative apparaît vers les années 1940-1950. A cette époque correspond l’avènement de l’éthologie objectiviste et des études sont faites dans ce contexte (Fisher & Hinde, 1949 ; Tinbergen, 1960 ; etc.).
Plus récemment, de nombreux auteurs remettent en cause les principes de base des théories S-R (stimulus-réponse) et admettent que les processus d’apprentissage peuvent être le reflet d’adaptations spécialisées dues à des pressions sélectives de l’environnement habituel de l’animal (Bolles, 1970 ; Seligman, 1970 ; Shettleworth, 1972 ; Rozin & Kalat, 1971 ; Herrstein, 1977). Des faits expérimentaux viennent corroborer la véracité de ces prises de
position théoriques (Garcia, 1966 ; Brown & Jenkings, 1968 ; Williams &, 1969 ; etc.). Il ressort de ces résultats que le principe d’équipotentialité des stimuli n’est pas généralisable, que la notion de » court délai » entre le S-C (stimulus conditionnel) et le S-I (stimulus inconditionnel) n’est pas vrai dans tous les cas, que le lien stimulus-réponse peut être plus déterminant que le lien réponse-renforcement dans certains cas, et d’une manière plus générale qu’il est plus facile d’associer certaines contingences plutôt que d’autres. Cette approche plus » naturaliste » de l’apprentissage a l’avantage de rapprocher les travaux de certains psychologues (Alcock, Galef, Wyrwicka, etc. ) de ceux des éthologistes (Hinde, Thorpe,etc. ). On s’accorde de plus en plus à ne plus faire de dichotomie simpliste » inné-acquis » (l’éternel débat » nature-culture » !) mais à considérer que le comportement est l’expression d’une interaction complexe entre les caractères héréditaires et les influences de l’environnement physique et social. L’hypothèse selon laquelle le phénotype est la résultante observable de l’interaction » génotype-environnement » n’est pas absolument nouvelle, mais ce qui est novateur est le fait que, depuis une vingtaine d’années, les auteurs en tiennent compte dans l’approche méthodologique de leurs expériences. Nous verrons que cette approche récente se retrouve dans le domaine de l’imitation : les expériences sur l’acquisition vicariante (approche méthodologique skinnérienne) se distinguent des autres sur l’apprentissage par observation.
II- DEUX APPROCHES METHODOLOGIQUE DE L’APPRENTISSAGE D’UNE TACHE
PAR UN SUJET-ANIMAL SUITE A L’OBSERVATION D’UN CONGENERE-MODELE.
Il y a longtemps que l’on distingue l’imitation proprement dite de l’apprentissage par observation. Lloyd Morgan (1896) distingue l’imitation » volontaire » de l’imitation » instinctive « . Thorpe (1963) fait le même type de nuance en séparant la » vraie imitation » (true imitation) qui impliquerait des processus non-instinctifs, de la facilitation sociale qui serait une contagion comportementale de schèmes comportementaux plus ou moins instinctifs. Cette catégorisation relativement simple devient très complexe dès que l’on étudie la littérature consacrée à l’imitation chez les animaux. On se perd dans une multitude de vocables tels que : le comportement allomimétique, la suggestion, la contagion, la copie, l’apprentissage par empathie, l’accentuation locale, l’imitation, l’identification, la mimique, l’imitation mutuelle, le conditionnement secondaire, l’apprentissage par observation et l’apprentissage vicariant. Il faut dire que cette situation confuse n’est pas favorable à des comparaisons de résultats ainsi qu’à des tentatives de théorisation de l’apprentissage à partir de l’expérience d’autrui. Davis (1973) fait une distinction de tous ces phénomènes en trois grandes catégories :
. la vocalisation chez les oiseaux,
. la facilitation sociale,
. l’apprentissage par observation.
Il admet lui-même que cette catégorisation ne repose sur aucune unité en ce qui concerne les processus sous-jacents. Il fait simplement un regroupement des études qui sont le plus apparentées du point de vue de l’objet étudié et/ou du point de vue méthodologique. Si ce regroupement semble pertinent pour la vocalisation des oiseaux, il l’est moins pour l’apprentissage par observation où de nombreuses situations présentées sont fort différentes les unes des autres (par exemple, apprentissage en situation vicariante typique et apprentissage par observation en situation sociale), il ne l’est plus du tout pour la facilitation sociale qui est une catégorie » poubelle » où se trouvent les expériences qui ne correspondent pas aux critères de classement implicites des deux autres regroupements. Il faut admettre qu’il est difficile de procéder autrement pour qui veut passer en revue l’ensemble des travaux sur l’imitation chez les animaux. En ce qui nous concerne, nous nous intéresserons uniquement à l’apprentissage par observation.
Dans ce domaine, il existe, en général, deux approches méthodologiques différentes plus particulièrement pour évaluer les modifications comportementales de l’observateur (Davis,1973) :
a/ Soit en insistant sur le choix de la réponse (Choises of response), en d’autres termes, sur la topographie et l’aspect stratégique de la réponse ; ce type de travaux apportent une vision plus nuancée de l’apprentissage à partir de l’expérience d’autrui et constitue ce que nous appellerons le domaine de l’apprentissage par observation ;
b/ Soit en insistant sur la taux d’acquisition (rate of acquisition) et donc sur la performance ; cette approche est skinnérienne du point de vue de méthodologique et constitue un domaine que l’on nomme traditionnellement l’apprentissage vicariant.
1- L’APPRENTISSAGE VICARIANT
11. Définition (d’après M. Robert, 1970)
Selon M. Robert, » il y a un apprentissage vicariant lorsque, après observation d’une certaine séquence d’événements ( apparition de stimuli dans le champ sensoriel et perceptuel du modèle, exécution de réponses par le modèle et distribution d’agent de renforcement en fonction des réponses produites) il y a modification du système de réponses ou du comportement de l’observateur, comme si l’observateur lui-même avait été directement impliqué de l’intérieur à cette séquence d’événements « .
De plus, trois conditions essentielles sont à respecter dans une situation d’apprentissage vicariant :
1/ Le modèle et l’observateur doivent être exposés aux mêmes stimuli de l’environnement social et physique ;
2/ L’observateur ne doit pouvoir qu’observer le modèle sans avoir la possibilité d’émettre des réponses manifestes aux indices de l’environnement du modèle ;
3/ Il y a apprentissage vicariant lorsque la modification comportementale de l’observateur est relativement permanente et similaire à celle obtenue chez le modèle.
De plus, dans une expérience d’apprentissage vicariant, le modèle et l’observateur doivent être séparés afin d’éliminer la composante sociale de l’environnement, ou du moins d’en atténuer la portée.
C’est ainsi que les expériences en apprentissage vicariant obéissent toutes à un protocole expérimental identique : une phase d’observation au cours de laquelle l’observateur (O) assiste au comportement du modèle (M) (qui peut être soit en cours d’apprentissage, soit en fin d’apprentissage et effectuer, dans ce cas, une tâche parfaitement acquise selon le critère défini), et ceci à travers une cloison transparente en général, suivie d’une phase de test où les modifications comportementales de O (en l’absence de M) sont relevées (en général, on cherche à savoir si O obtient de meilleures performances que M pour la vitesse d’acquisition et le nombre d’erreurs commises).
12. Quelques expériences d’apprentissage vicariant
Puisque ces expériences sont faites selon une approche traditionnelle de l’apprentissage (accent mis sur la performance, utilisation du matériel : boîte de Skinner, boîte d’évitement, labyrinthe, etc.), les expériences citées sont groupées selon les catégories généralement distinguées à l’intérieur des théories associationnistes.
121. Apprentissage instrumental
1211. Avec renforcement positif
Will et coll. (1974) montrent, chez le Rat, que dans une situation d’apprentissage dans une boîte de Skinner, les animaux observateurs ont de meilleures performances que les animaux qui ont observé des M naïfs et que les sujets du groupe contrôle (qui n’ont rien observé) et ceci pour le taux de réponses. De plus, ces
auteurs avaient sélectionné quatre groupes de M en fonction de leur stratégie d’approche du levier ; ils ont relevé des corrélations positives entre les stratégies utilisées par les O suite à l’observation des M. Cette expérience montre que les rats, grâce à l’observation de congénères en cours d’apprentissage, en retirent
des bénéfices du point de vue de la performance (ils apprennent plus vite et mieux) mais également du point de vue de la topographie de la réponse.
Pallaud (1976, 1977) montre, chez la Souris, qu’il y a une très nette possibilité d’acquisition vicariante dans une situation d’apprentissage simple (boîte de Skinner).
Il semblerait qu’il y a possibilité d’acquisition vicariante dans des situations simples chez les rongeurs tels que la Souris et le Rat, même si certains auteurs ne trouvent pas de résultats positifs (Powell, 1968 ; Gardner et Engel, 1971).
1212. Avec renforcement positif et stimulus discriminatif
John et coll. (1968) trouvent, chez le Chat, qu’il y a une acquisition vicariante d’une réponse d’approche (boîte de Skinner) en réponse à un stimulus discriminatif (signal lumineux).
122. Situations d’évitement
1221. Avec renforcement négatif seul
Lore (1971) trouve que des rats (Long Evans) qui peuvent observer un congénère qui apprend à éviter la flamme d’une bougie, approchent eux-mêmes moins de la bougie et apprennent plus vite à éviter la flamme que les animaux du groupe contrôle.
1222. Avec renforcement négatif et stimulus discriminatif
John et coll. (1968) trouvent, chez le Chat, que les animaux observateurs acquièrent la réponse d’évitement (sauter par dessus la barrière dont le stimulus discriminatif est une sonnerie et le renforcement du courant électrique) plus rapidement et avec moins d’erreurs que les chats qui sont conditionnés normalement. L’expérience se fait en deux temps : tout d’abord, les chat sont sensibilisés à un choc électrique (empathy trial), puis, pendant vingt périodes, ils observent des chats qui apprennent la réponse d’évitement et ceci parallèlement à l’observation d’animaux qui sont parfaitement conditionnés. La manière dont est menée cette
expérience masque un problème qui est souvent soulevé en apprentissage vicariant des réponses d’évitement. En effet, l’observateur ne peut percevoir le renforcement négatif (choc électrique) alors que c’est possible pour un renforcement positif tel que de la nourriture. L’observateur n’observe que les conséquences du renforcement
sur le comportement du modèle (saut, cris, etc.). La question est alors de savoir si il est plus efficace d’avoir un M parfaitement conditionné (et dans ce cas, il n’y a même plus possibilité d’observer les conséquences du renforcement) ou un M en cours d’apprentissage. John et coll. ont évité ce problème en présentant
parallèlement les deux situations, ce qui semble effectivement efficace mais ne permet pas de répondre à la question précédemment soulevée.
123. Discrimination d’objets
Klopfer (1959) trouve, chez le Verdier, que cet animal peut discriminer à la suite d’observation de M des graines de tournesol normales de graines remplies d’aspirine, le stimulus discriminatif étant la couleur des plats sur lesquels se trouvent la nourriture.
Darby et Riopelle (1959) montrent que chez le macaque Rhésus, dans des problèmes de discrimination complexes (appareil utilisé : Wisconti General Test Apparatus) apprend de manière vicariante en
profitant autant, sinon plus, des réponses incorrectes que des réponses correctes de M.
Cronhelm (1970) fait une expérience de discrimination d’objets en situation opérante :
1/ Des poussins de sept jours sont façonnés à picorer une clef pour accéder à de la nourriture, puis on procède à l’appariement entre les M et les O ;
2/ Les O voient les M pendant quatre périodes étalées sur deux jours, les M répondent différentiellement à deux couleurs présentées successivement sur la clef ; une couleur est corrélée à un programme à intervalle variable de renforcement et l’autre couleur avec un programme à intervalle fixe, les deux programmes ont la même fréquence de renforcements ;
3/ Seize heures après la dernière séance d’observation, le test montre que les O sont identiques dans leurs performances de discrimination aux M pendant les deuxième et troisième périodes.
Cette expérience montre que l’acquisition vicariante permet une accélération de l’apprentissage ; on pourrait dire que les observateurs sont en avance par rapport à des animaux naïfs.
124. Apprentissage vicariant – Façonnement et Auto-façonnement
L’expérience fondamentale de Brown et Jenkings (1968) montre que lorsque l’on présente à des pigeons un appariement clef-allumée/nourriture, les animaux apprennent à picorer la clef, très rapidement, comme si elle était elle-même de la nourriture (grain). Dans cette expérience, on assiste à une réponse apprise stéréotypée et
qui correspond certainement à une prédisposition spécifique du pigeon à ce type d’apprentissage. L’expérience suivante d’apprentissage vicariant illustre la même constation : il existe des réactions spécifiques de l’espèce qui favorisent certains apprentissages et non d’autres (comparable au concept éthologique de prédisposition innée à certains types d’apprentissage).
Zentall et coll. (1976) comparent des pigeons O qui peuvent voir des M qui picorent une clef-allumée appariée à de la nourriture comme récompense à d’autres O qui peuvent voir des M picorer une
clef-allumée appariée avec rien (pas de récompense) et enfin des O qui n’observent rien (cage vide). Les deux premiers groupes de O, lors du test, sont supérieurs au groupe contrôle, mais il n’y a aucune différence entre eux. Ces résultats montrent que l’observation d’un modèle qui picore mais ne mange pas permet une aussi bonne acquisition vicariante que l’observation d’un modèle qui picore et mange. La mise en évidence de l’acquisition vicariante est nette, mais la réponse consommatoire ne semble en rien favoriser ce type
d’apprentissage. En fait l’observation de l’auto-façonnement chez M favorise le même type de comportement chez O, mais ne favorise pas une association plus utile pour l’animal (picorer la clef pour se nourrir). Ceci montre la rigidité de ce comportement chez les pigeons et plaide en faveurs des hypothèses des auteurs qui remettent en cause les principes des théories S-R (Seligman ; Bolles, etc.) : dans cette expérience, l’observateur apprend du modèle à associer surtout le stimulus à la réponse et non pas la réponse au renforcement. On peut se demander si on peut vraiment parler d’acquisition vicariante dans un cas pareil et non pas plutôt de facilitation
sociale (du type copie ou imitation » instinctive « ), et ceci malgré la procédure expérimentale typique.
Powell et coll. (1968) ont comparé l’auto-façonnement,le façonnement et l’apprentissage vicariant chez le Rat. Les résultats montrent que l’apprentissage n’est pas possible ce qui semble évident car ayant utilisé des rats qui voient mal (albinos).
Jacoby et coll.(1969) comparent, chez le Rat, la technique de façonnement à celle de l’apprentissage vicariant dans une boîte de Skinner modifiée (pour favoriser une meilleure observation). Ils trouvent que la technique de l’acquisition vicariante est supérieure à celle du façonnement (nombre de périodes pour atteindre le critère optimal, nombre total d’appuis).Ils attribuent leurs résultats au fait qu’ils aient optimisé l’emploi de la vision chez les animaux. Cette expérience montre que lorsque l’on tient mieux compte des spécificités de l’animal en fonction de la contingence employée, on peut nettement favoriser l’apprentissage vicariant (ceci est vrai pour n’importe quel type d’apprentissage).
Dans ce paragraphe, nous avons vu que la possibilité d’acquisition vicariante ne fait aucun doute chez l’animal. Nous avons surtout parlé des rongeurs de laboratoire, ce qui est normal car ces expériences entrent dans le cadre des méthodologies skinnériennes. Du point de vue théorique, je pense que l’aspect le plus important
à relever est l’absence de renforcement direct pendant la phase d’acquisition vicariante. Cette constatation pose problème aux théories S-R qui accordent une très grande importance au renforcement dans tout processus d’acquisition.
Suite à cette approche rapide de l’apprentissage vicariant dont la caractéristique principale est finalement de faire apprendre à l’observateur des contingences de stimulus arbitraires (équipotentialité), nous allons nous intéresser à d’autres expériences qui accordent moins d’importance à la standardisation de la méthodologie mais étudient plutôt en nuance les modifications comportementales de l’observateur non plus en termes de performances mais en essayant de savoir ce qui a été appris dans la topographie de la
réponse.
2- L’APPRENTISSAGE PAR OBSERVATION
Nous avons vu en introduction et dans le paragraphe 124 que les principes de base des théories de l’apprentissage les plus en vue jusqu’à récemment sont de moins en moins pertinents compte tenu des
travaux récents dans ce domaine.
La conclusion principale de ces remises en cause est qu’un animal possède un répertoire comportemental plus ou moins rigide selon son histoire phylogénétique et résultant de la pression sélective des facteurs éco-éthologiques de l’environnement. Le corollaire est que l’on ne fait pas apprendre n’importe quoi dans n’importe quelle condition à un animal (situation arbitraire typique de la position skinnérienne). L’évolution explique pourquoi, chez tel animal, certaines contingences sont plus faciles à associer que d’autres sans que ce soit uniquement une question d’équipement sensoriel. Il n’est pas besoin d’être » comportementaliste » pour comprendre qu’un rat n’aura pas les mêmes capacités associatives (et cognitives évidemment) qu’un chimpanzée.
Finalement, les psychologues admettent de plus en plus que les animaux ont des prédispositions à certains types d’apprentissage (notion de » preparadness » de Seligman ; de » specific species defensive reaction » de Bolles ; dans la littérature sur l’apprentissage, on voit de plus en plus (depuis les années 1980) le terme de » réaction spécifique de l’espèce « ) pendant que, parallèlement, les éthologistes admettent l’importance des capacités associatives chez les animaux (Hinde, Thorpe).
Les études en apprentissage par observation rejoignent ces positions quand aux méthodologies employées (on tient compte de répertoire de l’animal) et quand aux buts à atteindre (mise en évidence de modifications dans la topographie de la réponse). Finalement on pourrait dire qu’un organisme tel que le Rat ou le Chat
soit capable d’apprendre par observation à effectuer une réponse arbitraire telle qu’un appui sur un levier pour obtenir un renforcement soit-disant tout aussi arbitraire ne permet plus, compte tenu de ces nouvelles idées, de généraliser ce phénomène. Une telle expérience devrait être considérée comme une mise en évidence d’une
capacité d’apprentissage dans une situation qui n’a rien d’arbitraire mais qui permet simplement des associations bien particutières qui sont peut-être en rapport avec les réactions spécifiques de l’espèce considérée.
21. Définition
Il n’existe, à vrai dire, aucune définition précise de l’apprentissage par observation. Tout comme dans l’apprentissage vicariant, trois éléments sont impliqués dans une telle situation :
* le modèle(M),
* l’observateur (O),
* les indices de l’environnement.
Mais les conditions à respecter sont beaucoup plus souples que dans l’apprentissage vicariant. M et O doivent toujours être exposés aux mêmes stimuli de l’environnement, mais O peut se trouver avec M (situation sociale) et dans ce cas il pourra avoir, éventuellelement, la possibilité d’émettre des réponses manifestes. Le point
fondamental reste le choix de l’évaluation des modifications comportementales obtenues chez l’observateur, à savoir qu’on insiste sur le fait de savoir ce qui a été appris et non pas sur le fait que l’observation permet une acquisition plus rapide avec moins d’erreurs (ce qui n’empêche pas de relever ce type de paramètres).
On peut dire finalement qu’on a un apprentissage par observation, si, après une analyse rigoureuse d’une expérience où sont impliqués les trois éléments essentiels cités précédemment, on peut mettre en évidence qu’un sujet observateur d’un modèle a acquis une modification comportementale en rapport avec celle acquise par le
modèle, mais pas forcément similaire.
22. L’extinction
Il est courant de classer ce type d’expériences dans le domaine de l’apprentissage vicariant car la méthode employée reste très proche de celle utilisée dans des expériences d’extinction d’un apprentissage avec renforcement négatif (situation d’évitement). Mais nous verrons que les observateurs se trouvent, en général,
avec le ou les modèles, ce qui n’est pas conforme avec les conditions à respecter pour pouvoir parler d’apprentissage vicariant.
La procédure utilisée dans ce type d’expériences est pratiquement toujours la même : dans une phase préliminaire, on soumet l’observateur (futur) à un conditionnement d’évitement, puis l’on soumet ce conditionnement à l’extinction en soumettant O à l’observation d’un ou de plusieurs M.
Marina et coll. (1974) comparent quatre groupes de rats (préalablement conditionnés à éviter un choc électrique dans une boîte d’évitement à sens unique) pendant la période d’extinction :
* le groupe 1 est composé d’animaux qui sont en présence de
trois rats-modèles (1 O et 3 M) qui n’ont jamais appris le
conditionnement d’évitement ;
* le groupe 2 est composé d’animaux qui sont en présence de
trois modèles anesthésiés ;
* les animaux du groupe 3 sont testés en présence de trois
objets ;
* les animaux du groupe 4 sont testés en présence de rien.
Les résultats montrent que les groupes 1 et 2 ont une extinction plus rapide que les groupes 3 et 4. Par contre il n’existe aucune différence entre les rats qui observent des congénères actifs et ceux qui sont en présence de congénères anesthésiés. Donc les modèles anesthésiés sont aussi bénéfiques pour les observateurs que les modèles actifs.
23. Apprentissage par observation entre espèces différentes d’animaux
Les expériences les plus typiques dans ce domaine sont celles portant sur l’observation de l’Homme (expérimentateur en tant que modèle) par des Singes. Cette façon de procéder était courante dans les expériences du début du siècle, et même plus tard (Hayes & Hayes, 1952). Les résultats sont fort douteux car le nombre de sujets est souvent réduit à un individu et il n’y a que très peu de contrôle de l’expérience passée de ces animaux.
Plus intéressant est l’expérience de Mainardi et coll. (1972). Il utilise un dispositif qui est une potence en haut de laquelle est fixée une plate-forme. Une boulette de nourriture est suspendue à une chaînette qui est elle même attachée à la plate-forme. L’animal peut accéder à celle-ci par une échelle. En testant l’activité spontanée des souris et hamsters mis en présence d’un dispositif, ces auteurs remarquent que ces deux espèces utilisent des stratégies différentes pour obtenir la nourriture :
* les souris remontent la chaînette à l’aide des pattes et du
museau, puis se nourrissent ;
* les hamsters se pendent par les pattes postérieures et es-
sayent d’atteindre la boulette (le résultat est qu’ils tombent
la plupart du temps).
Lorsqu’un groupe de hamsters a pu passer vingt quatre heures à observer des souris sachant remonter la boulette, un important pourcentage de ces hamsters utilisent la même stratégie que les souris.
Ce résultat, étonnant, ajoute une dimension supplémentaire à l’apprentissage par observation car, en milieu naturel, on peut se demander si certaines espèces ne profitent pas des expériences d’autres espèces en plus de bénéficier de celles de leur propre espèce (phénomène de la protoculture animale dont nous reparle-
rons).
24. Les habitudes alimentaires
Alcock (1969) étudie trois espèces d’oiseaux (moineau, gobemouche et mésange) et les effets de l’observation d’un congénère prenant de la nourriture dans un plateau à trois compartiments. La
variable mesurée est le temps de latence pour accéder au bon compartiment. Les résultats montrent que les observateurs explorent plus le plateau que les animaux du groupe contrôle, mais aucun observateur n’obtient de la nourriture pendant qu’il est seul à moins qu’il ait pu y accéder pendant la phase d’observation. Alcock trouve, chez le gobemouche, que l’obtention immédiate de récompense n’est pas toujours nécessaire pour qu’un certain type d’apprentissage par observation apparaisse. Après avoir déterminé que ces sujets montrent une aversion gustative pour une espèce de papillon non comestible et ayant un mimétisme imparfait, il fait observer un modèle qui mange deux de ces papillons. Lors du test, seulement la moitié des observateurs mâchent le papillon mais c’est largement significatif par rapport au groupe contrôle. Il est donc démontré que le gobemouche peut modifier son comportement alimentaire après l’observation d’un congénère.
Il est intéressant de noter que Alcock obtient des résultats positifs d’apprentissage par observation sans renforcement direct pendant la phase d’observation en utilisant comme habitude alimentaire l’aversion gustative. Nous savons que ce type d’apprentissage s’obtient facilement et très rapidement (effet Garcia) même sans observation. Il ne s’agit pas de mettre en doute ces résultats mais on peut se poser la question de savoir si on assiste vraiment, dans ce cas, à un apprentissage par observation tout comme dans l’expérience de Zentall rapportée dans le paragraphe 124.
Dans la plupart des expériences qui ont été rapportées jusqu’à maintenant, les observateurs étaient séparés des modèles, le facteur social étant mis, ainsi, entre parenthèses. Certaines expériences étudient l’apprentissage par observation en situation sociale, ce qui nous intéresse particulièrement puisque nous allons parler de la transmission pré-culturelle chez les animaux.
25. Apprentissage par observation en situation sociale
On sait que le comportement d’un animal est fortement influencé par la composante sociale de l’environnement. Les modifications dues à des variations de l’environnement social sont surtout
d’ordre émotionnel et motivationnel. On peut penser qu’en situation sociale, de nombreux facteurs tels que la dominance, l’agressivité, la territorialité, la hiérarchie, les relations maternelles et filiales peuvent intervenir dans un apprentissage par observation. Ainsi, Desporte et coll. (1972) pensent qu’un animal ne réagit pas à la simple présence d’un congénère mais toujours à une relation sociale. Ces auteurs montrent, chez la souris, que lors d’un apprentissage d’un parcours simple (labyrinthe en T), la courbe d’apprentissage n’est modifiée que si les deux animaux en présence, l’un » acteur » et l’autre » spectateur « , sont dominants.
Wyrwicka (1978) entraînent des chattes à manger de la banane ou de la purée de pomme de terre en présence de boulettes de viande tout en donnant une récompense par stimulation hypothalamique. Les chatons en allaitement pouvaient observer les mères (de 35 jours à 56 jours) mais en ignorant les boulettes de viande. Lorsque les chatons ont été testés seuls de 9 à 27 semaines, que ce soit pendant des périodes de dix minutes ou vingt quatre heures, ils ont également mangé ces aliments inhabituels pour l’espèce. La différence est très significative entre ces animaux observateurs et ceux du groupe contrôle. Ainsi, cette expérience montre que des relations maternelles, chez le chat, peuvent permettre un apprentissage par observation de nouvelles habitudes alimentaires chez les jeunes.
On sait que les rats sont très habiles à éviter des substances toxiques et que l’aversion gustative s’établit très rapidement (effet Garcia). Galef et coll. (1971) trouvent que des jeunes nés dans une colonie de rats sauvages évitent de la nourriture que des adultes avaient prédit comme empoisonnée, même si cette nourriture est saine pendant l’exposition des petits. De plus, les ratons maintiennent leur aversion après avoir été séparés des adultes.
Les trois étapes sous-jacentes de cet apprentissage seraient :
* les jeunes accompagnent les adultes quand ils vont manger ;
* ils apprennent les signaux associés à cette nourriture ;
* ils montrent une généralisation de néophobie à toutes les
nourritures nouvelles et non familières.
Nous avons vu que les animaux pouvaient grandement améliorer leurs performances d’apprentissage (vitesse d’acquisition, nombre d’erreurs) grâce à l’observation d’un congénère, et ceci, dans des situations expérimentales qui s’inscrivent dans le courant traditionnel des théories de l’apprentissage. Nous avons vu également qu’en tenant compte des réactions spécifiques de l’espèce, l’observation est un moyen très efficace de faire comprendre des schèmes comportementaux nouveaux. Enfin, il est claire, que des jeunes animaux peuvent acquérir, grâce à l’observation des adultes, certains types de comportements et qu’ils les maintiennent même séparés de ces adultes. On s’aperçoit que l’apprentissage par observation prend alors une signification biologique dans la mesure où il peut être favorisant quant aux transmissions de comportements utiles pour l’espèce (cette utilité est particulièrement évidente quand il s’agit d’éviter des nourritures toxiques). La transmission
de ces comportements à travers un groupe est, en fait, le point de départ de ce qui est si caractéristique de l’Homme : la culture. Ainsi, il semble logique que si on parle de l’apprentissage par observation chez les animaux, il faille parler des conséquences de ce processus, à savoir la protoculture chez les animaux.
Avant d’aborder ce problème, il serait peut-être utile de parler de l’intérêt théorique de l’apprentissage par observation pour sa contribution à mieux comprendre les causes de l’apprentissage. Il faut dire que les hypothèses explicatives de l’apprentissage par observation ne sont pas nombreuses relativement à celles qui existent pour l’apprentissage classique et instrumental. Il faut dire aussi que le » poids idéologique » des théories strictement S-R n’a pas favorisé une telle démarche. En effet, le renforcement direct est souvent inexistant dans les expériences d’apprentissage par observation, ce qui, c’est le moins qu’on puisse dire, est gênant
pour un théoricien S-R.
3- QUELQUES HYPOTHESES EXPLICATIVES DE L’APPRENTISSAGE PAR OBSERVATION
On pourrait classer des différentes hypothèses explicatives de l’apprentissage par observation en quatre grandes catégories : celles qui s’inscrivent dans la tradition S-R (Miller & Dollard, 1941) et dont on peut se demander si les démonstrations expérimentales sont vraiment de l’apprentissage par observation (dans la mesure où les auteurs, en fonction de leurs hypothèses de type S-R, sont obligés de renforcer l’observateur pendant la phase d’observation, celles qui ne font que » paraphraser » la réalité expérimentale et n’expliquent pas grand chose (accentuation locale), celles qui sont surtout issues des études de l’acquisition vicariante chez
l’Homme (Bandura, 1965), et enfin celles qui font un vrai effort d’explication à partir des situations expérimentales chez les animaux (hypothèse de la médiation).
31. » The matched dependant behavior »
C’est Miller et Dollard (1941) qui développent cette théorie dans leur livre » Social learning and Imitation La position qu’ils adoptent est représentative des partisans des théories associationnistes de l’apprentissage. Ces auteurs font l’expérience suivante chez des rats : il s’agit pour les sujets de discriminer une carte blanche ou noire au bout d’un labyrinthe en T ; la récompense est de la nourriture. Il faut que les sujets continuent à
discriminer la bonne couleur même quand les cartes ont été changées de côté. Une fois ces animaux parfaitement conditionnés, on s’en sert comme leader dans la phase d’imitation. Il s’agit de placer
l’imitateur derrière le leader et de le récompenser lorsqu’il suit le modèle. Les animaux du groupe contrôle appelés » non-imitateurs » sont récompensés lorsqu’ils tournent dans la direction opposée des leaders. En procédant ainsi, les auteurs veulent savoir si les » non-imitateurs » répondent à un signal de l’environnement
(carte) et les imitateurs à la réponse du leader. Les résultats montrent qu’effectivement les imitateurs suivent plutôt les leaders et les autres non.
Pour ces auteurs, il est important que les réponses soient du même ordre (matched) pour qu’il y ait imitation. Selon eux, le comportement de l’imitateur est » dependant » de la réponse du leader, en d’autre termes le signal pour l’imitateur serait la réponse du leader. Je pense qu’on pourrait en dire autant pour les non-imitateurs qui répondent au signal » le congénère va dans le sens opposé « . Il n’est pas question d’entrer dans des considérations trop techniques d’autant plus que leur expérience est décrite d’une manière très approximative, mais nous pouvons être amenés à nous poser deux questions :
– que se passe-t-il lorsque l’imitateur n’est pas récompensé pendant l’observation ?
– y a-t-il vraiment une phase d’observation ?
En fait il semblerait que ces auteurs se soient arrangés, afin d’être fidèles à la théorie S-R, pour créer des conditions expérimentales où un lien S (réponse du leader) et R (suivre le leader) soit à mettre en évidence. Leur expérience ressemble, en fait, étrangement, à une expérience d’apprentissage discriminatif où le
stimulus discriminatif est la réponse du leader.
Cette théorie reste très insatisfaisante pour essayer de comprendre des expériences où l’on assiste vraiment à un apprentissage par observation (avec une phase d’observation bien définie).
32. L’hypothèse de l’accentuation locale.
Crawford et Spence (1939) disent : » … in the problem-box test, the activity of the demonstrator simply enhances certains aspects of the stimulus situation whitch the imitator later attacks in his own way. Since discovery of the locus of attack is usually the most difficult part of a problem-box test, the imitation often meets with quick success without need of specific copy, after beginning to manipulate the part last manipulated by demonstrator (p. 133) « .
Des auteurs (Hall, 1963 ; Menzel, 1967) soulignent l’importance de l’attraction des jeunes singes vers les objets que leurs mères manipulent.
Le concept d’accentuation locale ( » local enhancement » : Roberts, 1941 ; Thorpe, 1956 : » stimulus enhancement » ; Spence, 1937 ; Crawfor d & Spence, 1939) est très souvent utilisé pour essayer d’expliquer l’apprentissage par observation. Dans ce cas, il n’est pas nécessaire de faire appel à des capacités particulières pour apprendre par observation. En effet, l’observateur aurait son attention dirigée vers des secteurs-clefs de l’environnement où le modèle effectue son apprentissage ou sa tâche apprise ; une fois en situation de test, l’observateur se dirigerait rapidement vers ces endroits ce qui lui permettrait de faire
une économie de temps par rapport à un sujet naïf.
Cette hypothèse permet, dans une certaine mesure, de comprendre pourquoi un apprentissage par observation est possible. Mais ça nous donne aucune indication sur les processus sous-jacents impliqués dans cette situation. En fait cette théorie est d’une telle généralité qu’elle ne risque pas d’être fausse mais qu’elle ne nous éclaire pas sur le fonctionnement profond de l’apprentissage par observation.
33. Hypothèse de Bandura (1965)
Bandura est un auteur qui travaille essentiellement sur l’apprentissage par observation chez l’Homme (adultes et enfants). C’est certainement pourquoi cet auteur est cognitiviste dans sa
façon de » penser » l’apprentissage. Selon Bandura, le principe de la contiguïté (toutes les fois qu’un stimulus est contigu à une réponse, il devient associé au maximum avec cette réponse) suffit à expliquer l’acquisition d’un comportement par observation et les variables liées directement au renforcement n’agiraient qu’au
moment de l’extériorisation des comportements appris par l’observateur. Il y aurait association contiguë de l’ensemble des expériences sensorielles de l’observateur (par l’observation du modèle) à l’ensemble des réponses perceptives, symboliques ou cognitives. Ces réponses qui s’intègrent servent d’indices pour l’exécution
de la réponse extériorisée après la phase d’observation.
Malgré le fait que Bandura soit cognitiviste, le fonctionnement de l’apprentissage par observation expliqué par l’hypothèse décrite ci-dessus ne fait pas appel à des processus cognitifs, en effet les réponses qui vont servir peuvent très bien n’être que perceptives. Notons que cette interprétation est plutôt anglosaxonne car pour
Piaget, la perception est un processus cognitif au même titre que la mémoire et l’intelligence. Toujours est-il que cette hypothèse a l’avantage de nous permettre de comprendre qu’il puisse y avoir une acquisition malgré l’absence de renforcement direct au moment de la phase d’observation.
34. Hypothèse de la médiation
Mackintosh (1974) considère que les expériences d’apprentissage par observation sont à classer parmi celles où il n’y a pas de contingences instrumentales. Dans une expérience traditionnelle d’apprentissage instrumentale, il y a en général, une contingence qui permet l’association réponse du sujet – situation de renforçante. Or, en apprentissage par observation, l’animal, la plupart du temps, n’a pas accès à un renforcement externe et il lui est impossible d’effectuer une réponse adéquate quelconque. Selon
Mackintosh, l’association entre des stimuli est suffisante pour provoquer une réponse instrumentale appropriée, et les expériences d’apprentissage de médiation classique semblent corroborer cette
hypothèse.
Un exemple d’expérience sur la médiation classique est celle de Bower et Grusec (1964). Ces auteurs entraînent des rats à appuyer sur un levier pour obtenir de l’eau. Dans une étape suivante, le levier est enlevé et les animaux sont soumis à un conditionnement discriminatif classique où le CS » plus » est un son et le CS
» moins » un claquement. Dans un troisième temps, le levier est réinstallé et les rats sont soumis à un apprentissage instrumental discriminatif avec les mêmes stimuli. Les résultats montrent que les animaux pour lesquels le CS » plus » a gardé la même signification dans les deux étapes de discrimination ont des performances supérieures à ceux pour lesquels les CS ont été inversés (le CS devient le S » plus « ) et à ceux pour lesquels le S » plus » a été représenté au hasard indépendamment du renforcement. Cette expérience montre que les informations acquises (réponses médiates) pendant le conditionnement classique favorisent l’apprentissage instrumental.
En situation d’apprentissage par observation, on peut imaginer que la phase d’observation est une situation d’apprentissage classique pour l’observateur. En effet, il va voir le renforcement alimentaire du modèle apparaître régulièrement ; on peut penser que le renforcement du modèle est un SI pour l’observateur qui va
déclencher des réponses médiates (liées à la représentation de la nourriture). Il y aurait association avec le comportement du modèle qui prendrait la propriété de stimulus conditionnel (SC). L’association ainsi acquise entre les réponses médiates et les stimuli précédant l’apparition du renforcement faciliterait l’apprentissage
instrumental ultérieur (phase de test). Donc l’observateur apprend la relation entre certains stimuli, mais n’imite en aucun cas le modèle. Cette hypothèse est très proche de celle d’accentuation locale dans la mesure où elle insiste sur le fait que l’observateur a son attention attirée par certains stimuli-clefs mais elle a l’avantage d’essayer d’expliquer les processus sous-jacents qui permettent de passer de la phase d’observation au moment où il y a extériorisation du comportement acquis.
Finalement, ces hypothèses explicatives sont confrontées au problème classique de la généralisation. Toutes ces hypothèses tentent d’expliquer surtout des situations d’apprentissage vicariant car elles excluent la possibilité d’un renforcement direct pendant l’observation (sauf celle de Miller et Dollard, ici, c’est la phase d’observation qui est à discuter). Si il est certainement vrai qu’il y a un moment dans la phase d’observation où il faut faire appel à des processus de » réponses médiates » pour comprendre l’acquisition, je pense que les mécanismes impliqués sont plus complexes. En milieu naturel, par exemple, un animal qui observe un
congénère peut très bien avoir accès au renforcement direct (comme il peut ne pas y avoir accès, dans le cas de l’occupation de l’espace par un dominant par exemple). On peut alors imaginer qu’il y a une participation active de l’observateur dans la tâche exécutée par le modèle ; il pourrait alors y avoir une sorte d’alternance
phase d’observation – apprentissage simple (instrumental par exemple) jusqu’à assimilation complète. Les hypothèses prônant l’importance exclusive du renforcement sont aussi insatisfaisantes que celles qui se basent uniquement sur des » réponses médiates « . Il est fort possible que pour pouvoir expliquer l’apprentissage par
observation tel qu’il existe dans la réalité concrète (et c’est bien de cela qu’il s’agit dans toute science : énoncer un schéma théorique explicatif des phénomènes naturels) et non pas tel qu’on le reproduit dans des situations arbitraires de laboratoire, il faille tenir compte de plus d’éléments que dans les hypothèses
précédemment citées. Il ne s’agit pas ici de remettre en cause les expériences de laboratoire qui sont des maillons intermédiaires de la chaîne complète d’un apprentissage par observation, mais de dire qu’il serait peut-être intéressant de synthétiser les différentes hypothèses en une théorie unitaire alors que la tendance est de
faire des schémas théoriques pour chaque groupe d’expériences bien particulier.
III- DE L’APPRENTISSAGE PAR OBSERVATION A LA PROTOCULTURE CHEZ
LES ANIMAUX
Certains auteurs n’hésitent plus à parler de protoculture, de propagation sub-culturelles, pré-culturelles, d’acculturation chez les animaux (Kawamura, 1959 ; Mainardi, 1970 ; Mundinger, 1980). Le seul mécanisme qui permette de comprendre le comment d’une transmission pré-culturelle chez les animaux est l’apprentissage par observation.
On peut essayer de définir très simplement une culture en disant qu’elle est la possibilité d’une transmission de traditions (ensemble de comportements acquis répétitifs à valeur de communication sociale et/ou utilitaire) à l’intérieur d’un groupe d’individus et qui se transmettent aux générations suivantes.
La condition sine qua non pour qu’on puisse parler de transmission pré-culturelle chez l’animal est donc que la mise en évidence de la transmission de traditions soit due à des apprentissages individuels ou à des » inventions « . Si il est relativement facile de montrer qu’il existe des traditions chez les animaux, il est
nettement moins évident de montrer que ces habitudes existent grâce à une transmission pré-culturelle ; elles peuvent être simplement le résultat de pressions sélectives de l’environnement. La plupart des travaux traitant de la protoculture chez les animaux, laquelle serait possible grâce à l’apprentissage par observation, concernent l’usage d’outil et les habitudes alimentaires.
1- L’USAGE D’OUTIL
Ce n’est que depuis une trentaine d’années que des publications montrent que l’usage d’outil est un comportement susceptible d’être transmis d’un individu à l’autre et à l’intérieur d’un groupe.
Le babouin (Beck, 1972,73,74) n’est pas capable d’apprendre par observation l’usage d’un outil, et donc de transmettre un tel comportement. Par contre, le Macaque Rhésus (Beck, 1976) et le Chimpanzée (Mc Grew et coll., 1975) sont capables de transmettre à l’intérieur d’un groupe des manipulations d’objets pour se nourrir ou pour s’enfuir.
Une étude de Mc Grew et coll. (1979) tendrait à montrer qu’il y a une transmission pré-culturelle de l’usage de l’outil chez le Chimpanzée dans son milieu naturel. Ces auteurs ont fait des comparaisons interculturelles en ce qui concernent les outils que les chimpanzées utilisent pour » chasser » les termites. En
comparant les brindilles utilisées quant à leur taille ( longueur, diamètre), quant à leurs origines botaniques, ainsi qu’en comparant les stratégies utilisées par les animaux, les périodicités saisonnières de chasse etc., ils ont observés des différences de traditions chez les chimpanzées du Mont Assirik (sud-est du Sénégal), du centre de recherche de Gombe Stream (ouest de la Tanzanie), et de Okorobiko (république de Guinée équatoriale). La difficulté, pour ces auteurs, a été de savoir si ces différences étaient dues à des pressions de l’environnement ou à une transmission pré-culturelle.
Le fait que les animaux du Mont Assirick et de la Gombe utilisent des matériaux différents pour confectionner leurs brindilles, alors que le peuplement végétal est identique entre ces deux stations, laissent supposer que ces différences ne peuvent être que d’origine protoculturelle. Les différentes manières d’éplucher les brindilles entre les trois sites semblent également arbitraires et indépendantes des effets produits par les pressions de l’environnement : il y aurait aussi une transmission pré-culturelle à ce niveau. Ainsi, ces auteurs, par déductions successives, arrivent à cerner ce qui serait du, dans l’usage de ces outils particuliers, à des
différences véritablement » culturelles « . Si ils en arrivent à cette conclusion, il faut alors admettre qu’il y a une transmission pré-culturelle chez les animaux, et ceci, par apprentissage par observation. On peut s’apercevoir que malgré la finesse de cette étude en milieu naturel, les conclusions des auteurs restent relativement spéculatives. Pour être certain de pouvoir parler de différences » culturelles « , il faudrait observer directement une transmission de ces traditions entre les membres des groupes étudiés. C’est ce que les Japonais ont réussi à faire, dans le domaine des habitudes alimentaires, grâce à une connaissance approfondie de troupes de macaques.
2- LES NOUVELLES HABITUDES ALIMENTAIRES
Les travaux les plus célèbres sur la protoculture animale sont sans aucun doute ceux des japonais. Ce sont également les plus convaincants.
Ces auteurs (Kawamura, 1954,58,59,63 ; Imanishi, 1957 ; Itani, 1958 ; Miyardi, 1959,64 ; Yamada, 1957 et d’autres) travaillent depuis de longue date sur des troupes de macaques (Macaca fuscada) qui se trouvent sur des îles au Sud du Japon. Ils se sont particulièrement intéressés à la propagation » sub-culturelle » (Kawamura,
1959) à travers la hiérarchie des troupes. Ce sont des apports de nourriture nouvelle (faits par les chercheurs) qui ont été le point de départ de nouvelles traditions alimentaires telles que laver des patates dans l’eau douce puis dans l’eau de mer, et séparer le blé du sable en jetant des poignées du mélange dans l’eau. Ces
nouvelles habitudes alimentaires ont entraîné la marche bipède, l’apparition de la nage et des plongeons. Les voies de transmission ont été clairement mises en évidence. Ce sont les juvéniles qui sont très curieux, très explorateurs et ayant beaucoup d’activités ludiques qui font les » découvertes « . Les compagnons du même âge que » l’inventeur » l’imitent en jouant avec lui. Petit à petit, ce comportement se transmet à des animaux plus âgés selon des voies de transmission filiales : mère, frères et soeurs aînés. Les animaux dominés, qui sont les plus éloignés des lieux de découverte et de transmission sub-culturelle, sont les derniers à acquérir ces nouveaux comportements. Une fois ce stade atteint, le seul moyen pour que la nouvelle habitude se répande dans le reste de la troupe est d’attendre que » l’inventeur » et ses contemporains vieillissent et montent dans la hiérarchie. A ce moment, la nouvelle habitude sera transmise aux jeunes comme toutes les autres traditions de la troupe ; cette nouvelle habitude étant devenue elle-même une tradition. Les chercheurs japonais ont donc montré que la transmission d’un nouveau comportement est tributaire de l’organisation sociale de la troupe et se fait selon deux directions très nettes : le lien de familiarité et filiaux, puis la hiérarchie.
IV- CONCLUSION
Nous avons vu que, chez de nombreuses espèces, il y a possibilité d’acquisition de nouveaux schèmes comportementaux grâce à l’apprentissage par observation d’un congénère plus expérimenté et ceci, dans des situations très variées et fort différentes les unes des autres. Les travaux récents dans ce domaine (Alcock, Galef, etc.) montrent que les capacités d’apprentissage par observation sont liées à l’histoire phylogénétique de l’espèce et à son environnement écoéthologique originel. Ce qui semble être arbitraire ne l’est en aucun cas et c’est finalement toujours l’animal qui » dirige » l’expérience en fonction de ces capacités adaptatives d’association (cognitives ?).
Ces travaux me semblent présenter un double intérêt. D’une part, ils peuvent apporter une contribution très grande dans la conception d’une théorie moderne de l’apprentissage (pas seulement par observation). Une analyse élaborée de l’apprentissage par observation permettrait, à mon avis, d’argumenter puissamment une théorie cognitiviste de l’apprentissage. En effet, il est difficile d’imaginer qu’un macaque acquiert par observation la faculté de séparer le blé du sable uniquement en l’expliquant par des successions d’associations. Il semblerait logique de penser qu’il faut, à cet animal, un minimum de » compréhension » de ce qu’il observe. Mais une fois de plus, il faut être très prudent quant à une généralisation car peut-on comparer le macaque et cette situation avec un pigeon qui picore une » clef allumée » suite à l’observation d’un congénère. Pour ce dernier cas, l’hypothèse d’accentuation locale est peut-être amplement suffisante pour expliquer ce phénomène. D’autre part, l’intérêt de travailler sur des expériences d’apprentissage par observation est de pouvoir » expliquer » les mécanismes sous-jacents de la transmission pré-culturelle chez les animaux. Peut-être que grâce à ces travaux, sera-t-on, un jour, en mesure de comprendre le » démarrage » de l’Homme culturel.
Nous avons parlé un moment de l’apprentissage par observation entre espèces différentes, il serait peut-être intéressant de développer des recherches dans ce sens pour essayer de savoir si des » traditions » peuvent s’établir à partir d’une autre espèce ; un tel mécanisme pourrait avoir une grande utilité biologique en
permettant un enrichissement du patrimoine comportemental. Toujours est-il qu’une espèce a » compris » l’intérêt d’un tel mécanisme : la nôtre. En effet, toutes les grandes réalisations techniques de l’Homme se trouvent dans la nature que ce soit de l’avion ou du sonar (écholocation des dauphins) ou du radar (radio guidage des
chauves souris).
Essayons de terminer ce travail par une note psychanalytique.
On peut imaginer que les inventions humaines soient la conjonction entre une connaissance innée accumulée héréditairement au cours de l’évolution phylogénétique des espèces et un apprentissage par observation proprement dit des éléments entrant alors dans le cadre d’une transmission du savoir culturel (au niveau du moi).
Cette conjonction pourrait être vu comme une sorte de réciprocité entre des éléments internes refoulés et des éléments externes de l’environnement, leur rencontre créant une sorte de catalyse créatrice qui aboutirait alors à une actualisation de la connaissance profondément ancrée dans le psychisme humain sous forme des grandes inventions de l’humanité.
Par ailleurs, si nous supposons exacte l’hypothèse selon laquelle le mécanisme d’identification (en tout cas secondaire) en passe obligatoirement par de subtils apprentissages par observation, nous devons en conclure que la formation du moi est le résultat d’une dynamique d’apprentissage par observation. Or dans ce cas, les expériences sur les animaux que nous avons passées en revue nous soulignent l’inouïe puissance de l’identification sur la formation des êtres humains. En effet, si déjà un animal peut être influencé par un congénère, que dire de l’Homme, véritable éponge par rapport à son environnement (précisément parce que ces capacités d’apprentissage par observation sont immenses), en perpétuelle interaction avec d’autres » lui-même » dès sa conception, et dont la mère en est le prototype. Cette constatation relativise alors considérablement le caractère d’altérité du moi ( » nous sommes tous uniques « ) qui n’est rien d’autres que le reflet de l’environnement dans lequel il est plongé, et particulièrement pendant la petite enfance.
Christian Jeanclaude
Psychanalyste
REFERENCES BIBLIOGRAPHIQUES
BANDURA (A), 1965 – Vicarious processes : a case of non-trial learning. In : Advances in experimental social psychology. Acad. Press. 2, pp. 1-53.
DAVIS, 1973 – Imitation : a review and critique. In : Perspectives in Ethology. Ed. Bateson P.P.G., Bateson and Peter H. Klopfer Press, New-York and London.
DESPORTE ET AL., 1973 – Effet de la présense d’un congénère passif sur l’apprentissage d’un parcours simple, en fonction des positions hiérarchiques du sujet » acteur » et du sujet « spectateur « , chez la souris. C 57 B 1/6. Rev. Comp. Anim. 7. pp. 259- 271.
DEWSBURG & RETHLINSHAFFER, 1973 – Comparative Psychology : a modern survey. Mc Graw-Hill Book Compagny. pp. 531-545
GALEF (B.G) ; DALRYMPHE (A.S.), 1971 – Brief Report : Active Transmission of poison avoidance among rats ? Behavioral Biology. 24, pp. 265-271.
GARDNER (E.L.) & ENGEL (D.R.), 1971 – Imitational and social facilitory aspects of observational learning in the laboratory rat. Psychon. Sci. 25. pp. 5-6.
JACOBY (K.E.) & DAWSON (M.E.) 1969 – Observation and shaping learning : a comparison using Long Evans rats Psychon. Sci. 16(5). pp. 257-258.
JEANCLAUDE (C.), 1977, – Les effets de l’environnement sur le comportement. Bibliothèque Nationale Universitaire de Strasbourg, pp. 2-38.
JOHN (E.R.) & CHESLER (P.) & BARTLETT (F.) & VICTOR (I.), 1968 – Observational learning in cats. Science. 159. pp. 1489-1491.
KAWAMURA (S.), 1959 – The process of sub-culture propagation among Japanese Macaques. Primates. 3, pp. 43-60.
LORE (R.) ; BLAND (A.) & SUEFELD (P.), 1971 – Empathic learning of a passive avoidance response in dom esticated Rattus norvegicus. Anim. Behav. 19. pp. 112-114.
MC GREW (W.C.) ; TUTIN (C.E.G.) & MIDGETT (P.S.), 1975 – Tool using in a group of captive chimpanzees. I Escape, Zeit. Tierpsychol. 37. pp. 145-162.
MC GREW (W.C.) ; TUTIN (C.E.G.) & BALDWIN (P.J.), 1979 – Chimpanzees, tools, and termites : cross-cultural comparisons of Senegal, Tanzanie, and Rio Muni. Man : the journal of royal Anthropological Institute. New series. 14(2). pp. 185-214.
MAINARDI (D.) ; MAINARDI (M.) & PASQUALI (A.), 1972 – Interspecific observational learning : from house mice to golden hamster. In tratto di Bolettino di Zoologia, 39 ; Atti del XLI Convegno
dell’U.Z.I. Trieste.
MACKINTOSH (N.S.), 1974 – The Psychology of Animal Learning. Acad. Press. London-New-York-San Francisco. pp. 197-216.
MARINA (J.F.) ; BAUERMEISTER (J.J.), 1974 – Socially facilited extinction of a condionned avoidance response. Bulletin of the Psychonomic Society. 3(3A). pp. 161-163.
MILLER (N.E.)& DOLLARD (J.), 1941 – Social learning and Imitation. The Institute of Human Relations. Yale University Press. New-Haven.
MUNDINGER (P.C.), 1980 – Animals Cultures and a General Theory of Cultural Evolution. Ethology and Sociobiology. 1. pp. 183-223.
PALLAUD (B.), 1977 – L’apprentissage par observation chez la Souris et le Rat. Thèse de Doctorat d’Etat présentée à l’U.L.P. de Strasbourg
PIAGET (J.), (1967), 1991, – La psychologie de l’intelligence -, Editions Armand Colin
POWELL (R.W.) ; SAUNDERS (D.) ; & THOMPSON (W.), 1968 – Shaping, and auto-shaping and observational learning with rats. Psychon. 13(3). pp. 167-168.
ROBERT (M.), 1970 – Apprentissage vicariant chez l’animal et l’humain. Année psychologique. 2. pp. 505-542.
WILL (B.) ; PALLAUD (B.) ; MANIKOWSKI (S.) & SOCZKA (L.C.), 1970 – Imitation of lever-pressing « strategies » during the operant conditionning of albino rats. Anim. Behav. 22. pp. 664-671.
WYRWICKA (W.), 1978 – Imitation of mother’s inappropriate food preference in weanling kittens. Pavlovian Journal of biological Science. 13(2). pp. 55-72.
ZENTALL (T.R.) & HOGAN (D.E.), 1976 – Imitation of social facilitation in the pigeon. Animal learning and Behavior. 4(4). pp. 427-430.