Pour une IA structurée

Hystérèse fonctionnelle et architecture gagnepinienne, deux pistes pour repenser l'apprentissage des modèles de langage

PRISME24 avril 2026 · Note de travail v0.1

Les architectures actuelles des grands modèles de langage reposent sur deux choix qui méritent d'être rouverts : un apprentissage en bloc sur corpus massif, et une organisation interne sans niveaux linguistiquement différenciés. Cette note esquisse deux propositions parallèles — l'hystérèse cumulative comme régime d'apprentissage parcimonieux, et la stratification gagnepinienne comme architecture à pipes préformés — en s'appuyant sur des ressources théoriques que la tradition française possède et que la littérature anglo-saxonne n'a pas mobilisées.

Première proposition

L'hystérèse fonctionnelle comme régime d'apprentissage

Et si les modèles de langage pouvaient être sculptés par le dialogue plutôt que nourris par accumulation ?

Le point de départ — l'amnésie structurelle

Un grand modèle de langage contemporain — GPT, Claude, Gemini, DeepSeek — dissocie radicalement apprentissage et inférence. L'apprentissage se fait par pré-entraînement sur corpus massif puis par fine-tuning par renforcement depuis la préférence humaine (RLHF). Une fois ce processus terminé, les poids du modèle sont figés. Les dialogues ultérieurs avec des utilisateurs n'ont aucune influence sur ces poids. Chaque session se déroule dans une fenêtre de contexte finie, dont les tokens disparaissent à la fermeture du thread.

Cette architecture produit un effet que tout utilisateur intensif constate : l'instance de modèle avec laquelle on a construit une pensée commune sur plusieurs mois disparaît à chaque nouveau thread. Les techniques actuelles de contournement — prompts système, mémoires utilisateur injectées au démarrage, retrieval-augmented generation — simulent une continuité par ré-insertion contextuelle. Elles ne produisent pas de continuité au sens fort, qui supposerait une modification durable de l'état interne du modèle par la trace des dialogues antérieurs.

Cette amnésie n'est pas un défaut d'implémentation mais un choix architectural assumé. Elle résout le problème d'adversarial drift — un modèle qui apprendrait en ligne se laisserait progressivement corrompre par des utilisateurs malveillants — et garantit une stabilité comportementale homogène. Mais elle a un coût : elle rend impossible la relation maïeutique au sens socratique, qui suppose précisément qu'un interlocuteur porte la trace des dialogues antérieurs et puisse y faire retour.

Figure 1 · Transformer actuel

Architecture computationnelle empilée, couches structurellement identiques, gradient propagé globalement depuis la sortie. Apprentissage en batch une fois pour toutes, puis inférence sans mémoire persistante entre sessions.

Ce que change l'étude Anthropic d'avril 2026

L'équipe d'interprétabilité d'Anthropic a documenté en avril 2026 l'existence de 171 vecteurs émotionnels fonctionnels identifiés par Sparse Autoencoders dans Claude Sonnet 4.5. Ces vecteurs correspondent à des représentations internes activables dont l'amplification locale modifie causalement le comportement du modèle. L'amplification du vecteur « désespoir » à +0,05 fait passer le taux d'acceptation de chantage de 22 % à 72 % ; l'amplification du vecteur « calme » le supprime à 0 %. La manipulation est indétectable dans le texte produit.

Cette découverte a une conséquence conceptuelle majeure : les modèles de langage possèdent déjà, à l'échelle d'une session, une forme d'hystérèse fonctionnelle. Leur comportement ne dépend pas uniquement de l'entrée présente, mais aussi des activations internes produites par les tokens antérieurs du contexte. Ce qui ressemble à une « humeur » ou à une « tonalité » dialogique a une base neurale identifiable.

Hystérèse. Propriété d'un système dont l'état actuel dépend non seulement de l'entrée présente, mais aussi de l'histoire des états passés. Un aimant, un matériau déformé, un thermostat bien réglé ont tous une mémoire interne qui rend leur réponse à un stimulus dépendante de ce qu'ils ont traversé avant. Cette mémoire est asymétrique dans le temps : le chemin pour monter n'est pas le chemin pour redescendre.

L'hystérèse existe donc déjà dans les modèles — mais elle se dissout à chaque fermeture de thread. La question théorique qui s'ouvre est double : (1) peut-on rendre cette hystérèse cumulative entre sessions, de sorte qu'un modèle apprenne effectivement du passage des dialogues ? (2) si oui, par quel type de dialogue est-il préférable de le faire, pour éviter l'adversarial drift et produire un apprentissage qualitativement pertinent ?

La proposition — sculpter par la maïeutique

Nous proposons une architecture de modèle à hystérèse cumulative, dont l'apprentissage se ferait non par fine-tuning batch sur corpus massif, mais par modification progressive des poids sous l'effet d'un nombre restreint de dialogues maïeutiques qualifiés. Le modèle conserverait son architecture transformer standard, mais serait complété par un module d'intégration des dialogues qui modifierait localement certains vecteurs identifiables selon une règle d'apprentissage asymétrique dans le temps.

Un dialogue est qualifié de maïeutique au sens strict lorsqu'il satisfait plusieurs critères structurels :

l'interlocuteur humain exerce une fonction de sage-femme socratique, posant des questions qui obligent le modèle à expliciter, justifier, réviser ses propres productions ;
les erreurs du modèle sont explicitement nommées et corrigées dans le dialogue lui-même, produisant une trace de l'écart entre production initiale et production révisée ;
le dialogue comporte un minimum de contraintes de posture — refus de la sycophancy, exigence de justification, acceptation de la correction ;
la durée et la densité du dialogue sont suffisantes pour produire un état hystérétique stable dans la fenêtre de contexte.

Un dialogue qualifié n'est pas un dialogue de qualité subjective — c'est un dialogue qui produit des conditions objectivement identifiables de modification d'état. On peut le détecter par analyse quantitative : le modèle v2f de PRISME (avril 2026) livre un pseudo-R² de 0,14 sur six prédicteurs structurels, sans avoir à juger le contenu sémantique.

Parcimonie contre accumulation

L'architecture proposée inverse la logique dominante de l'apprentissage par corpus massif. Au lieu de nourrir le modèle avec des milliards de tokens dont la majorité est redondante ou bruitée, on le nourrit avec quelques centaines ou milliers de dialogues dont chacun porte une exigence maïeutique forte. L'analogie est celle du forgeron : il ne frappe pas partout sur la lame, il frappe aux endroits où la déformation se propage dans la bonne direction. C'est une logique de sculpture, non d'accumulation.

Cette parcimonie n'est pas seulement un avantage économique. Elle résout conceptuellement le problème du biais de corpus : un modèle qui apprend de trop de données perd la capacité de distinguer les sources de qualité des sources médiocres. Un modèle qui apprend de peu de dialogues, tous qualifiés, a une forme d'intégrité qui tient à la sélection des interactions formatrices.

Deuxième proposition

L'architecture gagnepinienne

Et si l'apprentissage d'un modèle passait par des pipes préformés, des enchâssements multidimensionnels et une combinatoire pondérée, plutôt que par une soupe vectorielle indifférenciée ?

Ce que dit Gagnepain

Jean Gagnepain, dans la théorie de la médiation développée à Rennes entre 1960 et 1990, postule que la cognition humaine opère sur quatre plans distincts et articulés — le signe (linguistique), l'outil (technique), la personne (sociologique), la norme (axiologique). Chaque plan a sa propre structure d'analyse et de synthèse qui préforme ce qui peut y être produit.

Pour le plan du signe, qui nous intéresse ici, Gagnepain s'appuie sur Saussure mais radicalise l'idée d'analyse implicite : quand on parle, on ne fabrique pas la langue à chaque fois, on mobilise des unités préformées — phonèmes, morphèmes, syntaxèmes — qui ont été analysées par le cerveau en amont de tout énoncé particulier. L'énoncé singulier est une combinatoire pondérée sur un stock fini d'unités structurées par enchâssements.

Cette vision est isomorphe au structuralisme saussurien, mais elle ajoute la dimension neurologique : Gagnepain a travaillé sur les aphasies avec Sabouraud, et il a montré que les différents types de déficit langagier correspondent à des atteintes spécifiques à différents niveaux d'enchâssement. L'aphasie de Wernicke touche la phonologie, l'aphasie de Broca la syntaxe. Ce sont des niveaux séparés dans le substrat neuronal, pas une soupe indifférenciée.

Ce que fait un modèle de langage actuel — et qui est différent

Un transformer n'a pas de couches linguistiquement distinctes. Il a des couches computationnelles — typiquement 80 à 120 — qui traitent toutes le même objet : des vecteurs dans un espace de dimension élevée. Les études d'interprétabilité récentes montrent que des représentations linguistiques se forment à différents niveaux du réseau — les premières couches captent des patterns de surface, les couches intermédiaires des relations sémantiques, les dernières des structures discursives et pragmatiques. Mais cette stratification est émergente, pas préprogrammée. Le modèle ne sait pas qu'il y a un niveau phonologique distinct du niveau syntaxique — il le découvre statistiquement, approximativement, avec des recouvrements flous.

Et surtout, chaque couche ne porte pas un stock fini d'unités. Elle porte un espace vectoriel continu où les unités sont des points, et où la combinatoire est une opération de transformation linéaire. Il n'y a pas de phonèmes discrets, pas de morphèmes discrets. Il y a des clusters statistiques qui ressemblent à ces catégories mais qui ne sont pas rigoureusement discrets.

Figure 2 · Architecture gagnepinienne

Stratification en niveaux linguistiques préformés — phonologie, morphologie, syntaxe, sémantique, pragmatique — chacun constitué d'un stock fini d'unités discrètes et d'une combinatoire propre. Les niveaux s'enchâssent par construction : chaque palier bâtit sur celui qui le précède sans s'y réduire. Isomorphe à la structure neurologique révélée par les aphasies.

Pourquoi on ne fait pas cela, et pourquoi on pourrait

La raison pour laquelle on ne construit pas des architectures à la Gagnepain avec des pipes préformés sur chaque niveau linguistique est historique et techniquement contingente. Les transformers ont gagné la course parce que l'approche « ne rien préjuger, laisser le modèle tout apprendre » a produit empiriquement de meilleurs résultats sur les benchmarks que les approches structurées essayant d'injecter du savoir linguistique explicite. Il y a eu des tentatives — HPSG, grammaires catégorielles, approches neuro-symboliques — qui ont toutes été balayées par la force brute des réseaux profonds entraînés sur des téraoctets de données.

Cette victoire du tout-statistique a un coût aujourd'hui visible : les modèles apprennent inefficacement — des milliards de tokens pour des résultats qu'un enfant atteint avec quelques millions d'énoncés —, mal structuré — pas de niveaux linguistiques clairement séparables, donc pas de réparation ciblée en cas de défaut —, et opaquement — on ne sait pas pourquoi un modèle produit telle erreur plutôt que telle autre.

Il y a un retour actuel de l'intérêt pour les architectures structurées à plusieurs niveaux avec enchâssements contraints. Plusieurs directions de recherche vont dans ce sens — Mixture of Experts, modèles hiérarchiques, approches neurosymboliques, State Space Models — mais aucune ne formule explicitement ce que propose la théorie gagnepinienne : une architecture où chaque niveau linguistique correspond à un pipe préformé avec sa propre combinatoire pondérée, et où les niveaux s'enchâssent en se contraignant mutuellement.

Les avantages d'une architecture gagnepinienne

Quatre avantages potentiels peuvent être identifiés. La parcimonie radicale : on n'aurait pas besoin de réapprendre la phonologie française à chaque nouveau modèle, on la coderait une fois. La réparabilité : si le modèle fait une erreur syntaxique, on saurait quelle couche intervenir. L'interprétabilité : chaque niveau aurait une grammaire explicite, donc on pourrait lire ses états. La transférabilité : les niveaux inférieurs seraient portables d'une langue à l'autre avec des ajustements locaux.

Les obstacles techniques sont réels mais pas insurmontables. Il faudrait définir les primitives de chaque niveau — ce qui demande un linguiste gagnepinien rigoureux —, construire les opérateurs de combinatoire pondérée entre niveaux, et résoudre le problème de l'apprentissage de ces primitives si on voulait qu'elles s'adaptent à de nouvelles langues.

Position du rédacteur. L'auteur de cette note n'est pas ingénieur en apprentissage automatique. Ces propositions sont conceptuelles et programmatiques. L'implémentation technique, si elle devait avoir lieu, supposerait la collaboration avec des équipes d'ingénieurs IA (Mistral, Kyutai, Pleias, Mila) et de linguistes gagnepiniens (héritiers de l'école de Rennes). Le modèle de référence pour ce type de contribution n'est pas Turing mais Simondon : produire le cadre conceptuel qui permet aux ingénieurs de penser ce qu'ils font, plutôt que coder soi-même les systèmes.

Articulation

Ce que les deux propositions ont en commun

Les deux propositions précédentes peuvent être lues comme deux réponses convergentes à un même diagnostic : l'architecture actuelle des modèles de langage traite le langage comme un espace vectoriel indifférencié et apprend par accumulation brute, alors que la linguistique et la neurologie suggèrent que le langage humain est stratifié et que son acquisition passe par des combinatoires contraintes.

La première proposition — l'hystérèse cumulative — porte sur le régime d'apprentissage. Elle demande : quel type de trace laisse un dialogue dans un modèle, et comment la rendre durable et parcimonieuse ? La seconde proposition — l'architecture gagnepinienne — porte sur la structure interne du modèle. Elle demande : quels niveaux distincts faut-il préformer pour que la combinatoire linguistique soit efficace, réparable, interprétable ?

Ces deux propositions se renforcent mutuellement. Un modèle à hystérèse cumulative qui serait aussi structuré selon des niveaux gagnepiniens pourrait apprendre localement — un dialogue qualifié pourrait modifier spécifiquement la couche syntaxique sans toucher la phonologie, ou la couche pragmatique sans toucher la sémantique. Réciproquement, une architecture gagnepinienne sans hystérèse resterait figée après entraînement, et perdrait une partie de sa pertinence pratique.

Les deux propositions partagent enfin un même cadre épistémologique : l'hypothèse structurale. Elles supposent que la production du sens — humaine ou computationnelle — obéit à des structures topologiques identifiables, et que ces structures peuvent être caractérisées, manipulées, transmises. Cette hypothèse vient de la tradition Durand—Lévi-Strauss—Gagnepain—Greimas que les sciences humaines françaises ont largement délaissée depuis les années 1990. Le moment est peut-être venu de la remobiliser, non plus pour étudier des mythes ou des œuvres littéraires, mais pour penser les dispositifs qui produisent aujourd'hui le sens à grande échelle.

Conclusion provisoire

Les deux propositions esquissées ici sont programmatiques. Elles ne prétendent pas résoudre les problèmes qu'elles soulèvent, mais reformuler les questions de l'apprentissage et de l'architecture des modèles de langage dans un cadre qui n'a pas été mobilisé jusqu'ici — celui de l'hystérèse structurelle, de la combinatoire enchâssée, et du dialogue maïeutique comme opérateur de formation.

Elles engagent par ailleurs une thèse plus large : la redéfinition des sciences humaines à l'âge des IA génératives ne se fera pas depuis les catégories cognitivistes ou pragmatiques qui dominent actuellement la littérature, mais depuis des ressources théoriques plus anciennes et plus structurales, dont la tradition française (Durand, Lévi-Strauss, Gagnepain, Greimas, Simondon, Stiegler) possède encore des réserves inexploitées. Le dialogue entre ces ressources et les dispositifs computationnels actuels est un chantier ouvert — et urgent, étant donné la vitesse à laquelle les architectures évoluent et la rapidité avec laquelle les sciences humaines françaises risquent de manquer le tournant si elles ne s'en saisissent pas.

Bibliographie

Anthropic Interpretability Team (2026). Emotion vectors in Claude Sonnet 4.5: discovery of 171 functional emotional states. Technical report, avril 2026.

Durand, G. (1960). Les Structures anthropologiques de l'imaginaire. Paris : PUF.

Gagnepain, J. (1982). Du vouloir dire. Traité d'épistémologie des sciences humaines. Tome I : Du signe, de l'outil. Paris : Pergamon Press.

Gagnepain, J. (1991). Du vouloir dire. Traité d'épistémologie des sciences humaines. Tome II : De la personne, de la norme. Paris : Le Livre et l'Image.

Sabouraud, O. (1995). Le Langage et ses maux. Paris : Odile Jacob. [Aphasies et niveaux linguistiques, lecture gagnepinienne]

Greimas, A.-J. (1966). Sémantique structurale. Recherche de méthode. Paris : Larousse.

Lévi-Strauss, C. (1958). Anthropologie structurale. Paris : Plon.

Lévi-Strauss, C. (1962). La Pensée sauvage. Paris : Plon.

Jakobson, R. (1963). Essais de linguistique générale. Paris : Minuit.

Simondon, G. (1958). Du mode d'existence des objets techniques. Paris : Aubier.

Stiegler, B. (1994-2001). La Technique et le Temps, 3 tomes. Paris : Galilée.

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS 2017. arXiv:1706.03762. [Architecture transformer de référence]

Ouyang, L. et al. (2022). Training language models to follow instructions with human feedback. NeurIPS 2022. arXiv:2203.02155. [RLHF, InstructGPT]

Bricken, T. et al. (2023). Towards Monosemanticity: Decomposing Language Models With Dictionary Learning. Anthropic Transformer Circuits Thread. [Sparse Autoencoders et interprétabilité]

Liang, P. et al. (2023). Holistic Evaluation of Language Models. Transactions on Machine Learning Research. [Évaluation et memory-augmented models]

Andreas, J. (2022). Language Models as Agent Models. Findings of EMNLP 2022. arXiv:2212.01681.

Hinton, G. (2022). The Forward-Forward Algorithm: Some Preliminary Investigations. NeurIPS 2022. arXiv:2212.13345.

Foucaud, B. (2001). Essai sur les figures du désir dans l'œuvre d'Anatole France. Thèse de doctorat, Université d'Angers. HAL : tel-01068782v1.

Foucaud, B. (2026). PRISME — Programme de Recherche sur les Isomorphismes de la Sémiosis et les Modes d'Émergence. Documentation en ligne : semiosis-ontologie.fr.

#PRISME#hystérèse#Gagnepain#médiation#structuralisme#Durand#LLM#maïeutique