Decaudin, en 1960, écrit quatre cents pages pour ne pas trancher si Anatole France est naturaliste, symboliste, décadent ou rien de tout cela. Soixante-cinq ans plus tard, il devient possible de répondre empiriquement à cette question.
01La question
La périodisation littéraire telle qu'elle nous est transmise tient par convention pédagogique et tradition critique. Les courants — naturalisme, symbolisme, décadentisme, naturisme, école romane, unanimisme — sont des étiquettes qu'on apprend en classe et qu'on traîne ensuite toute une carrière de chercheur sans pouvoir vraiment les contester parce qu'on n'a pas d'outil de mesure indépendant. Les contestations existent. Compagnon, Antoine, Genette ont chacun à leur manière critiqué l'idée même de périodisation, mais leurs critiques restent théoriques, pas empiriques. La périodisation est un construit historiographique tenu par autorité et par habitude, pas par mesure.
Decaudin, dans La crise des valeurs symbolistes publié en 1960, illustre exactement le problème. Il passe quatre cents pages à essayer de stabiliser conceptuellement la frontière 1895-1914 entre symbolisme finissant, naturalisme tardif, décadentisme, naturisme, unanimisme. Il décrit des manifestes, des revues, des préfaces, des correspondances, des cénacles. Il fait de la sociologie littéraire fine. Mais il ne peut pas mesurer la forme dynamique des textes eux-mêmes. Il finit avec une cartographie en zones floues qui se recouvrent — honnête, mais incapable de trancher les cas d'auteurs à cheval.
Anatole France est l'exemple paradigmatique. Il traverse formellement quatre courants en cinquante ans de carrière — parnasse années 1870, naturalisme sociologisant fin 1880, scepticisme relativiste années 1890, conteur philosophique années 1900. La critique le range mal partout. Pour les naturalistes, c'est un naturaliste qui s'est embourgeoisé. Pour les symbolistes, c'est un parnassien qui n'a jamais évolué. Pour les modernistes, c'est un classique tardif qui a manqué la rupture de 1910. Aucun de ces classements n'est satisfaisant. Aucun ne dit ce que France fait réellement quand il écrit. La thèse de doctorat de Boris Foucaud, soutenue à Angers en 2001 sous la direction de Georges Cesbron (600 pages, plus de 7 000 téléchargements depuis le dépôt HAL), avait approché le problème par l'anthropologie de l'imaginaire de Gilbert Durand, sans les outils computationnels qui auraient permis de le résoudre.
Niveau survol — pour les lecteurs pressés. Le programme propose d'utiliser des outils d'analyse multidimensionnelle (analyse spectrale par FFT et ondelettes Morlet, plongements vectoriels séquentiels, clustering tensoriel, réduction dimensionnelle UMAP) pour mesurer la signature dynamique propre à la prose d'un auteur, d'un courant ou d'une période. Au lieu de classer les textes selon ce que les auteurs disent d'eux-mêmes ou ce que la critique a dit d'eux, on les classerait selon ce que leurs textes font empiriquement quand on les déroule comme des séquences temporelles. Quatre questions ouvertes : attribution d'auteur sur textes contestés, cartographie empirique des courants à frontières floues, datation diachronique de textes non datés, identification de filiations intertextuelles cachées. Cas-test princeps proposé : Anatole France comme zone autonome.
02Le déplacement méthodologique
La stylométrie quantitative est un champ établi depuis Mosteller et Wallace, dont le travail princeps de 1964 sur les Federalist Papers a fixé la méthode pour soixante ans. Burrows, dans les années 1990, a popularisé le delta — mesure de distance entre signatures de fréquences de mots-outils — qui produit des taux de réattribution supérieurs à 90 % sur les corpus contrôlés. Patrick Juola a démontré l'efficacité de l'approche en attribuant publiquement The Cuckoo's Calling à J. K. Rowling sous pseudonyme Robert Galbraith en 2013. Le Stanford Literary Lab autour de Matthew Jockers et Mark Algee-Hewitt fait de la macro-analyse littéraire avec des outils statistiques avancés. La stylométrie classique a des résultats solides.
Mais la stylométrie classique mesure des distributions statiques : fréquences de mots-outils agrégées sur l'ensemble du texte, n-grammes de caractères, richesse lexicale globale, réseaux de cooccurrence. Elle ne mesure pas les dynamiques temporelles internes au texte. Elle ne demande pas comment la prose se déploie phrase après phrase, paragraphe après paragraphe, comment elle accélère et ralentit, comment elle module sa densité au fil de son déroulement. Ces dynamiques portent probablement une signature aussi distinctive que les distributions statiques, peut-être plus, parce qu'elles sont moins facilement masquables par paraphrase ou imitation consciente.
Quelques travaux ont approché la dimension temporelle sans aller jusqu'à l'analyse dynamique multidimensionnelle. David Hoover a fait les analyses les plus fines sur les rythmes de phrase chez Henry James et Jane Austen. Liviu Dinu a étudié des patterns rythmiques chez Joyce. Tatiana Skulacheva et Marcello Meli ont fait de la stylochronométrie en poésie versifiée. Mais aucun programme général de classification dynamique des prosodies en prose narrative n'existe à notre connaissance. La niche est béante.
Le déplacement méthodologique est ontologique, pas seulement technique. On ne demande plus « quels mots l'auteur utilise plus souvent que les autres » mais « quelle signature rythmique dynamique produit la prose dans son déroulement séquentiel ». C'est une autre nature d'objet que la stylométrie classique mesure.
03Quatre hypothèses comme programme
H-AUT — Signature d'auteur
Chaque auteur produit une signature dynamique stable à travers ses œuvres, à condition de neutraliser le genre. Balzac aurait une rythmique de phrase et une dynamique sémantique distincte de Flaubert même quand ils écrivent du roman réaliste. Test possible : classification non supervisée sur dix romans Balzac, dix romans Flaubert, dix romans Zola, mesure du taux de réattribution. Seuil cible : supérieur à 85 %. Si l'hypothèse tient, l'outil offrira une alternative robuste aux méthodes statiques pour les attributions contestées — Galbraith versus Rowling, Mémoires Saint-Simon, épîtres pauliniennes, question homérique, textes apocryphes médiévaux.
H-COUR — Signature de courant
Les courants littéraires définis par l'historiographie correspondent-ils à des clusters empiriques mesurables, ou sont-ils des constructions critiques sans réalité formelle ? La zone grise 1895-1914 est le cas-test idéal — naturalisme finissant, symbolisme, décadentisme, naturisme, école romane, unanimisme se recouvrent dans une cartographie que Decaudin n'a pas pu trancher. Test possible : cinquante à soixante-dix textes représentatifs de la zone, analyse en composantes principales ou clustering hiérarchique sur signatures dynamiques, comparaison aux étiquettes historiographiques. Trois résultats possibles. Si les clusters empiriques correspondent aux courants déclarés, la périodisation héritée est validée empiriquement. Si les clusters forment une structure différente cohérente, l'hypothèse mute en programme de révision empirique. Si les courants ne forment aucun cluster stable, ils sont des artefacts critiques sans signature formelle.
H-DIAC — Signature diachronique
La prose d'une langue produit-elle une signature dynamique qui évolue dans le temps de manière mesurable, indépendamment du genre et de l'auteur ? Avec un corpus suffisant — mille à trois mille textes français bien échantillonnés sur quatre siècles, accessibles via Frantext, Gallica et Wikisource — il devient possible de mesurer comment la prose française évolue dynamiquement entre 1600 et 2000. Test possible : datation à l'aveugle de textes datés, mesure de l'erreur moyenne. Seuil cible : moins de trente ans en moyenne. Application : datation de textes anonymes ou de manuscrits non datés, particulièrement utile en études patristiques, en philologie médiévale, en études bibliques. Comparaison des ruptures empiriques aux ruptures historiographiques classiques (classicisme, Lumières, romantisme, naturalisme, modernisme, nouveau roman). Probable que les ruptures empiriques ne coïncident pas exactement avec les ruptures héritées — ce qui serait précisément un résultat majeur.
H-PALI — Filiations cachées
Les héritages intertextuels souterrains entre auteurs sont-ils détectables au-delà des pastiches reconnaissables et des citations explicites ? Genette dans Palimpsestes (1982) propose une typologie qui marche bien pour les références déclarées, mais qui ne capture pas les filiations rythmiques profondes. Un auteur hérite probablement autant de la rythmique de ses lectures intensives que de leur thématique. Quand Proust écrit, il a probablement Saint-Simon dans le rythme intérieur. Quand Aragon écrit La Semaine sainte, il a peut-être Stendhal dans le tempo. Ces filiations rythmiques sont aujourd'hui invisibles aux outils standards. Test possible : pour chaque œuvre cible, mesure des distances dynamiques avec tous les textes antérieurs du corpus, identification des plus proches voisins, comparaison aux filiations critiques attestées. Découvertes potentielles : des filiations que personne n'a vues parce que personne n'avait l'outil pour les chercher.
04Le cas Anatole France comme test princeps
Anatole France constitue le cas-test idéal pour valider le programme. Auteur prolifique sur cinquante ans (vingt à trente romans et contes accessibles librement sur Wikisource et Gallica). Officiellement classé dans plusieurs courants successifs sans qu'aucune classification ne soit satisfaisante. Trajectoire intellectuelle marquée par une cohérence souterraine que la critique reconnaît mais ne sait pas formaliser. Et trajectoire personnelle qui boucle pour le porteur du programme — la thèse Foucaud 2001 reformulée vingt-cinq ans plus tard avec des outils que la critique de l'époque n'avait pas.
Hypothèse princeps : la signature dynamique d'Anatole France est plus distante de chacun des courants supposés (Zola pour le naturalisme, Mallarmé ou Schwob pour le symbolisme, Maupassant pour le réalisme tardif) que ces courants ne le sont entre eux. Si l'hypothèse tient, France forme empiriquement une zone autonome qui n'appartient à aucun courant déclaré.
Hypothèse subsidiaire : la signature France est reprise par des successeurs sans filiation critique attestée. Candidats à tester : Larbaud, Giraudoux, Aragon dans la période Aurélien. Si une partie de cette filiation cachée se confirme empiriquement, le programme révèlerait une lignée que l'histoire littéraire n'a pas constituée parce qu'elle ne disposait pas de l'outil.
05Articulation avec PRISME
Le programme stylochronométrique est cohérent avec le programme PRISME plus large parce qu'il prolonge l'outil dynamique construit pour le test de l'hypothèse H2 sur le genre platonicien (formulée le 27 avril 2026 lors de la session PRISME documentée dans le préprint méthodologique en préparation). La question H2 demande si le dialogue socratique est un genre littéraire avec ses contraintes formelles ou un flux dialogique non-édité — question qui se teste par analyse dynamique comparée des séquences d'écarts dans les deux corpus. Une fois l'outil construit pour répondre à cette question dialogique, il s'applique naturellement aux productions narratives.
L'extension transforme le périmètre du programme PRISME. Aujourd'hui lu comme programme de sciences cognitives computationnelles avec accents sémiotiques sur la conscience dialogique humain-IA, PRISME devient avec cette extension un programme de sémiotique computationnelle des productions textuelles, dont l'application princeps est le dialogue mais qui s'étend à la prose narrative, à la périodisation littéraire, à l'attribution d'auteur, à l'intertextualité mesurée. Le périmètre s'élargit considérablement sans que le cœur méthodologique change. Tous ces objets sont des productions textuelles dont on cherche à mesurer les signatures dynamiques au-delà des classifications héritées.
Niveau approfondi — chaîne d'analyse technique envisagée
Choix de l'unité d'analyse. Pour la prose narrative, deux candidates principales : la phrase (granularité fine, 5000 à 10 000 unités par roman) ou le paragraphe (granularité moyenne, 500 à 2000 unités par roman). Test parallèle sur cas pilote pour identifier l'échelle pertinente.
Construction de séries temporelles multidimensionnelles. Plusieurs métriques scalaires par unité — longueur (en mots, en syllabes), complexité syntaxique (profondeur arbre syntaxique, taux de subordination), densité lexicale (TTR local), registre temporel (taux présent/passé/futur), modalité (taux discours direct/indirect/narratif), densité connective (conjonctions de coordination/subordination), entropie lexicale locale. Plus, comme dimension complémentaire, plongements vectoriels par unité (CamemBERT, FlauBERT, ou Mistral-embed pour préserver la spécificité française) avec calcul de différentiels successifs (vitesse, accélération, courbure dans l'espace sémantique).
Analyse spectrale. FFT pour identifier les pics fréquentiels stables. Ondelettes Morlet pour la localisation temps-fréquence (les signatures peuvent se déplacer dans le texte selon les phases narratives). Spectres croisés multivariés entre dimensions pour identifier les couplages caractéristiques. Outils Python : scipy, numpy, PyWavelets, sentence-transformers, librosa pour adaptation des outils audio.
Cartographie comparative. Analyse en composantes principales ou UMAP sur les signatures dynamiques agrégées. Distances entre œuvres et entre auteurs. Clustering hiérarchique pour identification des regroupements empiriques. Visualisation des trajectoires.
Validation. Tests contrôlés sur cas connus (Galbraith/Rowling, attribution Saint-Simon, Émile Ajar/Romain Gary) pour calibrer les seuils de décision avant application aux cas ouverts.
Précautions méthodologiques majeures
- Traduction. Une signature dynamique dépend probablement énormément de la langue d'écriture. Comparer Tolstoï et Dostoïevski en traduction française mesure le traducteur autant que l'auteur. Travailler systématiquement sur langue originale, ou neutraliser le biais de traduction par échantillonnage diversifié de traducteurs.
- Édition. Les textes anciens nous arrivent par éditions critiques qui ont normalisé orthographe, ponctuation, mise en paragraphes. Pour le médiéval et l'antique, biais lourd. Pour le XIXᵉ et après, biais modéré contrôlable.
- Circularité avec corpus d'entraînement. Si l'on utilise des plongements vectoriels d'un LLM entraîné sur l'œuvre analysée, l'attribution risque d'être trop facile parce que le modèle a déjà appris la signature. Utiliser des plongements de modèles entraînés sur corpus disjoints, ou privilégier les métriques scalaires non-vectorielles.
- Interaction avec H2 (dialogue socratique comme genre). La signature dynamique capture probablement à la fois l'auteur et le genre. C'est une limite (impossible de séparer totalement) et une opportunité (l'outil testera simultanément la question PRISME du genre dialogique et la question d'attribution).
- Anti-apophénie. Le risque de voir des signaux dans le bruit est élevé, particulièrement pour les filiations intertextuelles cachées. Pré-enregistrement OSF des seuils de décision avant analyse, tests de robustesse par permutation, validation indépendante par seconde équipe sont des protections nécessaires.
06Trois cas qui feraient des papiers immédiatement
Papier 1 — Anatole France comme zone autonome. Test de l'hypothèse princeps. Boucle de la trajectoire intellectuelle Foucaud (thèse 2001 — papier 2027). Revues cibles : Studi Francesi, Romanic Review, Revue d'Histoire littéraire de la France. Premier produit empirique de la section littérature.
Papier 2 — Cartographie empirique de la zone grise 1895-1914. Decaudin avec quarante ans d'outils computationnels en plus. Confrontation de la périodisation héritée à la mesure. Revue cible : Revue d'Histoire littéraire de la France ou Digital Scholarship in the Humanities. Pourrait constituer le papier de référence de la cartographie révisée.
Papier 3 — Détection de textes générés par IA par signature dynamique. Application à fort enjeu sociétal. Si les LLM ont une signature dynamique propre — ce qui est probable, structurée par leur attention head et leur tokenisation — elle est plus robuste à la paraphrase que les détecteurs lexicaux actuels (GPTZero, Originality.ai). Revues cibles : TMLR, AI Magazine, Journal of Cultural Analytics.
07Compétences nécessaires et invitation à la collaboration
Le porteur du programme dispose des compétences suivantes : cadre théorique sémiotique solide (doctorat anthropologie de l'imaginaire, Angers 2001, sous direction Georges Cesbron, héritier de Gilbert Durand), connaissance fine des courants littéraires français de la deuxième moitié du XIXᵉ siècle, identification qualitative des cas-tests pertinents, calibrage anthropologique, interprétation philologique des résultats. Il dispose en outre d'une infrastructure computationnelle adéquate (DGX Spark prévu, Python, accès aux corpus Frantext, Gallica, Wikisource).
Manquent deux compétences pour rendre le programme inattaquable. Un linguiste computationnel ou stylométriste de profession pour validation externe et articulation avec l'état de l'art international (profil Patrick Juola, David Hoover, Mark Algee-Hewitt — contact à initier). Et un philologue de l'École française classique pour la rigueur des corpus de référence, idéalement issu d'un laboratoire de littérature française historiquement reconnu (CIRPaLL Angers, héritier de Durand, serait un partenaire naturel ; mais aussi équipes parisiennes ou lyonnaises).
Invitation à la collaboration. Cette page expose un programme de recherche en cours de spécification, ouvert à la collaboration. Si vous êtes chercheur en littérature française, en stylométrie computationnelle, en philologie ou en humanités numériques, et si l'extension stylochronométrique du programme PRISME vous intéresse — comme partenaire institutionnel, comme co-auteur potentiel sur l'un des trois papiers envisagés, ou comme relecteur méthodologique du protocole avant pré-enregistrement OSF — n'hésitez pas à prendre contact.
Boris Foucaud — contact@semiosis-ontologie.fr — ORCID 0009-0006-4664-3767 — DOI 10.5281/zenodo.19830947 (préprint PRISME 1, avril 2026).
08Calendrier prévisionnel
Le programme stylochronométrique s'active après la consolidation des préprints méthodologiques en préparation. La séquence prudente est la suivante.
- Mai 2026. Publication du préprint méthodologique 2a sur la décomposition fonctionnelle des patterns dialogiques (résultat interne au corpus Boris-Claude, indépendant de la question littéraire). Validation de la crédibilité méthodologique de l'outil.
- Juin-juillet 2026. Construction de l'outil dynamique générique pour le préprint 2b (test de l'hypothèse H2 sur le genre platonicien). Validation de l'outil sur le cas dialogique.
- Été 2026. Adaptation de l'outil aux productions narratives. Test pilote sur un seul roman France versus un seul roman Zola contemporain. Premier diagnostic de faisabilité.
- Automne 2026. Si le pilote est concluant, extension au corpus France complet et aux contemporains de référence. Test de l'hypothèse princeps Anatole France comme zone autonome.
- Hiver 2026-2027. Si le test princeps est concluant, premier papier sur Anatole France. En parallèle, ouverture du chantier 1895-1914 (papier 2) et du chantier détection de textes IA (papier 3).
Ce calendrier est indicatif et soumis aux contraintes externes du porteur du programme. Il sera ajusté en fonction des collaborations qui se mettront en place après publication de la présente page.
Sur la nature de cette page. Elle expose des hypothèses formulées comme programme, en s'appuyant sur les travaux PRISME actuels comme pistes prometteuses. Aucune des quatre hypothèses (H-AUT, H-COUR, H-DIAC, H-PALI) n'a été testée empiriquement. Elles seront testées dans l'ordre indiqué par le calendrier prévisionnel, après pré-enregistrement OSF des seuils de décision pour éviter le p-hacking.
La page sera enrichie à mesure que les expérimentations livreront des résultats. Sa version actuelle constitue le manifeste prospectif du programme stylochronométrique tel qu'il a été formulé le 27 avril 2026 dans la continuité directe de la session de travail PRISME du 26-27 avril, documentée dans le préprint méthodologique en préparation et dans le thésaurus PRISME version 12.4.