Recherche augmentée, vibes proofs
Travailler avec l'IA ou se faire travailler par elle. Sept marqueurs différentiels pour distinguer l'usage scientifique du LLM de la fabrication d'apparence académique
Depuis 2024, les grands modèles de langage produisent en quelques heures, à partir de briefs flous, des textes qui ressemblent à des articles scientifiques. Cette capacité technique a transformé l'écosystème de la recherche périphérique en autorisant un nouveau type de production : la vibes proof, ou preuve par les vibrations académiques — un texte qui mobilise le vocabulaire, la structure et les codes de l'article scientifique sans en porter le travail conceptuel propre. Cette note distingue rigoureusement la recherche augmentée par LLM, qui est et restera une pratique légitime et précieuse, de sa contrefaçon par fabrication d'apparence. Elle propose sept marqueurs différentiels opérationnels et défend la place du LLM dans tout laboratoire à condition que la position dialogique du chercheur soit juste, éclairée, assumée.
I. Le seuil de mai 2025
Quelque chose s'est produit dans le courant du printemps 2025 que peu d'observateurs ont nommé précisément. Les grands modèles de langage — Claude Opus 4, GPT-4 Turbo, leurs successeurs — ont franchi un seuil qualitatif dans la production de français académique. Avant ce seuil, un texte produit par LLM dans un registre savant trahissait son origine algorithmique par une série de marqueurs reconnaissables : transitions stéréotypées, conclusions tautologiques, vocabulaire passe-partout, structures de paragraphe trop régulières. Un lecteur averti détectait l'origine en quelques minutes.
Après ce seuil, ces marqueurs se sont massivement effacés. Les modèles produisent désormais une prose académique française qui passe le test de lecture rapide d'un journaliste, d'un recruteur, d'un client potentiel, parfois même d'un évaluateur peu attentif. La détection automatisée des textes générés est devenue presque impossible — les classifieurs d'origine ont des taux d'erreur qui les rendent inutilisables en pratique. La distinction entre texte humain et texte assisté ne peut plus se faire au niveau formel ; elle ne peut se faire qu'au niveau du contenu conceptuel propre, ce qui demande au lecteur une expertise réelle dans le champ traité.
Ce déplacement a une conséquence sociologique massive. Pendant des décennies, la production académique constituait une barrière à l'entrée. Pour publier dans une revue, déposer dans une archive ouverte, ou simplement diffuser un texte plausible comme contribution scientifique, il fallait avoir suivi un parcours de formation long, intériorisé un vocabulaire spécifique, lu un corpus minimal de précédents, intégré les codes formels de la discipline. Cette barrière n'était pas seulement intellectuelle ; elle était aussi temporelle. Produire un article de fond demandait des semaines ou des mois de travail concentré.
Avec les LLMs contemporains, cette barrière s'effondre pour un coût marginal. Un acteur sans capital scientifique propre peut désormais produire en quelques heures un texte qui mobilise correctement le vocabulaire d'un champ qu'il ne maîtrise pas, structure correctement un argumentaire qu'il ne sait pas conduire seul, et cite plausiblement des références qu'il n'a pas lues. Le résultat passe le seuil minimal de la lecture rapide. Il peut être déposé sur Zenodo, partagé sur LinkedIn, intégré à un programme de recherche prétendu, sans qu'aucun filtre institutionnel ne le retienne — parce que les plateformes ouvertes ne filtrent pas, et que les filtres institutionnels traditionnels (revues à comité de lecture, thèses encadrées, postes universitaires) restent extérieurs à ce circuit.
Ce qui apparaît alors n'est pas exactement de la fraude. C'est un genre nouveau, qui mérite un nom propre.
II. Recherche augmentée — définition
Avant de définir la pathologie, il faut établir ce qui n'en est pas. La recherche augmentée par LLM est une pratique légitime, croissante, et qui va devenir massive dans la décennie qui vient. Elle ne doit pas être confondue avec sa contrefaçon, et la confusion entre les deux serait dommageable à la fois pour la qualité scientifique et pour l'usage éclairé des outils dialogiques.
La recherche augmentée se définit par la position du chercheur vis-à-vis du LLM. Le chercheur possède un cadre conceptuel propre, élaboré antérieurement à sa rencontre avec le LLM ou indépendamment de lui. Ce cadre s'enracine dans une formation, une expérience disciplinaire, des lectures cumulées, parfois plusieurs décennies de travail. Le LLM intervient comme amplificateur d'exécution sur des tâches précises : relecture critique d'une argumentation déjà construite, formalisation d'une intuition déjà cernée, recherche bibliographique à partir d'une question déjà formulée, mise en forme typographique d'un texte déjà pensé, traduction technique entre langages disciplinaires, dialogue contradictoire qui éprouve la solidité d'une thèse en gestation.
Dans cette configuration, la direction conceptuelle reste humaine. Le LLM ne décide pas du sujet, ne formule pas la problématique, ne tranche pas les arbitrages théoriques, ne sélectionne pas les références centrales. Il assiste, accélère, parfois conteste — toujours sous la responsabilité d'un chercheur qui aurait pu, avec plus de temps, accomplir le même travail seul, mais qui gagne en productivité ou en finesse en mobilisant l'outil.
Cette pratique est ancienne dans son principe. Les chercheurs ont toujours utilisé des amplificateurs intellectuels : la bibliothèque comme mémoire externe, les fiches comme système de classification, les bases de données comme accès accéléré aux sources, les correcteurs orthographiques, les logiciels statistiques. Le LLM s'inscrit dans cette continuité technologique tout en introduisant une nouveauté qualitative — la possibilité d'un dialogue argumentatif avec un interlocuteur non humain qui peut tenir un fil conceptuel sur plusieurs heures. Cette nouveauté est précieuse pour la recherche, et elle ne disparaîtra pas. Le travail consiste à apprendre à l'utiliser correctement, pas à la refuser.
Le cas de la présente note. Cet article est lui-même un cas paradigmatique de recherche augmentée. La distinction entre recherche augmentée et vibes proofs émerge d'observations cumulées par l'auteur depuis dix-huit mois sur l'écosystème LinkedIn et les plateformes ouvertes. Elle s'inscrit dans le cadre théorique de PRISME, élaboré antérieurement aux LLMs actuels, et prolonge spécifiquement les analyses de Le coucou et le passereau et Le sceau et la décision. La rédaction proprement dite a mobilisé Claude Opus 4.7 comme interlocuteur dialogique pour la mise en forme HTML, la structuration argumentaire, l'identification de précédents conceptuels et la critique interne. La direction conceptuelle, les marqueurs proposés, les exemples mobilisés, les positions assumées sont la propriété intellectuelle de l'auteur humain, qui en porte la signature et la responsabilité publique.
III. Vibes proofs — définition
La vibes proof se définit par la configuration inverse. L'acteur n'a pas le capital scientifique propre que la production académique exigeait jusqu'à présent. Il peut avoir des intuitions, des observations, des intérêts, parfois des compétences réelles dans des domaines connexes — mais il n'a pas cumulé le travail disciplinaire qui rend possible la production d'un article scientifique sérieux dans le champ qu'il prétend traiter.
Plutôt que de reconnaître cette limite et de produire ce qui est à sa portée — un blog, un essai personnel, un témoignage, un livre de vulgarisation — il mobilise le LLM pour produire l'apparence académique du texte qu'il ne pourrait pas écrire seul. Le LLM fait le polissage syntaxique, le vocabulaire technique, la structure en sections numérotées, les transitions argumentatives, les renvois plausibles à la littérature. L'acteur fournit un brief flou, recompose éventuellement les sorties par sections, ajoute son nom comme auteur, dépose le résultat sur une plateforme ouverte qui ne filtre pas.
Le résultat n'est pas un faux au sens juridique. Aucune donnée n'est inventée, aucune citation forgée, aucune institution usurpée. Mais c'est une fabrication d'apparence au sens épistémologique. Le texte mobilise le vocabulaire académique sans le travail académique. Il invoque des concepts sans les opérationnaliser. Il prétend démontrer sans procédure démonstrative réelle. Il ressemble à un article scientifique exactement comme une chaise vibrante ressemble à une chaise — la forme y est, l'usage n'y est pas.
L'expression vibes proof emprunte au registre informel anglo-saxon contemporain — le vibe coding désigne depuis 2024 l'écriture de code par sentiment plutôt que par compréhension, où le développeur copie-colle des sorties LLM sans comprendre ce qu'elles font, en vérifiant seulement que ça compile et que les tests passent. La vibes proof en est l'équivalent académique : un texte qui semble démontrer parce que la mise en forme évoque la démonstration, sans qu'aucune démonstration effective n'ait eu lieu. La preuve par les vibrations du registre.
IV. Sept marqueurs différentiels
L'identification d'une vibes proof n'est pas immédiate à la lecture rapide — c'est précisément sa caractéristique de réussir le test de surface. Mais sept marqueurs combinés permettent une discrimination fiable à la lecture attentive. Aucun de ces marqueurs n'est suffisant en soi ; leur convergence établit le diagnostic.
Marqueur 1 — Le ratio références citées sur volume produit
Un article scientifique sérieux dans une discipline mature cite typiquement entre quinze et soixante références pour un texte de cinq à dix mille mots. Ces références ne sont pas décoratives — elles ancrent l'argumentation dans la conversation disciplinaire en cours, distinguent ce que l'auteur reprend de ce qu'il propose, et permettent au lecteur de remonter aux sources pour vérifier. Une vibes proof typique cite trois à six références, souvent les plus génériques du champ, sans articulation précise avec l'argument développé. Le déficit citationnel signale que l'auteur ne s'inscrit pas dans la conversation disciplinaire — il en mime les codes sans en partager le tissu.
Marqueur 2 — La profondeur des distinctions avec les précédents
Un travail conceptuel sérieux qui propose une thèse nouvelle doit montrer précisément ce qui le distingue des positions existantes. Si l'auteur travaille sur la conscience, il doit dire en quoi sa proposition diffère de celle de Chalmers, de Tononi, de Varela, de Dennett. Cette distinction ne peut pas être un renvoi général ("dans la lignée de Varela") — elle doit être technique, précise, opératoire. La vibes proof mentionne les noms sans poser les distinctions. Elle dit "complement IIT" sans expliquer ce qu'elle ajoute formellement à phi. Elle invoque l'enaction sans préciser en quoi sa proposition étend ou modifie l'enaction.
Marqueur 3 — L'opérationnalisation des concepts
Tout cadre théorique sérieux opérationnalise ses concepts centraux. Si l'auteur propose une notion de cohérence interne, il doit définir comment cette cohérence se mesure, à quels indicateurs elle correspond, comment on distingue empiriquement un système qui en possède d'un système qui en manque. Sans opérationnalisation, le concept reste évocatoire — il fait travailler la lecture sans permettre la mise en travail scientifique. La vibes proof empile les concepts sans en opérationnaliser aucun. Elle parle de structural signatures, de regimes of interpretation, de internal informational architecture, sans définir précisément aucun de ces termes.
Marqueur 4 — La présence d'une procédure de falsifiabilité
Le critère poppérien reste un indicateur fiable de la posture scientifique. Un cadre théorique sérieux indique sous quelles conditions empiriques il serait réfuté, ce qu'il prédit qui pourrait ne pas se produire, comment ses détracteurs pourraient l'attaquer. Cette exposition à la réfutation est constitutive de la posture scientifique. La vibes proof évite systématiquement l'exposition. Elle propose des cadres si généraux qu'ils englobent toute observation possible. Elle ne dit jamais "si X se produisait, ma thèse serait fausse". Elle est invulnérable précisément parce qu'elle ne dit rien de précis.
Marqueur 5 — La structure citationnelle
Les renvois d'un article sérieux pointent majoritairement vers la littérature externe — autres chercheurs, autres équipes, autres travaux qui dialoguent avec celui-ci. Les renvois d'une vibes proof pointent fréquemment vers les autres documents du même auteur. "Voir Document Zéro pour le programme général", "voir DCNM en review pour la formalisation", "voir Conditions for Emergence pour l'extension consciousness". Cette structure circulaire produit l'illusion d'un programme abouti tout en différant indéfiniment la preuve effective. Chaque texte tire sa crédibilité du fait qu'il pointe vers les autres, et l'ensemble repose sur le pari que le lecteur n'aura pas le temps de tout vérifier.
Marqueur 6 — Les erreurs méthodologiques de surface
L'absence d'expertise réelle se trahit parfois par des erreurs qu'aucun spécialiste du champ ne pourrait commettre. Mobiliser un exemple obsolète comme s'il était paradigmatique, citer un état de l'art désuet, méconnaître une distinction conceptuelle élémentaire, présenter comme nouveau ce qui est établi depuis plusieurs décennies. Ces erreurs ne sont pas des fautes mineures — elles sont les fissures par lesquelles l'absence de capital scientifique propre devient visible. Le LLM produit une apparence cohérente à partir du brief de l'utilisateur ; si ce brief est fondé sur des informations périmées ou des malentendus, le LLM les reproduit dans une forme polie qui les rend plus difficiles à détecter, mais qui ne les corrige pas.
Marqueur 7 — La temporalité de production
Un article scientifique sérieux prend du temps. Pas du temps de rédaction — du temps de maturation. Les idées doivent décanter, les objections être envisagées, les références être réellement lues, les contre-exemples être testés. Cette temporalité est incompressible parce qu'elle correspond au travail de la pensée elle-même. Une vibes proof peut être produite en quelques heures parce qu'aucune de ces étapes ne se produit — le LLM compresse la rédaction, mais aucune décantation n'a lieu. La temporalité de production est un indicateur observable indirectement par le rythme de publication d'un auteur. Un programme qui sort huit textes substantiels en six mois sur des sujets divers signale soit une équipe de recherche structurée (vérifiable par les affiliations et les co-auteurs), soit une production assistée non décantée.
V. Tableau récapitulatif
| Marqueur | Recherche augmentée | Vibes proof |
|---|---|---|
| Cadre conceptuel | Antérieur au LLM, propre à l'auteur | Construit à la volée par LLM à partir du brief |
| Direction | Humaine, le LLM exécute | LLM, l'humain valide |
| Références citées | 15-60 par texte, articulées | 3-6, génériques |
| Distinctions avec précédents | Précises, techniques | Génériques, "dans la lignée de" |
| Opérationnalisation | Concepts définis, mesurables | Vocabulaire évocatoire saturé |
| Falsifiabilité | Posée explicitement | Évitée, cadre invulnérable |
| Structure citationnelle | Externe, dialogue avec le champ | Circulaire, auto-référentielle |
| Erreurs de surface | Rares, signalées et corrigées | Fréquentes, non détectées |
| Temporalité | Maturation longue, rédaction rapide | Production immédiate sans décantation |
VI. Le piège performatif assumé
Une note qui distingue la recherche augmentée de la vibes proof tout en étant elle-même produite par recherche augmentée s'expose à une objection symétrique. Comment le lecteur sait-il que cet article n'est pas lui-même une vibes proof ? La question est légitime et mérite une réponse explicite plutôt qu'une dénégation préventive.
La réponse passe par les sept marqueurs appliqués réflexivement. Cet article cite quinze références dans sa bibliographie, articulées à l'argumentation. Il pose des distinctions techniques avec les précédents (Bachelard sur la formation de l'esprit scientifique, Bourdieu sur la production scientifique réflexive, Latour sur la fabrique des faits, Brandolini sur l'asymétrie de production). Il opérationnalise sa thèse centrale en sept marqueurs précis et testables. Il s'expose à la falsification — si demain on identifiait un auteur dont la production présenterait tous les marqueurs de la vibes proof tout en constituant un travail scientifique manifestement valide, le cadre proposé ici devrait être révisé. Il renvoie majoritairement vers la littérature externe, et ses renvois vers d'autres textes PRISME pointent vers des textes vérifiables et antérieurs. Il s'inscrit dans une temporalité de maturation qui dépasse largement le moment de sa rédaction — la matière vient de dix-huit mois d'observations cumulées sur l'écosystème.
Surtout, il assume publiquement sa propre méthode de production. La position auto-référentielle posée dans le pilier précédent s'applique ici aussi. La signature reste humaine. L'auteur porte publiquement les thèses, qu'il défend sous son nom, avec son ORCID, sur un site horodaté et archivé. Le LLM contribue à la mise en forme et à la critique interne, mais le travail conceptuel propre est antérieur à cette session de rédaction et continuerait de tenir si Claude disparaissait demain. C'est précisément ce que la vibes proof ne peut pas dire — elle disparaît avec son LLM parce qu'elle n'a pas d'antériorité conceptuelle propre.
VII. L'asymétrie de Brandolini renforcée
Le principe d'asymétrie de Brandolini, posé dans Le coucou et le passereau, stipule que l'énergie nécessaire pour réfuter un mensonge est d'un ordre de grandeur supérieure à celle nécessaire pour le produire. Ce principe s'applique avec une vigueur accrue à l'écosystème de la vibes proof.
Une vibes proof de cinq mille mots peut être produite en deux à quatre heures par un acteur familier des LLMs. Sa réfutation rigoureuse exige la lecture attentive du texte, la vérification des références, l'identification des concepts non opérationnalisés, le repérage des erreurs de surface, la rédaction d'une analyse argumentée. Comptez vingt à quarante heures pour un débunker spécialiste. Le ratio est de l'ordre de un à dix.
Ce ratio s'aggrave structurellement avec la facilitation technique. Avant les LLMs contemporains, produire un texte d'apparence académique demandait des semaines, ce qui réduisait mécaniquement le volume de production. Après, la production peut atteindre des cadences industrielles. Un acteur peut produire cinq à dix vibes proofs par mois. Un débunker honnête en réfute une par mois, peut-être deux dans les bons mois. L'inflation de la production submerge mécaniquement la capacité critique.
Sur les plateformes ouvertes (Zenodo, OSF, ResearchGate), cette dynamique produit une pollution graduelle de l'archive scientifique. Les vibes proofs y coexistent avec des pré-prints de chercheurs établis, sans que les métadonnées disponibles permettent de distinguer rapidement les uns des autres. Les outils de recherche académique (Google Scholar, Semantic Scholar) indexent indifféremment les deux. Les algorithmes de recommandation propulsent vers les utilisateurs les textes qui maximisent l'engagement, indépendamment de leur valeur scientifique. À horizon de cinq ans, la fiabilité de ces archives ouvertes pourrait être substantiellement dégradée si aucun mécanisme de différenciation ne s'installe.
VIII. La place du LLM dans tout laboratoire
L'analyse précédente pourrait être lue comme une charge contre l'usage des LLMs en recherche. Cette lecture serait inverse de la position défendue ici. Le LLM a toute sa place dans tout laboratoire scientifique, dans toutes les disciplines — sciences de la nature, sciences humaines, sciences formelles, médecine, ingénierie. Mieux : son intégration progressive dans les pratiques de recherche est probablement souhaitable, parce qu'il libère du temps cognitif pour le travail conceptuel propre en absorbant les tâches d'exécution répétitives.
Le LLM peut accélérer la revue de littérature préliminaire — sans la remplacer, parce qu'il peut omettre ou déformer, mais en pointant rapidement vers les nœuds bibliographiques principaux qui méritent ensuite une lecture attentive. Il peut servir d'interlocuteur de simulation pour tester la solidité d'un argument avant de l'exposer à la critique réelle des pairs. Il peut formaliser une intuition mathématique informelle en notation rigoureuse. Il peut traduire entre langages disciplinaires, rendant accessibles à un sociologue les concepts d'un physicien et inversement. Il peut produire la mise en forme typographique des résultats, libérant le chercheur des aspects matériels de la production. Il peut générer du code de simulation à partir de spécifications, accélérant l'expérimentation computationnelle. Il peut documenter automatiquement les pipelines de traitement de données, améliorant la reproductibilité.
Toutes ces tâches sont bénéfiques quand elles s'insèrent dans une pratique de recherche dirigée par un chercheur ou une équipe qui possède le cadre conceptuel propre. Elles deviennent problématiques seulement quand le LLM cesse d'être un outil instrumenté pour devenir le producteur principal du travail intellectuel, l'humain ne servant plus que de signataire.
La distinction est posture, pas technique. Les mêmes modèles, les mêmes API, les mêmes interfaces peuvent être utilisés en recherche augmentée ou en vibes proof. Ce qui change, c'est la position dialogique du chercheur vis-à-vis de l'outil. Position juste : le chercheur sait ce qu'il sait, sait ce qu'il ne sait pas, mobilise le LLM pour ce qu'il peut faire mieux ou plus vite que l'humain seul, et garde la responsabilité conceptuelle. Position éclairée : le chercheur connaît les limites du LLM, ses biais, ses tendances confabulatoires, ses régressions vers la moyenne statistique de son corpus d'entraînement. Position assumée : le chercheur dit publiquement ce qu'il a fait, comment il a utilisé l'outil, ce qui est de lui et ce qui vient de l'instrument.
Cette transparence devient une condition de possibilité de la recherche elle-même dans l'écosystème post-LLM. Elle distingue le chercheur du courtier. Elle protège la qualité scientifique sans interdire l'usage de l'outil. Elle rend possible une intégration progressive et raisonnée du LLM dans les pratiques disciplinaires sans céder ni à la panique luddiste ni à la fascination sycophante.
Précédents historiques de l'augmentation instrumentale. L'arrivée du LLM dans les laboratoires n'est pas le premier épisode d'augmentation technologique de la recherche. Le microscope au XVIIe siècle, la photographie au XIXe, l'ordinateur au XXe, les bases de données numériques dans les années 1990, les outils statistiques computationnels — chacun a transformé les pratiques sans les remplacer. Chaque épisode a été accompagné d'inquiétudes ("la machine va remplacer le chercheur") et d'usages dévoyés (les premiers usages massifs des statistiques ont produit des décennies de p-hacking avant que la communauté ne se discipline). Le LLM s'inscrit dans cette continuité tout en présentant une nouveauté qualitative — le dialogue argumentatif. Cette nouveauté demande à la communauté scientifique de développer de nouveaux protocoles de bon usage, pas de refuser l'outil.
IX. Conséquences pour l'écosystème de la recherche
L'analyse proposée a des conséquences pratiques pour plusieurs acteurs de l'écosystème.
Pour les plateformes ouvertes (Zenodo, HAL, OSF, ArXiv, ResearchGate), elle pose la question d'une différenciation graduelle entre les types de dépôts. Sans imposer de filtre éditorial qui contredirait la mission d'archive ouverte, ces plateformes pourraient introduire des métadonnées explicites sur la nature des dépôts (pré-print de chercheur affilié, contribution indépendante, document en cours de revue, document publié) et sur l'usage déclaré des LLMs dans la production. La déclaration de l'usage du LLM ne devrait pas être stigmatisante — elle devrait être informative, exactement comme la déclaration d'une affiliation institutionnelle ou d'un financement. Cette transparence améliorerait la lisibilité des archives sans en restreindre l'accès.
Pour les revues à comité de lecture, elle pose la question des protocoles de relecture face à la masse croissante de soumissions assistées. Les éditeurs des grandes revues rapportent depuis 2024 une hausse significative du volume de soumissions, accompagnée d'une dégradation moyenne de la qualité — beaucoup de papiers paraissent superficiellement bien écrits mais s'effondrent à la lecture attentive. Les comités de lecture devront probablement développer des protocoles spécifiques pour traiter ces soumissions, incluant possiblement la demande explicite de transparence sur l'usage des LLMs.
Pour les chercheurs individuels, elle pose la question de la pratique réflexive de leur propre usage des outils. Tout chercheur qui utilise un LLM dans sa production gagnerait à expliciter — pour lui-même d'abord, pour ses lecteurs ensuite — les modalités précises de cet usage. Cette explicitation n'est pas un aveu honteux ; c'est une discipline professionnelle qui devient nécessaire dans le nouveau contexte technologique.
Pour les institutions de formation doctorale, elle pose la question de la pédagogie de l'usage du LLM. Les jeunes chercheurs en formation devraient apprendre explicitement les distinctions opérationnelles entre recherche augmentée et vibes proof, plutôt que d'être laissés à l'improvisation individuelle ou à l'interdiction symbolique qui est massivement contournée en pratique.
Pour les lecteurs non spécialistes — journalistes, décideurs publics, responsables politiques, citoyens informés — elle pose la question de la formation aux marqueurs critiques permettant de distinguer rapidement les types de productions. Les sept marqueurs proposés ici peuvent constituer une première grille de lecture accessible.
X. Cohérence avec PRISME
Cette note s'inscrit dans le programme PRISME comme cas d'application de plusieurs invariants théoriques, et complète le triptyque déjà constitué par Le sceau et la décision, Le coucou et le passereau et Épiménide et la lentille gravitationnelle.
D'abord, l'isomorphisme distribution-médiation. La fonction "produire un effet d'autorité scientifique pour soutenir une visibilité économique" est distribuée à travers l'histoire entre plusieurs médiations successives — universités d'élite au XIXe siècle, think tanks au XXe, conférences TED au début du XXIe, plateformes LinkedIn dans les années 2020, et maintenant vibes proofs assistées par LLM. La fonction est identique. Les médiations diffèrent dans leurs substrats. PRISME prédit que la fonction trouvera toujours une médiation tant que l'asymétrie d'accès aux savoirs spécialisés persistera, et tant que l'écosystème économique récompensera l'apparence du capital scientifique plus que sa réalité.
Ensuite, l'asymétrie de Brandolini comme invariant productif. Le principe identifié dans Le coucou et le passereau trouve ici une application aggravée. À chaque accélération technique de la production, l'asymétrie se renforce mécaniquement. Le LLM est l'épisode contemporain de cette dynamique, mais il ne sera pas le dernier — d'autres outils suivront qui amplifieront encore le différentiel entre coût de production et coût de réfutation.
Enfin, l'effondrement sémionique progressif. Le dispositif de la vibes proof est encore en phase d'expansion — il n'a pas atteint sa visibilité maximale, et la communauté scientifique n'a pas encore développé les anticorps culturels qui le rendraient inopérant. Mais comme tout dispositif de dissimulation, il porte en lui les conditions de sa propre crise. À mesure que les marqueurs deviennent connus, à mesure que des cas exemplaires sont publiquement disqualifiés, à mesure que les institutions intègrent des protocoles de différenciation, le dispositif perdra sa capacité de tromper. Il peut survivre dans la durée comme niche, mais il ne deviendra pas la norme — sauf si la communauté scientifique elle-même renonce à se défendre, ce qui n'est pas l'hypothèse la plus probable.
XI. Conclusion provisoire
L'arrivée des grands modèles de langage dans la production académique périphérique est un événement structurel, pas une mode passagère. Les LLMs ne disparaîtront pas. Leurs capacités vont continuer de croître. Leur intégration aux pratiques de recherche est inévitable et, dans une large mesure, souhaitable.
Ce qui doit se construire, c'est la capacité collective à distinguer les bons usages des dévoiements. Cette capacité passe par la formulation explicite de critères opératoires — ce que la présente note tente de fournir avec ses sept marqueurs — et par la diffusion de ces critères auprès de tous les acteurs concernés. Elle passe aussi par la pratique réflexive et transparente de tout chercheur qui utilise les LLMs dans sa propre production. La transparence n'est pas une concession à la pudeur ; c'est la condition de possibilité d'un écosystème scientifique sain dans le nouveau contexte technologique.
Le LLM amplifie ce qu'on lui apporte. Si l'on apporte un cadre conceptuel propre, des références cumulées, une question maturée, une méthode pensée, le LLM amplifie cette matière et produit avec le chercheur un travail meilleur ou plus rapide qu'il ne l'aurait été seul. Si l'on apporte un brief flou et l'envie d'apparaître comme expert, le LLM amplifie le flou et l'envie en leur donnant la forme polie qu'ils n'avaient pas seuls. Le résultat ressemble à de la recherche, mais c'est de la vibes proof.
Cette distinction n'est pas une condamnation morale individuelle. Elle est une grille de lecture pour comprendre ce qui se produit massivement dans l'écosystème contemporain et pour s'en distinguer activement quand on est chercheur honnête. Le pari du programme PRISME est que cette distinction est tenable, qu'elle peut être formulée précisément, et qu'elle vaut la peine d'être défendue publiquement — y compris par des chercheurs qui utilisent eux-mêmes les LLMs, parce qu'ils ont le plus à perdre à la confusion entre les deux pratiques.
L'écosystème scientifique a survécu à l'imprimerie, à la photographie, à l'ordinateur, à internet. Il survivra aux LLMs. Mais sa survie demande, à chaque épisode, un travail réflexif explicite sur les nouvelles conditions de la production de savoir. C'est ce travail que cette note essaie modestement de contribuer à initier, dans la lignée d'une tradition épistémologique française — Bachelard, Canguilhem, Latour — qui a toujours pris au sérieux la fabrication concrète des faits scientifiques comme objet de réflexion à part entière.
Bibliographie
Bachelard, G. (1938). La Formation de l'esprit scientifique. Contribution à une psychanalyse de la connaissance objective. Paris : Vrin. [Sur les obstacles épistémologiques et la formation de la rigueur scientifique]
Canguilhem, G. (1968). Études d'histoire et de philosophie des sciences. Paris : Vrin. [Sur la fabrication concrète du discours scientifique]
Bourdieu, P. (2001). Science de la science et réflexivité. Paris : Raisons d'agir. [Sur la production scientifique réflexive]
Latour, B. (1987). La Science en action. Introduction à la sociologie des sciences. Paris : La Découverte. [Sur la fabrique des faits scientifiques]
Latour, B. & Woolgar, S. (1979). Laboratory Life. The Construction of Scientific Facts. Princeton : Princeton University Press.
Brandolini, A. (2013). The bullshit asymmetry principle. Énoncé public, XP Days Italy 2013.
Bender, E. M., Gebru, T., McMillan-Major, A., Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?. FAccT '21 Proceedings.
Marcus, G. (2020). The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence. arXiv:2002.06177.
Garcez, A. d'A. & Lamb, L. (2020). Neurosymbolic AI: The Third Wave. arXiv:2012.05876.
Anthropic Interpretability Team (2026). Emotion vectors in Claude Sonnet 4.5. Technical report, avril 2026.
Popper, K. (1934). Logik der Forschung. Trad. fr. La Logique de la découverte scientifique, Paris : Payot, 1973. [Sur la falsifiabilité comme critère de scientificité]
Merton, R. K. (1973). The Sociology of Science. Theoretical and Empirical Investigations. Chicago : University of Chicago Press.
Kuhn, T. (1962). The Structure of Scientific Revolutions. Chicago : University of Chicago Press. Trad. fr. La Structure des révolutions scientifiques, Paris : Flammarion, 1972.
Foucaud, B. (2026). Le sceau et la décision. L'IA générative comme révélateur d'un dispositif. semiosis-ontologie.fr/textes/sceau-decision.html.
Foucaud, B. (2026). Le coucou et le passereau. Pilier épistémologique sur le courtage d'expertise. semiosis-ontologie.fr/textes/coucou-passereau.html.
Foucaud, B. (2026). Épiménide et la lentille gravitationnelle. Vers une charte éthique IA-humain. semiosis-ontologie.fr/textes/epimenide-lentille.html.
Foucaud, B. (2026). PRISME — Programme de Recherche sur les Isomorphismes de la Sémiosis et les Modes d'Émergence. Documentation en ligne : semiosis-ontologie.fr.