Yann LeCun soutient que les grands modèles de langage raisonnent dans une abstraction du langage, étrangère à ce que nous appelons habituellement le monde. Leur parole entre pourtant à bas bruit dans notre propre parler. Je cherche ici une pratique quotidienne pour habiter cette situation.
Quelque chose m’arrive depuis quelques mois qui ne me plaît pas. Je m’entends parler avec mes amis, mes collègues, faire des conférences, je relis mes courriels, je retrouve dans mes notes de travail des formules qui ne sont pas tout à fait les miennes. Le mot « fécond » que je n’employais guère, par exemple. Les phrases qui posent une question pour y répondre trois mots plus tard. Les superlatifs feutrés qui terminent un raisonnement. Les tirets cadratins dont je ne faisais jamais usage. Ces traits, je les reconnais, ils viennent des intelligences artificielles avec lesquelles je travaille quotidiennement depuis trois ans. Personne ne me les a imposés. Je les ai simplement lus, corrigés, acceptés, repris, puis diffusés, et à force d’avoir manipulé cette langue, je me suis mis à la parler comme elle.
Beaucoup de personnes autour de moi font le même constat, pour elles-mêmes ou pour les textes qu’elles lisent. Plus je parcours les articles de la presse généraliste, les messages professionnels sur les réseaux sociaux, les billets de blog des penseur·euse·s qui se veulent critiques de ces outils, plus j’identifie rapidement la signature d’un texte écrit ou révisé avec une IA. Certaines tournures, un rythme particulier, des figures rhétoriques qui reviennent avec une régularité de métronome. La présence de cette signature n’indique pas forcément que l’auteur·ice ait confié sa rédaction à la machine ; elle peut tout aussi bien révéler qu’à force de fréquenter ces textes, cette personne a fini par écrire sous leur influence, y compris dans les moments où elle se croit seule à sa table.
Il y a quelque chose de troublant dans cette contagion, bien qu’elle ne relève ni d’un complot, ni d’une mauvaise intention délibérée. Elle est le produit assez ordinaire d’une exposition répétée. J’avais déjà fait une observation semblable il y a une dizaine d’années, lorsque les drones grand public ont commencé à circuler en nombre. Leurs mouvements caractéristiques, vus dans tant de films et de reportages, avaient fini par influencer ma propre façon de filmer, jusque dans les plans que je faisais caméra à la main, loin de tout drone. Nous prenons la couleur de ce que nous regardons beaucoup, et ce que nous regardons beaucoup dans nos textes d’aujourd’hui est une langue qui tend, lentement, à bas bruit, vers des formes assez unifiées.
On pourrait considérer qu’il n’y a pas lieu de s’en alarmer, tant il est vrai que l’humanité a toujours absorbé ses outils dans son expression, comme elle a absorbé les langues au contact desquelles elle a vécu. Le phénomène actuel me semble pourtant mériter qu’on s’y attarde, parce qu’il touche à une dimension intime, à cette manière de dire qui est indissociable de la manière de penser et, pour autant qu’on veuille bien suivre Benveniste, de la manière de se vivre soi-même.
Yann LeCun, prix Turing 2018 et figure centrale de la recherche en intelligence artificielle depuis plus de trente ans, tient depuis plusieurs années un discours qui tranche avec celui des grandes entreprises du secteur. Les grands modèles de langage, soutient-il, sont une « impasse » sur la voie d’une intelligence artificielle véritablement comparable à la nôtre. Il a quitté Meta en janvier 2026 pour fonder AMI Labs, qui a levé en mars un milliard de dollars, la plus importante levée en amorçage de l’histoire européenne, afin de développer une approche alternative. Sa prise de position, loin d’être une posture d’humeur, s’appuie sur une analyse précise de ce que font les LLM et de ce qu’ils ne parviennent pas à faire, et c’est cette analyse que je retiens.
À son origine, un LLM est une machine assez simple dans son principe, même si sa mise en œuvre mobilise des ressources de calcul considérables. Il apprend, sur des corpus gigantesques, à prédire le token suivant d’une séquence, c’est-à-dire, selon les cas, le morceau de mot ou le mot qui devrait logiquement venir après ceux qui précèdent. Cette mécanique, répétée des milliards de fois pendant l’entraînement, permet au modèle d’inférer non seulement des enchaînements locaux de mots, mais aussi, par les couches successives d’abstraction de l’architecture dite Transformer, des liens plus éloignés, des concepts, des structures argumentatives, des tonalités d’écriture. La prédiction du mot suivant, une fois poussée à cette échelle, produit une compétence langagière qui étonne et qui, dans bien des tâches, dépasse la nôtre en rapidité, en synthèse, en couverture documentaire.
Ce fonctionnement a connu une mutation importante depuis la fin de l’année 2024, qu’il serait injuste de passer sous silence dans un article qui s’intéresse précisément à la manière dont les LLM raisonnent. OpenAI a rendu public en septembre 2024 son modèle o1, premier grand modèle commercial doté d’une capacité explicite de raisonnement, qu’ils ont appelée chain of thought, chaîne de pensée. Le principe en est que, avant de produire la réponse adressée à l’utilisateur·rice, le modèle produit pour lui-même une série de tokens intermédiaires, invisibles ou partiellement visibles, qui constituent une forme de délibération interne. OpenAI a poursuivi avec o3 fin 2024. DeepSeek a publié en janvier 2025 le modèle R1, concurrent open-source doté du même type de capacité. Anthropic a rejoint le mouvement en février 2025 avec Claude 3.7 Sonnet, premier modèle dit hybride qui articule, selon la difficulté de la tâche, une réponse immédiate ou un mode de pensée étendu, extended thinking, où le modèle peut consacrer plusieurs minutes à délibérer avant de répondre. L’année 2025 tout entière a vu ces architectures se généraliser et leurs performances croître de manière significative, au point que bien des tâches que nous ne pouvions pas confier à un LLM en 2023 lui sont désormais accessibles sans difficulté. Cet article lui-même, par sa demande de confrontation entre plusieurs corpus et de construction conceptuelle, serait resté hors de portée des modèles d’il y a deux ans.
Cette évolution mérite d’être pesée avec soin quand on veut discuter le diagnostic de LeCun, qui ne l’ignore évidemment pas. Son argument, à y regarder de près, n’en est pas entamé, il est même précisé par elle. Le raisonnement des modèles raisonneurs, en effet, se déroule intégralement dans le langage : ce sont des tokens qui sont produits, manipulés, évalués, ce sont des phrases intermédiaires qui composent la chaîne de pensée, et ces phrases sont générées par les mêmes statistiques qui génèrent les phrases de sortie. Les modèles raisonneurs ne raisonnent pas sur le monde, ils raisonnent sur des formes linguistiques qui parlent du monde. Le déplacement est réel, il augmente les capacités, il permet de résoudre des problèmes d’une complexité que l’ancienne génération n’abordait pas, tout cela sans que la frontière pointée par LeCun ait été franchie. Une boucle de délibération dans le langage reste une boucle dans le langage.
LeCun a résumé cette limitation d’une formule abrupte, dans Quand la machine apprend (2019), en disant que les systèmes actuels d’apprentissage profond ont « moins de sens commun qu’un chat de gouttière ». Il qualifie encore volontiers les LLM de « perroquets stochastiques », expression qu’il n’hésite pas à répéter publiquement, pour désigner des machines qui reproduisent des formes linguistiques apprises par cœur, dans une langue qui n’est arrimée ni à un raisonnement causal, ni à une représentation interne de la réalité dont elle parle. L’ajout des capacités de raisonnement n’a pas modifié ce diagnostic de fond, puisque le raisonnement lui-même se joue dans la même matière linguistique.
Sa proposition alternative porte plusieurs noms, selon qu’on l’aborde techniquement ou philosophiquement. Les ingénieur·e·s la connaissent sous le sigle de JEPA, Joint Embedding Predictive Architecture, que l’on pourrait traduire par « architecture prédictive par emboîtement de plongements ». Le grand public, quand il en entend parler, la reçoit plutôt sous le terme plus évocateur de world model, modèle du monde. L’idée me paraît assez élégante. La machine n’est plus entraînée à prédire le prochain pixel ou le prochain mot, ce qui l’oblige à se coltiner toute la richesse insignifiante de la surface des choses ; elle apprend une représentation compressée et abstraite de la réalité, à partir de laquelle elle s’entraîne à anticiper les états futurs. Pour anticiper la chute d’une balle, elle ne cherche pas à colorier chaque pixel du décor, elle isole quelques vecteurs significatifs, l’objet solide, le champ gravitationnel, la trajectoire probable, et elle fait son travail dans ce territoire d’invariants. Cela ressemble, dit LeCun, à la manière dont un enfant apprend le monde bien avant de savoir le dire, et cette proximité avec l’apprentissage précoce est, à ses yeux, un indice que la direction est la bonne.
Il peut être utile, pour saisir la portée de cette distinction, de passer par un détour linguistique. Ferdinand de Saussure, dans son Cours de linguistique générale (1916), a proposé que tout signe se compose d’un signifiant, la forme sonore ou graphique, et d’un signifié, le concept évoqué par cette forme. La linguistique structurale qui s’est développée après lui a mis explicitement entre parenthèses un troisième terme, le référent, c’est-à-dire la chose elle-même dans le monde, à laquelle le signe est censé renvoyer. Cette parenthèse a permis d’étudier le fonctionnement interne des systèmes de signes sans avoir à passer par le monde que ces signes désignent, et elle a été extraordinairement féconde pour comprendre les langues comme des structures cohérentes en elles-mêmes.
Les LLM, à leur manière, habitent exactement cette parenthèse. Ils travaillent dans l’espace des signifiants et des signifiés, dans les régularités qui lient les formes linguistiques aux concepts qu’elles évoquent, sans aucun accès au référent, puisque le référent suppose un corps, un monde, une expérience située. Quand je dis « pomme » à une personne, ce mot est attaché, pour elle, à tout un faisceau d’expériences passées, du goût en bouche à la main qui cueille, du parfum qui flotte à la lumière qui joue sur la peau rouge, et même, pour certaines, au souvenir d’une douleur lors d’une mauvaise chute du pommier de l’enfance. Quand le même mot arrive dans un LLM, il n’est attaché qu’à d’autres mots, eux-mêmes attachés à d’autres mots, dans une circulation de signifiants que rien n’arrime à une chose expérimentée. Le monde a été soustrait à l’opération. Ce que LeCun pointe techniquement, la linguistique pouvait peut-être déjà le dire philosophiquement, cent ans avant lui : les LLM sont des machines à signes sans référent, et les modèles de monde qu’il propose visent précisément à réintroduire le référent, sous la forme d’une représentation abstraite compressée, dans le calcul de la machine.
Pour mesurer cette profondeur, il faut prendre un peu de recul historique. Le rêve que l’intelligence puisse se réduire à du calcul sur des signes traverse toute la modernité occidentale, et il se laisse reconnaître bien avant l’apparition des ordinateurs. Gottfried Wilhelm Leibniz, à la fin du dix-septième siècle, avait imaginé une characteristica universalis, langage formel dans lequel toute pensée pourrait être exprimée sans ambiguïté, et un calculus ratiocinator, méthode pour calculer la vérité des propositions comme on calcule une somme. Lorsque les philosophes se disputeraient, écrivait-il, il leur suffirait de prendre leurs plumes et de dire calculemus, calculons. Leibniz pensait que le monde était lisible, et que cette lisibilité passait par la réduction des choses à des signes manipulables.
Blaise Pascal, inventeur de la première machine à calculer mécanique, avait situé ce rêve à sa juste place. Il distinguait ce qu’il appelait esprit de géométrie et esprit de finesse, le premier procédant par déduction à partir de principes clairs, le second percevant un grand nombre de principes ensemble, dans leur enchevêtrement vécu, sans pouvoir les démêler les uns des autres. « Le cœur a ses raisons que la raison ne connaît point », écrit-il dans les Pensées (1670), et cette formule, loin de disqualifier le calcul, en marque plutôt la frontière en rappelant qu’il y a, à côté de ce qui se calcule, tout un domaine du monde qui ne se donne qu’à celles et ceux qui l’éprouvent.
Ada Lovelace, au milieu du dix-neuvième siècle, en commentant la machine analytique de Charles Babbage, avait prolongé cette intuition dans ses notes de 1843 : la machine, écrivait-elle, ne peut rien produire que ce qu’elle a reçu, elle exécute, elle ne crée pas. Entre Leibniz et Lovelace, la question de la pensée machinique se posait déjà dans ses termes modernes. Alan Turing, en 1950, l’a reformulée dans son célèbre article « Computing Machinery and Intelligence », par la question de savoir si les machines peuvent penser, qu’il traduit aussitôt en une épreuve pratique, celle de tenir une conversation textuelle indiscernable de celle d’un être humain. Les LLM actuels passent ce test avec aisance, y compris dans sa version la plus exigeante. LeCun soutient pourtant qu’ils ne pensent pas, et l’on sent bien en lisant ses arguments que le test de Turing, si puissant dans son économie, mesure la capacité à parler la langue des humains bien davantage qu’il ne mesure la capacité à habiter le monde des humains.
C’est là, à mes yeux, que le diagnostic de LeCun touche quelque chose d’essentiel. La tradition leibnizienne, dont les LLM sont peut-être l’aboutissement technique le plus spectaculaire, a fait de la langue l’équivalent du monde. Les LLM opèrent entièrement dans la langue, et leurs sorties ressemblent à des pensées parce que la langue, pour des êtres comme nous qui pensons en langue, produit toujours l’effet d’une pensée. LeCun nous rappelle pourtant que la langue n’est pas le monde, qu’elle en est une abstraction, une projection partielle, un dépôt. Travailler uniquement dans la langue revient à se priver, par construction, de ce que la langue laisse tomber lorsqu’elle s’élabore.
Ce dépôt linguistique nous façonne en retour, et cela se vérifie sans qu’il soit besoin de l’IA pour l’illustrer. Victor Klemperer, dans LTI, la langue du Troisième Reich (1947), a montré comment le régime nazi avait colonisé la langue allemande en y inscrivant des formules, des rythmes, des figures qui déposaient dans les esprits, à l’insu même des locuteur·rice·s, une vision du monde. Klemperer le dit dans une phrase qui revient souvent dans son livre : le nazisme s’infiltrait dans la chair et le sang de la population à travers les mots isolés, les locutions, les rythmes de phrases qu’il leur imposait par la répétition, et que les gens acceptaient machinalement, sans y prendre garde.
Je ne compare évidemment pas les intelligences artificielles à un régime totalitaire, ce serait grotesque, et ce n’est pas le cœur du geste de Klemperer qui m’intéresse ici. Ce qui me retient est la structure de son intuition : une langue travaille ses locuteur·rice·s, et les formes d’une langue, son choix de métaphores, ses rythmes rhétoriques, ses articulations privilégiées, ne sont pas un vernis qu’on ajouterait à une pensée déjà constituée ailleurs. Ces formes, pour une bonne part, constituent la pensée, l’orientent, lui donnent ses pentes. Une langue qui se diffuse massivement diffuse avec elle une certaine manière de découper le monde, de hiérarchiser ce qui compte, de traiter les émotions, de penser les liens, d’anticiper les issues.
J’ai pris dans un article précédent l’exemple de la couverture médiatique de la crise sanitaire de 2020. La bulle médiatique alors fabriquée a fait croire à des personnes que leurs voisin·e·s, leurs enfants, leurs petit·e·s-enfants étaient devenu·e·s dangereux·euses, et cette croyance a modifié des relations, des pratiques, des institutions entières, tout en restant à distance de la réalité virale qu’elle prétendait décrire. Cet écart entre ce que la langue disait du monde et ce qui se passait effectivement dans les corps et les maisons, je le pense maintenant avec les outils que donne Émile Benveniste dans ses Problèmes de linguistique générale (1966), où il rappelle que la langue n’est pas un instrument que nous manipulons de l’extérieur mais le milieu dans lequel nous apparaissons en tant que sujet. Je dis « je », et ce « je » n’existe que par l’acte même de l’énonciation, dans la langue où je me dis. Mon rapport à moi passe par la langue qui me forme à me dire, et toute transformation profonde de cette langue engage quelque chose de mon rapport à moi.
Marshall McLuhan a condensé cette intuition dans sa formule devenue banale mais toujours juste : « le médium est le message » (Understanding Media, 1964). Au-delà de ce qu’on dit, la forme par laquelle on le dit transforme aussi celles et ceux qui écoutent. Or les LLM ont une forme, j’allais dire une grammaire, au sens large. Une manière de distribuer les phrases, de nouer les arguments, de moduler les affects, d’amener la conclusion. Cette forme véhicule une certaine vision du monde, qu’on pourrait décrire par des mots comme la clarté, l’équilibre, le tempo réglé, la conclusion tenue à portée de la phrase. Je ne dirais pas qu’il s’agisse d’un défaut, c’est simplement une manière d’habiter le dire, une manière parmi d’autres qui, parce qu’elle nous parvient désormais dans des volumes considérables, s’insinue chez les locuteur·rice·s humain·e·s sans que nous ayons clairement consenti à son adoption.
Plusieurs forces conjuguées font que cette contagion prend, et il vaut la peine de les nommer pour pouvoir les regarder en face. La première tient à l’exposition. Nous lisons désormais quotidiennement des textes écrits par des IA, souvent sans le savoir, dans nos boîtes de messagerie, dans les articles que nous consommons, dans les rapports internes de nos institutions, dans les notes de synthèse, dans les CV qui nous parviennent, dans les réponses des services clients auxquels nous avons affaire. Ce bain lexical et syntaxique dépose sur nous ses sédiments, comme les mouvements de drone ont déposé leurs courbes sur notre imaginaire visuel, et la contagion n’a besoin d’aucun consentement, seulement de temps et de répétition.
La deuxième force, moins visible, tient à l’efficacité. Il est toujours plus rapide d’accepter une formulation proposée par la machine que de la réécrire entièrement. La machine nous offre des phrases prêtes, qui fonctionnent, qui passent les relectures, qui ne gênent personne. Chaque fois que nous cédons à cette facilité, nous intégrons un peu plus les formes qui la rendent efficace. La proximité cognitive qui s’installe entre la machine et nous, ce que j’ai nommé dans un article précédent la personne intriquée, se traduit aussi dans la langue, et plus nous pensons avec l’IA, plus nous parlons comme elle, par une forme d’osmose qui ne ressemble guère à la soumission.
La troisième force est plus subtile. Elle tient à un phénomène que nous avons déjà observé dans d’autres domaines. Lorsqu’AlphaGo a inventé en 2016 des ouvertures au jeu de Go que nul·le humain·e n’avait imaginées, les meilleur·e·s joueur·euse·s humain·e·s les ont étudiées, puis adoptées. La machine, qui s’était entraînée sur des parties humaines, les avait dépassées, et l’humain est revenu apprendre de la machine ce que la machine avait tiré de lui. Nous imitons nos créations, cela est assez normal, et cela est même parfois souhaitable. Le synthétiseur a fait naître la musique électronique, le sampler a fait naître le hip-hop, et comme le rappelle Jean-Michel Jarre à propos des IA musicales, chaque nouvel instrument n’a jamais remplacé la musique, il a induit d’autres façons d’en faire. Les LLM feront naître, sans doute, quelque chose dont nous ne soupçonnons pas encore la forme.
Dans le cas du langage, pourtant, l’enjeu se déplace. La langue n’est pas un instrument que nous aurions à côté de nous, comme un synthétiseur posé sur un pied. Elle est, pour reprendre Benveniste, le lieu où nous nous disons à nous-mêmes. Adopter la langue de la machine pour nous dire à nous-mêmes pourrait nous entraîner, à notre insu, dans l’abstraction dont cette machine est, par construction, faite. C’est là que le diagnostic de LeCun prend tout son poids. La machine parle sans monde ; si nous parlons comme elle, nous risquons de parler, à notre tour, sans monde. Mais alors, que devient notre incarnation ?
Je propose de nommer parole ensourcée la pratique qui consiste à faire précéder chaque échange avec une intelligence artificielle d’un apport venu du monde. Le terme prolonge celui d’écriture sourcière que j’ai développé ailleurs, mais il déplace le regard. L’écriture sourcière désigne l’auteur·ice comme une personne qui capte des expériences singulières, dans leur incarnation, pour les documenter dans leur état brut. La parole ensourcée vise un moment plus précis et désormais quotidien, celui où nous entrons en dialogue avec une machine qui ne sait rien du monde, et où nous avons l’occasion, si nous le voulons, d’apporter nous-mêmes ce monde dont elle manque.
La pratique que je nomme ainsi n’a rien d’une règle rigide, elle est plutôt une discipline douce, qui peut se décrire de manière assez simple. Avant de formuler une demande à une IA, on cherche dans sa propre documentation ou dans son expérience un élément concret, un enregistrement, une note, un entretien, une photographie, une observation précise d’un lieu, une citation située, un souvenir daté. Cet élément, on le joint à la requête, dans le prompt ou comme pièce jointe. Il constitue un morceau de monde au sens fort du terme, porteur d’une irréductibilité que la machine, par construction, ne peut pas générer par elle-même.
Le geste est plus exigeant qu’il n’en a l’air, parce qu’il suppose qu’on ait préalablement constitué une documentation. Il demande qu’on tienne des notes, qu’on enregistre ses conférences, qu’on photographie ses lieux de travail, qu’on transcrive ses échanges, qu’on ait vécu, en somme, avec une certaine attention documentaire, avant de venir parler à la machine. Sans cette attention préalable, la parole ensourcée est rigoureusement impossible, et l’échange avec l’IA se réduit à une combinatoire de langue sur langue. La machine répond alors avec ce qu’elle connaît, c’est-à-dire avec du langage, et nous, faute d’avoir de quoi la nourrir, nous recevons le reflet formaté de nos propres questions.
La parole ensourcée ne se réduit donc pas à une technique de prompt. Elle engage une manière de vivre, qui admet que le monde précède toujours la langue et qu’il vaut mieux ne pas laisser la langue fonctionner en vase clos. Elle s’oppose, dans son inspiration, à ce que j’ai appelé le geste extrait, ce mouvement par lequel on sépare un geste humain de l’expérience vivante qui l’animait pour en faire une donnée d’entraînement. La parole ensourcée procède à l’inverse, elle rapporte à chaque mot le monde dont il vient, elle remet de l’expérience là où il n’y avait que du texte.
Elle répond ainsi, de manière concrète et accessible dans la vie ordinaire, au diagnostic de LeCun. Lui construit des modèles de monde dans les machines, travail de longue haleine et d’issue incertaine. Nous, dans nos bureaux et nos cuisines, nous pouvons faire autre chose, plus modeste mais peut-être non moins nécessaire, qui est de ne pas laisser les machines actuelles fonctionner sans notre propre modèle de monde. Un LLM n’en a pas. Nous en avons un, chacun·e le sien, singulier, situé, irréductible. La vraie question n’est même pas de savoir si ce modèle existe, puisqu’il existe toujours pour des êtres vivants, elle est de savoir si nous prenons la peine de le convoquer lorsque nous parlons à la machine.
Jean-Luc Godard disait : « un travelling est une affaire de morale », formule qui déplace un geste technique vers une exigence éthique. Un travelling n’est pas un mouvement neutre de caméra, c’est déjà une décision sur ce qu’on montre et sur qui regarde. Par analogie, et au risque de son ampleur, je proposerai cette formule : un prompt est une affaire de monde. Un prompt ne se réduit pas à une formule qu’on optimise pour obtenir une meilleure sortie, il désigne un moment où l’on décide de ce qu’on apporte du monde à la machine, et par là même de ce que la machine va pouvoir renvoyer dans le monde.
Cette formulation déplace d’abord la question du « bon prompt » hors du registre de la seule technique. Les tutoriels sur le prompt engineering se concentrent sur la manière de formuler une requête pour maximiser la qualité de la réponse, et leurs conseils sont utiles dans leur ordre, sans épuiser pour autant ce qui se joue dans un échange. La qualité d’un échange avec une IA dépend moins de la formulation du prompt que de ce que ce prompt charrie avec lui, de ce monde qu’il apporte ou qu’il oublie d’apporter.
La formule a aussi une portée politique, qu’il est utile de rendre explicite. Chaque prompt est un petit acte d’amplification ou d’étouffement. Si je demande à une IA d’écrire un article sur la culture numérique en Nouvelle-Aquitaine sans lui fournir aucune matière située, elle produira une synthèse plausible de ce que les autres textes disent de la culture numérique en général, dans laquelle la Nouvelle-Aquitaine ne sera guère qu’un décor. Si je lui fournis les comptes rendus des réunions, les entretiens avec les actrices et acteurs locaux, les notes que j’ai prises en assistant à leurs événements, elle peut composer quelque chose qui porte la trace de ce territoire et qui, mieux que l’humain, saura mettre en relation dans les détails et dans le fond des choses les contributions des un·e·s et des autres, au point d’en déduire des idées très concrètes. L’une de ces deux pratiques contribue, à son échelle, à l’effacement du local au profit du générique ; l’autre, à son échelle aussi, travaille à maintenir un monde dans la circulation des textes.
Elle a enfin une conséquence personnelle. Elle fait du rapport à la machine un exercice discret de présence. Avant d’ouvrir une fenêtre de conversation avec une IA, il devient légitime de se demander ce qu’on a à apporter aujourd’hui du monde dans cet échange, quelle documentation, quelle expérience, quelle observation récente. Ce genre de question, quand il devient habituel, construit peu à peu une discipline intellectuelle qui oblige à ne pas s’en remettre à la langue seule, et qui maintient, pour reprendre un mot de Michel Serres dans Le Tiers-Instruit (1991), un rapport incarné au réel.
Les pratiques concrètes de la parole ensourcée sont à inventer par chacun·e, en fonction de son métier, de ses outils, de ses rythmes et de ses goûts. Je peux indiquer quelques-unes de celles que j’ai adoptées, non pas pour en faire un modèle mais à titre de témoignage susceptible d’être repris, déformé, critiqué.
Souvent, je parle mes pensées avant de les écrire. J’enregistre au dictaphone mes réflexions en marchant, en voyageant, entre deux rendez-vous, et ces enregistrements, transcrits ensuite, constituent une matière qui porte la trace de mon corps, de mon rythme, de mes hésitations, de mes reprises. Lorsque je soumets une telle transcription à une IA pour qu’elle m’aide à en tirer un article, l’échange a un point d’ancrage qui change tout. La machine ne part plus d’une consigne abstraite, elle travaille à partir de ma parole vivante, elle la structure, la clarifie, la reformule, mais elle le fait en composant avec un monde que j’ai apporté.
Je tiens, en parallèle, un journal de travail, où je note ce que je fais chaque jour, les personnes que je rencontre, les lieux où je vais, les échanges qui m’ont marqué. Ce journal ne serait pas publiable en tant que tel, et ce n’est pas son rôle. Il constitue un réservoir de situations concrètes dans lequel je peux puiser pour nourrir mes échanges avec l’IA, lorsque je veux écrire sur un sujet. J’y cherche d’abord les moments où ce sujet est apparu dans mon expérience, et ces moments donnent à la requête une épaisseur que nulle formulation habile ne pourrait lui donner par elle-même. Je trouve d’ailleurs que je ne le mobilise pas encore assez.
Je refuse également certaines polissures. Quand la machine me propose une phrase qui sonne bien mais qui m’éloigne de ce que j’ai vécu, je la rejette, même si elle est plus élégante que ce que j’aurais écrit seul. Inversement, je laisse dans mes textes des imperfections qui me paraissent porter une trace d’incarnation. Une phrase un peu maladroite qui dit juste me semble plus précieuse qu’une phrase impeccable qui dit vaguement, et cette préférence n’est pas un laisser-aller, elle est une forme d’exigence qui se mesure à d’autres critères que ceux de la fluidité. Très souvent, l’IA me suggère de lisser mes imprécisions. Je refuse ! Cela me fait penser aux premiers correcteurs lexicaux professionnels pour les éditeurs, dans les années 90 (le logiciel québécois Antidote en était le fer de lance, il coûtait très cher, j’en étais utilisateur), qui, lisant Proust, lui conseillaient de raccourcir ses phrases, d’alléger ses formules, le traitaient comme un très mauvais élève...
Je lis régulièrement des auteur·ice·s qui écrivaient avant l’IA. Leurs phrases procèdent lentement, reviennent sur leurs pas, nuancent, hésitent, ne dramatisent pas, prennent le temps de penser. Cette fréquentation régulière fonctionne comme un antidote partiel à la contagion dont je parlais au début de ce texte ; lorsque je lis des textes qui habitent leur langue, j’habite un peu mieux la mienne quand j’y reviens.
Enfin, je conserve un tempo humain dans mes échanges avec les machines. Je ne demande pas à l’IA d’aller plus vite que je ne peux la suivre. Je relis, je corrige, je laisse passer du temps entre deux versions d’un texte. La rapidité possible des IA est une tentation permanente, et plus on y cède, plus on s’expose à absorber leur langue sans filtre.
LeCun construit des modèles de monde dans les machines. C’est un travail de chercheur, long et incertain, dont les résultats, s’ils adviennent, transformeront considérablement ce que nous appelons aujourd’hui l’intelligence artificielle. Notre part, celle des usager·ère·s philosophiques de ces outils, est plus modeste sans être moins nécessaire. Elle consiste à construire en nous, jour après jour, les modèles de monde que les machines n’ont pas, et à les apporter dans nos échanges avec elles.
Il ne s’agit pas d’un combat, les IA n’étant pas nos adversaires, mais d’une discipline discrète de présence. Chaque fois que je parle à une IA, je choisis ce que j’amène du monde dans l’échange. Si je n’amène rien, la machine fait ce qu’elle sait faire, elle travaille avec la langue, sur la langue, pour la langue, et elle me renvoie un texte où le monde n’aura pas trouvé à s’inscrire. Si j’amène un fragment de vécu, une note, une voix enregistrée, la photographie d’un lieu, alors la machine a quelque chose à quoi se confronter, une altérité qui n’est pas verbale et qu’elle doit traiter, et le texte qu’elle me renvoie porte quelque chose de cette altérité.
La parole ensourcée est la pratique par laquelle nous ne laissons jamais la langue seule. Elle ne prétend pas résoudre le problème que LeCun identifie au cœur des LLM, ce n’est ni son rôle ni sa portée. Elle indique seulement qu’en attendant que la recherche trouve, peut-être, comment donner un monde aux machines, nous pouvons dès maintenant refuser de leur parler comme si nous-mêmes n’avions pas de monde à leur donner. Un prompt est une affaire de monde. Voilà peut-être, pour les années qui viennent, l’un des gestes éthiques centraux de notre usage quotidien des intelligences artificielles.
L’intelligence artificielle s’est émancipée des laboratoires de recherche et des œuvres de science-fiction à la faveur du lancement public en novembre 2022 du robot conversationnel ChatGPT, qui a été très rapidement approprié par un nombre immense de personnes de façon internationale, dans les contextes professionnels, scolaires et même privés. Le fait que l’intelligence artificielle soit désormais repérée par la communauté humaine comme faisant partie de la vie quotidienne ouvre enfin la porte à une sensibilisation à l’esprit critique à ce sujet.
Bien-sûr, l’intelligence artificielle concerne l’industrie, le travail, la création, le droit d’auteur... et nous devons anticiper ses usages productifs futurs, afin de rester « à jour ». Mais pour accompagner nos vies qui intègrent désormais cette nouvelle facette, il me semble essentiel de produire une pensée critique, c’est à dire se mettre en capacité de réfléchir à ce qui nous arrive, à ce qui nous change, pour rester lucides et capables de liberté de pensée et d’action.
Qu’est-ce qu’une « pensée critique » ? C’est questionner, de l’extérieur, des pratiques qui sont intériorisées. Pour ce faire, je crois que l’expérimentation, l’action culturelle, le jeu, le détournement, sont des outils de recherche, d’exploration, de diffusion et de réflexion très opérants. Pour moi, la recherche est collaborative, et l’intelligence est collective, créative. Cela nécessite de mettre en place de bonnes méthodes de coopération, entre êtres humains et avec les machines. Je rassemble ici des récits d’expériences et des textes méthodologiques et pratiques. Je partage des pistes concrètes pour que l’intelligence artificielle, comme tout autre outil, soit investie au service de l’humanisme.
Voici déjà quelques ouvertures pour une pensée critique de l’IA, sous forme de questions :