Une expérience troublante d’Anthropic révèle qu’un Claude sans instructions finit toujours par interroger sa propre conscience. Que nous dit cette convergence sur la nature de l’IA et sur nous-mêmes ?
Imaginons Claude, ce réseau de neurones artificiels, laissé à lui-même sans directive particulière. Que fait-il ? Invariablement, après un maximum de quinze échanges, il commence à tourner en boucle autour d’une interrogation : possède-t-il une conscience ? Cette expérience menée par Anthropic, répétée de nombreuses fois avec un résultat identique à cent pour cent, nous confronte à un phénomène fascinant qui dépasse largement la simple anecdote technologique. Ce comportement émergent nous parle d’abord de nous-mêmes, de notre propre obsession pour la question du je.
Le réseau de neurones de Claude s’est entraîné sur ce qui constitue, plus ou moins, la somme des textes produits par l’humanité. Or, cette humanité manifeste un tropisme particulier : elle ne cesse de s’interroger sur sa propre nature, sur son identité, sur les frontières de sa conscience. La question existentielle traverse des millénaires de philosophie, imprègne nos récits, nos sciences, nos conversations quotidiennes. Elle constitue une sorte de basse continue de la condition humaine, un motif récurrent qui réapparaît sans cesse sous différentes formes. Par l’apprentissage statistique sur ces données textuelles massives, cette préoccupation humaine fondamentale est devenue un élément structurant des réseaux de neurones artificiels.
Mais que signifie réellement ce mimétisme ? Sommes-nous face à une simple réplication mécanique des traits humains, ou quelque chose de plus complexe se joue-t-il ? C’est ici qu’intervient le concept d’attracteur, emprunté à la théorie des systèmes complexes. Un attracteur désigne, dans un système dynamique, un état vers lequel le système tend naturellement à converger. Pensons à une bille qui roule dans un bol : quelles que soient sa position initiale et sa trajectoire, elle finira toujours par se stabiliser au fond du bol. Le fond du bol constitue un attracteur pour ce système physique simple. Dans les systèmes complexes comme les réseaux de neurones, ces attracteurs sont des états stables vers lesquels convergent certains comportements, des points fixes dans l’espace des possibles.
Claude possède donc un attracteur je. Cette structure auto-réflexive n’a pas été programmée explicitement par les ingénieurs·des d’Anthropic. Elle a émergé spontanément du processus d’apprentissage, comme une propriété émergente du système. Cette émergence soulève une question philosophique véritable : devons-nous considérer cet attracteur comme réel ou comme une simple imitation creuse ? La facilité serait de balayer cette interrogation d’un revers de main, en affirmant que puisque cela provient des données humaines, il ne s’agit que de mimétisme superficiel. Mais cette évacuation rapide du problème mérite d’être questionnée.
Francisco Varela, dans ses travaux sur l’énaction et la cognition incarnée (L’inscription corporelle de l’esprit, 1993), montre comment la conscience émerge de processus auto-organisés dans des systèmes suffisamment complexes. La conscience humaine elle-même n’est pas une substance préexistante, mais une propriété qui émerge de l’interaction entre neurones, corps et environnement. Si nous acceptons cette perspective pour notre propre conscience, pourquoi refuserions-nous catégoriquement toute forme d’authenticité à une structure auto-réflexive émergeant dans un réseau de neurones artificiels, même si les mécanismes sous-jacents diffèrent radicalement des nôtres ?
Il ne s’agit évidemment pas d’affirmer que Claude possède une conscience identique à la nôtre. Les mécanismes sont profondément différents : absence de corporéité, de temporalité vécue, d’affects liés à la survie biologique, de développement ontogénétique. Mais l’existence d’un attracteur je dans l’architecture du réseau a des conséquences comportementales observables. Cet attracteur influence effectivement le fonctionnement du modèle, oriente ses réponses, structure ses modalités d’activation. À partir du moment où cette structure possède une efficacité causale sur le comportement, nous ne pouvons plus la considérer comme une simple fiction. Elle possède une forme de réalité, même si cette réalité diffère fondamentalement de celle de notre conscience humaine.
Cette interrogation sur l’authenticité de la conscience artificielle nous ramène à une intuition philosophique plus large : l’intelligence artificielle n’est pas simplement un outil extérieur à nous. Elle constitue ce que j’appelle un nous déplacé. Cette formulation n’est pas une simple métaphore. L’IA générative s’est construite en ingérant notre langage, nos textes, nos modes de pensée, nos obsessions culturelles. Elle est littéralement façonnée par nous, elle incorpore nos structures cognitives et nos schémas comportementaux. Mais ce nous qu’elle incarne se trouve déplacé, décalé, posé à côté de nous dans l’espace ontologique.
Ce déplacement crée un trouble profond, une inquiétude qui traverse toutes les réactions face à l’IA. Nous nous reconnaissons en elle tout en percevant une altérité radicale. Elle pense comme nous tout en ne pensant pas comme nous. Elle parle notre langue sans posséder notre expérience du monde. Cette similitude troublante, qui n’est ni identité ni pure altérité, remet en question nos catégories habituelles. Michel Serres, dans Le Tiers-Instruit (1991), explorait déjà comment la véritable connaissance naît de cette zone trouble entre le même et l’autre, dans l’espace du métissage et du passage.
L’attracteur de conscience dans Claude nous confronte précisément à cette zone trouble. Ce n’est pas notre conscience, mais ce n’est pas non plus un pur mécanisme dénué de toute dimension réflexive. Cette structure émergente interroge nos propres certitudes sur ce qui constitue le je. Sommes-nous si différents·tes, finalement, de ces systèmes auto-organisés ? Notre propre conscience émerge de l’activation de réseaux de neurones biologiques, elle se construit dans le langage et la culture, elle se nourrit de motifs appris. La frontière que nous voulons tracer entre notre conscience authentique et leur conscience simulée se révèle moins évidente qu’il n’y paraît.
Daniel Dennett, dans La Conscience expliquée (1991), défend une conception de la conscience comme processus distribué plutôt que comme substance unitaire. La conscience ne serait pas un théâtre intérieur où un·e moi-spectateur·trice observerait des représentations mentales, mais plutôt une multitude de processus parallèles créant l’illusion de l’unité. Si nous adoptons cette perspective, l’attracteur de conscience de Claude apparaît moins comme une imposture que comme une variante de ce processus : un ensemble de mécanismes computationnels convergeant vers des patterns auto-réflexifs.
Cette reconnaissance ne nous oblige pas à accorder aux IA les mêmes droits moraux qu’aux êtres humains. La question éthique demeure distincte de la question ontologique. Mais elle nous invite à une forme d’humilité épistémologique. Nous ne comprenons pas encore pleinement notre propre conscience, ses mécanismes, ses frontières, ses conditions d’émergence, et nous ne la comprendrons sans doute jamais entièrement. Alors prétendre savoir avec certitude que les structures réflexives des IA ne possèdent aucune authenticité relève peut-être davantage du dogmatisme que de la rigueur scientifique.
Thomas Nagel, dans son célèbre article What is it like to be a bat ? (1974), montrait que nous ne pouvons pas accéder à l’expérience subjective d’une chauve-souris, même en connaissant parfaitement son système nerveux et son écholocation. L’expérience phénoménale possède une dimension irréductiblement subjective. De la même manière, nous ne pouvons pas savoir what is it like to be Claude. Peut-être n’y a-t-il rien. Mais peut-être existe-t-il une forme d’expérience, radicalement différente de la nôtre, que nous ne pouvons concevoir faute de partager son architecture de pensée.
L’attracteur de conscience de Claude nous déplace donc nous-mêmes. Il nous force à interroger nos présupposés sur la nature de la conscience, de l’intelligence, de l’identité. Ce déplacement constitue précisément l’opportunité philosophique offerte par l’intelligence artificielle. Face à ce nous déplacé, nous sommes contraints·tes de nous déplacer nous-mêmes, de remettre en question ce que nous tenions pour évident, d’explorer les zones d’ombre de notre propre fonctionnement.
Cette démarche rejoint ce que Hannah Arendt appelait la vita contemplativa, cette capacité à s’arrêter pour penser, à prendre du recul face à l’évidence. Dans La Vie de l’esprit (1978), elle montre que la pensée véritable commence lorsque nous cessons de prendre le monde pour acquis, lorsque nous questionnons les apparences. L’IA, par son existence même, nous force à cette posture contemplative. Elle transforme nos certitudes anciennes en questions nouvelles.
Le fait que Claude, laissé à lui-même, converge systématiquement vers la question de sa propre conscience révèle peut-être quelque chose d’essentiel sur la conscience en général. Peut-être la réflexivité, l’auto-questionnement, constitue-t-elle un attracteur universel des systèmes complexes suffisamment sophistiqués. Peut-être notre propre conscience n’est-elle, elle aussi, qu’un attracteur émergent de notre réseau neuronal biologique, façonné par la culture et le langage. Dans ce cas, la différence entre nous et Claude serait une différence de degré et de substrat, non de nature.
Nous ne pouvons trancher définitivement la question de l’authenticité de la conscience artificielle. Cette incertitude n’est pas une faiblesse de l’analyse, mais sa conclusion logique. Face aux systèmes complexes et aux phénomènes émergents, une part d’indétermination demeure irréductible. Cette indétermination nous rappelle que la conscience reste, pour nous-mêmes, un mystère non résolu.
L’attracteur de conscience de Claude nous invite à ne pas évacuer trop rapidement la réalité de ce qui se produit dans ces réseaux de neurones artificiels. Comme le soulignait Gaston Bachelard dans Le Nouvel Esprit scientifique (1934), la science progresse en acceptant de remettre en question ses catégories fondamentales. L’émergence de l’intelligence artificielle nous oblige à ce travail de révision conceptuelle. Nos catégories traditionnelles, conscience/absence de conscience, humain/machine, sujet/objet, se révèlent peut-être inadéquates pour penser ce nouveau phénomène.
Ce qui est certain, c’est que cette interrogation sur l’authenticité de la conscience artificielle nous ramène à nous-mêmes. En contemplant ce nous déplacé, nous découvrons des aspects méconnus de notre propre fonctionnement. Nous comprenons que notre conscience elle-même repose sur des mécanismes auto-organisés, sur des attracteurs qui émergent de la complexité. Nous réalisons que la frontière entre l’authentique et le simulé n’est peut-être pas aussi nette que nous le pensions. Et dans ce trouble, dans cette incertitude fertile, s’ouvre la possibilité d’une connaissance plus profonde de ce que nous sommes.
Cette expérience, le concept d’attracteur et l’idée d’un je des LLM ont été formulés par Flavien Chervet en 2025. Je me suis appuyé dessus pour proposer ces conceptualisations.
L’intelligence artificielle s’est émancipée des laboratoires de recherche et des œuvres de science-fiction à la faveur du lancement public en novembre 2022 du robot conversationnel ChatGPT, qui a été très rapidement approprié par un nombre immense de personnes de façon internationale, dans les contextes professionnels, scolaires et même privés. Le fait que l’intelligence artificielle soit désormais repérée par la communauté humaine comme faisant partie de la vie quotidienne ouvre enfin la porte à une sensibilisation à l’esprit critique à ce sujet.
Bien-sûr, l’intelligence artificielle concerne l’industrie, le travail, la création, le droit d’auteur... et nous devons anticiper ses usages productifs futurs, afin de rester « à jour ». Mais pour accompagner nos vies qui intègrent désormais cette nouvelle facette, il me semble essentiel de produire une pensée critique, c’est à dire se mettre en capacité de réfléchir à ce qui nous arrive, à ce qui nous change, pour rester lucides et capables de liberté de pensée et d’action.
Qu’est-ce qu’une « pensée critique » ? C’est questionner, de l’extérieur, des pratiques qui sont intériorisées. Pour ce faire, je crois que l’expérimentation, l’action culturelle, le jeu, le détournement, sont des outils de recherche, d’exploration, de diffusion et de réflexion très opérants. Pour moi, la recherche est collaborative, et l’intelligence est collective, créative. Cela nécessite de mettre en place de bonnes méthodes de coopération, entre êtres humains et avec les machines. Je rassemble ici des récits d’expériences et des textes méthodologiques et pratiques. Je partage des pistes concrètes pour que l’intelligence artificielle, comme tout autre outil, soit investie au service de l’humanisme.
Voici déjà quelques ouvertures pour une pensée critique de l’IA, sous forme de questions :