Le RAG, ou comment donner à une IA la puissance d’un outil métier

23 juin 2026. Publié par Benoît Labourdette.

10 min

Un RAG, c’est ce qui permet à une intelligence artificielle de devenir un outil métier, spécifique et pertinent par rapport à notre travail. Le mot est technique, le principe ne l’est pas, et Laurent Alexandre déclarait récemment qu’un chef d’entreprise qui ignore ce que c’est devrait être remplacé. La provocation est excessive, mais elle touche à ce que j’appelle l’usage professionnel des intelligences artificielles. Comprendre le RAG, c’est comprendre comment on ajoute la puissance d’une IA à nos outils de travail, depuis la simple discussion dans un chatbot jusqu’à des outils métiers en partie automatisés.

Une IA pertinente en général, mais à côté de notre situation

Pendant longtemps, on a dit qu’une IA répondait par des statistiques, qu’elle restituait ce qui ressortait en moyenne de tout ce qu’elle avait lu. Ce n’est plus du tout vrai, du moins si on le décide. On peut en rester là, à un usage de surface, mais on peut aujourd’hui aller beaucoup plus loin. Les modèles récents raisonnent, même quand on leur demande peu de chose. Ils produisent une réflexion, ils articulent, et leur réponse peut être pertinente.

Le problème est ailleurs. Ce raisonnement ne s’appuie pas sur nos données. Quand la question porte sur un métier, l’IA peut avoir beaucoup à dire, parce qu’elle a lu énormément sur les métiers et qu’elle en connaît les contours généraux. Mais quand la question porte sur notre organisation, sur notre dossier en cours, sur la procédure interne d’une équipe précise, elle ne dispose d’aucune des informations qui rendraient sa réponse adaptée. Elle ne connaît ni notre convention collective, ni l’historique d’un client, ni la dernière version d’un règlement, et sa réponse, faute de cet ancrage, reste en surface.

Donner ses données à une IA pose aussitôt la question de leur sécurité et de leur confidentialité. Une organisation ne peut pas verser ses informations sensibles dans n’importe quel outil sans savoir où elles sont traitées, qui peut y accéder, et ce qu’il en reste après. C’est pour cette raison que le sujet n’est pas simple, et qu’il demande un vrai travail. Mais c’est aussi à cette condition que l’IA apporte une puissance métier réelle. Il y a là une tension qu’il vaut mieux poser d’emblée. On ne tire de l’IA une utilité spécifique qu’en lui confiant ses données, et le faire suppose de s’en être donné les moyens sérieusement. Le RAG est précisément ce qui permet de tenir les deux bouts, parce qu’il garde la base sous le contrôle de l’organisation.

Une IA ne devient utile sur notre situation que si on la nourrit de cette situation. Le RAG est la façon technique d’automatiser ce nourrissage à l’échelle de tous nos documents.

La récupération, puis la génération

RAG est l’abréviation de Retrieval Augmented Generation, qu’on peut traduire par génération augmentée par récupération. Le dispositif relie un modèle de langage à une base documentaire qu’on lui constitue, et il fonctionne en deux temps.

La récupération. Quand une question arrive, le système ne la transmet pas directement au modèle. Il cherche d’abord, dans la base, les passages qui ont un rapport avec la question. Cette recherche se fait par proximité de sens, ce qui permet de retrouver un passage pertinent même s’il n’emploie pas les mêmes mots que la question.
La génération. Les passages retrouvés sont glissés dans le contexte du modèle, juste avant qu’il formule sa réponse. Le modèle répond alors en s’appuyant sur ces documents, ceux de notre organisation, à jour, plutôt que sur ses connaissances générales. La réponse reste dans le périmètre de ce qu’on lui a fourni, et on peut remonter aux sources qui l’ont produite.

Cette technique se distingue d’une autre, qu’on confond souvent avec elle. Entraîner ou réentraîner un modèle sur ses données, ce qu’on appelle le fine-tuning, c’est modifier le modèle lui-même, opération lourde, coûteuse, qu’il faut recommencer dès que les données changent. Le RAG ne touche pas au modèle. Il laisse le modèle intact et lui donne accès à une base qu’on met à jour quand on veut, en ajoutant ou en retirant des documents. Plus légère, plus souple, gardant la donnée sous le contrôle de l’organisation, c’est cette approche qui s’est imposée dans les entreprises pour mettre l’IA au service de leurs données internes.

Du chatbot à l’outil métier

On rencontre d’abord le RAG sous une forme simple, celle d’un assistant à qui on a donné quelques documents en pièce jointe dans une conversation, et qu’on interroge en discutant. Mais sa portée va beaucoup plus loin. Le RAG peut être mobilisé de façon automatique, à l’intérieur d’un système de gestion de bases de données et d’un outil métier dont de grandes parties sont automatisées.

Je le mesure à une expérience que j’ai vécue il y a plus de vingt ans, sans IA. Je dirigeais le festival Pocket Films au Forum des images, et j’avais construit avec FileMaker Pro un outil métier qui gérait l’ensemble du festival. Je ne fais pas de publicité pour FileMaker Pro, mais c’est un système qui permet de créer très rapidement des outils métiers complets, et qui est utilisé dans de très grandes entreprises depuis quarante ans. Celui que j’avais construit a évolué pendant les six ans du festival, au fur et à mesure des besoins de mon équipe. Il gérait d’abord les personnes à qui on prêtait des téléphones, puis les téléphones prêtés, puis les films réalisés, puis leur mise en ligne sur un réseau local avant même l’existence de YouTube, où chacun·e pouvait cliquer sur un film et donner son avis, avec des statistiques qui m’aidaient à faire mes choix. Il prenait ensuite en charge la préparation des séances, la grille de programme, l’écriture des textes du catalogue, la gestion des invité·es et des hôtels, et enfin ce qu’on appelait le rayonnement, c’est-à-dire toutes les projections ailleurs. Tout tenait dans un même outil, qui grandissait chaque année.

Chaque semaine, je demandais à mes équipes de quelle fonction magique elles auraient eu besoin pour gagner du temps et de l’efficacité, et j’ajoutais à l’outil ce que je pouvais. Diriger le festival, c’était aussi cela, être à l’écoute de ce qui venait d’elles, de leurs besoins concrets, et les aider dans leur travail plutôt que de décider à leur place. C’est une posture, autant qu’une technique.

Aujourd’hui, dans un système de ce genre, on peut construire un RAG au fil de l’eau, et y déposer les données de contexte pertinentes à mesure qu’elles apparaissent. En reprenant le même exemple, le contenu structuré de la base, les résumés de films, les documents sur les personnes, les biographies des réalisateur·rices, les articles écrits sur le festival, viendrait alimenter le RAG. Et l’outil pourrait alors, pour une demande de séance de rayonnement reçue par courriel, analyser cette demande et préparer tout seul une proposition de programme adaptée. On peut même imaginer qu’il relève directement les courriels, qu’il les traite, et qu’il prépare la proposition sans qu’on ait rien demandé, avant qu’un humain ne valide. Les propositions gagnent en pertinence, le nombre de partenariats possibles augmente, et le rayonnement du festival s’en trouve renforcé. Si les réponses manquent parfois de profondeur, on enrichit nous-mêmes le RAG, avec des articles sur l’histoire du cinéma, ou les livres de Gilles Deleuze, et les réponses s’en trouvent informées.

Je sais que c’est grâce à cet outil que nous avons pu recevoir énormément de films et construire des programmations exigeantes à partir d’objets audiovisuels expérimentaux, parfois improbables. En automatisant les tâches mécaniques, il nous laissait travailler sur le fond, sur le sens de ces films dans l’histoire du cinéma. C’est de là que le festival a tiré sa qualité et son impact. Et la clé n’est pas seulement l’existence de l’outil, c’est qu’il a évolué au fil des besoins. Entre sa première version en 2005, à la création du festival, et sa dernière, il avait gagné en fonctions, en simplicité, en commodité d’usage. Il s’était formé en même temps que notre manière de travailler.

C’est là que la formule de Laurent Alexandre montre sa limite. Réduire l’enjeu à l’efficacité d’un·e dirigeant·e qui saurait ou ne saurait pas, c’est rester en deçà. Ce qui compte, c’est l’outil métier, et le RAG est ce qui permet à une IA d’en devenir le cœur. C’est l’histoire de l’outil dans l’aventure humaine, à ceci près qu’ici l’outil est numérique. On mesure mal, je crois, à quel point un outil compte. On va trop vite, on voudrait qu’il marche tout de suite pour nous, alors que c’est l’attention qu’on lui porte qui finit par changer notre manière de travailler. Il n’y a pas, pour cette raison, d’opposition entre les outils, même ceux de l’intelligence artificielle, et notre humanité. Un outil reste un outil, et c’est l’usage qu’on en fait qui lui donne sa valeur.

Pour qui dirige une structure

C’est pour qui dirige une structure que l’enjeu est le plus grand, et c’est même par là qu’il faut commencer. Une organisation qui veut tirer parti de l’IA sur ses propres données découvre vite que la qualité du résultat ne dépend pas du modèle qu’elle choisit, mais de la qualité de la base qu’elle lui donne. Une base mal rangée, avec des documents redondants, périmés, sans structure, produit des réponses médiocres, quel que soit l’outil. C’est l’angle mort de beaucoup de projets d’IA en entreprise, où l’on installe la solution avant d’avoir organisé la donnée, et où l’on s’étonne ensuite des résultats.

Ce constat fait apparaître des métiers nouveaux, et il appelle de vraies compétences professionnelles. Deux familles s’y mêlent, qu’on confond trop souvent. Les premières sont purement techniques au sens informatique, la gestion des bases de données, l’administration des services cloud, la sécurité, le pilotage des coûts. Les autres relèvent d’une expertise sur le sujet métier lui-même, qui consiste à savoir quels documents comptent, à les mettre en forme pour qu’une machine puisse s’y retrouver, à choisir ce qui entre dans un RAG, à vérifier que la récupération remonte bien ce qu’il faut, à maintenir la base à jour. Cette expertise-là n’est pas technique au sens informatique, elle est technique au sens du métier. C’est exactement ce que j’avais fait pour le festival Pocket Films, sans être informaticien·ne, en connaissant mon sujet et en sachant comment l’organiser. Un·e dirigeant·e peut être cette personne-là, celle qui tient l’expertise du métier et la met en forme, à condition de ne pas considérer ce travail comme indigne de soi.

La compétence la plus recherchée en 2026, dans les organisations qui déploient sérieusement l’IA, n’est d’ailleurs pas la maîtrise des modèles, mais celle des données et des infrastructures qui les font tourner. Ce socle permet à une IA de fonctionner à l’échelle d’une organisation, et c’est lui qui manque le plus aujourd’hui. Un·e dirigeant·e n’a pas à savoir construire un RAG, pas plus qu’il ne faut savoir configurer un serveur. Ce qu’il faut comprendre, c’est que le travail de structuration de la donnée conditionne tout le reste, qu’il prend du temps, qu’il reste invisible, et qu’il ne se délègue pas entièrement à un prestataire. La personne qui décide sans savoir cela achète une solution sans avoir préparé le terrain qui la rendrait utile.

Pour qui veut rester employable

À l’échelle d’une personne, le même mécanisme ouvre une voie accessible, à condition de développer ses propres capacités de documentation et ses méthodes. Comprendre le RAG, c’est saisir pourquoi un document bien titré, écrit dans un format lisible par une machine comme le Markdown, rangé dans un dossier cohérent, vaut bien plus qu’un document riche mais informe. C’est comprendre pourquoi la personne qui organise la base interne d’une équipe occupe une position plus stratégique qu’il n’y paraît. Structurer les documents, d’ailleurs, c’est aussi savoir se faire aider par l’IA pour les structurer, pour qu’ils soient utiles et qu’ils s’indexent au mieux. Se constituer un ensemble structuré de notes et de documents, ce qu’on appelle parfois un deuxième cerveau, c’est déjà préparer la matière d’un RAG personnel.

On pourrait objecter que l’IA est intelligente, qu’elle apprend tout, et qu’il est donc inutile de tant ranger en amont. C’est en partie vrai, mais tout apprendre à chaque fois consomme énormément de ressources. Quand on lui donne des données déjà bien structurées, quand on a organisé sa pensée avant elle, on la fait monter à un niveau de compétence supérieur tout en consommant beaucoup moins d’énergie à chaque requête. Le soin qu’on met à organiser ses documents n’est pas une corvée préalable, c’est ce qui rend l’outil à la fois meilleur et plus sobre.

La même curiosité conduit vite à la question de l’outil métier. Avec un système comme FileMaker Pro, on crée des outils métiers d’une grande richesse, qu’on fait évoluer soi-même au rythme de ses besoins. Avec un gestionnaire de notes comme Obsidian, on construit une base personnelle structurée qu’on peut, à l’aide des bons modules, transformer en RAG. La compétence n’est pas de programmer le dispositif, elle est de comprendre ce qu’il fait, pour lui fournir ce dont il a besoin, et de prendre au sérieux ses propres outils.

Mettre en place un RAG sans être technicien

On peut commencer dès maintenant, sans écrire une ligne de code. Les principaux outils grand public proposent déjà un RAG, sous forme de petits espaces dédiés. Dans ChatGPT, ce sont les GPT personnalisés et les Projects. Dans Gemini, ce sont les Gems. Dans Claude, ce sont les Projets, où l’on dépose des fichiers dans la base de connaissance et où le RAG s’active de lui-même dès que cette base devient trop volumineuse pour tenir d’un seul tenant. Dans tous les cas, le principe est le même, on crée un espace, on y dépose des documents, et l’outil les découpe, les indexe, et va y chercher les passages utiles à chaque question. C’est un RAG, sous une forme allégée, une sorte de mini RAG individuel.

Cette manière de faire vaut mieux qu’une habitude répandue, qui consiste à tout charger dans une conversation et à continuer à discuter. Une conversation a une mémoire limitée. Quand elle s’allonge, elle finit par dépasser ce que l’outil peut stocker dans sa mémoire de travail, et il se met alors à la compacter, c’est-à-dire à résumer les échanges anciens pour faire de la place. Au fil de ce résumé, du détail se perd. Les documents qu’on avait collés au début deviennent flous, puis disparaissent. Un RAG ne fonctionne pas ainsi. La base reste disponible en permanence, elle ne se résume pas, on peut la modifier, et l’outil y revient à chaque question, dans le même état. C’est ce qui en fait une mémoire stable, là où la conversation est une mémoire qui s’use.

Un cas intéressant est celui de Claude Cowork, qui travaille sur un dossier de l’ordinateur. Cowork indexe ce dossier, sépare le stockage du raisonnement, et consulte cet index plutôt que de tout charger en mémoire, ce qui le rapproche d’un RAG. La différence avec un Projet est qu’il dépose lui-même sur le disque ce qu’il produit, et réindexe au fur et à mesure, si bien que sa base s’enrichit sans la limite d’une conversation. C’est un agent qui nourrit son propre RAG en travaillant.

Passer de l’usage individuel à l’organisation

Un Projet ou un Cowork, c’est un usage individuel, lié à un compte. Dès qu’on entre dans une organisation, la question change de nature. On ne peut plus penser ces outils chacun dans son coin, il faut les penser collectivement, ce qui suppose de se professionnaliser. La bonne question devient celle d’un RAG partagé, branché, auquel chacun·e accède en discutant avec l’IA.

C’est possible, et on peut rester dans Claude. Sur les offres Team et Enterprise, un Projet peut être partagé avec toute l’organisation, et son RAG s’active automatiquement quand la base grandit. Un·e administrateur·rice dépose les documents de référence, rend le projet accessible à l’équipe, et chaque personne qui pose une question interroge la même base. C’est la voie la plus simple, sans infrastructure à monter.

Pour aller plus loin, quand les sources changent sans cesse, courriels, espaces partagés, outils métiers, on les branche par des connecteurs, selon le standard ouvert appelé MCP. Claude interroge alors un ensemble de sources internes choisies par l’organisation, et l’administrateur·rice décide ce qui est exposé et à qui. On garde la maîtrise du périmètre et des accès. Et pour un très gros volume de documents, ou une exigence de souveraineté sur l’hébergement des données, on monte une base documentaire dédiée, reliée à l’IA, que l’on peut héberger sur ses propres serveurs. C’est le cas le plus exigeant, mais il n’est nécessaire que pour les organisations qui ont des besoins de cette échelle.

Le chemin tient donc en une progression. On commence par un espace individuel pour comprendre, on passe à un projet partagé pour une équipe, on branche des connecteurs quand les sources sont vivantes, et l’on ne construit une infrastructure dédiée que si l’échelle ou la confidentialité l’imposent. D’une étape à l’autre, le facteur décisif ne change pas. C’est le soin apporté aux documents qu’on donne à la machine qui fait la qualité de ce qu’elle nous rend.

Forger ses outils, un choix plus ancien que l’IA

La méthode que j’ai employée pour Pocket Films n’a rien d’inédit. Beaucoup de gens travaillent ainsi, et c’est même le cœur de métier d’une grande société comme Salesforce. On appelle ces systèmes des CRM, il existe des outils de gestion de festivals, et des outils métiers pour presque chaque secteur. Utiliser un outil métier est donc courant. Ce qui l’est moins, c’est de construire le sien, ou de le faire évoluer soi-même pour l’adapter au plus près de sa pratique. Les personnes qui prennent cette peine gagnent une efficacité bien plus grande, et surtout spécifique. Elles peuvent creuser leur singularité, approfondir ce qui les distingue, et se différencier par là même.

Et cela n’a rien à voir, au départ, avec l’intelligence artificielle ni avec les RAG. Choisir de forger ses propres outils avec le numérique, ou s’en remettre à des outils tout faits, est une façon d’envisager le travail bien antérieure à l’IA. Le RAG ne fait que prolonger ce choix, en ajoutant à ces outils la puissance d’une IA. Celles et ceux qui avaient déjà la culture de l’outil construit sur mesure y trouveront un terrain familier. Pour les autres, c’est une bonne occasion de découvrir ce que change le fait de prendre ses outils au sérieux.

Une photographie de juin 2026

J’écris tout cela en juin 2026, et ces choses vont évoluer vite. Les noms des produits, les fonctions, les manières de faire que je décris seront sans doute dépassés dans quelques mois. Cet article pourrait devenir caduc assez vite, et je le souhaite, parce que cela voudra dire que ces usages se sont répandus et que les outils se sont simplifiés. Ce qui ne vieillira pas, c’est le principe qui est dessous. Une IA devient utile à notre travail quand on lui donne, avec soin, la matière de notre travail.