Le Guide des Bonnes Pratiques RAG - version courte
Version 2.0 – Janvier 2026 Ministère de la Transition Écologique

Voici une synthèse structurée et claire des bonnes pratiques pour utiliser le RAG (Retrieval-Augmented Generation) via le PIAG (Portail des IA Génératives), basée sur le document fourni.
1. Le RAG est-il adapté à votre besoin ?
Quand utiliser le RAG ?
- Données "froides" (peu mises à jour) : lois, guides, doctrines, rapports.
- Besoins récurrents : recherche d’informations précises dans des documents volumineux.
- Réponses contextualisées : éviter les réponses génériques d’un LLM classique.
Quand éviter le RAG ?
- Données "chaudes" (mises à jour fréquentes) : veille quotidienne, notes hebdomadaires.
- Corpus trop petits (< 10 documents) : utilisez plutôt le PIAG sans RAG.
- Données sensibles : utilisez exclusivement Mistral (SecNumCloud).
Exemples de cas d’usage adaptés
- Référentiels juridiques (ex. : Code de l’environnement).
- Guides méthodologiques (ex. : évaluation environnementale).
- Bases de connaissances internes (ex. : FAQ RH).
2. Mettre en place une organisation spécifique
Rôles clés
- Pilote : définit les objectifs et le périmètre.
- Expert métier : valide les documents et les mises à jour.
- Responsable corpus : gère la maintenance et la cohérence.
Étapes de constitution d’un corpus
- Sélection : documents officiels, validés, à jour.
- Nettoyage : suppression des doublons, annexes inutiles.
- Structuration :
- Nommage homogène (ex. :
Thématique_Type_Auteur_Date_Version.pdf). - Métadonnées (titre, auteur, date, mots-clés).
- Validation : relecture par les experts métiers.
- Mise à jour : planifier des révisions régulières.
Checklist pour un corpus de qualité
- [ ] Documents stables (peu de mises à jour).
- [ ] Volume suffisant (> 10 documents).
- [ ] Format exploitable (PDF texte, DOCX, pas de scans).
- [ ] Conformité RGPD (pas de données sensibles sauf avec Mistral).
- [ ] Partage clair (droits d’accès définis).
3. Optimiser les corpus
Bonnes pratiques
- Éviter les PDF scannés : utiliser un outil OCR (ex. : ocr.e2.rie.gouv.fr).
- Découper les gros documents : 1 idée = 1 chunk (morceau de texte).
- Glossaire : ajouter un fichier de définitions pour éviter les ambiguïtés.
- Taille max : 25 Mo par fichier, 1 000 documents par corpus.
Gestion des accès
- Partage nominatif : via l’annuaire ministériel (attention à la casse des emails).
- Partage par entité : utiliser l’option "Unité (préfixe)" pour inclure les sous-structures.
4. Rédiger un prompt efficace pour le RAG
Différences avec un prompt classique
| Élément | LLM classique | RAG |
|---|---|---|
| Source | Données d’entraînement (figées) | Corpus externe (documents internes) |
| Contexte | À fournir dans le prompt | Intégré via les chunks du corpus |
| Actualisation | Aucune (sauf accès web) | Continue (via mises à jour du corpus) |
| Traçabilité | Faible | Forte (sources citées) |
Éléments clés d’un prompt RAG
- Contextualiser :
- Préciser le domaine (ex. : "dans le cadre des missions d’une DREAL").
- Définir le format de réponse (tableau, liste, synthèse).
- Cibler les corpus :
- Exemple : "Utilise uniquement le corpus 'Loi sur l’Eau'."
- Exiger les sources :
- "Cite toujours les documents sources (titre + date)."
- Gérer les limites :
- "Si l’information est absente, indique 'Aucune donnée trouvée'."
- Éviter les hallucinations :
- "Ne complète pas avec des connaissances externes."
Exemple de prompt
Tu es un expert en réglementation environnementale.
À partir du corpus "Textes Loi sur l’Eau" :
1. Liste les obligations pour un maître d’ouvrage en zone humide (déclaration).
2. Cite les articles du Code de l’environnement applicables.
3. Présente la réponse en tableau : [Obligation | Article | Source].
Si une information manque, indique "Non trouvé".
5. Évaluer et améliorer les réponses
Méthode de test
- Préparer un jeu de questions : avec réponses attendues (validées par les experts).
- Comparer :
- Réponse du RAG vs réponse experte.
- Vérifier : exhaustivité, précision, sources citées.
- Itérer :
- Ajuster le corpus (supprimer les doublons, ajouter des documents).
- Affiner le prompt (ex. : ajouter un glossaire).
Outils pour corriger les erreurs
- Hallucinations : vérifier les sources citées, ajouter des documents de contexte.
- Réponses trop génériques : préciser le corpus ou la question.
- Format inadapté : reformuler la demande (ex. : "Rédige une note en 3 points").
6. Gouvernance et partage des corpus
Règles de mutualisation
- Éviter les silos : privilégier les corpus partagés (ex. : DAJ pour le juridique).
- Responsabilités :
- Producteur : maintient le corpus à jour.
- Utilisateur : signale les erreurs ou besoins complémentaires.
- Annuaire des corpus : à développer pour faciliter la réutilisation.
Évolutions prévues (2026)
- Améliorations techniques :
- Prise en charge des PDF scannés (OCR intégré).
- Augmentation de la taille des chunks.
- Agents thématiques :
- Assistants préconfigurés pour des cas d’usage spécifiques (ex. : RH, marchés publics).
- Connecteurs :
- Synchronisation automatique avec des sources externes (ex. : lecteurs réseau).
7. Ressources et accompagnement
Où trouver de l’aide ?
- Promptothèque :
- Promptothèque RAG
- Exemples prêts à l’emploi.
- Formations :
- Webinaires DNum (replays disponibles).
- Contact :
drc.uni.dnum.sg@developpement-durable.gouv.fr. - Outils recommandés :
- Fusion de PDF : PDFsam Basic.
- OCR : ocr.e2.rie.gouv.fr.
- voir aussi les outils proposés dans la Promptothèque
Charte et sécurité
- Données sensibles : utiliser Mistral (SecNumCloud).
- RGPD : vérifier les licences (ex. : Licence Ouverte Etalab).
- Charte PIAG : Lien vers la charte.
Résumé des étapes clés
- Valider l’adéquation : Le RAG répond-il à votre besoin ?
- Constituer le corpus : Documents stables, nettoyés, structurés.
- Rédiger le prompt : Précis, ciblé, avec exigence de sources.
- Tester et ajuster : Comparer avec les réponses expertes.
- Partager et maintenir : Mutualiser les corpus, planifier les mises à jour.
Besoin d’aide ?
- Contactez la DNum :
drc.uni.dnum.sg@developpement-durable.gouv.fr. - Consultez le guide complet.
- Rejoignez le canal Tchap #PIAG-Infos ou contactez les conseillers DRC.
Cette version du guide a été générée à l'aide d'une IA.