Le Guide des Bonnes Pratiques RAG - version courte

Version 2.0 – Janvier 2026 Ministère de la Transition Écologique

illustration_guide_RAG__1_

Voici une synthèse structurée et claire des bonnes pratiques pour utiliser le RAG (Retrieval-Augmented Generation) via le PIAG (Portail des IA Génératives), basée sur le document fourni.


1. Le RAG est-il adapté à votre besoin ?

Quand utiliser le RAG ?

  • Données "froides" (peu mises à jour) : lois, guides, doctrines, rapports.
  • Besoins récurrents : recherche d’informations précises dans des documents volumineux.
  • Réponses contextualisées : éviter les réponses génériques d’un LLM classique.

Quand éviter le RAG ?

  • Données "chaudes" (mises à jour fréquentes) : veille quotidienne, notes hebdomadaires.
  • Corpus trop petits (< 10 documents) : utilisez plutôt le PIAG sans RAG.
  • Données sensibles : utilisez exclusivement Mistral (SecNumCloud).

Exemples de cas d’usage adaptés

  • Référentiels juridiques (ex. : Code de l’environnement).
  • Guides méthodologiques (ex. : évaluation environnementale).
  • Bases de connaissances internes (ex. : FAQ RH).

2. Mettre en place une organisation spécifique

Rôles clés

  • Pilote : définit les objectifs et le périmètre.
  • Expert métier : valide les documents et les mises à jour.
  • Responsable corpus : gère la maintenance et la cohérence.

Étapes de constitution d’un corpus

  1. Sélection : documents officiels, validés, à jour.
  2. Nettoyage : suppression des doublons, annexes inutiles.
  3. Structuration :
  4. Nommage homogène (ex. : Thématique_Type_Auteur_Date_Version.pdf).
  5. Métadonnées (titre, auteur, date, mots-clés).
  6. Validation : relecture par les experts métiers.
  7. Mise à jour : planifier des révisions régulières.

Checklist pour un corpus de qualité

  • [ ] Documents stables (peu de mises à jour).
  • [ ] Volume suffisant (> 10 documents).
  • [ ] Format exploitable (PDF texte, DOCX, pas de scans).
  • [ ] Conformité RGPD (pas de données sensibles sauf avec Mistral).
  • [ ] Partage clair (droits d’accès définis).

3. Optimiser les corpus

Bonnes pratiques

  • Éviter les PDF scannés : utiliser un outil OCR (ex. : ocr.e2.rie.gouv.fr).
  • Découper les gros documents : 1 idée = 1 chunk (morceau de texte).
  • Glossaire : ajouter un fichier de définitions pour éviter les ambiguïtés.
  • Taille max : 25 Mo par fichier, 1 000 documents par corpus.

Gestion des accès

  • Partage nominatif : via l’annuaire ministériel (attention à la casse des emails).
  • Partage par entité : utiliser l’option "Unité (préfixe)" pour inclure les sous-structures.

4. Rédiger un prompt efficace pour le RAG

Différences avec un prompt classique

Élément LLM classique RAG
Source Données d’entraînement (figées) Corpus externe (documents internes)
Contexte À fournir dans le prompt Intégré via les chunks du corpus
Actualisation Aucune (sauf accès web) Continue (via mises à jour du corpus)
Traçabilité Faible Forte (sources citées)

Éléments clés d’un prompt RAG

  1. Contextualiser :
  2. Préciser le domaine (ex. : "dans le cadre des missions d’une DREAL").
  3. Définir le format de réponse (tableau, liste, synthèse).
  4. Cibler les corpus :
  5. Exemple : "Utilise uniquement le corpus 'Loi sur l’Eau'."
  6. Exiger les sources :
  7. "Cite toujours les documents sources (titre + date)."
  8. Gérer les limites :
  9. "Si l’information est absente, indique 'Aucune donnée trouvée'."
  10. Éviter les hallucinations :
  11. "Ne complète pas avec des connaissances externes."

Exemple de prompt

Tu es un expert en réglementation environnementale.
À partir du corpus "Textes Loi sur l’Eau" :
1. Liste les obligations pour un maître d’ouvrage en zone humide (déclaration).
2. Cite les articles du Code de l’environnement applicables.
3. Présente la réponse en tableau : [Obligation | Article | Source].
Si une information manque, indique "Non trouvé".

5. Évaluer et améliorer les réponses

Méthode de test

  1. Préparer un jeu de questions : avec réponses attendues (validées par les experts).
  2. Comparer :
  3. Réponse du RAG vs réponse experte.
  4. Vérifier : exhaustivité, précision, sources citées.
  5. Itérer :
  6. Ajuster le corpus (supprimer les doublons, ajouter des documents).
  7. Affiner le prompt (ex. : ajouter un glossaire).

Outils pour corriger les erreurs

  • Hallucinations : vérifier les sources citées, ajouter des documents de contexte.
  • Réponses trop génériques : préciser le corpus ou la question.
  • Format inadapté : reformuler la demande (ex. : "Rédige une note en 3 points").

6. Gouvernance et partage des corpus

Règles de mutualisation

  • Éviter les silos : privilégier les corpus partagés (ex. : DAJ pour le juridique).
  • Responsabilités :
  • Producteur : maintient le corpus à jour.
  • Utilisateur : signale les erreurs ou besoins complémentaires.
  • Annuaire des corpus : à développer pour faciliter la réutilisation.

Évolutions prévues (2026)

  • Améliorations techniques :
  • Prise en charge des PDF scannés (OCR intégré).
  • Augmentation de la taille des chunks.
  • Agents thématiques :
  • Assistants préconfigurés pour des cas d’usage spécifiques (ex. : RH, marchés publics).
  • Connecteurs :
  • Synchronisation automatique avec des sources externes (ex. : lecteurs réseau).

7. Ressources et accompagnement

Où trouver de l’aide ?

Charte et sécurité

  • Données sensibles : utiliser Mistral (SecNumCloud).
  • RGPD : vérifier les licences (ex. : Licence Ouverte Etalab).
  • Charte PIAG : Lien vers la charte.

Résumé des étapes clés

  1. Valider l’adéquation : Le RAG répond-il à votre besoin ?
  2. Constituer le corpus : Documents stables, nettoyés, structurés.
  3. Rédiger le prompt : Précis, ciblé, avec exigence de sources.
  4. Tester et ajuster : Comparer avec les réponses expertes.
  5. Partager et maintenir : Mutualiser les corpus, planifier les mises à jour.

Besoin d’aide ?

  • Contactez la DNum : drc.uni.dnum.sg@developpement-durable.gouv.fr.
  • Consultez le guide complet.
  • Rejoignez le canal Tchap #PIAG-Infos ou contactez les conseillers DRC.

Cette version du guide a été générée à l'aide d'une IA.


Paramètres d’affichage

Choisissez un thème pour personnaliser l’apparence du site.