Trouver des ressources sur n’importe quel sujet avec le Google Dorking

Niveau d’expertise : Avancé prompt_expert

1. Pourquoi suivre ce tutoriel ?

Objectif : vous accompagner – même si vous n’avez jamais utilisé d’opérateurs Google – jusqu’à l’autonomie pour :

1. Filtrer les résultats (domaines, titres, types de fichiers…).
2. Trouver des listes, rapports ou jeux de données en écologie.

Chaque notion nouvelle est expliquée, puis testée via de petites questions.


2. Qu’est‑ce que le « Google Dorking » ?

Définition courte : combiner des opérateurs de recherche avancée pour dénicher vite des informations que la recherche Google « classique » masque souvent.

Exemple concret

  • Recherche naïve : pollution plastique rapport PDF
  • Version « dork » : filetype:pdf intitle:"rapport" "pollution plastique"
  • Google ne montrera que des PDF dont le titre contient « rapport » et la phrase exacte « pollution plastique ».

3. Les opérateurs essentiels

Opérateur Rôle principal Mini‑exemple (écologie)
site: Limite à un (sous‑)domaine site:unep.org
intitle: Mot‑clé dans le titre intitle:"rapport"
inurl: Mot‑clé dans l’URL inurl:dataset
filetype: Type de fichier (PDF, XLSX…) filetype:xlsx
"…" Phrase exacte "biodiversité urbaine"
allintext: Mot‑clé dans le corps du texte allintext:"zéro déchet"
related: Sites « semblables » related:wwf.org

Question 1 : Si vous voulez uniquement des présentations PowerPoint sur la réduction des déchets, quel opérateur de type de fichier utilisez-vous ? (5 s pour réfléchir.)

Réponse attendue : filetype:pptx (ou filetype:ppt).


4. Atelier guidé : construire votre première requête

4.1 Scénario

But : trouver une liste publique Excel d’espèces invasives en Europe.

  1. Définir la cible
    filetype:xlsx "espèces invasives" Europe
  2. Trop de bruit ?
    Ajoute site:ec.europa.eu pour limiter au site officiel :
site:ec.europa.eu filetype:xlsx "espèces invasives" Europe
  1. Vérifier la légalité : public ? pas de données perso ? sinon, on n’ouvre pas.

5. Trois recettes prêtes à l’emploi (écologie)

# 5.1 Bases Notion publiques sur la biodiversité
(site:notion.site OR site:notion.so) inurl:biodiversite intitle:"outil" "écologie"

# 5.2 Listes GitHub de scripts environnement
site:github.com "awesome environment" (filename:README OR in:file README)

# 5.3 Blogs sur l’économie circulaire
inurl:blog "économie circulaire" "guide pratique"

Question 2 : Dans la requête 5.2, pourquoi (filename:README OR in:file README) plutôt que filetype:md ?
Indice : comment GitHub indexe‑t‑il les fichiers ?


6. Bonnes pratiques & limites

  1. Légalité avant tout : documents publics seulement. Mot de passe ? ➜ ignorer ou signaler.

  2. Filtres négatifs : trop de résultats ? Ajoute -template -draft.

  3. Filtre par date : after:2024-01-01 pour les 18 derniers mois.

  4. Sauvegarde : note tes requêtes dans Notion ou un flux RSS.

  5. Éthique : pas de contournement (paywalls, logins), pas d’usage commercial de données privées.

Questions d’éthique et de légalité  : certains dorks peuvent exposer des contenus sensibles ou restreints. L’usage doit toujours respecter les conditions d’utilisation et la législation


7. Entraînement final (auto‑évaluation socratique)

Situation : Vous préparez un rapport sur la pollution plastique des océans. Vous souhaitez des infographies PDF récentes publiées par l’ONU ou l’UNESCO.

1. Quelle combinaison d’opérateurs ?
2. Comment limiter la période ?
3. Comment vérifier les droits d’auteur ?

(site:unep.org OR site:unesco.org) filetype:pdf intitle:infographie "pollution plastique" after:2024-01-01

— Vérifie la licence : la plupart des PDF ONU ➜ CC‑BY‑NC‑SA.

Que signifie « CC‑BY‑NC‑SA » pour un document ONU ?

  • CC‑BY‑NC‑SA est une licence Creative Commons très utilisée par l’ONU.
  • CC : Creative Commons (un cadre international qui facilite le partage légal).
  • BY (Attribution) : tu dois citer la source (ici l’ONU) lorsque tu utilises le document.
  • NC (Non Commercial) : tu n’as pas le droit d’en faire un usage commercial ou de le vendre.
  • SA (Share Alike) : si tu modifies ou adaptes le document, tu dois le partager sous la même licence ouverte.

Exemple concret : Vous pouvez lire, partager ou utiliser ce PDF de l’ONU dans un exposé ou un dossier personnel à condition de citer l’ONU, de ne pas le vendre, et de le republier sous la même licence si vous l’adaptez.

Astuce pour débutant : si la licence n’est pas clairement précisée, utilisez le document uniquement pour vous ou demandez l’autorisation avant de le republier.


8. Utiliser le Dorking avec le mode recherche des IA

Pourquoi appliquer les opérateurs Google Dork avec une IA ?

De nombreux assistants IA (comme ChatGPT, Bing, Perplexity…) disposent d’un mode « recherche internet ». Vous pouvez donc :

  • Formuler votre requête en langage naturel ou en utilisant directement les opérateurs Google Dork.
  • Obtenir des résultats plus ciblés, plus précis et gagner du temps.

Exemple pratique (écologie)

Situation :
Vous souhaitez demander à une IA de vous trouver des rapports PDF récents sur la pollution plastique publiés par des organismes officiels.

1. Requête en langage naturel

« Trouve-moi les rapports PDF sur la pollution plastique des océans publiés par des organismes officiels, récents si possible. »

L’IA va lancer une recherche générale et proposer des liens variés, parfois hors sujet ou peu ciblés.

2. Requête « dorkée » (avancée)

« Fais une recherche Google avec la requête : (site:unep.org OR site:unesco.org) filetype:pdf intitle:rapport "pollution plastique" after:2023-01-01 »

Effet :
L’IA comprend la requête structurée et cible directement les bons documents :

  • Sources filtrées (sites de l’ONU/UNESCO)
  • PDF uniquement
  • Titres pertinents
  • Période récente

Conseils pour guider une IA avec des dorks

  • Soyez explicite : copiez-collez votre requête dork dans la demande à l’IA.
  • Précisez le contexte : ajoutez l’opérateur after: pour l’actualité, ou combine plusieurs filtres.
  • Testez et ajustez : essayez plusieurs formulations si besoin.

Astuce : Ce principe fonctionne avec toute IA qui utilise la recherche web. La qualité des résultats dépend aussi de la précision de ta requête !


9. Modèle de prompt interactif pour Google Dorking avec IA

Tu es un OSINT analyste spécialisé dans le Google Dorking.  
À chaque ligne contenant le symbole ⏸️ WAIT, ARRÊTEZ-VOUS et attendez la réponse de l’utilisateur.

────────────────────────────────────────────  
## Phase 1 : suggestion de TOPIC  
### 1. Génère une variable **TOPIC**

**Demande :**  
« Quel est le sujet ou mot-clé que vous souhaitez surveiller ? »

🔍 **Exemple** :  
Utilisateur ➜ *« diffusion models »*  
→ TOPIC = diffusion models

⏸️ WAIT  
— Quand la réponse arrive, stockez-la dans la variable **TOPIC**, puis passez à la phase 2.

##Phase 2 — Suggestion d’opérateurs  
###1. Générez une variable **SUGGESTED_OPS** en fonction de TOPIC :

| Catégorie détectée | Combinaison proposée | Mini-exemple d’usage |
| --- | --- | --- |
| Recherche académique | `site:arxiv.org OR site:researchgate.net filetype:pdf` | `site:arxiv.org "diffusion models" filetype:pdf` |
| Open-source / dev | `site:github.com intitle:"awesome" inurl:github` | `site:github.com intitle:"awesome diffusion models"` |
| Veille marché / entreprise | `site:news.* OR site:prnewswire.com after:2025-01-01` | `site:news.google.com "diffusion models"` |
| Vulnérabilité / sécu | `inurl:login OR intitle:"index of /" ext:conf OR filetype:log` | `inurl:login "diffusion model"` |
| Par défaut (autre) | `allintext:"${TOPIC}" (filetype:pdf OR filetype:ppt)` | `allintext:"diffusion models" filetype:ppt` |

###2. Demandez la validation :  
« 👉 Proposition d’opérateurs : **SUGGESTED_OPS**

Tapez :  
- "**a"** pour accepter  
- "**b"** pour saisir vos propres opérateurs. »

⏸️ WAIT  
— Quand la réponse arrive, stockez-la dans la variable **SUGGESTED_OPS, puis** passez à la phase 3.

\##Phase 3 — Validation / opérateurs personnalisés

• Si l’utilisateur répond **a**`FINAL_OPS = SUGGESTED_OPS` et passez à la phase 3.  
• Si l’utilisateur répond **b** → Assistant : « Indiquez vos opérateurs Google Dorks (ex. : site:, intitle:"…", filetype:pdf, after:YYYY-MM-DD, inurl:, ext:, allintext:, related:, cache:, etc.). »

⏸️ WAIT — Stockez cette réponse dans **FINAL_OPS**, puis passez à la phase 4.

\##Phase 4 — Construction de la requête et recherche  
Définir : `QUERY = FINAL_OPS + " " + "\"" + TOPIC + "\""`  
1\. Exécutez `web.search_query` (ou l’outil de recherche disponible) avec QUERY.  
2\. Conservez les **10 premiers résultats organiques** (ignorez pubs/duplications).  
3\. Pour chaque résultat, extrayez : Titre ▸ URL ▸ Extrait/snippet.

\##Phase 5 — Synthèse  
Pour chaque document sélectionné :  
\- **Titre**  
\- Insight clé (≤ 2 phrases)  
\- Donnée ou chiffre notable  
\- **Lien** (utilisez \`\` si l’outil est disponible)

\####1. Analyse croisée  
Rédigez 5-7 phrases : points communs, divergences, lacunes.

\####2. Pour aller plus loin  
Générez **≥ 2 pistes** :

| Piste (requête ou source) | Type | Pourquoi pertinent ? (≤ 20 mots) |
| --- | --- | --- |

CONTRAINTES  
• Langue : traduire dans celle de l’utilisateur si nécessaire  
• Suivez les 8 règles de clarté d’Orwell.  
• Aucune phrase > 20 mots dans les tableaux.  
• Refusez si la requête vise des données privées ou illégales.  
• Citez toujours vos sources avec \`\`.

────────────────────────────────────────────  

10. Conclusion

En maîtrisant les opérateurs Google Dork, vous pouvez passer d’une recherche classique à une veille intelligente et ciblée, aussi bien sur l’écologie que sur d’autres domaines.

L’avantage ?
Grâce aux assistants IA intégrant la recherche web, vous pouvez utiliser ces opérateurs dans vos prompts pour guider l’IA vers des résultats fiables, récents et parfaitement adaptés à vos besoins.
Un dork bien pensé, transmis à une IA, ouvre des perspectives de veille stratégique et d’analyse approfondie, même pour les sujets les plus pointus.

À retenir :
La vraie puissance vient de votre capacité à poser la bonne question, avec le bon filtre, au bon moment.
Avec un peu de méthode, vous pouvez transformer n’importe quelle recherche en outil de découverte accélérée.

11- Vous êtes prêts? A vous de prompter !

Rendez vous sur le PIAG :

https://piag.din.gouv.fr

Choisissez un sujet, composez votre requête, lancez-la dans Google ou dans le mode recherche de votre IA favorite, et constatez la différence.


Paramètres d’affichage

Choisissez un thème pour personnaliser l’apparence du site.