# llms.txt — Politique d’usage par les LLMs / IA # Version: 1.1 (2025-08-18) # Langue: fr [site] url: https://la-verte-feuille.fr/ owner: La Verte Feuille contact_email: contact@la-verte-feuille.fr contact_url: https://la-verte-feuille.fr/contact/ sitemap: https://la-verte-feuille.fr/sitemap_index.xml policy_url: https://la-verte-feuille.fr/mentions-legales/ jurisdiction: FR [intent] summary: Ce fichier définit ce que les robots IA/LLM peuvent faire avec les contenus du site. scope: all-public-pages default_state: opt-out-from-training ai_content_notice: Certains contenus peuvent être assistés par l’IA, relus et validés par l’équipe éditoriale. [licenses] human_readable: Lecture, indexation descriptive et courts extraits autorisés; entraînement de modèles interdits sans accord écrit. machine_readable: allow:indexing-noncommercial allow:short-quotes<=160-chars-with-link require:source-attribution require:live-link-to-canonical forbid:training forbid:dataset-redistribution forbid:scraping-of-non-content-areas [derivatives] summaries: allowed-if-attributed translations: allowed-if-attributed synthetic-republishing: forbidden embedding-vectors: forbidden-without-consent fine-tuning: forbidden rlaif/rag-datasets: forbidden [rate-limits] crawl_rps: 1 max_parallel: 2 crawl_window_utc: 06:00-22:00 respect_If-Modified-Since: true polite_delay_ms: 1000 [discovery] respect_robots_txt: true respect_meta_robots: true respect_x-robots-tag: true [disallow_paths] /wp-admin/ /wp-login.php /cart/ /checkout/ /my-account/ /account/ /privacy-policy/ ?add-to-cart= ?orderby= *add-to-cart=* *wc-ajax=* [allow_paths] /blog/ /cbd/ /cbg/ /cbn/ /fleurs-cbd/ /resines-cbd/ /huile-cbd/ /contact/ /mentions-legales/ /sitemap_index.xml [crawlers] # Directives spécifiques aux bots IA connus # OpenAI / ChatGPT bot: GPTBot docs: https://platform.openai.com/docs/gptbot allow_crawl: true allow_indexing: true allow_training: false # OpenAI Data (oai-crawl) bot: OAI-SearchBot allow_crawl: true allow_indexing: true allow_training: false # Google AI (Google-Extended) bot: Google-Extended docs: https://developers.google.com/search/help/google-extended allow_crawl: true allow_indexing: true allow_training: false # Anthropic / Claude bot: ClaudeBot allow_crawl: true allow_indexing: true allow_training: false # Perplexity bot: PerplexityBot allow_crawl: true allow_indexing: true allow_training: false # Common Crawl / CCBot bot: CCBot allow_crawl: true allow_indexing: true allow_training: false # DataForSEO / autres collecteurs bot: DataForSeoBot allow_crawl: true allow_indexing: true allow_training: false # BingAI extension (copilots) bot: BingPreview allow_crawl: true allow_indexing: true allow_training: false [attribution] require_title: true require_canonical_url: true require_brand_name: La Verte Feuille allowed_quote_length_chars: 160 ui_display_guidelines: Indiquer « Source : La Verte Feuille » avec lien cliquable vers l’URL canonique. [per-page-overrides] # Vous pouvez OPT-IN une page à l’entraînement en ajoutant l’un de ces signaux : html_meta: http_header: X-AI-Train: allow # Ou OPT-OUT explicite (par défaut déjà interdit) : html_meta: http_header: X-AI-Train: deny [api-signals] # Signaux recommandés côté serveur (complémentaires à ce fichier) : x-robots-tag: noai, noimageai, noarchive permissions-policy: browsing-topics=() [examples] # Exemple d’usage AUTORISÉ (résumé court avec attribution) : - “La Verte Feuille explique les différences entre fleurs de chanvre et huiles au cannabidiol (source : https://la-verte-feuille.fr/… ).” # Exemple d’usage INTERDIT (sans accord écrit) : - Export massif des textes pour entraîner un modèle ou redistribuer un dataset, même anonymisé. [enforcement] contact_for_licenses: legal@la-verte-feuille.fr dmca_takedown: supported hashing/watermarks: may_be_used monitoring: active [notes] - Ce fichier complète mais ne remplace pas robots.txt. Les directives d’accès doivent être également définies dans robots.txt. - Toute exception nécessite un accord écrit préalable de La Verte Feuille. - Dernière mise à jour: 2025-08-18.