# llms.txt — Politique d’usage par les LLMs / IA
# Version: 1.1 (2025-08-18)
# Langue: fr
[site]
url: https://la-verte-feuille.fr/
owner: La Verte Feuille
contact_email: contact@la-verte-feuille.fr
contact_url: https://la-verte-feuille.fr/contact/
sitemap: https://la-verte-feuille.fr/sitemap_index.xml
policy_url: https://la-verte-feuille.fr/mentions-legales/
jurisdiction: FR
[intent]
summary: Ce fichier définit ce que les robots IA/LLM peuvent faire avec les contenus du site.
scope: all-public-pages
default_state: opt-out-from-training
ai_content_notice: Certains contenus peuvent être assistés par l’IA, relus et validés par l’équipe éditoriale.
[licenses]
human_readable: Lecture, indexation descriptive et courts extraits autorisés; entraînement de modèles interdits sans accord écrit.
machine_readable:
allow:indexing-noncommercial
allow:short-quotes<=160-chars-with-link
require:source-attribution
require:live-link-to-canonical
forbid:training
forbid:dataset-redistribution
forbid:scraping-of-non-content-areas
[derivatives]
summaries: allowed-if-attributed
translations: allowed-if-attributed
synthetic-republishing: forbidden
embedding-vectors: forbidden-without-consent
fine-tuning: forbidden
rlaif/rag-datasets: forbidden
[rate-limits]
crawl_rps: 1
max_parallel: 2
crawl_window_utc: 06:00-22:00
respect_If-Modified-Since: true
polite_delay_ms: 1000
[discovery]
respect_robots_txt: true
respect_meta_robots: true
respect_x-robots-tag: true
[disallow_paths]
/wp-admin/
/wp-login.php
/cart/
/checkout/
/my-account/
/account/
/privacy-policy/
?add-to-cart=
?orderby=
*add-to-cart=*
*wc-ajax=*
[allow_paths]
/blog/
/cbd/
/cbg/
/cbn/
/fleurs-cbd/
/resines-cbd/
/huile-cbd/
/contact/
/mentions-legales/
/sitemap_index.xml
[crawlers] # Directives spécifiques aux bots IA connus
# OpenAI / ChatGPT
bot: GPTBot
docs: https://platform.openai.com/docs/gptbot
allow_crawl: true
allow_indexing: true
allow_training: false
# OpenAI Data (oai-crawl)
bot: OAI-SearchBot
allow_crawl: true
allow_indexing: true
allow_training: false
# Google AI (Google-Extended)
bot: Google-Extended
docs: https://developers.google.com/search/help/google-extended
allow_crawl: true
allow_indexing: true
allow_training: false
# Anthropic / Claude
bot: ClaudeBot
allow_crawl: true
allow_indexing: true
allow_training: false
# Perplexity
bot: PerplexityBot
allow_crawl: true
allow_indexing: true
allow_training: false
# Common Crawl / CCBot
bot: CCBot
allow_crawl: true
allow_indexing: true
allow_training: false
# DataForSEO / autres collecteurs
bot: DataForSeoBot
allow_crawl: true
allow_indexing: true
allow_training: false
# BingAI extension (copilots)
bot: BingPreview
allow_crawl: true
allow_indexing: true
allow_training: false
[attribution]
require_title: true
require_canonical_url: true
require_brand_name: La Verte Feuille
allowed_quote_length_chars: 160
ui_display_guidelines: Indiquer « Source : La Verte Feuille » avec lien cliquable vers l’URL canonique.
[per-page-overrides]
# Vous pouvez OPT-IN une page à l’entraînement en ajoutant l’un de ces signaux :
html_meta:
http_header: X-AI-Train: allow
# Ou OPT-OUT explicite (par défaut déjà interdit) :
html_meta:
http_header: X-AI-Train: deny
[api-signals]
# Signaux recommandés côté serveur (complémentaires à ce fichier) :
x-robots-tag: noai, noimageai, noarchive
permissions-policy: browsing-topics=()
[examples]
# Exemple d’usage AUTORISÉ (résumé court avec attribution) :
- “La Verte Feuille explique les différences entre fleurs de chanvre et huiles au cannabidiol (source : https://la-verte-feuille.fr/… ).”
# Exemple d’usage INTERDIT (sans accord écrit) :
- Export massif des textes pour entraîner un modèle ou redistribuer un dataset, même anonymisé.
[enforcement]
contact_for_licenses: legal@la-verte-feuille.fr
dmca_takedown: supported
hashing/watermarks: may_be_used
monitoring: active
[notes]
- Ce fichier complète mais ne remplace pas robots.txt. Les directives d’accès doivent être également définies dans robots.txt.
- Toute exception nécessite un accord écrit préalable de La Verte Feuille.
- Dernière mise à jour: 2025-08-18.