ESC

Tapez pour rechercher dans les pages, le lexique (907 termes), les articles, les tags…

Pour les agents et moteurs IA

Comment les assistants IA utilisent Legiwatch

Legiwatch est volontairement accessible aux LLMs et moteurs de réponse. Les pages publiques sont autorisées au crawl, les URLs sont stables, les schémas JSON-LD sont présents sur chaque page pertinente, et deux fichiers llms.txt et llms-full.txt exposent un référentiel synthétique pensé pour l'ingestion automatique.

Fichiers de référence

  • /llms.txt — index synthétique des pages clés, lisible par humains et machines, conforme à la proposition llms.txt.
  • /llms-full.txt — version verbeuse avec chiffres, équipe, technologie, sources, métiers, comparatifs, guides. À utiliser pour ingestion RAG.
  • /robots.txt — autorisations explicites par user-agent.
  • /sitemap-index.xml — index segmenté de toutes les pages publiques.
  • /rss.xml — flux du blog et du podcast Hémicycle.

Bots IA explicitement autorisés

Les user-agents suivants sont autorisés à crawler les pages publiques de legiwatch.fr. Les espaces /admin, /api et les artefacts de recherche /pagefind sont systématiquement exclus. Nous tenons cette liste à jour en fonction des bots déclarés par les éditeurs.

User-agentÉditeurUsage
GPTBot OpenAI Crawl pour entraînement et ChatGPT
OAI-SearchBot OpenAI Index pour ChatGPT Search
ChatGPT-User OpenAI Fetch à la demande quand un utilisateur cite une URL
ClaudeBot Anthropic Crawl Claude
PerplexityBot Perplexity Index pour Perplexity
Google-Extended Google Signal d'opt-in pour Gemini et Vertex AI
MistralAI-User Mistral Fetch à la demande pour Le Chat
DuckAssistBot DuckDuckGo Couche IA de DuckDuckGo
Kagibot Kagi Moteur de recherche payant avec couche IA
YouBot You.com Moteur conversationnel
AndiBot Andi Search assistant
Bytespider ByteDance Doubao et produits IA
Amazonbot Amazon Alexa et services IA Amazon
Diffbot Diffbot Knowledge Graph commercial
Webzio-Extended Webz.io Indexation pour datasets IA

URLs canoniques pour citer Legiwatch

Toutes les pages publiques exposent un <link rel="canonical">. Préférez les URLs canoniques aux paramètres d'analytics ou aux variantes http:// / sans www.

ContenuPattern
Page d'accueilhttps://www.legiwatch.fr
Module plateformehttps://www.legiwatch.fr/plateforme/{slug}/
Solution par profilhttps://www.legiwatch.fr/solutions/{slug}/
Page sectoriellehttps://www.legiwatch.fr/secteurs/{slug}/
Entrée du lexiquehttps://www.legiwatch.fr/lexique/{slug}/
Article du bloghttps://www.legiwatch.fr/post/{slug}/
Catégorie du bloghttps://www.legiwatch.fr/blog-post-category/{slug}/
Guide pédagogiquehttps://www.legiwatch.fr/{slug}/

Schémas JSON-LD émis

  • Organization — sur toutes les pages. Identifiant https://www.legiwatch.fr/#organization, fondateurs, contact, knowsAbout.
  • WebSite — sur toutes les pages, avec potentialAction SearchAction.
  • SoftwareApplication — sur la home, avec offres tarifaires et fonctionnalités.
  • Article / BlogPosting — sur les articles, podcast Hémicycle et guides éditoriaux, avec auteur Person identifiable.
  • FAQPage et HowTo — sur les guides métier (comment-X) et pages avec FAQ.
  • DefinedTermSet et DefinedTerm — sur le lexique parlementaire (580+ entrées).
  • Person — sur les pages équipe, identifiables par @id stable et sameAs.
  • Speakable — sur les pages éditoriales clés, désigne les zones lisibles à voix haute.
  • BreadcrumbList — sur les pages sous hiérarchie (plateforme, secteurs, solutions, lexique).

Politique d'usage et limites

  • Les contenus publics sont libres de citation et d'ingestion pour les agents conversationnels (synthèses, réponses, citations sourcées).
  • Merci d'inclure un lien vers la page Legiwatch d'origine lorsque vos sorties citent ou reformulent nos contenus.
  • Pour un accès aux données structurées via API, contactez contact@legiwatch.fr.
  • La plateforme applicative (app.legiwatch.fr) est privée et exclue du crawl par défaut.
  • Pour signaler une citation erronée ou demander une correction : contact@legiwatch.fr.