Optimisation on-page IA — checklist complète
L'optimisation on-page pour l'IA combine techniques SEO classiques (mobile-first, performance, schema.org) et spécificités LLM (structure question/réponse, llms.txt, autorisation bots IA). Voici la checklist exhaustive en 12 points qu'un consultant senior peut auditer en 4-6 heures sur une page stratégique.
Section A — Technique infrastructure
1. robots.txt : GPTBot, ClaudeBot, PerplexityBot, Google-Extended autorisés (pas en Disallow). 2. llms.txt : présent à la racine du domaine, listant les pages clés avec contexte sémantique en Markdown simple. 3. sitemap.xml : à jour, soumis à Google Search Console + Bing Webmaster Tools (Perplexity utilise Bing). 4. SSR ou SSG : contenu présent dans le HTML initial (vérifier avec view-source: ou curl).
Section B — Performance
5. Core Web Vitals : LCP < 2.5s, INP < 200ms, CLS < 0.1. Lighthouse score > 85 sur Performance + Accessibility + SEO + Best Practices. 6. Mobile-first : page mobile n'a pas de contenu manquant vs desktop. 7. Compression et caching : HTTP/2, Brotli ou Gzip, cache-control headers appropriés.
Section C — Structure de contenu
8. H1 question : sous forme de question ou réponse directe. 9. Intro 50-80 mots : résume la réponse complète dès les premiers paragraphes. 10. H2 thématiques : 4-6 H2 distincts, chacun apporte info nouvelle. 11. Listes/tableaux : data structurée pour comparatifs et processus.
Section D — Schema et balisage
12. Schema.org JSON-LD : Article + Organization (sameAs renseigné) + FAQPage (si section FAQ) + HowTo (si tutoriel) + Product/Service (si page produit). Validé par Google Rich Results Test sans warnings.
Scoring
12/12 = optimisation on-page complète. 9-11 = quelques manques mineurs. 7-8 = optimisation partielle, gains rapides accessibles. 5-6 = déficit structurel, plan 30 jours nécessaire. < 5 = page non-prête pour GEO, refonte recommandée.
Cas concret — passage 5/12 à 11/12
Page produit B2B SaaS, audit initial 5/12 (manques : robots.txt bloquant GPTBot, pas de llms.txt, pas de schema FAQ, H1 corporate, pas de tableau comparatif, intro narrative longue, performance 60/100). Plan 30 jours : déblocage robots.txt, création llms.txt, refonte H1, rewrite intro, déploiement schema FAQ, ajout tableau comparatif, optimisation performance. Score final 11/12 à J30. Citation rate cross-LLM : 8 % → 28 % à 4 mois.
Cadence d'audit
Pour les 30 pages stratégiques : audit complet annuel + check rapide trimestriel (vérifier que rien n'a régressé). Pour les nouvelles pages : audit obligatoire avant publication. Pour les anciennes pages avec performance déclinante : audit à la demande, prioriser les pages avec trafic top-20.
Outils pour exécuter l'audit
Lighthouse intégré Chrome (gratuit). Google Rich Results Test (gratuit). Schema.org Validator (gratuit). Screaming Frog (gratuit jusqu'à 500 URL). Pour le check robots.txt et user-agents : OpenAI GPTBot doc. L'audit complet d'une page prend 30-45 minutes pour un consultant senior, 1-2h pour un junior formé.
Pièges à éviter
Premier piège : faire l'audit sans plan d'action priorisé. Audit = inventaire, pas amélioration en soi. Deuxième piège : sur-investir dans les sections D (schema) en négligeant A (technique infra). Sans crawlabilité ni SSR, le schema ne sert à rien. Troisième piège : optimiser une page parfaitement et oublier les liens internes vers elle. Une page top 12/12 sans liens internes est sous-utilisée.