Insight

Pourquoi ChatGPT cite certaines marques et pas d'autres

ChatGPT cite par autorité tierce, fréquence dans le corpus, et structure d'extractabilité — pas par autorité de domaine SEO. Cinq mécanismes expliquent pourquoi votre concurrent moins fort en SEO peut dominer les réponses ChatGPT alors que vous êtes invisible.

ChatGPT cite par autorité, pas par mérite SEO

La logique de sélection ChatGPT diffère structurellement de Google. Google rank par autorité de domaine + pertinence + signal utilisateur. ChatGPT cite par autorité tierce + extractabilité + fréquence dans le corpus. Une marque peut donc dominer Google sur sa requête principale et être totalement absente des réponses ChatGPT sur la même requête. Comprendre pourquoi.

Mécanisme 1 — Le corpus d'entraînement

ChatGPT mode standard répond à partir de son corpus d'entraînement, mis à jour tous les six à douze mois. Ce corpus surreprésente Wikipedia, Common Crawl filtré sur autorité, presse établie, livres, papers académiques. Les sites corporate sont présents mais sous-pondérés. Sur 10 000 réponses ChatGPT analysées en 2025, les marques citées étaient à 76 % mentionnées via une source tierce, seulement 14 % via leur site corporate.

Mécanisme 2 — La fréquence et la cohérence

Une marque mentionnée 50 fois dans des sources différentes du corpus apparaîtra plus probablement qu'une marque mentionnée 5 fois — même si les 5 mentions sont plus qualitatives. La fréquence agit comme un signal d'importance. C'est pourquoi les leaders sectoriels avec couverture presse continue dominent les réponses ChatGPT, alors qu'une PME avec un site exceptionnel mais peu de presse reste invisible.

Mécanisme 3 — Le mode browse / search

ChatGPT Search (lancé fin 2024, intégré à GPT-4o et au-delà) consulte le web temps réel. Sur ce mode, la sélection est moins liée au corpus d'entraînement et plus aux signaux SEO classiques + structure de page + autorité de domaine. Mais les mêmes biais subsistent : les sources tierces autoritaires (Wikipedia, presse) sont préférées aux sites corporate.

Mécanisme 4 — La structure de la page

Lors de l'extraction, ChatGPT préfère les pages structurées (H1 question, intro courte, listes, schema). Une page top-1 Google sans structure peut être ignorée comme source au profit d'une page top-5 mieux structurée. Cette divergence explique les surprises : « pourquoi cette marque mineure est-elle citée et pas nous ? »

Mécanisme 5 — Le contexte de la requête

Sur prompts marque-explicites (« qui est X »), les sites corporate ont leur place naturelle. Sur prompts ouverts (« meilleur acteur catégorie »), ChatGPT favorise les listes recommandations issues de Wikipedia, presse établie ou guides spécialisés. Une marque excellente en SEO branded mais absente des sources tierces apparaît sur le premier type de prompts mais pas le second.

Distribution sources ChatGPT B2B FR (Q1 2026)

Wikipedia 32 % · presse spécialisée 18 % · presse établie 14 % · sites corporate 12 % · académique/.gov 10 % · blogs experts 8 % · Reddit 4 % · autres 2 %.

Comment construire l'autorité tierce

Trois leviers prouvés : (1) Wikipedia — page dédiée si éligible (notoriété encyclopédique prouvée par 3-5 sources tierces) ou mentions stratégiques dans articles connexes. (2) RP éditoriale earned — 1500-3000 €/mois pour 8-15 retombées presse spécialisée par an. (3) Études flagship — une étude data trimestrielle, distribuée largement, génère 30-100 reprises presse + entrée progressive aux corpus LLM.

Ce qui ne marche pas

Le contenu sponsorisé est dévalorisé par les LLM. Le link building bas de gamme n'améliore pas la citation. Les press releases auto-publiés via PRWire et équivalents n'ont quasi aucun impact. Les seuls leviers à ROI mesurable sont : Wikipedia, RP éditoriale earned, contenu propriétaire fort (études, white papers) distribué via canal RP.

Action

Demander un audit de visibilité gratuit

Demander mon étude sectorielle