Comment Perplexity choisit ses sources
L'algorithme de sélection de sources Perplexity n'est pas public, mais l'observation empirique sur 5000+ réponses analysées révèle une logique cohérente en quatre étapes. Comprendre cette logique transforme une stratégie GEO d'intuitive à dirigée — vous savez exactement ce qu'il faut faire pour que votre source soit retenue.
Étape 1 — Query expansion
Le prompt utilisateur est reformulé en 3-5 sous-requêtes web par le LLM Sonar. Exemple : « meilleur asset manager européen ESG » devient « top European asset managers ESG ratings 2026 », « European ESG asset management leaders », « sustainable asset managers Europe AUM ». Implication marque : votre contenu doit ranker sur des variations sémantiques, pas seulement le mot-clé exact.
Étape 2 — Crawl multi-source
Chaque sous-requête est exécutée contre l'index web Perplexity (combinant son propre crawl + partenariats avec moteurs comme Bing). 30-50 résultats sont récupérés. Implication : votre site doit être crawlable par PerplexityBot ET par Bingbot (souvent oublié). Vérifier robots.txt et soumettre votre site à Bing Webmaster Tools.
Étape 3 — Ranking par autorité + pertinence
Les 30-50 résultats sont rerankés selon : autorité de domaine (similar à PageRank, biais Wikipedia/.edu/presse établie), récence pour requêtes time-sensitive, pertinence sémantique (embedding question vs page), structure du contenu (data structurée, listes, headers clairs préférés). Les 5-10 finalistes alimentent le contexte LLM.
Étape 4 — Extraction et synthèse
Les 5-10 meilleures sources sont passées au LLM (Sonar ou Pro) qui rédige la réponse en attachant chaque phrase à 1-3 sources. Une marque mentionnée dans la synthèse aura été extraite depuis au moins une de ces 5-10 sources. Implication : pour apparaître mentionnée, deux portes — être l'une des sources OU être mentionnée dans une source.
Profil source-type qui rank bien
Domaine établi (10+ ans), trafic organique >50k/mois, contenu factuel structuré, mises à jour régulières. Wikipedia coche toutes les cases — d'où sa surreprésentation systématique (32 % des citations cross-LLM). Les sites corporate récents avec contenu narratif et faible trafic organique sont écartés au ranking.
Distribution sources Perplexity B2B FR (Q1 2026)
Wikipedia FR 38 % · L'AGEFI 24 % · Les Échos 19 % · Funds Magazine 12 % · H24 Finance 10 % · reste 8 %. Pour le secteur asset management FR, ces 5 sources couvrent 80 % de l'autorité Perplexity.
Implication pour votre stratégie
Identifier les 5-10 sources les plus citées dans votre secteur est la première action stratégique. Faites-le via votre outil GEO ou en analysant manuellement 50 réponses Perplexity sur prompts secteur. Une fois identifiées, votre stratégie d'autorité tierce devient ciblée : prioriser la présence sur ces 5-10 sources spécifiques plutôt que de disperser l'effort.
Différence avec Google
Google ranke 10 résultats. Perplexity rank 30-50, retient 5-10, en cite 3-5 dans la réponse finale. Cette double réduction explique pourquoi le citation rate Perplexity est plus binaire : vous êtes soit dans le top 5-10 retenu, soit invisibles. Pas de position 8-15 qui rapporte un peu de trafic comme sur Google.