Content pruning : Pourquoi supprimer du contenu peut améliorer votre SEO
Et si la meilleure chose à faire pour votre référencement, c’était de supprimer des pages ? Le content pruning — l’art d’élaguer son site — est une stratégie contre-intuitive mais redoutablement efficace. Le leak de l’API Google de 2024 nous donne désormais les preuves techniques de son fonctionnement.
Pourquoi Google mesure la concentration thématique de votre site
Pendant longtemps, la stratégie SEO dominante était simple : publier plus. Plus de pages, plus de mots-clés, plus de contenu. L’idée semblait logique — chaque nouvelle page est une porte d’entrée potentielle vers votre site.
Le leak de l’API Google Content Warehouse de mai 2024 a révélé que cette approche est non seulement obsolète, mais potentiellement nuisible. La documentation interne expose deux attributs qui changent tout : siteFocusScore et siteRadius.
Le modèle du système solaire
Imaginez votre site comme un système solaire. Votre thématique principale est le soleil. Chaque page est une planète.
| Attribut | Ce qu’il mesure | Analogie |
|---|---|---|
| siteRadius | L’écart thématique d’une page par rapport au sujet central du site | L’orbite d’une planète — plus elle est éloignée du soleil, plus le siteRadius est élevé |
| siteFocusScore | La cohérence thématique globale du site (agrégation de tous les siteRadius) | La compacité du système solaire — un système serré = score élevé |
| site2vec | La représentation vectorielle de l’ensemble du contenu du site | L’identité mathématique de votre site, comparable à une empreinte digitale thématique |
Concrètement, Google convertit l’ensemble du contenu de votre site en un vecteur numérique (via site2vec) qui permet de calculer mathématiquement votre degré de spécialisation. Un site focalisé sur un sujet précis aura un siteFocusScore élevé. Un site dispersé sur des dizaines de thématiques aura un score faible.
Et c’est là que ça devient critique : une page avec un contenu de qualité publiée sur un site à faible siteFocusScore sera moins bien évaluée que la même page sur un site spécialisé. La page hérite du « halo » — positif ou négatif — de son domaine.
Your site is as strong as your weakest content. A few stellar pages don’t compensate for mediocre content.
— Animalz, analyse du leak Google 2024
Ce que le content pruning change réellement
Le content pruning (élagage de contenu) consiste à identifier et supprimer les pages qui nuisent à la performance globale de votre site. Ce n’est pas un nettoyage cosmétique — c’est une intervention chirurgicale sur votre autorité thématique.
En supprimant les pages à haut siteRadius (celles qui s’éloignent de votre sujet principal), vous produisez plusieurs effets mesurables :
- Amélioration du siteFocusScore — votre site devient plus cohérent aux yeux de Google, ce qui renforce l’autorité de toutes vos autres pages
- Optimisation du crawl budget — Google arrête de gaspiller ses ressources sur des pages sans valeur et découvre plus vite vos contenus importants
- Concentration du PageRank interne — le maillage interne redistribue l’autorité vers les pages stratégiques au lieu de la diluer
- Réduction du risque de pandaDemotion — le leak confirme qu’un facteur de demotion Panda persiste dans les CompressedQualitySignals, pénalisant les sites avec une forte proportion de contenu de faible qualité
- Meilleure perception globale de qualité — le score Q* (Quality) de Google est calculé au niveau du domaine, pas de la page
Google lui-même le confirme dans sa documentation publique sur le Helpful Content System :
Having relatively high amounts of unhelpful content might cause other content on the site to perform less well in Search. Removing unhelpful content might contribute to your other pages performing better.
— Google, documentation Helpful Content System
Les preuves : cas concrets de content pruning réussi
CNET : -des centaines de milliers de pages, +29% de trafic
En 2024, le géant tech CNET a pris une décision radicale : supprimer des centaines de milliers de pages de son site. Le résultat ? Une augmentation de 29% du trafic organique. Les analyses montrent que la suppression a permis à Google de concentrer son crawl sur les pages de qualité restantes, améliorant ainsi la performance de l’ensemble du domaine.
SEO Copilot : 600 000 pages supprimées, trafic doublé
Un cas documenté par SEO Copilot en 2025 rapporte qu’une marque a supprimé 600 000 pages de son site. Les résultats : +30% de clics et d’impressions immédiatement, puis un doublement du nombre de mots-clés en top 3 sur les mois suivants. Seule une fraction (environ 1%) des pages originales est restée indexée — et le mois suivant le pruning a été le meilleur mois de l’entreprise en termes de revenus.
Home Science Tools : +64% de revenus après 10% de pruning
L’agence Inflow a documenté le cas de Home Science Tools : après suppression d’environ 200 pages (10% du blog), le site a connu une augmentation de 64% des revenus liés au contenu stratégique. Le keyword footprint a temporairement baissé avant de remonter significativement dans les 90 jours suivants — un pattern classique du content pruning.
Mon expérience : e-commerce bien-être, +71% de CA organique
En 2025, j’ai accompagné un e-commerce spécialisé dans les produits bien-être. Le site proposait des versions anglaises et espagnoles en sous-domaines, générées automatiquement et de qualité médiocre. Leur suppression a rehaussé la perception globale du site et nous a permis de rebondir rapidement après une spam update Google. Résultat sur un an : +71% de chiffre d’affaires généré par le canal organique.
Comment identifier les pages à élaguer
Le content pruning n’est pas un exercice de suppression aveugle. Chaque page doit être évaluée individuellement selon une grille de décision claire.
Les critères d’évaluation
Pour chaque page de votre site, posez-vous ces questions :
| Critère | Supprimer | Conserver / Améliorer |
|---|---|---|
| Trafic organique | 0 clic sur 6 mois | Génère du trafic régulier |
| Backlinks | Aucun lien entrant de qualité | Des domaines référents pertinents pointent vers la page |
| Conversions | Aucune conversion attribuée | Participe au parcours de conversion |
| Alignement thématique | Hors-sujet par rapport au cœur de métier | Dans le cluster thématique principal |
| Qualité du contenu | Thin content, dupliqué ou obsolète | Contenu original, à jour, utile |
| Cannibalisation | Cible le même mot-clé qu’une autre page | Mot-clé unique et distinct |
Les outils nécessaires
- Google Search Console — identifier les pages à zéro clic et impression
- Google Analytics 4 — croiser avec les données de conversion et d’engagement
- Screaming Frog — crawler le site pour repérer le contenu thin, les duplicatas et les pages orphelines
- Ahrefs ou Semrush — évaluer le profil de backlinks de chaque page
Les 3 actions possibles
Pour chaque page identifiée comme problématique, trois options :
- Supprimer et rediriger (301) — pour les pages sans valeur, redirigez vers la page thématiquement la plus proche pour conserver le jus de lien
- Fusionner — combinez plusieurs pages faibles sur le même sujet en un seul contenu complet et authoritative
- Noindexer — pour les pages utiles à la navigation (pages de tags, archives) mais sans valeur SEO, appliquez un noindex pour les retirer de l’index sans les supprimer du site
Attention : ne supprimez pas tout
Le content pruning ne signifie pas supprimer tout le contenu ancien. Les pages evergreen qui génèrent du trafic régulier, celles avec des backlinks de qualité, et celles qui participent au parcours de conversion doivent être conservées — et améliorées si nécessaire. L’objectif est de couper le bois mort, pas d’abattre l’arbre.
Le piège : focus thématique ≠ qualité
Une erreur courante serait de croire qu’un siteFocusScore élevé suffit à bien ranker. La documentation du leak est claire sur ce point : concentration thématique et qualité sont deux évaluations distinctes.
L’exemple du New York Times illustre parfaitement cette distinction. C’est un site généraliste qui couvre des centaines de sujets — son siteFocusScore est donc faible. Pourtant, c’est un des domaines les plus autoritaires du web grâce à son score de qualité (Q*) extrêmement élevé.
À l’inverse, un site ultra-spécialisé sur un sujet niche aura un excellent siteFocusScore. Mais si le contenu est thin, sans backlinks et sans signaux de confiance, Google le considérera quand même comme un site de faible qualité.
Le content pruning est donc un levier parmi d’autres. Il renforce votre autorité topique, mais ne remplace pas la nécessité de produire du contenu de qualité, d’obtenir des backlinks et de satisfaire les utilisateurs (via les signaux NavBoost).
Checklist : votre plan de content pruning en 5 étapes
- Auditer l’intégralité de votre contenu — exportez toutes les URLs indexées via Screaming Frog ou Sitebulb, croisez avec les données GSC et GA4
- Scorer chaque page — attribuez un score basé sur le trafic, les backlinks, les conversions et l’alignement thématique
- Décider pour chaque page — supprimer, fusionner, noindexer ou améliorer
- Implémenter avec des redirections 301 — chaque page supprimée doit pointer vers la page la plus pertinente pour préserver le link equity
- Monitorer les résultats — suivez l’évolution du trafic, des positions et des conversions sur les 3 à 6 mois suivants. Une baisse temporaire est normale avant la remontée
Le content pruning n’est pas un exercice ponctuel. C’est un processus continu — idéalement tous les 6 à 12 mois — qui fait partie intégrante d’une stratégie SEO mature.
Sources
- Hobo Web — Technical SEO 2025 — Analyse des attributs siteFocusScore, siteRadius et site2vec dans le leak Google
- Hobo Web — The Google Content Warehouse API Leak 2024 — Décryptage complet du leak et de ses implications stratégiques
- SEO Copilot — Case Study: 600K pages supprimées, trafic en hausse — Étude de cas documentée avec résultats chiffrés
- SEO.ai — Content Pruning Case Study: CNET — Analyse de l’impact du pruning massif de CNET (+29% de trafic)
- Inflow — Content Pruning Case Study: Home Science Tools — +64% de revenus après suppression de 10% du blog
- Search Engine Land — Content Pruning: Boost SEO by Removing Underperformers — Guide complet sur le pruning et la cannibalisation
- The Search Cure — Content Pruning: KonMari Your Website — Analyse du lien entre pruning et site2vec
- Contentful — Content Pruning: Clear Clutter, Improve Rankings — Framework méthodologique pour le pruning à grande échelle
- iPullRank — Google Algorithm Leak Analysis — Analyse initiale du leak par Michael King
Besoin d’un audit de contenu ?
J’identifie les pages qui plombent votre siteFocusScore et je vous livre une roadmap de pruning priorisée par impact SEO.
Discuter de votre projet