Réparez votre Index - Astuce SEO pour les Pages Explorées mais Non Indexées

Try Proseoai — it's free
AI SEO Assistant
SEO Link Building
SEO Writing

Réparez votre Index - Astuce SEO pour les Pages Explorées mais Non Indexées

Table of Contents:

  1. Introduction 🌟
  2. Understanding Crawled But Not Indexed Pages
  3. Exporting and Filtering Data
  4. Checking Internal Links
  5. Analyzing Content Length
  6. Reviewing GSC Clicks and Impressions
  7. Filtering URLs with HTTP 200 Status
  8. Removing Feed URLs
  9. Identifying Anomalies and Orphaned Pages
  10. Taking Action for Indexed Pages
  11. Conclusion 🌟

1. Introduction 🌟

Bonjour à tous ! Je m'appelle Daniel Foley Carter, de SEO-audits.io, et aujourd'hui je vais vous montrer un petit truc très astucieux pour mieux comprendre les pages actuellement non indexées et découvertes mais non indexées. Si vous ne le savez pas, le fait d'avoir du contenu qui est exploré mais non indexé est généralement un indicateur que ce contenu n'a pas de valeur. En général, lorsque Google explore certaines pages de votre site, telles que les pages de service, les pages de produits, les articles ou les URL malformées ou basées sur des paramètres, il peut interpréter le contenu de la première passe d'exploration comme n'ayant pas de valeur ou peu susceptible d'être servi, et le place alors dans la catégorie "crawled but not indexed" ou "discovered but not indexed", en fonction de la manière dont Google a découvert ce contenu.

2. Understanding Crawled But Not Indexed Pages

Les pages "crawled but not indexed" sont des pages de votre site qui ont été explorées par Google, mais qui ne sont pas encore incluses dans l'index de recherche. Cela peut être dû à diverses raisons telles que du contenu dupliqué, des erreurs de formatage des URL, des pages de faible qualité, ou des erreurs lors de la génération du contenu.

Lorsque vous rencontrez des pages "crawled but not indexed", il est important de comprendre qu'elles manquent de valeur aux yeux de Google, et qu'il est nécessaire de prendre des mesures appropriées pour résoudre ce problème.

3. Exporting and Filtering Data

Pour mieux comprendre les pages "crawled but not indexed", nous allons utiliser une méthode simple mais efficace pour exporter et filtrer les données. Voici les étapes à suivre :

  • Tout d'abord, exportez les données des pages "crawled but not indexed" depuis votre outil d'exploration de site vers une feuille Google.
  • Ensuite, utilisez un outil de crawl pour obtenir un crawl complet de votre site.
  • Copiez les données du crawl dans une autre feuille Google.

Maintenant que vous avez toutes les données nécessaires, vous pouvez passer à l'étape suivante de filtrage.

4. Checking Internal Links

L'un des facteurs importants à prendre en compte lors de l'analyse des pages "crawled but not indexed" est de vérifier si elles ont des liens internes. Les liens internes sont un signal important pour Google quant à la valeur et à la pertinence d'une page.

Utilisez la fonction VLOOKUP pour vérifier si une page donnée a des liens internes dans le crawl de votre site. Si une page n'a pas de liens internes, il est fort probable que Google la considère comme n'ayant pas de valeur et qu'elle ne sera pas indexée.

5. Analyzing Content Length

Outre les liens internes, il est également essentiel de vérifier la longueur du contenu des pages "crawled but not indexed". Si une page n'a pas de contenu textuel ou si son contenu est trop court, Google peut considérer qu'elle n'apporte pas de valeur aux utilisateurs et la laisser non indexée.

Utilisez à nouveau la fonction VLOOKUP pour vérifier si les pages ont un contenu textuel suffisant. Si une page n'a pas de contenu ou si son contenu est insuffisant, vous devrez peut-être y ajouter plus de texte pertinent pour augmenter ses chances d'être indexée.

6. Reviewing GSC Clicks and Impressions

Un autre aspect à prendre en compte lors de l'analyse des pages "crawled but not indexed" est d'examiner les clics et les impressions dans Google Search Console (GSC). Ces données peuvent vous donner des informations supplémentaires sur l'activité passée de ces pages.

Exportez les données de clics et d'impressions depuis GSC vers une feuille Google. Utilisez ensuite la fonction VLOOKUP pour faire correspondre les URL du crawl avec les données de clics et d'impressions. Cela vous aidera à déterminer si les pages ont déjà été indexées, puis retirées de l'index.

7. Filtering URLs with HTTP 200 Status

Maintenant que vous avez analysé les différentes caractéristiques des pages "crawled but not indexed", il est temps de passer à l'étape de filtrage. Commencez par filtrer les URL avec le statut HTTP 200, qui indique que les pages sont accessibles et fonctionnent correctement.

Dans votre feuille de données, appliquez un filtre pour ne montrer que les URL avec le statut HTTP 200, afin de vous concentrer sur les pages actives de votre site.

8. Removing Feed URLs

Une fois que vous avez filtré les pages avec le statut HTTP 200, vous pouvez continuer à affiner vos résultats en supprimant les URL de flux. Ces URL de flux ne sont généralement pas pertinentes pour l'indexation et peuvent être excluses.

Utilisez à nouveau la fonction de filtre pour exclure les URL contenant des termes spécifiques liés aux flux, tels que "feed" ou "rss". Cela vous permettra de vous concentrer uniquement sur les pages qui ont une valeur réelle et qui devraient être indexées.

9. Identifying Anomalies and Orphaned Pages

À ce stade, vous aurez une liste plus restreinte de pages "crawled but not indexed" qui sont actives, ont des liens internes et un contenu suffisant. Cependant, il est possible qu'il y ait encore des anomalies ou des pages orphelines qui nécessitent une attention particulière.

Examinez les URL restantes pour déterminer si elles sont des anomalies, comme des pages générées par une extension WordPress, ou si elles sont des pages qui ne font plus partie de la structure du site. Si ces pages n'ont pas de valeur réelle pour les utilisateurs, il peut être judicieux de prendre des mesures pour empêcher Google de les explorer à nouveau.

10. Taking Action for Indexed Pages

Pour les pages actives qui ont des liens internes, un contenu suffisant et qui étaient précédemment indexées, mais ne le sont plus, vous devrez prendre des mesures pour les remettre dans l'index de recherche.

Ajoutez des liens internes supplémentaires vers ces pages pour les rendre plus accessibles et pertinentes. Vous pouvez également mettre à jour le contenu en y ajoutant plus d'informations ou en l'optimisant pour les mots-clés pertinents.

Après avoir effectué les modifications nécessaires, demandez l'indexation de ces pages via l'outil d'inspection d'URL de Google Search Console. Cela aidera Google à repasser en revue et à réindexer les pages mises à jour.

11. Conclusion 🌟

Voilà ! Vous avez maintenant une méthode simple pour mieux comprendre et gérer les pages "crawled but not indexed". En suivant ces étapes, vous pourrez identifier les problèmes potentiels, prendre les mesures appropriées et améliorer la visibilité de votre site dans les résultats de recherche.

N'oubliez pas d'effectuer régulièrement des audits de votre site pour identifier et résoudre les problèmes de pages "crawled but not indexed". Avec une approche proactive, vous donnerez à votre site les meilleures chances d'être bien indexé et d'obtenir de bons classements dans les moteurs de recherche.

J'espère que cet article vous a été utile ! N'hésitez pas à me contacter sur LinkedIn si vous avez des questions ou avez besoin d'aide supplémentaire. Bonne journée à tous !

Ressources recommandées :

Are you spending too much time on seo writing?

SEO Course
1M+
SEO Link Building
5M+
SEO Writing
800K+
WHY YOU SHOULD CHOOSE Proseoai

Proseoai has the world's largest selection of seo courses for you to learn. Each seo course has tons of seo writing for you to choose from, so you can choose Proseoai for your seo work!

Browse More Content