A partir d’une requête, Google affiche des résultats dans son moteur de recherche. Les liens de sites proposés ont été en amont explorés puis indexées pour répondre le plus précisément à la requête.

En ce sens, pour attirer du trafic sur son site, il est impératif que les pages soit indexées sur Google. Il faut permettre à Google d’explorer le site afin qu’il puisse procéder à l’indexation des pages qu’il juge pertinentes. Il peut arriver que le site ne soit pas visible dans l’index Google. Outre la pauvre qualité de la page qui peut expliquer cette absence, d’autres raison peuvent expliquer cela.

Le principe de crawl et d’indexation Google

 

L’exploration ou crawl est effectué par GoogleBot qui va analyser les pages ainsi que les liens qui s’y trouvent. Afin de faire figurer vos pages web sur le moteur de recherche Google, vous devez alors permettre ce crawl pour l’indexation de votre site WordPress.

 

Conditions particulières pour les nouveaux sites

 

Vous venez de créer votre site WordPress donc Google ne le connaît pas. Il faudra un certain temps afin que Google vienne crawler votre nouveau site et indexe les pages. Par la suite, selon l’optimisation SEO, il les placera à une certaine place selon les mots-clés visés. La qualité du contenu compte pour Google pour indexer une page afin de répondre au mieux aux besoins des internautes.

 

Paramètres à vérifier pour l’absence d’indexation des pages

 

Vérifier dans les réglages de l’interface d’administration

 

Une des premières choses à vérifier est de se rendre sur l’interface d’administration dans le sous-menu « Lecture » du menu « Réglages.

 

Réglages WordPress indexation

 

Par la suite, regarder si la case est cochée pour la visibilité du site sur les moteurs de recherche :

réglages visibilité site wordpress

 

Si la case est cochée, il faudra la décocher afin d’autoriser l’accès aux moteurs de recherche.

 

Vérifier si une règle du robots.txt empêche l’indexation

 

Ce fichier se trouve à la racine et permet d’interdire l’accès à tous ou certaines parties du site. Il se trouve à la racine, car les robots analysent ce fichier avant de crawler le site.

Quand on regarde de plus près ce fichier, il y a deux règles : User-agent et Disallow. User-agent désigne un moteur de recherche et Disallow désigne un répertoire ou une page qu’on ne souhaite pas être explorée. Le valeur « / » de Disallow signifie que l’ensemble du site est concerné.

Dans ce premier cas, on interdit l’exploration du site pour tous les robots de moteurs de recherche :

User-agent: *
Disallow: /

Dans ce deuxième cas, seul le robot Googlebot ne peut crawler votre site

User-agent: Googlebot
Disallow: /

 

Vérifier les balises meta de vos pages

 

Dans une page web, vous avez avez plusieurs types de balises meta dans la partie <head> </head> qui se situent en début de page.

Une des balises indique aux robots de ne pas indexer la page  : <meta name=« robots«  content=« noindex« >

 

Voir les pages indexées avec la syntaxe d’interrogation Google « site: »

 

Une des manières de vérifier l’indexation d’un site est d’utiliser la syntaxe « site: » suivi de l’url du site pour afficher les pages indexées par Google. Une liste de liens du site en question avec titres et descriptions s’affichent avec le nombre de pages indexées par Google juste au-dessus du premier lien.

Affichage page indéxées sur Google avec la syntaxe site:

 

C’est aussi une façon de voir des pages qu’on ne souhaitait voir indexées. Cependant, ce procédé n’est pas fiable à 100 % et la meilleure façon de contrôler l’indexation de son site est d’utiliser Google Search Console.

 

Utiliser Google Search Console

 

Qu’est-ce que Google Search Console ?

 

Anciennement appelé « Outils Google pour webmasters », Google Search console est un service gratuit de Google pour gérer plusieurs paramètres de son site web tel que :

  • L’état d’indexation du site
  • L’analyse du trafic
  • Les données structurées
  • Gestion des pages par la suppression d’url obsolètes

 

Lier son site à Google Search Console

 

Pour lier son site à Google Search Console, il faut au préalable avoir un compte Google. Par la suite, se rendre sur la page Google Search Console pour ajouter la propriété sur le site en question. Dans le coin supérieur gauche, cliquez sur la flèche à côté de la mention « Ajouter la propriété ».

 

Ajout propriété Google Search Console

 

Une fenêtre va s’ouvrir et vous allez pouvoir saisir l’url du site internet sous la mention « Domaine ». Par la suite, une autre fenêtre s’affichera avec une sorte de code à insérer dans un enregistrement TXT du serveur DNS de votre hébergeur.

 

code enregistrement dns google search console

 

Si vous n’êtes pas à l’aise avec ce procédé, vous pouvez opter pour le préfixe d’url et différentes solutions vous seront proposées afin de valider votre propriété. Vous avez le choix d’opter pour :

  • La balise HTML
  • Utiliser votre compte Google Analytics
  • Utiliser votre compte Google Tag Manager
  • Associer votre fournisseur de nom de domaine

 

Prefixe url Google search console

 

 

Ajouter le sitemap de son site WordPress

 

Le sitemap est un fichier au format XML qui liste toutes les url de votre site WordPress. Pour créer votre sitemap, vous pouvez en générer par l’intermédiaire de plugins SEO tel que All in one SEO, Yoast… Ou alors avec un plugin spécialement conçu pour construire un sitemap comme Google XML Sitemaps.

Après avoir validé la propriété, on va enregistrer le sitemap ici :

menu sitemaps google search console

formulaire ajout sitemap Google Search Console

 

 

Comment voir le nombre de pages indexées

 

Afin de connaître le nombre précis de pages indexées, il faut se rendre sur le menu « Couverture », différentes valeurs nous sont présentées, mais celle qui nous intéresse est sous la mention « Valides ».

 

pages indéxéées google search console

 

Pensez au budget crawl si vous avez un gros site

Qu’est-ce que le budget crawl ?

 

A partir d’un certain nombre de pages, Googlebot va limiter l’exploration d’un site web. Plusieurs passages sont donc nécessaires pour un crawl exhaustif, mais rien ne dit qu’il sera complet, car différents critères conditionnent cette exploration.

 

Les conditions pour un bon budget crawl ?

 

  • Un temps de réponse du serveur rapide
  • Un site mis à jour assez souvent
  • Eviter d’avoir des liens qui mènent vers des pages d’erreurs
  • Proposer des pages avec du contenu de qualité

 

Vous savez maintenant comment savoir si vos pages ont bien été indexées avec l’outil Google Search Console. De plus, vous serez avertis d’éventuelles erreurs afin de les corriger pour que les robots puissent explorer votre site.