A partir d’une requête, Google affiche des résultats dans son moteur de recherche. Les liens de sites proposés ont été en amont explorés puis indexées pour répondre le plus précisément à la requête.
En ce sens, pour attirer du trafic sur son site, il est impératif que les pages soit indexées sur Google. Il faut permettre à Google d’explorer le site afin qu’il puisse procéder à l’indexation des pages qu’il juge pertinentes. Il peut arriver que le site ne soit pas visible dans l’index Google. Outre la pauvre qualité de la page qui peut expliquer cette absence, d’autres raison peuvent expliquer cela.
Le principe de crawl et d’indexation Google
L’exploration ou crawl est effectué par GoogleBot qui va analyser les pages ainsi que les liens qui s’y trouvent. Afin de faire figurer vos pages web sur le moteur de recherche Google, vous devez alors permettre ce crawl pour l’indexation de votre site WordPress.
Conditions particulières pour les nouveaux sites
Vous venez de créer votre site WordPress donc Google ne le connaît pas. Il faudra un certain temps afin que Google vienne crawler votre nouveau site et indexe les pages. Par la suite, selon l’optimisation SEO, il les placera à une certaine place selon les mots-clés visés. La qualité du contenu compte pour Google pour indexer une page afin de répondre au mieux aux besoins des internautes.
Paramètres à vérifier pour l’absence d’indexation des pages
Vérifier dans les réglages de l’interface d’administration
Une des premières choses à vérifier est de se rendre sur l’interface d’administration dans le sous-menu « Lecture » du menu « Réglages.
Par la suite, regarder si la case est cochée pour la visibilité du site sur les moteurs de recherche :
Si la case est cochée, il faudra la décocher afin d’autoriser l’accès aux moteurs de recherche.
Vérifier si une règle du robots.txt empêche l’indexation
Ce fichier se trouve à la racine et permet d’interdire l’accès à tous ou certaines parties du site. Il se trouve à la racine, car les robots analysent ce fichier avant de crawler le site.
Quand on regarde de plus près ce fichier, il y a deux règles : User-agent et Disallow. User-agent désigne un moteur de recherche et Disallow désigne un répertoire ou une page qu’on ne souhaite pas être explorée. Le valeur « / » de Disallow signifie que l’ensemble du site est concerné.
Dans ce premier cas, on interdit l’exploration du site pour tous les robots de moteurs de recherche :
User-agent: * Disallow: /
Dans ce deuxième cas, seul le robot Googlebot ne peut crawler votre site
User-agent: Googlebot Disallow: /
Vérifier les balises meta de vos pages
Dans une page web, vous avez avez plusieurs types de balises meta dans la partie <head> </head> qui se situent en début de page.
Une des balises indique aux robots de ne pas indexer la page : <meta name=« robots« content=« noindex« >
Voir les pages indexées avec la syntaxe d’interrogation Google « site: »
Une des manières de vérifier l’indexation d’un site est d’utiliser la syntaxe « site: » suivi de l’url du site pour afficher les pages indexées par Google. Une liste de liens du site en question avec titres et descriptions s’affichent avec le nombre de pages indexées par Google juste au-dessus du premier lien.
C’est aussi une façon de voir des pages qu’on ne souhaitait voir indexées. Cependant, ce procédé n’est pas fiable à 100 % et la meilleure façon de contrôler l’indexation de son site est d’utiliser Google Search Console.
Utiliser Google Search Console
Qu’est-ce que Google Search Console ?
Anciennement appelé « Outils Google pour webmasters », Google Search console est un service gratuit de Google pour gérer plusieurs paramètres de son site web tel que :
- L’état d’indexation du site
- L’analyse du trafic
- Les données structurées
- Gestion des pages par la suppression d’url obsolètes
Lier son site à Google Search Console
Pour lier son site à Google Search Console, il faut au préalable avoir un compte Google. Par la suite, se rendre sur la page Google Search Console pour ajouter la propriété sur le site en question. Dans le coin supérieur gauche, cliquez sur la flèche à côté de la mention « Ajouter la propriété ».
Une fenêtre va s’ouvrir et vous allez pouvoir saisir l’url du site internet sous la mention « Domaine ». Par la suite, une autre fenêtre s’affichera avec une sorte de code à insérer dans un enregistrement TXT du serveur DNS de votre hébergeur.
Si vous n’êtes pas à l’aise avec ce procédé, vous pouvez opter pour le préfixe d’url et différentes solutions vous seront proposées afin de valider votre propriété. Vous avez le choix d’opter pour :
- La balise HTML
- Utiliser votre compte Google Analytics
- Utiliser votre compte Google Tag Manager
- Associer votre fournisseur de nom de domaine
Ajouter le sitemap de son site WordPress
Le sitemap est un fichier au format XML qui liste toutes les url de votre site WordPress. Pour créer votre sitemap, vous pouvez en générer par l’intermédiaire de plugins SEO tel que All in one SEO, Yoast… Ou alors avec un plugin spécialement conçu pour construire un sitemap comme Google XML Sitemaps.
Après avoir validé la propriété, on va enregistrer le sitemap ici :
Comment voir le nombre de pages indexées
Afin de connaître le nombre précis de pages indexées, il faut se rendre sur le menu « Couverture », différentes valeurs nous sont présentées, mais celle qui nous intéresse est sous la mention « Valides ».
Pensez au budget crawl si vous avez un gros site
Qu’est-ce que le budget crawl ?
A partir d’un certain nombre de pages, Googlebot va limiter l’exploration d’un site web. Plusieurs passages sont donc nécessaires pour un crawl exhaustif, mais rien ne dit qu’il sera complet, car différents critères conditionnent cette exploration.
Les conditions pour un bon budget crawl ?
- Un temps de réponse du serveur rapide
- Un site mis à jour assez souvent
- Eviter d’avoir des liens qui mènent vers des pages d’erreurs
- Proposer des pages avec du contenu de qualité
Vous savez maintenant comment savoir si vos pages ont bien été indexées avec l’outil Google Search Console. De plus, vous serez avertis d’éventuelles erreurs afin de les corriger pour que les robots puissent explorer votre site.
Besoin d’un accompagnement pour être visible sur Google
Bonjour,
Si vous venez de créer votre site, c’est normal qu’il ne soit pas indexé. Cela prend un peu de temps avant que Google vienne explorer votre site
Dans l’article, je donne un conseil pour signaler la présence de votre site. Il s’agit d’inscrire le site sur la Google Search Console et de télécharger un sitemap où on trouve les urls des pages du site.
Cordialement
Bonjour.
J’ai créé mon site via Hostinger (https://lesamisdesaintjacquesduvelay.org). Depuis 2 jours je tourne en rond car mon site n’apparait pas sur les moteurs de recherche de Goggle. Que puis-je faire ?
Merci.
P. Demailly