La première étape pour pour être sur Google d’être présent dans l’index de Google. Parfois, les sites web n’arrivent même pas jusque-là.
Dans l’univers en ligne, ce n’est rien de moins qu’un désastre. Si vous n’êtes pas indexé par les moteurs de recherche, votre site web sera invisible pour 99,999 % des internautes et vous pouvez complètement oublier le trafic organique. Pourtant, c’est le point de départ pour le référencement de votre site WordPress.
Certes, il existe d’autres sources de trafic, mais les visiteurs des moteurs de recherche restent l’une des options les plus importantes et les plus rentables.
Afin d’éviter ce genre de catastrophe, dans cet article, nous allons examiner les raisons pour lesquelles vous ne pourriez pas être visibles sur Google. Ensuite, nous allons suivre une approche progressive pour faire en sorte que le site soit bien indexé par Google.
Comment Google trouve-t-il mon site ?
Avant de commencer, nous devons nous mettre d’accord sur les bases des moteurs de recherche et sur un vocabulaire important. Cela permettra aux débutants de comprendre plus facilement ce qui suit.
Pour trouver du contenu pour ses résultats de recherche, Google s’appuie sur ce que l’on appelle des « robots de recherche« . Il s’agit de programmes automatisés qui parcourent le web et signalent le contenu des sites web aux moteurs de recherche.
Tous les grands moteurs de recherche ont leurs propres robots (par exemple, celui de Google s’appelle Googlebot et il en existe beaucoup d’autres. Le processus d’exploration d’un site web et de son contenu est appelé « crawling« .
C’est ce que fait le Googlebot pour comprendre le contenu de vos articles et de vos pages. La phase suivante s’appelle l’indexation. Cela signifie que si votre contenu a été jugé digne par Google, il est alors traité et ajouté à l’index de Google. Cet index, à son tour, alimente les résultats de recherche.
Pourquoi mon site n’est-il pas indexé par Google ?
La première étape pour savoir si votre site est apparu dans le radar de Google consiste à taper site:votredomaine.com ou site:votredomaine.fr dans la barre de recherche Google. Cela vous permettra de voir toutes les pages de votre domaine que Google a dans son index. Si les résultats sont complètement vides, cela signifie que le moteur de recherche ignore totalement votre contenu ou qu’il se passe quelque chose avec votre site qui l’empêche d’être indexé. Cela peut se produire pour plusieurs raisons :
- Il y a des problèmes avec votre serveur tels que des problèmes techniques ou une mauvaise configuration
- Votre site web enfreint certaines conditions de Google et a été pénalisé
- Votre site WordPress ou ses paramètres de référencement sont mal configurés
- Vous n’avez pris aucune mesure pour être indexé ou même remarqué
- Le site est trop récent et Google n’a pas eu le temps de l’ajouter à son index
Chaque cas est différent et il peut y avoir plus d’un problème en jeu. Toutefois, ne vous inquiétez pas, bien que nous reviendrons en détail sur chacun de ces facteurs ci-dessous.
Comment faire en sorte que votre site web WordPress soit indexé par Google ?
D’une certaine manière, nous sommes complètement à la merci de Google quand il s’agit d’être trouvé sur le web. Pas d’index, pas de trafic organique. Cependant, la bonne nouvelle est qu’il y a beaucoup de choses que nous pouvons faire pour que Google nous donne une place dans ses SERP, ce dont nous parlerons plus loin.
Investir dans un bon fournisseur d’hébergement
L’un des premiers obstacles potentiels à l’indexation par Google est le serveur sur lequel votre site fonctionne.
Une vitesse de serveur lente, des temps d’arrêt et des déconnexions peuvent empêcher le travail robots de recherche. Bien que cela ne soit pas très courant, c’est une possibilité. Étant donné qu’en matière d’hébergement, vous en avez pour votre argent, investir dans un hébergeur de qualité performant et une excellente disponibilité en vaut toujours la peine.
Remplissez votre site avec un contenu de haute qualité
Le fait d’être indexé par Google, c’est que nous ne voulons pas seulement qu’ils connaissent notre site, mais qu’ils en soient conscients de manière positive. Si votre site est vide ou pire rempli de contenu de basse qualité, il peut être indexé, mais il ne se retrouvera pas au premier rang des SERP.
C’est presque aussi grave que de ne pas être indexé du tout. Ce n’est un secret pour personne : Google se soucie de la pertinence et de la qualité de votre contenu. C’est pourquoi, lorsque vous créez votre site, concentrez-vous sur un contenu de qualité, utile et original.
Bien entendu, cela signifie aussi qu’il faut éviter les contenus dupliqués et/ou les contenus de mauvaise qualité.
Désactiver « Empêcher les moteurs de recherche d’indexer ce site » dans WordPress
Pendant la phase de développement, la dernière chose que nous souhaitons généralement est d’être indexés par les moteurs de recherche. En fait, nous voulons garder Google et compagnie aussi loin de notre site que possible.
Sinon, nous risquons d’être pris avec un contenu incomplet car le site est en construction et Google se fera une opinion sur notre site sur cette base. Le problème, c’est que nous oublions de revenir sur les mesures que nous avons prises pour éloigner les moteurs de recherche après la mise en ligne de notre site.
L’une des erreurs les plus courantes consiste à laisser la mention « empêcher les moteurs de recherche d’indexer ce site » active dans le tableau de bord de WordPress. C’est en fait une condamnation à mort pour le trafic organique de votre site.
Donc, pour vous assurer que votre site sera indexé (ou si vous avez des problèmes pour apparaître sur Google), jetez un coup d’œil à ce paramètre en bas de Paramètres > Lecture pour vous assurer qu’il n’est pas coché.
N’oubliez pas de sauvegarder si vous avez fait des changements. C’est un cas que j’ai souvent découvert lors d’audit SEO pour des clients, autant dire que c’est une des premières choses à aller vérifier.
Configurer correctement le fichier robots.txt
Dire à WordPress d’empêcher les moteurs de recherche de venir indexer implique plusieurs choses. D’une part, cela ajoute des méta-tags « noindex » et « nofollow » à la tête de votre site web et empêche également quiconque d’envoyer des pings à votre site.
Mais surtout, ce paramètre configure le fichier robots.txt interne à WordPress pour empêcher tous les robots de recherche d’indexer votre site. Au cas où vous ne le sauriez pas, le fichier robots.txt est un outil serveur important pour communiquer directement avec les moteurs de recherche.
Vous pouvez l’utiliser pour leur dire quelles parties de votre site vous voulez qu’ils indexent et lesquelles vous ne voulez pas.
Pour cette raison, vous mettrez souvent en place un fichier robots.txt pour contrôler l’indexation pendant le développement. Bien que ce soit très bien, cela devient un problème lorsque vous oubliez de le modifier.
Créer un sitemap
Un sitemap est un document XML qui contient une liste de tous les contenus de votre site. Il indique aux moteurs de recherche ce que vous avez à offrir et à quelle fréquence ils doivent vérifier s’il y a du nouveau.
En bref, les sitemap sont un excellent outil pour guider les robots de recherche et en créer un pour votre site web est une bonne idée.
Pour ce faire, nous disposons de plusieurs plugins. L’un des plus populaires est Google XML Sitemaps, auquel plus d’un million d’utilisateurs font confiance.
Vous pouvez aussi utiliser les plugins SEO comme Yoast SEO, All in SEO Pack qui peut créer des sitemaps automatiquement, les mettre à jour avec de nouveaux messages et de nouvelles pages ainsi qu’alerter Google lorsqu’il le fait.
Soumettre votre site à Google
Cependant, l’utilité des sitemap ne s’arrête pas là. Après tout, voulez-vous simplement laisser faire et attendre que Google le découvre ?
Voici une meilleure idée : pourquoi ne pas laisser Google savoir exactement où se trouve votre sitemap afin qu’il puisse commencer à indexer votre contenu immédiatement ?
C’est exactement ce que vous pouvez faire dans Google Search Console. Si vous n’avez pas encore de compte, créez en un. Google Search Console vous donne de nombreuses informations sur ce que Google sait et pense de votre site et sur la manière dont vous pouvez l’améliorer.
Après avoir connecté votre site, allez dans votre compte et accédez à Crawl > Sitemaps. Ici, cliquez sur Ajouter un site dans le coin supérieur droit. Il ne vous reste plus qu’à ajouter l’adresse de votre sitemap à la fin de votre domaine. Il s’agit généralement de quelque chose comme votredomaine.fr/sitemap.xml.
Vérifier les erreurs de crawl
Lorsque l’indexation échoue, c’est souvent parce qu’il y a un problème technique sur votre site. Heureusement, si c’est le cas, les Google Search Console vous en avertit. Il le fera directement sur votre tableau de bord (la grande fenêtre Crawl Errors) et sous Crawl > Crawl Errors.
Le plus souvent, les erreurs seront des 404, c’est-à-dire des liens vers des URL qui n’existent pas. C’est bien s’il y en a quelques-uns (cela arrive), mais à cet endroit, vous remarquerez également s’il y a quelque chose de plus important qui empêche votre site d’être indexé.
Ces informations sont essentielles pour prendre des mesures correctives et vous pouvez trouver des avis similaires dans votre menu Sitemaps.
Demandez manuellement à Google de parcourir votre site
Si vous avez des problèmes sur votre page et que vous avez pris des mesures pour les corriger, vous pouvez alors demander à Google de bien vouloir regarder à nouveau les pages concernées.
De cette façon, vous saurez si votre solution a fonctionné et vous pourrez dire à Google que ces pages sont correctes maintenant sans avoir à attendre qu’elles explorent votre site à leur propre rythme.
Pour ce faire, vous devez d’abord récupérer les URL en question. Cela se fait avec l’inspection d’URL, vous pouvez saisir n’importe quelle page de votre domaine pour que Google la vérifie, l’affiche même telle que les robots de recherche la voient.
Ce dernier peut vous aider à repérer les erreurs ou autres éléments qui ne vont pas pendant le traitement de votre page. Une fois que vous avez récupéré une page, elle apparaîtra dans la liste en bas avec un bouton qui dit « Soumettre à l’index ».
Si la récupération et le rendu se passent bien, vous pouvez utiliser ce bouton pour dire à Google d’essayer d’ajouter la page à son index. Vous pouvez soit ne soumettre que la page elle-même, soit inclure tous les liens directs vers lesquels elle pointe.
Vérifier le fichier .htaccess
Le fichier .htaccess est un autre fichier important sur votre serveur qui contient des informations pour les navigateurs et les moteurs de recherche sur l’utilisation et le traitement de votre site.
Par exemple, .htaccess contient des informations de réécriture, ce qui vous permet d’utiliser de jolis permaliens. En outre, il peut également contenir des autorisations pour différents répertoires de votre site.
Bien que cela soit très utile, cela signifie également que ce fichier peut être une source de problèmes pour les efforts d’indexation de votre site. Si vous rencontrez des problèmes d’indexation que vous ne pouvez pas expliquer autrement, la vérification de ce fichier peut en valoir la peine.
Parfois, il suffit d’aller dans Paramètres > Permaliens dans le tableau de bord de WordPress et de cliquer sur Enregistrer les modifications pour que WordPress vide le fichier .htaccess.
Vérifier les balises Meta
Les méta-tags sont des éléments du code de votre site qui fournissent des informations supplémentaires sur son contenu et son architecture.
Par exemple, si vous définissez une méta description dans un plugin SEO WordPress, elle apparaîtra à l’intérieur d’une méta balise dans la section d’en-tête de votre page. Une balise nommée « robots » en particulier est très importante.
Sa valeur peut être index/noindex et follow/nofollow. Comme vous pouvez probablement le deviner, il s’agit de directives destinées aux robots des moteurs de recherche.
En fait, l’option « empêcher les moteurs de recherche » mentionnée ci-dessus dans WordPress ajoute une balise noindex, nofollow à votre site jusqu’à ce qu’elle soit désactivée. Si vous rencontrez des problèmes d’indexation (ou si vous voulez simplement vous assurer qu’il n’y a pas de problème), vous pouvez vérifier les en-têtes de votre page en l’inspectant avec les outils de développement de votre navigateur.