John Mueller, qui est Search Advocate chez Google, anime un grand nombre des sessions actuelles de questions-réponses en anglais de Google. C’est là que les webmasters et les spécialistes du référencement peuvent soumettre ou poser des questions sur la recherche, l’exploration et l’indexation de Google.
Vers le début de la session du 8 octobre 2021, M. Mueller s’est vu proposer un scénario et a posé une question relative à l’utilisation de noindex.
Cette vidéo est mise en file d’attente à la marque de ~39 secondes, qui est le moment où la question a été posée.
Le scénario, en partie, était le suivant :
“Nous avons des sites Web d’examens [où] les gens ajoutent des examens et… étiquettent les examens, et Google indexe toutes les pages [et] toutes les pages d’étiquettes…”
La description du scénario par le participant peut être entendue, en détail, en regardant la vidéo ci-dessus.
Je ne veux pas tout taper ici, car il entre dans plus de détails que ce que nous devons explorer.
Cela dit, je vais décrire son scénario avec mes propres mots :
Le participant a un site avec beaucoup de contenu dupliqué.
L’ensemble de ce contenu (ou une partie importante de celui-ci) est indexé dans Google.
Le participant a d’abord canonicalisé ces pages dupliquées, puis a mis un noindex sur elles.
(Un noindex dans le code d’une URL, au cas où vous ne seriez pas sûr, indique fondamentalement aux moteurs de recherche de ne pas indexer l’URL).
Mais, prétendument, ces pages dupliquées étaient toujours indexées.
Il suffit de les laisser ?
Et donc, sa question concernant ce qu’il devait faire ensuite.
La réponse de John a été la suivante :
“Je les laisserais simplement comme non indexées et… ce qui se passera, c’est qu’au fil du temps, lorsque nous recrawlerons ces pages, elles disparaîtront…”.
Ok, c’est bon.
John a poursuivi en parlant du temps que cela peut prendre :
“…mais ça peut arriver peut-être…je ne sais pas… [ça pourrait] prendre quelques mois.”
Et ce, pour un site qui aurait environ 100 000 pages indexées. (Mais je n’utiliserais pas ce chiffre comme une estimation de la rapidité ou de la minutie avec laquelle Google pourrait ré-exploiter tout autre site, car d’autres facteurs entrent en jeu).
La réponse finale : Attendez
Si une page (ou une URL) est indexée et que vous décidez par la suite de ne plus la faire indexer, vous pouvez mettre un noindex sur cette page.
Mais, disons que quelques semaines passent, et vous vérifiez : elle est toujours indexée dans Google.
Eh bien, attendez. Quand Googlebot s’en occupera, cette page finira par sortir de l’index. Et elle ne sera plus explorée aussi souvent.
(Comme elle ne sera pas explorée aussi souvent, si vous voulez qu’elle soit réindexée, vous devrez peut-être la soumettre à nouveau en utilisant un processus de soumission d’URL dans Search Console).
Mais… la discussion se poursuit…
Cela dit, la discussion par questions-réponses autour de ce scénario particulier s’est poursuivie. Le participant a demandé (et je paraphrase ici), “Si j’ai du contenu dupliqué qui est indexé, mais canonisé, est-ce que cela affecte négativement mon référencement ?”.
Avez-vous du contenu dupliqué ? Est-il canonisé ? (Si vous n’êtes pas sûr, je donne une brève explication dans l’article ci-dessus).
Vous voudrez peut-être en avoir le cœur net.
Source : Chaîne YouTube Google Search Central