“Nous avons des millions de résultats de recherche sur site indexés. Devrions-nous les nettoyer ?”

Le nombre de pages de votre site est-il gonflé par les recherches indexées sur le site ? Vous pourriez vouloir regarder ceci.
SIA Team
October 7, 2021

Avant d’entrer dans le vif du sujet, je tiens à m’assurer que nous savons ce qu’est un résultat de recherche sur le site.

Certains sites ont des boîtes de recherche où vous pouvez faire une recherche sur le site.

Je suis sûr que vous les avez déjà vues. C’est presque comme une recherche Google, sauf qu’elle est limitée au contenu disponible sur un site.

Quoi qu’il en soit, certains propriétaires de sites autorisent l’indexation des pages de résultats de ces recherches. On peut donc supposer qu’un visiteur effectue une recherche et qu’il est dirigé vers la page de résultats du site. Cette page de résultats comporte généralement un paramètre URL qui la rend différente de la plupart des autres URL, et c’est ce paramètre URL qui est indexé.

Ainsi, au fil du temps, en fonction de l’importance du trafic sur un site, de sa taille et du degré d’activité des utilisateurs, il peut en résulter une accumulation de très nombreux paramètres d’URL de recherche indexés.

Nous savons également que Google a tendance à favoriser le contenu unique et les pages de qualité.

En gardant cela à l’esprit, passons maintenant à l’une des plus récentes sessions de questions-réponses que Google organise souvent pour les webmasters et les professionnels du référencement.

Pendant les heures de bureau de Google SEO en anglais du 1er octobre 2021, la question suivante a été posée à John Mueller, qui est un Google Search Advocate :

“J’avais une question concernant les pages de recherche interne. Nous autorisons l’indexation des recherches sur le site. Parfois, quelqu’un effectue une recherche sur notre site, nous créons une page à cet effet, et cela devient un peu incontrôlable, si bien que nous avons des centaines de millions de ces pages.

“Alors comment recommanderiez-vous que nous fassions le tri et s’il y a vraiment un avantage à nettoyer cela ou si nous ne devrions pas nous en inquiéter.”

Cette vidéo est en file d’attente à ~52:26, ce qui est à peu près le moment où la question a été posée.

“Je pense que dans la plupart des cas, il est logique de nettoyer cela, car cela rend l’exploration beaucoup plus difficile.

“Il ne s’agit pas tant de se débarrasser de toutes les pages de recherche interne (certaines d’entre elles peuvent parfaitement être affichées dans les résultats de recherche) que d’essayer d’éviter une situation où n’importe qui peut créer un million de nouvelles pages sur votre site Web en créant des liens vers des url ou des mots aléatoires sur vos pages”.

On a ensuite demandé à John comment faire. Il a recommandé de simplement ajouter no-index aux pages (URL avec paramètres de recherche) que vous ne souhaitez pas voir indexées.

Mais il a ajouté que certaines de ces pages pourraient être indexées, alors gardez cela à l’esprit.

John a également parlé de qualité, ce qui est logique.

Comme vous le savez peut-être, un grand nombre de ces pages de résultats de recherche internes (URL avec paramètres de recherche) ne sont probablement pas de grande qualité. De plus, ces pages affichent probablement du contenu provenant d’autres pages de votre site, et il s’agit donc, d’une certaine manière, de contenu dupliqué. (Non pas que le contenu dupliqué soit mauvais, il est juste… redondant).

Avantages potentiels pour le référencement de la suppression des pages de mauvaise qualité

On a ensuite posé à John une question qui préoccupe ceux qui travaillent avec des entreprises : “…les entreprises diraient, vous savez, ‘Si nous devons faire ce travail en tant qu’investissement de notre côté, quel est le retour sur investissement ? Y a-t-il un avantage en termes de référencement ?”

La réponse de John a été fondamentalement affirmative, même si vous ne verrez peut-être pas tout de suite une amélioration du référencement.

L’un des aspects de cette question est lié au budget de crawl (bien que je n’aie pas entendu John utiliser spécifiquement ce terme). En gros, si Google n’avait pas à explorer autant de pages (en particulier les URL contenant des paramètres de recherche), Googlebot disposerait d’un budget plus important pour les pages que vous souhaitez réellement explorer et indexer.

(John a cité l’exemple des sites de commerce électronique qui modifient leurs prix. Si vous publiez un nouveau changement de prix, vous voulez que Google le sache le plus rapidement possible).

Ainsi, si un nombre important de vos URL indexées ne sont que des pages de résultats de recherche à faible contenu, pensez à les désindexer. Par ailleurs, ce que j’ai mentionné ci-dessus ne s’applique pas nécessairement à tous les sites, alors tenez compte de votre situation spécifique.

Source : Chaîne YouTube Google Search Central