“Si j’ai du contenu dupliqué qui est indexé, mais canonisé, cela affecte-t-il négativement mon référencement ?” La réponse de Google

Ah, oui... l'éternelle question du contenu dupliqué : pénalité ou filtre ? Découvrez la réponse finale.
SIA Team
October 11, 2021

Depuis des années (apparemment, des siècles dans le temps d’Internet), il y a une question récurrente : le contenu dupliqué est-il une pénalité, ou un filtre ?

Cette question, qui semble simple, peut en fait provoquer beaucoup de malentendus et de réponses incorrectes de la part des gens.

Je vais donc essayer d’y répondre.

Je commencerai par définir le contenu dupliqué.

Une définition du contenu dupliqué est la suivante : avoir 2 ou plusieurs pages (ou URLs) sur un site web (ou domaine) qui ont, globalement, le même contenu. C’est-à-dire qu’il s’agit de doublons.

(Je sais qu’il peut y avoir deux ou plusieurs pages dont le contenu n’est que partiellement dupliqué. C’est-à-dire que le contenu est en grande partie dupliqué, mais pas à 100% identique. Bien que je ne veuille pas entrer dans des détails superflus quant au pourcentage de contenu dupliqué qui constitue un point de référence pour s’inquiéter, nous avons constaté qu’il y a une règle de 51%).

Pourquoi vous voulez être certain de la façon dont le contenu dupliqué est traité sur votre site ?

Certaines plates-formes de sites Web, telles que WordPress, selon la façon dont les installations individuelles sont configurées, peuvent générer du contenu dupliqué.

Les pages de balises en sont un exemple. Sur certains sites alimentés par WordPress, des pages de balises sont automatiquement créées, et chacune de ces pages contient des extraits de blog provenant des nombreux articles de cette balise.

(Les pages de balises ne doivent pas être confondues avec les pages de catégories, bien que dans ce contexte, le même processus – contenu dupliqué – puisse avoir lieu).

Si vos pages de balises sont réglées sur noindex (ce qui peut être fait dans wp-admin, tout devrait bien se passer).

Bien, avec cela en tête, passons au vrai sujet de cette nouvelle.

La semaine dernière, Google a donné l’une de ses nombreuses sessions de questions-réponses, et cette session spécifique est l’English Google SEO Office-Hours du 8 octobre 2021.

Au cours de cette session particulière, John Mueller de Google a été interrogé,

“Est-ce que cela affecte négativement nos performances de référencement en termes de… ce sont des pages dupliquées mais, canonisées… ?”.

Cette vidéo est mise en file d’attente à ~ la marque de 2 minutes, 35 secondes, qui est approximativement où la question a été posée.

La réponse de John a été :

“Non, non… c’est parfaitement bien. C’est purement une question de… côté crawling des choses. Si nous voyons qu’il s’agit de doublons, nous essaierons de les traiter comme tels et nous nous concentrerons sur une seule URL canonique pour eux.”

Le contenu dupliqué n’affecte pas négativement le référencement… du moins, pas si…

…Pas si au moins une de ces pages a une balise canonique.

Mais… qu’est-ce que la canonisation ?

Une brève introduction à la canonisation

En juillet 2021, j’ai écrit sur la canonicalisation, que vous pouvez lire en cliquant ici.

En bref, disons que vous avez des pages Web (ou URL) A, B et C, qui sont toutes entièrement identiques.

Pour la canonicalisation, vous devez désigner l’une de ces pages comme étant l’originale, ou celle que vous voulez indexer. Disons que vous choisissez A.

Vous placez alors une balise canonique sur B et C, en faisant référence à A. En gros, vous dites : “Je veux que A soit la page considérée comme la référence pour ce contenu.”

Le contenu dupliqué n’est pas une pénalité en soi ; il s’agit plutôt d’un filtre.

Et c’est logique, non ? Google, surtout si vous utilisez la canonicalisation ou la noindexation de vos doublons, ne va pas pénaliser votre site. Au contraire, comme décrit dans l’exemple de canonicalisation ci-dessus, il est plus probable qu’il utilisera un processus de filtrage et essaiera de rechercher des canoniques (ou noindex) pour essayer d’en trouver un que vous voulez indexer.

Source : Chaîne YouTube Google Search Central