Quelle quantité de contenu dupliqué est acceptable ?

Les référenceurs sont généralement divisés en deux camps sur la question du contenu dupliqué : ceux qui l'adorent et ceux qui le détestent. Lisez pour savoir ce que les résultats de nos tests nous ont montré.
SIA Team
July 27, 2021

Il n’y a aucun doute. Le contenu dans le référencement est important. Le contenu dupliqué est-il l’ami ou l’ennemi des référenceurs ? La communauté des référenceurs est généralement divisée en deux camps sur la question du contenu dupliqué : ceux qui l’aiment et ceux qui le détestent.

Les sentiments personnels mis à part, nous avons testé pour voir la quantité de contenu dupliqué qui est acceptable. Certains diront qu’il n’y en a pas, tandis que d’autres diront que le contenu dupliqué est le moyen d’avoir les poches pleines d’argent.

Attention : Avez-vous du contenu dupliqué sur votre site ?

La question du contenu dupliqué est un sujet délicat pour les spécialistes du marketing. Certains disent qu’il s’agit d’un raccourci vers le classement dans les moteurs de recherche, tandis que d’autres ne jurent que par sa destruction.

Nous avons voulu savoir combien de blocs de contenu dupliqué pouvaient être tolérés avant que les moteurs de recherche ne s’énervent et ne commencent à nous pénaliser. Nous avons donc effectué quelques tests et trouvé la réponse !

Continuez à lire si vous voulez savoir ce que c’est.

What Is Duplicate Content

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué fait généralement référence à des blocs de contenu substantiels qui sont dupliqués sur la même page de votre site Web.

Parfois, le contenu dupliqué est intentionnel, parfois il est accidentel. La plupart du temps, les spécialistes du marketing utilisent du contenu dupliqué non malveillant. Ils créent intentionnellement du contenu dupliqué pour améliorer leur classement.

Cette pratique est tout à fait acceptable, même sur vos sites financiers.

Avant d’en savoir plus sur les différentes formes, dissipons les mythes sur la façon dont Google traite le contenu dupliqué.

3 mythes sur le contenu dupliqué

Selon les personnes que vous suivez, vous pouvez entendre dire que le contenu dupliqué est la meilleure chose depuis le pain tranché. Et c’est pour cela que vous avez atterri ici. Vous voulez connaître la vérité sur le contenu dupliqué.

L’idée d’utiliser du contenu dupliqué est excellente. Elle permet aux spécialistes du marketing d’économiser du temps et de l’argent dans le classement. Cependant, vous vous méfiez peut-être des redoutables pénalités liées au contenu dupliqué.

3 Myths

Mythe n° 1 : le contenu “filé” ou “récupéré” est mauvais pour votre référencement.

Lorsque vous effectuez une recherche dans les moteurs de recherche, comment savez-vous que ce que vous lisez est unique ?

Voici les signes traditionnels :

  • Des phrases qui n’ont pas de sens.
  • Le contexte des mots est décalé.
  • Le contenu n’est pas fluide.

L’amélioration de la technologie de l’IA élimine désormais bon nombre des signes révélateurs d’articles de récupération.

Le contenu récupéré ou syndiqué n’est pas pénalisé lorsqu’il apporte une valeur ajoutée et du trafic pour le prouver.

Certains des sites les plus populaires et les mieux classés utilisent du contenu récupéré. Ils veulent les derniers et les meilleurs articles pour servir leur base de lecteurs. Ils y parviennent grâce au contenu récupéré.

Pensez-vous que les grandes entreprises parcourent le net à la recherche de quelqu’un qui a gratté ou dupliqué leur contenu ?

Le plus souvent, non. La majorité d’entre elles ne s’inquiètent pas du fait que le contenu récupéré puisse nuire à leur classement.

Vous ne devriez pas non plus.

Mythe 2 : Le contenu réutilisé nuit au classement de votre domaine

Google ne classe plus les sites entiers. Chaque page est jugée sur une base individuelle. Le contenu dupliqué ne nuit généralement pas à l’ensemble de votre site.

De nombreuses personnes utilisent du contenu dupliqué pour du contenu spécifique à un pays ou même pour le référencement local. À ce jour, cela est acceptable aux yeux de Google. À l’heure actuelle, ces versions du contenu dupliqué sont acceptables.

Si vous êtes pénalisé par une action manuelle pour l’ensemble de votre domaine, nettoyez autant que possible et déposez une demande de réexamen auprès de Google.

Si vous avez une pénalité, le vrai problème n’est probablement pas le contenu dupliqué.

Mythe n° 3 : le contenu dupliqué est un contenu dupliqué

Tous les types de contenu dupliqué ne sont pas égaux. Il existe huit types de contenu dupliqué.

  • Duplicata exact – Ils sont généralement dus à des problèmes techniques ou à la syndication. Vous trouverez ci-dessous des informations sur la façon de nettoyer le contenu technique en double.
  • Quasi-duplicata – Il s’agit d’un élément de contenu trouvé sur une page qui a été placé sur une autre page ou plusieurs pages avec de légères modifications.
  • Duplicata inter-domaines – Il s’agit d’un contenu dupliqué sur un domaine, puis republié sur un autre domaine. Google et d’autres moteurs de recherche peuvent masquer votre contenu dupliqué dans les résultats de recherche.
  • Contenu copié – Il s’agit d’une question de moralité. Google considère que le fait de copier sans autorisation le même contenu d’un site qui ne vous appartient pas est une erreur.

Si cela est découvert, le propriétaire initial de ce même contenu peut déposer une plainte pour contenu dupliqué.

Comme Google ne veut pas que vous manipuliez les résultats de recherche, il donnera la priorité au contenu original et pourra retirer votre page des SERPs.

Si la plupart des propriétaires de sites Web ne s’en aperçoivent jamais, certains y veillent.

  • Contenu sélectionné – Il existait autrefois des sites qui récupéraient les articles tendance et créaient des articles de blog à partir de ce même contenu.

    À l’époque de l’Ouest sauvage de Google, c’était un moyen populaire de classer un site Web. Elle est toujours utilisée aujourd’hui, mais légèrement modifiée pour être plus efficace.

    Google et les autres moteurs de recherche ne considèrent pas cette méthode comme du spam tant qu’il y a plus de contenu unique sur la page.
  • Contenu syndiqué – Le site le plus célèbre pour trouver de la syndication de contenu est le Huffington Post. Même les sites d’information sur le référencement utilisent la syndication. Le contenu syndiqué est un contenu Web qui est republié sur un autre site ou sur plusieurs URL.

    IFTTT est également un type de syndication. Il s’agit de placer votre article de blog, votre extrait ou votre vidéo sur plusieurs sites tiers.
  • Content Scraping – Wikipedia définit le web scraping (ou content scraping) comme suit : Le web scraping (web harvesting ou web data extraction) est une technique informatique d’extraction d’informations à partir de sites.

    Dans la mise à jour Panda de Google, certains sites de raclage de contenu ont été touchés.
  • Reproduction de contenu – Il s’agit de la duplication de contenu avec une touche d’originalité. C’est ce qu’on appelle le “content spinning”. La plupart des logiciels produisent un très mauvais content spinning.

S’il est fait à la main, il peut ressembler à du contenu de qualité.

Les logiciels, comme Spinrewriter, sont de plus en plus intuitifs. Même s’il n’est pas encore parfait, il est possible d’en faire du contenu frais avec un peu de nettoyage.

Sans nettoyage, l’expérience utilisateur risque d’être médiocre.

Technical Issues

Problèmes techniques à l’origine du contenu dupliqué

La plupart des personnes qui ne réutilisent pas délibérément du contenu peuvent constater qu’elles ont par inadvertance des erreurs de contenu dupliqué. Ces erreurs sont généralement de nature technique. Il s’agit d’un problème courant qui peut entraîner une perte de trafic.

Bien qu’elles n’entraînent pas de pénalité de la part de Google, il est bon de supprimer tout ce qui peut vous empêcher d’obtenir le premier résultat. Ou causer des drapeaux “contenu mauvais”.

Corrigez votre version canonique et vos redirections

Il est important d’avoir la bonne version canonique de votre domaine de premier niveau. Pour ce faire, vous devez définir le domaine canonique sur votre variation d’url préférée.

Si votre site est un non www mais un HTTPs, votre élément de lien canonique devrait être https://yourdomain.com.

Mais si votre serveur Web est mal configuré, il se peut que votre page unique soit affichée sous toutes ces formes par Google et d’autres moteurs de recherche :

your domain examples

Assurez-vous que vous utilisez correctement les redirections 301 vers vos paramètres d’URL préférés.

Définissez également la version canonique comme la structure URL préférée pour chaque page afin d’éviter la duplication du contenu dans Google.

Un léger bonus supplémentaire est que cela peut augmenter l’autorité de votre page, il n’y aura donc aucune ambiguïté. L’utilisation des versions canoniques dans le référencement devrait faire partie de tous vos systèmes de gestion de contenu standard.

Si vous avez plusieurs pages similaires, elles risquent de se cannibaliser mutuellement. Cela signifie qu’elles pourraient s’annuler efficacement les unes les autres. La mise en place d’un canonical sur chaque page vous aidera.

Microsoft, Google et Yahoo ! travaillent ensemble pour voir avec précision les pages uniques. En 2020, Google déclare : “Si votre site contient plusieurs pages dont le contenu est largement identique, il existe plusieurs façons d’indiquer votre URL préférée à Google. (Cela s’appelle la “canonicalisation”).”

Ajout d’une balise Canonical

Il suffit d’ajouter cette balise à la section head de vos pages.

<link rel=”canonical”href=”http://yoursite.com/dupicate-content-works”/>

Cela permet à Google de savoir exactement quelle url canonique vous souhaitez classer.

Remarque : il s’agit d’une indication pour Google et les autres moteurs de recherche. Les robots de classement des moteurs de recherche ont donc tous la possibilité de l’ignorer.

À moins que votre page ne présente des problèmes graves, ils en tiendront compte.

Si vous souhaitez utiliser un plugin. En voici deux que nous recommandons :

  • Yoast SEO ajoute des URLs canoniques à votre WordPress.
  • 301 Redirects – Easy Redirect Manager
Another Benefit To Canonicals

Un autre avantage des liens canoniques

Si le raclage de contenu vous préoccupe, vous pouvez empêcher les gens de voler votre contenu en ajoutant le lien rel=canonical à toutes vos pages.

Cela permet d’indiquer aux moteurs de recherche que votre contenu est l’original.

Il est important de noter que tous les scrapeurs ne récupèrent pas l’ensemble du code HTML de l’article, ce qui peut ne pas fonctionner avec tous les scrapeurs.

Les pages d’index peuvent être du contenu dupliqué

Une page d’accueil peut toujours être accessible par différentes URL sans que vous le sachiez. Cela est dû à une mauvaise configuration du serveur web.

En dehors de https://yourdomain.com, une page d’accueil peut être accessible par les URL suivantes :

  • https://yourdomain.com/index.html
  • https://yourdomain.com/index.php
  • https://yourdomain/index.php?r…
  • https://yourdomain.com/index.asp
  • https://yourdomain.com/index.aspx

Lorsque nous les regardons, elles représentent toutes la même page pour nous. Mais pour un robot de recherche, chacune d’entre elles est une page unique.

Choisissez-en une pour votre page d’accueil. Vous mettrez ensuite en place une redirection 301 de la version non préférée vers la version préférée.

Si le site Web utilise l’une des URL pour le contenu, les pages doivent être canonisées car la redirection les brisera.

Use Google Search Console To Find Duplicate Content

Utilisez la console de recherche Google pour trouver le contenu dupliqué

Google Search Console n’est pas seulement utile pour les performances et les liens du site, mais aussi pour savoir si vous devez résoudre les problèmes de contenu dupliqué.

L’ajout de votre site à Google Search Console peut vous aider à voir comment Google voit vos pages Web sur votre site.

Une fois dans Google Search Console, allez dans Performance. Sous les résultats de recherche, vous verrez les éventuels problèmes de duplication.

Liens internes et contenu dupliqué

Nous soulignons l’importance des liens internes pour le contenu de votre site Web. Si votre lien canonique est défini sur https://yourdomain.com/duplicate-conent-rules, assurez-vous que chaque lien interne vers cette page utilise la même URL de la même manière.

Si l’URL canonique est définie sur https://yourdomain.com/internal-links/, assurez-vous que tout le contenu de votre site Web qui sera lié à cette page est exact.

Si vous achetez des liens par le biais de services tels que SEONitro de Dori, assurez-vous que vos liens entrants provenant de sites à forte autorité de domaine correspondent à votre URL canonique.

Rappelez-vous : vous voulez que toute l’autorité de domaine de ces sites soit entièrement transmise à votre site.

Dori se donne beaucoup de mal pour s’assurer que la métrique des liens poussera l’aiguille du classement. L’utilisation du chemin de lien correct vous aidera à bénéficier de cette équité de lien.

Threshold For Duplicate Content

Existe-t-il un seuil pour le contenu dupliqué ?

Il existe un moyen simple de savoir si Google considère votre contenu comme unique. Prenez un morceau de contenu et collez-le dans la barre de recherche de Google. Il s’agit de l’un des vérificateurs de contenu dupliqué les plus précis.

Si Google voit un contenu original, les résultats du moteur de recherche seront normaux. En revanche, si Google considère que ce contenu est dupliqué, vous obtiendrez le résultat suivant.

Page Optimizer Pro

Voici trois des outils les plus populaires de vérification du contenu dupliqué. Ils vous aideront à identifier facilement le contenu dupliqué :

  • Duplichecker.com – Il suffit d’entrer votre texte pour qu’il vérifie tous les contenus dupliqués sur le Web. La version gratuite est limitée à 1 000 mots.
  • Siteliner.com – Pour ce vérificateur interne de contenu dupliqué, il suffit d’entrer votre adresse et cela vous aidera à déterminer le contenu dupliqué sur votre site.
  • Copyscape.com – L’un des originaux pour trouver le contenu dupliqué sur Internet. Il s’agit d’un logiciel payant.
What Our SEO Testing Reveals

Ce que nos tests de référencement révèlent…

Le contenu dupliqué va-t-il assécher votre site et nuire à votre classement SEO ? En fin de compte, nous n’avons pas pu obtenir de facteur négatif. La page cible avait tout ce contenu dupliqué et ne s’est pas transformée en facteur négatif.

Il n’y a pas de pénalité pour le contenu dupliqué. Google ne vous pénalisera pas avec une pénalité pour contenu dupliqué.

Le contenu dupliqué vous mettra-t-il dans une sandbox ? Nous n’avons pas obtenu de sandbox. Le bac à sable est l’idée que quelque chose qui ne sera pas classé pendant des jours ou des semaines.

Quelle quantité de contenu dupliqué devez-vous avoir ? Bien que nous n’ayons pas été pénalisés par le contenu dupliqué, nous savons que Google filtrera les résultats de recherche.

Si vous êtes filtré, vous pouvez corriger le contenu dupliqué sur votre propre site en utilisant les méthodes décrites dans cet article.

Nous avons constaté que tant que vous avez 51% de contenu unique, c’est un moyen d’éviter le filtre. Comme Google a des scores différents pour les différents mots clés, vous pouvez avoir besoin d’un pourcentage plus élevé de contenu unique pour être classé.

moomba on google

Le contenu de votre site Web et les SERP

Selon les lignes directrices de Google, le contenu dupliqué sur votre site Web n’est pas un motif d’action sur ce site, sauf s’il apparaît que l’intention du contenu dupliqué est d’être trompeur et de manipuler les résultats des moteurs de recherche.

En 2015, John Mueller a déclaré : ” Pas de pénalité pour le contenu dupliqué ” mais ” Nous avons certaines choses autour du contenu dupliqué … qui méritent une pénalité. “

Google sait que les utilisateurs veulent des articles divers et originaux à consommer. Pas le même article encore et encore. Il ne veut pas que les lecteurs atterrissent sur votre site et voient les mêmes informations remaniées trouvées ailleurs.

Rien à voir ici, avancez.

Google veut des articles uniques, pertinents par rapport à la requête du chercheur, informatifs et originaux pour les lecteurs. Les baisses de score de qualité vont vous atteindre si vous utilisez beaucoup de contenu dupliqué.

Easy Solutions At A Glance

Des solutions simples en un coup d’œil

Il est frustrant d’avoir des pages qui ont disparu des résultats des moteurs de recherche. Vous avez gaspillé de l’argent sur les budgets de crawl. Le trafic chute. Et vos clients SEO commencent à vous appeler. Le contenu dupliqué peut être une grosse épine dans le pied pour de nombreux spécialistes du marketing SEO ignorants.

Bien qu’il existe des solutions faciles à mettre en œuvre, sachez que la solution peut varier en fonction de la situation.

La règle des 51

Dupliquer le contenu rend la vie tellement plus facile. Assurez-vous simplement d’avoir une page qui est unique à 51% et vérifiez le classement dans les moteurs de recherche pour voir si elle sera filtrée.

Paramètres Google

En configurant cette option, vous informerez Google des paramètres qui fonctionnent, au lieu d’attendre qu’il s’en rende compte.

Rel=”alternate”

Ce paramètre est utilisé pour consolider la version alternative d’une page (pages mobiles ou pages pays/langue). Pour la page pays/langue, hreflang est utilisé pour afficher le résultat correct.

Selon John Mueller lors du Webmaster Hangout, la correction du hreflang n’augmentera pas le classement. Cependant, cela aidera à afficher la version correcte. En effet, les versions alternatives ont déjà été identifiées par Google et les signaux ont été consolidés pour différentes pages.

Définissez votre rel=canonical

Ce point est particulièrement important dans la lutte contre le contenu dupliqué. Nous avons constaté que l’utilisation d’une balise meta robots noindex n’est pas assez efficace.

Au lieu de cela, nous utilisons la rel=canonical pour désigner chaque URL de vos pages.

Assurez-vous que les mots-clés et les pages que vous visez ne seront pas cannibalisés.

Les paramètres URL dans le référencement

Les paramètres URL sont importants lorsqu’il s’agit de contenu dupliqué. Les paramètres d’URL sont souvent créés de manière dynamique. Cela conduit à la création de nombreuses pages avec un contenu identique ou similaire.

Ces paramètres URL apparaissent dans les résultats de recherche et sont filtrés comme des résultats similaires ou considérés comme du contenu de faible qualité.

Si vous trouvez des paramètres qui sont purement dupliqués et qui n’offrent pas de valeur indépendamment de la page originale, ajoutez un canonical. Veillez à le faire pointer vers la page d’origine.

Redirections 301

Cela permettra d’éviter les problèmes de duplication des pages en empêchant l’affichage de versions alternatives.

Conclusion

Nous avons testé et pouvons confirmer qu’il n’y a pas de pénalité pour contenu dupliqué. Vous savez maintenant que Google traite le contenu dupliqué en filtrant les résultats dans les SERPs.

Les problèmes de contenu dupliqué existent. Si vous êtes confronté à un problème technique de contenu dupliqué, il peut être facilement résolu. Et vous savez maintenant comment l’éviter à l’avenir.

Google n’a pas de problème avec le contenu dupliqué. Il a plutôt un problème avec le contenu de mauvaise qualité et de mauvaise expérience utilisateur. Cela aura un effet négatif sur vos résultats de recherche.

Si vous utilisez du contenu dupliqué, assurez-vous d’utiliser 51 % de contenu unique pour être sûr. Gardez un œil sur vos scores de qualité.

En utilisant correctement le contenu dupliqué, vous constaterez un meilleur retour sur investissement pour le temps et l’argent investis dans votre gestion de contenu.