URLs canoniques : 3 facteurs à prendre en compte dans la canonisation pour le SEO

Qu'est-ce qu'une URL canonique ? Pourquoi en avez-vous besoin et comment en créer une ?
SIA Team
July 23, 2021

Le contenu dupliqué peut parfois exister sur un site Web, en particulier pour les sites de grande taille tels que les sites de commerce électronique qui proposent de nombreux produits dans différentes variantes. C’est également le cas pour les sites de blog et certains articles de blog qui sont republiés sur d’autres sites web par l’auteur. Le contenu dupliqué, même s’il ne constitue pas une pénalité, pose tout de même quelques problèmes, notamment en ce qui concerne la recherche et le classement dans Google et les autres moteurs de recherche. C’est là qu’interviennent les urls canoniques et l’utilisation des balises canoniques.

Dans cet article, nous allons parler des urls canoniques, de ce qu’elles sont, de l’importance de définir des balises canoniques et de la façon de définir un élément de lien canonique. Je fournis également 3 facteurs à prendre en compte lors de la mise en place de la canonisation des URL pour un bénéfice SEO.

Bien que je parle de ” 3 facteurs “, il se peut qu’il y en ait plus que ce que nous avons décrit ci-dessous. Cela dépend de quelques éléments, tels que le nombre de pages ou d’éléments de contenu de votre site, le nombre de vos pages pouvant être considérées comme des pages dupliquées, la façon dont les identifiants de suivi sont ajoutés à vos URL, et une foule d’autres facteurs.

Dans cette optique, Google dispose d’une page qui fournit des informations plus détaillées : https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls.

Les arguments en faveur de la canonisation du référencement et de l’URL canonique

Vous le savez probablement, mais vous n’y avez pas vraiment réfléchi.

Vous voulez aller sur un certain site Web, disons Google ou Facebook.

Vous tapez google.com ou facebook.com.

Bien.

Vous savez également que si vous tapez www.google.com ou www.facebook.com (en insistant sur la partie www.), vous accédez aux mêmes sites.

Ainsi, pour la plupart des domaines de premier niveau, que vous tapiez ou non la partie www. de l’adresse, vous êtes conduit là où vous voulez aller. (Cela ne fonctionne pas tout à fait avec les adresses qui contiennent des sous-domaines non www, mais nous nous éloignons du sujet).

Pour la plupart des visiteurs, il n’y a aucune différence entre google.com et www.google.com (techniquement, il y en a une, et les gens sont parfois dirigés vers la version www, mais cela sort de notre champ d’action).

Donc, en ce qui nous concerne, il n’y a pas de différence.

Mais, pour les moteurs de recherche et leurs crawlers, il peut y en avoir une.

Cela nous amène à la vieille discussion sur le contenu dupliqué.

Contenu dupliqué (et nécessité d’une URL canonique)

what is url canonicalization - seointel

Dissipons un malentendu : il n’y a pas de pénalité pour contenu dupliqué en soi ; il s’agit plutôt d’un filtre.

Définissons d’abord le contenu dupliqué : il s’agit en gros de deux ou plusieurs pages (urls) différentes dont le contenu est suffisamment identique pour être pratiquement le même. C’est presque comme avoir une copie originale d’un document et avoir une photocopie de ce document.

Si vous considérez un grand site de commerce électronique avec de très nombreux produits, il est possible que deux pages ou plus aient un contenu dupliqué.

Prenons l’exemple de deux widgets qui sont identiques à 99 %, la seule différence étant leur couleur.

Si chacun de ces gadgets avait une page distincte, il y aurait effectivement 2 pages qui partageraient un contenu identique à 99 % (dupliqué).

(En fait, nous n’avons même pas besoin d’utiliser l’exemple de 2 pages distinctes : il peut y avoir différentes variations d’url d’une même page, et cela peut conduire à du contenu dupliqué).

Google le sait, c’est pourquoi il ne pénalise pas les sites pour cela. Il s’agit plutôt d’un processus de filtrage : il essaie de proposer la page qu’il juge la meilleure pour l’utilisateur. (Dans ce cas, le facteur de différenciation peut être la page qui reçoit le plus de trafic, ou le plus populaire des deux widgets). Ensuite, les versions dupliquées sont filtrées des résultats.

Quoi qu’il en soit, vous vous demandez probablement : “Si les problèmes de contenu dupliqué n’entraînent pas de pénalité, qu’est-ce qui les rend si mauvais ? Pourquoi ce débat ?”

Eh bien, le contenu dupliqué n’est pas un problème énorme, mais idéalement, c’est quelque chose à éviter.

Qu’est-ce que la canonisation des URL ?

La canonisation d’URL ou l’ajout d’une balise canonique à vos urls est une balise qui indique aux moteurs de recherche que l’url canonisée est la version originale de la page et que les pages non canoniques sont des versions dupliquées de la page originale.

L’ajout de la balise canonique rel=”canonical” permet d’éviter les problèmes causés par le contenu dupliqué qui apparaît dans différentes pages d’un site. Comme je l’ai mentionné précédemment, bien qu’il n’y ait pas de pénalité pour le contenu dupliqué, le même contenu qui apparaît dans plusieurs pages déclenche un filtre qui élimine certains contenus dupliqués. C’est à l’algorithme de recherche de choisir quelle page particulière parmi les pages à contenu dupliqué sera classée dans les résultats de recherche.

seo canonicalization banner - seo intelligence agency

L’utilisation d’une balise canonique indique aux moteurs de recherche qu’il s’agit de la pièce originale et que c’est ce qui doit apparaître dans les résultats de recherche. Ainsi, les pages que vous ne souhaitez pas voir classées ne le seront pas et ce qui sera classé sera la source originale que vous souhaitez voir classée. La bonne page obtiendra également le trafic organique de la requête de recherche.

La canonisation résout le contenu dupliqué et consolidera probablement le ” jus de lien ” de votre site.

Nous avons commencé cet article en parlant des versions www. et non-www. des sites Web (par exemple, www.facebook.com et facebook.com).

Lorsque Googlebot (ou la plupart des robots de recherche) voit une page qui a des variations www. et non-www., il se pose la question suivante : “Hé, je vois 2 urls différentes qui ont le même contenu. Si je devais choisir, laquelle devrais-je privilégier par défaut ?”

how google bot sees two different urls with same content

Ce n’est pas un dilemme pour Google : le cas échéant, il prendra une décision et choisira l’une des urls, même si vous n’en déterminez pas une en utilisant une balise canonique.

Mais il y a autre chose à prendre en compte.

Si vous êtes un tant soit peu intéressé par l’avantage SEO que représente un contenu unique (non dupliqué) et le “jus de lien” qui vient sur votre site, il y a peut-être une raison plus importante pour laquelle vous devriez envisager la canonisation.

Qu’est-ce que le “jus de lien” ?

Le jus de lien est un terme que nous utilisons dans le secteur du référencement. Sans trop entrer dans les détails, il s’agit en fait d’un écho de quelque chose que Google avait l’habitude d’afficher publiquement : le Page Rank. (Le Page Rank n’est plus disponible publiquement, bien qu’il puisse être utilisé en interne chez Google).

Quoi qu’il en soit, l’essentiel de ce que j’essaie de dire est que la plupart des pages Web qui sont indexées par Google ont une sorte de mérite ou de pouvoir de “vote”.

L’un des facteurs utilisés par Google pour classer une page Web (et un site) est lié aux liens pointant vers cette page. Chaque fois qu’une page Web est liée à une autre page Web (que ce soit à l’intérieur d’un site ou d’un site à un autre), cela compte comme un “vote” en faveur de la page à laquelle le lien renvoie.

Diagram of non canonical url specified as canonical

Ainsi, lorsqu’une page Web établit un lien vers une autre page Web, ou ” vote ” pour elle, un certain ” jus de lien ” circule de cette page Web vers la page à laquelle elle est liée (en général).

Ce que je vais dire est un peu trop simpliste, mais il illustre mon propos : plus il y a de sites qui renvoient au vôtre, mieux c’est.

“D’accord”, dites-vous. “Alors, qu’est-ce que cela a à voir avec la canonisation ?”

L’URL canonique et le “jus de lien”.

Disons que deux sites ont un lien vers votre page d’accueil. L’un d’eux utilise une url non www (comme votre site.com) et l’autre une url www (comme www.yoursite.com).

Le jus de lien circule de chacun de ces deux sites vers deux versions différentes de votre site.

Pensez-y : ce capital de liens est dilué de 50 %.

Ne serait-il pas préférable de consolider le jus de lien et de le diriger vers une version privilégiée de votre site, de sorte qu’au lieu de bénéficier des avantages d’un seul site qui vous lie, vous bénéficiez des avantages des deux sites qui vous lient ?

En toute transparence, nous ne savons pas exactement comment fonctionne l’algorithme de Google, et ce que je viens d’expliquer est un peu trop simpliste, mais nous avons des raisons de croire que c’est une bonne façon de penser.

C’est pourquoi la canonicalisation peut être bénéfique pour le référencement. Elle vous aide à consolider vos URL et à tirer un maximum de “jus de lien” des liens qui pointent vers votre site. La définition d’une url canonique appropriée pour les versions dupliquées de votre site indique au moteur de recherche que ces versions non canoniques sont des versions dupliquées et il peut alors compter tous les signaux de liens pointant vers les autres versions comme des liens vers la version canonique. C’est le bénéfice SEO que vous pouvez tirer de la mise en place de vos pages canoniques – renforcer votre construction de liens avec des métriques consolidées et s’assurer que les liens sont appropriés à la bonne page.

Trois facteurs à prendre en compte lors de la canonisation de votre site

Avant d’aborder les trois facteurs, nous tenons à vous informer que, selon la complexité de votre site, vous devrez peut-être prendre en compte plus que ces trois facteurs lorsque vous mettrez en œuvre la canonisation. Cela dit, nous pensons que les 3 facteurs suivants sont à prendre en compte par tout webmaster.

HTTPS ou HTTP ?

Décidez si vous aurez un site HTTPS ou simplement un site HTTP. Nous vous conseillons d’opter pour le protocole de transfert hypertexte sécurisé (HTTPS), qui implique le protocole SSL (Secure Sockets Layer). SSL signifie que les données partagées entre l’utilisateur final et le site sont cryptées (sécurisées).

La plupart des bons hébergeurs modernes proposent le SSL gratuit. Si votre hébergeur ne le propose pas, il existe peut-être d’autres moyens de mettre en œuvre le SSL sur votre site. Si vous utilisez WordPress, il existe peut-être un plugin qui peut le faire gratuitement pour vous. Un tel plugin à considérer pourrait être WP Encryption – One Click SSL & Force HTTPS.

Lorsqu’il s’agit de passer de HTTP à HTTPS, une autre option à envisager est de définir des codes de statut de redirection 301 de vos pages HTTP vers vos pages HTTPS. Cette solution est plus simple et permet de réduire les risques de duplication de contenu.

Activez la canonisation à l’échelle du site

Oui, chaque page a un paramètre url différent et, par conséquent, la canonicalisation est effectuée page par page, mais selon les solutions dont vous disposez, vous pouvez mettre en œuvre la canonisation automatiquement sur chaque page de votre site.

C’est l’idéal si votre site a une structure d’url très gérable et si vous n’avez pas plusieurs pages de produits qui présentent essentiellement le même produit. (Si vous utilisez WordPress, un bon plugin de référencement peut avoir cette fonction. Un exemple d’un plugin qui a cette fonction est Yoast SEO)

Vous devrez peut-être traiter les pages individuelles différemment

Si votre site est récent et peu complexe, cette étape ne s’applique peut-être pas à vous, mais il faut tout de même en tenir compte pour l’avenir.

Par exemple, regardez cette url :

http://example.com/dresses/cocktail?gclid=ABCD

Maintenant, regardez celle-ci :

https://www.example.com/dresses/green/greendress.html

why use canonicalization for your urls - seo intelligence agency

Ils ont tous deux l’air très différents, parce que :

  • L’un est un HTTP, l’autre est sécurisé (HTTPS).
  • L’un est un non-www (le premier), le second est un www.
  • Le premier a quelques caractères qui ne sont pas vraiment discernables.
  • Le second a une structure url plus propre, plus descriptive et moins ambiguë.

Cependant, croiriez-vous que, malgré leur différence, ces deux urls ont le même contenu ?

Oui, bien que ces urls soient purement hypothétiques, elles sont des exemples de ce que peuvent être, en théorie, deux pages Web apparemment différentes qui sont en fait les mêmes. Nous avons en fait tiré cet exemple de la page Web de Google sur la consolidation des URL.

https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls
Si votre site Web présente un certain niveau de complexité, ou si sa structure d’URL ressemble à celle illustrée ci-dessus, vous devrez peut-être prendre des mesures supplémentaires pour vous assurer que chacune de ces pages est canonisée individuellement.

Comment définir les balises canoniques sur une page

Nous allons vous montrer comment ajouter des balises canoniques au code d’une page Web. Ne vous inquiétez pas, si vous utilisez un système de gestion de contenu comme WordPress, Wix, Shopify ou toute autre plateforme moderne de création de sites, cela devrait être assez simple. Il existe également des plugins WordPress qui vous permettent de définir des pages canoniques. Ce que nous voulons que vous gardiez à l’esprit, c’est que la canonisation (du moins la façon dont nous allons vous montrer) se fait page par page).

Nous avons déjà établi que le même contenu peut apparaître sur deux URL différentes (c’est-à-dire une version www. et une version non-www.), et nous vous avons parlé de l’avantage pour le référencement de consolider ces 2 versions et d’en déclarer une comme étant la version par défaut (l’URL canonique correcte).

Alors, comment faire ?

<link rel=”canonical” href=”https://seointel.com/” />

En établissant qu’une certaine url (version d’une page Web) est l’url canonique. Une URL canonique est établie par une ligne de code html appelée rel=”canonical”.

En termes de code, voici à quoi cela ressemble :

Cette ligne de code est placée dans la section http header du code source de la page, entre les balises head ouvrante et fermante. (Il existe des balises d’en-tête et d’autres balises d’en-tête. Ici, nous parlons des balises d’en-tête).

Si vous regardez cette ligne de code, elle indique essentiellement que la version non-www de cette page est la version canonique – ou, en d’autres termes, la version par défaut. Ainsi, en supposant qu’il existe un lien vers https://www.seointel.com (la version www), la version canonique est celle qui sera référencée. Elle fusionne les deux pages en une seule, du point de vue des moteurs de recherche. Le code est une redirection douce sans rediriger réellement l’utilisateur vers une autre page.

Une fois que c’est fait, c’est un signal pour les moteurs de recherche pour savoir quelle page est la version originale qu’ils classeront dans la recherche, et quelle page obtiendra tout le jus de lien.

Le cas de l’URL canonique auto-référencée

L’URL canonique auto-référencée consiste essentiellement à définir une balise canonique de la page d’origine vers elle-même. Cela permet d’affirmer que la page originale est bien la version originale.

Si vous syndiquez votre contenu pour le publier sur différents sites Web, il est préférable d’utiliser une balise canonique autoréférentielle sur votre article original également et de faire en sorte que la page syndiquée spécifie des URL canoniques inter-domaines, c’est-à-dire qu’elle établisse que sa version est une version canonique et que la vôtre est l’originale. Bien que la mise en place d’une balise canonique auto-référencée n’empêche pas toujours la version syndiquée d’apparaître dans les résultats de recherche, elle permet de réduire le risque que les versions syndiquées surclassent le contenu original.

Nous espérons vous avoir montré les avantages pour le référencement de la mise en place d’URL canoniques pour votre site et vos pages individuelles. La canonisation permet de résoudre les problèmes de contenu dupliqué, de consolider plusieurs URL de produits en un seul produit pour qu’il apparaisse dans une requête de recherche, de faire en sorte que votre contenu soit étiqueté comme la version originale, de permettre aux moteurs de recherche de savoir quelle page particulière classer et d’obtenir le maximum de “jus de lien” des sites qui renvoient au vôtre. Nous espérons qu’avec ce guide, vous serez en mesure d’appliquer correctement les balises canoniques et le champ d’url canonique, et que vous obtiendrez un meilleur classement pour les bonnes pages de votre site.

DK Fynn
SIA STAFF SEO WRITER