Le même contenu en PDF et en HTML est-il considéré comme un contenu dupliqué ?

Le fait d'avoir un pdf et le même contenu dans un article de blog en HTML sur le même site, est-il considéré comme du contenu dupliqué ? Auront-ils un impact négatif sur le site ?
Marie Aquino
February 22, 2022

Lors des Google SEO Office Hours du 18 février dernier, un utilisateur a demandé si le fait d’avoir un pdf et le même contenu dans un article de blog en HTML sur le même site, est considéré comme du contenu dupliqué. Le fait d’avoir le même contenu, mais diffusé différemment, aura-t-il un impact négatif sur le site ?

John Mueller répond qu’il ne considère pas le fichier PDF et l’article de blog en HTML comme du contenu dupliqué, car il s’agit de types de contenu différents.

L’un est une page HTML tandis que l’autre est un PDF.

Même si l’élément principal du contenu est le même, tout ce qui l’entoure est différent.

En ce qui concerne les effets négatifs, le plus difficile est que les deux sites apparaissent en même temps dans les résultats de recherche. Mais que vous souhaitiez que cela se produise ou non, c’est plus une question de stratégie.

M. Mueller ne voit pas cela comme un inconvénient en matière de référencement, mais peut-être que pour l’utilisateur, il y a des raisons stratégiques pour que seule la page PDF ou HTML apparaisse dans les résultats de recherche.

Ils peuvent cependant se faire concurrence dans les résultats de recherche. Dans la plupart des cas, les PDF sont moins visibles simplement parce qu’ils sont moins liés au reste du site Web.

C’est au propriétaire du PDF ou de la page HTML qu’il revient de choisir la page à indexer et à classer, voire les deux.

Vous avez la possibilité de définir un canonical vers la page que vous préférez classer et de ne pas indexer la page que vous ne souhaitez pas classer.

De bonnes idées sur les différents types de contenu et le contenu dupliqué. Peut-être les SEO peuvent-ils trouver un moyen d’utiliser ces éléments pour dominer les SERPs. Qu’en pensez-vous ?

Pour plus de détails, consultez l’épisode SEO Office Hours à l’adresse suivante :