¿El mismo contenido en PDF y en HTML se considera contenido duplicado?

¿Tener un pdf y el mismo contenido en un artículo de blog HTML en el mismo sitio, se considera contenido duplicado? ¿Tendrán un impacto negativo en el sitio?
Marie Aquino
February 22, 2022

En el Google SEO Office Hours del pasado 18 de febrero, un usuario preguntó si tener un pdf y el mismo contenido en un artículo de blog HTML en el mismo sitio, se considera contenido duplicado. ¿Tener el mismo contenido pero entregado de forma diferente, tendrá un impacto negativo en el sitio?

John Mueller respondió que no verían el archivo PDF y el artículo de blog HTML como contenido duplicado porque son tipos de contenido diferentes.

Uno es una página HTML y el otro un PDF.

Aunque el contenido principal es el mismo, el conjunto que lo rodea es diferente.

En cuanto a cualquier efecto negativo, lo más difícil que puede ocurrir es que ambos aparezcan en los resultados de búsqueda al mismo tiempo. Aunque si te gustaría que eso ocurriera o no, es más una cuestión estratégica.

Para Mueller, no lo ve como algo negativo en cuanto a SEO, pero quizás para el usuario, hay razones estratégicas para que sólo aparezca el PDF o la página HTML en la búsqueda.

Sin embargo, pueden competir entre sí en los resultados de búsqueda. En la mayoría de los casos, los PDF son menos visibles porque están menos vinculados al resto del sitio web.

Realmente dependería del propietario del PDF o de la página HTML es la página preferida para ser indexada y clasificada o incluso ambas.

Tiene la opción de establecer un canonical a la página que prefiere clasificar y también de no indexar la página que no quiere clasificar.

Gran información sobre los diferentes tipos de contenido y el contenido duplicado. Tal vez los SEOs pueden llegar a un hack haciendo uso de tales, en el dominio de los SERPs. ¿Qué opinas?

Para más detalles, consulte el episodio SEO Office Hours en: