Durante años (aparentemente, edades en el tiempo de Internet), ha habido una pregunta recurrente: ¿es el contenido duplicado una penalización o un filtro?
Esta pregunta, que parece simple, en realidad puede provocar muchos malentendidos y respuestas incorrectas de las personas.
Entonces, voy a tratar de resolver las cosas aquí.
Comenzaré con la definición de contenido duplicado.
Una definición de contenido duplicado es esta: tener 2 o más páginas (o URL) en un sitio web (o dominio) que tienen, en general, el mismo contenido. Es decir, son duplicados.
(Sé que puede haber 2 o más páginas que solo pueden tener contenido parcialmente duplicado. Es decir, contenido que es demasiado duplicado, pero no 100% idéntico. Si bien no quiero entrar en detalles extraños sobre qué porcentaje de contenido duplicado es un punto de referencia para la preocupación, hemos descubierto que hay una regla del 51%).
Por qué es posible que desee estar seguro de cómo se maneja el contenido duplicado en su sitio
Algunas plataformas de sitios web, como WordPress, dependiendo de cómo se establezcan las instalaciones individuales, pueden generar contenido duplicado.
Un ejemplo son las páginas de etiquetas. En algunos sitios con WordPress, las páginas de etiquetas se crean automáticamente, y cada una de estas páginas contiene muestras de blog de las muchas publicaciones dentro de esa etiqueta.
(Las páginas de etiquetas no deben confundirse con las páginas de categorías, aunque en este contexto, puede tener lugar el mismo proceso, el contenido duplicado).
Si sus páginas de etiquetas están configuradas en noindex (lo que se puede hacer en wp-admin, debería estar bien).
Muy bien, con eso en mente, pasemos al tema real de esta noticia.
La semana pasada, Google dio una de sus numerosas sesiones de preguntas y respuestas, y esta específica es el Horario de oficina de Google SEO en inglés a partir del 8 de octubre de 2021.
Durante esta sesión en particular, se le preguntó a John Mueller de Google:
“¿Afecta negativamente a nuestro rendimiento SEO en términos de … estas son páginas duplicadas pero, canonicalizadas…?”
Este video está en cola a ~ la marca de 2 minutos y 35 segundos, que es aproximadamente donde se hizo la pregunta.
La respuesta de Juan fue:
“No, no… está perfectamente bien. Es puramente una cuestión de… el lado rastrero de las cosas. Si vemos que están duplicados, intentaremos tratarlos como duplicados y solo nos centraremos en una URL canónica para ellos”.
El contenido duplicado no afecta negativamente al SEO… al menos, no si…
… No si al menos una de esas páginas tiene una etiqueta canónica.
Pero… ¿Qué es la canonicalización?
Una breve introducción a la canonicalización
En julio de 2021, escribí sobre la canonicalización, que puedes leer haciendo clic aquí.
En resumen, digamos que tiene páginas web (o URL) A, B y C, todas las cuales son completamente idénticas.
Para la canonicalización, lo que tendría que hacer es designar una de esas páginas como la original, o la que desea indexar. Digamos que eliges A.
Entonces, pones una etiqueta canónica en B y C, refiriéndose a A. Básicamente estás diciendo: “Quiero que A sea la página que se vea como la referencia para este contenido”.
El contenido duplicado no es una penalización per se; Es más un filtro
Y eso tiene sentido, ¿verdad? Google, especialmente si usas canonicalización o noindexas tus duplicados, no va a penalizar tu sitio. En cambio, como se describe en el ejemplo de canonicalización anterior, es más probable que use un proceso de filtrado e intente buscar canónicos (o noindex) para tratar de encontrar uno que desee indexar.