El contenido duplicado a veces puede existir en un sitio web, especialmente para sitios más grandes, como sitios de comercio electrónico que ofrecen muchos productos en diferentes variaciones. Este es también el caso de los sitios de blog y algunas publicaciones de blog que el autor vuelve a publicar en otros sitios web. El contenido duplicado, aunque no es una penalización, todavía plantea algunos problemas, especialmente cuando se trata de búsqueda y clasificación en Google y otros motores de búsqueda. Aquí es donde entran en juego las urls canónicas y el uso de etiquetas canónicas.
En este artículo, hablaremos sobre las urls canónicas, qué son, la importancia de establecer etiquetas canónicas y cómo establecer un elemento de enlace canónico. También proporciono 3 factores a considerar al configurar la canonicalización de URL para beneficio de SEO.
Si bien digo ‘3 factores’, podría haber más de lo que hemos descrito a continuación. Esto depende de algunas cosas, como cuántas páginas o contenido tiene su sitio, cuántas de sus páginas pueden considerarse como páginas duplicadas, cómo se agregan los ID de seguimiento a sus URL y una serie de otros factores.
Con eso en mente, Google tiene una página que se sumerge en un detalle un poco más extenso: https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls
Probablemente lo sepas, pero no lo has pensado mucho.
Quieres ir a un determinado sitio web, digamos, Google o Facebook.
Escribe google.com o facebook.com
Bien.
También sabe que si escribe www.google.com o www.facebook.com (énfasis en la parte www.) va a los mismos sitios.
Por lo tanto, para la mayoría de los dominios de nivel superior, ya sea que escriba o no en www. parte de la dirección, se le lleva a donde quiere ir. (Esto no funciona del todo con direcciones que tienen subdominios que no son www, pero estamos divagando).
En lo que respecta a la mayoría de los visitantes, no hay diferencia entre google.com y www.google.com (Técnicamente, lo hay, y las personas a veces son dirigidas a la versión www, pero eso está fuera de nuestro alcance).
Entonces, en lo que a nosotros respecta, no hay diferencia.
Pero, para los motores de búsqueda y sus rastreadores de búsqueda, puede haberlo.
Eso nos lleva a la discusión de años de antigüedad sobre el contenido duplicado.
Aclaremos un concepto erróneo: no hay penalización por contenido duplicado per se; más bien, es más un filtro.
Primero definamos el contenido duplicado: es aproximadamente donde dos o más páginas diferenciadas (urls) tienen suficiente contenido idéntico que son prácticamente iguales. Es casi como tener una copia original de un documento y tener una fotocopia de ese documento.
Si considera un sitio de comercio electrónico grande con muchos, muchos productos, existe la posibilidad de que 2 o más páginas tengan contenido duplicado.
Por ejemplo, considere 2 widgets que son 99% idénticos, la única diferencia es su color.
Si cada uno de estos widgets tuviera una página separada, efectivamente habría 2 páginas que comparten un 99% de contenido idéntico (duplicado).
(De hecho, ni siquiera tenemos que usar el ejemplo de 2 páginas separadas: puede haber diferentes variaciones de URL de una sola página, y eso puede llevar a contenido duplicado).
Google lo sabe, por lo que no penalizan a los sitios por esto. En cambio, es más un proceso de filtración que tiene lugar: intentan ofrecer la página que creen que es mejor para el usuario. (En este caso, tal vez un factor diferenciador puede ser la página que recibe más tráfico, o el más popular de los dos widgets). Luego, las versiones duplicadas se filtran de los resultados.
De todos modos, probablemente te estés preguntando: “Si los problemas de contenido duplicado no causan una penalización, ¿qué lo hace tan malo? ¿Por qué el debate?”
Bueno, el contenido duplicado no es un gran problema, pero idealmente, es algo que debe evitarse.
La canonicalización de URL o agregar una etiqueta canónica a sus urls es una etiqueta que indica a los motores de búsqueda que la URL canonicalizada es la versión original de la página y que las páginas no canónicas son versiones duplicadas de la página original.
Agregar la etiqueta canónica rel=”canonical” evita problemas causados por contenido duplicado que aparece en diferentes páginas de un sitio. Como mencioné anteriormente, si bien no hay penalización por duplicado, el mismo contenido que aparece en varias páginas activa un filtro que filtra algunos contenidos duplicados. Depende del algoritmo de búsqueda elegir qué página en particular entre las páginas con contenido duplicado se clasificará en los resultados de búsqueda.
El uso de una etiqueta canónica le dice a los motores de búsqueda que esta es la pieza original y esto es lo que debería aparecer en los resultados de búsqueda. De esta manera, las páginas de clasificación que no le gustaría ser clasificadas no sucederán y lo que se clasificará será la fuente original que le gustaría ser clasificada. La página correcta también obtendrá el tráfico orgánico de la consulta de búsqueda.
Abrimos este artículo hablando de www. y no www. versiones de sitios web (es decir, www.facebook.com y facebook.com).
Cuando Googlebot (o la mayoría de los robots de búsqueda) ve una página que tiene www. y no www. hipotéticamente pregunta: “Oye, veo 2 urls diferentes que tienen el mismo contenido. Si tuviera que elegir, ¿cuál debería elegir por defecto?”
Ahora, esto no es un dilema para Google: cuando sea apropiado, tomará una decisión y elegirá una de las urls, incluso si no determina una mediante el uso de una etiqueta canónica.
Pero hay algo más a considerar.
Si está interesado en el beneficio de SEO de tener contenido único (no duplicado) y el “jugo de enlaces” que llega a su sitio, podría haber una razón más importante por la que debería considerar la canonicalización.
Link juice es un término que utilizamos en la industria seo. Sin entrar en demasiados detalles, en realidad es un eco de algo que Google solía mostrar públicamente: Page Rank. (Page Rank ya no está disponible públicamente, aunque se puede usar internamente en Google).
De todos modos, la esencia de lo que estoy tratando de decir es que la mayoría de las páginas web que son indexadas por Google tienen algún tipo de mérito o poder de “voto”.
Un factor que Google utiliza para clasificar una página web (y sitio) tiene que ver con los enlaces que apuntan a esa página. Cada vez que una página web enlaza a otra página web (ya sea dentro de un sitio o de un sitio a otro), cuenta como un “voto” a favor de la página a la que se está vinculando.
Por lo tanto, cuando una página web enlaza o “vota” por otra página web, algún “jugo de enlace” fluye de esa página web a la página a la que está enlazando (en términos generales).
Lo que estoy a punto de decir es un poco de simplificación excesiva, pero ilustra mi punto: cuantos más sitios enlacen al tuyo, mejor.
“Muy bien”, dices. “Entonces, ¿qué tiene que ver eso con la canonicalización?”
Entonces, digamos que hay 2 sitios que enlazan a su página de inicio. Un sitio utiliza un sitio que no es www. url (como yoursite.com) y otro sitio utiliza un www. url (como www.yoursite.com).
Link juice fluye desde cada uno de estos 2 sitios a 2 versiones diferentes de su sitio.
Piénsalo: este eslabón se está diluyendo en un 50%.
¿No sería mejor si el jugo de enlaces se consolidara y fuera a una versión preferida de su sitio, de modo que en lugar de obtener el beneficio de solo 1 sitio que lo vincula a usted, obtenga el beneficio de ambos sitios que lo vinculan a usted?
Ahora, con toda transparencia, no sabemos exactamente cómo funciona el algoritmo de Google, y lo que acabo de explicar es un poco una simplificación excesiva, pero tenemos razones para creer que esta es una forma sólida de pensar.
Es por eso que la canonicalización puede ser beneficiosa para el SEO. Le ayuda a consolidar sus URL y obtener el máximo beneficio de ‘link juice’ de los enlaces que van a su sitio. Establecer una URL canónica adecuada para duplicar versiones de su sitio le dice al motor de búsqueda que estas versiones no canónicas son versiones duplicadas y luego pueden contar todas las señales de enlace que apuntan a las otras versiones como enlaces a la versión canónica. Este es el beneficio de SEO que puede obtener al configurar sus páginas canónicas, fortaleciendo su construcción de enlaces con métricas consolidadas y asegurándose de que los enlaces se apropien de la página correcta.
Antes de entrar en los 3 factores, queremos aconsejarle que, dependiendo de la complejidad de su sitio, es posible que deba tener en cuenta más de estos 3 factores cuando implemente la canonicalización. Dicho esto, creemos que los siguientes son 3 factores que todo webmaster tendrá que considerar.
Decida si tendrá un sitio HTTPS o simplemente un sitio HTTP. Le aconsejamos que vaya con Hyper-Text Transfer Protocol Secure (HTTPS), que implica SSL (Secure Sockets Layer). SSL significa que los datos compartidos entre el usuario final y el sitio están encriptados (seguros).
La mayoría de los buenos servidores web modernos ofrecen SSL gratuito, y si su host no lo hace, puede haber otras formas en que puede implementar SSL en su sitio. Si está utilizando WordPress, puede haber un complemento que pueda hacer esto libremente por usted. Uno de esos complementos a considerar podría ser WP Encryption – One Click SSL & Force HTTPS.
Cuando se trata de pasar de HTTP a HTTPS, otra opción a considerar es establecer códigos de estado de redireccionamiento 301 desde sus páginas HTTP a sus páginas HTTPS. Esta sería una solución más fácil y ayudaría a disminuir la posibilidad de contenido duplicado.
Sí, cada página tiene un parámetro de url diferente y, por lo tanto, la canonicalización se realiza página por página, pero dependiendo de las soluciones que tenga disponibles, puede implementar la canonicalización automáticamente en cada página de su sitio.
Esto es ideal si su sitio tiene una estructura de URL muy manejable y no tiene varias páginas de productos que esencialmente cuentan con el mismo producto. (Si está utilizando WordPress, un buen complemento de SEO puede tener esta característica. Un ejemplo de un plugin que tiene esto es Yoast SEO)
Si su sitio es nuevo y sin complicaciones, es posible que este paso no se aplique a usted, pero aún así es uno a considerar para el futuro.
Por ejemplo, mira esta url:
http://example.com/dresses/cocktail?gclid=ABCD
Ahora, mira este:
Ambos se ven muy diferentes, porque:
Sin embargo, ¿creerías que, a pesar de lo diferentes que son estos 2, ambos tienen el mismo contenido?
Sí, aunque estas urls son puramente hipotéticas, son ejemplos de lo que pueden, en teoría, ser dos páginas web aparentemente diferentes que en realidad son iguales. De hecho, extrajimos este ejemplo de la página web de Google sobre la consolidación de URL.
Si su sitio web tiene un cierto nivel de complejidad, o su estructura de URL es como la que ilustramos anteriormente, es posible que deba tomar medidas adicionales para asegurarse de que cada una de estas páginas se canonicice individualmente.
Vamos a mostrarte cómo agregar etiquetas canónicas al código de una página web. No se preocupe, si utiliza un sistema de administración de contenido como WordPress, Wix, Shopify o cualquiera de las plataformas modernas de creación de sitios, esto debería ser bastante simple. También hay plugins de WordPress que te permiten configurar páginas canónicas. Lo que queremos que tengas en cuenta es que la canonicalización (al menos la forma en que te vamos a mostrar) se realiza página por página).
Ya hemos establecido que el mismo contenido puede aparecer en dos URL diferentes (es decir: una versión www. y una versión no www.), y le informamos del beneficio SEO de consolidar estas 2 y declarar una versión como la predeterminada (la URL canónica correcta).
Entonces, ¿cómo se hace eso?
Para ello, establezca que una determinada url (versión de una página web) es la url canónica. Una url canónica se establece a través de una línea de código html llamada rel=”canonical”.
En cuanto al código, así es como se ve:
<link rel=”canonical” href=”https://seointel.com/” />
Esta línea de código se coloca en la sección de encabezado http del código fuente de la página, entre las etiquetas de encabezado de apertura y cierre. (Hay etiquetas de cabeza, y luego hay etiquetas de encabezado. Aquí, nos referimos a las etiquetas de cabeza).
Si nos fijamos en esa línea de código, básicamente dice que la versión no www de esta página es la versión canónica, o, en otras palabras, la versión predeterminada. Entonces, suponiendo que haya un enlace que vaya a https://www.seointel.com (la versión www), la versión canónica es la que se hará referencia. Fusiona las dos páginas en una, desde la perspectiva de los motores de búsqueda. El código es una redirección suave sin redirigir realmente al usuario a otra página.
Una vez hecho esto, es una señal para que los motores de búsqueda sepan qué página es la versión original que clasificarán en la búsqueda, y qué página obtendrá todo el jugo de enlaces.
La URL canónica autorreferencial es básicamente establecer una etiqueta canónica desde la página original hasta sí misma. Esto ayuda a afirmar que la página original es de hecho la versión original.
Si está sindicando su contenido para su publicación y publicándolo en diferentes sitios web, es mejor usar una etiqueta canónica autorreferencial en su artículo original también y hacer que la página sindicada especifique urls canónicas entre dominios, es decir, establecer que su versión es una versión canónica y la suya es la original. Si bien establecer una etiqueta canónica de autorreferencia no siempre impide que la versión sindicada se muestre en los resultados de búsqueda, ayuda a disminuir el riesgo de que las versiones sindicadas superen al contenido original.
Esperamos haberte mostrado los beneficios de SEO de establecer URL canónicas para tu sitio y páginas individuales. La canonicalización ayuda a resolver problemas de contenido duplicado, consolidar múltiples urls de productos en un solo producto para que aparezca en una consulta de búsqueda, para que su contenido se etiquete como la versión original, para que los motores de búsqueda sepan qué página en particular clasificar y para obtener el máximo ‘link juice’ de los sitios que enlazan a la suya. Esperamos que con esta guía, pueda aplicar las etiquetas canónicas y el campo de url canónica correctamente, y obtener ese impulso de clasificación a las páginas correctas de su sitio.