Categorías

¿Cuánto contenido duplicado es aceptable?

Los SEOs se dividen generalmente en dos bandos sobre el tema del contenido duplicado: los que lo aman y los que lo odian. Lee para saber lo que nos han mostrado los resultados de las pruebas.

No hay duda. El contenido en el SEO es importante. ¿Es el contenido duplicado un amigo o un enemigo del SEO? La comunidad de SEO está generalmente dividida en dos bandos sobre el tema del contenido duplicado: los que lo aman y los que lo odian.

Dejando a un lado los sentimientos personales, probamos para ver la cantidad de contenido duplicado que es aceptable. Algunos dirían que ninguna, mientras que otros dicen que el contenido duplicado es la forma de tener un bolsillo feliz lleno de dinero.

Atención: ¿Tiene contenido duplicado en su sitio?

La cuestión del contenido duplicado es un tema espinoso para los profesionales del marketing. Algunos dicen que es un atajo para el posicionamiento en buscadores, mientras que otros juran por su destrucción.

Queríamos averiguar cuántos bloques de contenido duplicados se podían tolerar antes de que los motores de búsqueda se enfadaran y empezaran a penalizarnos. Así que hicimos algunas pruebas y encontramos la respuesta.

Siga leyendo si quiere saber de qué se trata.

¿Qué es el contenido duplicado?

¿Qué es el contenido duplicado?

El contenido duplicado generalmente se refiere a bloques de contenido sustanciales que se duplican en la misma página de su sitio web. 

A veces el contenido duplicado es intencionado y otras veces es accidental. La mayoría de las veces, los vendedores utilizan contenido duplicado no malicioso. Crean intencionadamente contenido duplicado para ayudar a sus rankings. 

Esto es perfectamente aceptable, incluso en sus sitios de dinero.

Antes de conocer las diferentes formas, vamos a disipar los mitos sobre cómo trata Google el contenido duplicado.

3 mitos sobre el contenido duplicado

Dependiendo de a quién sigas, puede que oigas que el contenido duplicado es lo mejor desde el pan de molde. Y por eso has aterrizado aquí. Quieres saber la verdad sobre el contenido duplicado. 

La idea de utilizar contenido duplicado es genial. Ahorra a los profesionales del marketing tanto tiempo como dinero en la clasificación. Sin embargo, es posible que tengas cuidado con las temidas penalizaciones por contenido duplicado.

3 Mitos

Mito #1: El contenido "spun" o "scrapeado" es malo para tu SEO

Cuando haces una consulta en los motores de búsqueda, ¿cómo sabes que lo que estás leyendo es único?

Estos son los signos tradicionales:

  • Frases que no tienen sentido.
  • El contexto de las palabras está fuera de lugar. 
  • El contenido no fluye bien.

La mejora de la tecnología de IA elimina ahora muchos de los signos reveladores de los artículos raspados.

El contenido raspado o sindicado no se penaliza cuando aporta valor y el tráfico lo demuestra.

Algunos de los sitios más populares y con mejor clasificación utilizan contenido raspado. Quieren los últimos y mejores artículos para servir a su base de lectores. Esto lo logran con contenido raspado.

¿Cree que las grandes empresas rastrean la red en busca de alguien que haya raspado o duplicado su contenido? 

La mayoría de las veces, no. A la mayoría no le preocupa que el contenido raspado perjudique su clasificación.  

Tú tampoco deberías.

Mito 2: El contenido reutilizado perjudica la clasificación de su dominio

Google ya no clasifica sitios completos. Cada página se juzga de forma individual. El contenido duplicado no suele perjudicar a todo el sitio.

Muchas personas utilizan el contenido duplicado para el contenido específico del país o incluso para el SEO local. Hasta la fecha, esto es aceptable a los ojos de Google. A partir de ahora, estas versiones de contenido duplicado están bien.

Si alguna vez recibes una penalización por acción manual de todo tu dominio, limpia todo lo que puedas y presenta una solicitud de reconsideración a Google.

Si tiene una penalización, el verdadero problema probablemente no sea el contenido duplicado.

Mito #3: El contenido duplicado es contenido duplicado

No todos los tipos de contenido duplicado son iguales. Hay ocho tipos de contenido duplicado.

  • Duplicado exacto - Suelen deberse a problemas técnicos o de sindicación. A continuación, podrás leer más sobre cómo limpiar el contenido duplicado técnico.
  • Casi duplicado - Se trata de un contenido que se encuentra en una página y que se ha colocado en otra o en varias páginas con ligeros cambios.
  • Duplicado de dominio cruzado - En este caso, el contenido duplicado se encuentra en un dominio y se vuelve a publicar en otro. Google y otros motores de búsqueda pueden ocultar el contenido duplicado en los resultados de búsqueda.
  • Contenido copiado - Esto entra en la moral. Google considera que copiar el mismo contenido de un sitio que no es de tu propiedad sin permiso está mal.

Si se descubre, el propietario original de ese mismo contenido puede presentar una reclamación por contenido duplicado.

Como Google no quiere que manipules los resultados de búsqueda, dará prioridad al contenido original y puede eliminar tu página de las SERP.

Aunque la mayoría de los propietarios de sitios web nunca lo notarán, hay algunos que están atentos a ello. 

  • Contenido curado - Antes había sitios creados para tomar las historias que eran tendencia y crear entradas de blog a partir de ese mismo contenido.

    En el salvaje oeste de Google, esta era una forma popular de clasificar un sitio web. Todavía se utiliza hoy en día, pero ligeramente modificada para tener éxito. 

    Google y otros motores de búsqueda no ven esto como spam mientras haya más contenido único en la página.

  • Contenido sindicado - El sitio más famoso para encontrar la sindicación de contenidos es Huffington Post. Incluso los sitios web de noticias SEO utilizan la sindicación. El contenido sindicado es un contenido basado en la web que se vuelve a publicar en otro sitio o en múltiples URLs.

    IFTTT es también un tipo de sindicación. Se trata de tener su entrada de blog, fragmento o vídeo colocado en múltiples sitios de terceros.

  • Raspado de contenidos - Wikipedia define el web scraping (o raspado de contenidos) como: El web scraping (web harvesting o extracción de datos de la web) es una técnica de software informático de extracción de información de sitios.

    En la actualización Panda de Google, algunos sitios de raspado de contenido fueron afectados.

  • Reutilización de contenidos - Se trata de una duplicación de contenidos con una vuelta de tuerca. Se conoce como spinning de contenidos. La mayoría de los programas producen un spinning de contenidos realmente malo. 

    Si se hace a mano, puede resultar un contenido de calidad.

    Los programas, como Spinrewriter, son cada vez más intuitivos. Aunque todavía no es perfecto, puede convertirse en contenido fresco con un poco de limpieza. 

    Si no se limpia, puede dar lugar a una mala experiencia de usuario.
Cuestiones técnicas

Problemas técnicos que provocan la duplicación de contenidos

La mayoría de las personas que no están reutilizando contenido a propósito pueden encontrar que tienen errores de contenido duplicado sin darse cuenta. Estos son generalmente de naturaleza técnica. Es un problema común que puede causar la pérdida de tráfico.

Aunque no causarán una penalización de Google, es bueno eliminar todo lo que pueda alejarte de ese primer resultado. O causar cualquier bandera de "contenido malo".

Arregle su versión canónica y sus redireccionamientos

Es importante tener el conjunto canónico correcto para su dominio de nivel superior. Para ello, querrá establecer el dominio canónico a su variación de url preferida.

Si su sitio no es www pero es HTTP, su elemento de enlace canónico debe ser https://yourdomain.com

Pero si su servidor web está mal configurado, es posible que su única página se muestre como todas estas a Google y otros motores de búsqueda:

sus ejemplos de dominio

Asegúrese de que está utilizando correctamente las redirecciones 301 a sus parámetros de URL preferidos.

Establezca también la versión canónica como la estructura de URL preferida para cada página para evitar la duplicación común de contenido en Google.

Una pequeña ventaja adicional es que puede aumentar la autoridad de su página para que no haya ambigüedad. El uso de canónicos en el SEO debería formar parte de todos sus sistemas de gestión de contenidos estándar.

Si tiene varias páginas que son similares, pueden canibalizarse entre sí. Esto significa que podrían anularse mutuamente de forma eficaz. Establecer un canonical en cada página le ayudará.

Microsoft, Google y Yahoo! están trabajando juntos para ver con precisión las páginas únicas. En 2020, Google dice, "Si su sitio contiene varias páginas con un contenido prácticamente idéntico, existen varias formas de indicar a Google su URL preferida. (Esto se llama "canonización")".

Añadir una canónica

Sólo tiene que añadir esta etiqueta a la sección del encabezado de sus páginas.

<link rel=”canonical”href=”http://yoursite.com/dupicate-content-works”/>

Esto ayuda a Google a saber exactamente cuál es la url canónica que desea clasificar. 

Nota: Esto se considera una pista para Google y otros motores de búsqueda, por lo que los robots de clasificación de los motores de búsqueda tienen la opción de ignorarlo. 

A menos que haya problemas graves en su página, lo tendrán en cuenta.

Si quieres usar un plugin. Aquí hay dos que recomendamos:

  • Yoast SEO añade URLs canónicas a tu WordPress
  • Redirecciones 301 - Easy Redirect Manager
Otro beneficio para los canónicos

Otro beneficio para los canónicos

Si el scraping de contenidos le preocupa, puede evitar que le roben el contenido añadiendo el enlace rel=canonical a todas sus páginas. 

Esto ayuda a indicar a los motores de búsqueda que su contenido es el original.

Es importante tener en cuenta que no todos los scrapers agarran todo el HTML con el artículo, por lo que esto puede no funcionar con todos los scrapers.

Las páginas de índice pueden ser contenido duplicado

Todavía se puede acceder a una página de inicio a través de diferentes URLs sin que usted lo sepa. Esto se debe a un servidor web mal configurado.

Además de https://yourdomain.com, se puede acceder a una página de inicio a través de las siguientes URL:

  • https://yourdomain.com/index.html
  • https://yourdomain.com/index.php
  • https://yourdomain/index.php?r…
  • https://yourdomain.com/index.asp
  • https://yourdomain.com/index.aspx

Cuando las miramos, todas significan la misma página para nosotros. Pero para un bot de búsqueda, cada una de ellas es una página única.

Elija una para su página de inicio. A continuación, implementará una redirección 301 desde la versión no preferida a la preferida.

Si el sitio web está utilizando alguna de las URL para el contenido, las páginas deben ser canonizadas porque redirigirlas romperá las páginas.

Utilizar Google Search Console para encontrar contenido duplicado

Utilizar Google Search Console para encontrar contenido duplicado

Google Search Console no sólo es bueno para el rendimiento del sitio y los enlaces, también es bueno para ver si tienes que arreglar problemas de contenido duplicado.

Añadir su sitio a Google Search Console puede ayudarle a ver cómo ve Google las páginas web de su sitio.

Una vez dentro de Google Search Console, ve a Rendimiento. Debajo de los resultados de búsqueda verás los problemas de duplicación.  

Enlaces internos y contenido duplicado

Destacamos la importancia de enlace interno para el contenido de su sitio web. Si su canónico está configurado en https://yourdomain.com/duplicate-conent-rules asegúrese de que todos los enlaces internos a esa página utilicen esa misma URL de forma exacta.

Si tiene la URL canónica configurada como https://yourdomain.com/internal-links/ asegúrese de que todo el contenido de su sitio web que se enlazará a éste es exacto. 

Si usted está comprando enlaces a través de servicios como Dori's SEONitroAsegúrese de que sus enlaces entrantes de sitios de alta autoridad de dominio coinciden con su canónico.

Recuerda: Quieres que toda la autoridad de dominio de esos sitios fluya completamente hacia tu sitio.

Dori hace todo lo posible para asegurarse de que las métricas de los enlaces empujen la aguja del ranking. El uso de la ruta de enlace correcta le ayudará a beneficiarse de esa equidad de enlace.

Umbral de contenido duplicado

¿Existe un umbral para el contenido duplicado?

Hay una manera fácil de averiguar si Google ve tu contenido como único. Tome un trozo de contenido y péguelo en la barra de búsqueda de Google. Este es uno de los comprobadores de contenido duplicado más precisos.

Si Google ve el contenido original, verá los resultados normales del motor de búsqueda. Sin embargo, si Google ve ese contenido como duplicado, verá el siguiente resultado.

Optimizador de páginas Pro

A continuación, tres de las herramientas más populares para comprobar el contenido duplicado. Esto ayudará a identificar fácilmente el contenido duplicado:

  • Duplichecker.com - Simplemente introduzca su texto y esto comprobará todo el contenido duplicado en la web. Hay una restricción de hasta 1.000 palabras para la versión gratuita.
  • Siteliner.com - Para este comprobador de contenido duplicado interno, simplemente ponga su dirección y esto le ayudará a determinar el contenido duplicado en su sitio.
  • Copyscape.com - Uno de los originales para encontrar contenido duplicado en Internet. Es un software de pago.
Lo que revelan nuestras pruebas de SEO

Lo que nuestras pruebas de SEO revelan...

¿Los contenidos duplicados hundirán su sitio y perjudicarán su posicionamiento SEO? Al final, no pudimos conseguir un factor negativo. La página de destino tenía todo este contenido duplicado y no se convirtió en un factor negativo.

No existe una penalización por contenido duplicado. Google no te penalizará con una penalización por contenido duplicado.

¿El contenido duplicado se convertirá en una caja de arena? No conseguimos una caja de arena. La caja de arena es la idea de que algo que no va a clasificar durante días o semanas.

¿Cuánto contenido duplicado debe tener?  Si bien no pudimos recibir una penalización por contenido duplicado, sabemos que Google filtrará los resultados de búsqueda.

Si te filtran, puedes arreglar el contenido duplicado en tu propio sitio usando los métodos de este artículo.

Hemos comprobado que siempre que tengas 51% de contenido único, es una forma de ayudar a evitar el filtro. Como Google tiene diferentes puntuaciones para diferentes palabras clave, es posible que necesite un mayor porcentaje de contenido único para clasificar. 

moomba en google

El contenido de su sitio web y los SERPs

Según Directrices de GoogleEn el caso de las páginas web, la duplicidad de contenidos no es motivo para tomar medidas en ese sitio, a menos que parezca que la intención del contenido duplicado es engañar y manipular los resultados de los motores de búsqueda.

En 2015, John Mueller dijo: "No hay penalización por contenido duplicado" pero "Tenemos algunas cosas en torno al contenido duplicado... que son dignas de penalización"

Google sabe que los usuarios quieren consumir artículos diversos y originales. No el mismo artículo una y otra vez. No quiere que los lectores aterricen en su sitio y vean la misma información refrito que se encuentra en otros lugares.

No hay nada que ver aquí, muévete.

Google quiere artículos únicos, relevantes para la consulta del buscador, e informativos y originales para los lectores. Las caídas de la puntuación de calidad te van a pillar si utilizas mucho contenido duplicado.

Soluciones sencillas de un vistazo

Soluciones sencillas de un vistazo

Es frustrante cuando tienes páginas que han desaparecido de los resultados de los motores de búsqueda. Has desperdiciado dinero en presupuestos de rastreo. El tráfico cae. Y tus clientes de SEO empiezan a llamar. El contenido duplicado puede ser una gran espina para muchos vendedores de SEO inconscientes.

Aunque hay algunas soluciones fáciles de aplicar, sepa que la solución puede variar según la situación.

Regla 51%

Duplicar el contenido hace la vida mucho más fácil. Sólo asegúrese de que tiene una página que es 51% único y comprobar el ranking del motor de búsqueda para ver si se filtrará.

Parámetros de Google

Si se configura esto, se informará a Google de los parámetros que funcionan, en lugar de esperar a que ellos lo averigüen.

Rel="alternativo"

Se utiliza para consolidar la versión alternativa de una página (móvil o páginas de país/idioma). Para la página de país/idioma, se utiliza hreflang para mostrar el resultado correcto.

Según John Mueller durante el Webmaster Hangout, arreglar el hreflang no aumentará el ranking. Sin embargo, ayudará a mostrar la versión correcta. Esto se debe a que las versiones alternativas ya han sido identificadas por Google y las señales se consolidaron para diferentes páginas.

Establezca su rel=canonical

Esto es especialmente importante en la lucha contra el contenido duplicado. Hemos comprobado que el uso de una etiqueta meta robots noindex no es lo suficientemente eficaz. 

En su lugar, utilizamos el rel=canonical para designar cada URL de sus páginas.

Asegúrese de que las palabras clave y las páginas que persigue no van a ser canibalizadas.

Parámetros de la URL en el SEO

Los parámetros URL son importantes cuando se trata de contenido duplicado. Los parámetros de la URL se crean a menudo de forma dinámica. Esto lleva a que se creen muchas páginas con el mismo o similar contenido. 

Estos parámetros de la url aparecen en los resultados de búsqueda y se filtran como resultados similares o se ven como contenido de baja calidad. 

Si encuentra parámetros que son puramente duplicados y no ofrecen un valor independiente de la página original, añada un canonical. Asegúrese de apuntar a la página original.

Redirecciones 301

Esto evitará los problemas de duplicación de las páginas al impedir que se muestren versiones alternativas.

Conclusión:

Hemos probado y podemos confirmar que no hay ninguna penalización por contenido duplicado. Ya sabes que Google gestiona el contenido duplicado filtrando los resultados en las SERPs.

Los problemas de contenido duplicado ocurren. Si tiene problemas con el contenido duplicado técnico, se puede limpiar fácilmente. Y ahora ya sabes cómo prevenirlo en el futuro. 

Google no tiene problemas con el contenido duplicado. Tiene más problemas con el contenido de baja calidad y con la mala experiencia del usuario. Esto tendrá un efecto negativo en sus resultados de búsqueda.

Si está usando contenido duplicado, asegúrese de que está usando contenido único 51% para estar seguro. Vigila tus puntuaciones de calidad.

Si utiliza el contenido duplicado de forma adecuada, verá mejorado el retorno de la inversión, tanto de tiempo como de dinero, en su gestión de contenidos.

Personal de la SIA

Redactores de contenidos

Se necesita un pueblo para dirigir un negocio con éxito. Varios miembros del personal contribuyen a los artículos de esta biografía. Puede leer más sobre ellos aquí: biografía completa aquí.