¿Cuánto contenido duplicado es aceptable?

Los SEO generalmente se dividen en dos campos en el tema del contenido duplicado: los que lo aman y los que lo odian. Lea para averiguar qué nos mostraron los resultados de las pruebas.
SIA Team
July 27, 2021

No hay duda. El contenido en SEO es importante. ¿Es el contenido duplicado un amigo o enemigo de los SEO? La comunidad SEO generalmente se divide en dos campos en el tema del contenido duplicado: los que lo aman y los que lo odian.

Dejando a un lado los sentimientos personales, probamos para ver la cantidad de contenido duplicado que es aceptable. Algunos dirían que ninguno, mientras que otros dicen que el contenido duplicado es la forma de tener un bolsillo feliz lleno de dinero.

Atención: ¿Tienes contenido duplicado en tu sitio?

El problema del contenido duplicado es un tema complicado para los especialistas en marketing. Algunos dicen que es un atajo para el ranking de optimización de motores de búsqueda, mientras que otros juran por su destrucción.

Queríamos averiguar cuánto se podían tolerar los bloques de contenido duplicados antes de que los motores de búsqueda se enojaran y comenzaran a penalizarnos. ¡Así que hicimos algunas pruebas y encontramos la respuesta!

Sigue leyendo si quieres saber qué es.

What Is Duplicate Content

¿Qué es el contenido duplicado?

El contenido duplicado generalmente se refiere a bloques sustantivos de contenido que se duplican en la misma página de su sitio web.

A veces el contenido duplicado es intencional y a veces es accidental. La mayoría de las veces, los especialistas en marketing utilizan contenido duplicado no malicioso. Crean intencionalmente contenido duplicado para ayudar a sus clasificaciones.

Esto es perfectamente aceptable de usar, incluso en sus sitios de dinero.

Antes de aprender sobre las diferentes formas, disipemos los mitos sobre cómo Google trata el contenido duplicado.

3 mitos sobre el contenido duplicado

Dependiendo de a quién sigas, es posible que escuches que el contenido duplicado es lo mejor desde el pan de molde. Y es por eso que has aterrizado aquí. Quieres saber la verdad sobre el contenido duplicado.

La idea de usar contenido duplicado es genial. Ahorra a los especialistas en marketing tiempo y dinero en la clasificación. Sin embargo, es posible que desconfíe de las temidas sanciones por contenido duplicado.

3 Myths

Mito # 1: El contenido hilado o raspado es malo para su SEO

Cuando haces una consulta de búsqueda en los motores de búsqueda, ¿cómo sabes que lo que estás leyendo es único?

Estos son los signos tradicionales:

  • Frases que no tienen sentido.
  • El contexto de las palabras está apagado.
  • El contenido no fluye bien.

La mejora de la tecnología de IA ahora elimina muchos de los signos reveladores de los artículos raspados.

El contenido raspado o sindicado no se penaliza cuando agrega valor y el tráfico para demostrarlo.

Algunos de los sitios más populares y bien clasificados utilizan contenido raspado. Quieren que los últimos y mejores artículos sirvan a su base de lectores. Lo logran con contenido raspado.

¿Crees que las grandes empresas recorren la red en busca de alguien que raspe o duplique su contenido?

La mayoría de las veces, no. A la mayoría no le preocupa que el contenido raspado perjudique su clasificación.

Tú tampoco.

Mito 2: El contenido reutilizado perjudica las clasificaciones de tu dominio

Google ya no clasifica sitios enteros. Cada página se juzga de forma individual. El contenido duplicado generalmente no dañará todo su sitio.

Muchas personas usan contenido duplicado para contenido específico del país o incluso SEO local. Hasta la fecha, esto es aceptable a los ojos de Google. A partir de ahora, estas versiones de contenido que está duplicado están bien.

Si alguna vez recibes una penalización por acción manual de todo tu dominio, limpia todo lo que puedas y presenta una solicitud de reconsideración con Google.

Si tiene una penalización, el verdadero problema probablemente no sea el contenido duplicado.

Mito #3: El contenido duplicado es contenido duplicado

No todos los tipos de contenido duplicado son iguales. Hay ocho tipos de contenido duplicado.

  • Duplicado exacto: generalmente se deben a problemas técnicos o de sindicación. A continuación, leerá más sobre cómo limpiar el contenido técnico duplicado.
  • Casi duplicado: este es un contenido que se encuentra en una página que se ha colocado en otra página o en varias páginas con ligeros cambios.
  • Duplicado entre dominios: aquí es donde se encuentra contenido duplicado en un dominio y luego se vuelve a publicar en otro dominio. Google y otros motores de búsqueda pueden ocultar su contenido duplicado en los resultados de búsqueda.
  • Contenido copiado: esto entra en la moralidad. Google considera que copiar el mismo contenido de un sitio que no posee sin permiso está equivocado.

Si se descubre, el propietario original de ese mismo contenido puede presentar una queja de contenido duplicado.

Dado que Google no quiere que manipules los resultados de búsqueda, le dará prioridad al contenido original y puede eliminar tu página de los SERP.

Si bien la mayoría de los propietarios de sitios web nunca se darán cuenta, hay algunos que están atentos a eso.

  • Contenido curado: solía haber sitios configurados para capturar historias de tendencias y crear publicaciones de blog a partir de ese mismo contenido.

De vuelta en el salvaje y salvaje Google West, esta era una forma popular de clasificar un sitio web. Todavía está en uso hoy en día, solo ligeramente modificado para el éxito.

Google y otros motores de búsqueda no ven esto como si fuera spam, siempre y cuando haya más contenido único en la página.

  • Contenido sindicado el sitio más famoso para encontrar sindicación de contenido es Huffington Post. Incluso los sitios web de noticias SEO utilizan la sindicación. El contenido sindicado es contenido basado en la web que se vuelve a publicar en otro sitio o en varias URL.

IFTTT es también un tipo de sindicación. Esto es tener su publicación de blog, fragmento o video colocado en múltiples sitios de terceros.

  • Raspado de contenido – Wikipedia define el raspado web (o raspado de contenido) como: El raspado web (recolección web o extracción de datos web) es una técnica de software informático para extraer información de los sitios.

En la actualización de Panda de Google, algunos sitios de raspadores de contenido fueron golpeados.

  • Reutilización de contenido esta es la duplicación de contenido con un giro. Se conoce como giro de contenido. La mayoría del software produce contenido realmente malo girando.

Si se hace a mano, puede resultar igual que el contenido de calidad.

El software, como Spinrewriter, se está volviendo más intuitivo. Si bien todavía no es perfecto, se puede convertir en contenido fresco con un poco de limpieza.

Sin limpieza, puede conducir a una mala experiencia de usuario.

Technical Issues

Problemas técnicos que causan contenido duplicado

La mayoría de las personas que no están reutilizando contenido a propósito pueden encontrar que inadvertidamente tienen errores de contenido duplicados. Estos son generalmente de naturaleza técnica. Es un problema común que puede causar pérdida de tráfico.

Si bien no causarán una penalización de Google, es bueno eliminar cualquier cosa que pueda evitar ese primer resultado. O causar cualquier bandera de “contenido malo”.

Arregla tu versión canónica y redirecciones

Es importante tener el conjunto canónico correcto para su dominio de nivel superior. Para hacer esto, querrá establecer el dominio canónico en su variación de URL preferida.

Si su sitio no es www sino un HTTP, entonces su elemento de enlace canónico debe ser https://yourdomain.com

Pero si su servidor web está configurado incorrectamente, su página también puede mostrarse como todo esto a Google y otros motores de búsqueda:

your domain examples

Asegúrese de que está utilizando correctamente los redireccionamientos 301 a sus parámetros de URL preferidos.

También establezca la versión canónica como la estructura de URL preferida para cada página para evitar la duplicación de contenido común en Google.

Una ligera ventaja adicional es que puede aumentar la autoridad de su página, por lo que no habrá ambigüedad. El uso de canónicos en SEO debe ser parte de todos sus sistemas de gestión de contenido estándar.

Si tiene varias páginas que son similares, pueden canibalizarse entre sí. Esto significa que podrían cancelarse mutuamente de manera eficiente. Establecer un canónico en cada página ayudará.

Microsoft, Google y Yahoo! Están trabajando juntos para ver con precisión páginas únicas. En 2020, Google dice: “Si su sitio contiene varias páginas con contenido en gran medida idéntico, hay varias formas en que puede indicar su URL preferida a Google. (Esto se llama “canonicalización”.)”

Adición de un canónico

Simplemente agregue esta etiqueta a la sección de encabezado de sus páginas.

Esto ayuda a Google a saber exactamente qué URL canónica desea clasificar.

Nota: Esto se considera una pista para Google y otros motores de búsqueda, por lo que todos los bots de clasificación de motores de búsqueda tienen la opción de ignorarlo.

A menos que haya problemas graves en su página, lo tendrán en cuenta.

Si quieres utilizar un plugin. Aquí hay dos que recomendamos:

  • Yoast SEO añade URLs canónicas a tu WordPress
  • 301 Redirecciones – Easy Redirect Manager
Another Benefit To Canonicals

Otro beneficio para los canónicos

Si el raspado de contenido es una preocupación para usted, puede ayudar a evitar que las personas roben su contenido agregando el enlace rel=canonical a todas sus páginas.

Esto ayuda a decirle a los motores de búsqueda que su contenido es el original.

Es importante tener en cuenta que no todos los raspadores tomarán todo el HTML con el artículo, por lo que es posible que esto no funcione con todos los raspadores.

Las páginas de índice pueden ser contenido duplicado

Todavía se puede acceder a una página de inicio a través de diferentes URL sin que usted lo sepa. Esto se debe a un servidor web mal configurado.

Además de https://yourdomain.com, se puede acceder a una página de inicio a través de las siguientes URL:

  • https://yourdomain.com/index.html
  • https://yourdomain.com/index.php
  • https://yourdomain/index.php?r…
  • https://yourdomain.com/index.asp
  • https://yourdomain.com/index.aspx

Cuando miramos estos, todos significan la misma página para nosotros. Pero para un bot de búsqueda, cada uno de estos es una página única.

Elija uno para su página de inicio. A continuación, implementará una redirección 301 de la versión no preferida a la preferida.

Si el sitio web está utilizando cualquiera de las URL para el contenido, las páginas deben ser canonicalizadas porque redirigirlas romperá las páginas.

Use Google Search Console To Find Duplicate Content

Usar Google Search Console para encontrar contenido duplicado

Google Search Console no solo es bueno para el rendimiento del sitio y los enlaces, sino que también es bueno ver si tiene que solucionar problemas de contenido duplicado.

Agregar tu sitio a Google Search Console puede ayudarte a ver cómo Google ve tus páginas web en tu sitio.

Una vez dentro de Google Search Console, ve a Rendimiento. En los resultados de la búsqueda, verá cualquier problema duplicado.

Enlaces internos y contenido duplicado

Hacemos hincapié en la importancia de los enlaces internos para el contenido de su sitio web. Si su canónico está configurado en https://yourdomain.com/duplicate-conent-rules asegúrese de que cada enlace interno a esa página use esa misma URL de esa manera exacta.

Si tiene la URL canónica establecida en https://yourdomain.com/internal-links/ asegúrese de que todo el contenido de su sitio web que se vinculará a esto sea exacto.

Si está comprando enlaces a través de servicios como SEONitro de Dori, asegúrese de que sus enlaces entrantes de sitios de alta autoridad de dominio coincidan con su canónico.

Recuerde: desea que toda la autoridad de dominio de esos sitios fluya completamente a través de su sitio.

Dori hace todo lo posible para asegurarse de que las métricas de enlace empujen la aguja de clasificación. Usar la ruta de enlace correcta lo ayudará a beneficiarse de esa equidad de enlace.

Threshold For Duplicate Content

¿Existe un umbral para el contenido duplicado?

Hay una manera fácil de encontrar si Google ve su contenido como único. Toma un fragmento de contenido y pégalo en la barra de búsqueda de Google. Este es uno de los verificadores de contenido duplicado más precisos.

Si Google ve contenido original, verá los resultados normales de los motores de búsqueda. Sin embargo, si Google ve ese contenido como duplicado, verá el siguiente resultado.

Page Optimizer Pro

Aquí hay tres de las herramientas más populares para verificadores de contenido duplicado. Esto ayudará a identificar fácilmente el contenido duplicado:

  • Duplichecker.com: simplemente ingrese su texto y esto verificará todo el contenido duplicado en la web. Hay una restricción de hasta 1.000 palabras para la versión gratuita.
  • Siteliner.com: para este verificador interno de contenido duplicado, simplemente ingrese su dirección y esto lo ayudará a determinar el contenido duplicado en su sitio.
  • Copyscape.com – Uno de los originales para encontrar contenido duplicado a través de Internet. Es un software de pago.
What Our SEO Testing Reveals

Lo que nuestras pruebas de SEO revelan…

¿El contenido duplicado hundirá su sitio y dañará su clasificación SEO? Al final, no pudimos obtener un factor negativo. La página de destino tenía todo este contenido duplicado y no se convirtió en un factor negativo.

No hay penalización por contenido duplicado. Google no te penalizará con una penalización por contenido duplicado.

¿Duplicarás el contenido del sandbox? No conseguimos una caja de arena. El sandbox es la idea de algo que no se clasificará durante días o semanas.

¿Cuánto contenido duplicado debes tener? Si bien no pudimos obtener una penalización por contenido duplicado, sabemos que Google filtrará los resultados de búsqueda.

Si se está filtrando, puede corregir el contenido duplicado en su propio sitio utilizando los métodos de este artículo.

Hemos descubierto que siempre que tenga un 51% de contenido único, es una forma de ayudar a evitar el filtro. Como Google tiene diferentes puntajes para diferentes palabras clave, es posible que necesite un mayor porcentaje de contenido único para clasificar.

moomba on google

Contenido en su sitio web y los SERPs

De acuerdo con las Directrices de Google, el contenido duplicado en su sitio web no es motivo de acción en ese sitio a menos que parezca que la intención del contenido duplicado es ser engañoso y manipular los resultados de los motores de búsqueda.

En 2015, John Mueller dijo: “No hay penalización por contenido duplicado”, pero “Tenemos algunas cosas en torno al contenido duplicado … que son dignos de pena”

Google sabe que los usuarios quieren artículos diversos y originales para consumir. No es el mismo artículo una y otra vez. No quiere que los lectores aterricen en su sitio y vean la misma información refrito que se encuentra en otro lugar.

Nada que ver aquí, muévelo a lo largo.

Google quiere artículos únicos, relevantes para la consulta del buscador e informativos y originales para los lectores. Las caídas de la puntuación de calidad te van a atrapar si usas mucho contenido duplicado.

Easy Solutions At A Glance

Soluciones sencillas de un vistazo

Es frustrante cuando tienes páginas que han desaparecido de los resultados de los motores de búsqueda. Has desperdiciado dinero en presupuestos de rastreo. Caídas de tráfico. Y sus clientes de SEO comienzan a llamar. El contenido duplicado puede ser una gran espina en el costado para muchos vendedores de SEO inconscientes.

Si bien hay algunas soluciones fáciles de implementar, sepa que la solución puede variar según la situación.

Regla del 51%

Duplicar el contenido hace la vida mucho más fácil. Solo asegúrese de tener una página que sea 51% única y verifique el ranking del motor de búsqueda para ver si se filtrará.

Parámetros de Google

Configurar esto informará a Google qué parámetros están funcionando, en lugar de esperar a que resuelvan las cosas.

Rel=”alternativo”

Esto se utiliza para consolidar la versión alternativa de una página (páginas móviles o de país/idioma). Para la página país /idioma, hreflang se utiliza para mostrar el resultado correcto.

Según John Mueller durante el Webmaster Hangout, arreglar el hreflang no aumentará la clasificación. Sin embargo, ayudará a mostrar la versión correcta. Esto se debe a que las versiones alternativas ya han sido identificadas por Google y las señales se consolidaron para diferentes páginas.

Configura tu rel=canonical

Esto es particularmente importante en la lucha contra el contenido duplicado. Hemos descubierto que el uso de una etiqueta noindex de meta robots no es lo suficientemente efectivo.

En su lugar, usamos el rel=canonical para designar cada URL para sus páginas.

Asegúrate de que las palabras clave y las páginas que buscas no se van a canibalizar.

Parámetros de URL en SEO

Los parámetros de URL son importantes cuando se trata de contenido duplicado. Los parámetros de URL a menudo se crean dinámicamente. Esto lleva a que se creen muchas páginas con el mismo contenido o similar.

Estos parámetros de url aparecen en los resultados de búsqueda y se filtran como resultados similares o se ven como contenido de baja calidad.

Si encuentra parámetros que son puramente duplicados y no ofrecen valor independientemente de la página original, agregue un canónico. Asegúrese de apuntarlo a la página original.

301 Redirecciones

Esto evitará problemas de duplicación con las páginas al evitar la visualización de versiones alternativas.

Conclusión

Probamos y podemos confirmar que no hay penalización por contenido duplicado. Ahora sabe que Google maneja el contenido duplicado filtrando los resultados en los SERP.

Se producen problemas de contenido duplicado. Si tiene problemas con el contenido técnico duplicado, se puede limpiar fácilmente. Y ahora sabes cómo prevenirlo en el futuro.

Google no tiene ningún problema con el contenido duplicado. Tiene más de un problema con la baja calidad y el contenido de mala experiencia del usuario. Esto tendrá un efecto negativo en los resultados de búsqueda.

Si está utilizando contenido duplicado, asegúrese de que está utilizando un 51% de contenido único para estar seguro. Vigila tus puntuaciones de calidad.

Al usar el contenido duplicado correctamente, verá un ROI mejorado tanto por el tiempo como por el dinero invertido en su administración de contenido.