“Pusimos un noindex en algunas páginas, pero todavía están indexadas. ¿Qué debemos hacer?” Google responde

¿Tienes páginas duplicadas que no querías indexar, pero... descubrir que todavía lo son? ¿Es noindex lo suficientemente adecuado?
SIA Team
October 11, 2021

John Mueller, quien es un defensor de la búsqueda en Google, organiza muchas de las sesiones actuales de preguntas y respuestas en inglés de Google. Aquí es donde los webmasters y los especialistas en SEO pueden enviar o hacer preguntas relacionadas con la búsqueda, el rastreo y la indexación de Google.

Hacia el comienzo de la sesión del 8 de octubre de 2021, a Mueller se le dio un escenario y se le hizo una pregunta relacionada con el uso de noindex.

Este video está en cola hasta la marca de ~ 39 segundos, que es donde se hizo la pregunta.

El escenario, en parte, fue:

“Tenemos sitios web de exámenes [donde] la gente agrega algunos exámenes y … etiqueta los exámenes y Google indexa todas las páginas [y] todas las páginas de etiquetas…”

La descripción del escenario por parte del participante se puede escuchar, extensamente, viendo el video de arriba.

No quiero escribirlo todo aquí, ya que entra en más detalles de los que necesitamos explorar.

Dicho esto, describiré su escenario en mis propias palabras:

El participante tiene un sitio con mucho contenido duplicado.

Todo este contenido (o una parte significativa del mismo) está indexado en Google.

El participante primero canonicalizó estas páginas duplicadas, y luego, puso un noindex en ellas.

(Un noindex en el código de una URL, en caso de que no esté seguro, básicamente le dice a los motores de búsqueda que no indexen la URL).

Pero, supuestamente, estas páginas duplicadas todavía estaban indexadas.

¿Solo dejarlos?

Y de ahí su pregunta relativa a lo que debería hacer a continuación.

La respuesta de Juan fue:

“Simplemente los dejaría como sin índice y … lo que sucederá es que con el tiempo cuando volvamos a rastrear esas páginas, se caerán …”

Está bien, eso es bueno.

John continuó hablando sobre cuánto tiempo puede tomar esto:

“… pero eso puede pasar tal vez… No sé… [podría] tomar un par de meses”.

Eso es para un sitio que se dice que tiene alrededor de 100,000 páginas indexadas. (Pero no usaría ese número como una estimación de qué tan pronto o a fondo Google podría volver a rastrear cualquier otro sitio, ya que hay otros factores involucrados).

La respuesta final: solo espera

Si tiene una página (o URL) que está indexada y, a continuación, decide que no desea que se indexe, puede poner un noindex en esa página.

Pero, digamos que pasan unas semanas, y lo compruebas: sigue indexado en Google.

Bueno, solo espera. Cuando Googlebot lo haga, esa página eventualmente se retirará del índice. Y, no se arrastrará tan a menudo.

(Debido a que no se rastreará con tanta frecuencia, si desea que se vuelva a indexar, es posible que tenga que volver a enviarlo mediante un proceso de envío de URL en Search Console).

Pero… la discusión continuó…

Dicho esto, la discusión de preguntas y respuestas en torno a este escenario en particular continuó. El participante preguntó (y estoy parafraseando aquí): “Si tengo contenido duplicado que está indexado, pero canonicalizado, ¿afecta negativamente mi SEO?

¿Tienes contenido duplicado? ¿Está canonicalizado? (Si no está seguro, le doy una breve explicación en la noticia anterior).

Es posible que desee averiguarlo con seguridad.

Fuente: Canal de YouTube de Google Search Central