“Tenemos millones de resultados de búsqueda en el sitio indexados. ¿Deberíamos limpiarlos?”

Is the number of pages on your site inflated by indexed on-site searches? You may want to watch this.
SIA Team
October 7, 2021

Antes de entrar en esto, solo quiero asegurarme de que sepamos qué es un resultado de búsqueda en el sitio.

Algunos sitios tienen cuadros de búsqueda donde puede hacer una búsqueda en el sitio.

Estoy seguro de que los has visto. Es casi como hacer una búsqueda en Google, excepto que se limita al contenido disponible en un sitio.

De todos modos, algunos propietarios de sitios permiten que las páginas de resultados de estas búsquedas se indexen. Entonces, presumiblemente, un visitante haría una búsqueda y sería llevado a la página de resultados de búsqueda del sitio. Esa página de resultados generalmente tiene un parámetro de URL que la hace diferente de la mayoría de las otras URL, y es ese parámetro de URL el que se indexa.

Por lo tanto, con el tiempo, dependiendo de la cantidad de tráfico que recibe un sitio, qué tan grande es y qué tan activos son los usuarios, esto puede llevar a la acumulación de muchos, muchos parámetros de URL de búsqueda indexados.

Además, sabemos que Google tiende a favorecer el contenido único y también, las páginas de calidad.

Con eso en mente, pasemos ahora a una de las sesiones de preguntas y respuestas más recientes que Google a menudo realiza para webmasters y profesionales de SEO.

Durante el horario de oficina de Google SEO en inglés a partir del 1 de octubre de 2021, a John Mueller, quien es un defensor de la búsqueda de Google, se le preguntó lo siguiente:

“Tenía una pregunta con respecto a las páginas de búsqueda interna. Por lo tanto, estamos permitiendo la indexación de búsquedas en el sitio; así que a veces, alguien hace una búsqueda en nuestro sitio, creamos una página para eso y ahora eso se ha salido un poco de control, por lo que tenemos cientos de millones de estas páginas.

“Entonces, ¿cómo recomendaría que resolviéramos eso y si realmente hay algún beneficio en limpiar eso o si no deberíamos preocuparnos por eso?”

Este video está en cola a ~ 52:26, que es aproximadamente donde se hizo la pregunta.

“Creo que en su mayor parte tiene sentido limpiar eso porque hace que gatear sea mucho más difícil.

“Entonces, ese es el tipo de … La dirección que miraría allí, es pensar en … qué páginas tienes en realidad… quieren haber rastreado e indexado y ayudar a nuestros sistemas a centrarse en eso, no tanto como para que deba deshacerse de todas las páginas de búsqueda internas (algunas de estas podrían estar perfectamente bien para mostrar en la búsqueda), sino que realmente trate de evitar la situación en la que cualquiera pueda simplemente salir y crear un millón de páginas nuevas en su sitio web enlazando a urls aleatorias o palabras que pueda tener en sus páginas “.

Luego se le preguntó a Juan cómo hacer esto. Recomendó simplemente agregar sin índice a las páginas (URL con parámetros de búsqueda) que no desea que se indexen.

Pero, dijo que puede haber algunas de esas páginas que le gustaría que se indexaran, así que tenga eso en cuenta.

John también habló sobre la calidad, lo cual tiene sentido.

Como sabrá, muchas de estas páginas de resultados de búsqueda interna (URL con parámetros de búsqueda) probablemente no sean de alta calidad. Y, estas páginas probablemente muestran contenido de otras páginas en su sitio, por lo que, en cierto modo, serían contenido duplicado. (No es que el contenido duplicado sea malo, es solo … redundante.)

Beneficios potenciales de SEO de eliminar páginas de baja calidad

A John se le preguntó entonces algo que es de interés para aquellos que trabajan con empresas: “… las empresas argumentarían, ya sabes, ‘Si vamos a hacer este trabajo como inversión de nuestro lado, ¿cuál es el retorno de esto? ¿Hay algún beneficio de SEO en eso?”

La respuesta de John fue básicamente afirmativa, aunque es posible que no veas un impulso de SEO de inmediato.

Un aspecto de esto tiene que ver con el presupuesto de rastreo (aunque no escuché a John usar específicamente ese término). Básicamente, si Google no tuviera que rastrear tantas páginas (específicamente aquellas URL con parámetros de búsqueda), Googlebot tendría más presupuesto asignado a las páginas que realmente desea rastrear e indexar.

(Un ejemplo que John mencionó fue el de los sitios de comercio electrónico que tienen cambios de precios. Si publicas un nuevo cambio de precio, quieres que Google lo sepa lo antes posible).

Por lo tanto, si tiene un número significativo de sus URL indexadas que son solo estas páginas de resultados de búsqueda de bajo contenido, considere desindexarlas. Además, lo que mencioné anteriormente puede no aplicarse por igual a todos los sitios, así que tenga en cuenta su situación específica.

Fuente: Canal de YouTube de Google Search Central