“¿Qué es mejor post-malware: 404s o redirecciones?” Google da consejos

404, ¿o redirecciones de página de inicio? John Mueller de Google transmite lo más importante que debes tener en cuenta.
SIA Team
August 16, 2021

Durante la sesión de preguntas y respuestas más reciente de Google, titulada Horas de oficina de Google SEO en inglés a partir del 13 de agosto de 2021, John Mueller de Google respondió una serie de preguntas, tanto de asistentes en persona como de personas que habían enviado previamente las suyas.

En la marca ~ 32:41, una pregunta enviada básicamente preguntó: “¿Qué es mejor: 404 o redirecciones de la página de inicio?”

Permítanme darles algunos antecedentes.

Aparentemente, la persona que envió esa pregunta tenía un sitio que había sufrido un ataque de malware. Su pregunta completa fue:

“¿Cuál sería una mejor estrategia: tener una página 404 para páginas que no existen, o redirigir cualquier página inexistente a la página de inicio? Nuestro sitio web se está recuperando de un ataque de malware en el que decenas de miles de páginas que se hicieron estaban redirigiendo a algún sitio web sospechoso. Lo estamos arreglando, pero ahora probablemente tenemos 150.000 páginas con 404 errores en Search Console”. [La negrita es mía para enfatizar. Llegaré a eso a continuación.]

Uau.

Eso es un montón de páginas, una molestia colosal, y bastante a considerar.

La respuesta de Muller fue: “En una situación como esa, no creo que haya una gran diferencia con respecto a hacer una página 404 para redirigir a la página de inicio”.

Continuó diciendo que una redirección a la página de inicio se consideraría una página ‘soft 404’, y sería tratada de manera similar a una página 404.

Una de las cosas más importantes de las que estar seguro

Después de una breve pausa, Mueller también dijo: “Lo que trataría de hacer en un caso como este es centrarme en las páginas más importantes de su sitio web y asegurarme de que todas funcionen realmente bien y asegurarme de que se actualicen en la búsqueda …”

Los 404 son probablemente más fáciles que redirigir

Mueller continuó: “… y todo lo demás… probablemente 404 es el enfoque más fácil en el que si elimina esas páginas, devuelve 404 de forma predeterminada”.

Si eres un webmaster o sabes sobre la creación de páginas web, puedes ver cómo los 404 simples (simplemente eliminar las páginas no deseadas) son más fáciles que hacer redirecciones (lo que supone que tendrías que ir manualmente (o usar un software) a cada página y redirigir cada una individualmente).

Pero espera… ¿Qué pasa con las páginas que ya existían?

Arriba, transmití que Mueller dijo que se centraría en sus páginas más importantes y se aseguraría de que estuvieran funcionando. Y eso tiene sentido.

Pero, para un sitio que tiene más de 100 mil páginas de tamaño, eso podría ser mucho trabajo que llevará tiempo.

¿Qué se puede hacer mientras tanto?

Páginas que se hicieron frente a páginas preexistentes

Arriba, mencioné que puse en negrita una parte de la pregunta original que decía que “se hicieron páginas“.

A partir de eso, deduzco que el malware creó páginas en el sitio que no estaban allí antes.

Ese parece ser el caso, pero mi pregunta es: ¿qué pasa con las páginas preexistentes? ¿También fueron tomados por el malware y se transformaron efectivamente en páginas de malware?

Idealmente, para las páginas que existían antes del ataque de malware, desea ponerlas en marcha, comenzando con sus páginas más importantes.

Antes de continuar, debo mencionar una suposición que hice: estoy asumiendo (y sí, sé que no debes asumir cosas) que este sitio todavía era bastante grande antes del ataque de malware. No hay nada en la pregunta original que implique explícitamente que la cifra de 150K es el número de páginas que existían antes o después del ataque.

Si el sitio era, digamos, solo 25 páginas antes del ataque y 150K después, entonces seguro, 404 en las páginas creadas podría ser el camino a seguir.

Pero digamos que el sitio tenía miles o decenas de miles de páginas de tamaño antes del ataque, y tenía una gran cantidad de buenas páginas indexadas … tantos que sería difícil reconstruirlos todos en poco tiempo.

En ese caso, como medida temporal, en las páginas preexistentes / preataque (o URL) que no tuve tiempo de reconstruir o que no eran mis páginas más importantes, simplemente haría redirecciones 301 a la página de inicio o a una página más apropiada que reconstruí (como una categoría o página principal). (Si bien las redirecciones 301 se definen como permanentes, creo que, para SEO, son más preferibles que, por ejemplo, las redirecciones 302, pero la elección es tuya).

Entonces, en mi opinión, el problema de 404-vs-redirect no es necesariamente una proposición de uno u otro que se aplique a cada página de un sitio posterior al ataque. Para las páginas preexistentes que aún no se han reconstruido, se pueden preferir las redirecciones. Para las páginas / URL que fueron creadas por el malware, se puede preferir la eliminación simple de páginas / URL o 404s.

“… Esperemos que puedas bloquear las cosas para evitar este tipo de situación en el futuro …”

Eso fue algo que Mueller dijo en la primera parte de su respuesta.

Y eso me hizo pensar…

¿Cómo se pudo haber evitado esto?

¿La empresa de alojamiento tenía copias de seguridad de rutina?

Ahora, puedo entender cómo, para un sitio grande y dinámico, restaurar desde una copia de seguridad podría no ser tan simple como lo sería para un sitio más pequeño y simple.

Me pregunto qué medidas de protección estaban en vigor, si es que había alguna, antes del ataque.

Es por eso que, si planea o tiene un sitio grande (o un sitio de cualquier tamaño, en realidad), se asegura de que haya algún tipo de medida de protección y / o restauración en su lugar.

Conozco al menos una empresa de alojamiento que hace copias de seguridad diarias y mantiene cada copia de seguridad para algo como … 28 días más o menos.

O tal vez pueda usar un software o complemento para hacer copias de seguridad de su sitio.

Si usa copias de seguridad, asegúrese de estar bien ensayado en el proceso de recuperación del sitio. Idealmente, en una versión sandbox o práctica (no en vivo) de su sitio, desea practicar la restauración de su sitio desde una copia de seguridad, de modo que en una situación real, no lo esté haciendo por primera vez en una situación de pánico.

Probablemente haya muchas soluciones, pero asegúrese de usar una probada, porque solo puedo imaginar cuán grande debe ser la empresa para tratar de restaurar un sitio muy grande.

Me acuerdo de la Regla 80/20, o Principio de Pareto: en este contexto, el 20% de sus páginas representan el 80% de las páginas que se ven. (Por supuesto, puede que no sean exactamente esos: podría ser 10/90, 5/95, o lo que sea). Una pequeña parte de sus páginas puede compensar la mayoría de las vistas / visitas.

Por lo tanto, primero concéntrese en restaurar tantos de ellos como pueda, tan rápido como pueda. De esa manera, la mayor parte de su tráfico ni siquiera notará las otras páginas. Eso le dará tiempo para usar lo que ha aprendido de este artículo para tomar decisiones sobre qué hacer a continuación.

Fuente: Canal de YouTube de Google Search Central