Tout le monde sait que Google indexe les pages Web. En fait, c’est presque la définition même de ce qu’est Google, et c’est son activité principale.
Mais ce que beaucoup de gens ne savent pas, c’est que Google est, en quelque sorte, en guerre.
Une guerre permanente avec de très nombreuses batailles.
Cette guerre est menée pour assurer votre sécurité et celle des autres utilisateurs. À l’abri d’informations fausses ou trompeuses, à l’abri de sites Web malveillants (logiciels malveillants et hameçonnage) et à l’abri de… mauvaises choses.
Google tente non seulement d’assurer votre sécurité, mais aussi, dans une certaine mesure, de protéger votre vie privée.
Si vous êtes un webmaster qui souhaite obtenir du trafic de recherche organique sur Google, cette question est pertinente, car Google a établi des règles à suivre et à ne pas suivre concernant les pages Web.
Mais d’abord, qu’est-ce que le spam, vraiment ?
Pour commencer, le Spam est une marque de porc cuit de Hormel foods.
Quant à savoir comment le terme a fait son chemin dans le jargon informatique, je ne suis pas sûr de ce qui est arrivé en premier : son utilisation dans MUD (multiple user dungeons) ou le sketch des Monty Python.
Cette vidéo amusante donne un peu d’histoire :
Mais indépendamment de la façon dont ce terme est apparu dans le monde de l’informatique, on peut dire qu’au minimum, le spam est quelque chose que nous n’avons pas demandé. Il peut prendre la forme d’un texte indésirable généré par un robot, d’un courrier électronique indésirable, d’un texte indésirable ou, dans le cas présent, d’un résultat de recherche ou d’une page Web indésirable.
Ces pages Web peuvent causer pas mal de problèmes. Par exemple, les plus agressives de ces pages peuvent essayer de verrouiller votre navigateur et ne vous donner qu’une seule option : télécharger quelque chose que vous seriez bien avisé de ne pas télécharger.
Certaines de ces pages peuvent essayer de vous inciter à donner un mot de passe ou des informations de connexion. Par exemple, le nom de domaine d’une telle page peut ressembler à celui d’une grande banque, et la mise en page et le schéma de couleurs d’une telle page peuvent ressembler à ceux de votre banque, mais attention… ce n’est pas votre banque ! Il s’agit d’un faux site qui vous demande de saisir votre numéro de carte bancaire et vos informations de connexion.
Le spam et les affaires de Google
Comme vous le savez, Google est, du moins dans une bonne partie du monde, le moteur de recherche le plus utilisé.
Pour que Google conserve cette position, il doit fournir des résultats de recherche fiables et sûrs.
Pour ce faire, il identifie et réduit le spam.
Une idée de la façon dont Google identifie le spam
Certes, les algorithmes et les méthodologies de Google ne sont pas impénétrables à 100 %. Il existe des sites indignes qui parviennent à se hisser sur la première page des résultats de recherche.
Cela dit, au fil des ans, grâce aux mises à jour et aux modifications quotidiennes de l’algorithme, Google a pris le dessus sur les sites de spam.
Quant à savoir comment Google s’y prend exactement, je ne connais pas le secret de fabrication exact de Google, mais on peut le deviner. Google a des directives pour les webmasters, et je pense qu’une partie de ses algorithmes est conçue pour identifier les pages qui ne les respectent pas.
Par ailleurs, les internautes peuvent soumettre manuellement à Google des pages Web qui ne sont pas conformes aux Webmaster Guidelines. Dans ce cas, Google peut prendre des mesures manuelles pour pénaliser ces pages Web. (Dans ce cas, je pense que Google essaiera d’avertir le webmaster qu’une telle action a eu lieu).
En résumé, voilà une brève introduction au pourquoi et au comment de la lutte de Google contre le webspam.
Source : Canal Twitter de Google