La fin d’un mythe : Une page avec des mots-clés LSI est plus efficace qu’une page avec une densité de mots-clés plus élevée.

LSI et densité de mots clés
SIA Team
July 10, 2021

Ce test est basé sur l’observation que les pages classées ne répétaient pas ouvertement le mot-clé plusieurs fois dans le corps du texte. L’idée dominante chez la plupart des professionnels du référencement est d’abandonner l’utilisation de mots clés au profit d’un langage plus naturel. L’idée est que Google devient de plus en plus intelligent et qu’il recherche sur les pages un contenu qui correspond à l’intention de recherche de l’utilisateur, et non un contenu basé sur le placement de mots-clés.

Le terme technique pour “langage naturel” est Latent Semantic Indexing ou LSI. LSI est souvent confondu avec les “synonymes”, mais ils sont différents. Les LSI sont des mots qui reviennent naturellement dans une conversation sur un sujet particulier. Par exemple, si vous avez une conversation sur les cuisines, il serait naturel de mentionner des mots tels que cuisinière, évier, réfrigérateur, garde-manger, etc. Ce sont des termes LSI. Bien entendu, les synonymes des termes cibles apparaîtront également dans les conversations naturelles, c’est pourquoi des variations de mots clés ont également été utilisées dans ce test, plutôt que des termes LSI purs.

Pour obtenir notre langage naturel/ISL, nous avons dû nous écarter de notre contenu normal “lorem ipsum” et utiliser un terme réel qui produirait de l’ISL utilisable. Pour ce faire, nous avons trouvé une expression de mots clés qui n’avait que quelques pages de classement mais qui pouvait produire des termes LSI.

Pour ce test, le mot-clé choisi concernait un service local dans une région éloignée (house demolition bunbury). Ce mot-clé, lorsqu’il a été recherché avec des guillemets, n’a donné que 4 résultats. Les articles ont tous deux été publiés sur un Google Doc et ont été rendus publics. L’article 1 comptait 600 mots, tandis que l’article 2 en comptait 604. La différence entre les deux articles est qu’au lieu de répéter le mot clé “démolition de maison”, le deuxième article l’a utilisé une fois, puis a utilisé des mots clés LSI dans le reste de l’article. Les mots-clés LSI ont été déterminés en recherchant “house demolition” à l’aide du planificateur de mots-clés, puis en choisissant les variations appropriées. L’article test a répété “house demolition” 7 fois, alors que l’article test 2 n’a utilisé ce mot-clé qu’une seule fois.

Résultats

La page qui n’utilise que le mot-clé cible bat la page qui utilise le mot-clé une seule fois, puis utilise les mots-clés LSI et leurs variations.

Conclusion

Ce mythe est brisé. La page qui n’utilise que les mots-clés cibles bat une page qui utilise le mot-clé une seule fois, puis utilise des variations de mots-clés et de LSI.

La densité des mots-clés reste un facteur de classement important pour un mot-clé individuel. Bien que la LSI soit sans aucun doute un facteur de classement, elle ne supplante pas l’importance de placer le mot-clé cible sur la page. Vous entendrez souvent des professionnels parler de l’abandon de l’utilisation des mots clés et de l’utilisation de l’ISL à cause de Hummingbird ou RankBrain. Ce que ces professionnels ne vous disent pas, c’est que vous devez toujours aider Google à comprendre le sujet de la page, en premier lieu.

Il est important de noter que ce qui n’apparaît pas dans ce test, c’est que la page avec des mots-clés LSI se classerait pour beaucoup plus de mots-clés.

Le retour d’expérience de Clint

Dans cette vidéo, Clint parle de ce test. Il parle également de la densité des mots clés et de l’utilisation des LSI, et partage quelques exemples.

Voici le test numéro 25 – LSI vs Mots-clés

Le concept d’indexation sémantique latente n’est pas nouveau, il existait bien avant que 2016 ne fasse ce test, mais je pense qu’il est devenu de plus en plus populaire au fur et à mesure que de nouveaux outils sont apparus pour le traiter. Les outils d’analyse de texte, comme, disons Ntopic en serait un bon exemple. Il y a un outil à l’intérieur de WebSite Auditor for SEO power suite, il y en a un tas.

En gros, le concept est le suivant : disons que vous écrivez un sujet sur les pipes en bois, les outils vont regarder les pages qui sont classées pour les pipes en bois et faire un compte de tous les mots qui sont là, et voir lesquels sont utilisés le plus souvent. Il vous dira alors d’utiliser ces mots dans votre contenu, car ils sont souvent associés au mot cible pour lequel vous essayez d’obtenir un classement. Et donc LSI

Ce test doit absolument être revu, parce que maintenant, nous avons le super LSI, faute d’un meilleur terme. Nous avons des entités et les entités créent un véritable buzz au sein de la communauté SEO et des personnes chargées du contenu, de l’apprentissage automatique de l’IA, etc. Vous avez Bert, vous avez Smith, et je suis sûr que l’IA ouverte, vous avez toutes ces autres choses qui se développent et regardent les entités d’une toute nouvelle manière. Et les entités, finalement, si vous regardez beaucoup de listes, vous verrez que beaucoup sont des “termes LSI”. Nous sommes déjà des entités – personnes, lieux, choses et événements.

Nous voulions voir si l’indexation sémantique latente (LSI), c’est-à-dire le fait de former le sujet autour d’un mot clé en utilisant l’indexation sémantique latente ou les entités super LSI, battrait la densité des mots clés dans un face-à-face. Au lieu de dire plus ou moins sur mon mot-clé moins de fois, j’en dirais plus en utilisant le LSI et en gardant ma densité de mots-clés basse.

Et le résultat était une victoire de la densité de mots-clés. La page qui était optimisée pour le mot-clé a battu la page optimisée pour l’ISL.

Une densité de mots-clés réduite avec une optimisation accrue pour le LSI ne bat pas les mots-clés. Une densité de mots-clés plus élevée ne fonctionne tout simplement pas. Donc vous devez comprendre ça quand vous écrivez votre contenu. Il y a beaucoup d’outils différents qui regardent la densité de mots-clés et ils le font de différentes perspectives.

Je vais juste allumer SERPworkx ici et vous pouvez voir une densité de mots-clés de 01 avec la moyenne de la SERP à .034.

Maintenant, ce n’est même pas entièrement clair comment ils l’ont fait. Comme je leur ai demandé une fois et nous regardons la page entière en décomposant cela, etc. Mais si vous venez ici, et regardez juste un autre outil de densité de mots clés, choisissons-en un par exemple. Keyword density checker. Keyword density trigger, choisissons-en un au hasard. En fait, choisissons quelques extras. Je vois des ninjas du marketing internet. On va choisir celui-là.

D’accord, donc nous avons cette page et copié le lien retour, copié l’URL. La densité dans SERPworx dit point .034 ou c’est en fait un mais j’ai des mots clés partout qui le cache. Set .17 c’est la densité .174 wooden pipes. Ok, alors regardons là-dedans.

Le top des mots-clés fréquence et je ne veux pas de fréquence mais de la densité. Deux mots, pipes en bois. Cet outil n’en a pas trouvé, d’après ce qu’il semble et je commence à m’énerver avec les multiples annonces ici, donc en regardant vers le bas nous ne voyons rien.

La densité du mot-clé serait de zéro selon cet outil, non ? Alors allons-y. Selon cet outil, la densité du mot-clé serait de zéro. Cet outil ne vous donne que des mots-clés uniques.

Donc la page numéro un n’a pas de correspondance exacte. Vous voyez donc pourquoi il faut re-tester. Il faut l’examiner. Je vous parie que je peux le lancer sur Cora et trouver autre chose. Voyons ça. Pourquoi pas, on est là, autant jouer avec certains de mes outils, non ?

Cora Lite. Je ne sais pas si ça va s’afficher pendant qu’on fait ça. Pipe en bois 2.96. Les pipes en bois, c’est le pluriel. Je les additionnerais et dirais que ça fait 3 %. Donc c’était donné et ensuite cet outil a dit que ce n’était pas le cas si je me souviens bien. Allons sur Amazon et vérifions ça. Wooden pipes n’est même pas là. C’est intéressant. Je vois. Donc c’est zéro, selon cet outil, trois, zéro.

Voyons ce que dit celui-ci. “Pipes en bois” 1%.

D’accord, donc en gros, nous voulons probablement être autour de 1,52%, tuyaux en bois. C’est ce que nous cherchons.

Et puis je vais l’arrondir. Et on va y aller et voir ce qu’on a là.

Les résultats du test disent qu’il a été optimisé pour cette page, il a battu le LSI. Nous devons donc vérifier si c’est toujours le cas, en particulier avec la mise en œuvre de l’API NLP de Google, et éventuellement de Bert, etc., qui vous aide à analyser les pages et à voir et formuler des sujets, etc. Nous devons donc nous pencher sur la question et voir si c’est toujours d’actualité.

Et aussi, ce que je viens de faire là, vous pouvez voir que chaque outil va vous fournir des résultats différents. Je suis sûr que je vais obtenir des résultats différents avec l’outil Cora, une fois que ce sera fait. Vous devez donc prendre cela en compte, chercher et trouver un outil auquel vous faites confiance. Celui dont vous savez qu’il va vous donner les résultats les plus précis.

L’en-tête, le pied de page, les barres latérales, parfois les annonces, s’il y a des annonces textuelles, ce genre de choses. Les commentaires vont perturber votre vérificateur de densité de mots-clés si vous ne les incluez pas. Parce que Google verra ces commentaires et ceux-ci, en fait, plus vous avez de contenu, vous réduirez votre densité de mots-clés si les gens ne commentent pas sur ce sujet ou n’utilisent pas ce mot-clé. Vous réduisez donc la densité globale de vos mots-clés pour la page entière.

Mais c’est en supposant que Google combine cela et qu’il ne sait pas si vous avez commencé votre article à un moment donné et si vos articles sont terminés et un autre est Google qui prend cela et parce que les commentaires sont généralement chargés dans la balise body est ajouté en elle. C’est une question intéressante qui pourrait être testée.

Cora lite est toujours en train de faire son truc. Cela pourrait prendre un peu de temps parce que j’enregistre en même temps que nous demandons beaucoup de choses sur mon ordinateur en ce moment, nous verrons, c’est presque terminé.

Mais en gros, ce qu’il fait, c’est qu’il passe à travers. Si vous n’avez jamais vu ça avant, il parcourt le top 100. Il compare. Il regarde ce que font les concurrents et dit ensuite ce que vous devez faire pour les battre. J’aurais pu lui donner un objectif ou lui ajouter une URL pour pouvoir le comparer si je le voulais. Et à la fin, quand tout est dit et fait, il va cracher ce joli rapport que vous pouvez enregistrer comme un fichier HTML pour vos rapports, ou tout ce que vous voulez faire. Donc nous attendons ça. Il nous donnera des entités que nous utiliserons et je crois qu’il y a un rapport LSI. C’est un peu… ce n’est pas comme le logiciel principal de Cora. Le logiciel principal de Cora fait tout le LSI comme le ferait ntopic, etc. Il fait les comptes et tout ça. Je ne suis pas tout à fait sûr que celui-là le fasse. Mais je sais que ce rapport est en fait plus petit. Il n’est pas aussi élaboré que le rapport principal de Cora, car la sortie principale de Cora est une feuille de calcul Excel.

En général, il peut contenir des centaines de mots, mais l’avantage de ces deux rapports est qu’ils réduisent le nombre de mots et indiquent ceux que vous devriez probablement utiliser le plus.

Ils sont également utiles si vous combinez tous ces rapports et disons que vous en avez 10 et que vous faites un classement pour, je ne sais pas – allons-y pour la conception de sites Web de villes. Donc vous avez 10 villes et vous pouvez trouver les signes jaunes qui sont communs à toutes ces villes et qui sont vraiment populaires et les ajouter dans votre modèle quand vous construisez ça pour essayer de vous classer pour plus de choses. Juste pour se rapprocher un peu plus, pour ne pas avoir à réinventer la roue et examiner chacun individuellement au début.

Nous devons retester celui-ci, nous devons tester le LSI sans les entités intentionnellement et ensuite nous devons tester le LSI avec les entités et ensuite je dirais tester seulement les entités mais cela n’a pas de sens parce que c’est toujours un LSI mais nous allons les éliminer tous et ce sera un bon ensemble de retest pour les membres de SIA.

Vous êtes curieux de savoir ce qu’est le LSI ? Nous avons d’autres tests sur le LSI, ainsi que sur les variations et les correspondances de mots-clés ! Consultez nos articles sur les tests et lisez-les.