L’indexation sémantique latente est-elle un facteur de classement ?

Il existe de nombreuses opinions différentes en ce qui concerne l'identification automatique. Certains pensent que l'ISL est un facteur de classement, d'autres non. Nous l'avons testé pour voir ce qu'il en est réellement.
SIA Team
August 31, 2021

L’indexation sémantique latente ou LSI est un concept dont la définition ou l’explication est encore plus controversée. Il est important de rappeler que l’indexation sémantique latente fait partie d’un système de recherche de documents (ce que font les moteurs de recherche). LSI recherche des termes connexes pour vous donner le document le plus pertinent. On confond souvent l’ISL avec les synonymes ou les variations proches d’un terme cible, mais les synonymes et les variations ne sont qu’une partie de l’ISL.

Une meilleure façon d’envisager l’ILS est de considérer que les ILS sont des termes qui apparaissent naturellement dans une conversation sur un sujet particulier. À titre d’exemple, si vous parlez d’une nouvelle voiture, vous pouvez parler du moteur, des roues, de la direction et de la maniabilité, de la consommation de carburant, etc. Aucun de ces éléments n’est un synonyme du terme “nouvelle voiture”, mais ce sont des termes qui apparaissent naturellement dans les conversations et qui sont appelés LSI.

Il y a beaucoup d’opinions différentes sur le LSI, même la définition de ce qu’il est, varie même parmi les SEOs. Certains référenceurs considèrent même les LSI comme des synonymes. Certains pensent que le LSI est un facteur de classement, d’autres non. Mettons cela à l’épreuve et voyons ce qu’il en est réellement, et si vous devriez utiliser l’ISL dans votre contenu.

Configuration du test

Un outil que nous aimons utiliser pour le LSI est nTopic et c’est l’outil qui a été utilisé pour ce test.

Pour ce test, 2 pages de 500 mots avec une densité de mots clés de 2% ont été mises en place. Le même mot-clé et le même titre méta ont été utilisés sur chaque page, et les deux pages ont été optimisées de manière identique pour le mot-clé cible.

La page d’expérimentation incluait le LSI et le score LSI de nTopic pour cette page était de 80,93%`.

Sur la page de contrôle, la LSI a été remplacée par des mots anglais aléatoires à l’endroit exact où la LSI était placée sur la page d’expérimentation. À titre de comparaison, le score nTopic de la page de contrôle était de 36 %.

Afin d’obtenir des termes LSI en premier lieu, nous avons utilisé un ensemble aléatoire de mots comme phrase de mots clés cible qui produirait des résultats limités. Nous avons utilisé la phrase de recherche : fleuriste chaussée piédestal. Pour cette recherche, les résultats ont donné 47 000 documents. Par rapport à d’autres recherches, 47 000 documents représentent une quantité relativement faible de résultats de recherche.

Résultats

Après le lancement de nos pages optimisées, les pages se sont immédiatement classées sur la première page aux positions #3 et #4. La page avec l’ISL s’est classée en troisième position. La page avec LSI gagne.

Utilisez les LSI pour obtenir un réel avantage dans votre pratique du référencement. Un point essentiel à retenir est que les LSI ne remplacent pas l’utilisation du mot-clé cible.

Commentaires de Clint

Dans cette vidéo, Clint parle de ce test et de ce qu’il pense des LSI et des super LSI ou entités, et de la façon de créer du contenu en tenant compte des LSI et des entités.

Voici le test SIA numéro 57 – L’indexation sémantique latente (ISL) est-elle un facteur de classement ?

Il s’agit d’un test assez ancien. Cependant, même s’il est vieux, il est toujours pertinent aujourd’hui, sauf que les différences aujourd’hui, au lieu de regarder les petites chaînes de mots comme qui, quoi, quand, où type de mots, nous regardons le nouveau LSI. La nouvelle saveur de LSI est en fait l’utilisation d’entités dans votre contenu. Si vous avez le moindre doute à ce sujet, vous pouvez regarder des outils comme Inlinks, Surfer, Cognitive SEO, Clearscope, Marketmuse, même SEO Powersuite essaie un peu d’entrer dans le jeu des entités, Text razor, ils utilisent tous les entités. Et la raison pour laquelle ils exploitent les entités est que Google a compris, en utilisant ses techniques d’apprentissage automatique, que la plupart d’entre nous parlent de certaines personnes, de certains lieux, de certaines choses ou de certains événements dans notre contenu en relation avec ce sujet spécifique ou ce morceau de contenu.

Ainsi, si vous rédigez un contenu sur le baseball, vous pouvez parler de balles de baseball, du diamant de baseball, du stade de baseball, de CenturyLink Field ? C’est du football, mais qu’est-ce que c’est que le >Mariners Field, ou encore New York. Si vous êtes un fan de New York, vous parlez des Yankees, des Mariners, des Giants. Ce sont donc toutes des entités.

Il est plus facile, du point de vue de l’apprentissage automatique, et probablement du point de vue de l’analyse des données, de rassembler un ensemble d’entités connues pour être cohérentes avec le sujet que de faire la même chose avec LSI. LSI, c’était tous les mots. Si vous faites un truc sur les tests, vous allez avoir une page de contrôle, vous allez avoir la première place, vous allez avoir des mots-clés cibles, vous allez avoir des documents pertinents, vous allez avoir une page de test, etc…, n’est-ce pas ?

Et donc, nous avons fait une transition, je ne veux pas dire que nous nous sommes éloignés du LSI, mais il n’est pas aussi important que le super LSI, qui est les entités maintenant. Quoi qu’il en soit, ce test est toujours important et il a testé les pages LSI, les pages qui sont optimisées pour le LSI par rapport à celles qui ne le sont pas.

Pour ce faire, il n’a pas utilisé un faux mot-clé, nous en avons inventé un – donc un Florist Causeway Pedestal. Si vous pensez à ça comme à un fleuriste, une chaussée est un peu comme un couloir, et puis des piédestaux que vous avez mis dessus. Donc ça aurait du sens et il y a en fait 47 000 documents, selon les résultats de la recherche, disant que c’est une sorte de chose, ok.

L’une des pages a été optimisée, en utilisant des LSI, et l’autre, les endroits où se trouvaient les LSI ont été remplacés par de l’anglais ipsum, un ensemble aléatoire de mots à l’intérieur de ces endroits. En conséquence, la densité des mots-clés est restée la même et le test LSI n’a pas été faussé.

La page LSI a battu la page qui n’était pas optimisée pour notre site. Gardez à l’esprit qu’elles ont toutes deux la même densité de mots-clés. Si la page LSI était optimisée et que la densité de mots-clés passait à trois et que l’autre page restait à deux, le test aurait été faussé. Dans ce cas, les deux pages avaient la même densité de mots clés et nous avons donc vu que la page LSI était classée en troisième position par rapport à la page qui était classée en quatrième position sur 47 000 documents.

Nous savons donc que l’ISL existe, qu’il existait déjà à l’époque et qu’il existe encore aujourd’hui, alors comment l’utiliser ?

LSI, vous pouvez toujours le faire et Ntopic est toujours là. Je pense qu’il y a quelques textes SA, qui sont toujours là. Je sais que WebSite Auditor de SEO Powersuite l’a toujours et en plus les outils comme Surfer, Cognitive, Inlinks, etc., non seulement apportent les entités, mais certains d’entre eux font un peu de LSIT, parce que vous pouvez regarder certains de ces termes que ces outils apportent et ce ne sont pas des entités, mais ce sont des mots communs que vous voyez là.

Je vous recommande de vous trouver un bon outil LSI, d’éditer votre contenu, de le placer dans Frase, puis Surfer, de l’optimiser avec les entités, d’arrondir le tout en utilisant des Inlinks, puis de le publier après avoir nettoyé la grammaire et tout le reste avec Grammarly, ou quel que soit votre outil de vérification grammaticale préféré, et vous verrez de très bons résultats. Et c’est un contenu bien optimisé, bien écrit, et qui se lit vraiment bien. Ce n’est pas du “contenu SEO”.

Le processus de commande est assez simple et je peux vous montrer un peu à quoi cela ressemble. Si vous voulez commander, vous avez votre plan de contenu, d’accord ? Et dans cette ébauche de contenu, vous pouvez utiliser vos outils comme Frase ou autre, vous allez essentiellement avoir vos H1s, vos H2s, H3s, et puis vos H4s.

La façon dont je fais le plan, pour moi, je vais toujours avoir la correspondance exacte ici (H1) et je vais toujours avoir la correspondance exacte dans mon dernier H4. Et la raison en est que ceci est l’introduction, et ceci est la conclusion. Et donc, quand vous pensez à écrire un papier, c’est mon sujet, c’était tout sur, et c’est ce que j’ai dit, et maintenant ils se terminent et je ferme ce sujet. C’est pour ça qu’ils sont toujours là. Et ici, vous avez vos autres termes, vous pouvez faire ce genre de choses dehors.

Donc quand vous envoyez ça au rédacteur, tout ce que vous avez à faire c’est de lui envoyer ça, ok, ne lui dites pas d’écrire un SEO, ne lui donnez pas le mot clé à écrire, c’est mon sujet, c’est ce que je veux que vous écriviez. Et vous pouvez mettre votre mot-clé là-dedans, si vous voulez comme – Top 5 RC ou top 5 des drones pour les pilotes amateurs, d’accord ? Et ils vont sortir et suivre ce plan, écrire votre contenu pour vous avec aucune considération de SEO dans leur esprit.

Maintenant, quand ils font ce truc ici, quand ils le mettent dans le format du plan. à la fin de la journée, ils vont écrire pour le référencement. Vous n’avez pas besoin de lui dire ça et vous n’avez pas à vous disputer sur la qualité ou non du contenu SEO. Ils l’écrivent pour vous et vous le faites faire.

Ensuite, vous mettez cela à l’intérieur d’un outil LSI et si c’est écrit de cette façon, comme je viens de le dire ici, les scores LSI vont en fait être assez élevés, vous n’allez pas nécessairement avoir à vous soucier de tout un tas de choses et c’est là que le truc de l’entité entre en jeu.

En bref, lorsque vous faites cela, cela s’occupe presque efficacement de l’aspect LSI pour vous et vous n’avez pas besoin d’y réfléchir et d’acheter un autre outil ou autre pour le mettre en œuvre. Et puis vous passez à votre Surfer. Je fais Frase, Surfer, puis Inlinks. Et puis d’Inlinks à Word, où dans Word, je frappe avec Grammarly et en faisant tout ça, vous allez vous occuper de LSI, vous allez vous occuper de votre grammaire, vous allez vous occuper de votre flux, vous allez l’avoir lu plein de fois pour vous assurer qu’il est exact, que votre rédacteur a recherché les bonnes informations ou quoi que ce soit d’autre, et que vous avez abordé le sujet de la manière dont vous l’aviez envisagé. Vous pouvez alors publier et neuf fois sur dix, il sera publié dans les 20-25 premiers pour le mot-clé à concurrence facile ou moyenne. Il sera très bien placé.

Là où vous avez un peu de mal, c’est si vous entrez dans des termes à plus forte concurrence, etc. Alors ce genre de choses, à un moment donné, ne fonctionnera tout simplement plus parce que Google sait que c’est un mot-clé axé sur les liens retour, comme l’optimisation des pages, je peux écrire un beau contenu sur l’optimisation des pages, passer par tous les outils de rédaction, marquer tout ce que je veux, et ne toujours pas me classer. Pourquoi ? Parce que ce terme est principalement axé sur les liens retour, ce qui est très ironique.

Dans ce but, faites ceci, écrivez votre contenu dans ce schéma, et ensuite l’ISL prendra soin de lui-même, mais il vous aidera toujours à vous classer.