Google vient de publier une nouvelle balise robots appelée indexifembedded qui permet de mieux contrôler le moment où le contenu est indexé.
Grâce à cette nouvelle balise robots, vous pouvez indiquer à Google que vous souhaitez que le contenu soit indexé lorsqu’il est intégré à d’autres pages au moyen d’une iframe ou d’autres balises HTML similaires. Et ce, même si la page de contenu dans laquelle le contenu est intégré comporte une balise noindex.
Cette nouvelle balise robots a été publiée pour résoudre un problème courant qui touche les éditeurs de médias. Il s’agit des cas où les éditeurs veulent que leur contenu soit indexé lorsqu’il est intégré à des pages tierces, mais où ils ne veulent pas que leurs pages médias soient indexées par elles-mêmes.
Actuellement, la balise noindex est utilisée dans ces pages lorsqu’ils ne veulent pas que les pages multimédias soient indexées. Le problème est que la balise noindex empêche également l’intégration du contenu dans d’autres pages pendant l’indexation.
Selon le Google Search Central Blog :
La nouvelle balise robots, indexifembedded, fonctionne en combinaison avec la balise noindex uniquement lorsque la page avec noindex est intégrée dans une autre page par le biais d’une iframe ou d’une balise HTML similaire, comme object.
Par exemple, si podcast.host.example/playpage?podcast=12345 possède à la fois la balise noindex et indexifembedded, cela signifie que Google peut intégrer le contenu hébergé sur cette page dans recipe.site.example/my-recipes.html lors de l’indexation.
La balise indexifembedded est utilisée en combinaison avec la balise noindex et est ajoutée dans le fichier robots.txt. Vous pouvez également spécifier la balise dans l’en-tête HTTP.
À l’heure actuelle, seul Google prend en charge la balise indexifembedded.
Pour plus de détails et d’exemples sur cette nouvelle balise, consultez le blog de Search Central.