Sommaire
Qu’est-ce que la balise meta robots ?
La balise meta robots est une balise HTML placée dans l’en-tête (<head>) d’une page web. Elle transmet des directives précises aux moteurs de recherche pour contrôler l'indexation et le suivi des liens.
Fonctionnement et syntaxe
La syntaxe standard est la suivante :
<meta name="robots" content="noindex, nofollow">
Les attributs les plus utilisés :
- index / noindex : autorise ou interdit l'apparition dans les résultats de recherche.
- follow / nofollow : autorise ou interdit le crawl des liens de la page.
- noarchive : empêche la mise en cache de la page.
Meta Robots vs Robots.txt
Le robots.txt bloque l'accès à des dossiers, tandis que la balise meta robots agit au niveau de la page. Elle est plus efficace pour garantir qu'une page spécifique n'apparaîtra jamais dans l'index de Google.
Quand l'utiliser ?
- Pages de faible valeur : mentions légales, paniers, résultats de recherche interne.
- Contenu dupliqué : filtres de produits, versions imprimables.
- Budget Crawl : pour concentrer l'énergie de Google sur vos pages stratégiques.
Bonnes pratiques
- Placez la balise le plus haut possible dans le
<head>. - Privilégiez le "noindex, follow" pour conserver la circulation du jus de lien (PageRank) vers vos autres pages.
- Vérifiez toujours vos directives après une mise en ligne via la Search Console.
FAQ sur la balise meta robots
Comment vérifier si elle fonctionne ?
Utilisez l'outil d'inspection d'URL de Google Search Console ou un crawler comme Screaming Frog pour valider vos directives.
Quelles alternatives existent ?
Le X-Robots-Tag permet d'envoyer ces directives via les headers HTTP, ce qui est utile pour les fichiers PDF ou les images.