La balise Meta robots est une ligne de code, indispensable en matière de référencement naturel. Cette balise, située dans la section <head> de vos pages web a pour objectif de communiquer avec les robots de crawl.

Sa mission est assez simple, elle doit indiquer à tous les crawlers si la page qu’ils explorent actuellement peut être explorée mais également si les liens y figurant peuvent être suivis…

Pourquoi utiliser la meta robots pour empêcher l’exploration de pages ?

La fonction qui consiste à interdire l’exploration d’une page web par la balise meta robots est essentielle pour présenter à l’indexation uniquement des pages qui ont un intérêt à vos visiteurs. En effet, si vous laissez libre court à une exploration anarchique de l’ensemble de vos pages, vous risquez de vous retrouverez avec des centaines de pages pauvres en contenus, très préjudiciable pour votre SEO et le comportement de vos visiteurs.

Cette balise meta robots permet ainsi de bloquer l’exploration de pages telles que :

  • Des pages avec contenus sensibles : indispensable si vous collectez des données personnelles, des éléments confidentiels etc…
  • Des pages avec potentiels de risques SEO : vous avez certainement des pages à contenus dupliqués, pauvre en texte, etc… Vous êtes parfaitement conscient que ces pages sont potentiellement « sanctionnables » par Google, autant les bloquer par anticipation.
  • Des pages générées ou structurelles. Certaines pages sont générées automatiquement par les CMS, il faut absolument les bloquer si elles n’ont aucun intérêt. On peut également parler des pages de processus de commande de e-commerce…

Meta robots et l’optimisation du pagerank interne

La balise meta robots a une double fonctionnalité. Elle permet d’indiquer aux robots d’exploration si on accepte ou non l’indexation d’une page mais ce n’est pas tout. Elle permet aussi d’indiquer à ces mêmes robots si on accepte ou non que les liens figurant dans cette page soient explorés et suivis.

Ainsi, en refusant, vous allez pouvoir optimiser notre netlinking interne et votre jus de lien. Cette technique est également très utile si vous souhaitez indiquer à Google de ne pas suivre des liens pour lesquels vous n’avez pas une certitude totale de leurs sources.

Toutefois, je conseille vivement d’utiliser plutôt l’attribut « rel=nofollow » de façon individuel sur chaque lien.

Comment utiliser la balise meta robots ?

La balise meta robots a un fonctionnement très simple. En effet, à partir de cette balise, vous pourrez intégrer 4 commandes, qui auront des actions différentes :

  • Index : cela veut dire que vous acceptez que cette page soit totalement indexée dans les résultats de recherches.
  • Noindex : cela veut dire que vous refusez que cette page soit indexée dans les résultats de recherches.
  • Follow : cela veut dire que vous acceptez que les liens figurant dans le contenu de cette page soit analysés et suivis.
  • No Follow : cela veut dire que vous refusez que les liens figurant dans le contenu de cette page soit analysés et suivis.

Concrètement, la balise meta robots prend la forme comme suit ( un exemple…) :

<meta name="robots" content="index,follow"/>

Vous devrez donc à chaque fois préciser si vous souhaitez que le contenu soit indexé ou non et les liens suivis ou non. Soyez rassuré, tous les CMS d’édition de sites Internet assurent ce travail de façon très facile à l’aide de plugin SEO par exemple.