L’attribut NoIndex est une valeur utilisée très fréquemment en SEO. Il s’agit de préciser à l’ensemble des robots d’exploration, lors de leurs passages de crawl, de ne pas indexer cette page active.

Cette valeur NoIndex est directement intégrée dans les balises SEO HTML, plus précisément dans la balise <meta name= robots>.
Voici concrètement le résultat :

<meta name="robots" content="noindex">

Cette balise ci-dessus peut se traduire de la façon suivante : A tous les robots d’exploration, veuillez ne pas indexer le contenu de cette page.

Cette valeur NoIndex n’est pas active par défaut. Si c’était le cas, tout le site Internet ne sera pas indexé sur Google et cela serait catastrophique. Vous devez donc effectuer une configuration unique, sur chacune des pages que vous ne souhaitez pas voir à l’indexation.

Où se trouve l’attribut NoIndex ?

Pour transmettre efficacement ce message de ne pas indexer telle ou telle page à Google et aux autres moteurs de recherches, vous devez utiliser la balise « meta name « robots ».

Cette balise se trouve dans le header de chaque page ( la section <head>), visible dans le code source.

Pour rappel voici sa structure :

<meta name="robots" content="noindex,follow">

Comme vous pouvez le voir sur cet exemple, une seconde valeur s’est intégrée « follow ». Cette valeur a pour action de demander aux robots de crawl de continuer à suivre les liens intégrés dans cette page. En d’autres termes, une page web peut ne pas être indexée mais continuer à diffuser du jus de lien vers d’autres pages.

A quelles occasions utiliser l’attribut NoIndex ?

Intégrer l’attribut NoIndex dans une balise meta name « robots » est nécessaire lorsque vous souhaitez ne pas indexer une page. Google préconise ainsi d’utiliser cette action sur toutes vos pages dites « pauvres en contenus » ou «  de mauvaises qualités ».

En effet cela, vous allez vous garantir de présenter à l’indexation une sélection exclusive de pages de bonne qualité et ainsi optimiser votre « résultat global de positionnement ».

Voici ainsi quelques exemples de pages que vous pouvez retirer à l’indexation :

  • Les pages « membres », « mon compte » etc… : toutes les pages contenant des informations privées doivent nécessairement être bloquées à l’indexation.
  • Les pages « gestion », « tableau de bord », « back office » : toutes les pages d’un back office sont souvent désindexées sur un CMS et c’est tant mieux !
  • Les pages « pauvres en contenus » : toutes les pages pauvres en contenus éditorial ou avec du contenu dupliqué doivent absolument être désindexée sur Google.

Certains référenceurs conseillent de désindexer aussi certaines pages institutionnelles telles que les « mentions légales », « Foire Aux Questions », « Condition de Ventes », « RGPD » etc… Je ne partage pas cette opinion. A mon sens ces pages permettent d’attester de la légalité, de l’origine et du sérieux d’un site web.

Les retrouver dans les résultats Google ne peut pas entrainer un déclassement de positionnement.