Le duplicate content, que l’on traduit en Français par contenu dupliqué, est le fait de proposer un contenu identique ou similaire sur différente pages web. Le duplicate content peut être en interne, c’est-à-dire sur un même site Internet ou en externe, disponible sur différents sites Internet.

Le contenu dupliqué est très mauvais en termes de SEO. En effet, les moteurs de recherchent veulent proposer à leurs utilisateurs du contenu unique, de qualité. Retrouver plusieurs pages répondant de façon identique ou très similaire à une même requête n’encourage pas Google à positionner toutes ces pages.

Distinguer du duplicate content

Le contenu dupliqué peut avoir de nombreuses formes, il peut s’agir d’un paragraphe identique sur plusieurs sites Internet ou tout simplement du vol manifeste de pages web entières.

Certains SEO avide de black hat ont tenté durant de nombreuses années de jouer avec le contenu dupliqué. Pour cela, ils utilisaient des méthodes, très intelligente à l’époque, qui consistait à traduire du contenu étranger ou à utiliser des outils de reformulation de texte. Ces techniques sont aujourd’hui totalement connus des filtres de Google (notamment Bert et Panda ) qui sont en mesures de déclasser toute page web dupliquée d’un site étranger.

Cependant, sachez que la citation d’un auteur est totalement acceptée. Il faut pour cela bien mettre en avant l’url de la source et bien indiquer que ce texte est une citation ( par exemple en utilisant le bloc citation de WordPress).

Les raisons d’un contenu dupliqué

Il existe bien évidemment de nombreuses raisons pouvant expliquer la présence de contenu dupliqué sur un site Internet. Voici les principales :

  • Action malveillante : je cherche à créer du contenu rapidement et donc je vole du contenu déjà existant.
  • Duplication d’url ou DUST: il s’agit d’url généré souvent automatiquement et qui pour autant affiche le même contenu, par exemple avec les filtres à facettes en e-commerce.
  • Utilisation de CMS : les CMS comme WordPress ont tendance à créer des pages identiques, par exemple la page « Auteur » et donc va publier à nouveau du contenu déjà présent sur le site. Il faut dans ce cas, demander la désindexation de ces pages.

Comment éviter le duplicate content ?

Nous l’avons vu précédemment, Google aime l’unique, l’exclusivité, vous devez donc répondre à ces demandes. Pour cela, voici quelques pistes pour vous aider à éviter d’avoir du contenu dupliqué :

  • Rédiger du contenu unique, sans aller vous inspirer chez la concurrence.
  • Paramétrer les paramètres d’URL du CMS que vous utilisez.
  • Vérifier souvent sur les outils en ligne qui permettent de détecter le contenu dupliqué que votre indicateur de duplicité est faible.
  • Suivez simplement la règle 1URL = 1contenu. Si en effectuant un audit technique de votre site Internet en utilisant notamment un logiciel de Crawl tel que Screaming Frog vous remarquez des URL avec des paramètres bizarres, vérifiez si elles sont indexées ou non. Si ces pages sont indexées et apportent du contenu dupliqué, bloquez-les sans attendre.

Le contenu dupliqué est souvent, très souvent une question de mauvais paramétrage. C’est en effectuant ce genre de contrôle du contenu dupliqué que Google vous accordera une meilleure indexation et positionnement de votre site Internet.