Utiliser la technique de scraping consiste à récupérer du contenu déjà existant sur des sites tiers. Le principe est assez simple. Il suffit d’utiliser un logiciel de scraping qui visitera le site source et collectera texte et image s’y trouvant.

Cette démarche fait énormément polémique car elle enfreint un principe de base : la propriété intellectuelle.

Dans le cadre du web, le scraping de données permet différente utilité. La première exploiter ces même données pour générer du contenu directement sur son site Internet. La seconde, exploiter ces données dans un cadre commercial et les revendre ( par exemple scraper des email pour ensuite les revendre ).

La polémique autour du scraping

Mettre en place des actions de scrap efficace demande bien évidemment des connaissances assez supérieures. Nous traitons de ce sujet sur notre blog mais déconseillons fortement cela.

En effet, dans la cadre d’une stratégie SEO quel’on peut qualifier black hat, le scraping a tout son sens. Le Black Hat va chercher essentiellement a rapidement générer un gros volume de trafic avec le moindre effort.

Ainsi, le scraping de contenu déjà existant permettra dans un court terme, de générer du trafic en masse. Le scraping ne sera efficace que s’il est associé à un nom de domaine expiré et par exemple une double traduction de contenu.

Les moteurs de recherches tel que Google sanctionnent fortement cette technique dès qu’elle est détectée. C’est pourquoi elle est souvent abordée dans une visée black hat, où l’objectif est de viser vite et fort sur une courte durée.

Quelques situations de web scraping

Toutes les situations qui demandent à effectuer du scraping ne sont pas illégales ou hors des guidelines de Google. Le principe est très simple, si vous « voler du contenu » tiers, vous êtes hors la loi.

Mais le scraping peut s’appliquer également à ses propres projets individuels ( pour gagner du temps sur ses projets perso par exemple ), et dans ce cadre cela est totalement toléré.

Voici quelques exemples de scraping :

  • Ouvrir un site sans contenu unique basé uniquement sur du scrap de contenu tiers : cela est non seulement inefficace sur du long terme et totalement illégal.
  • Intégré sur un site web du contenu scrapé et légèrement modifié : les moteurs de recherches arriveront à moyen terme à déceler la supercherie, le site sera déclassé.
  • Scraper des adresses mails : de nombreux prestataires proposent encore cela en 2021, mais la limite avec le RGPD et la collecte de donné est très sensible. Nous vous déconseillons vivement d’avoir recours à ce genre de technique.

Le web scraping est il efficace pour mon SEO ?

Si votre objectif est de développer une stratégie white hat, sur une activité pérenne, il est formellement déconseillé d’y avoir recours.

Mettre en avant sur votre site internet du contenu scrapé est en infraction même avec l’une des guidelines de Google les plus connus : le duplicat content.

Le contenu que vous avez intégré vient d’un autre site web, il sera donc naturellement dupliqué.