Le duplicate content est un facteur défavorable en référencement lequel se traduit par l’existence d’une page web sous plusieurs urls. Les moteurs de recherche interprètent cela comme une tentative d’abus de la part de l’éditeur du site web (la volonté de simuler un volume de pages plus important).

Le duplicate content représente un risque au niveau du positionnement (sanction des moteurs de recherche notamment Google entraînant une baisse de l’audience) et de mauvaise diffusion de la popularité :

  • Positionnement : les moteurs de recherche peuvent pénaliser le site Internet en termes de classement dans les résultats de recherche.
  • Popularité : la popularité est distribuée entre plusieurs urls au lieu de la concentrer sur un seul url.

Résoudre un cas de duplicate content n'est pas nécessairement complexe.
Généralement, il s'agit de mettre en place des redirections de type 301 et/ou un fichier robots.txt (selon les cas).

Le coeur du problème réside dans la détection de ce phénomène sur son site Internet.

Il existe différentes techniques pour identifier un duplicate content.

En voici quelques unes :

  • Commençons par un cas classique : si votre site web ne dispose pas de sous nom de domaine, naviguez en utilisant d'une part l'adresse avec "www" et sans "www". Si vous pouvez naviguer sans constater de redirection, vous serez face à un problème de duplicate content.


  • La page d'accueil fait souvent l'objet d'un duplicate content. Rendez-vous sur la page d'accueil de votre site web de plusieurs façons (en saisissant l'adresse de votre site, en cliquant sur les liens pointant vers votre page d'accueil sur votre site comme le logo etc.), vous serez alors en mesure de constater si votre page d'accueil existe sous différents urls, sans redirection, constituant un cas de duplicate content.


  • Mettre en ligne un même site web sous plusieurs noms de domaines, représente un cas de duplicate content. L'audit de votre système web peut vous permettre d'identifier qu'au moins deux sites présentent des pages similaires (au moins 70%). Envoyer une requête contenant quelques lignes de contenus d'une page dans un moteur de recherche peut vous permettre d'identifier les pages concernées.


  • Si vous disposez d'une pré-prod, il convient de s'assurer que les pages de pré-prod ne soient pas indexées par les moteurs de recherche. L'insertion par mégarde de liens pointant vers les pages de pré-prod sur son site officiel peut entraîner l'indexation des pages de pré-prod. Les moteurs de recherche connaissent donc deux urls différents pour une page similaire, se traduisant par un duplicate content.


  • Autre moyen de repérer un duplicate content : utilisez le service Google Webmaster Tools et consultez la liste des urls portant le même title. Derrière cette liste d'urls peuvent se cacher des cas de duplicate content.


Bonne chasse !


Pour aller plus loin, confiez à Enki Technologies l'audit de référencement de votre site !
Une prestation comprenant un rapport d'analyse de 40 pages accompagnées de recommandations et d'une réunion de débriefing.

Contactez-nous au 01 76 00 71 20 ou par e-mail !