in

Duplicate content : comment détecter et résoudre les plagiats ?

duplicate content, redaction web, articles optimisés

Redouté à juste titre par de nombreux marketeurs, le duplicate content est la dernière chose dont ont besoin les pages de votre site. Les cas de contenu dupliqué sont majoritairement involontaires. Quoi qu’il en soit, la prudence veut que tous propriétaires de sites web mènent une surveillance active pour être sûrs de ne pas avoir de contenus dupliqués sur leur plateforme.

Cette précaution est d’autant plus importante quand Panda, l’algorithme de Google mis à jour en 2011 a rendu la lutte contre les fermes de contenus et les contenus de faible qualité plus intense. Les pénalités à l’encontre des sites qui s’y adonnent devenant plus sévères, cette réalité est depuis lors entrée dans les mœurs. Heureusement, diverses solutions anti plagiat permettent de venir à bout des contenus dupliqués.

Qu’est-ce que le duplicate content ?

Un duplicate content est la traduction anglaise de contenu dupliqué qu’on appelle également un plagiat. Le duplicate content fait référence à la reproduction d’articles d’autres sites en vue de les publier tels quels sur son site. Les deux contenus se ressemblent ou présentent de nombreuses similitudes tout en ayant des URL distinctes.

Quelles peuvent être les causes d’un duplicate content ?

Généralement involontaires, les pages dupliquées ont plusieurs origines. Ce peut être d’ordre technique lors d’un paramétrage du CMS. Effectivement, les Content management System à l’instar de WordPress peuvent générer des pages tags, pages catégories, pages portfolio… Les moteurs de recherche vont les interpréter comme des contenus dupliqués.

L’utilisation de titres en double et des segments de textes par le webmaster entraîne aussi un contenu dupliqué. Il en est de même de l’indexation d’une version de site en développement ou en test. Les plugins de maintenance et le fichier robot.txt permettent d’y remédier. Sur WordPress, allez dans Réglages > Lecture pour faire en sorte que le site ne soit pas indéxé. Il est aussi courant d’avoir du duplicate content lors d’une manœuvre incorrecte de netlinking.

 

Quand les sites font du duplicate content intentionnellement

Parallèlement, certains sites cherchent à duper les moteurs de recherche dans une optique d’avoir un meilleur ranking et générer du trafic. Cependant, cette pratique n’est clairement pas le meilleur moyen d’y parvenir en raison de l’expérience utilisateur médiocre qu’elle procure.

Quels risques encourent les sites qui pratiquent le duplicate content ?

Pour Google, le copié collé est synonyme de contenu de mauvaise qualité. Résultat : cela peut faire complètement disparaître votre site des résultats de recherche. Au mieux, il sera dans les bas-fonds des SERPs. Mais la pénalisation ne reste pas là puisque non seulement vous verrez votre visibilité et le trafic vers votre site diminuer. Dans le même temps, vos lecteurs vont remettre en cause la fiabilité de votre marque. Le moteur de recherche qui ne s’y retrouve plus risque de poser un filtre sur le contenu original. Les pénalités et les déclassements infligés par Google laissent impuissantes de nombreuses entreprises. C’est pourquoi il est dans votre intérêt de prendre les mesures nécessaires.

Détecter le contenu dupliqué

Impossible de corriger un duplicate content sans l’avoir repéré au préalable. Les solutions antiplagiats gratuites ou non sont les meilleurs outils à avoir sous la main. Elles s’avèrent également efficaces pour être sûr d’avoir des contenus uniques si vous déléguez la rédaction SEO de vos contenus, et contre les doublons en interne pouvant malencontreusement se glisser dans vos propres textes.

Les outils anti-duplicate content

duplicate content

Parmi les plus populaires, on peut citer Kill Duplicate. Il permet de voir en temps réel quels sites se sont emparés de vos contenus. D’autres, comme Duplichecker, s’assurent de l’originalité de vos contenus et aussi que vous n’êtes pas sur le point de mettre en ligne un article dupliqué.

Copyfight, outil de protection de contenu très complet vous prévient quand un site tiers publie un article copié du vôtre. Pour lutter contre les risques de contenus dupliqués en interne, SiteLiner et Screaming Frog scannent les descriptions dupliquées jusqu’aux métadonnées… Enfin, en dehors de sa fonction basique, CopyScape, quant à lui, existe aussi en version pro et parcourt régulièrement le web pour vous alerter s’il détecte des copies de vos contenus.

Résolution des problèmes de contenus identiques en interne

Les boutiques en ligne rencontrent souvent un problème de duplicate content à cause des fiches produits. Mais quand il s’agit de plagiats dus à des causes involontaires, plusieurs méthodes vous permettront d’indiquer aux moteurs de recherche la bonne destination.

La redirection 301

Celle-ci redirige les moteurs depuis la page copiée vers l’originale. Cette pratique fait cesser la bataille de ranking entre les pages tout en boostant celui de la page d’origine.

La balise rel=canonical

Les balises canoniques ordonnent aux moteurs de traiter la page citée comme une copie de l’URL indiquée afin qu’ils attribuent les liens et metrics etc. à la bonne page.

Les paramétrages SEO dans les CMS

Cette pratique, au même titre que le plugin Yoast SEO de WordPress, précise aux moteurs de recherche qu’ils ne doivent pas indexer les contenus pauvres.

Qu’en est-il des duplicate contents en externe ?

Sur les logiciels anti plagiat, vous trouverez des sections de contenus similaires au vôtre en forme de liste. À vous de juger si c’est normal, notamment lorsqu’il ne s’agit que d’un nombre limité d’expressions ou de phrases. Ce qui est loin d’être le cas quand vous voyez des pans entiers tirés de vos articles. Cette technique fonctionne aussi sur les moteurs de recherche en collant un extrait de texte entre guillemets avant de lancer la recherche. Si votre site n’est pas le seul à ressortir, le contenu peut avoir été plagié.

Comment réagir si on est victime de contenus dupliqués ?

Captures d’écran, contacts, URL… Prenez tout ce qui peut vous servir de preuves. Présentez-les au plagiaire et demandez-lui de retirer son contenu. Les réseaux sociaux sont pratiques pour contacter le webmaster.

Si cela ne fonctionne pas, l’envoi d’une lettre recommandée avec accusé de réception spécifiant clairement la demande et la date butoir devrait l’alarmer. Signaler le site en faute à Google à travers son rapport Spam ou prévenez l’hébergeur. Si le règlement à l’amiable ne donne aucun résultat, faites valoir vos droits d’auteur et déposez plainte.

Quand Google sanctionne à la suite d’un duplicate content, il est malheureusement souvent trop tard comme il est aussi pénible d’en sortir. C’est pourquoi vous gagnerez à commander vos textes auprès de spécialistes du SEO ou des rédacteurs web SEO professionnels. Avec ces experts, vous êtes assuré d’avoir un niveau de qualité très appréciable assorti d’une garantie no duplicate puisque les contenus livrés sont systématiquement vérifiés.