La création de contenu optimisé pour le SEO demande du temps, et pour qu’une page soit bien positionnée dans les résultats de recherche de Google, cela nécessite des compétences en référencement naturel. On est alors tenté de copier et coller un texte d’un site de référence bien positionné. Mauvaise idée : Google va s’en rendre compte, et pénaliser la page de contenu dupliqué, voire le site tout entier. Voyons alors quels sont les risques à utiliser le duplicate content.

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué, ou duplicate content, désigne le fait d’avoir un certain volume de texte qui se retrouve sur 2 pages web ou plus, avec de la paraphrase ou un copié/collé franc et non dissimulé.

Or, nous le savons, en 2022, le contenu est roi en SEO, et représente un gros enjeu business. En effet, si un site propose du contenu dupliqué, Google identifiera un seul auteur et propriétaire du contenu, et pénalisera l’autre, réduisant drastiquement les performances SEO de la page ou du site qui a plagié.

Comment Google décide de l’auteur d’un texte dupliqué ?

Lorsque Google se retrouve face à deux contenus identiques, deux facteurs vont influencer sa décision de donner l’autorité à l’un ou à l’autre :

  • L’historique du contenu : la page qui aura été parcourue en premier par Google sera considérée comme la page autrice du contenu ;

  • Le poids et la réputation du site : plus un site est influent et produit du contenu régulièrement, plus il a des chances d’être reconnu comme l’auteur du texte.

Quelles sont les conséquences du contenu dupliqué ?

Le contenu dupliqué fait partie des critères de performance du SEO en 2022. Une étude montre d’ailleurs que 2 indicateurs pèsent plus que d’autres dans la note de performance attribuée au site :

  • La régularité et la constance de la production de contenu de qualité ;

  • La capacité à produire du contenu de niche, du contenu d’autorité, pour que Google puisse avoir la réponse la plus qualitative sur un maximum de sujets.

Google ne prend donc pas en compte les pages de duplicate content. Au mieux, il les ignore, au pire, il les pénalise, que ce soit au niveau de la page (en ne l’indexant pas dans Google) ou au niveau du site, en le désindexant complètement (mesure assez rare, mais possible).

Le plagiat peut mener un site ou une page à être banni de la SERP de Google. Ils ne vont alors plus apparaître dans les résultats de Google, ou alors dans les dernières pages de la SERP.

C’est, entre autres, grâce à cette sélection des pages indexées et référencées que Google arrive à donner les meilleures réponses à ses utilisateurs. Un rare cas peut aussi arriver, concernant surtout les sites avec une très grande visibilité.

Bon à savoir : il peut arriver qu’un site subisse un reporting manuel de plagiat, visible dans l’onglet de la search console. Cela déclenche alors une action manuelle de pénalité du site de la part de Google.

Quels sont les différents types de contenus dupliqués ?

En matière de contenus dupliqués, il y a deux cas de figure : le duplicate content interne, et le duplicate content externe.

Le contenu dupliqué externe

Un site B, par manque d’inspiration, de courage ou de compétences, copie et colle bêtement le contenu de qualité du site A, ou s’en inspire très fortement avec une paraphrase grossière. Dans ce cas, si le site B n’est pas très puissant, il va directement être repéré et pénalisé.

Le contenu dupliqué interne

Bien plus fréquent qu’on ne le croit, notamment sur les sites e-commerce, ce duplicate content est un peu moins grave, car Google comprend que le contenu est présent sur 2 pages hébergées par le même domaine. Il n’y a donc clairement aucune intention de nuire. Mais ça a un impact fort sur la compréhension et le ranking des pages du site, car il y a cannibalisation des pages (une page = un mot-clé, donc si contenu dupliqué il y a, il faut supposer que les 2 pages se positionnent sur le même mot-clé).

Dans ce cas, Google partage les torts, et les deux pages seront moyennement classées. Il va ensuite y avoir une dégradation de la note de performance Google, car le contenu ne sera pas assez authentique, et donc ne sera pas considéré comme un contenu d’expert, de niche, d’autorité.

Dans le cas du duplicate interne, la balise canonical sert à définir une page qui fait autorité par rapport à une autre, et permet de choisir la page que l’on veut mettre en avant sur la SERP, pour éviter qu’elle ne soit pénalisée pour le duplicate content interne.

Par exemple, pour une paire de chaussures déclinée en 3 couleurs, on peut créer un contenu unique pour chacune (très chronophage), ou ajouter une balise canonical en intégrant la couleur de la chaussure, pour que chaque modèle soit d’autorité sur la couleur.

Dans le cas d’un récit unique pour plusieurs sites d’un même propriétaire (site d’une marque franchise, par exemple), il faut soit réécrire les textes, soit géolocaliser la page en injectant le nom de la ville ou autre dans le texte, ou diluer le texte dans un contenu plus conséquent.

Quel est le taux de plagiat autorisé par Google ?

On considère qu’en-dessous de 10 % de duplicate content (=10 % de similitude de texte entre 2 pages) il ne se passera rien de la part de Google. À partir de 25-30 %, les pénalités peuvent commencer à tomber, surtout si Google comprend que la structure de l’article est très similaire, voire identique au contenu plagié (H1, H2…), ou s’il y a des gros blocs de phrases identiques.

Il existe aujourd’hui de nombreux outils de vérification de plagiat, payants ou gratuits, comme grammarly, copyscape, unicheck, paper rater…

Comment éviter le contenu dupliqué ?

Pour éviter le duplicate content, la réponse la plus évidente est de ne jamais copier/coller ou paraphraser du contenu.

Il faut d’ailleurs être vigilant, parce qu’on a parfois l’impression de rédiger un contenu unique, et en vérifiant sur un vérificateur de plagiat, on se rend compte qu’inconsciemment, notre cerveau s’est largement inspiré de ce qu’il a pu lire sur d’autres sites.

Ensuite, il est conseillé de ne pas traduire mot à mot une page en anglais ou dans une autre langue, car Google est capable de le repérer.

Enfin, il ne faut jamais dépasser 20 % de duplicate (voire 10 % si vous voulez vraiment être tranquille). L’objectif est alors de construire du contenu unique et documenté, avec votre propre plus-value.

Plagiat : les points de vigilance

Le duplicate content se cache parfois là où on ne l’attend pas.

Un site d’actualités doit, par exemple, être particulièrement vigilant, car on peut facilement se retrouver avec du duplicate sur une interview donnée à une personnalité. Si vous souhaitez vraiment retranscrire mot à mot l’interview, il faudra alors densifier la page en apportant du texte supplémentaire autour du texte plagié.

Par ailleurs, quand le contenu commercial est identique sur plusieurs sites, on est face à du duplicate content. Par exemple, un magasin qui a une phrase d’accroche unique ou un à propos que l’on retrouve sur les 100 sites de la marque des différentes villes fait du contenu dupliqué sans même le vouloir.

Google reconnaît aussi le content spinning (génération d’un contenu à partir d’un texte initial pour lequel on a proposé un synonyme pour chaque mot). Il est donc peu judicieux de recourir à ce type d’outils.

La création de contenu demande des compétences et du temps, et pour qu’un texte soit bien référencé d’un SERP, cela demande un savoir-faire. Vous n’avez pas le temps ou les connaissances suffisantes pour produire des textes optimisés ? Confiez votre projet de stratégie SEO à Lemon Interactive et assurez-vous un contenu unique et personnalisé.