Widmen sich Webseitenbetreiber zum ersten Mal der SEO-Optimierung, taucht dieser Ausdruck beim Audit regelmäßig auf: Duplicate Content. Es handelt sich um einen wichtigen Optimierungsfaktor, der von Google sonst knallhart abgestraft wird. Viele Menschen, gerade wenn sie nicht vom Fach sind, haben allerdings gar keine genaue Vorstellung davon, was sich hinter Duplicate Content verbirgt. Wir klären daher heute auf und haben auch die passenden Tipps parat, um den Fehler zu beheben sowie in Zukunft von vornherein zu vermeiden.
Duplicate Content – Eine kurze Definition
Hinter Duplicate Content verbergen sich identische Inhalte, die auf mehreren Internetseiten vorkommen. Dabei handelt es sich nicht ausschließlich um Kopien bereits existierender Texte, sondern auch um versehentlich doppelt erstellte Einzelseiten. Duplicate Content existiert dabei sowohl intern auf der eigenen Seite als auch extern. Bei ersterem finden sich alle gedoppelten Inhalte auf der eigenen Domain. Externer Content wiederum ist im Netz gestreut und kommt auf mehreren Webseiten vor. Probleme entstehen vor allem durch die Webseitenbetreiber, da Google Dopplungen bestraft. Betroffene Seiten werden schlechter gerankt oder sogar aus den Suchergebnissen gefiltert, was für die Suchmaschinenoptimierung eine Katastrophe ist. Um das Problem zu lösen, wird der Gegenentwurf zum Duplicate Content benötigt: Unique Content. Dabei handelt es sich um einzigartige Inhalte, die nur für die eigene Seite erstellt wurden und entsprechend auch nur auf dieser vorkommen.
Wenn Google auf doppelten Content stößt
Das Ranking einer Webseite bei Google verändert sich nicht länger nur mit einem großen Google Update, sondern stetig, da Google ein kontinuierliches Crawling im Netz betreibt. Fehler bewirken eine Verschlechterung des SEO-Wertes. Entdeckt der Google-Bot nun aber etliche Seiten, die den exakt gleichen Inhalt vorweisen, kann das Programm sich nicht entscheiden, welche von ihnen nun eine höhere Relevanz hat. Auch um Ressourcen zu sparen, findet also eine gesamtheitliche Abstrafung statt. Für eine ideale Bewertung auf diesem Gebiet sollte eine Webseite ausschließlich aus einzigartigen Inhalten bestehen.
Wie sieht Duplicate Content aus?
Gerade wenn die gedoppelten Inhalte nicht absichtlich durch das Kopieren oder Stehlen fremder Bilder oder Texte erzeugt wurde, finden sich häufig ähnliche Ursachen dafür. Einige davon möchten wir hier benennen.
Keine einheitliche URL-Struktur
Wer eine Webseite von Grund auf neu erstellt, sollte sich auch über die URL-Struktur Gedanken machen. Wird hier auf Einheitlichkeit geachtet, können später viele Probleme vermieden werden.
- Groß- und Kleinbuchstaben – Sind URLs sowohl über Groß- als auch über Kleinbuchstaben erreichbar wie musterseite.de/beispiel-seite und musterseite.de/Beispiel-Seite, gilt auch das für die Suchmaschine als Duplicate Content.
- Das verwendete Protokoll – Das Protokoll einer Webseite zählt ebenfalls zur URL. Ist Ihre Webseite via https://musterseite.de ebenso erreichbar wie unter http://musterseite.de und http://www.musterseite.de, gelten alle Dopplungen als Duplicate Content.
Extra Seiten für gleichen Inhalt
Für mehr Nutzerfreundlichkeit nehmen viele Webmaster den Aufwand auf sich, den Webseiteninhalt noch einmal speziell für die Nutzung durch den User aufzuarbeiten. Wird dafür der gleiche Text auf eine neue URL gestellt, ergibt sich aber dennoch eine Dopplung, die von Google nicht gern gesehen wird.
- Druckversion – Ist die Druckversion einer Webseite unter einer neuen URL erreichbar und nicht auf einer Seite mit eingebaut, ergibt sich hier doppelter Inhalt. Dann sollte die Struktur überarbeitet werden oder alternativ eine Abwandlung der Inhalte durchgeführt werden.
- PDFs – Stellen Sie zusätzliche PDFs mit ergänzenden Informationen zu Ihren Produkten zur Verfügung, die sich in gleicher Form auch auf einer anderen URL finden, gilt auch das als Duplicate Content.
Variationen im Onlineshop
Ein Onlineshop in klassischem Aufbau erzeugt beinahe automatisch einige doppelte Inhalte. Hier ist deshalb besondere Aufmerksamkeit gefragt.
- Produktdetailseiten – für viele Produkte existieren einige Variationen. Kleidungsstücke sind dann zum Beispiel in unterschiedlichen Farben und Größen erhältlich. Ist hier jede Detailseite unter einer anderen URL erreichbar, wobei Textinhalte übernommen werden, summiert sich so eine Menge Duplicate Content.
Diese Liste ist alles andere als vollständig und je nach Branche finden sich hier auch andere Gründe für gedoppelte Inhalte. Wir hoffen allerdings, dass wir mit der Aufzählung einiger Ursachen für etwas mehr Aufmerksamkeit für diese Thematik sorgen konnten. Duplicate Content bedeutet eben in den meisten Fällen nicht einen mutwilligen Diebstahl anderer Inhalte, sondern schlichtweg Unaufmerksamkeit auf der eigenen Webseite.
Duplizierte Inhalte aufspüren
Um solche doppelten Inhalte zu finden, werden am besten Tools genutzt. Es ist zwar möglich, die Google Suche zu nutzen, um einige Textbausteine in Anführungszeichen im Netz zu finden, allerdings sind die Ergebnisse hier häufig sehr unübersichtlich oder sogar unvollständig. Die Google Search Console gibt zu jeder URL auch die Seiten an, die als Duplikat eingestuft wurden. Wer weiterklickt, bekommt schnell weitere Details angezeigt und kann entsprechende Maßnahmen einleiten. Andere Tools zur Onpage Analyse wie Xovi können hier ebenfalls viele hilfreiche Informationen liefern. Mithilfe dieser Reports können die Ursachen für schlechte Suchmaschinenergebnisse aufgespürt und Schritt für Schritt eliminiert werden.
Richtig vorsorgen
Natürlich geht es am Ende nicht nur darum, die vorhandenen Beispiele für duplizierte Inhalte von der eigenen Webseite zu entfernen. Idealerweise werden all die nötigen Vorkehrungen getroffen, um dafür zu sorgen, dass in Zukunft keine neuen Dopplungen vorkommen. 301-Weiterleitungen und sinnvollere Strukturen auf der gesamten Seite sind für den Anfang gute Schritte. Bereits existierender Duplicate Content kann per Canonical-Link auf die URL-Struktur verweisen. Das ist beispielsweise für Detailseiten in einem Onlineshop eine interessante Lösung und bewirkt, dass Variationen desselben Inhalts nicht indexiert werden. Abstrafungen aufgrund des vorhandenen duplizierten Inhalts können so vermieden werden. Sich wiederholende Inhalte können per Robots-Metatag auf „noindex,follow“ gestellt werden, damit diese nicht mehr von der Suchmaschine gecrawlt werden. Die bessere Lösung wäre es allerdings, solche Seiten gar nicht erst zu erstellen. Inhalte, die nicht von der Suchmaschine ausgeschlossen werden sollen, müssen individuell sein. Selbst wenn die Informationen dieselben sind, sollte die Aufarbeitung dieser eine gewisse Variation zeigen. Zwei besonders ähnliche Produkte oder Dienstleistungen, die trotzdem separat angeboten werden sollen, brauchen entsprechend eigene, einzigartige Inhalte. Das gilt für jede Art von Content auf einer Webseite, um Duplikationen zu vermeiden.
Besondere Fälle von doppelten Inhalten
Textabschnitte
In vielen Fällen wird nicht der komplette Webseiteninhalt gedoppelt. Stattdessen werden einzelne Abschnitte immer wieder zum Einsatz gebracht. Von Google werden solche dann als wiederkehrende Textbausteine bezeichnet. Grundsätzlich gilt es, solche Elemente möglichst zu vermeiden. Solche sich wiederholenden Informationen können alternativ auf einer extra Landing Page aufgearbeitet und an entsprechender Stelle schlichtweg verlinkt werden. So spart man sich als Webseitenbetreiber zahllose Wiederholungen. Besonders wenn ein Textabschnitt die 300-Wort-Marke überschreitet, also recht umfangreich ist, reagiert Google sehr streng. Die Investition in einzigartige Inhalte lohnt sich deshalb immer.
Duplicate Content auf anderen Webseiten
Auch externe Dopplungen sind ein Sonderfall. Kommen bestimmte Inhalte auf verschiedenen Webseiten vor, muss Google interpretierten, bei welcher URL es sich nun um das Original handelt. Verlinkungen können hier ein Indiz sein, aber grundsätzlich gilt, dass von Google zuerst entdeckter Content mit Vorzug betrachtet wird. Oft ist das beispielsweise für Pressemitteilungen relevant. Sollen diese auch über die eigene Webseite gestreut werden, sollten sie hier auch entsprechend früher online gehen, damit die Seite als Original anerkannt wird. Das Original leidet nicht besonders darunter, wenn es externe Inhalte gibt, die kopiert wurden. Verwendet man aber auf der eigenen Webseite Fremdinhalte, ist es unwahrscheinlich, mit diesen Seiten bei Google gefunden zu werden. Produktbeschreibungen für den Onlineshop vom Hersteller zu übernehmen, ist daher immer ein Risiko. Besser: Selbst schreiben.
Verschiedene Top-Level-Domains
Wer nicht nur deutschlandweit, sondern im gesamten deutschsprachigen Raum agiert, der verfügt wahrscheinlich für Deutschland, Österreich und die Schweiz eine jeweils eigene Seite mit eigener Top-Level-Domain (.de, .at, .ch). Das wird zum Beispiel immer dann gern gemacht, wenn die Preise je nach Land variieren und andere Versanddetails gelten. Gleiche Inhalte und Informationen werden trotzdem gern übernommen und sorgen schnell für eine Menge Duplicate Content. Um hier Absprachungen zu vermeiden, kann mit „hreflang“ gearbeitet werden, was Google darüber informiert, für welches Land die jeweilige Seite gedacht ist. Gern beraten wir Sie dazu ausführlich oder ergänzen diesen Code bei Ihrer Webseite.
Das Risiko von Duplicate Content
Duplikationen von Inhalten sind besonders deshalb ein so relevantes Risiko im Netz, weil sie ohne einen Blick dafür kaum aufspürbar sind. Stattdessen merken Webseitenbetreiber nur die jeweiligen Resultate: Die Seite performt nicht wie erwartet und trotz viel Arbeit, die im Zuge der SEO-Optimierung geleistet wird, stellen sich kaum Verbesserungen ein. Zu leiden haben gerade große und unübersichtliche Seiten. Onlineshops mit einer großen Produktvielfalt verfügen schnell über tausende URLs. Ein sinnvoller Seitenaufbau ist da schwierig genug und oft fällt es gar nicht auf, wenn sich doppelte Inhalte einschleichen. Wer als Seitenbetreiber da nicht vom Fach ist, kann schnell in Schwierigkeiten kommen. Wird allerdings aufmerksam gearbeitet und alle Inhalte werden selbst geschrieben, lässt sich Duplicate Content von vornherein vermeiden und die Seitenstruktur behält ihre Ordnung. Duplikationen, die sich nicht vermeiden lassen, können mit unseren Tipps allerdings davor bewahrt werden, Probleme herbeizuführen.
Wir hoffen, dass wir Ihnen mit diesen Informationen zu mehr Einblick in die Welt der Suchmaschinenoptimierung und Content-Produktion geben konnten. SEO ist kein Sprint, sondern ein Langstreckenlauf, der dann Resultate zeigt, wenn man Ball bleibt. Gern unterstützen wir Sie und Ihre Webseite auf Ihrem Erfolgsweg im Netz. Stellen Sie dafür einfach eine Anfrage und wir erstellen Ihnen ein individuelles Angebot für unsere SEO-Zusammenarbeit.