Duplicate Content – Kurzerklärung

Als Duplicate Content werden Inhalte im Internet bezeichnet, die in identischer oder sehr ähnlicher Form auf verschiedenen Seiten zu finden sind. Dieses Phänomen entsteht häufig unbewusst bei der Programmierung einer Webseite oder durch das sorglose Übernehmen fremder Darstellungen und Texte. Werden Duplikate von Suchmaschinen identifiziert, kann dies zu einer Abwertung in deren Ranking führen. Ziel bei der Erstellung und Pflege einer Webseite sollte daher sein, sich wiederholende Inhalte weitestgehend zu vermeiden.

Unique Content in Form von einzigartigen Texten kann über Textagenturen wie clickworker beauftragt werden.

Externer und interner Duplicate Content

Alle großen Suchmaschinen sind bemüht, ihre Ergebnisse unverfälscht und nach höchster Relevanz für den Nutzer aufzulisten. Duplizierter Content wird daher zum Problem, weil der Suchalgorithmus erstens entscheiden muss, welche der gefundenen Seiten mit identischem Inhalt das Original darstellt, und zweitens, ob ein bewusster Manipulationsversuch vorliegt.

Typischerweise wird zwischen internem und externem Duplicate Content unterschieden. Externer duplizierter Inhalt entsteht dadurch, dass Texte, Bilder oder Graphiken auf Webseiten verschiedener Betreiber übernommen werden. Dies kann gewollt sein im Sinne von Content-Sharing-Vereinbarungen oder auf unerlaubte Weise geschehen.

Bei der internen Form bilden sich die Duplikate hingegen innerhalb einer einzigen Domain. Das hat meistens technische Gründe, weil die Webseite mangelhaft strukturiert ist oder absichtlich unter verschiedenen URLs erreichbar sein möchte.

Anmerkung zu Duplicate Content

Vermeiden Sie Duplicate Content und lassen Sie einzigartigen Content von clickworker erstellen. Informieren Sie sich über die Content Services von clickworker.

Einfluss auf das Ergebnis von Suchalgorithmen

Die Algorithmen, die bei der Internetsuche mittels Google, Bing, Yahoo! und Co. zum Einsatz kommen, werden von den Unternehmen geheim gehalten und zudem ständig weiterentwickelt. Deshalb lässt sich nicht mit Gewissheit sagen, welchen Einfluss Duplikate auf das Ranking einer Seite haben. Google bspw. erklärt dazu, dass Webseiten niedriger eingestuft oder sogar vollständig aus dem Index entfernt werden können, bei denen man vermutet, dass Duplicate Content gezielt eingesetzt wird, um das Ranking zu beeinflussen. Unter Experten herrscht größtenteils Einigkeit darüber, dass die Suchalgorithmen inzwischen intelligent genug sind, bewusste Manipulationsversuche von notwendigen Duplikaten – wie z. B. wiederholten rechtlichen Hinweisen in Onlineshops – zu unterscheiden.

Doch selbst wenn es nicht zu einer direkten Abstrafung durch Google infolge eines vermuteten Täuschungsverdachts kommt, kann sich Duplicate Content negativ auf Ranking oder Indexierung einer Webseite auswirken. Treten zahlreiche interne Wiederholungen von Content-Bausteinen auf, kann der Suchalgorithmus möglicherweise nicht erkennen, welche Unteradresse die wichtigste einer Webseite ist und wählt deshalb ggf. die schlechtere in den Index. Außerdem steht den Algorithmen beim Suchvorgang nur eine begrenzte Dauer zur Verfügung. Müssen viele Duplikate auf einer Domain durchforstet werden, bricht der sogenannte Crawling-Prozess eventuell nach einer gewissen Zeit ab, ohne wirklich wichtige Inhalte registriert zu haben.

Ursachen für Duplicate Content

Die Gründe für die Entstehung von internen Dopplungen sind meistens technischer Natur. Häufige Ursachen sind:

  • die Webseite lässt sich über mehrere Adressen aufrufen bzw. die Domain ist nicht eindeutig gewählt, wie http://www.beispiel.de, https://www.beispiel.de und http://beispiel.de,
  • verschiedene URLs führen zur gleichen Seite, wie www.beispiel.de/bsp1 und www.beispiel.de/bsp1/,
  • zusätzliche Druck- oder pdf-Versionen einer Seite,
  • Session-IDs und URL-Parameter,
  • Umprogrammieren der Seite mit neuer Struktur der Verlinkung,
  • Domain-Umzug ohne Löschung der alten Domain,
  • unterschiedliche Länderdomains mit nahezu identischem Inhalt.

Externe Duplikate hingegen entstehen, weil Inhalte bewusst im Internet vervielfältigt werden, z. B. durch Verbreitung von Meldungen, gemeinschaftlich genutzte Content-Systeme oder unautorisierten Missbrauch.

Analyse mit Hilfe von Online-Tools

Um herauszufinden, ob man mit duplizierten Inhalten konfrontiert ist, gibt es verschiedene Möglichkeiten. Die einfachste Variante ist die Suche nach bestimmten Textbausteinen über Google. Duplikate werden in der Ergebnisliste zwar größtenteils ausgeblendet, es erfolgt jedoch ein spezieller Hinweis auf der Trefferseite.

Des Weiteren kann man sich der Hilfe spezieller Online-Tools – so genannter Duplicate-Content-Checker – bedienen, die das gesamte Internet, aber insbesondere auch die eigene Webseite auf doppelten Inhalt hin analysieren und in einer detaillierten Übersicht ausweisen.

Duplicate Content beheben

Suchmaschinen beeinflussender Duplicate Content lässt sich häufig auf einfache Weise beheben oder vermeiden, wenn einige Regeln beachtet werden. Dazu zählen die Nutzung der 301-Weiterleitung aller Sub- oder Nebendomains auf die Hauptadresse einer Webseite sowie der Einsatz des Canonical Tags, eines noindex-Vermerks oder einer robots.txt-Datei. Die wichtigste Grundregel lautet jedoch, so weit es geht auf einmalige, individuelle Inhalte zu achten und die Zweitverwendung von Content so sparsam wie möglich einzusetzen.