Duplicate Content

Duplicate Content

Duplicate Content sind doppelte Inhalte auf Websites. Insbesondere für die Suchmaschinenoptimierung (SEO)  ist ein Text, der wortgleich oder ähnlich auf mehreren URLs erscheint, sehr gefährlich. Google bewertet Seiten mit Duplicate Content grundsätzlich negativ.

Google Robots erkennen doppelte Inhalte schnell

Duplicate Content sollte man vor allem deshalb vermeiden, weil Google dem User einzigartige Inhalte (Unique Content)  bieten möchte. Es gilt der alte Grundsatz Content is king  – das ist eines der Erfolgsgeheimnisse von Google. Wenn die Suchergebnisse gleiche oder weitgehend ähnliche Informationen in verschiedenen Artikeln liefern, stellt dies für den User keinen Mehrwert dar. Vor allem dann, wenn sich unter einer Domain doppelte Inhalte häufen, kann sich dies negativ auf das Ranking der Website auswirken und zu einem echten SEO-Problem werden.

Die Bewertung, ob es sich bei einem Text im Internet um Duplicate Content handelt, wird von Google meist vollautomatisch getroffen. Die „Google Crawler“ analysieren die Inhalte von Websites und stoßen mithilfe von Algorithmen auf Ähnlichkeiten. Dahinter steht das Bestreben von Google, den Nutzern möglichst viele unterschiedliche Informationen zu einem Stichwort auf der Suchergebnisliste (SERP) zu zeigen.

Wo besteht Duplicate-Content-Gefahr?

Dass ein absichtliches Kopieren von Inhalten auf lange Sicht schädlich ist, leuchtet unmittelbar ein. Die Betreiber einer Website sind deshalb immer darauf bedacht, auf die korrekte Website Struktur zu achten und dem User Unique Content zu liefern. In den meisten Fällen entsteht Duplicate Content aber unabsichtlich. Mögliche Fehlerquellen sind zum Beispiel:

  • Identische Inhalte, die in verschiedenen Formaten vorliegen (zum Beispiel als PDF und HTML-Seite)
  • Von einem Content Management System automatisch generierte Seiten
  • Seiten, die mit oder ohne den Zusatz www oder sowohl unter http:// als auch unter https:// erreichbar sind
  • Inhalte in verschiedenen Sprachen, die nicht als Übersetzungen gekennzeichnet sind
  • Umzug einer Domain, wobei die alte Domain bestehen bleibt

Eine effiziente und schnelle Möglichkeit, um doppelte Inhalte im Netz herauszufinden, ist eine Google-Anfrage mit Textbausteinen. Hierbei ist es wichtig, längere Textpassagen im Suchfeld in Anführungszeichen zu setzen.

Was tun gegen Duplicate Content?

Duplicate Content ist riskant. Es birgt insbesondere das Risiko, von Suchmaschinen auf hintere Positionen verwiesen zu werden, weil der Inhalt keinen echten Mehrwert liefert. Es gibt aber verschiedene Möglichkeiten, dieser Gefahr zu begegnen, vor allem mit „Meta-Daten“

1. Doppelte Inhalte verhindern oder minimieren

Um zu verhindern, dass auf der eigenen Seite versehentlich externer oder interner Duplicate Content erscheint, gibt es im Web viele Tools, die doppelten Inhalten schnell und einfach auf die Spur kommen. Dazu gehören zum Beispiel Plagiats-Checker für eine Analyse von Duplicate Content, aber auch hochwertige SEO-Tools mit verschiedenen Funktionen für die Suchmaschinenoptimierung.

2. Google auf Duplicate Content hinweisen

Liefert eine URL denselben Inhalt wie eine andere URL unter derselben Domain (interner Duplicate Content), kann man Google im Quelltext einer Seite darauf hinweisen. Hierfür bietet sich der Canonical-Tag an. Dieses Tag weist die Suchmaschinen an, eine bestimmte URL als Hauptseite, die anderen nur als Variationen zu bewerten. Mit dem Attribut lang im „-Tag“ liefert die URL weitere Informationen an die Robots. Das ist sehr nützlich, wenn gleiche Inhalte in verschiedenen Sprachen erscheinen.

3. Einen Link ausschließen

Ähnliche URLs unter der gleichen „Domain“ lassen sich häufig (zum Beispiel bei Onlineshops) nicht vermeiden. Für den HTML-Code bietet sich dann die Option an, Google und Co. bereits im Head-Bereich mit dem Tag no-index anzuweisen, die Seite nicht ins Verzeichnis aufzunehmen. Gleiches kann mit Hinweisen in der Datei „robots.txt“ passieren. Für interne und externe Links auf Seiten mit Duplicate Content ist die Markierung no-follow wichtig.

4. 301-Weiterleitungen nutzen

Oft werden alte Inhalte durch neue ersetzt. Wenn dies nicht auf der Seite selbst geschieht, sondern die neuen Inhalte unter einer neuen URL veröffentlicht werden, bietet sich die 301-Weiterleitung an. So geht wertvoller Traffic auf die alte Adresse nicht verloren.

Zitate sind natürlich erlaubt. Sie müssen jedoch als solche gekennzeichnet werden, um Duplicate Content zu vermeiden. Hierfür bieten sich die Tags „cite“ und „q“ im HTML-Quellcode an.

Duplicate Content und Plagiate

Weil das Internet immer mehr Content zu verschiedenen Themen liefert, ist die Gefahr von Plagiaten groß. Wer fremde Inhalte übernimmt und als eigene geistige Schöpfungen veröffentlicht, verletzt das Urheberrecht. Gerade im Marketing ist es riskant, aufgrund von Urheberrechtsverletzungen empfindliche Geldbußen bezahlen zu müssen. Oft werden in Onlineshops oder auf kommerziell orientierten Websites Hersteller-Angaben unverändert übernommen. Duplicate Content ist deshalb nicht nur ein SEO-Risiko, sondern auch eine rechtliche Gefahr.

Fazit

Duplicate Content ist Gift für Google und kann sich auf das Ranking ganzer Domains auswirken. Deshalb ist es wichtig, doppelte Inhalte von vornherein zu vermeiden und dem User wertvolle Informationen zu bieten, die einmalig sind. Deshalb achten wir als Webdesign Agentur Nürnberg ganz besonders auf Einzigartigkeit Ihrer Website. Manchmal lassen sich Übereinstimmungen aber nicht vermeiden – das gilt insbesondere für umfangreiche Websites mit einer Vielzahl von Angeboten. Doch auch hierfür gibt es viele Möglichkeiten, den SEO-Gefahren zu begegnen.