Was ist Duplicate Content?

Duplicate Content heißt doppelter Inhalt und genau das ist es. Wenn ein Text auf einer deiner Webseite, noch auf mindestens einer anderen Webseite im Internet zu finden ist, dann handelt es sich um Duplicate Content.

Dabei ist egal, ob der Content auf deiner Seite ein zweites Mal auftaucht, oder auf einer anderen Domain. Der Content existiert mehr als ein mal, so ist es Duplicate Content.

Ist es zu 100 % der gleiche Inhalt, so ist es auch wirklich doppelter Inhalt. Sind nur Teile (z.B. 60 %) identisch, so spricht man von „Near Duplicates„.

Wie entsteht Duplicate Content

Du magst denken, jemand kopiert dich oder du kopierst, das ist doppelter Inhalt. Ja auch, aber das ist nicht der häufigste Grund.

Viel häufiger ist interner Duplicate Content, zum Beispiel bei Shops oder in Blogs.

Nimm an dein Shop verkauft Fahrräder, das gleiche Fahrrad in Grün, Gelb, Blau und Rot. Einmal mit 24 und einmal mit 28 Gängen. Da entsteht schnell doppelter Inhalt, in dem Fall der gleiche Inhalt (mit Farb- und Gang-Variation) also achtmal.

Ein Blog könnte versehentlich eine Seite unter verschiedenen URLs aufrufbar machen. Schon aufgrund fehlender Einstellungen kann eine Seite einmal mit und einmal ohne Slash am Ende aufrufbar sein (trailing slash).

Auch könnte deine Webseite mit https und http aufgerufen werden, oder mit www und ohne www. An sich kein Problem, denn für jede Art des Duplicate Content gibt es eine Lösung.

Das Canonical-Tag ist die eine Lösung, es sagt: Ich bin doppelter Inhalt, das Original ist unter einer anderen URL zu finden. Das wäre zum Beispiel die Lösung für deinen Shop.

Eine Weiterleitung (redirect) ist eine weitere Lösung. Zum Beispiel beim trailing Slash oder der non-www zu www Problematik. Der redirect stellt sicher, das nur ein Weg erreichbar ist. Der andere wird zum Original weitergeleitet.

Auch Internationalisierung kann ein Problem sein, falsche Verwendung von hreflang kann bedeuten, dass der Inhalt für Deutschland und Östereich Duplicate Content ist.

Hingegen sind Quotes, Blockquotes oder cites – also Zitate von anderen auf deiner Seite kein Problem. Es wäre auch maximal nearby-Duplicate und das ist nicht schon bei 0,9 % ein Problem.

Suchanfragen nach „Henry Ford Zitate“ könnte Google sonst ja auch nicht akkurat beantworten.

Warum Duplicate Content ein SEO Problem ist

Immer wenn jemand nach Suchbegriffen aus deinem Content sucht, kennt der Googlebot mehr als eine Antwort von dir. Welche soll er zeigen?

googlebot-confused
Googlebot ist verwirrt (Quelle: Moz.com – Ho To solve Keyword Cannibalization)

Du verlierst die Chance darauf gefunden zu werden. Diese Verwirrung des Googlebots hat einen Namen: Keyword Kannibalisierung.

Bei kopierten Seiten ist es einfacher. Denn hier rankt das für Google vertrauensvollste Original, dass nicht immer das echte Original sein muss. Stell dir vor, das Google selbst ein Canonical setzt, dahin wo der Bot glaubt, das dort das Original zu finden ist.

Was du eigentlich möchtest

Was du möchtest, ist Unique Content, also einzigartiger Inhalt. Das ist die Grundvoraussetzung, um bei Google gefunden zu werden. Jedoch heißt das nicht, dass Unique Content auch gut gefunden wird. Es gibt mehr als 10 gute und einzigartige Seiten zu einem Suchbegriff. Daher zählt eben auch Unique Value, also ein einzigartiger Mehrwert. Dein Unique Selling Point (USP), wenn du so willst.