Duplicate Content? Was ist das denn?

Christoph Jakob im Portrait
Von Christoph

Die neue Webseite ist online und erzielt trotz durchgefĂŒhrter Suchmaschinenoptimierung ein niedriges Ranking bei Google. Was kann die Ursache dafĂŒr sein? Zum Beispiel Duplicate Content!
Doch was ist Duplicate Content ĂŒberhaupt, woran erkenne ich diesen und was kann man dagegen tun?

Was ist Duplicate Content und wie entsteht dieser?

Die Rede ist von doppeltem Inhalt, sofern sich grĂ¶ĂŸere, identische Textbausteine auf der gleichen oder unterschiedlichen Webseite wiederfinden. Folglich kann dieser sowohl intern als auch extern auftauchen.

Interner Duplicate Content

Interner Duplicate Content ist immer auf Ihre eigene Domain zurĂŒckzufĂŒhren, bezieht sich also ausschließlich auf Inhalte Ihrer eigenen Website.
Interner Duplicate Content kann entstehen, wenn derselbe Inhalt unter mehreren URLs auf der eigenen Seite verfĂŒgbar ist – beispielsweise aufgrund von Filterparametern in der URL oder die mehrfache Erreichbarkeit einer bestimmten URL. Besonders anfĂ€llig fĂŒr diese Art von Duplicate Content sind meist E-Commerce-PrĂ€senzen mit Shopsystemen. Auch mehrere Sprachversionen einer Website können beispielsweise zu Problemen mit Duplicate Content fĂŒhren, wenn diese nicht mit der entsprechenden “hreflang-Kennzeichnung” versehen sind.

Externer Duplicate Content

Externer Duplicate Content ist domainĂŒbergreifend, d.h. er tritt zwischen mindestens zwei verschiedenen oder mehreren Domains auf. Ein externer doppelter Inhalt liegt also immer dann vor, wenn ein Inhaltsblock (meist grĂ¶ĂŸere Textbausteine) in derselben Sprache von mindestens einer anderen Domain mehrfach verwendet wird. Externer Duplicate Content kann beispielsweise durch Web-Projekte, auf welchen identische, oder zumindest sehr Ă€hnliche Inhalte veröffentlicht werden, entstehen. Content Diebstahl und Content Scraping spielen hierbei meist ebenfalls eine große Rolle. Vor allem bei Web-PrĂ€senzen mit vielen Produktdetailseiten und geringer Inhalts-Dichte (meist E-Commerce bzw. Online-Shops) kommt es durch das Duplizieren von Artikelbeschreibungen schon zu Problemen mit duplizierten externen Inhalten.

Wie geht Google nun damit um?

Google möchte dem User die bestmöglichen Suchergebnisse auf seine Suche hin ausliefern. Findet Google bei der Ausgabe dieser mehrere identische Suchergebnisse mit dem gleichen Content, so ist dies fĂŒr die einzelnen Seiten mehr als negativ. Ein gegenseitiges Ranking steht nun an und die Gefahr, dass die „gute“ Seite abfĂ€llt, ist hier hoch. Es entstehen Indexierungsprobleme. Google kann an dieser Stelle nicht klar entscheiden, welche Seite die Benötigte ist, die auch den originalen Textinhalt beinhaltet.

Tritt der Ernstfall auf und Google stuft eine der Seiten mit Duplicate Content als TÀuschung ein, so kann diese Seite womöglich aus den Suchergebnissen entfernt werden.

„Gelegentlich werden jedoch bewusst Dubletten in verschiedenen Domains platziert, um so das Suchmaschinen-Ranking zu beeinflussen oder mehr Zugriffe zu generieren. Solche betrĂŒgerischen Methoden können die Nutzerfreundlichkeit beeintrĂ€chtigen, z. B. weil Besuchern in den Suchergebnissen mehrere Male die gleichen Inhalte angezeigt werden.“
(Auszug aus den Google Vorgaben, Stand September 2022)

Ist eine weitere Verwendung des Contents, zum Beispiel aufgrund von Kooperationen, bewusst veröffentlicht, so sollte der Webseitenbetreiber mittels eines Canonical-Tags (Angabe der Quelle im Code) auf die Originalseite hinweisen. So wird Google klar vorgegeben, welche der Webseiten in den Suchergebnissen die bevorzugte URL ist und primÀr dargestellt werden soll.

Wie kann ich Duplicate Content auffinden?

Die wohl einfachste Art ist die Eingabe von lĂ€ngeren Texten in die Suchmaske bei Google. Hierzu genĂŒgt ein Textabschnitt aus der Webseite, der mit AnfĂŒhrungszeichen umrandet ist. Wird mehr als ein Treffer ausgegeben, so liegt ein Indiz vor: Es gibt wahrscheinlich Duplicate Content!

Google ergÀnzt das Ergebnis mit einer Meldung:

„Damit Sie nur die relevantesten Ergebnisse erhalten, wurden einige EintrĂ€ge ausgelassen, die den 2 angezeigten Treffern sehr Ă€hnlich sind. Sie können bei Bedarf die Suche unter Einbeziehung der ĂŒbersprungenen Ergebnisse wiederholen.“

FĂŒhrt man die Suche nun erneut aus, so können genaue PrĂŒfungen stattfinden, ob sich der Content innerhalb der eigenen Webseite befindet oder unter einer anderen Domain liegt.
UnzĂ€hlige, meist kostenfreie Tools (Duplicate-Content-Checker) im Web dienen ergĂ€nzend zum PrĂŒfen; leider beziehen diese auch kleine Texte, wie Button oder Kontaktlinks mit ein, welche im Grunde unkritisch sind.

Als nĂŒtzliches und zudem kostenfreies Tool bietet sich Siteliner an. Das Tool prĂŒft die gesamte Webseite auf doppelte Inhalte und liefert eine kleinteilige Auflistung zu den einzelnen Schwachstellen. Nach Abschluss der Analyse steht ein Diagramm als Übersicht zur VerfĂŒgung. Dieses zeigt den Anteil an Duplicate Content, Common Content und Unique Content der geprĂŒften Domain.

FĂŒr eine genaue PrĂŒfung der Website-Inhalte auf Duplicate Content steht ein detaillierter Bericht mit allen gefundenen URL’s zur VerfĂŒgung, der z. B. schnellen Aufschluss ĂŒber interne Duplikate gibt. PrĂŒfen Sie bei auffallenden Werten unbedingt den scheinbaren doppelten Inhalt. Beachten Sie hierbei die Spalten “Match Words”, “Match Percentage” und “Match Pages”. Betrifft es die eigene Webseite oder wurden im schlechtesten Fall unerwĂŒnschte Kopien auf anderen Webseiten veröffentlicht?

Was Duplicate Content nicht ist

Nun wissen Sie sowohl was Duplicate Content ist, als auch wie man diesen identifizieren kann. Im Folgenden klÀren wir, was Duplicate Content nicht ist. Liegt ein Inhalt in mehreren Sprachversionen vor, so wird dies nicht als Duplicate Content gewertet, sofern dieser Inhalt richtig ausgezeichnet ist. Auch Zitate oder zitierte Textpassagen werden mithilfe einer korrekten semantischen Auszeichnung nicht als Duplicate Content identifiziert.

Beispiel eines Zitats mit korrekter Quelltext-Auszeichnung:
<blockquote>Hier steht der zu zitierende Text - <cite>Hier steht der Name des zitierten Autors oder der Quelle</cite></blockquote>

Schlusswort

Die Problematik durch den Duplicate Content betrifft eine Vielzahl an Webseiten. Jeder Webseitenbetreiber sollte sich dem Problem der negativen Ranking-Platzierung bewusst sein und entsprechende Gegenmaßnahmen einleiten.
Zusammengefasst lÀsst sich allerdings sagen, dass Duplicate Content nicht von Grund auf schlecht ist. Kleine Textbausteine wie Button oder Teaser sind sicherlich nicht bedenklich, da in der Praxis auch schwer zu umgehen.
Fakt ist allerdings, dass Google seinen Such-Algorithmus regelmĂ€ĂŸig Ă€ndert und das Breitstellen von einzigartigem Content mehr und mehr von Relevanz ist.
Werden die Ursachen erkannt und bestmöglich behoben, so kann dies dem Ranking der Seite nur förderlich sein.

Quellen:
google.com
siteliner.com

Neue BeitrÀge