Duplicate-Content beherrschen
Probleme mit Double-Content: Gleiche Texte im Web vermeiden
Duplicate-Content sind Texte, Textblöcke und Textpassagen die mehrfach im Web vorkommen. Egal ob sich Texte auf einer Website, oder auf vielen wiederholen: Doppelte Inhalte führen dazu, dass Suchmaschinen ein Ausleseverfahren starten, um mehrfache Versionen eines Inhaltes auszufiltern.
Der Grund für dieses Ausfiltern ist eigentlich klar: Wenn man unter einem Suchbegriff nur Seiten finden würde, die alle aus dem gleichen Text bestehen, wären diese Suchergebnisse völlig unbrauchbar. Suchmaschinen bemühen sich also, einzigartigen und vielfältigen Content anzubieten, damit ihre User durch die Ergebnisse den für sich richtigen Inhalt finden können.
Um das zu gewährleisten, versuchen Suchmaschinen die Website zu ermitteln, die am relevantesten erscheint, und wählt diese aus in den Ergebnisse weit oben zu stehen. Die als Dubletten erkannte Seiten dagegen, verschwinden auf die hinteren Plätze. Die Auswahl erfolgt nach mehreren Kriterien: Wie alt ist die Seite, wie umfangreich, wie hoch ist der PageRank etc.
Duplicate-Content vermeiden
Schreiben Sie Ihre Texte selbst und verwenden Sie keine Kopien von anderen Seiten. Achten Sie darauf, ob andere Seiten Ihre Inhalte verwenden: Content-Klau verstößt gegen das Urheberrecht.
Duplicate-Content direkt auf Ihrer Website
Doppelte Inhalte entstehen meistens auch auf der eigenen Seite, und das ungewollt. Auch hier ist es wichtig die versehentliche Produktion zu unterbinden, da ansonsten den eigenen Seiten das selbe Schicksal ereilt - in den Ergebnissen abzurutschen.
1) http://url.de oder http://www.url.de
Viele Websites können mit oder ohne dem Zusatz von www aufgerufen werden, und werden dabei als zwei eigenständige Seiten gewertet. Verwenden Sie die Google-Webmastertools, um die von Ihnen bevorzugte Art zu bestimmen und legen Sie zusätzlich in der .htaccess-Datei eine Weiterleitung fest, um auf die richtige Version mit einem Statuscode 301 weiterzuleiten. Wie das geht, sehen Sie hier: Mit oder ohne www via .htaccess-Datei
2) Druckversion kontrollieren
Wenn Sie eine eigene Druckversion als extra Seiten angelegt haben, beachten Sie diese Seiten komplett über die robots.txt auszuschließen. Wenn Suchmaschinen einerseits Ihre Website indizieren und zusätzlich die Druckversion, kann es passieren, dass überhaupt nur die Druckversion in den Suchergebnissen auftauchen. Noch besser: Verwenden Sie Stylesheets, um eine gute Druckversion zu generieren.
3) Die Technik beherrschen
Sehen Sie sich Ihr CMS-System, Ihr Shop-System, oder Ihren Blog genauer an: Viele Systeme sind von Haus aus schlecht gegen doppelte Inhalte geschützt. So lassen sich je nach System, die selben Blogeinträge über mehrere URLs erreichen, z.B. nach Datum, Uhrzeit, aus dem Archiv, besonders beliebt. Bei Online-Shops ist oft die Kategorieübersicht das Problem: Mehrere Produkte werden untereinander angezeigt, und als Besonderheit kann der Kunde diese nach Preis, Beliebtheit, auf- oder absteigend anzeigen lassen - und alles immer über eine eigene URL.
Erschienen am 06.08.2008, um 18:10h.