Doppelter Inhalt – Duplicate Content vermeiden

Wer einmal seine Webseite durch www.seitwert.de bewerten ließ, hat vielleicht gesehen, dass bei einigen Seiten unter der Rubrik „Technik“ der Satz „es liegt doppelter Content“ vor steht. Duplicate Content meint, dass ein und die gleichen Inhalte unter verschiedenen Urls vorhanden bzw. zu erreichen sind.

Duplicate Content auf Webseiten vermeiden

Einmal abgesehen von richtigem Content-Klau phantasieloser Kleingeister, liegt ein Grund für doppelten Inhalt darin, dass die Inhalte einer Webseite sowohl mit „www“ als auch ohne zu erreichen sind. Derzeit ist es noch so, dass Seiten die aufgrund der Urlschreibweise duplicate content aufweisen trotzdem ranken — man kann sich aber nicht sicher sein, ob das auch zukünftig so bleiben wird, da es ja nicht in Googles Interesse liegt die vordersten Sonnenplätze mit Seiten gleichen Inhalts zu belegen. Je mehr das Phänomen um sich greift, desto größer die Wahrscheinlichkeit, dass Seiten, die aufgrund der urlschreibweise doppelten Inhalt aufweisen, aus dem Google-Index rausfliegen oder zumindest nicht mehr ranken.

Man macht daher sicher nichts falsch, wenn man das Problem mittels mod_rewrite behebt. Mod_rewrite ist ein Modul, was auf einem Apache-Webserver (nicht: Windows-Webserver) vorhanden ist und mit welchem man die URLs umschreiben kann. Vorher sollte man sich natürlich überlegen für welche Form man sich entscheidet: mit oder ohne www?

Wem das mit dem Webserver und dem mod_rewrite jetzt so gar nichts sagt, sollte einfach bei seinem Webhoster gezielt nachfragen, auf was für einem Webserver gehostet wird und ob mod_rewrite benutzt werden kann.

Um eine Url umzuschreiben muss man eine leere Datei z.B. mit einem Texteditor erzeugen und diese als .htaccess abspeichern. An den Anfang dieser Datei fügt man dann eine ziemlich kryptische Zeichenfolge ein und lädt die Datei auf den Webserver hoch.

Was genau man in die .htaccess Datei einfügen muss und noch viele andere wissenswerte Dinge über mod_rewrite kann man sehr schön im Webdesign-Blog von Christian Strang nachlesen.

WordPress und Duplicate Content

Viele Content-Management-Systeme, wie auch WordPress, erzeugen aber auch auf anderem Weg doppelten Inhalt. Zusätzlicher Grund hierfür ist zum einen die Möglichkeit einen Beitrag in mehrere Kategorien einordnen zu können und die Tagging Funktion. Wenn man in einem Weblog wie WordPress auf das Schreiben von schöneren Urls umgestellt hat, wird man jedoch mit der .htacces nichts ausrichten können. Das System hat in die Datei schon etwas hineingeschrieben, was dann zu Konflikten führt. Jedenfalls war das bei meinen frischen-zitronen so. Es ist bei WordPress aber auch nicht notwendig selber eine .htaccess zu schreiben.

Wie, was und warum es in Content-Management-Systemen zu duplicate Content kommen kann – hierzu empfiehlt sich auf texto.de zu lesen.

Ich habe in meinem Blog keine komplizierten Sachen gemacht, sondern schlicht und ergreifend seit ein paar Tagen das wp-seo Plugin installiert, welches dafür sorgt, dass doppelter Inhalt vermieden wird.