
Sie sind hier: Startseite » SEO-Tutorials » Doppelter Content
Doppelter Content auf ein- und derselben Website durch verschieden formatierte Ausgaben wird von Google heute in den meissten Fällen erkannt. Die Suchmaschine kann zwischen den verschiedenen Versionen (Druck- und Textausgaben, Layoutausgabe, PDF-Ausgabe, etc.) unterscheiden. Auch ein- und derselbe Text in verschiedenen Sprachen auf Domains mit unterschiedlicher TLD wird toleriert.
Damit die Seiteninhalte sicher identifiziert werden können möchte Google jedoch nach wie vor nur EINE Ausgabe der Seiteninhalte präsentiert bekommen. Dieses Ziel ist auf zwei Wegen erreichbar.
Mithilfe der robots.txt wird Suchmaschinen das durchsuchen und einlesen von Webseiten und Verzeichnissen verboten. Eine typische robots.txt enthält folgende Syntax:
Mithilfe der .htaccess - sofern auf dem Server erlaubt - können Domains zusammengefasst werden. Noch vor wenigen Jahren war es normal, möglichst viele Domainnamen auf ein Verzeichnis zu konnektieren so dass eine Website unter diversen URLs aufgerufen werden konnte. Das sollte man heute vermeiden und legt daher alle vorhandenen URLs auf eine bestimmte URL. Auch die Ausgabe mit- und ohne www. wird verhindert indem wir uns für eine Version entscheiden. Der Eintrag in die .htaccess sieht dann syntaktisch folgendermassen aus:
Dieses Beispiel stammt aus meiner Arbeitspraxis und man sieht dass in den ersten zwei Zeilen der Linkumschreibung die Ziel-URL angegeben wird - hier fett dargestellt: http://rutenmuehle.com. Die URL http://www.rutenmuehle.com wird als Erste auf den Domainnamen ohne www. geleitet und danach alle weiteren, existierenden Domainnamen mit- und ohne www-Link jeweils auf die Ziel-URL. Diese Weiterleitung wird mit einer sogenannten 301-Weiterleitung erreicht die den Suchmaschinen mitteilt, dass es sich um eine permanente Weiterleitung handelt.