Das schöne an den großen Lizenzen bei Weblication ist die Verwaltung mehrerer Projekte in einem CMS.
Die Ausgangssituation und das Problem
Man hat ein Web oder Webspace mit mehreren Internetauftritten, als CMS wird Weblication Enterprise oder Weblication Grid verwendet. Die Projekte sind jeweils in Unterordnern angelegt und jedes Projekt hat seine eigene Domain:
/projekt1_de/ - www.projekt1.de
/projekt1_en/ - www.projekt1.com
/projekt2_de/ - www.projekt2.de
/projekt2_es/ - www.projekt2.es
Die Ordner haben jeweils den Länderkürzel-Suffix, da somit das Modul Sprachworkflow in Weblication funktioniert. Ein direktes Einrichten der Domains ist auf die Unterordner nicht möglich, da sonst der Workflow nicht mehr funktioniert.
Eine Lösung dafür ist: Die Domains zeigen jeweils auf den Root Folder und werden von dort mithilfe eine php-Scripts auf die jeweilegn Unterorder weitergeleitet.
Soweit so gut, doch was passiert wenn eine Suchmaschine plötzlich projekt1_en unter der Domain projekt2_de findet, weil die Domain www.projekt2.de stärker ist als www.projekt1.com. Ein Duplicate Content Prolem ist vorhanden.
Die Lösung
Ich habe dafür folgende Lösung gefunden. Man muss den robots mitteilen, dass jedes Projekt jeweils nur unter der jeweiligen Domain gefunden werden darf. Dafür ist es notwendig die Domain zuvor abzufragen um schließlich dem robot das Verzeichnis zu erlauben, welches crawlbar sein soll oder aber dieses zu verbieten.
In der .htaccess lege ich dazu folgende Zeile an:
<pre lang=”html4strict”>AddType application/x-httpd-php php php4 php3 php5 txt</pre>
Anschließend ist die robots.txt ebenfalls in der Lage PHP-Code auszuführen. In dieser kann ich somit eine Abfrage nach Domain erstellen die so aussehen könnte:
<pre lang=”php”>
<?php
if($_SERVER['SERVER_NAME'] == “projekt2.de”) {
echo “Disallow: /projekt1_en/”;
}
?>
</pre>
Die Disallow Zeile wird somit nur geschrieben wenn die Domain projekt2.de vom robot aufgerufen wurde.
Diese Abfrage müsste man somit auch für die anderen Projekte wiederholen, solang diese jedoch unter ihren eigenen Domain gefunden werden, besteht dafür kein Anlass.

Schreibe einen Kommentar zu robots.txt mithilfe von php dynamisch machen