Ich denke, eine meiner Websites wurde vor kurzem von Google deklassiert, weil es gefunden und begann meine dev-Website zu indizieren. Es ist im Grunde eine Replik meiner Hauptseite. (dev.site.com & site.com)blockieren Suchmaschinen von der Indexierung Dev-Sites
Wie auch immer, gibt es eine Möglichkeit, eine robot.txt zu erstellen, die verhindern würde, dass Datenverkehr auf dev.site.com indiziert wird, so dass site.com immer noch voll ist indexiert.
Ich weiß, ich könnte nur separate Roboter-Dateien für jeden haben, aber es wäre nur einfacher, einen zu haben, der beide abdeckt. Vor allem, weil ich mit einer ganzen Reihe von Websites arbeite, die Dev-Sites haben, und möchte einfach einen einfachen Workflow haben und die Roboterdateien nicht ändern müssen, wenn ich neue Versionen der Site zum Leben dränge.
könnte dies funktionieren. Ich mache meine db-Parameter tatsächlich so. Wie würde ich eine robot.txt-Datei echo'n? Ich bin ein wenig verwirrt darüber, was du damit meinst. – Roeland
Ich meine, verwenden Sie einfach echo-Anweisungen, um die gewünschten Zeilen auszugeben - zB Echo "Disallow: /" und so weiter ... –
Alternativ könnten Sie auch includes verwenden: if () {include "dev-robots.txt" ; } else {include "live-robots.txt"; } –