Ich habe eine Seite auf einer Website und habe keinen Zugriff auf etwas anderes als meine Seite. Die Website wird verwendet, um verschiedene kleine Produkte zu verkaufen. Nachdem ich über ein Jahr mit ihnen zusammen war und Google Adwords verwendet habe, um mich selbst zu promoten, bemerkte ich, dass keine der Produktseiten auf Google indexiert wurde. Als ich bemerkte, dass die robots.txt für die Seite nicht viel enthielt, und fragte mich, ob das etwas damit zu tun hat.Unvollständige robots.txt, was passiert?
Produkt URLs folgen diesem Format:
www.example.com/myshopname/[product ID]?q=I[product ID]
Und die robots.txt ist einfach:
Disallow: /*_escaped_fragment_
Es gibt keinen User-Agent. Ich frage mich, ob dies Auswirkungen auf das Crawlen meiner Seite durch Google hätte oder ob es die robots.txt ignorieren würde, da kein User-Agent angegeben wurde.
Hier finden Sie weitere Informationen: https://moz.com/learn/seo/robotstxt – Franco
@Franco Ich habe Dokumentation über Roboter gelesen, nichts über unvollständige robot.txt-Dateien. Von dem, was ich weiß ist, dass Sie zuerst einen Benutzer-Agent eingeben müssen, dann die Regel verbieten. Ich bin mir nicht sicher, was passiert, wenn kein User-Agent angegeben wird ... verhalten sich Roboter so, als wäre User-Agent *, oder ignoriert sie einfach die Disallow-Regel, da kein User-Agent angegeben wird. Wenn es als User-Agent * handeln würde, wie würde dann die Regel angewendet? Da das AJAX-Crawling jetzt veraltet ist, ignoriert es diese Regel? – Alex