2016-03-23 17 views
1

Ich arbeite mit robots.txt, sitemap.xml und .htaccess in meinem Projekt und ich bekomme Zugriff auf Fehler für meine sitemap.xml URLs, wenn ich sie in den Google Webmaster-Tools einreichen.Mit htaccess richtig umleiten

robots.txt

User-Agent: * 
Disallow: 

sitemap.xml

<url> 
    <loc>http://www.example.de/</loc> 
    <changefreq>daily</changefreq> 
</url> 
<url> 
    <loc>http://www.example.de/blog/article/</loc> 
    <changefreq>daily</changefreq> 
</url> 
<url> 
    <loc>http://www.exampe.de/blog/article/example-article</loc> 
    <changefreq>daily</changefreq> 
</url> 

.htaccess

RewriteRule ^(.*)blog/article/$ $1article.php 
RewriteRule ^(.*)blog/article/example-article$ $1blog/example-article.php 

Meine Ordnerstruktur:

├───blog 
│ └─── example-article.php 
├─── sitemap.xml 
├─── robots.txt 
├─── .htaccess 
├─── article.php 
├─── ... 

Google Webmaster-Tools sagen:

http://www.example.de/blog/article/ 
http://www.example.de/blog/article/example-article 

durch robots.txt blockiert werden, was aufgrund der Tatsache nicht möglich ist, habe ich alles kriechen gelassen.

Wo ist mein Fehler?

+0

Vielleicht liegt es daran, dass Ihre robots.txt es blockiert. Deine robots.txt sieht nicht richtig aus. –

+0

Ja, seine Tatsache, dass es von der robots.txt blockiert wird. Aber wo genau sind die Fehler? Kann ich die mod_rewrited-URLs nicht in den Robotern verwenden? Weil ich möchte, dass sie so indexiert werden. – CodeVolunteer

Antwort

2

Verwendung: robots.txt

User-Agent: * 
Disallow: /only_folder_name_you_disallow/ 

Sie nicht auch Allow

verwenden können Hinweis, dass Globbing und reguläre Ausdrücke sind weder in der User-Agent oder Verbieten Linien unterstützt. Das '*' im Feld User-Agent ist ein spezieller Wert, der "beliebiger Roboter" bedeutet. Insbesondere können Sie keine Zeilen wie "User-Agent: Bot", "Disallow:/tmp/*" oder "Disallow: * .gif" haben. http://www.robotstxt.org/robotstxt.html

+0

Danke für Ihre Antwort. Ich werde es versuchen. Aus welchem ​​Grund kann ich "Allow" nicht verwenden? Ich habe das sehr oft gesehen. Oder funktioniert es einfach nicht in meinem Fall? – CodeVolunteer

+0

Ich habe die robots.txt zu Testzwecken modifiziert um nichts einzuschränken: User-Agent: * Disallow: Ich bekomme die gleichen Fehler damit das Problem nicht die robots.txt, .htaccess oder sitemap.xml sind falsch, aber ich wette auf dem .htaccess. Siehst du die Fehlerursache? – CodeVolunteer

+1

"Zulassen" ist nicht im Robots Exclusion Protocol. Auch wenn einige Roboter es benutzen. Aber einen Ordner zulassen und nach Allow, ist mir nicht einmal klar. In deinem Htaccess schreibst du Links mit 'blog ...' um, das ist nicht der Fall für 'robots.txt' und nicht das Problem. Sie haben Google mit 'robots.txt' geschrieben ... Testen Sie erneut Ihre' robots.txt' mit Google Webmaster Tools. Und deine 'sitemap.xml' ... – Croises