Ich möchte nicht, dass die Suchmaschinen meine Imprint-Seite indexieren. Wie könnte ich das tun?Wie kann man verhindern, dass Suchmaschinen eine einzelne Seite meiner Website indizieren?
Antwort
Sie benötigen eine einfache robots.txt
Datei. Im Grunde ist es eine Textdatei, die Suchmaschinen anweist, bestimmte Seiten nicht zu indizieren.
Sie müssen es nicht in die Kopfzeile Ihrer Seite aufnehmen; Solange es sich im Root-Verzeichnis Ihrer Website befindet, wird es von Crawlern abgeholt.
Erstellen es in dem Stammordner Ihrer Website und setzen Sie den folgenden Text in:
User-Agent: *
Disallow: /imprint-page.htm
Beachten Sie, dass imprint-page.html
im Beispiel mit dem tatsächlichen Namen der Seite (oder das Verzeichnis) ersetzen würde, die Sie wünschen um nicht indexiert zu werden.
Das war's! Wenn Sie weiter fortgeschritten sein möchten, können Sie für weitere Informationen here, here oder here auschecken. Außerdem können Sie kostenlose Tools online finden, die eine robots.txt
Datei für Sie generieren (zum Beispiel here).
Hier ist ein gutes Tutorial: http://www.javascriptkit.com/howto/robots.shtml –
Danke Sam! Deinen Link neben dem anderen Tutorial hinzugefügt. – Donut
Vielen Dank! Muss ich robots.txt irgendwo in den Header aufnehmen? Oder ist es genug, um es einfach in die Wurzel der Website fallen zu lassen? –
Sie können Setup eine robots.txt-Datei, um zu versuchen und Suchmaschinen zu sagen, bestimmte Verzeichnisse zu ignorieren.
Grundsätzlich gilt:
User-agent: *
Disallow: /[directory or file here]
Sie können auch
folgende Meta-Tag in HEAD dieser Seite hinzufügen<meta name="robots" content="noindex,nofollow" />
gute Idee. Hab das zusätzlich gemacht. –
Dies ist eine bessere Lösung als die Verwendung von robots.txt. Der Grund dafür ist, wenn Sie eine Seite mit robots.txt auslesen, werden Suchmaschinen die Seite nicht einmal besuchen. Wenn Links auf die Seite verweisen, werden sie nicht aus dem Index entfernt, weil Sie es ihnen nicht gesagt haben. Google zeigt die Seite ohne Beschreibung an, weil sie die Seite kennen, aber nicht wissen, was auf der Seite steht. Die einzige Möglichkeit, sie explizit aus dem Index zu entfernen, besteht darin, den Engines mit dem Befehl 'noindex' mitzuteilen, dass sie überhaupt nicht angezeigt werden sollen. – eywu
Dies ist ein kleines Problem (zu viel mehr Zeit für die Codierung), wenn der Kopf dynamisch als serverseitige Sprache wie PHP enthalten ist, die für alle Seiten gleich ist. –
eine robots.txt-Datei erstellen und die Kontrollen dort eingestellt.
Hier sind die Dokumente für Google: http://code.google.com/web/controlcrawlindex/docs/robots_txt.html
Heute ist die beste Methode, einen robots meta tag und setzen Sie ihn auf noindex,follow
zu verwenden:
<meta name="robots" content="noindex, follow">
<meta name="robots" content="noindex, nofollow">
Gerade sind diese Zeile in Ihrer <html>
tag. Warum erzähle ich Ihnen das, wenn Sie die robots.txt-Datei verwenden, um Ihre URLs zu verbergen, die Anmeldeseiten oder andere geschützte URLs sein könnten, die Sie nicht anderen Personen oder Suchmaschinen zeigen.
Was ich tun kann, ist nur Zugriff auf die robots.txt-Datei direkt von Ihrer Website und kann sehen, welche URLs Sie haben, sind geheim. Was ist dann die Logik hinter dieser robots.txt-Datei?
Der gute Weg ist, das Meta-Tag von oben zu integrieren und sich vor niemandem zu schützen.
Ein Roboter möchte eine Website-URL aufrufen, sagen http://www.example.com/welcome.html. Bevor es so tut, denden es Kontrollen für http://www.example.com/robots.txt und findet: Sie explizit nicht zulassen können: // CSS-Tricks:
User-agent: *
Disallow: /~joe/junk.html
bitte robots.txt
- 1. Wie verhindern Sie, dass Suchmaschinen Textanzeigen indexieren?
- 2. Wie kann man verhindern, dass eine Seite allmählich angezeigt wird?
- 3. Kann ich verhindern, dass Browsererweiterungen das CSS meiner Website überschreiben?
- 4. Wie erkenne ich Suchmaschinen auf meiner Website? wie phpBB
- 5. Wie kann ich einzelne Besucher auf meiner Website zählen?
- 6. Wie kann man Suchmaschinen sagen, dass 2 Domain-Namen die gleiche Website sind?
- 7. Kann man die Microsoft-Fehlerberichterstattung für eine einzelne App verhindern?
- 8. Wie kann man verhindern, dass Karma eine Datei entfernt?
- 9. Wie kann man verhindern, dass eine Spool-Datei gelöscht wird?
- 10. Wie kann man verhindern, dass Delphi eine RSM-Datei erzeugt?
- 11. , wie man verhindern, dass zip
- 12. Wie kann man verhindern, dass Browser mehrere Leerzeichen durch einzelne Leerzeichen ersetzt?
- 13. wie man die Website von Suchmaschinen komplett ausblenden?
- 14. Verhindern von Werbenetzwerk-Popups auf meiner Website
- 15. Methoden zum Verhindern, dass Suchmaschinen irrelevante Inhalte auf einer Seite indexieren
- 16. Wie halte ich Suchmaschinen an, die eine Wartungsseite indexieren
- 17. Können Sie verhindern, dass eine Website im Browserverlauf gespeichert wird?
- 18. Wie kann ich meine BlogSpot-Seite in eine Seite meiner Website einbinden?
- 19. Warum Suchmaschinen regelmäßig neu indizieren müssen, aber Datenbanken nicht?
- 20. "suexec Richtlinienverstoß" verhindern, dass meine Website läuft?
- 21. Indexieren Suchmaschinen JSON-Ergebnisse?
- 22. Wie hostet man eine Versionskontrolle auf meiner eigenen Website
- 23. Kann ich verhindern, dass Bilder von meiner Site gespeichert werden?
- 24. Wie kann ich verhindern, dass Spring MVC eine Umleitung ausführt?
- 25. Wie kann ich verhindern, dass der Inhalt meiner Spalte in eine neue Spalte eingefügt wird?
- 26. Verhindern, dass Seite bei Fokuswechsel scrollt
- 27. Swift - Wie kann man verhindern, dass die Steckdose geschlossen wird?
- 28. Wie kann ich verhindern, dass eine Seite nach fehlgeschlagener Überprüfung zur obersten Position springt?
- 29. Wie kann man verhindern, dass die Apple Watch einschläft?
- 30. MQTT-Sicherheit - Wie kann man verhindern, dass Missbraucher Themen abonnieren?
https für Details untenstehenden Link besuchen.com/snippets/html/meta-tag-zu-verhindern-search-engine-bots/ – zloctb