Mit allen verfügbaren HTTP-Daten,
Auf welche "Zeichen" können Sie achten, um die Suchmaschinenroboter von Google zu erkennen?Welche HTTP-Signaturen werden von Crawling-Robots von Google Web gefunden?
Antwort
How to verify googlebot - die offizielle Methode.
Soweit ich weiß, haben die Crawler von Google den User-Agent auf "Googlebot" gesetzt.
Andere Suchmaschinenanbieter halten sich normalerweise an einen erkennbaren Namen im User-Agent; Es gibt verschiedene Listen von bekannten Agenten, wie zum Beispiel http://www.jafsoft.com/searchengines/webbots.html.
Es ist der Link ich suchte, danke! –
Das sollte User-Agent Header genug sein, um die Google-Bot eine Liste bekannter se bot
Durch die Sie sicher, dass ein echter Googlebot das ist sein wollen würde bekommen
Check out user-agents.org Webseite erfassen google, dann können Sie die IP/Host, der
c immer überprüfen [nn] .googlebot.com
Wobei [nn] eine Zahl ist.
Nun, ich bin nicht so sicher, wie wartbar es ist, DNS-Reverse-Lookups für IP-Adressen zu tun. Ich würde das nur tun, wenn Sie befürchten, dass jemand die User-Agent-Zeichenfolgen von Google verfälscht, was sehr unwahrscheinlich ist. Es kann auch selbst gespooft werden, wie der Artikel zeigt.
Sie sind am besten dran, nur ihre bekannten Benutzeragenten passend:
Regex.IsMatch(ua, @"googlebot|mediapartners-google|adsbot-google", RegexOptions.IgnoreCase);
- 1. Welche Webbrowser werden von Meteor Web Framework unterstützt?
- 2. Welche Daten werden an Google Analytics gesendet?
- 3. Welche Art von Ausnahmen werden von Microsoft.Owin.Diagnostics.ErrorPageExtensions.UserErrorPage
- 4. Welche PHP-Frameworks werden von Unternehmen verwendet?
- 5. Welche Version google index von Webmaster-Tools?
- 6. Werden Web-Mitarbeiter von ionic app profitieren?
- 7. google docs + web app
- 8. Hidden Features von Google Web Toolkit 2
- 9. Senden von E-Mails von Servlet in Google Web-Anwendung
- 10. 404 nicht gefunden bei der Verwendung von Nginx Web Server
- 11. Welche GIT-Versionen werden von GITLAB unterstützt?
- 12. Welche Dateien werden von einem Anwendungsserver bereitgestellt?
- 13. Welche Ereignisse werden von Ember.js unterstützt?
- 14. Welche Vorverarbeitungsoperationen werden von Tesseract OCR ausgeführt?
- 15. Welche Logiken werden von z3 unterstützt?
- 16. Welche Dateitypen werden von WKWebView unterstützt?
- 17. Welche Optionen werden für Common Lisp Web Server empfohlen?
- 18. Web-Elemente können nicht unter "chrome: // downloads /" gefunden werden. Seite
- 19. Typ oder Namespace konnte nicht gefunden werden (Web Site)
- 20. Welche Methoden können zum Sichern von Webdiensten verwendet werden?
- 21. Kann ich sehen, welche Dateien von einer Schluckuhr verarbeitet werden?
- 22. Welche Art von Scores werden von cross_validation.cross_val_score zurückgegeben?
- 23. Welche #defines werden von Xcode beim Kompilieren für iPhone eingerichtet
- 24. Welche Sprache für die Entwicklung von Web-/Handyspielen lernen?
- 25. Welche Ausgabe von ECMA-262 unterstützt Google Apps Script?
- 26. Welche Art von Cookies werden automatisch von HTTP Cookie Manager-Komponente von Jmeter extrahiert? darin
- 27. Android - Google-play-services_lib.apk konnte nicht gefunden werden! Fehler
- 28. Welche Sprachen werden im 404-Polygot von Stack Overflow verwendet?
- 29. Selinium web driver- Kann nicht gefunden werden href
- 30. web api 2 routing - Die Ressource kann nicht gefunden werden
toller link! Kennt jemand große Google IP-Routen? – divinci
Es ändert sich wahrscheinlich unvorhersehbar. Verwenden Sie einfach die DNS-Methode und Sie sollten in Ordnung sein. – bdonlan