Es gibt eine Website, die ich aus Google Cache abrufen möchte, die Tausende von Seiten hatte. Gibt es eine Möglichkeit, dass ich es schnell mit Google Cache oder einem anderen Webcrawler/Archivierer wiederherstellen kann?Abrufen einer ganzen Website mit Google Cache?
Antwort
können Sie sehen, was Google (noch) über eine Website kennt site
unter Verwendung einschränken:
http://www.google.com/search?q=site:[domain]
Sie auch die Internet Archive überprüfen könnten.
(In jedem Fall würden Sie wahrscheinlich wollen einige schwere Automatisierung tun, um Tausende von Seiten zu holen.)
ich ein free service to recover your website geschaffen, die meisten Seiten aus der Suchmaschinen-Cache abrufen kann.
Die Ausgabe des Dienstes ist eine gezippte Datei mit Ihrem HTML aus dem Suchmaschinen-Cache. Es ist immer noch in der Beta-Phase, also braucht es noch eine Menge Verbesserungen und Bugfixes, aber hoffentlich kann es dir oder anderen Leuten helfen, die das gleiche Problem haben.
UPDATE: Ich hatte keine Zeit, die Entwicklung des Dienstes fortzusetzen, so dass es geschlossen ist.
Site aufgeführt ist eine tote Link :( – NickG
Man wäre absolut episch, wenn Sie den Quellcode = O – dctremblay
- 1. Stoppt Google mit einer zwischengespeicherten Kopie meiner Website
- 2. Ablaufzeit des Cache abrufen
- 3. Daten von einer bestimmten Website abrufen
- 4. AngularJS Website, Cache eine Versionsnummer
- 5. Google Cache wird nicht aktualisiert
- 6. Google Kontakte mit LightOpenID abrufen?
- 7. Google Cloud-Speicher, Cache-Control
- 8. Cache-Validierer für Google Webfonts
- 9. Chrome lädt einen alten Cache meiner Website
- 10. Abrufen einer Nummer von jeder Seite einer paginierten Website
- 11. Zwei Google Analytics-ID auf einer Website
- 12. Löschen einer ganzen Tabelle
- 13. Cache für aspnet mvc2 Website deaktivieren
- 14. Anzeigen einer Website in einer Website?
- 15. Strikeout einer ganzen Tabellenzeile
- 16. Blockieren einer Website mit Java
- 17. Abrufen einer java.lang.ClassCastException bei Verwendung von "net.sf.json.JSONObject" mit Google-Geokodierung
- 18. kleines Problem mit einer ganzen Reihe entkommen
- 19. Wann crawlt Google eine Website neu?
- 20. Wie kann ich die ganzen Klartext von einer Website mit Scrapy?
- 21. YII 2 Website-URL abrufen
- 22. Können NHibernate-Kriterien aus dem Cache abrufen
- 23. Anmeldung mit Google Plus auf meiner Website
- 24. Können wir mailchimp mit Google-Website integrieren
- 25. Parsen einer Website mit NodeJs
- 26. Google Benutzerdefinierte Suche und Google Website-Suche
- 27. Abrufen von JSON von einer Website (Windows Phone 7)
- 28. Wie kann ich das Favicon einer Website abrufen?
- 29. Update WSO2-Cache zum Abrufen von Daten
- 30. Zugriff auf den Cache von Google Chrome
Ich würde Warrick verwenden: http://warrick.cs.odu.edu/ Aber ach, seine Server sind zu beschäftigt. Internet Archive speichert nach 6 Monaten. – stockoverflow