Angenommen, ich analysiere eine Listing-Seite und erzeuge eine JSON-Ausgabe. Am Ende, wenn alles geparst ist, möchte ich einige Operationen auf dem letzten Scrapped-Ergebnis ausführen. Wie kann ich es in Scrapy machen? Ich weiß über process_item
aber es funktioniert für jedes Element in Iteration. Die geschlossene Sache, die ich fand, war close_spider
, aber ich bin nicht sicher, dass, wenn ich scrapy crawl spider
laufen lasse, ob es mir JSON gibt, das ich in closed_spider
schuf? Wenn ja, wie?Wie verarbeitet man letzte Schaber in Scrapy?
0
A
Antwort
0
Sie könnten die JsonItemExporter
Überschreiben die finish_exporting
Methode Unterklasse weiter die endgültige JSON-Datei
Verwandte Themen
- 1. Wie verarbeitet duplikate in scrapy?
- 2. Scrapy Schaber nicht Scraping vorbei 1. Seite
- 3. Beschleunigen Sie Web Schaber
- 4. Scrapy verarbeitet nicht alle Seiten beim Crawlen
- 5. Wie verarbeitet man JSON
- 6. Wie verarbeitet man alle Arten von Ausnahmen in einem Scrapy-Projekt, in errback und callback?
- 7. BeautifulSoup wie Schaber für NodeJS
- 8. Wie verarbeitet man ein Objektliteral?
- 9. Wie bekomme ich letzte ID MySQL in Scrapy?
- 10. Wie verarbeitet man JSON Fehlermeldung
- 11. Wie verarbeitet man Informationen in einem Bild?
- 12. Wie verarbeitet man die Vektoreingabe in StateFlow?
- 13. Wie verarbeitet man mehrere Befehlszeilenargumente in Bash?
- 14. Wie verarbeitet man 2 Checkboxen in PHP?
- 15. Wie verarbeitet man "parallele" Sequenzen in Linq?
- 16. Wie verarbeitet man KML/GeoJSON in Nodejs?
- 17. Wie verarbeitet man Anfrage Header in Koa.js?
- 18. Wie verarbeitet man große Binärdaten in Clojure?
- 19. Webseite Datentabelle Schaber
- 20. build PHP URL-Parser Schaber
- 21. Selen Web-Treiber Schaber
- 22. Daten Schaber Ergebnisse Datenbank
- 23. Wie verarbeitet man Dateien nur für die letzte Stunde mit Talend?
- 24. wie man Artikel laden in scrapy Schleife
- 25. Wie man eine Spinne in Scrapy "pausiert"?
- 26. Wie implementiert man verschachtelte Artikel in Scrapy?
- 27. wie man Cookies in scrapy überschreibt/verwendet
- 28. Wie man über divs in Scrapy iteriert?
- 29. Wie letzte Option von SELECT-Liste bekommen XPath - Scrapy
- 30. Wie verarbeitet man CIDR-Block/Textverarbeitung?
Können Sie das näher erläutern Sie Ihre Antwort zu verarbeiten. Erhalte ich vollständig analysierte Daten aller Datensätze in dieser Methode? – Volatil3
Hallo @ Volatil3 ja, im Grunde der Artikel Exporteur fügen Sie die serialisierten Elemente in die Datei, und weil Sie Zugriff auf die Ausgabedatei haben, haben Sie Zugriff auf alle Elemente (überprüfen Sie bitte https://github.com/scrapy/scrapy/ blob/master/scrapy/exporters.py # L101) dort ist die Variable 'file' die Datei, die alle serialisierten Elemente enthält. Alternativ könnten Sie auch einen benutzerdefinierten speicherinternen Speicher erstellen (das Objekt, das die Datei verwaltet, die vom Artikelexporteur verwendet wird, an seinem endgültigen Ziel wie s3, ftp usw.) und alle Elemente verarbeitet, wenn die Methode 'store' aufgerufen wird – Wilfredo