Ich benutze Scrapy XMLFeedSpider, um einen großen XML-Feed (60 MB) von einer Website zu analysieren, und ich habe mich nur gefragt, ob es nur einen Teil davon gibt 60MB, weil im Moment der RAM verbraucht ist ziemlich hoch, vielleicht etwas in den Link wie setzen:Nur einen Teil eines XML-Feeds abrufen
"http://site/feed.xml?limit=10", ich habe gesucht, wenn es etwas ähnliches, aber ich habe nichts gefunden. Eine andere Option wäre die Anzahl der von scrapy geparsten Elemente zu begrenzen, aber ich weiß nicht, wie das geht. Sobald der XMLFeedSpider das ganze Dokument analysiert hat, wird der Bot nur die ersten zehn Elemente analysieren, aber ich nehme an, dass der Ganzer Feed wird immer noch im Speicher sein. Haben Sie eine Idee, wie Sie die Leistung des Bot verbessern können, indem Sie den RAM- und CPU-Verbrauch verringern?
Dank
http://doc.scrapy.org/en/master/topics/spiders.html#scrapy.spiders.XMLFeedSpider.iterator Siehe diesen Teil der Dokumentation. Es beschreibt das Heilmittel. –