Ich kratze eine Site und ich möchte ein XML erzeugen, wo jede Region innerhalb des Landes ist, zu dem es gehört.Wie man XML in einer scrapy Spinne richtig einrückt
def parse(self, response):
#here i parse the country names
country_names = response.xpath('//some countries/text()').extract()
for name_of_country in countries :
yield {"Country": name_of_country }
yield Request(country_url, callback=self.parse_regions)
def parse_regions(self, response):
#here i parse the regions of each country
regions= response.xpath('//some regions/text()').extract()
for region in regions
yield {"Region": region }
Nun ist die XML erscheint wie:
<Country1></Country1>
<Country2></Country2>
<Region>Region1</Region>
<Region>Region2</Region>
<Region>Region3</Region>
<Region>Region1</Region>
<Region>Region2</Region>
<Region>Region3</Region>
ich die XML als angezeigt werden soll folgt:
<Country1>
<Region>Region1</Region>
<Region>Region2</Region>
<Region>Region3</Region>
</Country1>
<Country2>
<Region>Region1</Region>
<Region>Region2</Region>
<Region>Region3</Region>
</Country2>
Sie senden können 'Country' zu nächsten Anfragen mit' meta = 'in' Requests (..., meta = {"Land": name_of_country}) 'und zweitens Mit der Anfrage können Sie einen Artikel mit Land und allen Regionen erstellen, nicht viele Artikel mit einzelnen Regionen. – furas
können Sie URL zu dieser Seite hinzufügen, damit wir es testen können. – furas