Ich habe diese sehr kurze Spinne geschrieben, um zu einem US News Link zu gehen und die Namen der dort aufgeführten Colleges zu übernehmen.Leere .json Datei in Scrapy
#!/usr/bin/python
# -*- coding: utf-8 -*-
import scrapy
class CollegesSpider(scrapy.Spider):
name = "colleges"
start_urls = [
'http://colleges.usnews.rankingsandreviews.com/best-colleges/rankings/national-universities?_mode=list&acceptance-rate-max=20'
]
def parse(self, response):
for school in response.css('div.items'):
yield {
'name': school.xpath('//*[@id="view-1c4ddd8a-8b04-4c93-8b68-9b7b4e5d8969"]/div/div[1]/div[1]/h3/a').extract_first(),
}
Allerdings, wenn ich diese Spinne laufen und fragen Sie nach den Namen in einer Datei mit dem Namen schools.json gespeichert werden, kommt die Datei aus leer. Was mache ich falsch?
tun Sie sehen Artikel im Terminal/CLI ergab? – Umair
@Umair was meinst du? Meine Terminalausgabe zeigte keine Fehler. – ch1maera
@Umair Ich habe das obwohl "HTTP-Status-Code wird nicht behandelt oder nicht erlaubt" – ch1maera