2017-04-10 2 views
-2

Entschuldigung für meine Frage. Wenn ich laufe, erhalte ich einen Fehler. Was mache ich falsch? Bitte hilf mir. Ich muss alle Artikel mit der New York Times bekommen.Scrapy. Fehler beim unerwarteten Einzug Python

class OrphanSpider(CrawlSpider): 
    name = "atical" 
    allowed_domains = ["www.nytimes.com"] 
    start_urls = ["https://www.nytimes.com/section/world?WT.nav=page&action=click&contentCollection=World&module=HPMiniNav&pgtype=Homepage&region=TopBar"] 

    rules = (
      Rule(SgmlLinkExtractor(allow=(), restrict_xpaths=('//*[@id="story"]/div/',)), callback="parse_items", follow= True) 
      ) 

      def parse_item(self, response): 
       hxs = HtmlXPathSelector(response) 
       l = OrphanLoader(parse_item(), hxs) 
     l.add_value('url', response.url) 
     l.add_xpath('name', "//*[@id="headline"]" % u"Название статьи:") 
     l.add_xpath('text', "//*[@id="story"]/div/" % u"Текст:") 

Fehler:

IndentationError: unexpected indent 
+1

'parse' Methode Einrückung ist nicht korrekt. Ist das der Fehler oder Tippfehler in Ihrer Frage? – kuro

+0

@kuro ist es wahrscheinlich Fehler. Was ist los mit dir? Ich verstehe nicht. – Maria

Antwort

-2

Sie haben Tabs und Leerzeichen am Anfang jeder Zeile gemischt. Machen Sie sie konsistent, entweder alle Tabs oder alle Leerzeichen. Oder es könnte die Zeile sein: def parse_item (self, response): ist nicht richtig eingerückt