Ich versuche Artikel Loader in scrapy zu studieren, dieser Code unten funktioniert nicht richtig: es gibt mir nur die "start_url" Wert und nicht die "SUBJECT" und "CREATOR2" Wert (sie erscheinen überhaupt nicht, es gibt nicht nur einen leeren Schlitz). Ich kann nicht herausfinden, warum das so ist.Artikel Loader funktioniert nicht richtig in scrapy
Ich brauche Item Loader speziell für den "CREATOR2" -Wert, der manchmal auf einem XPath und manchmal auf einem anderen ist.
Sie sind alle in der Datei Elemente benannt und der Xpath funktioniert gut auf einem Tester.
EDIT: Als Wunsch, hier ist der Artikel Definition:
import scrapy
from scrapy.item import Item, Field
from scrapy.loader import ItemLoader
from scrapy.contrib.loader.processor import Identity
class BibtimeItem(Item):
CREATOR2 = Field()
SUBJECT = Field()
start_url = Field()
pass
class BibtimeLoader(ItemLoader):
#default_input_processor = Identity()
default_output_processor = Identity()
Vielen Dank! aber es funktioniert sowieso nicht. –
@LaraM. Sind Sie sicher, dass die XPath-Ausdrücke korrekt sind? Veröffentlichen Sie auch die Artikel- und die Artikelladerdefinition. Vielen Dank. – alecxe
Die Element- und Loader-Definition hinzugefügt. Ja, ich bin mir ziemlich sicher, hier ist eine Beispielseite: view-source: http: //www.aib.it/aib/sezioni/emr/bibtime/num-i-1/bucchion.htm –