scrapy Holen Sie sich den gesamten Text einschließlich Kinder

Ich habe eine Reihe von  Elemente in einem Dokument Ich kratze mit Scrapy.
das sind einige: bla bla bla oder bla bla blasecond bla blascrapy Holen Sie sich den gesamten Text einschließlich Kinder

Ich möchte den ganzen Text mit den Kindern extrahieren (nehmen Ich habe bereits die Wähler des <p)
(zweites Beispiel: eine Zeichenfolge haben bla bla bla second bla bla)

Quelle

2014-10-25 Boaz

können Sie Code anzeigen, wie Sie die Daten aus dem Antworttext extrahieren? – Anzel

[Beautifulsoup] (http://www.crummy.com/software/BeautifulSoup/bs4/doc/) ist eine großartige Bibliothek zum scraping. Sie können es mit 'scrapy' verwenden. –

Sie können nur //text() verwenden alle Texte von Kindern

Knoten

zum Beispiel zu extrahieren:

.//p//text()

Quelle

2014-10-25 17:35:47 Anzel

ahhh ... // text() statt/text() - was ein 1 character kann :) – Boaz

froh, dass es hilft. Mit yes '//' werden alle Elemente rekursiv nach dem übergeordneten 'node', in Ihrem Fall '// p', abgerufen – Anzel

scrapy Holen Sie sich den gesamten Text einschließlich Kinder

Antwort

Verwandte Themen