So extrahieren Sie verschachtelten Text in Scrapy?

Ich versuche, einen Absatz von Marken Beschreibung auf dieser Website mit Scrapy zu extrahieren: http://us.asos.com/hope-and-ivy/hope-ivy-dotty-mesh-midi-dress-with-ruffle-detail/prd/8663409?clr=black&cid=2623&pgesize=36&pge=0&totalstyles=627&gridsize=3&gridrow=1&gridcolumn=1 So extrahieren Sie verschachtelten Text in Scrapy?

Das HTML-Element wie folgt aussieht:

<div class="brand-description"> 
    <h4>Brand</h4> 
    <span>"Prom queens and wedding guests, claim the best-dressed title in " 
    <a href="/Women/A-To-Z-Of-Brands/Hope-And-Ivy/Cat/pgecategory.aspx?cid=21368"> 
     <strong>"Hope and Ivy's"</strong> 
    </a> 
    "occasion-ready collection. Shop its notice-me styles for hand-painted florals, Bardot necklines and figure-flattering pencil dresses." 
    </span> 
</div>

Mein gewünschtes Ergebnis ist:

„Prom Königinnen und Hochzeitsgäste, fordern Sie den bestgekleideten Titel in Hope und Ivys anlassfertigen Kollektion. Kaufen Sie ihre Notiz-Stile für handbemalte Blumen, Bardot-Ausschnitt und figurschmeichelnde Bleistiftkleider. "

habe ich versucht, diese Methode:

response.css("div.brand-description span::text").extract()

jedoch die Textliste Ich habe ist jene in der „starken“ Tag fehlt, die „Hoffnung und Ivys“ ist:

['Prom queens and wedding guests, claim the best-dressed title in ', ' occasion-ready collection. Shop its notice-me styles for hand-painted florals, Bardot necklines and figure-flattering pencil dresses.']

Meine Frage Ist, kann ich den einfachen Text ohne die Aufmerksamkeit auf den "href" Tag erhalten?

Quelle

2017-08-29 lliu05

versuchen, diese // div [Einnahme geben @ class = "Markenbeschreibung"]/div –

Sie könnten noch einige Nachbearbeitung zu tun haben, aber das ist wahrscheinlich das Beste, was Sie tun können:

response.xpath('normalize-space(//div[@class="brand-description"]/span)').extract_first()

die Sie

u'"Prom queens and wedding guests, claim the best-dressed title in " "Hope and Ivy\'s" "occasion-ready collection. Shop its notice-me styles for hand-painted florals, Bardot necklines and figure-flattering pencil dresses."'

Quelle

2017-08-29 05:49:22

So extrahieren Sie verschachtelten Text in Scrapy?

Antwort

Verwandte Themen