Ich versuche, einen Absatz von Marken Beschreibung auf dieser Website mit Scrapy zu extrahieren: http://us.asos.com/hope-and-ivy/hope-ivy-dotty-mesh-midi-dress-with-ruffle-detail/prd/8663409?clr=black&cid=2623&pgesize=36&pge=0&totalstyles=627&gridsize=3&gridrow=1&gridcolumn=1So extrahieren Sie verschachtelten Text in Scrapy?
Das HTML-Element wie folgt aussieht:
<div class="brand-description">
<h4>Brand</h4>
<span>"Prom queens and wedding guests, claim the best-dressed title in "
<a href="/Women/A-To-Z-Of-Brands/Hope-And-Ivy/Cat/pgecategory.aspx?cid=21368">
<strong>"Hope and Ivy's"</strong>
</a>
"occasion-ready collection. Shop its notice-me styles for hand-painted florals, Bardot necklines and figure-flattering pencil dresses."
</span>
</div>
Mein gewünschtes Ergebnis ist:
„Prom Königinnen und Hochzeitsgäste, fordern Sie den bestgekleideten Titel in Hope und Ivys anlassfertigen Kollektion. Kaufen Sie ihre Notiz-Stile für handbemalte Blumen, Bardot-Ausschnitt und figurschmeichelnde Bleistiftkleider. "
habe ich versucht, diese Methode:
response.css("div.brand-description span::text").extract()
jedoch die Textliste Ich habe ist jene in der „starken“ Tag fehlt, die „Hoffnung und Ivys“ ist:
['Prom queens and wedding guests, claim the best-dressed title in ', ' occasion-ready collection. Shop its notice-me styles for hand-painted florals, Bardot necklines and figure-flattering pencil dresses.']
Meine Frage Ist, kann ich den einfachen Text ohne die Aufmerksamkeit auf den "href" Tag erhalten?
versuchen, diese // div [Einnahme geben @ class = "Markenbeschreibung"]/div –