ich mit dem folgende HTML-Layout auf Hunderte von Seiten zu tun habe, die ich mag von Daten kratzen:Mit normalisieren-Raum mit XPath entfernen Whitespaces
<div class="store stores_show cms_page_text">
<div class="row">
<div class="col col_4 m_col_8 stores_list_address">
<p class="store_header">
Russell & Bromley
</p>
Unit 3A
<br/>
35-38 George Street<br/>
TW9 1HY
</div>
<div class="col col_4 m_col_8 stores_list_contact">
<strong>T.</strong> 02089486805<br/> </div>
XPath folgenden wird ‚& Bromley Russell extrahiert ‘, aber es extrahiert auch Leerzeichen, die ich nicht will:
// * [@ id = "stores_list"]/div [2]/div/div [1]/p
Wie kann ich die Normalize-Space-Funktion mit dem obigen XPath verwenden, um Leerzeichen zu entfernen?
Microsoft Beleg:
https://msdn.microsoft.com/en-us/library/ms256063(v=vs.110).aspx
Beispiel Streicher:
normalize-space ("abc def")
<xsl:template match="/text">
Unnormalized:
"<xsl:value-of select='.'/>"
Normalized: "<xsl:value-of select='normalize-space()'/>"
</xsl:template>
Ich kann das nicht bekommen um meinen eigenen XPath zu bearbeiten, irgendwelche Ideen?
Bitte lassen Sie mich wissen, wenn Sie weitere Informationen benötigen. Ich möchte einen zweiten Schritt vermeiden, wie z. B. das Löschen von Leerzeichen über Excel.
Vielen Dank im Voraus, total über meinen Kopf mit diesem als Newb mit 0 Erfahrung.
bitte veröffentlichen Sie Ihre HTML – derloopkat