Ist es möglich, Xpath normalize-space()
auf HTML mit <br>
, <br/>
als neue Zeile aufrufen? XPath-Version ist 1.0XPath, um den String-Wert des Elements auszuwählen, aber mit <br/> ersetzt durch Newline?
Wir analysieren Artikel von Websites. Beispiel für echten HTML-Code:
<div id="someid">
<img src="https://habrastorage.org/webt/ej/ye/hp/ejyehp08ercmqzlhzh3um6mtukm.jpeg"><br>
<br>
Организовать удаленный доступ для сотрудников — задача прикладная. Решений на рынке немало, при этом, и подводных камней достаточно. Под катом рассказ о нашем «чемодане», который раскладывается быстро и удобно за 30 минут. Просьба не воспринимать это как рекламный BS, поскольку внутри реальная инструкция по применению.<a name="habracut"></a><br>
<br>
<a href="https://www.parallels.com/ru/products/ras/remote-application-server/">Parallels Remote Application Server</a> (RAS) — это комплексное средство для доставки виртуальных приложений и рабочих столов, позволяющее работать с приложениями и данными с любого устройства, в том числе мобильного. Мы понимаем, что такие решения хочется сначала протестировать в конкретных условиях, прежде чем принимать решение о покупке. <br>
<br>
</div>
Problem nicht beim Extrahieren von Text von der Website. Problem ist, dass normalize-space
entfernen alle Tags sind <br>
. Als Ergebnis haben wir eine lange Textzeile. Ich brauche eine Textzeile mit Pausen.
Erwartetes Ergebnis:
Организовать удаленный доступ для сотрудников — задача прикладная. Решений на рынке немало, при этом, и подводных камней достаточно. Под катом рассказ о нашем «чемодане», который раскладывается быстро и удобно за 30 минут. Просьба не воспринимать это как рекламный BS, поскольку внутри реальная инструкция по применению.
Parallels Remote Application Server(RAS) — это комплексное средство для доставки виртуальных приложений и рабочих столов, позволяющее работать с приложениями и данными с любого устройства, в том числе мобильного. Мы понимаем, что такие решения хочется сначала протестировать в конкретных условиях, прежде чем принимать решение о покупке.
1) Gibt es einen bestimmten Grund, warum Sie 'normalize-space()' verwenden möchten? 2) Willst du diese 2 Teilstrings als einzelne Saite oder als Liste von 2 Saiten bekommen? 3) Teilen Sie Ihren XPath – Andersson
@Andersson 1) Wir brauchen Text ohne HTML-Tags, aber mit Haltepunkten. 2) Wir können von 1 bis zu
Tags haben. Wir crawlen Artikel. –
Sind Sie sicher, dass 'br' der einzige Elementtyp in Ihrem gemischten Inhalt ist? – kjhughes