2017-05-31 5 views
1

I eine Linie haben, die Teil der html zurückgegeben:Extrahierung <span /> Teil html Knoten

<h1 id="pgName" class="floatLVal tight">IBM Dividend Yield (TTM):</h1><span id="pgNameVal">3.74% for May 31, 2017</span> 

, die ich wie folgt gelesen. Ich sehe den Knoten, aber ich kann nichts von dem Text nach (TTM): in irgendeinem der Felder singleNode sehen, z. B. als Teil von innerhtml. Ich möchte den Teil "3,74% für den 31. Mai 2017" extrahieren.

Was ist der richtige Weg, um diese Informationen zu extrahieren?

HtmlDocument document = ... 
var singleNode = document.DocumentNode.SelectSingleNode("//h1[@class='floatLVal tight']"); 

Antwort

1

span Tag nicht in h1-Tag befindet. Entweder bekommen nächsten Geschwisterknoten von h1

var h1 = document.DocumentNode.SelectSingleNode("//h1[@class='floatLVal tight']"); 
var span = h1.NextSibling; 
var text = span.InnerHtml; // "3.74% for May 31, 2017" 

Oder bekommen span Knoten von ID:

var span = document.DocumentNode.SelectSingleNode("//span[@id='pgNameVal']"); 
var text = span.InnerHtml; // "3.74% for May 31, 2017" 
+1

Danke, das funktioniert. – Ivan

Verwandte Themen