2017-03-14 8 views
0

Ich übe mit XPATH, um Text innerhalb HTML zu extrahieren.XPATH extrahieren Text innerhalb <br>

Ich habe die folgende Struktur:

<tbody> 
    <tr class="table-row"> 
    <td class="table-cell"> 
     Name 
     <br /> 
     Address 
     <br /> 
     Postcode 
     <br /> 
     Phone: 111111 
     <br /> 
     Fax: 123456 
     <br /> 
     Email: <a class="mail" href="mailto:[email protected]">[email protected]</a> 
     <br /> 
    </td> 
    </tr> 
    <tr class="table-row"> 
    <td class="table-cell"> 
     Name 
     <br /> 
     Address 
     <br /> 
     Postcode 
     <br /> 
     Phone: 111111 
     <br /> 
     Fax: 123456 
     <br /> 
     Email: <a class="mail" href="mailto:[email protected]">[email protected]</a> 
     <br /> 
    </td> 
    </tr> 
    (...) 
</tbody> 

Ich schaffe es verschiedene Knoten zu navigieren, aber ich kann nicht herausfinden, wie in einem Textknoten zu extrahieren.

Insbesondere muss ich Text in "Telefon:" und folgenden <br /> und "Email:" und folgenden <br /> in allen Zeilen in der Tabelle extrahieren.

+0

zeigen Bitte die XPath Sie versucht haben .. Sie benötigen auch die '
' s oder einfach nur die Texte? – har07

Antwort

0

wie etwa //td/text()[4] für Telefon und //td/a für den E-Mail-Wert

Verwandte Themen