2016-12-16 2 views
0

ich ein HTML-Dokument mit einer Struktur wie diese:Komponenten

<div id = 'd1'> 
    <p>...</p> 
    <p>...</p> 

    <!-- this [SurveyButton] is pure text and doesn't belong to any element under this level --> 
    [SurveyButton] 

    <div>...</div> 
</div> 

Ich mag dieses HTML-Dokument in drei Teil brechen:

1:

<p>...</p> 
<p>...</p> 

2:

[SurveyButton] 

3:

<div>...</div> 

und ich möchte das String-Format jedes Teils erhalten. Einige Gedanken, die ich jetzt habe, ist "[SurveyButton]" durch "<p>[SurveyButton]</p>" zu ersetzen, und ich kann alle <p></p>s bekommen und die ersten beiden als eins gruppieren. In diesem Fall habe ich die ersten beiden Teile behandelt. Aber die knifflige Sache ist, gibt es auch <p>s innerhalb der dritten <div></div>. Ich kann keinen allgemeinen Weg finden. Wie mache ich das (besser mit Jsoup-Bibliothek)? Vielen Dank.

+3

SO ist kein Code-Schreibdienst. Bitte zeigen Sie uns Ihren Versuch. – Alohci

Antwort

-2

Es gibt Bibliotheken, die HTML-Parsing durchführen. JSoup kommt mir in den Sinn, aber es gibt andere.

+0

OP's Frage war 'Wie mache ich das (besser mit Jsoup-Bibliothek)?' – Joe

Verwandte Themen