2017-05-10 6 views
0

Angenommen, es gibt zwei HTML-Seite. Seite1 und Seite2Extrahieren von Daten aus einer Div-Klasse oder Div-ID Ende mit Inhalt mit jsoup

page1 enthält html wie

<div class="content"> 
<p></p> 
<p></p> 
</div> 

und page2 enthält html wie

<div id="main-content"> 
<p></p> 
<p></p> 
<p></p> 
</div> 

jetzt ich einen jsoup Parser wie

schrieb
Document document = Jsoup.connect(url).get(); 
      Elements links = document.select("div[class~=content$]"); 

       for (Element heading2 : links) { 
       Elements p = heading2.select("p"); 
       for (Element ptext : p) { 
        System.out.println(ptext.text()); 
          } 
           } 

in diesem Code es sagt, wenn div Klasse enthält content am Ende dann analysieren sie die Daten aber wenn Seite div id="content" enthält kippt pasre die data..i natürlich wissen, es kann nicht ... meine Frage ist es eine Möglichkeit, ob die <div>id oder Klasse zu überprüfen ist, enthält content am Ende von div id/class dann parse es?

Antwort

0

Sie könnten Komma verwenden, um einige voneinander unabhängige Selektoren anzugeben. So können Sie einen erstellen, der nach <div id="main-content"> und anderen für <div class="content">

.select("div[id~=content$], div[class~=content$]"); 
suchen wird
Verwandte Themen