Ich verwende htmlUnit auf dieser Seite http://www.my-personaltrainer.it/Foglietti-illustrativi/Torvast.html Es gibt einen Index von Abschnitten und jeder Abschnitt hat eigenen Text. Ich möchte eine Methode erstellen, die den Text zurückgibt, der den Namen des Abschnitts übergibt.HtmlUnit - Holen Sie sich den Text zwischen 2 Tags ohne ID
Alle sections'name sind in einem Tag 'lista' genannt, und ich bekomme diese Informationen auf diese Weise:
HtmlPage page = webClient.getPage("http://www.my-personaltrainer.it/Foglietti-illustrativi/Torvast.html");
final String pageAsText = page.asText();
final Iterable<DomElement> div = page.getHtmlElementById("lista").getChildElements();
ArrayList<String> menu = new ArrayList<>();
for (DomElement e : div) {
menu.add(e.asText());
}
Alle Informationen sind in einer Spanne, die ich durchlaufen:
Iterable<DomElement> desc = page.getHtmlElementById("foglietto_descrizioni").getChildElements();
Jeder Abschnitt sind innerhalb eines h2-Tags ohne ID oder Klasse. Also ich weiß nicht, wie man den ganzen Text zwischen einem Tag h2 zum anderen extrahiert.
Kannst du die ganze Reihe schreiben? Ich weiß nicht wo die Methode, die du schreibst, steht. Vielen Dank. @Thowk – Fidelis