Q

jsoup den gesamten Text zwischen Tag außer für eine Art von Subtag Extrahieren

regex
jsoup

2017-02-26 5 views 0 likes

0

Ich habe ein HTML-Code wie dieserjsoup den gesamten Text zwischen Tag außer für eine Art von Subtag Extrahieren

<p> 
    <i>One</i> - <i>Two</i> - ... <i>N</i> - 
    <tag1>hey</tag1> <tag2>there!</tag2> how are you? 
</p>

ich hey there! how are you? haben möchte.

Das ist, was ich bisher zu verwaltenden:

Elements p = document.select("p"); 
List<Node> nodes = p.get(0).childNodes(); 
for (Node node : nodes){ 
    if (node.nodeName() != "i"){ 
     if (node.nodeName() != "#text"){ 
      System.out.print(((Element) node).text()); 
     } else { 
      System.out.print(node); 
     } 
    } 
}

Und das ist, was ich habe:

- - hey there! how are you?

Danach habe ich geplant .replace() verwenden der "loszuwerden - ".

Ich fragte mich, ob es einen besseren Weg gab?

2017-02-26 NoSmile

+0

Von Bedeutung in der bearbeiteten Version ist, dass _all_ der auszuschließenden Textelemente ein "" -Tag vorausgeht. Ist das korrekt? –

+0

Die auszuschließenden Textelemente sind alle " smth -" Muster :) – NoSmile

+0

Es zeigt nur "dort!". Das ist okay, ich bleibe bei meiner Methode, bis es eine Verbesserung gibt :) – NoSmile

A
Antwort

0

Wenn das Layout sicher gegeben ist, dann könnte diese Variante für Sie geeignet sein. Testen der <i> Elemente und Elemente, die ihnen folgen.

Quelle

2017-02-26 09:54:16

+0

Das Layout ist nicht genau so: Ein - kann wiederholt werden. (0, 1, 2 oder 3 mal) Ich werde meine vorherige Post folglich ändern. Aber meine Frage war mehr, wenn es irgendwelche Methoden von jSoup gab, die es direkt tun konnten? – NoSmile

Verwandte Themen

1. Jsoup - Extrahieren von Text

2. Notepad ++ löschen den gesamten Text außer URL

3. JSoup- Abrufen von Text zwischen den Tags als

4. mit jsoup Attribute Text von Tag Get

5. Extrahieren von Text zwischen den Ziffern - Python

6. Inhalt zwischen Tag extrahieren

7. Extrahieren von Text zwischen dem ersten <a> Tag

8. So extrahieren Sie den vorherigen Tag-Text

9. JSoup - Extrahieren von Tabellendaten Fehler

10. Extrahieren Sie den gesamten Text mit Zeichenfolgenpositionen aus einem PDF

11. Extrahieren von Inhalt mit JSOUP

12. notepad ++ den gesamten Text löschen, außer was mit Regex übereinstimmt

13. Extrahieren Sie den gesamten Text aus beliebig verschachteltem HTML

14. Geben Sie den gesamten Text innerhalb von Links von einem bestimmten div mit JSoup zurück

15. Extrahieren von Text aus einem Div-Tag

16. Extrahieren von Text aus BeautifulSoup-Tag-Element

17. Extrahieren von Tags und Text zwischen Tags mithilfe von Regex für eine Zeichenfolge mit XML-Tags

18. Jsoup scraping Text von Kindern von div

19. Abrufen von Text innerhalb einer Div-Klasse in Jsoup

20. Regex - Extrahiert den gesamten Text außer eckigen Klammern und deren Inhalt

21. Extrahieren von Text zwischen zwei Stücken von Text

22. Nur Inhalt von fettem Tag analysieren Jsoup

23. regex für den Erhalt gesamten Text (etwas) innerhalb von [[]]

24. Text in HTML extrahieren <br> Tags JSOUP

25. jsoup: Wie für Datum Text von einer Webseite suchen

26. Extrahieren Sie Text in einer Reihenfolge mit Jsoup

27. Muster zum Extrahieren von Text zwischen Klammern

28. Text Informationen extrahieren zwischen zwei definieren Text

29. Python: BeautifulSoup extrahieren Zeichenfolge zwischen div-Tag von seiner Klasse

30. So extrahieren Sie den Text zwischen vielen Kommas in Excel

Letzte Frage

1. So rufen Sie eine Methode im Winkel Service

2. Bedingtes Sortieren der Spalte in R

3. Falsche Füllwerte in einer ggplot2-Legende

4. Können wir alle Release-/Builddefinition-Burn-down-Charts in TFS 2015 Update 3 konfigurieren?

5. Wie kann ich Constraint programmgesteuert ändern

6. Wie erreicht man eine saubere Korrelationstabelle mit der Funktion corstarsl()?

7. Führen Sie etwas einmal in einer rekursiven JavaScript-Funktion

8. XPath 3 in Browser

9. Wie kann ich verschiedene Inhalte in der heutigen Erweiterung hinzufügen?

10. Ist es in Ordnung, viele Datenbank-Roundtrips in einer Controller-Aktion

Verwandte Themen

1. Jsoup - Extrahieren von Text

2. Notepad ++ löschen den gesamten Text außer URL

3. JSoup- Abrufen von Text zwischen den Tags als

4. mit jsoup Attribute Text von Tag Get

5. Extrahieren von Text zwischen den Ziffern - Python

6. Inhalt zwischen Tag extrahieren

7. Extrahieren von Text zwischen dem ersten <a> Tag

8. So extrahieren Sie den vorherigen Tag-Text

9. JSoup - Extrahieren von Tabellendaten Fehler

10. Extrahieren Sie den gesamten Text mit Zeichenfolgenpositionen aus einem PDF

Sprechen Sie uns an

© 2020 DE.VOIDCC.COM

沪ICP备13005482号-13

简体中文

繁體中文

Русский

Deutsch

Español

हिन्दी

Italiano

日本語

한국어

Polski

Türkçe

Tiếng Việt

Française