Welche HTML-Parsing-Bibliotheken empfehlen Sie in Java

ich einige HTML, um zu analysieren, wollen usw. die Werte einiger Attribute/Tags zu findenWelche HTML-Parsing-Bibliotheken empfehlen Sie in Java

Welche HTML-Parser Sie empfehlen? Irgendwelche Vor- und Nachteile?

Quelle

2008-08-25 pek

NekoHTML, TagSoup und JTidy können Sie HTML analysieren und dann mit XML-Tools wie XPath verarbeiten.

Quelle

2008-08-25 19:22:20 jelovirt

XPath ist der Weg für das HTML-Parsing, es hilft im Falle von schlechtem gebildetem HTML auch dort, wo Regex fehlschlägt. –

Ich habe versucht HTML Parser, die tot ist einfach.

Quelle

2008-08-25 18:55:11 pek

Ich habe HTML-Parser für ein Projekt verwendet und es funktionierte genau wie erwartet –

, aber es gibt nicht viele Tutorials zur Verfügung ... – Lily

Ich habe eine Menge JavaScript-Snippets (und Elementattribute) in meinem angeblich "Textknoten schleichen bemerkt "Extraktionen. Es gab auch Fälle, in denen falsch formatiertes HTML den gesamten Analysevorgang fehlschlagen ließ. Ich möchte also die htmlparser-Bibliothek in meinem eigenen Projekt durch etwas besseres ersetzen. – benjismith

Müssen Sie eine vollständige Analyse des HTML durchführen? Wenn Sie nur nach bestimmten Werten innerhalb des Inhalts suchen (ein spezifisches Tag/Parameter), dann könnte ein einfacher regulärer Ausdruck genügen und könnte sehr viel schneller sein.

Quelle

2008-08-25 18:56:36 Herms

Welche HTML-Parsing-Bibliotheken empfehlen Sie in Java

Antwort

Verwandte Themen