ich einige HTML, um zu analysieren, wollen usw. die Werte einiger Attribute/Tags zu findenWelche HTML-Parsing-Bibliotheken empfehlen Sie in Java
Welche HTML-Parser Sie empfehlen? Irgendwelche Vor- und Nachteile?
ich einige HTML, um zu analysieren, wollen usw. die Werte einiger Attribute/Tags zu findenWelche HTML-Parsing-Bibliotheken empfehlen Sie in Java
Welche HTML-Parser Sie empfehlen? Irgendwelche Vor- und Nachteile?
Ich habe versucht HTML Parser, die tot ist einfach.
Ich habe HTML-Parser für ein Projekt verwendet und es funktionierte genau wie erwartet –
, aber es gibt nicht viele Tutorials zur Verfügung ... – Lily
Ich habe eine Menge JavaScript-Snippets (und Elementattribute) in meinem angeblich "Textknoten schleichen bemerkt "Extraktionen. Es gab auch Fälle, in denen falsch formatiertes HTML den gesamten Analysevorgang fehlschlagen ließ. Ich möchte also die htmlparser-Bibliothek in meinem eigenen Projekt durch etwas besseres ersetzen. – benjismith
Müssen Sie eine vollständige Analyse des HTML durchführen? Wenn Sie nur nach bestimmten Werten innerhalb des Inhalts suchen (ein spezifisches Tag/Parameter), dann könnte ein einfacher regulärer Ausdruck genügen und könnte sehr viel schneller sein.
XPath ist der Weg für das HTML-Parsing, es hilft im Falle von schlechtem gebildetem HTML auch dort, wo Regex fehlschlägt. –