Ich möchte den Quellcode einer HTML-Seite erhalten, aber es hat ein JS-Skript, das die Daten dynamisch lädt und den empfangenen Inhalt an die Seite anfügt.Wie analysiere ich eine HTML-Seite, nachdem ich darauf gewartet habe, dass JS den Inhalt lädt?
Ich verwende jsoup, um HTML zu analysieren, aber es gibt nur den Inhalt vor der JS-Ausführung zurück, so dass ich die dynamisch geladenen Daten nicht erhalte.
Wie kann ich den Quellcode nach der Skriptausführung mit irgendeinem Framework, CLI usw. erhalten?
so etwas wie document.getElementById ("elementID") Outerhtml nachdem das Element gerendert wird.. – Bindrid
Zeigen Sie, wie dieses JS-Skript aussieht. –
Am besten ist es, es durch Phantom zu laufen und Phantoms 'page.content' zu verwenden. –