Ich versuche, eine Chrome-Erweiterung zu erstellen, um alle Website-Daten zu erfassen. In Tutorials spricht man oft davon, eine Seite zu "modifizieren", aber es scheint subtil zu implizieren, dass man keine ganze Seite bekommen kann.Erstellen einer Chrome-Erweiterung zum Abrufen aller Seiten HTML
Ich fand eine chrome API, die pageCapture ist, die ermöglicht, dass ALLE Ressourcen von einer Seite gespeichert werden. Ich gehe davon aus, dass ich den HTML-Code finden und danach crawlen kann - das ist nicht wünschenswert, da dafür viel mehr Platz und Overhead benötigt wird.
Ich würde es vorziehen, wenn es eine Möglichkeit gäbe, den aktiven Tab zu crawlen. The tab API können Sie die aktuelle Registerkarte abrufen, aber die aktuelle Registerkarte scheint kein Inhaltsattribut zu haben.
Es muss einen besseren Weg geben, das zu tun. Wer weiß, wie man den aktuellen HTML-Code bekommt?
Mögliche Duplikat [den HTML-Quellcode der aktuellen Seite von Chrome-Erweiterung Erste] (http://stackoverflow.com/questions/11684454/getting-the-source-html-of-the-current -page-from-chrome-extension) –
Ich sollte sagen, dass ich eine Content-Skript-Lösung für das Problem suche, ich werde aktualisieren, wenn ich es erstellt habe. – jQwierdy