2016-10-09 12 views
0

1) Ich habe einen Link im Browser geöffnet. (Angenommen, My Facebook FriendsList)Quelltext im Browser anzeigen und nicht alle Inhalte anzeigen, die im Browser geladen sind

2) Ein Siehe die View-Quelle für die Seite. (Ich kann sehen, dass rund 20 Namen kommen in der Quelle - zuerst geladen)

3) Auch wenn ich Scroll nach unten und alle Freunde Liste geladen und überprüfen Sie die View Source es gibt mir gleich 20 Personen dh keine Änderung in die View-Quelle, selbst wenn die Seite mehr Inhalt als vorher hat.

4) Es kann Ajax Anfrage sein oder kann Javascript sein, aber wie bekomme ich den vollständigen Quellcode für die Seite.

Lassen Sie mich wissen, wenn mehr Informationen benötigt werden.

+0

Sie können nicht. Die Daten werden dynamisch geladen, wenn Sie sich auf der Site befinden und Sie ein Widget scrollen. Wenn Sie Daten von Facebook benötigen, müssen Sie die Facebook API verwenden – Franco

+0

Auch mit der Facebook-API - Ich bin nicht in der Lage, die vollständige Freundesliste zu bekommen - Es gibt nur wenige sagen Nur diese Leute haben Ihre Apps registriert. Ich benutze User Access Token – wadhwa94

Antwort

0

Wenn dynamische Daten analysiert werden sollen, sind Developer Tools von Browsern praktisch.

Verwenden Sie das Chrome-Entwicklungstool. (Klicken Sie einfach mit der rechten Maustaste auf eine beliebige dynamische Seite und dann auf Inspizieren.)

Bearbeiten: Verwenden Sie für dynamisches Seiten-Scrapping PhantomJS mit NodeJs und importieren Sie dann in Ihr Python-Skript.

+0

Willst du es mit Python bekommen? – wadhwa94

Verwandte Themen