2016-08-24 2 views
-1

Ich bin neu im Web Scraping und bisher kann ich nur grundlegende HTML-Seite mit Python schöne Suppe kratzen. Was ich will, ist die Informationen zu diesem page extrahieren. Insbesondere würde Ich mag die folgenden Daten von allen Gefährten bekommen (etwa 700 von ihnen)Wie kratze ich eine Seite mit Javascript-Effekten

  • Name
  • Hintergrund
  • Einblick Projekt
  • aktuellen Arbeitgeber

jedoch, dass Seite wird von Javascript gerendert und die gewünschten Informationen werden nur als separate Box angezeigt, wenn mouseover-Ereignis auf jedem Fellows-Bild ausgelöst wird.

Wie extrahiert man in diesem Fall Text? Jede Information (Bücher, Web-Ressourcen) wird geschätzt. Python-Lösungen werden nach Möglichkeit bevorzugt. Danke vielmals.

+0

Ich habe JavaScript auf der Website deaktiviert und die Tool-Tipps werden weiterhin angezeigt. Der Inhalt ist da, er ist nur über CSS versteckt. –

Antwort

0

Überprüfen Sie die Seitenquelle der Website.

Die Information ist bereits im DOM enthalten, nur mit CSS versteckt. Auf den ersten Blick scheint die JavaScript-Logik nur CSS-Manipulationen durchzuführen.

Die Tatsache, dass die Informationen von CSS ausgeblendet werden, hindert Sie nicht daran, sie mithilfe eines Web-Scraping-Tools von der Quelle zu entfernen.

Verwandte Themen