2016-06-17 5 views
0

Ich versuche, Daten von einer Seite mit ähnlichem Inhalt (Shopping-Website) mit HtmlAgility-Pack zu kratzen.Wie scrape Daten auf einer Seite mit jquery Button klicken Sie mit HtmlAgility Pack

Es gibt eine Schaltfläche, um weitere Elemente zu laden, die aus einem Tag bestehen. Beim Klicken lädt es mehr Elemente auf derselben Seite.

Wenn es mit Tag entworfen wird, dann werde ich die nächsten Elemente mit dem href Attribut URL im Tag bekommen und auch ich werde neue Seite für die neuen nächsten Elemente geladen werden, also kein Problem.

Aber hier keine neue URL und Elemente auf der gleichen Seite geladen.

Gibt es eine Möglichkeit, diese Funktionalität zu implementieren? Wie löse ich diese Taste mehr, um mehr Gegenstände zu bekommen?

Antwort

0

HtmlAgilityPack ist ein HTML-Parser allein, es kann nur ein statisches HTML-Dokument analysieren. Was Sie wollen, kann mit selenium web driver erreicht werden. Eine andere Möglichkeit ist - wenn die Anzahl der Aktionen zum Laden von Elementen so ist, dass Sie das Laden manuell durchführen können - tun Sie dies und speichern Sie das resultierende HTML lokal und verwenden Sie danach HtmlAgiliyPack um das statische HTML zu analysieren, das Sie lokal gespeichert haben Parsen der HTTP-Antwort).

Teilen Sie den Link der Website, über die Sie sprechen, damit ich einige Codeschnipsel zum Beispiel hinzufügen kann.

+0

Ha, danke für den Vorschlag. Ich versuche, für diese Website wie jabong.com oder myntra.com oder amazon.com oder snapdeal.com oder flipkart.com zu tun. Alle sind vom gleichen Typ, um Elemente (jQuery oder Javascript) zu laden. Wenige Websites unter diesen bieten APIs, die wir verwenden können, um Daten zu erhalten. Aber ich möchte lernen, wie Scraping für Javascript oder jQuery oder Ajax anzuwenden. Schauen Sie sich die Snippets an und teilen Sie sie mit, wenn Sie einige codieren. – Louis

+0

Ich fragte mich auch, ob es irgendwelche Pakete gibt, die von Python verwendet werden. Weil ich gehört habe, Python ist der beste Weg, um durch Seiten zu scrollen und zu kratzen. Ich meine Google Suche macht es. – Louis

+0

Ja, Python ist in der Scraping-Community hoch angesehen. Ich denke, dass es Stärke nicht nur im Scraping selbst ist, sondern in Bibliotheken, die maschinelle Lernalgorithmen und ähnliches zur Verfügung stellen, die letztendlich in einem skalierbaren und breiten Scraper unverzichtbar sind. Eine berühmte Bibliothek ist Scrapy, andere ist BeautifulSoup. Ich bin im selben Boot wie du, ich denke manchmal über Python nach. – Veverke

Verwandte Themen