Ich arbeite an einem Projekt, wo ich hoffe, Daten von Google Scholar zu kratzen. Ich möchte alle Autoren, die in einer Kategorie markiert sind (z. B. Anaphylaxis), abkratzen und deren Anzahl an Zitaten, h-Index und i-10-Index in einer CSV-Datei speichern. Ich bin mir jedoch nicht sicher, wie dies zu tun ist, da Google Scholar über keine API verfügt. Ich verstehe, dass ich einen Schaber wie schöne Suppe verwenden kann, bin aber unsicher, wie man die Daten abschabt, ohne blockiert zu werden.Scraping Autoren basierend auf Tags von Google Scholar
Also, meine Frage ist, wie kann ich bs4 verwenden, um alle Autoren als Anaphylaxis und Zitaten, h-Index und i-10-Index jedes Autors in einer CSV-Datei gespeichert zu speichern.
Also, was ist die Frage? – Peaceful
@Peaceful Habe aktualisiert um zu klären – user7339949
Klingt ziemlich interessant! Ich habe keine Antwort, vor allem nicht blockiert zu werden. Vielleicht haben Sie https://pypi.python.org/pypi/scholarly/0.2.2 noch nicht gesehen? Der Code könnte auf diesen Ergebnissen basieren. –