Ich habe ein Web-Scrape geschrieben, um Google Gelehrte Informationen zu extrahieren. Allerdings sind alle zweckdienlichen Tools wie urllib2 pr-Anforderungen fehlgeschlagen. Und es gab mir 503 Fehlercode.So öffnen Sie eine URL und extrahieren Informationen in Python
Und ich bin auf der Suche nach einem alternativen Weg, um die Informationen zu extrahieren. Ist das möglich, kann ich das Programm die URL beim Browsen öffnen lassen und dann Informationen extrahieren.
Zum Beispiel ist es ein Link:
'http://scholar.google.com/citations?user=lTCxlGYAAAAJ&hl=en'
Und wie es weitergeht H-Index zu erhalten, etc?
http://docs.python-guide.org/en/latest/scenarios/scrape/ – SteveJ
Nein, es funktioniert nicht. Immer noch "503" -Fehler. – Daniel