Ich versuche zu kratzen this webpage. Dieser Code funktioniert:Python: Was wird zurückgegeben, wenn ich requests.get ('url') und print r.text verwende?
import requests
header = {
'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:32.0) Gecko/20100101 Firefox/32.0',
}
r = requests.get('http://www.machinefinder.com/ww/en-US/categories/used-drawn-planters', headers=header)
print r.text
aber ich bin mir nicht sicher, was der Text, den es wirklich zurückgibt. Ich wünschte, es wäre JSON, damit ich andere Beispiele kopieren könnte, die JSON parsen.
Hinweis: meine Arbeit Sicherheit blockiert die Webseite und sagt: „Illegale Web Browser“, wenn ich
header={
'Content-Type': 'application/json;charset=UTF-8',
}
verwenden, weshalb ich Firefox stattdessen bin mit.
Überprüfen Sie 'r.headers ['content-type']' für den Typ. Wahrscheinlich "text/html" wenn ich raten musste. – kindall
Sie können je nach Anfrage json zurück –