Ich verwende urllib.urlretrieve
in Python zum Herunterladen von Websites. Obwohl einige Websites nicht wollen, dass ich sie herunterlade, es sei denn, sie haben einen richtigen Referrer von ihrer eigenen Website. Kennt irgendjemand eine Art, wie ich einen Referrer in einer der Python-Bibliotheken oder eine externe setzen kann?Einstellung Verweis URL in Python urllib.urlretrieve
6
A
Antwort
11
import urllib2
req = urllib2.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib2.urlopen(req)
3
urllib
macht es schwierig, beliebige Header mit der Anfrage zu senden; Sie könnten urllib2 verwenden, mit dem Sie ein Request Objekt mit beliebigen Headern erstellen und senden können (einschließlich natürlich - leider leider buchstabiert ;-) - Referer
). Bietet urlretrieve
nicht an, aber es ist einfach, nur urlopen
wie Sie mit und das resultierende dateiähnliche Objekt auf die Festplatte kopieren, wenn Sie möchten (direkt oder über shutil Funktionen).
3
auch angenommen, urllib2
mit build_opener
verwenden Sie können dies tun:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('Referer', 'http://www.python.org/')]
opener.open('http://www.example.com/')
Verwandte Themen
- 1. Benötigen urllib.urlretrieve und urllib2.OpenerDirector zusammen
- 2. Einstellung Zeitzone in Python
- 3. Chrome.History erhalten Verweis URL (JS)
- 4. Einstellung Blob Erkennungsparameter in Python
- 5. urllib.urlretrieve lässt GUI-Fenster nicht reagieren
- 6. Einstellung qml-Eigenschaft von Python?
- 7. Einstellung Gruppenberechtigungen mit Python
- 8. Matplotlib Grid-Einstellung (Python)
- 9. Store Verweis auf primitiven Typ in Python?
- 10. Smarty-Einstellung nav href basierend auf URL
- 11. Einstellung Bildlaufleiste in Tkinter Baum Widget Python
- 12. Einstellung System Python Pfad in OSX
- 13. Einstellung locale und String-Modul in Python
- 14. Einstellung der Standardwerte von Argumenten in Python
- 15. Python übergeben Instanz der Klasse durch Verweis
- 16. Python: undefinierter Verweis auf `_imp __Py_InitModule4 '
- 17. Ändern der Verweis auf Funktion in Laufzeit in Python
- 18. wenn nicht Zeile: Raise EOFError bei der Verwendung von urllib.urlretrieve
- 19. Unterschiede Einstellung Inhalt in Forms.WebBrowser Kontrolle über Documenttext vs. URL
- 20. Einstellung Timeout für neue URL (...) Text in Groovy/Grails
- 21. Kanonische URL in Python vergleichen?
- 22. verbinden in Python mit url
- 23. Werden diese Argumente in Python nach Wert oder Verweis übergeben?
- 24. Einen Verweis auf eine Referenz in Python speichern?
- 25. Verarbeiten von Daten nach Verweis oder nach Wert in Python
- 26. Wie einen Verweis auf aktuelle Modul Attribute in Python bekommen
- 27. Python Seaborn Matplotlib Einstellung Linienstil als Legende
- 28. Einstellung Argtype für Python Callback-Funktion
- 29. Organisieren Python-Projekt mit der Einstellung Umgebung
- 30. Einstellung Höhen einzelner Nebenhandlungen in matplotlib in Python