Ich benutze python3 urllib3, um einen Crawler zu bauen, um mehrere URLs herunterzuladen.Python3 urllib3 crawler - kann max Verbindungen zu einer einzelnen Domäne nicht beschränken
Auf meiner Haupttätigkeit schaffen i 20 Threads, dass das gleiche (eins) Instanz meine Downloader
-Klasse, die eine Instanz von PoolManager
verwendet:
def __init__(self):
self.manager = PoolManager(num_pools=20)
Ich habe versucht, über die gleiche URL einreichen und wieder und ich sehe im Log, dass es viele Verbindungen zu der gleichen Domain schafft. Ich habe versucht, die Anzahl der Pools zu begrenzen (num_pools=1
) und es schafft immer noch mehrere Verbindungen zu derselben URL. Auf der Dokumentation habe ich verstanden, dass die PoolManager
eine neue Verbindung erstellt, wenn die anderen Verbindungen zu der gleichen Domäne verwendet werden.
Ich möchte die Anzahl der Verbindung zu einer einzigen Domäne beschränken. Die Verwendung von bis zu zwei verschiedenen Verbindungen wird von einem normalen Browser verwendet, damit er sicher ist. Wie kann ich das machen?