Ich brauche Selen für einen Scraping-Job mit einem Haufen Javascript-Webseiten generiert. Ich kann mehrere Instanzen des Webdrivers gleichzeitig öffnen und die Websites mithilfe der Warteschlange an die Instanzen übergeben.Threading oder Multiprocessing für Webscraping mit Selen
Es kann jedoch in mehrfacher Weise durchgeführt werden. Ich habe sowohl mit dem Threading-Modul als auch mit den Pool- und Prozesswegen aus dem Multiprocessing-Modul experimentiert.
Alle arbeiten und werden den Job ziemlich schnell erledigen.
Das lässt mich fragen: Welches Modul ist in einer solchen Situation bevorzugt?
Threads sind einfacher zu koordinieren und verwenden weniger Speicher als Prozesse. Aber es liegt an dir, es gibt keinen bevorzugten Weg. – freakish