Ich brauche einige numpy Berechnung auf 5000 Dateien parallel mit Python. Ich habe die sequentielle Einzelmaschinenversion bereits implementiert. Was wäre der einfachste Weg, um den Code parallel zu betreiben (zB mit einem ec2-Cluster)? Soll ich meinen eigenen Aufgabenplaner und Jobverteilungscode schreiben?laufenden Python-Code auf verteilten Cluster
1
A
Antwort
1
Sie können sehen, pscheduler Python-Modul. Damit können Sie Ihre Jobs in eine Warteschlange stellen und sie nacheinander ausführen. Die Anzahl der gleichzeitigen Prozesse hängt von den verfügbaren CPU-Kernen ab. Mit diesem Programm können Sie Ihre Aufträge problemlos auf Remote-Computer hochskalieren und übertragen, aber dann müssen alle Remote-Computer NFS verwenden.
Ich werde glücklich sein, Ihnen weiter zu helfen.
Verwandte Themen
- 1. Zugriff auf Dateien im verteilten hadoop-Cache
- 2. Sphinx sql_query_killlist auf einem verteilten Remote-Index
- 3. Laravel-Zeitpläne auf verteilten App
- 4. Wie wird KUBE_ENABLE_INSECURE_REGISTRY = true für einen laufenden Kubernetes-Cluster festgelegt?
- 5. Gibt es eine Möglichkeit, einem laufenden Hadoop-Cluster Knoten hinzuzufügen?
- 6. Liegt das virtuelle Dateisystem auf verteilten Dateisystemen?
- 7. AWS EMR führen "bootstrap" Skript auf allen bereits laufenden Maschinen in Cluster
- 8. Ausführen eines verteilten Spark Job Servers mit mehreren Arbeitern in einem eigenständigen Spark-Cluster
- 9. Kafka im verteilten System
- 10. EMR-Cluster aktualisieren?
- 11. Leistungsproblem mit verteilten Abfragen
- 12. Entscheidung in verteilten Anwendungen
- 13. Enumerating Kombinationen in einer verteilten Art
- 14. Stoppen einer laufenden Spark-Anwendung
- 15. Gibt es eine Möglichkeit, einen verteilten Dateidownload über einen Hadoop-Cluster durchzuführen?
- 16. Wie wird eine neue Master-Datenbank in einem geografisch verteilten MongoDB-Cluster zugewiesen?
- 17. So entwerfen Sie einen verteilten node.js Webserver
- 18. Jmeter im verteilten Modus
- 19. Wie duplizierte Werte im verteilten System entfernen?
- 20. Pyspark auf Garn-Cluster-Modus
- 21. Cluster basierend auf der Entfernungsmatrix
- 22. Redis auf Windows-Cluster-Setup
- 23. APIM191 - "Statusbericht - nicht gefunden" In einem verteilten Setup.
- 24. Schlüsselwortgesteuerte Testautomatisierung in verteilten Systemen
- 25. verteilten Shared Memory oder nicht?
- 26. Merging Eingänge in verteilten Anwendung
- 27. "Real" Objektverweise im verteilten Cache?
- 28. Cassandra-Snapshot (aus 3-Node-Cluster) auf Entwickler oder Test-Cluster (1-Node-Cluster) wiederherstellen
- 29. Mit verteilten Komponenten sicher sprechen
- 30. TransactionScope: Vermeiden von verteilten Transaktionen