2016-03-18 3 views
5

Nach dem Absenden einer COMPSs-Anwendung habe ich folgende Fehlermeldung erhalten und die Anwendung wird nicht ausgeführt.COMPSs - Knoten bereits gefüllt Fehler

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss 
--project=/tmp/1668183.tmpdir/project_1458303603.xml 
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml 
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc 
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc 

-------------------------------------------------------------------------- 
All nodes which are allocated for this job are already filled. 
-------------------------------------------------------------------------- 

Ich verwende COMPSs 1.3.

Warum passiert das?

+0

Könnten Sie weitere Informationen über welchen Befehl haben Sie ausgeführt? –

+0

Ich habe meine Frage bearbeitet, um den Befehl aufzunehmen. –

Antwort

5

Sie versuchen, Master und Worker in demselben Knoten auszuführen. COMPSs 1.3 im Cluster mit dem NIO-Adapter (Standardoption) verwendet mpirun, um die Master- und Worker-Prozesse in den verschiedenen Knoten des Clusters zu erzeugen, und das im Cluster installierte mpirun erlaubt dies nicht.

Die Optionen, es zu lösen sind die folgenden:

  1. Sie geben nicht --tasks_in_master = im enqueue_compss Befehl.
  2. Sie mit GAT-Adapter ausführen (--comm = integratedtoolkit.gat.master.GATAdaptor), die mehr Aufwand

Weiter COMPSs Software-Release wird den Laich-Befehl verwenden, die in den verschiedenen Cluster-Ressource-Manager verfügbar ist (wie blaunch, srun), die dieses Problem lösen müssen

+2

Perfekt! Ich habe mein Problem mit dem GAT Adapter gelöst. Da ich jedoch weiß, dass der NIO-Adapter effizienter ist, werde ich COMPSs aktualisieren, sobald die nächste Version veröffentlicht wird. Danke für Ihre schnelle und präzise Antwort. –

Verwandte Themen