perf
ist ein Leistungsanalyse-Tool, das Hardware- und Softwareereignisse melden kann. Ich versuche, es mit einer MPI-Anwendung auszuführen, um zu erfahren, wie viel Zeit die Anwendung in jedem Kern für Datenübertragungen und Rechenoperationen aufwendet.Ausführen von Perf mit einer MPI-Anwendung
Normalerweise würde ich meine Bewerbung mit
mpirun -np $NUMBER_OF_CORES app_name
laufen Und es würde auf mehrere Kerne erzeugen oder möglicherweise mehrere Knoten. Ist es möglich, perf
oben hinzuzufügen? Ich habe versucht
perf stat mpirun -np $NUMBER_OF_CORES app_name
Aber die Ausgabe für diese sieht aus wie eine Art Aggregat von mpirun. Gibt es eine Möglichkeit, Perf-Typ-Daten von jedem Kern zu sammeln?