Ich habe einen Code in Bluehive ausgeführt. Der Code hat einen Parameter N. Wenn N klein ist, läuft der Code einwandfrei. Aber für etwas große N (zB N = 10) wird der Code für Stunden laufen und am Ende bin ich immer folgende Fehlermeldung:slurmstepd: Fehler: Überschritt Speichergrenze überschritten
slurmstepd: error: Exceeded step memory limit at some point.
Die Batch-Datei, die ich anmelde hat den folgenden Code:
#!/bin/bash
#SBATCH -o log.%a.txt -t 3-01:01:00
#SBATCH --mem-per-cpu=1gb
#SBATCH -c 4
#SBATCH --gres=gpu:1
#SBATCH -J Ankani
#SBATCH -a 1-2
python run.py $SLURM_ARRAY_TASK_ID
Ich bin genug Speicher für den Code zuweisen. Aber immer noch den Fehler
"slurmstepd: error: Exceeded step memory limit at some point."
Kann jemand helfen?