Khipu
HomeGitHubToggle Dark/Light/Auto modeToggle Dark/Light/Auto modeToggle Dark/Light/Auto modeVolver a Inicio

Enviar Jobs

Comandos básicos de Slurm

A continuación se muestra una lista con los comandos de Slurm más usados:

  • Para enviar un batch job a la cola de slurm ejecutaremos sbatch.
sbatch ejemplo.sh
  • Para listar los jobs que he enviado a la cola usaremos squeue.
squeue --me
  • Para cancelar un job en ejecución usando su job ID emplearemos scancel.
scancel 78910
  • Para revisar el estatus de un job usaremos sacct y le pasaremos un job ID.
sacct  -j 78910
  • Para revisar cuan eficientemente un job se ejecuta, emplearemos seff acompañado del job ID.
seff 78910
  • Para ejecutar un job de manera interactiva emplearemos srun
srun --pty -t 2:00:00 --mem=8G -p interactive bash

Job request más comunes

Las siguientes opciones modifican el tamaño, largo y el comportamiento del job que se envía. Estos pueden especificarse llamando a srun o sbatch, o dentro de un batch job. Si se especifican las opciones en los argumentos de sbatch y en el script del batch job al mismo tiempo, las opciones pasadas al comando sbatch serán las que se tomarán en cuenta. Si no se especifica valor para alguna de las opciones, los valores por defecto serán los que se empleen.

Opción LargaOpción CortaValor por DefectoDescripción
--job-name-JNombre del archivoNombre de job personalizado.
--output-o"slurm-%j.out"Nombre del archivo donde se guadará la salida stdout o stderr. Mayores patrones de nombre aquí.
--error-eSe escribe en el mismo archivo del --outputNombre del archivo donde se guadarán los logs de ;ps errores.
--partition-pVaría de acuerdo al clusterSeñala la partición donde se va a ejecutar el job.
--account-AEl nombre de su grupoEspecifica si se tiene acceso a múltiples particiones privadas.
--time-tVaría de acuerda a la particiónLímite de tiempo para el job en el formato D-HH:MM:SS. Por ejemplo, -t 1- es un día de ejecución y -t 4:00:00 son 4 horas.
--nodes-N1Número total de nodos.
--ntasks-n1Número de tareas (workers MPI).
--ntasks-per-nodeEl scheduler lo decideNúmero de tareas por nodo.
--cpus-per-task-c1Número de CPUs para cada tarea. Use esto para threads/cores en un job de nodo único.
--mem-per-cpu5GCantidad de memoria RAM requerida por CPU en MiB. Si se especifica en GiB usar G(ej. 10GB).
--memMemoria pedida por nodo en MiB. Si se especifica en GiB usar G(ej. 10GB).
--gpusGUsado para pedir GPUs.
--constraintCRestricciones a las características del nodo. Para limitar los tipos de nodos a ejecutarse.
--mail-userTu email de UTECDirección de correo a donde enviar notificaciones del job.
--mail-typeNingunaEnvía un mail cada vez que un job cambia de estado. Utilice la opción ALL para recibir notificaciones al iniciar y terminar un job. Opciones disponibles ALL, BEGIN, END, FAIL, NONE