Diferencia entre revisiones de «Cancelación de Tareas»

De NLHPC
 
(No se muestran 10 ediciones intermedias de otro usuario)
Línea 3: Línea 3:


== Por uso de Memoria ==
== Por uso de Memoria ==
En el caso de que la memoria reservada por core en los nodos slims sea mayor a 1000MB, se activa el proceso de verificación del uso de memoria RAM para su tarea para garantizar al menos 70% de uso correcto de todo el recurso reservado. Esta condición será revisada desde el inicio de la tarea y si no alcanza el mencionado límite, la tarea será cancelada de forma automática.
En el caso de que la memoria reservada por core en los nodos main sea mayor a '''1000MB''', se activa el proceso de verificación del uso de memoria RAM para su tarea para garantizar al menos '''70%''' de uso correcto de todo el recurso reservado. Esta condición será revisada desde el inicio de la tarea y si no alcanza el mencionado límite, la tarea será cancelada de forma automática.


Cabe destacar que si su tarea necesita reservar 2300MB por core, usted debe hacer uso de la memoria RAM asignada por cada CPU.
Cabe destacar que si su tarea necesita reservar '''2300MB''' por core, usted debe hacer uso de la memoria RAM asignada por cada CPU.


Por lo anterior, el siguiente ejemplo muestra el uso de 1 proceso con 1 CPU con 2300M de RAM asignada.
Por lo anterior, el siguiente ejemplo muestra el uso de 1 proceso con 1 CPU con 2300M de RAM asignada.
 
<pre>
#SBATCH -p slims
#SBATCH -p main
#SBATCH -n 1
#SBATCH -n 1
#SBATCH -c 1
#SBATCH -c 1
#SBATCH --mem-per-cpu=2300
#SBATCH --mem-per-cpu=2300
Puede visitar nuestro Generador de Scripts en https://wiki.nlhpc.cl/Generador_Scripts
</pre>
 
Puede visitar nuestro [https://wiki.nlhpc.cl/Generador_Scripts Generador de Scripts]


== Ejemplo ==
== Ejemplo ==
En el siguiente caso se hace una reserva de 11 cores y 48G de memoria:
En el siguiente caso se hace una reserva de 11 cores y 48G de memoria:


400px-Cpu subutilizacion.png
[[Archivo:Cpu_subutilizacion.png|no]]
 


Se puede observar que el uso efectivo es de solo 1 core a la vez.
Se puede observar que el uso efectivo es de solo 1 core a la vez.


400px-Memoria subutilizacion.png
[[Archivo:Memoria subutilizacion.png|no]]


Además, SLURM asignó por core al menos (48000/11) 4300M de memoria, cuando el uso de la tarea solo fue de 5M (los valores del gráfico se presentan en bytes).
Además, SLURM asignó por core al menos (48000/11) 4300M de memoria, cuando el uso de la tarea solo fue de 5M (los valores del gráfico se presentan en bytes).


== Referencias ==
== Referencias ==
man sbatch
* [https://slurm.schedmd.com/sbatch.html man sbatch]
Monitoreo De Tareas
* [https://wiki.nlhpc.cl/Monitoreo Monitoreo De Tareas]

Revisión actual - 21:43 29 abr 2024

Por uso de CPU

Procederemos a cancelar la tarea en el caso de que la mitad del total de cores reservados muestre un porcentaje de uso menor o igual a un 30% en un lapso de 4 horas.

Por uso de Memoria

En el caso de que la memoria reservada por core en los nodos main sea mayor a 1000MB, se activa el proceso de verificación del uso de memoria RAM para su tarea para garantizar al menos 70% de uso correcto de todo el recurso reservado. Esta condición será revisada desde el inicio de la tarea y si no alcanza el mencionado límite, la tarea será cancelada de forma automática.

Cabe destacar que si su tarea necesita reservar 2300MB por core, usted debe hacer uso de la memoria RAM asignada por cada CPU.

Por lo anterior, el siguiente ejemplo muestra el uso de 1 proceso con 1 CPU con 2300M de RAM asignada.

#SBATCH -p main
#SBATCH -n 1
#SBATCH -c 1
#SBATCH --mem-per-cpu=2300

Puede visitar nuestro Generador de Scripts

Ejemplo

En el siguiente caso se hace una reserva de 11 cores y 48G de memoria:

Cpu subutilizacion.png


Se puede observar que el uso efectivo es de solo 1 core a la vez.

Memoria subutilizacion.png

Además, SLURM asignó por core al menos (48000/11) 4300M de memoria, cuando el uso de la tarea solo fue de 5M (los valores del gráfico se presentan en bytes).

Referencias