Skip to content

MoreInfo

Adrian Quintana edited this page Dec 11, 2017 · 1 revision

en lugar del comando resume hay que poner diagnose -n

Para un mejor aprovechamiento de los recursos del cluster

Con el comando resume -n, podemos tener acceso a la información de los recursos disponibles, para los cálculos en batch, en una cola especifica.

    • resume -n | grep estado | grep cola*

estado = Idle, Busy y Running cola = Nombre de la cola

Parte de la Salida

Nodo Estado Pro Memoria Dis Swap S.O. Arqut Part Load Cola ================ ====== === =========== === =========== ==== ===== ====== === ==== === ================ ========= ====== trueno42.csic.es Busy 0:8 15624:16024 1:1 23200:23200 1.00 linux [ NONE] DEF 4.08 005 [exe-x86_64_0:8] [DEFAULT] [NONE]

Los datos en formato xxx:yyy especifican disponible/definidos

Con el Estado [Idle,Running, Busy] podemos consultar los procesadores disponibles para un trabajo determinado.

Ejemplo:

Tenemos un trabajo que utiliza 4 procesadores y queremos que se ejecute en la cola exe-86_64. Para evitar que el trabajo, según se envié, se quede en espera, utilizaremos:

resume -n | grep Running | grep exe-x86_64

En este caso no tenemos ningun nodo completamente libre, pero si tenemos 3 nodos con procesadores libres

trueno00.csic.es Running 2:4 24:16024 1:1 5367:6144 1.00 linux [NONE] DEF 9.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE] trueno01.csic.es Running 2:4 16024:16024 1:1 22034:22034 1.00 linux [NONE] DEF 2.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE] trueno03.csic.es Running 1:4 16024:16024 1:1 22049:22049 1.00 linux [NONE] DEF 1.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE]

Si enviamos el trabajo con qsub -q exe-x86_64 -l nodes=1:ppn=4 script se nos quedará en espera hasta que se libere completamente un nodo de 4 cores

En cambio, si lo enviamos *qsub -q exe-x86_64 -l nodes=2:ppn=2 script *ocuparía los dos nodos con 2 procesadores libres y se ejecutaría inmediatamente

-- Main.RobertoMarabini - 16 Oct 2008

Clone this wiki locally