MoreInfo
en lugar del comando resume hay que poner diagnose -n
Para un mejor aprovechamiento de los recursos del cluster
Con el comando resume -n, podemos tener acceso a la información de los recursos disponibles, para los cálculos en batch, en una cola especifica.
-
- resume -n | grep estado | grep cola*
estado = Idle, Busy y Running cola = Nombre de la cola
Parte de la Salida
Nodo Estado Pro Memoria Dis Swap S.O. Arqut Part Load Cola ================ ====== === =========== === =========== ==== ===== ====== === ==== === ================ ========= ====== trueno42.csic.es Busy 0:8 15624:16024 1:1 23200:23200 1.00 linux [ NONE] DEF 4.08 005 [exe-x86_64_0:8] [DEFAULT] [NONE]
Los datos en formato xxx:yyy especifican disponible/definidos
Con el Estado [Idle,Running, Busy] podemos consultar los procesadores disponibles para un trabajo determinado.
Ejemplo:
Tenemos un trabajo que utiliza 4 procesadores y queremos que se ejecute en la cola exe-86_64. Para evitar que el trabajo, según se envié, se quede en espera, utilizaremos:
resume -n | grep Running | grep exe-x86_64
En este caso no tenemos ningun nodo completamente libre, pero si tenemos 3 nodos con procesadores libres
trueno00.csic.es Running 2:4 24:16024 1:1 5367:6144 1.00 linux [NONE] DEF 9.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE] trueno01.csic.es Running 2:4 16024:16024 1:1 22034:22034 1.00 linux [NONE] DEF 2.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE] trueno03.csic.es Running 1:4 16024:16024 1:1 22049:22049 1.00 linux [NONE] DEF 1.00 002 [heavy_3:4][exe-x86_64_0:1] [DEFAULT] [NONE]
Si enviamos el trabajo con qsub -q exe-x86_64 -l nodes=1:ppn=4 script se nos quedará en espera hasta que se libere completamente un nodo de 4 cores
En cambio, si lo enviamos *qsub -q exe-x86_64 -l nodes=2:ppn=2 script *ocuparía los dos nodos con 2 procesadores libres y se ejecutaría inmediatamente
-- Main.RobertoMarabini - 16 Oct 2008