run_jobs.py

import os
import utils
from config import RESULTS_DIR_LOCAL, RESULTS_DIR_REMOTE

jobs = [

    # TOPIC AGNOSTIC MODELS -------------------------------------------------------------------------------
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20,
    #  'use_pretrained_embeddings': '', 'dropout': 0.4, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20,
    #   'use_pretrained_embeddings': '', 'dropout': 0.2, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20,
    #   'use_pretrained_embeddings': '', 'dropout': 0.0, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20,
    #  'use_pretrained_embeddings': '', 'dropout': 0.2, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 100, 'n_layers_rnn': 2, 'sentence_len': 20,
    #  'use_pretrained_embeddings': '', 'dropout': 0.2, 'bidirectional': '', 'glove_dir':'data/glove.6B/glove.6B.100d.txt'},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 300, 'n_layers_rnn': 2, 'sentence_len': 20,
    #  'use_pretrained_embeddings': '', 'dropout': 0.2, 'bidirectional': '', 'glove_dir':'data/glove.6B/glove.6B.100d.txt'},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20, 'dropout': 0.2, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20,
    #  'reuse_pred':'', 'use_pretrained_embeddings': '', 'dropout': 0.4, 'bidirectional': ''},
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn', 'batch_size': 256, 'lrt': 0.0001,
    #  'epoch_size': 100, 'n_epochs': 2000, 'hidden_size_rnn': 200, 'n_layers_rnn': 2, 'sentence_len': 20,
    #  'use_pretrained_embeddings': '', 'dropout': 0.2},


    # TOPIC MODELS --------------------------------------------------------------------------------------
    {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_closest_word_to_rest', 'batch_size': 64, 'lrt': 0.001,
     'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.5,
     'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
     'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
     },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_word', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.5,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_words', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.5,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_closest_word_to_rest', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.8,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_word', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.8,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_words', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.8,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_closest_word_to_rest', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.2,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_word', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.2,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
    # {'dataloader': 'multi_file_str', 'model': 'word_rnn_topic_least_frequent_words', 'batch_size': 64, 'lrt': 0.001,
    #  'epoch_size': 20, 'n_epochs': 300, 'hidden_size_rnn': 200, 'n_layers_rnn': 4, 'sentence_len': 20, 'loss_alpha': 0.2,
    #  'dropout': 0.2, 'use_pretrained_embeddings': '', 'bidirectional':'', 'glove_dir': 'data/glove.6B/glove.6B.200d.txt',
    #  'baseline_model': '/data/jcm807/batch_size=256-bidirectional=True-char_ngram=2-dataloader=multi_file_str-dropout=0.2-hidden_size_rnn=200-lrt=0.0001-model=word_rnn-n_layers_rnn=4-reuse_pred=False-sentence_len=20-use_pretrained_embeddings=True/checkpoint',
    #  },
]

srun_args = ['']
save_dir = RESULTS_DIR_LOCAL if utils.is_local() else RESULTS_DIR_REMOTE


def run_job(job):

    name = ''
    for k, v in sorted(job.items()):
        if k not in ['baseline_model', 'glove_dir']:
            name += ('' if name == '' else '-') + ('{}={}'.format(k,v) if v!="" else k)

    command_srun = (
        'srun --job-name "{}" --output "{}/{}.out" --err "{}/{}.err" --mail-type=ALL --mail-user=jcm807@nyu.edu '
        '--gres=gpu:1 --qos=batch --nodes=1 --constraint=gpu_12gb'
    ).format(name, save_dir, name, save_dir, name)

    command_py = 'python train.py '
    for k,v in sorted(job.items()):
        command_py += '-{} "{}" '.format(k,v) if v!="" else '-{} '.format(k)

    command = command_py if utils.is_local() else command_srun + ' ' + command_py + '&'
    print('Running command: '+command)
    os.system(command)

for job in jobs:
    run_job(job)