main.py

import torch
import argparse
from src.multiview import load_model, pretrain, finetune, evaluate_classifier
from src.eegdataset import construct_eeg_datasets
from torch.optim import AdamW
import numpy as np
from sklearn.utils.class_weight import compute_class_weight
import os
import wandb
import shutil

def check_output_path(output_path):
    if not os.path.exists(output_path):
        os.makedirs(output_path)
    else:
        i = 1
        while os.path.exists(output_path + f'_v_{i}'):
            i+=1
        output_path = output_path + f'_v_{i}'
        os.makedirs(output_path, exist_ok=True)
    return output_path

def main(args):
    args.train_mode = 'pretrain' if args.pretrain and not args.finetune else 'finetune' if args.finetune and not args.pretrain else 'both'
    # always normalize epochs channelwise within each window
    args.standardize_epochs = 'channelwise'
    
    # load data 
    pretrain_loader, pretrain_val_loader, finetune_loader, finetune_val_loader, test_loader, (channels, time_length, num_classes) = construct_eeg_datasets(**vars(args))
    orig_channels = channels
    
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    if args.pretrain:
        output_path = f'pretrained_models/MultiView_{args.pretraining_setup}_{args.loss}'
        print('Saving outputs in', output_path)

        # initialize wandb
        wandb.init(project = 'MultiView', group = args.pretraining_setup, config = args)

        # setup model
        model, loss_fn = load_model(args.pretraining_setup, device, channels, time_length, num_classes, args)

        if args.load_model:
            model.load_state_dict(torch.load(output_path, map_location=device))

        wandb.config.update({'Pretrain samples': len(pretrain_loader.dataset), 'Pretrain validation samples': len(pretrain_val_loader.dataset)})
        
        optimizer = AdamW(model.parameters(), lr = args.learning_rate, weight_decay=args.weight_decay)

        # pretrain model
        pretrain(model,
                pretrain_loader,
                pretrain_val_loader,
                args.pretrain_epochs,
                optimizer,
                device,
                backup_path=output_path,
                loss_fn = loss_fn,
                log = True)

        model.eval()
        path = f'{output_path}/pretrained_model.pt'
        torch.save(model.state_dict(), path)
        wandb.finish()

    if args.finetune:
        if args.load_model:
            output_path = f'finetuned_models/MultiView_{args.pretraining_setup}_{args.loss}'
            group = f'{args.pretraining_setup}_{args.loss}'
        else:
            output_path = f'finetuned_models/MultiView_{args.pretraining_setup}_scratch'
            group = f'{args.pretraining_setup}_scratch'

        output_path = check_output_path(output_path)
        args.outputh_path = output_path
        print('Saving outputs in', output_path)

        for ft_loader, ft_val_loader in zip(finetune_loader, finetune_val_loader):
            wandb.init(project = 'MultiView', group = group, config = args)
            model, loss_fn = load_model(args.pretraining_setup, device, channels, time_length, num_classes, args)
            train_samples = len(ft_loader.sampler)
            val_samples = len(ft_val_loader.sampler)

            if args.load_model:
                pretrained_model_path = f'pretrained_models/MultiView_{args.pretraining_setup}_{args.loss}'
                pretrained_model_path = pretrained_model_path + '/pretrained_model.pt'

                model.load_state_dict(torch.load(pretrained_model_path, map_location=device))
            
            ft_output_path = output_path + f'/{train_samples}_samples'
            os.makedirs(ft_output_path, exist_ok=True)

            wandb.config.update({'Finetune samples': train_samples, 'Finetune validation samples': val_samples, 'Test samples': len(test_loader.dataset)})
            if args.pretraining_setup != 'GNN':
                model.update_classifier(num_classes, orig_channels=orig_channels, seed = args.seed)
                model.to(device)

            if args.optimize_encoder:
                optimizer = AdamW(model.parameters(), lr = args.ft_learning_rate, weight_decay=args.weight_decay)
            else:
                optimizer = AdamW(model.classifier.parameters(), lr = args.ft_learning_rate, weight_decay=args.weight_decay)
            
            if not args.balanced_sampling == 'finetune' or args.balanced_sampling == 'both':
                targets = ft_loader.dataset.dn3_dset.get_targets()
                weights = torch.tensor(compute_class_weight('balanced', classes = np.unique(targets), y = targets)).float().to(device)
                wandb.config.update({'Target distribution': np.unique(targets, return_counts=True)[-1]})
            else:
                weights = None
            
            finetune(model,
                    ft_loader,
                    ft_val_loader,
                    args.finetune_epochs,
                    optimizer,
                    weights,
                    device,
                    test_loader = test_loader if args.track_test_performance else None,
                    early_stopping_criterion=args.early_stopping_criterion,
                    backup_path=ft_output_path,
            )
            if not args.save_model:
                # delete ft_output_path folder to save memory
                shutil.rmtree(ft_output_path)
            accuracy, prec, rec, f = evaluate_classifier(model, test_loader, device)
            wandb.config.update({'Test accuracy': accuracy, 'Test precision': prec, 'Test recall': rec, 'Test f1': f})
            wandb.finish()

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    # training arguments
    parser.add_argument('--job_id', type = str, default = '0')
    # whether or not to save finetuned models
    parser.add_argument('--save_model', type = eval, default = False)
    parser.add_argument('--load_model', type = eval, default = False)
    parser.add_argument('--pretrain', type = eval, default = True)
    parser.add_argument('--finetune', type = eval, default = False)
    parser.add_argument('--optimize_encoder', type = eval, default = False)
    parser.add_argument('--pretraining_setup', type = str, default = 'MPNN', options = ['MPNN', 'nonMPNN'])
    parser.add_argument('--seed', type = int, default = 42)

    # data arguments
    # path to config files. Remember to change paths in config files. 
    parser.add_argument('--data_path', type = str, default = 'sleepps18.yml')
    parser.add_argument('--finetune_path', type = str, default = 'sleepedf.yml')
    # whether or not to sample balanced during finetuning
    parser.add_argument('--balanced_sampling', type = str, default = 'finetune')
    # number of samples to finetune on. Can be list for multiple runs
    parser.add_argument('--sample_generator', type = eval, nargs = '+', default = [10, 20, None])

    # model arguments
    parser.add_argument('--layers', type = int, default = 6)
    # early stopping criterion during finetuning. Can be loss or accuracy (on validation set)
    parser.add_argument('--early_stopping_criterion', type = str, default = None, options = [None, 'loss', 'acc'])
    parser.add_argument('--conv_do', type = float, default = 0.1)
    parser.add_argument('--feat_do', type = float, default = 0.1)
    parser.add_argument('--num_message_passing_rounds', type = int, default = 3)
    parser.add_argument('--hidden_channels', type = int, default = 256)
    parser.add_argument('--out_dim', type = int, default = 64)
    parser.add_argument('--embedding_dim', type = int, default = 32)


    # eeg arguments
    # subsample number of subjects. If set to False, use all subjects, else set to integer
    parser.add_argument('--sample_pretrain_subjects', type = eval, default = False)
    parser.add_argument('--sample_finetune_train_subjects', type = eval, default = False)
    parser.add_argument('--sample_finetune_val_subjects', type = eval, default = False)
    parser.add_argument('--sample_test_subjects', type = eval, default = False)

    # optimizer arguments
    parser.add_argument('--loss', type = str, default = 'time_loss', options = ['time_loss', 'contrastive', 'COCOA'])
    # whether or not to compute performance on test set during training
    parser.add_argument('--track_test_performance', type = eval, default = True)
    parser.add_argument('--learning_rate', type = float, default = 1e-3)
    parser.add_argument('--ft_learning_rate', type = float, default = 1e-3)
    parser.add_argument('--weight_decay', type = float, default = 5e-4)
    parser.add_argument('--pretrain_epochs', type = int, default = 10)
    parser.add_argument('--finetune_epochs', type = int, default = 1)
    parser.add_argument('--batchsize', type = int, default = 128)
    parser.add_argument('--target_batchsize', type = int, default = 128)
    args = parser.parse_args()
    main(args)