In [1]:
import random
import torch
from transformers import AutoConfig, AutoTokenizer, AdamW, get_linear_schedule_with_warmup
import argparse
import sys
from torch.utils.data import DataLoader, SequentialSampler
from torch.utils.data.distributed import DistributedSampler
from tqdm import tqdm, trange
import numpy as np
import os
os.environ["TOKENIZERS_PARALLELISM"] = "false"
import logging
import time
from utils.cogs_utils import *
import _pickle as cPickle
from transformers import AutoModelForMaskedLM, AutoTokenizer, BertModel, BertConfig
from model.encoder_decoder_hf import EncoderDecoderConfig, EncoderDecoderModel
from model.encoder_decoder_lstm import EncoderDecoderLSTMModel
import pandas as pd  

torch.cuda.empty_cache()

def set_seed(seed: int):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)

def count_parameters(model):
    return sum(p.numel() for p in model.parameters() if p.requires_grad)

def find_partition_name(name, lf):
    if lf == "cogs":
        return name
    else:
        return name+f"_{lf}"

In [2]:
class COGSTrainer(object):
    def __init__(
        self, model,
        is_master,
        src_tokenizer, 
        tgt_tokenizer, 
        device,
        logger,
        lr=5e-5,
        apex_enable=False,
        n_gpu=1,
        early_stopping=5,
        do_statistic=False,
        is_wandb=False,
        model_name="",
        eval_acc=True,
    ):
        self.model = model
        self.src_tokenizer = src_tokenizer
        self.tgt_tokenizer = tgt_tokenizer
        self.is_master = is_master
        self.logger = logger
        self.is_wandb = is_wandb
        self.model_name = model_name
        self.eval_acc = eval_acc
        
        self.device = device
        self.lr = lr
        self.n_gpu = n_gpu
    
        self.early_stopping = early_stopping
    
    def evaluate(
        self, eval_dataloader,
    ):
        logging.info("Evaluating ...")
        loss_sum = 0.0
        eval_step = 0
        correct_count = 0
        total_count = 0
        self.model.eval()
        for step, inputs in enumerate(eval_dataloader):
            for k, v in inputs.items():
                if v is not None and isinstance(v, torch.Tensor):
                    inputs[k] = v.to(self.device)
            input_ids = inputs["input_ids"]
            attention_mask = inputs["attention_mask"]
            labels = inputs["labels"]
            outputs = self.model(**inputs)
            loss = outputs.loss.mean() if self.n_gpu > 1 else outputs.loss
            loss_sum += loss.item()
            eval_step += 1
        self.model.train()
        if total_count == 0:
            return loss_sum / eval_step, 0
        return loss_sum / eval_step, correct_count / total_count
    
    def train(
        self, train_dataloader, eval_dataloader,
        optimizer, scheduler, output_dir,
        log_step, valid_steps, epochs, 
        gradient_accumulation_steps,
        save_after_epoch
    ):
        self.model.train()
        train_iterator = trange(
            0, int(epochs), desc="Epoch"
        )
        total_step = 0
        total_log_step = 0
        patient = 0
        min_eval_loss = 100
        for epoch in train_iterator:
            epoch_iterator = tqdm(train_dataloader, desc=f"Epoch: {epoch}", position=0, leave=True)
            for step, inputs in enumerate(epoch_iterator):
                if patient == self.early_stopping:
                    logging.info("Early stopping the training ...")
                    break
                for k, v in inputs.items():
                    if v is not None and isinstance(v, torch.Tensor):
                        inputs[k] = v.to(self.device)
                outputs = self.model(**inputs)
                loss = outputs.loss.mean() if self.n_gpu > 1 else outputs.loss
                
                if total_step % log_step == 0 and self.is_wandb:
                    wandb.log(
                        {
                            "train/loss": loss.item(),
                        },
                        step=total_log_step
                    )
                    total_log_step += 1
                loss_str = round(loss.item(), 2)
                epoch_iterator.set_postfix({'loss': loss_str})
                
                if gradient_accumulation_steps > 1:
                    loss = loss / gradient_accumulation_steps
                
                if total_step % gradient_accumulation_steps == 0:
                    loss.backward()
                    optimizer.step()
                    scheduler.step()
                    self.model.zero_grad()
                    
                total_step += 1
                
                if valid_steps != -1 and total_step % valid_steps == 0:
                    eval_loss, eval_acc = self.evaluate(eval_dataloader)
                    logging.info(f"Eval Loss: {eval_loss}; Eval Acc: {eval_acc}")
                    if self.is_wandb:
                        wandb.log(
                            {
                                "eval/loss": eval_loss.item(),
                                "eval/acc": eval_acc,
                            },
                            step=total_step
                        )
                    if eval_loss < min_eval_loss:
                        if self.is_master:
                            if self.n_gpu > 1:
                                self.model.module.save_pretrained(os.path.join(output_dir, 'model-best'))
                            else:
                                self.model.save_pretrained(os.path.join(output_dir, 'model-best'))
                        min_eval_loss = eval_loss
                        patient = 0
                    else:
                        patient += 1
                        
            if self.is_master:
                if save_after_epoch is not None and epoch % save_after_epoch == 0:
                    dir_name = f"model-epoch-{epoch}"
                else:
                    dir_name = "model-last"
                if self.n_gpu > 1:
                    self.model.module.save_pretrained(os.path.join(output_dir, dir_name))
                else:
                    self.model.save_pretrained(os.path.join(output_dir, dir_name))
            if patient == self.early_stopping:
                break
        logging.info("Training is finished ...") 
        if self.is_master:
            if self.n_gpu > 1:
                self.model.module.save_pretrained(os.path.join(output_dir, 'model-last'))
            else:
                self.model.save_pretrained(os.path.join(output_dir, 'model-last'))

In [3]:
if __name__ == '__main__':
    is_notebook = False
    try:
        cmd = argparse.ArgumentParser('The testing components of')
        cmd.add_argument('--gpu', default=-1, type=int, help='use id of gpu, -1 if cpu.')
        cmd.add_argument('--train_batch_size', default=128, type=int, help='training batch size')
        cmd.add_argument('--eval_batch_size', default=128, type=int, help='training batch size')
        cmd.add_argument('--lr', default=0.01, type=float, help='learning rate')
        cmd.add_argument('--data_path', required=True, type=str, help='path to the training corpus')
        cmd.add_argument(
            '--encoder_config_path', 
            type=str, help='path to the encoder config'
        )
        cmd.add_argument(
            '--decoder_config_path', 
            type=str, help='path to the decoder config'
        )
        cmd.add_argument('--max_seq_len', default=512, type=int)
        cmd.add_argument('--seed', default=42, type=int)
        cmd.add_argument('--gradient_accumulation_steps', default=1, type=int)
        cmd.add_argument('--output_dir', required=True, type=str, help='save dir')
        cmd.add_argument('--local_rank', default=-1, type=int, help='multi gpu training')
        cmd.add_argument('--epochs', default=10, type=int, help='training epochs')
        cmd.add_argument('--model_path', type=str, required=False, default=None)
        cmd.add_argument('--warm_up', type=float, default=0.1)
        cmd.add_argument('--is_wandb', default=False, action='store_true')
        cmd.add_argument('--spanformer', default=False, action='store_true')
        cmd.add_argument('--log_step', default=10, type=int)
        cmd.add_argument('--valid_steps', default=500, type=int)
        cmd.add_argument('--early_stopping', default=5, type=int)
        cmd.add_argument('--device', default="cuda", type=str, help='')
        cmd.add_argument('--do_train', default=False, action='store_true')
        cmd.add_argument('--do_eval', default=False, action='store_true')
        cmd.add_argument('--do_test', default=False, action='store_true')
        cmd.add_argument('--do_gen', default=False, action='store_true')
        cmd.add_argument('--least_to_most', default=False, action='store_true')
        cmd.add_argument('--use_glove', default=False, action='store_true')
        cmd.add_argument('--eval_acc', default=False, action='store_true')
        cmd.add_argument('--use_span_match', default=False, action='store_true')
        cmd.add_argument('--save_after_epoch', type=int, default=None)
        cmd.add_argument('--lf', default="cogs", type=str, help='')
        cmd.add_argument('--model_name', default="cogs", type=str, help='')
        
        args = cmd.parse_args(sys.argv[1:])
    except:
        # LSTM settings best: {batch = 512, lr = 8e-4, epoch = 200}
        # Transformer settings best: {batch = 128, lr = 1e-4, epoch = 200}
        is_notebook = True
        parser = argparse.ArgumentParser()
        args = parser.parse_args([])
        args.gpu = 1
        args.train_batch_size = 128
        args.eval_batch_size = 128
        args.gradient_accumulation_steps = 1
        args.lr = 1e-4
        args.data_path = "./cogs_participle_verb"
        args.model_data_path = "./model/"
        args.encoder_config_path = None
        args.decoder_config_path = None
        args.max_seq_len = 512
        args.seed = 77
        args.output_dir = "./results_cogs_notebook/"
        args.epochs = 200
        args.warm_up = 0.1
        args.is_wandb = False
        args.log_step = 10
        # args.valid_steps = 500 # -1 not do training eval!
        args.valid_steps = -1
        args.early_stopping = None # large == never early stop!
        args.device = "cuda:0"
        args.spanformer = False
        args.model_path = None
        args.do_train = True
        args.do_eval = True
        args.do_test = True
        args.do_gen = True
        args.least_to_most = False
        args.use_glove = False
        args.eval_acc = False
        args.save_after_epoch = None
        args.use_span_match = False
        args.model_name = "ende_transformer"
        # args.lf = "no_()" # cogs, es, noexp
        # args.model_path = "./results_cogs_notebook/cogs_pipeline.model.ende_lstm.lf.cogs.glove.False.seed.42/model-last/"
        print("Using in a notebook env.")

Using in a notebook env.


usage: The testing components of [-h] [--gpu GPU]
                                 [--train_batch_size TRAIN_BATCH_SIZE]
                                 [--eval_batch_size EVAL_BATCH_SIZE] [--lr LR]
                                 --data_path DATA_PATH
                                 [--encoder_config_path ENCODER_CONFIG_PATH]
                                 [--decoder_config_path DECODER_CONFIG_PATH]
                                 [--max_seq_len MAX_SEQ_LEN] [--seed SEED]
                                 [--gradient_accumulation_steps GRADIENT_ACCUMULATION_STEPS]
                                 --output_dir OUTPUT_DIR
                                 [--local_rank LOCAL_RANK] [--epochs EPOCHS]
                                 [--model_path MODEL_PATH] [--warm_up WARM_UP]
                                 [--is_wandb] [--spanformer]
                                 [--log_step LOG_STEP]
                                 [--valid_steps VALID_STEPS]
                                 

In [4]:
results = {}

In [5]:
for lf in [
    "cogs",
]:
    for seed in [42, 66, 77, 88, 99]: # 42, 66, 77, 88, 99
        set_seed(args.seed)
        
        args.lf = lf
        args.seed = seed

        model_name = args.model_name
        run_name = f"cogs_pipeline.model.{model_name}.lf.{args.lf}.glove.{args.use_glove}.seed.{args.seed}"
        if args.do_train == False:
            args.model_path = f"./results_cogs_notebook/{run_name}/model-last/"
        
        logger = logging.getLogger()
        logger.setLevel(logging.INFO)
        device = torch.device(args.device)
        
        encoder_config_filename = "encoder_config_lstm.json" if model_name == "ende_lstm" else "encoder_config.json"
        decoder_config_filename = "decoder_config_lstm.json" if model_name == "ende_lstm" else "decoder_config.json"
        
        if "participle_verb" in args.data_path:
            config_encoder = AutoConfig.from_pretrained(
                os.path.join(args.data_path, encoder_config_filename)
            )
        else:
            config_encoder = AutoConfig.from_pretrained(
                os.path.join(args.model_data_path, encoder_config_filename)
            )
        if "participle_verb_hard" in args.data_path:   
            config_decoder = AutoConfig.from_pretrained(
                    os.path.join(args.data_path, decoder_config_filename) if args.decoder_config_path is None else \
                        args.decoder_config_path
            )
        else:
            config_decoder = AutoConfig.from_pretrained(
                    os.path.join(args.model_data_path, decoder_config_filename) if args.decoder_config_path is None else \
                        args.decoder_config_path
            )
            
        if "participle_verb" in args.data_path:
            src_tokenizer = WordLevelTokenizer(
                os.path.join(args.data_path, "src_vocab.txt"), 
                config_encoder,
                max_seq_len=args.max_seq_len
            )
        else:
            src_tokenizer = WordLevelTokenizer(
                os.path.join(args.model_data_path, "src_vocab.txt"), 
                config_encoder,
                max_seq_len=args.max_seq_len
            )
            
        if "participle_verb_hard" in args.data_path:    
            tgt_tokenizer = WordLevelTokenizer(
                os.path.join(args.data_path, "tgt_vocab.txt"), 
                config_decoder,
                max_seq_len=args.max_seq_len
            )  
        else:
            tgt_tokenizer = WordLevelTokenizer(
                os.path.join(args.model_data_path, "tgt_vocab.txt"), 
                config_decoder,
                max_seq_len=args.max_seq_len
            )

        if args.least_to_most:
            logging.info("Preparing training set to be least to most order.")
        train_dataset = COGSDataset(
            cogs_path=args.data_path, 
            src_tokenizer=src_tokenizer, 
            tgt_tokenizer=tgt_tokenizer, 
            partition=find_partition_name("train", args.lf),
            least_to_most=args.least_to_most
        )
        train_dataloader = DataLoader(
            train_dataset, batch_size=args.train_batch_size, 
            sampler=SequentialSampler(train_dataset),
            collate_fn=train_dataset.collate_batch
        )

        eval_dataset = COGSDataset(
            cogs_path=args.data_path, 
            src_tokenizer=src_tokenizer, 
            tgt_tokenizer=tgt_tokenizer, 
            partition=find_partition_name("dev", args.lf),
        )
        eval_dataloader = DataLoader(
            eval_dataset, batch_size=args.eval_batch_size, 
            sampler=SequentialSampler(eval_dataset),
            collate_fn=train_dataset.collate_batch
        )

        test_dataset = COGSDataset(
            cogs_path=args.data_path, 
            src_tokenizer=src_tokenizer, 
            tgt_tokenizer=tgt_tokenizer, 
            partition=find_partition_name("test", args.lf),
        )
        test_dataloader = DataLoader(
            test_dataset, batch_size=args.eval_batch_size, 
            sampler=SequentialSampler(test_dataset),
            collate_fn=train_dataset.collate_batch
        )

        gen_dataset = COGSDataset(
            cogs_path=args.data_path, 
            src_tokenizer=src_tokenizer, 
            tgt_tokenizer=tgt_tokenizer, 
            partition=find_partition_name("gen", args.lf),
        )
        gen_dataloader = DataLoader(
            gen_dataset, batch_size=args.eval_batch_size, 
            sampler=SequentialSampler(gen_dataset),
            collate_fn=train_dataset.collate_batch
        )
        
        if model_name == "ende_transformer":
            logging.info("Baselining the Transformer Encoder-Decoder Model")
            model_config = EncoderDecoderConfig.from_encoder_decoder_configs(
                config_encoder, config_decoder
            )
            model_config.decoder_start_token_id = config_encoder.bos_token_id
            model_config.pad_token_id = config_encoder.pad_token_id
            model_config.eos_token_id = config_encoder.eos_token_id
            model = EncoderDecoderModel(config=model_config)
        elif model_name == "ende_lstm":
            logging.info("Baselining the LSTM Encoder-Decoder Model")
            model_config = EncoderDecoderConfig.from_encoder_decoder_configs(
                config_encoder, config_decoder
            )
            model_config.decoder_start_token_id = config_encoder.bos_token_id
            model_config.pad_token_id = config_encoder.pad_token_id
            model_config.eos_token_id = config_encoder.eos_token_id
            model = EncoderDecoderLSTMModel(config=model_config)
            
        if args.model_path is not None and model_name == "ende_transformer":
            logging.info("Loading pretrained model.")
            model = model.from_pretrained(args.model_path)
        elif args.model_path is not None and model_name == "ende_lstm":
            logging.info("Loading pretrained model.")
            raw_weights = torch.load(os.path.join(args.model_path, 'pytorch_model.bin'))
            model.load_state_dict(raw_weights)
            
        

        if "cuda:" not in args.device:
            n_gpu = torch.cuda.device_count()
            logging.info(f'__Number CUDA Devices: {n_gpu}')
        else:
            n_gpu = 1
            logging.info(f'__Number CUDA Devices: {n_gpu}')

        if n_gpu > 1:
            model = torch.nn.DataParallel(model)
        _ = model.to(device)

        t_total = int(len(train_dataloader) * args.epochs)

        warm_up_steps = args.warm_up * t_total
        optimizer = torch.optim.AdamW(
            model.parameters(), lr=args.lr
        )
        scheduler = get_linear_schedule_with_warmup(optimizer, num_warmup_steps=warm_up_steps,
                                                    num_training_steps=t_total)
        is_master = True
        apex_enable = False                                       
        if not os.path.exists(args.output_dir) and is_master:
            os.mkdir(args.output_dir)

        os.environ["WANDB_PROJECT"] = f"COGS"

        output_dir = os.path.join(args.output_dir, run_name)
        if args.is_wandb:
            import wandb
            run = wandb.init(
                project="COGS-CKY-Transformer", 
                entity="wuzhengx",
                name=run_name,
            )
            wandb.config.update(args)
        if not os.path.exists(args.output_dir) and is_master:
            os.mkdir(args.output_dir)

        trainer = COGSTrainer(
            model, device=device, 
            src_tokenizer=src_tokenizer, 
            tgt_tokenizer=tgt_tokenizer, 
            logger=logger,
            is_master=is_master, 
            n_gpu=n_gpu,
            is_wandb=args.is_wandb, 
            model_name=model_name,
            eval_acc=args.eval_acc,
            # early_stopping=args.early_stopping
        )
        num_params = count_parameters(model)
        logging.info(f'Number of model params: {num_params}')

        if args.do_train:
            logging.info(f"OUTPUT DIR: {output_dir}")
            trainer.train(
                train_dataloader, eval_dataloader,
                optimizer, scheduler, 
                log_step=args.log_step, valid_steps=args.valid_steps,
                output_dir=output_dir, epochs=args.epochs, 
                gradient_accumulation_steps=args.gradient_accumulation_steps,
                save_after_epoch=args.save_after_epoch,
            )
        
        if args.do_test:
            trainer.model.eval()
            epoch_iterator = tqdm(test_dataloader, desc="Iteration", position=0, leave=True)
            total_count = 0
            correct_count = 0
            for step, inputs in enumerate(epoch_iterator):
                input_ids = inputs["input_ids"].to(device)
                attention_mask = inputs["attention_mask"].to(device)
                labels = inputs["labels"].to(device)
                if model_name == "ende_lstm":
                    outputs = trainer.model.generate(
                        input_ids,
                        attention_mask=attention_mask,
                    )
                else:
                    outputs = trainer.model.generate(
                        input_ids,
                        attention_mask=attention_mask,
                        eos_token_id=model_config.eos_token_id,
                        max_length=args.max_seq_len,
                    )
                decoded_preds = tgt_tokenizer.batch_decode(outputs)
                decoded_labels = tgt_tokenizer.batch_decode(labels)

                for i in range(len(decoded_preds)):
                    if args.use_span_match:
                        if set(decoded_preds[i].split(" ; ")) == set(decoded_labels[i].split(" ; ")):
                            correct_count += 1
                        else:
                            print(decoded_preds[i])
                            print(decoded_labels[i])
                    else:
                        if decoded_preds[i] == decoded_labels[i]:
                            correct_count += 1
                        else:
                            print(decoded_preds[i])
                            print(decoded_labels[i])
                    total_count += 1
                current_acc = round(correct_count/total_count, 2)
                epoch_iterator.set_postfix({'acc': current_acc})
            test_acc = current_acc

        if args.do_gen:
            per_cat_eval = {}
            for cat in set(gen_dataset.eval_cat):
                per_cat_eval[cat] = [0, 0] # correct, total
            trainer.model.eval()
            epoch_iterator = tqdm(gen_dataloader, desc="Iteration", position=0, leave=True)
            total_count = 0
            correct_count = 0
            for step, inputs in enumerate(epoch_iterator):
                input_ids = inputs["input_ids"].to(device)
                attention_mask = inputs["attention_mask"].to(device)
                labels = inputs["labels"].to(device)
                if model_name == "ende_lstm":
                    outputs = trainer.model.generate(
                        input_ids,
                        attention_mask=attention_mask,
                    )
                else:
                    outputs = trainer.model.generate(
                        input_ids,
                        attention_mask=attention_mask,
                        eos_token_id=model_config.eos_token_id,
                        max_length=args.max_seq_len,
                    )
                decoded_preds = tgt_tokenizer.batch_decode(outputs)
                decoded_labels = tgt_tokenizer.batch_decode(labels)

                input_labels = src_tokenizer.batch_decode(input_ids)
                for i in range(len(decoded_preds)):
                    cat = gen_dataset.eval_cat[total_count]
                    if args.use_span_match:
                        if set(decoded_preds[i].split(" ; ")) == set(decoded_labels[i].split(" ; ")):
                            correct_count += 1
                            per_cat_eval[cat][0] += 1
                        else:
                            if cat == "obj_pp_to_subj_pp":
                                pass
        #                         print("input: ", input_labels[i])
        #                         print("pred: ", decoded_preds[i])
        #                         print("actual: ", decoded_labels[i])
        #                         print("cat: ", cat)
        #                         print()
                    else:
                        if decoded_preds[i] == decoded_labels[i]:
                            correct_count += 1
                            per_cat_eval[cat][0] += 1
                        else:
                            if cat == "prim_to_obj_proper":
                                pass
        #                             print("input: ", input_labels[i])
        #                             print("pred: ", decoded_preds[i])
        #                             print("actual: ", decoded_labels[i])
        #                             print("cat: ", cat)
        #                             print()
                    total_count += 1
                    per_cat_eval[cat][1] += 1
                current_acc = correct_count/total_count
                epoch_iterator.set_postfix({'acc': current_acc})

            struct_pp_acc = 0
            struct_cp_acc = 0
            struct_obj_subj_acc = 0

            lex_acc = 0
            lex_count = 0
            for k, v in per_cat_eval.items():
                if k  == "pp_recursion":
                    struct_pp_acc = 100 * v[0]/v[1]
                elif k  == "cp_recursion":
                    struct_cp_acc = 100 * v[0]/v[1]
                elif k  == "obj_pp_to_subj_pp":
                    struct_obj_subj_acc = 100 * v[0]/v[1]
                elif k  == "subj_to_obj_proper":
                    subj_to_obj_proper_acc = 100 * v[0]/v[1]
                elif k  == "prim_to_obj_proper":
                    prim_to_obj_proper_acc = 100 * v[0]/v[1]
                elif k  == "prim_to_subj_proper": 
                    prim_to_subj_proper_acc = 100 * v[0]/v[1]
                else:
                    lex_acc += v[0]
                    lex_count += v[1]
            lex_acc /= lex_count
            lex_acc *= 100
            current_acc *= 100

            print(f"obj_pp_to_subj_pp: {struct_obj_subj_acc}")
            print(f"cp_recursion: {struct_cp_acc}")
            print(f"pp_recursion: {struct_pp_acc}")
            print(f"subj_to_obj_proper: {subj_to_obj_proper_acc}")
            print(f"prim_to_obj_proper: {prim_to_obj_proper_acc}")
            print(f"prim_to_subj_proper: {prim_to_subj_proper_acc}")
            print(f"LEX: {lex_acc}")
            print(f"OVERALL: {current_acc}")

            results[(seed, lf)] = {
                "obj_pp_to_subj_pp" : struct_obj_subj_acc,
                "cp_recursion" : struct_cp_acc,
                "pp_recursion" : struct_pp_acc,
                "subj_to_obj_proper" : subj_to_obj_proper_acc,
                "prim_to_obj_proper" : prim_to_obj_proper_acc,
                "prim_to_subj_proper" : prim_to_subj_proper_acc,
                "lex_acc" : lex_acc,
                "overall_acc" : current_acc,
                "test_acc" : test_acc
            }



INFO:root:Baselining the Transformer Encoder-Decoder Model
INFO:root:__Number CUDA Devices: 1
INFO:root:Number of model params: 4383977
INFO:root:OUTPUT DIR: ./results_cogs_notebook/cogs_pipeline.model.ende_transformer.lf.cogs.glove.False.seed.42
Epoch: 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.31it/s, loss=5.85]
Epoch: 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 17.99it/s, loss=4.29]
Epoch: 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00

Epoch: 27: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.64it/s, loss=0.01]
Epoch: 28: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.88it/s, loss=0.01]
Epoch: 29: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.07it/s, loss=0.01]
Epoch: 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 

Epoch: 58: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.00it/s, loss=0]
Epoch: 59: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.94it/s, loss=0]
Epoch: 60: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.95it/s, loss=0]
Epoch: 61: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 89: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.97it/s, loss=0]
Epoch: 90: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.98it/s, loss=0]
Epoch: 91: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.00it/s, loss=0]
Epoch: 92: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 120: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.96it/s, loss=0]
Epoch: 121: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.96it/s, loss=0]
Epoch: 122: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.96it/s, loss=0]
Epoch: 123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 151: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.01it/s, loss=0]
Epoch: 152: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.94it/s, loss=0]
Epoch: 153: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.11it/s, loss=0]
Epoch: 154: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 182: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.11it/s, loss=0]
Epoch: 183: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.04it/s, loss=0]
Epoch: 184: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 19.00it/s, loss=0]
Epoch: 185: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 14 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND table . nmod . on ( x _ 11 , x _ 17 ) AND table ( x _ 17 )
* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 11 , x _ 14 ) AND table ( x _ 14 )


Iteration:  21%|██████████████████████████████████████████▌                                                                                                                                                                 | 5/24 [00:03<00:13,  1.43it/s, acc=1]

* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Lillian )
* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Emma )


Iteration:  46%|█████████████████████████████████████████████████████████████████████████████████████████████                                                                                                              | 11/24 [00:07<00:09,  1.36it/s, acc=1]

tolerate . agent ( x _ 1 , Emma ) AND tolerate . ccomp ( x _ 1 , x _ 4 ) AND like . agent ( x _ 4 , Sophia ) AND like . ccomp ( x _ 4 , x _ 8 ) AND father ( x _ 7 ) AND wire . agent ( x _ 8 , x _ 7 ) AND wire . recipient ( x _ 8 , x _ 10 ) AND wire . theme ( x _ 8 , x _ 12 ) AND box ( x _ 10 ) AND box ( x _ 12 )
tolerate . agent ( x _ 1 , Emma ) AND tolerate . ccomp ( x _ 1 , x _ 4 ) AND like . agent ( x _ 4 , Sophia ) AND like . ccomp ( x _ 4 , x _ 8 ) AND father ( x _ 7 ) AND wire . agent ( x _ 8 , x _ 7 ) AND wire . recipient ( x _ 8 , x _ 10 ) AND wire . theme ( x _ 8 , x _ 12 ) AND wolf ( x _ 10 ) AND box ( x _ 12 )


Iteration:  62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 15/24 [00:10<00:06,  1.40it/s, acc=1]

* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND machine ( x _ 7 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND gardner ( x _ 7 )


Iteration: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:16<00:00,  1.44it/s, acc=1]
Iteration: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 165/165 [18:58<00:00,  6.90s/it, acc=0.852]


obj_pp_to_subj_pp: 75.7
cp_recursion: 0.9
pp_recursion: 8.6
subj_to_obj_proper: 81.7
prim_to_obj_proper: 51.8
prim_to_subj_proper: 96.5
LEX: 98.28
OVERALL: 85.20952380952382


INFO:root:Baselining the Transformer Encoder-Decoder Model
INFO:root:__Number CUDA Devices: 1
INFO:root:Number of model params: 4383977
INFO:root:OUTPUT DIR: ./results_cogs_notebook/cogs_pipeline.model.ende_transformer.lf.cogs.glove.False.seed.66
Epoch: 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.28it/s, loss=5.68]
Epoch: 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.62it/s, loss=4.09]
Epoch: 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00

Epoch: 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.77it/s, loss=0.01]
Epoch: 31: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.77it/s, loss=0.01]
Epoch: 32: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.80it/s, loss=0.01]
Epoch: 33: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 

Epoch: 61: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.81it/s, loss=0]
Epoch: 62: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.89it/s, loss=0]
Epoch: 63: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.88it/s, loss=0]
Epoch: 64: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 92: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:09<00:00, 18.94it/s, loss=0]
Epoch: 93: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.89it/s, loss=0]
Epoch: 94: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.84it/s, loss=0]
Epoch: 95: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.65it/s, loss=0]
Epoch: 124: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.86it/s, loss=0]
Epoch: 125: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.80it/s, loss=0]
Epoch: 126: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 154: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.78it/s, loss=0]
Epoch: 155: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.59it/s, loss=0]
Epoch: 156: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.71it/s, loss=0]
Epoch: 157: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 185: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.80it/s, loss=0]
Epoch: 186: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.61it/s, loss=0]
Epoch: 187: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.66it/s, loss=0]
Epoch: 188: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 14 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND table . nmod . on ( x _ 14 , x _ 17 ) AND table ( x _ 17 )
* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 11 , x _ 14 ) AND table ( x _ 14 )


Iteration:  29%|███████████████████████████████████████████████████████████▌                                                                                                                                                | 7/24 [00:05<00:11,  1.43it/s, acc=1]

* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 14 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 14 ) AND boat ( x _ 11 )
* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 14 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 11 ) AND boat ( x _ 11 )


Iteration:  33%|████████████████████████████████████████████████████████████████████                                                                                                                                        | 8/24 [00:05<00:11,  1.34it/s, acc=1]

* girl ( x _ 4 ) ; * dealer ( x _ 8 ) ; declare . agent ( x _ 1 , Mia ) AND declare . ccomp ( x _ 1 , x _ 5 ) AND wish . agent ( x _ 5 , x _ 4 ) AND wish . ccomp ( x _ 5 , x _ 10 ) AND sell . recipient ( x _ 10 , x _ 8 ) AND sell . theme ( x _ 10 , x _ 12 ) AND cake . nmod . in ( x _ 12 , x _ 12 ) AND cake ( x _ 12 ) AND house ( x _ 15 )
* girl ( x _ 4 ) ; * dealer ( x _ 8 ) ; declare . agent ( x _ 1 , Mia ) AND declare . ccomp ( x _ 1 , x _ 5 ) AND wish . agent ( x _ 5 , x _ 4 ) AND wish . ccomp ( x _ 5 , x _ 10 ) AND sell . recipient ( x _ 10 , x _ 8 ) AND sell . theme ( x _ 10 , x _ 12 ) AND cake ( x _ 12 ) AND cake . nmod . in ( x _ 12 , x _ 15 ) AND house ( x _ 15 )


Iteration:  46%|█████████████████████████████████████████████████████████████████████████████████████████████                                                                                                              | 11/24 [00:07<00:09,  1.41it/s, acc=1]

think . agent ( x _ 1 , Olivia ) AND think . ccomp ( x _ 1 , x _ 5 ) AND child ( x _ 4 ) AND hope . agent ( x _ 5 , x _ 4 ) AND hope . ccomp ( x _ 5 , x _ 9 ) AND girl ( x _ 8 ) AND give . agent ( x _ 9 , x _ 8 ) AND give . recipient ( x _ 9 , Emma ) AND give . theme ( x _ 9 , Emma ) AND chalk . nmod . in ( x _ 12 , x _ 15 ) AND house ( x _ 15 )
think . agent ( x _ 1 , Olivia ) AND think . ccomp ( x _ 1 , x _ 5 ) AND child ( x _ 4 ) AND hope . agent ( x _ 5 , x _ 4 ) AND hope . ccomp ( x _ 5 , x _ 9 ) AND girl ( x _ 8 ) AND give . agent ( x _ 9 , x _ 8 ) AND give . recipient ( x _ 9 , Emma ) AND give . theme ( x _ 9 , x _ 12 ) AND chalk ( x _ 12 ) AND chalk . nmod . in ( x _ 12 , x _ 15 ) AND house ( x _ 15 )


Iteration:  62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 15/24 [00:10<00:06,  1.40it/s, acc=1]

* dog ( x _ 5 ) ; * student ( x _ 15 ) ; puppy ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 7 ) AND give . recipient ( x _ 7 , x _ 5 ) AND give . theme ( x _ 7 , x _ 9 ) AND give . agent ( x _ 7 , x _ 15 ) AND donut ( x _ 9 ) AND donut . nmod . on ( x _ 9 , x _ 15 ) AND napkin ( x _ 12 )
* dog ( x _ 5 ) ; * student ( x _ 15 ) ; puppy ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 7 ) AND give . recipient ( x _ 7 , x _ 5 ) AND give . theme ( x _ 7 , x _ 9 ) AND give . agent ( x _ 7 , x _ 15 ) AND donut ( x _ 9 ) AND donut . nmod . on ( x _ 9 , x _ 12 ) AND napkin ( x _ 12 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND donut ( x _ 7 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 

Iteration: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:17<00:00,  1.34it/s, acc=1]
Iteration: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 165/165 [21:05<00:00,  7.67s/it, acc=0.849]


obj_pp_to_subj_pp: 77.9
cp_recursion: 0.6
pp_recursion: 7.6
subj_to_obj_proper: 64.7
prim_to_obj_proper: 56.4
prim_to_subj_proper: 89.0
LEX: 99.10666666666667
OVERALL: 84.89523809523808


INFO:root:Baselining the Transformer Encoder-Decoder Model
INFO:root:__Number CUDA Devices: 1
INFO:root:Number of model params: 4383977
INFO:root:OUTPUT DIR: ./results_cogs_notebook/cogs_pipeline.model.ende_transformer.lf.cogs.glove.False.seed.77
Epoch: 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.77it/s, loss=5.73]
Epoch: 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.61it/s, loss=4.14]
Epoch: 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00

Epoch: 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.52it/s, loss=0.01]
Epoch: 31: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.49it/s, loss=0.01]
Epoch: 32: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.67it/s, loss=0.01]
Epoch: 33: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 

Epoch: 61: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.55it/s, loss=0]
Epoch: 62: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.64it/s, loss=0]
Epoch: 63: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.62it/s, loss=0]
Epoch: 64: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 92: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.50it/s, loss=0]
Epoch: 93: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.55it/s, loss=0]
Epoch: 94: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.60it/s, loss=0]
Epoch: 95: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.60it/s, loss=0]
Epoch: 124: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.75it/s, loss=0]
Epoch: 125: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.75it/s, loss=0]
Epoch: 126: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 154: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.52it/s, loss=0]
Epoch: 155: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.65it/s, loss=0]
Epoch: 156: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.56it/s, loss=0]
Epoch: 157: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 185: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.59it/s, loss=0]
Epoch: 186: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.49it/s, loss=0]
Epoch: 187: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.15it/s, loss=0]
Epoch: 188: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 14 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 14 , x _ 17 ) AND table ( x _ 17 )
* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 11 , x _ 14 ) AND table ( x _ 14 )


Iteration:  21%|██████████████████████████████████████████▌                                                                                                                                                                 | 5/24 [00:03<00:13,  1.40it/s, acc=1]

* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Lillian )
* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Emma )


Iteration:  29%|███████████████████████████████████████████████████████████▌                                                                                                                                                | 7/24 [00:05<00:11,  1.43it/s, acc=1]

* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 11 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 11 ) AND boat ( x _ 11 )
* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 14 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 11 ) AND boat ( x _ 11 )


Iteration:  62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 15/24 [00:10<00:06,  1.38it/s, acc=1]

* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND cot ( x _ 7 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND gardner ( x _ 7 )


Iteration: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:16<00:00,  1.42it/s, acc=1]
Iteration: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 165/165 [24:05<00:00,  8.76s/it, acc=0.849]


obj_pp_to_subj_pp: 76.5
cp_recursion: 1.9
pp_recursion: 7.6
subj_to_obj_proper: 69.9
prim_to_obj_proper: 45.2
prim_to_subj_proper: 96.9
LEX: 99.03333333333333
OVERALL: 84.92857142857143


INFO:root:Baselining the Transformer Encoder-Decoder Model
INFO:root:__Number CUDA Devices: 1
INFO:root:Number of model params: 4383977
INFO:root:OUTPUT DIR: ./results_cogs_notebook/cogs_pipeline.model.ende_transformer.lf.cogs.glove.False.seed.88
Epoch: 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.73it/s, loss=5.85]
Epoch: 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.84it/s, loss=4.29]
Epoch: 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00

Epoch: 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.84it/s, loss=0.01]
Epoch: 31: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.76it/s, loss=0.01]
Epoch: 32: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.69it/s, loss=0.01]
Epoch: 33: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 

Epoch: 61: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.62it/s, loss=0]
Epoch: 62: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.64it/s, loss=0]
Epoch: 63: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.63it/s, loss=0]
Epoch: 64: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 92: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 17.61it/s, loss=0]
Epoch: 93: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.63it/s, loss=0]
Epoch: 94: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.71it/s, loss=0]
Epoch: 95: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.71it/s, loss=0]
Epoch: 124: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.68it/s, loss=0]
Epoch: 125: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.65it/s, loss=0]
Epoch: 126: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 154: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.41it/s, loss=0]
Epoch: 155: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.49it/s, loss=0]
Epoch: 156: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.68it/s, loss=0]
Epoch: 157: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 185: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.61it/s, loss=0]
Epoch: 186: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.59it/s, loss=0]
Epoch: 187: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.61it/s, loss=0]
Epoch: 188: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 14 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND table . nmod . on ( x _ 11 , x _ 17 ) AND table ( x _ 17 )
* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 11 , x _ 14 ) AND table ( x _ 14 )


Iteration:  21%|██████████████████████████████████████████▌                                                                                                                                                                 | 5/24 [00:03<00:13,  1.40it/s, acc=1]

* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Lillian )
* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Emma )


Iteration:  46%|█████████████████████████████████████████████████████████████████████████████████████████████                                                                                                              | 11/24 [00:08<00:09,  1.34it/s, acc=1]

tolerate . agent ( x _ 1 , Emma ) AND tolerate . ccomp ( x _ 1 , x _ 4 ) AND like . agent ( x _ 4 , Sophia ) AND like . ccomp ( x _ 4 , x _ 8 ) AND father ( x _ 7 ) AND wire . agent ( x _ 8 , x _ 7 ) AND wire . recipient ( x _ 8 , x _ 10 ) AND wire . theme ( x _ 8 , x _ 12 ) AND box ( x _ 10 ) AND box ( x _ 12 )
tolerate . agent ( x _ 1 , Emma ) AND tolerate . ccomp ( x _ 1 , x _ 4 ) AND like . agent ( x _ 4 , Sophia ) AND like . ccomp ( x _ 4 , x _ 8 ) AND father ( x _ 7 ) AND wire . agent ( x _ 8 , x _ 7 ) AND wire . recipient ( x _ 8 , x _ 10 ) AND wire . theme ( x _ 8 , x _ 12 ) AND wolf ( x _ 10 ) AND box ( x _ 12 )


Iteration:  62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 15/24 [00:10<00:06,  1.38it/s, acc=1]

* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND machine ( x _ 7 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND gardner ( x _ 7 )


Iteration: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:16<00:00,  1.42it/s, acc=1]
Iteration: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 165/165 [18:59<00:00,  6.90s/it, acc=0.852]


obj_pp_to_subj_pp: 75.7
cp_recursion: 0.9
pp_recursion: 8.6
subj_to_obj_proper: 81.7
prim_to_obj_proper: 51.8
prim_to_subj_proper: 96.5
LEX: 98.28
OVERALL: 85.20952380952382


INFO:root:Baselining the Transformer Encoder-Decoder Model
INFO:root:__Number CUDA Devices: 1
INFO:root:Number of model params: 4383977
INFO:root:OUTPUT DIR: ./results_cogs_notebook/cogs_pipeline.model.ende_transformer.lf.cogs.glove.False.seed.99
Epoch: 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.36it/s, loss=5.82]
Epoch: 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.65it/s, loss=4.17]
Epoch: 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00

Epoch: 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.12it/s, loss=0.01]
Epoch: 31: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.29it/s, loss=0.01]
Epoch: 32: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.31it/s, loss=0.01]
Epoch: 33: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 

Epoch: 61: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.48it/s, loss=0]
Epoch: 62: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.35it/s, loss=0]
Epoch: 63: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.10it/s, loss=0]
Epoch: 64: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 92: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.42it/s, loss=0]
Epoch: 93: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.47it/s, loss=0]
Epoch: 94: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.68it/s, loss=0]
Epoch: 95: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.68it/s, loss=0]
Epoch: 124: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.73it/s, loss=0]
Epoch: 125: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.83it/s, loss=0]
Epoch: 126: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 154: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.77it/s, loss=0]
Epoch: 155: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.74it/s, loss=0]
Epoch: 156: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.78it/s, loss=0]
Epoch: 157: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

Epoch: 185: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.84it/s, loss=0]
Epoch: 186: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.84it/s, loss=0]
Epoch: 187: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/189 [00:10<00:00, 18.77it/s, loss=0]
Epoch: 188: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 189/1

* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * table ( x _ 14 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND table ( x _ 14 )
* pencil ( x _ 8 ) ; * house ( x _ 11 ) ; * girl ( x _ 17 ) ; bear ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND sell . recipient ( x _ 6 , Ella ) AND sell . theme ( x _ 6 , x _ 8 ) AND sell . agent ( x _ 6 , x _ 17 ) AND pencil . nmod . in ( x _ 8 , x _ 11 ) AND house . nmod . on ( x _ 11 , x _ 14 ) AND table ( x _ 14 )


Iteration:  21%|██████████████████████████████████████████▌                                                                                                                                                                 | 5/24 [00:03<00:13,  1.43it/s, acc=1]

* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Lillian )
* boy ( x _ 5 ) ; * drink ( x _ 9 ) ; child ( x _ 1 ) AND like . agent ( x _ 2 , x _ 1 ) AND like . ccomp ( x _ 2 , x _ 6 ) AND say . agent ( x _ 6 , x _ 5 ) AND say . ccomp ( x _ 6 , x _ 11 ) AND give . theme ( x _ 11 , x _ 9 ) AND give . recipient ( x _ 11 , Lillian ) AND give . agent ( x _ 11 , Emma )


Iteration:  29%|███████████████████████████████████████████████████████████▌                                                                                                                                                | 7/24 [00:04<00:11,  1.44it/s, acc=1]

* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 14 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 14 ) AND boat ( x _ 11 )
* girl ( x _ 5 ) ; * doctor ( x _ 14 ) ; child ( x _ 1 ) AND value . agent ( x _ 2 , x _ 1 ) AND value . ccomp ( x _ 2 , x _ 6 ) AND give . agent ( x _ 6 , x _ 5 ) AND give . theme ( x _ 6 , x _ 8 ) AND give . recipient ( x _ 6 , x _ 14 ) AND yogurt ( x _ 8 ) AND yogurt . nmod . beside ( x _ 8 , x _ 11 ) AND boat ( x _ 11 )


Iteration:  46%|█████████████████████████████████████████████████████████████████████████████████████████████                                                                                                              | 11/24 [00:07<00:09,  1.36it/s, acc=1]

think . agent ( x _ 1 , Olivia ) AND think . ccomp ( x _ 1 , x _ 5 ) AND child ( x _ 4 ) AND hope . agent ( x _ 5 , x _ 4 ) AND hope . ccomp ( x _ 5 , x _ 9 ) AND girl ( x _ 8 ) AND give . agent ( x _ 9 , x _ 8 ) AND give . recipient ( x _ 9 , Emma ) AND give . theme ( x _ 9 , Emma ) AND chalk ( x _ 12 ) AND chalk . nmod . in ( x _ 12 , x _ 15 ) AND house ( x _ 15 )
think . agent ( x _ 1 , Olivia ) AND think . ccomp ( x _ 1 , x _ 5 ) AND child ( x _ 4 ) AND hope . agent ( x _ 5 , x _ 4 ) AND hope . ccomp ( x _ 5 , x _ 9 ) AND girl ( x _ 8 ) AND give . agent ( x _ 9 , x _ 8 ) AND give . recipient ( x _ 9 , Emma ) AND give . theme ( x _ 9 , x _ 12 ) AND chalk ( x _ 12 ) AND chalk . nmod . in ( x _ 12 , x _ 15 ) AND house ( x _ 15 )


Iteration:  62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                            | 15/24 [00:10<00:06,  1.39it/s, acc=1]

* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND stage ( x _ 7 )
* cake ( x _ 4 ) ; promise . recipient ( x _ 2 , Samuel ) AND promise . theme ( x _ 2 , x _ 4 ) AND promise . agent ( x _ 2 , Emma ) AND cake . nmod . beside ( x _ 4 , x _ 7 ) AND gardner ( x _ 7 )


Iteration: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 24/24 [00:16<00:00,  1.44it/s, acc=1]
Iteration: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 165/165 [07:37<00:00,  2.77s/it, acc=0.852]

obj_pp_to_subj_pp: 77.8
cp_recursion: 1.5
pp_recursion: 7.8
subj_to_obj_proper: 72.8
prim_to_obj_proper: 58.3
prim_to_subj_proper: 97.7
LEX: 98.22
OVERALL: 85.2





In [6]:
result_tables = []
for k,v in results.items():
    result_tables += [[
        k[1], v['obj_pp_to_subj_pp'], 
        v['cp_recursion'], v['pp_recursion'], 
        v['subj_to_obj_proper'], v['prim_to_obj_proper'], v['prim_to_subj_proper'],
        v['lex_acc'], v['overall_acc'], v['test_acc']
    ]]
result_df = pd.DataFrame(result_tables, columns = [
    'exp', 'obj_pp_to_subj_pp', 'cp_recursion', 'pp_recursion',
    'subj_to_obj_proper', 'prim_to_obj_proper', 'prim_to_subj_proper',
    'lex_acc', 'overall_acc', 'test_acc'
]) 
result_df.groupby(['exp'], as_index=False).mean()

Unnamed: 0,exp,obj_pp_to_subj_pp,cp_recursion,pp_recursion,subj_to_obj_proper,prim_to_obj_proper,prim_to_subj_proper,lex_acc,overall_acc,test_acc
0,cogs,76.72,1.16,8.04,74.16,52.7,95.32,98.584,85.088571,1.0


In [16]:
result_df

Unnamed: 0,exp,obj_pp_to_subj_pp,cp_recursion,pp_recursion,subj_to_obj_proper,prim_to_obj_proper,prim_to_subj_proper,lex_acc,overall_acc,test_acc
0,cogs,75.6,0.2,5.7,29.6,0.0,0.0,34.346667,29.82381,100.0
1,cogs,80.8,0.6,6.4,4.0,50.3,98.2,48.58,46.142857,1.0
2,cogs,81.2,0.4,7.3,1.9,1.3,90.2,49.66,44.152381,1.0
3,cogs,75.6,0.2,5.7,29.6,0.0,0.0,34.346667,29.82381,1.0
4,cogs,80.9,0.8,2.7,1.7,0.3,92.5,54.586667,47.509524,1.0


### Eval without absolute indexing

In [None]:
trainer.model.eval()
epoch_iterator = tqdm(test_dataloader, desc="Iteration", position=0, leave=True)
total_count = 0
correct_count = 0
for step, inputs in enumerate(epoch_iterator):
    input_ids = inputs["input_ids"].to(device)
    attention_mask = inputs["attention_mask"].to(device)
    labels = inputs["labels"].to(device)
    outputs = trainer.model.generate(
        input_ids,
        attention_mask=attention_mask,
#         eos_token_id=model_config.eos_token_id,
#         max_length=512,
    )
    decoded_preds = tgt_tokenizer.batch_decode(outputs)
    decoded_labels = tgt_tokenizer.batch_decode(labels)

    for i in range(len(decoded_preds)):
        
        index_mapping = {}
        current_idx = 0
        for t in decoded_labels[i].split():
            if t.isnumeric():
                if int(t) not in index_mapping:
                    index_mapping[int(t)] = current_idx
                    current_idx += 1
        decoded_labels_ii = []
        for t in decoded_labels[i].split():
            if t.isnumeric():
                decoded_labels_ii += [str(index_mapping[int(t)])]
            else:
                decoded_labels_ii += [t]
                
        index_mapping = {}
        current_idx = 0
        for t in decoded_preds[i].split():
            if t.isnumeric():
                if int(t) not in index_mapping:
                    index_mapping[int(t)] = current_idx
                    current_idx += 1
        decoded_preds_ii = []
        for t in decoded_preds[i].split():
            if t.isnumeric():
                decoded_preds_ii += [str(index_mapping[int(t)])]
            else:
                decoded_preds_ii += [t]
            
        
        decoded_labels_ii_str = " ".join(decoded_labels_ii)
        decoded_preds_ii_str = " ".join(decoded_preds_ii)
            
        if decoded_preds_ii_str == decoded_labels_ii_str:
            correct_count += 1
        else:
            print(decoded_labels_ii_str)
            print(decoded_preds_ii_str)

        total_count += 1
    current_acc = round(correct_count/total_count, 2)
    epoch_iterator.set_postfix({'acc': current_acc})

In [None]:
per_cat_eval = {}
for cat in set(gen_dataset.eval_cat):
    per_cat_eval[cat] = [0, 0] # correct, total
trainer.model.eval()
epoch_iterator = tqdm(gen_dataloader, desc="Iteration", position=0, leave=True)
total_count = 0
correct_count = 0
for step, inputs in enumerate(epoch_iterator):
    input_ids = inputs["input_ids"].to(device)
    attention_mask = inputs["attention_mask"].to(device)
    labels = inputs["labels"].to(device)
    outputs = trainer.model.generate(
        input_ids,
        attention_mask=attention_mask,
#         eos_token_id=model_config.eos_token_id,
#         max_length=args.max_seq_len
    )
    decoded_preds = tgt_tokenizer.batch_decode(outputs)
    decoded_labels = tgt_tokenizer.batch_decode(labels)

    input_labels = src_tokenizer.batch_decode(input_ids)
    for i in range(len(decoded_preds)):
        
        index_mapping = {}
        current_idx = 0
        for t in decoded_labels[i].split():
            if t.isnumeric():
                if int(t) not in index_mapping:
                    index_mapping[int(t)] = current_idx
                    current_idx += 1
        decoded_labels_ii = []
        for t in decoded_labels[i].split():
            if t.isnumeric():
                decoded_labels_ii += [str(index_mapping[int(t)])]
            else:
                decoded_labels_ii += [t]
                
        index_mapping = {}
        current_idx = 0
        for t in decoded_preds[i].split():
            if t.isnumeric():
                if int(t) not in index_mapping:
                    index_mapping[int(t)] = current_idx
                    current_idx += 1
        decoded_preds_ii = []
        for t in decoded_preds[i].split():
            if t.isnumeric():
                decoded_preds_ii += [str(index_mapping[int(t)])]
            else:
                decoded_preds_ii += [t]
            
        
        decoded_labels_ii_str = " ".join(decoded_labels_ii)
        decoded_preds_ii_str = " ".join(decoded_preds_ii)

        cat = gen_dataset.eval_cat[total_count]
        if decoded_preds_ii_str == decoded_labels_ii_str:
            correct_count += 1
            per_cat_eval[cat][0] += 1
            if cat == "obj_pp_to_subj_pp":
                pass
        else:
            if cat == "obj_pp_to_subj_pp":
                # pass
                print("input: ", input_labels[i])
                print("pred: ", decoded_preds_ii_str)
                print("actual: ", decoded_labels_ii_str)
                print("cat: ", cat)
                print()
        total_count += 1
        per_cat_eval[cat][1] += 1
    current_acc = correct_count/total_count
    epoch_iterator.set_postfix({'acc': current_acc})

struct_pp_acc = 0
struct_cp_acc = 0
struct_obj_subj_acc = 0

lex_acc = 0
lex_count = 0
for k, v in per_cat_eval.items():
    if k  == "pp_recursion":
        struct_pp_acc = 100 * v[0]/v[1]
    elif k  == "cp_recursion":
        struct_cp_acc = 100 * v[0]/v[1]
    elif k  == "obj_pp_to_subj_pp":
        struct_obj_subj_acc = 100 * v[0]/v[1]
    elif k  == "subj_to_obj_proper":
        subj_to_obj_proper_acc = 100 * v[0]/v[1]
    elif k  == "prim_to_obj_proper":
        prim_to_obj_proper_acc = 100 * v[0]/v[1]
    elif k  == "prim_to_subj_proper":
        prim_to_subj_proper_acc = 100 * v[0]/v[1]
    else:
        lex_acc += v[0]
        lex_count += v[1]
lex_acc /= lex_count
lex_acc *= 100
current_acc *= 100

print(f"obj_pp_to_subj_pp: {struct_obj_subj_acc}")
print(f"cp_recursion: {struct_cp_acc}")
print(f"pp_recursion: {struct_pp_acc}")
print(f"subj_to_obj_proper: {subj_to_obj_proper_acc}")
print(f"prim_to_obj_proper: {prim_to_obj_proper_acc}")
print(f"prim_to_subj_proper: {prim_to_subj_proper_acc}")
print(f"LEX: {lex_acc}")
print(f"OVERALL: {current_acc}")

results[lf] = {
    "obj_pp_to_subj_pp" : struct_obj_subj_acc,
    "cp_recursion" : struct_cp_acc,
    "pp_recursion" : struct_pp_acc,
    "subj_to_obj_proper" : subj_to_obj_proper_acc,
    "prim_to_obj_proper" : prim_to_obj_proper_acc,
    "prim_to_subj_proper" : prim_to_subj_proper_acc,
    "lex_acc" : lex_acc,
    "overall_acc" : current_acc
}