In [1]:
import warnings
import pandas as pd

from engine import Config, Trainer
from dataset import get_dataloaders, get_datasets

warnings.filterwarnings('ignore')

In [2]:
df = pd.read_csv("FeynmanEquationsModified.csv")
input_df = pd.read_csv("./data_400/train_df.csv")

In [3]:
datasets, train_equations, test_equations = get_datasets(df, input_df, "./data_400", [0.80, 0.1, 0.1])

In [4]:
dataloaders = get_dataloaders(datasets, 512, 512, 100)

In [5]:
config = Config(experiment_name="evolved",
                model_name="evolved_transformer",
                epochs = 10,
                optimizer_lr = 0.0005,
                optimizer_weight_decay = 0.0001,
                T_0 = 10,
                num_encoder_layers = 2,
                num_decoder_layers = 6,
                input_emb_size = 64,
                embedding_size = 64,
                hidden_dim = 64,
                pff_dim = 128,
                device = "cuda:6")
config.print_config()

Config
experiment_name                evolved
root_dir                       ./
device                         cuda:6
epochs                         10
seed                           42
use_half_precision             True
scheduler_type                 cosine_annealing_warm_restart
T_0                            10
T_mult                         1
optimizer_type                 adam
optimizer_lr                   0.0005
optimizer_momentum             0.9
optimizer_weight_decay         0.0001
optimizer_no_decay             []
clip_grad_norm                 -1
model_name                     evolved_transformer
hybrid                         True
embedding_size                 64
hidden_dim                     64
pff_dim                        128
nhead                          8
num_encoder_layers             2
num_decoder_layers             6
dropout                        0.2
pretrain                       False
input_emb_size                 64
max_input_points               33
src_vo

In [6]:
trainer = Trainer(config, dataloaders)

In [7]:
trainer.train()

[1/10] Train: 100%|███████████████████████████████████████████████████████████| 391/391 [03:42<00:00,  1.76it/s, loss=0.902]
[1/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:11<00:00,  4.10it/s]


==> Best Accuracy improved to 0.8808135 from -1


[2/10] Train: 100%|███████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.332]
[2/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:11<00:00,  4.13it/s]


==> Best Accuracy improved to 0.9402394 from 0.8808135


[3/10] Train: 100%|███████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.179]
[3/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  4.01it/s]


==> Best Accuracy improved to 0.9845948 from 0.9402394


[4/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0974]
[4/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  4.02it/s]


==> Best Accuracy improved to 0.9933432 from 0.9845948


[5/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0615]
[5/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  3.96it/s]


==> Best Accuracy improved to 0.9963568 from 0.9933432


[6/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0448]
[6/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  3.96it/s]


==> Best Accuracy improved to 0.9977374 from 0.9963568


[7/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0348]
[7/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  4.04it/s]


==> Best Accuracy improved to 0.9985052 from 0.9977374


[8/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0288]
[8/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  4.01it/s]


==> Best Accuracy improved to 0.9986778 from 0.9985052


[9/10] Train: 100%|██████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0243]
[9/10] Valid: 100%|█████████████████████████████████████████████████████████████████████████| 49/49 [00:11<00:00,  4.10it/s]


==> Best Accuracy improved to 0.9992865 from 0.9986778


[10/10] Train: 100%|█████████████████████████████████████████████████████████| 391/391 [03:38<00:00,  1.79it/s, loss=0.0211]
[10/10] Valid: 100%|████████████████████████████████████████████████████████████████████████| 49/49 [00:12<00:00,  4.05it/s]


==> Best Accuracy improved to 0.9992948 from 0.9992865


In [8]:
trainer.test_seq_acc()

[10/10] Test: 100%|███████████████████████████████████████████████████████████████████████| 250/250 [00:11<00:00, 21.46it/s]


Calculating Sequence Accuracy for predictions (1 example per batch)


Test: 100%|███████████████████████████████████████████████████████████████████████████████| 250/250 [01:02<00:00,  3.98it/s]

Test Accuracy: 0.83101 | Valid Accuracy: 0.9992948
Test Sequence Accuracy: 0.296



