In [1]:
import model as M
import evaluate as E
import config as CFG
import os
import torch

In [2]:
DATASETS = ["billsum", "cnn_dailymail", "big_patent", "scientific_papers"]

In [3]:
def train(hierarchical, loss_func, suffix='', separate=False, use_pooler=True, use_lscore=False):
    for DATASET in DATASETS:
        train_set = M.CustomDataset(os.path.join(CFG.DATASET_ROOT, DATASET, CFG.METHOD, 'train.tsv'), hierarchical=hierarchical)
        print(len(train_set))

        model = M.Siamese(separate, use_pooler, use_lscore)
        model.to(CFG.DEVICE)

        print("Training from", DATASET)
        M.train_model(model, train_set, loss_func=loss_func, shuffle=False)

        CKPT_PATH = os.path.join(CFG.RESULT_ROOT, DATASET, CFG.METHOD+suffix, "model.pth")
        if not os.path.exists(os.path.dirname(CKPT_PATH)):
            os.makedirs(os.path.dirname(CKPT_PATH))

        scorer = model.base_model
        torch.save(scorer.state_dict(), CKPT_PATH)

        del model
        torch.cuda.empty_cache()

In [4]:
def test(suffix='', separate=False, use_pooler=False, use_lscore=True):
    for DATASET in DATASETS:
        CKPT_PATH = os.path.join(CFG.RESULT_ROOT, DATASET, CFG.METHOD+suffix, "model.pth")
        scorer = M.Scorer(separate, use_pooler, use_lscore)
        scorer.load_state_dict(torch.load(CKPT_PATH, map_location=CFG.DEVICE))
        scorer.to(CFG.DEVICE)
        scorer.eval()

        E.evaluate_newsroom("human/newsroom/newsroom-human-eval.csv", os.path.join(CFG.RESULT_ROOT, DATASET, CFG.METHOD+suffix, "test_results_newsroom.tsv"), scorer)
        E.evaluate_realsumm("human/realsumm/realsumm_100.tsv", os.path.join(CFG.RESULT_ROOT, DATASET, CFG.METHOD+suffix, "test_results_realsumm.tsv"), scorer)
        E.evaluate_tac("human/tac/TAC2010_all.json", os.path.join(CFG.RESULT_ROOT, DATASET, CFG.METHOD+suffix, "test_results_tac.tsv"), scorer)

        del scorer
        torch.cuda.empty_cache()

In [5]:
train(hierarchical=False, loss_func='CrossEntropyLoss', separate=False, use_pooler=False, use_lscore=False)
test(separate=False, use_pooler=False, use_lscore=False)
# train(hierarchical=False, loss_func='MarginRankingLoss', suffix='_NonHier', separate=True)
# test(suffix='_NonHier', separate=True)

Hierarchichal False
56847
Training from billsum
CrossEntropyLoss 0.0 False


  6%|███████████▍                                                                                                                                                                           | 999/16000 [05:06<1:16:28,  3.27it/s]

Iteration 1000, Loss 377.38579911366105


 12%|██████████████████████▋                                                                                                                                                               | 1999/16000 [10:15<1:11:40,  3.26it/s]

Iteration 2000, Loss 286.1963318718481


 19%|██████████████████████████████████                                                                                                                                                    | 2999/16000 [15:23<1:06:46,  3.25it/s]

Iteration 3000, Loss 279.73207500140416


 25%|█████████████████████████████████████████████▍                                                                                                                                        | 3999/16000 [20:31<1:02:11,  3.22it/s]

Iteration 4000, Loss 283.6875814804371


 31%|█████████████████████████████████████████████████████████▍                                                                                                                              | 4999/16000 [25:38<56:51,  3.22it/s]

Iteration 5000, Loss 272.0938816331218


 37%|████████████████████████████████████████████████████████████████████▉                                                                                                                   | 5999/16000 [30:45<51:06,  3.26it/s]

Iteration 6000, Loss 260.0420410132501


 44%|████████████████████████████████████████████████████████████████████████████████▍                                                                                                       | 6999/16000 [35:51<45:39,  3.29it/s]

Iteration 7000, Loss 261.62384959840483


 50%|███████████████████████████████████████████████████████████████████████████████████████████▉                                                                                            | 7999/16000 [40:57<40:54,  3.26it/s]

Iteration 8000, Loss 263.67999700747714


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 8999/16000 [46:03<35:41,  3.27it/s]

Iteration 9000, Loss 243.53983030695963


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 9999/16000 [51:09<30:23,  3.29it/s]

Iteration 10000, Loss 238.34372068375887


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                         | 10999/16000 [56:14<25:07,  3.32it/s]

Iteration 11000, Loss 238.6004276331596


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                             | 11999/16000 [1:01:20<20:13,  3.30it/s]

Iteration 12000, Loss 243.35444105587987


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 12999/16000 [1:06:26<15:21,  3.26it/s]

Iteration 13000, Loss 241.65230117269485


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 13999/16000 [1:11:31<10:14,  3.26it/s]

Iteration 14000, Loss 233.70290830383965


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 14999/16000 [1:16:37<05:03,  3.30it/s]

Iteration 15000, Loss 234.88310545068495


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 15999/16000 [1:21:43<00:00,  3.27it/s]

Iteration 16000, Loss 241.33150404824116


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16000/16000 [1:21:43<00:00,  3.26it/s]


Hierarchichal False
120000
Training from cnn_dailymail
CrossEntropyLoss 0.0 False


  6%|███████████▍                                                                                                                                                                           | 999/16000 [05:03<1:15:18,  3.32it/s]

Iteration 1000, Loss 293.8945315561723


 12%|██████████████████████▋                                                                                                                                                               | 1999/16000 [10:06<1:11:14,  3.28it/s]

Iteration 2000, Loss 197.12439206562703


 19%|██████████████████████████████████                                                                                                                                                    | 2999/16000 [15:10<1:05:40,  3.30it/s]

Iteration 3000, Loss 178.5363457632493


 25%|█████████████████████████████████████████████▍                                                                                                                                        | 3999/16000 [20:13<1:00:47,  3.29it/s]

Iteration 4000, Loss 176.43092340692715


 31%|█████████████████████████████████████████████████████████▍                                                                                                                              | 4999/16000 [25:17<55:20,  3.31it/s]

Iteration 5000, Loss 160.91856859865948


 37%|████████████████████████████████████████████████████████████████████▉                                                                                                                   | 5999/16000 [30:21<50:11,  3.32it/s]

Iteration 6000, Loss 156.86392163379332


 44%|████████████████████████████████████████████████████████████████████████████████▍                                                                                                       | 6999/16000 [35:25<46:04,  3.26it/s]

Iteration 7000, Loss 153.18123304621986


 50%|███████████████████████████████████████████████████████████████████████████████████████████▉                                                                                            | 7999/16000 [40:29<41:06,  3.24it/s]

Iteration 8000, Loss 157.49581713754014


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 8999/16000 [45:33<35:33,  3.28it/s]

Iteration 9000, Loss 155.85842048211657


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 9999/16000 [50:38<30:22,  3.29it/s]

Iteration 10000, Loss 146.8345043743145


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                         | 10999/16000 [55:42<25:29,  3.27it/s]

Iteration 11000, Loss 156.6292656970163


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                             | 11999/16000 [1:00:47<20:26,  3.26it/s]

Iteration 12000, Loss 138.9211182475417


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 12999/16000 [1:05:51<15:09,  3.30it/s]

Iteration 13000, Loss 158.14543689089305


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 13999/16000 [1:10:56<10:10,  3.28it/s]

Iteration 14000, Loss 152.28495537485696


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 14999/16000 [1:16:01<05:01,  3.32it/s]

Iteration 15000, Loss 151.96353224164477


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 15999/16000 [1:21:06<00:00,  3.31it/s]

Iteration 16000, Loss 144.33344931571355


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16000/16000 [1:21:06<00:00,  3.29it/s]


Hierarchichal False
120000
Training from big_patent
CrossEntropyLoss 0.0 False


  6%|███████████▍                                                                                                                                                                           | 999/16000 [05:06<1:16:27,  3.27it/s]

Iteration 1000, Loss 374.0110810259357


 12%|██████████████████████▋                                                                                                                                                               | 1999/16000 [10:12<1:11:26,  3.27it/s]

Iteration 2000, Loss 272.1334492927417


 19%|██████████████████████████████████                                                                                                                                                    | 2999/16000 [15:18<1:06:25,  3.26it/s]

Iteration 3000, Loss 242.70395847431791


 25%|█████████████████████████████████████████████▍                                                                                                                                        | 3999/16000 [20:25<1:01:13,  3.27it/s]

Iteration 4000, Loss 247.01361580530647


 31%|█████████████████████████████████████████████████████████▍                                                                                                                              | 4999/16000 [25:31<56:36,  3.24it/s]

Iteration 5000, Loss 234.36954892016365


 37%|████████████████████████████████████████████████████████████████████▉                                                                                                                   | 5999/16000 [30:37<51:17,  3.25it/s]

Iteration 6000, Loss 234.9033832255045


 44%|████████████████████████████████████████████████████████████████████████████████▍                                                                                                       | 6999/16000 [35:44<45:40,  3.28it/s]

Iteration 7000, Loss 218.96706064281352


 50%|███████████████████████████████████████████████████████████████████████████████████████████▉                                                                                            | 7999/16000 [40:51<40:58,  3.25it/s]

Iteration 8000, Loss 230.57438027094395


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 8999/16000 [45:58<35:57,  3.24it/s]

Iteration 9000, Loss 223.3417177020533


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 9999/16000 [51:06<30:26,  3.29it/s]

Iteration 10000, Loss 221.96851665463328


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                         | 10999/16000 [56:14<25:59,  3.21it/s]

Iteration 11000, Loss 224.85249180696974


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                             | 11999/16000 [1:01:22<20:36,  3.24it/s]

Iteration 12000, Loss 222.85711880844474


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 12999/16000 [1:06:29<15:15,  3.28it/s]

Iteration 13000, Loss 211.46234848694166


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 13999/16000 [1:11:37<10:17,  3.24it/s]

Iteration 14000, Loss 210.37953113858202


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 14999/16000 [1:16:46<05:07,  3.25it/s]

Iteration 15000, Loss 200.46609818071624


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 15999/16000 [1:21:54<00:00,  3.28it/s]

Iteration 16000, Loss 216.2996034183608


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16000/16000 [1:21:54<00:00,  3.26it/s]


Hierarchichal False
120000
Training from scientific_papers
CrossEntropyLoss 0.0 False


  6%|███████████▍                                                                                                                                                                           | 999/16000 [05:08<1:17:59,  3.21it/s]

Iteration 1000, Loss 382.87780818832107


 12%|██████████████████████▋                                                                                                                                                               | 1999/16000 [10:19<1:12:09,  3.23it/s]

Iteration 2000, Loss 279.9298380364198


 19%|██████████████████████████████████                                                                                                                                                    | 2999/16000 [15:29<1:07:16,  3.22it/s]

Iteration 3000, Loss 245.26820220099762


 25%|█████████████████████████████████████████████▍                                                                                                                                        | 3999/16000 [20:39<1:01:15,  3.27it/s]

Iteration 4000, Loss 247.16548493330265


 31%|█████████████████████████████████████████████████████████▍                                                                                                                              | 4999/16000 [25:49<56:51,  3.22it/s]

Iteration 5000, Loss 230.83569641562644


 37%|████████████████████████████████████████████████████████████████████▉                                                                                                                   | 5999/16000 [30:59<51:12,  3.26it/s]

Iteration 6000, Loss 232.9772453077967


 44%|████████████████████████████████████████████████████████████████████████████████▍                                                                                                       | 6999/16000 [36:08<46:53,  3.20it/s]

Iteration 7000, Loss 224.704556571407


 50%|███████████████████████████████████████████████████████████████████████████████████████████▉                                                                                            | 7999/16000 [41:18<41:22,  3.22it/s]

Iteration 8000, Loss 213.08218347425282


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 8999/16000 [46:28<36:00,  3.24it/s]

Iteration 9000, Loss 222.34277501767792


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 9999/16000 [51:39<31:07,  3.21it/s]

Iteration 10000, Loss 206.85750342493702


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                         | 10999/16000 [56:50<25:51,  3.22it/s]

Iteration 11000, Loss 208.28336146545917


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                             | 11999/16000 [1:02:03<20:48,  3.20it/s]

Iteration 12000, Loss 210.61811280605252


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 12999/16000 [1:07:15<15:41,  3.19it/s]

Iteration 13000, Loss 214.25784380108962


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 13999/16000 [1:12:28<10:30,  3.17it/s]

Iteration 14000, Loss 200.20431524276137


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 14999/16000 [1:17:40<05:12,  3.20it/s]

Iteration 15000, Loss 204.6059541458817


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 15999/16000 [1:22:52<00:00,  3.23it/s]

Iteration 16000, Loss 196.55243805553528


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16000/16000 [1:22:53<00:00,  3.22it/s]
