In [35]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import os
from tqdm import tqdm
import torch.nn.functional as F
from gensim.models import Word2Vec
from sklearn import metrics
from sklearn.metrics import classification_report
import itertools
import random

In [10]:
import torch
import torch.nn as nn

In [11]:
device = 'cuda'

# 284 915


In [12]:
pos_weight = 915/284

In [13]:
class BertModel(nn.Module):
    def __init__(self, voc_size:int=30000, seq_len: int=512, d_model: int=384, d_ff:int=3072, pad_idx: int=1,
                num_encoder: int=12, num_heads: int=12, n_layers=6, dropout: float=0.1):
        super(BertModel, self).__init__()
        self.pad_idx = pad_idx
        self.layers = nn.ModuleList([nn.TransformerEncoderLayer(d_model=d_model, nhead=8, batch_first=True) for _ in range(n_layers)])
        self.fc = nn.Linear(d_model, d_model)
        self.activ1 = nn.Tanh()
        self.classifier = nn.Linear(d_model, 1)
        
    def forward(self, input: torch.Tensor) -> torch.Tensor:
        output = input
        for layer in self.layers:
            output = layer(output)
        #output = output.mean(dim=1, keepdim=True)
        output = output[:,-1]
        h_pooled = self.activ1(self.fc(output)) # [batch_size, d_model]
        logits_clsf = self.classifier(h_pooled) # [batch_size, 2]
        return logits_clsf # [B, S, D_model]

In [14]:
def log_metrics(preds, labels):
    preds = torch.stack(preds)
    preds = preds.cpu().detach().numpy()
    labels = torch.stack(labels)
    labels = labels.cpu().detach().numpy()
    
    
    ## Method 2 using ravel()
    fpr_micro, tpr_micro, _ = metrics.roc_curve(labels.ravel(), preds.ravel())
    auc_micro = metrics.auc(fpr_micro, tpr_micro)
    n=10
    preds = [round(i) for i in preds.ravel()]
    acc = metrics.accuracy_score(labels.ravel(), preds)
    f1 = metrics.f1_score(labels.ravel(), preds)
    preds = [preds[i*n:(i+1)*n] for i in range(len(preds)//6)]
    #target_names = list(genre_list.keys())
    #print(classification_report(labels,preds, target_names=target_names))
    return {"auc_micro": auc_micro, "acc" : acc, "f1" : f1, 'pred' : preds}

In [52]:
def train_one_epoch(dataloader, model, optimizer, device, loss_fn):
    model.train()
    tk0 = tqdm(dataloader, total=len(dataloader))
    total_loss = 0.0
    
    for source_tensor, label in tk0:
        optimizer.zero_grad()
        output = model(source_tensor.to(device))
        loss = loss_fn(output.view(-1, output.size(-1)), torch.FloatTensor([label]).to(device))
        
        total_loss += loss
        loss.backward()
        optimizer.step()
        
    avg_train_loss = total_loss / len(dataloader) 
    print(" Average training loss: {0:.2f}".format(avg_train_loss))  

def test_one_epoch(testset, model, loss_fn):
    model.eval()
    tk0 = tqdm(testset, total=len(testset))
    targets = []
    outputs = []
    total_loss = 0.0
    with torch.no_grad():
        for source_tensor, label in tk0:
            label = torch.FloatTensor([label])
            output = model(source_tensor.to(device))
            loss = loss_fn(output.view(-1, output.size(-1)), label.to(device))
            total_loss += loss
            targets.extend(label)
            outputs.extend(torch.sigmoid(output[0]).to('cpu'))
    avg_valid_loss = total_loss / len(testset) 
    score = log_metrics(outputs, targets)
    print(" Average valid loss: {0:.2f}".format(avg_valid_loss))  
    print('AUC_SCORE: ', score["auc_micro"], " acc: ", score["acc"], "f1: ", score["f1"])
    return score, avg_valid_loss
    
def fit(model, train_dataloader, valid_dataloader=None,test_dataloader=None, EPOCHS=3, lr=0.0000005):
    loss_fn = nn.BCEWithLogitsLoss(pos_weight=torch.tensor(pos_weight)) #ignore padding
    optimizer = torch.optim.AdamW(model.parameters(),lr=lr)
    for i in range(EPOCHS):
        print(f"EPOCHS:{i+1}")
        print('TRAIN')
        train_one_epoch(train_dataloader, model, optimizer, device, loss_fn)
        auc, loss = test_one_epoch(valid_dataloader,model, loss_fn)
        if i == 0:
            torch.save(model,'rnn_best.model')
            best_loss = loss
        if  loss<best_loss:
            best_loss = loss
            print(i,' EPOCH BEST MODEL!')
            torch.save(model,'rnn_best.model')
        print('Test')
        auc, loss = test_one_epoch(test_dataloader,model, loss_fn)
    best_model = torch.load('rnn_best.model')
    auc, loss  = test_one_epoch(test_dataloader,best_model, loss_fn)
    print('BEST MODEL')
    print('AUC_SCORE: ', auc["auc_micro"], " acc: ", auc["acc"], "f1: ", auc["f1"])
    return auc

            best_f1 = auc['f1']
        if  auc['f1']>best_f1:
            best_f1 = auc['f1']

In [27]:
import pickle
with open('movie_split_surprise.pickle','rb') as fw:
    movie_split = pickle.load(fw)

In [97]:
path1 = 'word2vec_model_edge/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,400)
for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
                    
                    
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])

In [99]:
bert = BertModel(d_model=400).to('cuda')
score = fit(bert, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 79.87it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 461.68it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.562111801242236  acc:  0.3333333333333333 f1:  0.375
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 484.71it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5704647676161919  acc:  0.33884297520661155 f1:  0.3548387096774193
EPOCHS:2
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 71.75it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 818.30it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5819099378881988  acc:  0.375 f1:  0.4
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.12it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6334332833583208  acc:  0.4793388429752066 f1:  0.41121495327102797
EPOCHS:3
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 85.61it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 471.50it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5954968944099379  acc:  0.4083333333333333 f1:  0.4033613445378151
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 483.02it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6619190404797601  acc:  0.48760330578512395 f1:  0.4363636363636364
EPOCHS:4
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 72.84it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.06it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.609472049689441  acc:  0.44166666666666665 f1:  0.40707964601769914
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.82it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6847826086956522  acc:  0.5206611570247934 f1:  0.4528301886792453
EPOCHS:5
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 87.41it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6304347826086957  acc:  0.5166666666666667 f1:  0.43137254901960786
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.36it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7031484257871063  acc:  0.5867768595041323 f1:  0.48979591836734687
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.21it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.76it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6370341614906833  acc:  0.5416666666666666 f1:  0.45544554455445546
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 845.39it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7136431784107946  acc:  0.5867768595041323 f1:  0.48979591836734687
EPOCHS:7
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 81.27it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 767.56it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6416925465838509  acc:  0.55 f1:  0.45999999999999996
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 777.86it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7241379310344828  acc:  0.6363636363636364 f1:  0.5217391304347827
EPOCHS:8
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 81.88it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 683.01it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6393633540372671  acc:  0.5416666666666666 f1:  0.45544554455445546
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 696.30it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7256371814092953  acc:  0.6033057851239669 f1:  0.5
EPOCHS:9
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 72.33it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 814.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.641692546583851  acc:  0.5416666666666666 f1:  0.45544554455445546
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.11it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7308845577211394  acc:  0.6198347107438017 f1:  0.5106382978723405
EPOCHS:10
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 76.32it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 464.89it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6420807453416149  acc:  0.55 f1:  0.45999999999999996
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 498.73it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7361319340329835  acc:  0.6198347107438017 f1:  0.5106382978723405
EPOCHS:11
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 83.29it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.38it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6463509316770186  acc:  0.5416666666666666 f1:  0.4444444444444445
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.38it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7402548725637181  acc:  0.6115702479338843 f1:  0.5052631578947369
EPOCHS:12
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 78.33it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 473.36it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6471273291925466  acc:  0.55 f1:  0.4375
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 476.03it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7432533733133433  acc:  0.6528925619834711 f1:  0.5227272727272727
EPOCHS:13
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 82.20it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 472.87it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6506211180124224  acc:  0.5416666666666666 f1:  0.4329896907216495
12  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 488.23it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.747376311844078  acc:  0.6446280991735537 f1:  0.5168539325842697
EPOCHS:14
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 78.09it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 788.36it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6537267080745341  acc:  0.55 f1:  0.4375
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 797.66it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7473763118440779  acc:  0.6694214876033058 f1:  0.5121951219512195
EPOCHS:15
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 82.05it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 462.73it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6564440993788819  acc:  0.575 f1:  0.4516129032258065
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 460.25it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7473763118440779  acc:  0.6776859504132231 f1:  0.5185185185185185
EPOCHS:16
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 73.06it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 826.91it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6579968944099378  acc:  0.5666666666666667 f1:  0.4468085106382979
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.75it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7503748125937032  acc:  0.6859504132231405 f1:  0.525
EPOCHS:17
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 85.58it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.97it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6611024844720497  acc:  0.5833333333333334 f1:  0.45652173913043476
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.06it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7567466266866567  acc:  0.6859504132231405 f1:  0.525
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 112.28it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 795.26it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6665372670807452  acc:  0.5833333333333334 f1:  0.45652173913043476
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 813.17it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7593703148425787  acc:  0.6776859504132231 f1:  0.5185185185185185
EPOCHS:19
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 80.95it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 797.93it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6688664596273292  acc:  0.5916666666666667 f1:  0.46153846153846156
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 801.98it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7616191904047976  acc:  0.7024793388429752 f1:  0.5384615384615385
EPOCHS:20
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 78.38it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 478.99it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6704192546583851  acc:  0.6083333333333333 f1:  0.4719101123595506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 487.24it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7649925037481259  acc:  0.71900826446281 f1:  0.5405405405405405
EPOCHS:21
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 73.90it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.50it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6719720496894409  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.27it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7664917541229386  acc:  0.7272727272727273 f1:  0.547945205479452
EPOCHS:22
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 80.52it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 472.75it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.674301242236025  acc:  0.6083333333333333 f1:  0.4719101123595506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 484.51it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7661169415292354  acc:  0.7272727272727273 f1:  0.547945205479452
EPOCHS:23
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 80.08it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 814.36it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6777950310559006  acc:  0.6 f1:  0.4545454545454545
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.40it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7657421289355322  acc:  0.7355371900826446 f1:  0.5555555555555556
EPOCHS:24
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 78.92it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 474.10it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6754658385093167  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 482.27it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7717391304347826  acc:  0.7272727272727273 f1:  0.5217391304347826
EPOCHS:25
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 77.98it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 386.51it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6805124223602484  acc:  0.6083333333333333 f1:  0.4597701149425287
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 422.02it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7694902548725637  acc:  0.7355371900826446 f1:  0.5428571428571429
EPOCHS:26
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:13<00:00, 72.26it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.50it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6851708074534161  acc:  0.6 f1:  0.4545454545454545
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.20it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7706146926536731  acc:  0.71900826446281 f1:  0.5277777777777777
EPOCHS:27
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 80.14it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 466.63it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6875000000000001  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 453.48it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7698650674662668  acc:  0.7355371900826446 f1:  0.5428571428571429
EPOCHS:28
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:12<00:00, 74.22it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 824.35it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6875  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 837.80it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7679910044977512  acc:  0.7272727272727273 f1:  0.5352112676056338
EPOCHS:29
TRAIN


100%|█████████████████████████████████████████| 963/963 [00:11<00:00, 81.97it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 760.66it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6878881987577641  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 786.09it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7687406296851574  acc:  0.743801652892562 f1:  0.5633802816901408
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 109.71it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6913819875776398  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 786.72it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7706146926536731  acc:  0.743801652892562 f1:  0.5633802816901408
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 112.95it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.14it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6933229813664596  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.51it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7736131934032983  acc:  0.7272727272727273 f1:  0.5352112676056338
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.94it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.60it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6937111801242236  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.71it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.772488755622189  acc:  0.7355371900826446 f1:  0.5428571428571429
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.52it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6925465838509317  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.51it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7724887556221889  acc:  0.7355371900826446 f1:  0.5428571428571429
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.24it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.22it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6917701863354038  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.01it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7736131934032983  acc:  0.7355371900826446 f1:  0.5428571428571429
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.69it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.08it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6929347826086957  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.79it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7713643178410795  acc:  0.7272727272727273 f1:  0.5352112676056338
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.47it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.06it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6933229813664595  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.92it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.77023988005997  acc:  0.7272727272727273 f1:  0.5217391304347826
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.03it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.08it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6925465838509317  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.34it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7713643178410795  acc:  0.7272727272727273 f1:  0.5074626865671642
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.93it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6933229813664596  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.04it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7717391304347826  acc:  0.7272727272727273 f1:  0.5074626865671642
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.18it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.51it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6937111801242236  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.07it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7694902548725637  acc:  0.71900826446281 f1:  0.5
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.89it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.46it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6929347826086957  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.89it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7691154422788605  acc:  0.71900826446281 f1:  0.5


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.28it/s]

 Average valid loss: 0.91
AUC_SCORE:  0.7616191904047976  acc:  0.7024793388429752 f1:  0.5384615384615385
BEST MODEL
AUC_SCORE:  0.7616191904047976  acc:  0.7024793388429752 f1:  0.5384615384615385
{'auc_micro': 0.7616191904047976, 'acc': 0.7024793388429752, 'f1': 0.5384615384615385, 'pred': [[0, 0, 1, 1, 0, 1, 1, 0, 0, 0], [0, 0, 1, 1, 1, 0, 0, 0, 0, 0], [0, 1, 0, 1, 0, 0, 0, 1, 0, 0], [1, 1, 0, 0, 1, 0, 0, 1, 0, 0], [1, 0, 1, 0, 0, 0, 0, 1, 0, 0], [0, 0, 0, 0, 0, 1, 0, 1, 1, 0], [1, 1, 0, 1, 1, 0, 0, 1, 1, 0], [1, 0, 1, 0, 0, 0, 1, 1, 0, 0], [0, 1, 1, 1, 1, 1, 0, 1, 0, 0], [1, 0, 0, 0, 1, 1, 0, 1, 0, 1], [0, 0, 0, 0, 1, 0, 1, 1, 1, 0], [1, 1, 0, 0, 0, 0, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





In [104]:
random.randint(0,100)

19

In [69]:
import random

# Doc2vce

In [None]:
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

# SUM

In [76]:
import pickle
with open('emb_sum.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [81]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
    if movie_name not in movie_emb.keys():
        continue
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [82]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

953
120
119


In [83]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 112.10it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.85it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.49805900621118016  acc:  0.25833333333333336 f1:  0.3776223776223776





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.13it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5310047095761381  acc:  0.2773109243697479 f1:  0.37681159420289856
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 112.53it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 781.10it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5263975155279503  acc:  0.25833333333333336 f1:  0.3776223776223776
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 808.69it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5506279434850864  acc:  0.2773109243697479 f1:  0.37681159420289856
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 112.84it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 784.94it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5399844720496895  acc:  0.275 f1:  0.3829787234042553
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 833.12it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5726059654631083  acc:  0.2857142857142857 f1:  0.3795620437956204
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 113.76it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.47it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.545807453416149  acc:  0.30833333333333335 f1:  0.39416058394160586
3  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 816.13it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5863422291993722  acc:  0.31932773109243695 f1:  0.3816793893129771
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 113.46it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 787.21it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5566770186335404  acc:  0.3416666666666667 f1:  0.3969465648854961
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 773.06it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5969387755102041  acc:  0.3445378151260504 f1:  0.3709677419354839
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 113.97it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.27it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5690993788819876  acc:  0.35 f1:  0.39999999999999997
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 829.67it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6059654631083202  acc:  0.35294117647058826 f1:  0.37398373983739835
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 116.42it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.22it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5834627329192547  acc:  0.35833333333333334 f1:  0.40310077519379844
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 827.88it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6106750392464678  acc:  0.37815126050420167 f1:  0.3833333333333333
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.87it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.14it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5873447204968945  acc:  0.36666666666666664 f1:  0.40625
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 839.38it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6165620094191523  acc:  0.3697478991596639 f1:  0.38016528925619836
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.76it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 826.18it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5974378881987578  acc:  0.375 f1:  0.4094488188976378
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 836.62it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6224489795918368  acc:  0.3697478991596639 f1:  0.38016528925619836
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.06it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.75it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6032608695652173  acc:  0.38333333333333336 f1:  0.4126984126984127
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.94it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6232339089481947  acc:  0.3865546218487395 f1:  0.38655462184873945
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.46it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.90it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6052018633540373  acc:  0.39166666666666666 f1:  0.41600000000000004
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.32it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.629120879120879  acc:  0.3949579831932773 f1:  0.38983050847457623
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 116.53it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.51it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6125776397515529  acc:  0.4 f1:  0.41935483870967744
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 842.50it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6326530612244897  acc:  0.40336134453781514 f1:  0.3931623931623932
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.30it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.51it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6152950310559007  acc:  0.4166666666666667 f1:  0.42622950819672134
12  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 840.27it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.630690737833595  acc:  0.4117647058823529 f1:  0.396551724137931
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 116.74it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.80it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6195652173913043  acc:  0.4166666666666667 f1:  0.4166666666666667
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 834.05it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.631868131868132  acc:  0.42016806722689076 f1:  0.4
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.10it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.20it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6218944099378882  acc:  0.43333333333333335 f1:  0.42372881355932207
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 840.74it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6334379905808477  acc:  0.44537815126050423 f1:  0.4107142857142857
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.76it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.18it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6207298136645962  acc:  0.44166666666666665 f1:  0.42735042735042744
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 844.47it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6326530612244898  acc:  0.453781512605042 f1:  0.4144144144144144
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.51it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.61it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6273291925465838  acc:  0.44166666666666665 f1:  0.42735042735042744
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 849.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6377551020408163  acc:  0.46218487394957986 f1:  0.4181818181818182
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 116.46it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.83it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6277173913043479  acc:  0.43333333333333335 f1:  0.41379310344827586
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6389324960753533  acc:  0.4789915966386555 f1:  0.42592592592592593
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.36it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6335403726708075  acc:  0.44166666666666665 f1:  0.42735042735042744
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 845.28it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6393249607535322  acc:  0.47058823529411764 f1:  0.4220183486238532
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.53it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.25it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6354813664596274  acc:  0.44166666666666665 f1:  0.42735042735042744
19  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 835.32it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6432496075353218  acc:  0.4789915966386555 f1:  0.42592592592592593
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.84it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.17it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6347049689440993  acc:  0.425 f1:  0.4
20  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 843.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6467817896389325  acc:  0.48739495798319327 f1:  0.42990654205607476
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.58it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.73it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6354813664596273  acc:  0.425 f1:  0.4
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 841.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6475667189952904  acc:  0.4957983193277311 f1:  0.4444444444444444
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.58it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.70it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6362577639751553  acc:  0.4583333333333333 f1:  0.4144144144144144
22  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 835.90it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.65149136577708  acc:  0.5042016806722689 f1:  0.44859813084112155
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.50it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.44it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6370341614906831  acc:  0.43333333333333335 f1:  0.40350877192982454
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6546310832025117  acc:  0.5042016806722689 f1:  0.44859813084112155
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.85it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.04it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6385869565217391  acc:  0.45 f1:  0.4107142857142857
24  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 839.97it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6565934065934066  acc:  0.5042016806722689 f1:  0.44859813084112155
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.68it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.01it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6370341614906833  acc:  0.45 f1:  0.4107142857142857
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 846.79it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6577708006279435  acc:  0.5042016806722689 f1:  0.44859813084112155
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.03it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.50it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6358695652173914  acc:  0.4583333333333333 f1:  0.4144144144144144
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 849.65it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6577708006279435  acc:  0.5378151260504201 f1:  0.4660194174757282
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.10it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6409161490683231  acc:  0.4666666666666667 f1:  0.4181818181818182
27  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 842.12it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6562009419152276  acc:  0.5462184873949579 f1:  0.4705882352941177
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.47it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.34it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6409161490683231  acc:  0.4583333333333333 f1:  0.4144144144144144
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 831.72it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6605180533751962  acc:  0.5462184873949579 f1:  0.4705882352941177
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.57it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.65it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6424689440993789  acc:  0.475 f1:  0.4220183486238532
29  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 843.09it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6632653061224489  acc:  0.5630252100840336 f1:  0.48
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.71it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.78it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6413043478260869  acc:  0.45 f1:  0.39999999999999997
30  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 842.32it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6644427001569859  acc:  0.5798319327731093 f1:  0.4897959183673469
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.55it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.25it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.640139751552795  acc:  0.4583333333333333 f1:  0.38095238095238093
31  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 838.68it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6667974882260597  acc:  0.5798319327731093 f1:  0.47916666666666674
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.45it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.01it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.639751552795031  acc:  0.45 f1:  0.4107142857142857
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 813.64it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6667974882260596  acc:  0.5798319327731093 f1:  0.4897959183673469
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.79it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.59it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.640916149068323  acc:  0.4583333333333333 f1:  0.39252336448598124
33  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 829.18it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6695447409733124  acc:  0.5798319327731093 f1:  0.47916666666666674
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.78it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.46it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6459627329192547  acc:  0.4583333333333333 f1:  0.39252336448598124
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 849.45it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6699372056514913  acc:  0.5882352941176471 f1:  0.4842105263157894
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.03it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.21it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6482919254658385  acc:  0.475 f1:  0.4220183486238532
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 845.24it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6715070643642072  acc:  0.5798319327731093 f1:  0.47916666666666674
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.08it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.16it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6475155279503105  acc:  0.45 f1:  0.4107142857142857
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 841.69it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6683673469387754  acc:  0.5630252100840336 f1:  0.4693877551020408
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.31it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.36it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6447981366459627  acc:  0.4583333333333333 f1:  0.39252336448598124
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 794.65it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6695447409733124  acc:  0.5882352941176471 f1:  0.4842105263157894
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.39it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.03it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6440217391304348  acc:  0.4583333333333333 f1:  0.4144144144144144
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 852.37it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6699372056514913  acc:  0.5630252100840336 f1:  0.4693877551020408
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.96it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6444099378881988  acc:  0.49166666666666664 f1:  0.4077669902912622
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 848.04it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6703296703296704  acc:  0.6050420168067226 f1:  0.4946236559139785


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 842.97it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6695447409733124  acc:  0.5798319327731093 f1:  0.47916666666666674
BEST MODEL
AUC_SCORE:  0.6695447409733124  acc:  0.5798319327731093 f1:  0.47916666666666674
{'auc_micro': 0.6695447409733124, 'acc': 0.5798319327731093, 'f1': 0.47916666666666674, 'pred': [[0, 0, 1, 1, 0, 1, 1, 1, 0, 0], [0, 1, 1, 1, 1, 0, 1, 1, 1, 1], [0, 1, 0, 1, 0, 0, 0, 0, 1, 0], [1, 1, 1, 0, 1, 1, 0, 1, 1, 0], [1, 0, 1, 1, 0, 0, 1, 1, 0, 0], [0, 0, 1, 0, 0, 1, 0, 1, 1, 1], [1, 0, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 0, 1, 1, 1, 1, 0, 0, 0], [1, 1, 1, 1, 0, 0, 1, 0, 0, 1], [1, 0, 1, 1, 0, 1, 1, 0, 1, 0], [0, 0, 0, 0, 0, 1, 1, 1, 0, 1], [1, 1, 1, 0, 1, 0, 1, 1, 0], [], [], [], [], [], [], []]}





# Doc2vec

In [78]:
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

In [79]:
path1 = 'doc2vec/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Doc2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.dv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.dv.index_to_key:
            emb = w2v.dv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [80]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 113.96it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.44it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5597826086956522  acc:  0.49166666666666664 f1:  0.3711340206185567





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.75it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5637181409295353  acc:  0.4793388429752066 f1:  0.37623762376237624
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 112.65it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 746.11it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5372670807453416  acc:  0.49166666666666664 f1:  0.3711340206185567
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.06it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5652173913043478  acc:  0.48760330578512395 f1:  0.38
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.47it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.21it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5287267080745341  acc:  0.48333333333333334 f1:  0.36734693877551017
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 837.56it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5674662668665668  acc:  0.4793388429752066 f1:  0.37623762376237624
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 112.56it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.71it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5271739130434783  acc:  0.44166666666666665 f1:  0.34951456310679613
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.94it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5693403298350824  acc:  0.45454545454545453 f1:  0.39999999999999997
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.09it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.81it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5139751552795032  acc:  0.4083333333333333 f1:  0.32380952380952377
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.02it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5670914542728634  acc:  0.4297520661157025 f1:  0.3893805309734514
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.40it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.37it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5085403726708074  acc:  0.45 f1:  0.32653061224489793
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.11it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.568215892053973  acc:  0.45454545454545453 f1:  0.39999999999999997
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.87it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.66it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4980590062111801  acc:  0.36666666666666664 f1:  0.29629629629629634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.42it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5663418290854573  acc:  0.4132231404958678 f1:  0.3931623931623932
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.81it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.49it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4926242236024844  acc:  0.4583333333333333 f1:  0.3157894736842105
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.94it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5663418290854573  acc:  0.4380165289256198 f1:  0.3928571428571429
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.62it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.84it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4856366459627329  acc:  0.44166666666666665 f1:  0.27956989247311825
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.87it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5637181409295352  acc:  0.4380165289256198 f1:  0.38181818181818183
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.45it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.90it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.48408385093167705  acc:  0.425 f1:  0.2736842105263158
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.23it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5648425787106447  acc:  0.4462809917355372 f1:  0.38532110091743116
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.94it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.81it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4922360248447205  acc:  0.4 f1:  0.2653061224489796
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.24it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5667166416791602  acc:  0.4214876033057851 f1:  0.3859649122807018
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.92it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.89it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4930124223602485  acc:  0.43333333333333335 f1:  0.2765957446808511
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.46it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5640929535232383  acc:  0.4214876033057851 f1:  0.36363636363636365
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.50it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.58it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4941770186335404  acc:  0.43333333333333335 f1:  0.2765957446808511
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.04it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5599700149925038  acc:  0.4380165289256198 f1:  0.37037037037037035
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.46it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.38it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.49223602484472057  acc:  0.4583333333333333 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.02it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5554722638680659  acc:  0.45454545454545453 f1:  0.36538461538461536
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.75it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.35it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4891304347826087  acc:  0.4666666666666667 f1:  0.2888888888888889
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.98it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.552848575712144  acc:  0.4628099173553719 f1:  0.36893203883495146
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.16it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.07it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4829192546583851  acc:  0.4666666666666667 f1:  0.2888888888888889
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.21it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5494752623688155  acc:  0.4628099173553719 f1:  0.36893203883495146
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.34it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.04it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4809782608695653  acc:  0.45 f1:  0.2826086956521739
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 898.19it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.552848575712144  acc:  0.45454545454545453 f1:  0.36538461538461536
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.58it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.02it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.47981366459627334  acc:  0.5 f1:  0.3023255813953489
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.10it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5554722638680659  acc:  0.4793388429752066 f1:  0.37623762376237624
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.53it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.27it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4825310559006212  acc:  0.49166666666666664 f1:  0.2823529411764706
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 886.89it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5562218890554722  acc:  0.4793388429752066 f1:  0.36363636363636365
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.12it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.21it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.48291925465838514  acc:  0.48333333333333334 f1:  0.26190476190476186
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.47it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5535982008995503  acc:  0.48760330578512395 f1:  0.3541666666666667
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.98it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.93it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.48214285714285715  acc:  0.5 f1:  0.26829268292682923
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 898.06it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5539730134932533  acc:  0.5041322314049587 f1:  0.37500000000000006
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.65it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.55it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.48291925465838514  acc:  0.49166666666666664 f1:  0.2469135802469136
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 891.72it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5539730134932533  acc:  0.512396694214876 f1:  0.37894736842105264
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.00it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.56it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.484472049689441  acc:  0.5083333333333333 f1:  0.2531645569620253
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.92it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5498500749625188  acc:  0.5206611570247934 f1:  0.3695652173913043
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.93it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.42it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.48486024844720493  acc:  0.49166666666666664 f1:  0.3296703296703297
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.90it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5509745127436282  acc:  0.4793388429752066 f1:  0.36363636363636365
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.80it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.37it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.48680124223602483  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.69it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.552848575712144  acc:  0.5206611570247934 f1:  0.3695652173913043
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.93it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.26it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4891304347826087  acc:  0.5333333333333333 f1:  0.28205128205128205
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 895.71it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5535982008995501  acc:  0.5289256198347108 f1:  0.3736263736263736
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.31it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.56it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4910714285714286  acc:  0.55 f1:  0.2894736842105263
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.80it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5577211394302849  acc:  0.5289256198347108 f1:  0.3736263736263736
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.29it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.36it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.48951863354037267  acc:  0.5416666666666666 f1:  0.32098765432098764
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 894.12it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5592203898050975  acc:  0.512396694214876 f1:  0.3655913978494624
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.16it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.68it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.48990683229813664  acc:  0.5416666666666666 f1:  0.367816091954023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 893.09it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5610944527736133  acc:  0.5041322314049587 f1:  0.36170212765957444
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.77it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.19it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.48874223602484473  acc:  0.5583333333333333 f1:  0.3291139240506329
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 892.45it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5603448275862069  acc:  0.5041322314049587 f1:  0.36170212765957444
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.22it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.51it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.48796583850931674  acc:  0.55 f1:  0.3571428571428571
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 900.25it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5603448275862069  acc:  0.5041322314049587 f1:  0.36170212765957444
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.16it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.05it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.4875776397515528  acc:  0.5416666666666666 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 893.65it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5640929535232384  acc:  0.512396694214876 f1:  0.3516483516483517
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.10it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.62it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.48524844720496896  acc:  0.5583333333333333 f1:  0.3291139240506329
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 888.56it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5648425787106447  acc:  0.512396694214876 f1:  0.3516483516483517
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.60it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.88it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.484860248447205  acc:  0.5583333333333333 f1:  0.34567901234567905
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.76it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5663418290854573  acc:  0.512396694214876 f1:  0.3516483516483517
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.98it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.18it/s]


 Average valid loss: 1.19
AUC_SCORE:  0.48408385093167705  acc:  0.5583333333333333 f1:  0.34567901234567905
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 887.24it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5648425787106447  acc:  0.512396694214876 f1:  0.3516483516483517
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.77it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.24it/s]


 Average valid loss: 1.20
AUC_SCORE:  0.4809782608695653  acc:  0.5333333333333333 f1:  0.3488372093023256
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 894.60it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5670914542728636  acc:  0.49586776859504134 f1:  0.3440860215053763
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.80it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.10it/s]


 Average valid loss: 1.21
AUC_SCORE:  0.48097826086956524  acc:  0.55 f1:  0.3414634146341463
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.98it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5644677661169415  acc:  0.512396694214876 f1:  0.3516483516483517
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 113.17it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.49it/s]


 Average valid loss: 1.23
AUC_SCORE:  0.47787267080745344  acc:  0.5583333333333333 f1:  0.3291139240506329
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 887.26it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.5663418290854572  acc:  0.5371900826446281 f1:  0.34883720930232553
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.60it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.90it/s]


 Average valid loss: 1.23
AUC_SCORE:  0.47903726708074534  acc:  0.5416666666666666 f1:  0.3373493975903614
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 897.47it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.5659670164917542  acc:  0.5454545454545454 f1:  0.367816091954023
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.56it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 815.48it/s]


 Average valid loss: 1.25
AUC_SCORE:  0.4794254658385093  acc:  0.5333333333333333 f1:  0.3170731707317073
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.43it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5659670164917542  acc:  0.5454545454545454 f1:  0.367816091954023


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.47it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.5637181409295353  acc:  0.4793388429752066 f1:  0.37623762376237624
BEST MODEL
AUC_SCORE:  0.5637181409295353  acc:  0.4793388429752066 f1:  0.37623762376237624
{'auc_micro': 0.5637181409295353, 'acc': 0.4793388429752066, 'f1': 0.37623762376237624, 'pred': [[0, 1, 1, 1, 1, 1, 0, 1, 0, 0], [1, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1, 1, 1, 0, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 0, 1, 1], [0, 1, 1, 0, 0, 1, 1, 0, 1, 0], [0, 1, 1, 1, 0, 1, 0, 1, 0, 1], [0, 0, 1, 0, 0, 1, 1, 0, 1, 1], [1, 1, 0, 1, 0, 1, 0, 0, 1, 0], [0, 0, 1, 1, 0, 1, 1, 1, 0, 1], [1, 1, 0, 0, 1, 1, 0, 0, 1, 1], [1, 0, 0, 0, 0, 1, 0, 1, 1, 1], [0, 1, 1, 1, 0, 0, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





# 평균 임베딩

In [71]:
import pickle
with open('emb_avg2.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [72]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [73]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [74]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.86it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.25it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6374223602484472  acc:  0.475 f1:  0.4424778761061947





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 800.14it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6705397301349325  acc:  0.45454545454545453 f1:  0.43103448275862066
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.32it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.16it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.654891304347826  acc:  0.48333333333333334 f1:  0.4464285714285715
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.15it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7053973013493253  acc:  0.4793388429752066 f1:  0.44247787610619466
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.19it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 801.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6607142857142857  acc:  0.48333333333333334 f1:  0.4363636363636364
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 798.03it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.722263868065967  acc:  0.512396694214876 f1:  0.4587155963302752
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.58it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 793.89it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6680900621118012  acc:  0.5 f1:  0.4339622641509434
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7312593703148426  acc:  0.5289256198347108 f1:  0.4672897196261683
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.32it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.20it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6700310559006211  acc:  0.5416666666666666 f1:  0.4444444444444445
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.32it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7346326836581708  acc:  0.5867768595041323 f1:  0.5
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.91it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 794.26it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6739130434782609  acc:  0.5416666666666666 f1:  0.4329896907216495
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 783.25it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7376311844077961  acc:  0.5950413223140496 f1:  0.5050505050505051
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.66it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.77it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6770186335403727  acc:  0.5333333333333333 f1:  0.4285714285714285
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.17it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7413793103448275  acc:  0.5785123966942148 f1:  0.4950495049504951
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.80it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.71it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6789596273291925  acc:  0.5833333333333334 f1:  0.45652173913043476
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 795.23it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7436281859070465  acc:  0.628099173553719 f1:  0.5263157894736842
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.97it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.70it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6824534161490683  acc:  0.5833333333333334 f1:  0.45652173913043476
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 790.86it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7492503748125936  acc:  0.6528925619834711 f1:  0.5333333333333333
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.15it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.56it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6847826086956522  acc:  0.5833333333333334 f1:  0.45652173913043476
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.76it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7492503748125937  acc:  0.6446280991735537 f1:  0.5274725274725275
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.18it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 808.59it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6840062111801243  acc:  0.5916666666666667 f1:  0.44943820224719094
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.46it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7537481259370314  acc:  0.6611570247933884 f1:  0.5393258426966292
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.94it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.20it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.687111801242236  acc:  0.5833333333333334 f1:  0.4444444444444444
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 799.68it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7559970014992504  acc:  0.6528925619834711 f1:  0.5333333333333333
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.80it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 796.45it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.6851708074534162  acc:  0.5916666666666667 f1:  0.44943820224719094
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 787.26it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7593703148425788  acc:  0.6611570247933884 f1:  0.5393258426966292
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.90it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.94it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.6875  acc:  0.575 f1:  0.4516129032258065
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 795.59it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.757496251874063  acc:  0.6528925619834711 f1:  0.5333333333333333
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.27it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 813.48it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.6917701863354038  acc:  0.5916666666666667 f1:  0.43678160919540227
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 798.23it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.757496251874063  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.46it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 807.77it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6952639751552795  acc:  0.575 f1:  0.4516129032258065
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 800.75it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7571214392803598  acc:  0.6528925619834711 f1:  0.5333333333333333
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.23it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 812.04it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6906055900621118  acc:  0.6083333333333333 f1:  0.4719101123595506
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 793.90it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7586206896551724  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.75it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 809.04it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6913819875776398  acc:  0.6166666666666667 f1:  0.46511627906976755
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 798.19it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7608695652173914  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.33it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.09it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6898291925465838  acc:  0.6083333333333333 f1:  0.4597701149425287
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 795.65it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7623688155922039  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.80it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 810.27it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6929347826086957  acc:  0.6 f1:  0.4666666666666667
19  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 795.31it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7597451274362819  acc:  0.6694214876033058 f1:  0.5454545454545454
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.21it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 800.70it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6944875776397516  acc:  0.6166666666666667 f1:  0.4772727272727271
20  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.55it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7634932533733134  acc:  0.6776859504132231 f1:  0.5517241379310345
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.00it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 812.25it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6937111801242236  acc:  0.6166666666666667 f1:  0.4772727272727271
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 798.65it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7631184407796102  acc:  0.6776859504132231 f1:  0.5517241379310345
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.51it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 796.26it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.6929347826086957  acc:  0.6166666666666667 f1:  0.4772727272727271
22  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 795.01it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7631184407796101  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.91it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 809.06it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.6940993788819876  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 796.73it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7642428785607196  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.71it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 796.00it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.6925465838509317  acc:  0.625 f1:  0.4827586206896552
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 789.72it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7623688155922039  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.35it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.33it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.6956521739130435  acc:  0.6333333333333333 f1:  0.48837209302325585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.83it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.762743628185907  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.81it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 792.95it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.6944875776397516  acc:  0.6333333333333333 f1:  0.48837209302325585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 793.11it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7638680659670165  acc:  0.6859504132231405 f1:  0.5476190476190476
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.43it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 794.21it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6937111801242236  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 789.13it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7608695652173914  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.67it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 792.24it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6960403726708074  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 784.85it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7593703148425788  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.41it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.54it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6972049689440993  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 791.28it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7571214392803598  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.54it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 805.37it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6972049689440993  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 780.84it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7574962518740629  acc:  0.6776859504132231 f1:  0.5301204819277108
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.75it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 800.88it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6991459627329193  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 789.19it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7559970014992503  acc:  0.6776859504132231 f1:  0.5301204819277108
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.76it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.75it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6983695652173912  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 791.81it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7526236881559221  acc:  0.6859504132231405 f1:  0.5365853658536586
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.78it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.92it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.6979813664596274  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 791.01it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7522488755622189  acc:  0.6859504132231405 f1:  0.5365853658536586
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.30it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 802.91it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6987577639751553  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 784.93it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.75  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.03it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 810.94it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6999223602484472  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 790.76it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.75  acc:  0.6942148760330579 f1:  0.5432098765432098
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.59it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 800.07it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6999223602484472  acc:  0.6166666666666667 f1:  0.4772727272727271
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 789.59it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7455022488755623  acc:  0.6694214876033058 f1:  0.5348837209302325
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.34it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 808.98it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7003105590062112  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 801.69it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7466266866566716  acc:  0.6942148760330579 f1:  0.5542168674698795
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.36it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.69it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6979813664596273  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 792.44it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7458770614692655  acc:  0.6942148760330579 f1:  0.5542168674698795
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.46it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 813.06it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6972049689440993  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.70it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7428785607196402  acc:  0.6611570247933884 f1:  0.4938271604938272


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 791.15it/s]

 Average valid loss: 0.88
AUC_SCORE:  0.7631184407796101  acc:  0.6776859504132231 f1:  0.5411764705882354
BEST MODEL
AUC_SCORE:  0.7631184407796101  acc:  0.6776859504132231 f1:  0.5411764705882354
{'auc_micro': 0.7631184407796101, 'acc': 0.6776859504132231, 'f1': 0.5411764705882354, 'pred': [[0, 0, 1, 1, 0, 1, 1, 1, 0, 1], [0, 0, 1, 0, 1, 0, 0, 0, 1, 1], [1, 1, 0, 1, 0, 0, 0, 0, 1, 0], [1, 0, 0, 0, 1, 0, 0, 0, 1, 0], [1, 0, 1, 0, 0, 0, 0, 0, 0, 0], [1, 1, 1, 0, 0, 1, 0, 1, 1, 1], [1, 0, 0, 1, 0, 0, 0, 1, 1, 0], [1, 1, 1, 0, 0, 1, 1, 1, 0, 0], [0, 1, 1, 1, 0, 1, 0, 1, 0, 0], [0, 1, 0, 1, 1, 1, 0, 0, 0, 1], [0, 0, 0, 0, 1, 0, 1, 1, 1, 0], [1, 1, 0, 0, 0, 0, 1, 1, 1, 1], [0], [], [], [], [], [], [], []]}





# 그냥 metapath

In [66]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [67]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [68]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.14it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 780.99it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5559006211180124  acc:  0.31666666666666665 f1:  0.39705882352941174





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 777.69it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5273613193403298  acc:  0.2809917355371901 f1:  0.3649635036496351
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 110.76it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 770.83it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6129658385093167  acc:  0.4 f1:  0.4285714285714285
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 778.69it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6368065967016492  acc:  0.36363636363636365 f1:  0.3937007874015748
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 110.50it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 769.39it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6436335403726707  acc:  0.45 f1:  0.45
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 760.29it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6836581709145427  acc:  0.4214876033057851 f1:  0.41666666666666663
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.02it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.87it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.657608695652174  acc:  0.5416666666666666 f1:  0.49541284403669716
3  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.70it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7117691154422788  acc:  0.45454545454545453 f1:  0.41071428571428575
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.11it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.40it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6665372670807453  acc:  0.5583333333333333 f1:  0.48543689320388345
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.26it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7282608695652175  acc:  0.512396694214876 f1:  0.4380952380952381
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.00it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.83it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6754658385093167  acc:  0.575 f1:  0.4950495049504951
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.78it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7368815592203897  acc:  0.5371900826446281 f1:  0.45098039215686275
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.67it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.46it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6793478260869565  acc:  0.5666666666666667 f1:  0.48
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.51it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7406296851574212  acc:  0.5454545454545454 f1:  0.4554455445544554
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.05it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.83it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.688664596273292  acc:  0.5666666666666667 f1:  0.4693877551020408
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 838.65it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7451274362818591  acc:  0.5785123966942148 f1:  0.4742268041237113
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.38it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.93it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6929347826086957  acc:  0.5916666666666667 f1:  0.4731182795698925
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.71it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7518740629685157  acc:  0.6198347107438017 f1:  0.5
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.19it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.33it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6925465838509317  acc:  0.6 f1:  0.4782608695652174
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 810.81it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7552473763118441  acc:  0.628099173553719 f1:  0.5054945054945055
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.72it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.16it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6944875776397516  acc:  0.5916666666666667 f1:  0.46153846153846156
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 807.56it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7604947526236882  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.33it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 824.20it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6933229813664596  acc:  0.6 f1:  0.4782608695652174
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.66it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7646176911544228  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.83it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.38it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6948757763975155  acc:  0.6 f1:  0.4782608695652174
12  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.88it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7683658170914542  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.57it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.27it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.6960403726708074  acc:  0.6083333333333333 f1:  0.4946236559139785
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.89it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7732383808095953  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.93it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.56it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.701086956521739  acc:  0.6 f1:  0.4545454545454545
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.29it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7792353823088456  acc:  0.6528925619834711 f1:  0.5227272727272727
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.83it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.82it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7038043478260869  acc:  0.6166666666666667 f1:  0.4772727272727271
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.80it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7826086956521738  acc:  0.6528925619834711 f1:  0.5227272727272727
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.42it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.21it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.7084627329192547  acc:  0.625 f1:  0.49438202247191004
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.61it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7829835082458771  acc:  0.6446280991735537 f1:  0.5168539325842697
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.49it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.90it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.7158385093167703  acc:  0.6416666666666667 f1:  0.5057471264367817
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.52it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7867316341829085  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.85it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.78it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.71777950310559  acc:  0.6583333333333333 f1:  0.5287356321839081
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.95it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7871064467766117  acc:  0.628099173553719 f1:  0.4943820224719101
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 113.66it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 785.84it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7197204968944099  acc:  0.6583333333333333 f1:  0.5176470588235293
19  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.81it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7927286356821589  acc:  0.6446280991735537 f1:  0.4941176470588236
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.69it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.41it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7212732919254659  acc:  0.6833333333333333 f1:  0.5476190476190476
20  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.10it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7938530734632684  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.05it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.21it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.71777950310559  acc:  0.6833333333333333 f1:  0.5365853658536585
21  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.00it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7957271364317842  acc:  0.6611570247933884 f1:  0.4938271604938272
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.10it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.41it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.718555900621118  acc:  0.6916666666666667 f1:  0.5542168674698795
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 808.26it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7919790104947526  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.10it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.05it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.717391304347826  acc:  0.6833333333333333 f1:  0.5365853658536585
23  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.09it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7908545727136431  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.27it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.53it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.71972049689441  acc:  0.6833333333333333 f1:  0.5365853658536585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.54it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.790104947526237  acc:  0.6694214876033058 f1:  0.5
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.80it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.30it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7216614906832297  acc:  0.6833333333333333 f1:  0.5365853658536585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.43it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.787856071964018  acc:  0.6694214876033058 f1:  0.5
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.23it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.32it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7212732919254659  acc:  0.6666666666666666 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.10it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7874812593703149  acc:  0.6694214876033058 f1:  0.5
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.20it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.67it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7189440993788819  acc:  0.6833333333333333 f1:  0.5476190476190476
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.52it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7859820089955022  acc:  0.6694214876033058 f1:  0.5121951219512195
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.25it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.84it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7216614906832298  acc:  0.6666666666666666 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.78it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7882308845577211  acc:  0.6776859504132231 f1:  0.5185185185185185
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.21it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.80it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7224378881987576  acc:  0.6916666666666667 f1:  0.5542168674698795
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 803.97it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7837331334332833  acc:  0.6694214876033058 f1:  0.5121951219512195
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.32it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.35it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7224378881987579  acc:  0.675 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.08it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7818590704647677  acc:  0.6776859504132231 f1:  0.5185185185185185
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.83it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.86it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7251552795031055  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 789.36it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7871064467766117  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.00it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 824.18it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7239906832298137  acc:  0.675 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.68it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7856071964017991  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.09it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.32it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7236024844720497  acc:  0.675 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 831.29it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7837331334332833  acc:  0.6776859504132231 f1:  0.49350649350649356
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.88it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.19it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7270962732919255  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.38it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.782983508245877  acc:  0.6776859504132231 f1:  0.49350649350649356
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.55it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.16it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7251552795031055  acc:  0.675 f1:  0.5185185185185185
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.68it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7799850074962519  acc:  0.6859504132231405 f1:  0.5128205128205129
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.86it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.60it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7239906832298136  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.68it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7796101949025487  acc:  0.6859504132231405 f1:  0.4999999999999999
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.31it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 824.32it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7251552795031055  acc:  0.675 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.80it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7792353823088456  acc:  0.6776859504132231 f1:  0.49350649350649356
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.78it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.05it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7259316770186335  acc:  0.6916666666666667 f1:  0.5194805194805194
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.61it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7762368815592203  acc:  0.6859504132231405 f1:  0.4999999999999999
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.84it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.46it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7263198757763976  acc:  0.6833333333333333 f1:  0.5365853658536585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 787.20it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7732383808095952  acc:  0.6694214876033058 f1:  0.48717948717948717


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.25it/s]

 Average valid loss: 0.85
AUC_SCORE:  0.7908545727136431  acc:  0.6776859504132231 f1:  0.5063291139240508
BEST MODEL
AUC_SCORE:  0.7908545727136431  acc:  0.6776859504132231 f1:  0.5063291139240508
{'auc_micro': 0.7908545727136431, 'acc': 0.6776859504132231, 'f1': 0.5063291139240508, 'pred': [[0, 0, 1, 1, 0, 1, 0, 1, 0, 0], [0, 0, 1, 0, 1, 0, 0, 0, 1, 1], [0, 1, 0, 1, 0, 0, 0, 0, 1, 0], [0, 1, 0, 0, 1, 0, 0, 1, 1, 0], [1, 0, 1, 0, 0, 0, 1, 1, 0, 0], [0, 0, 0, 0, 0, 1, 0, 1, 1, 1], [1, 0, 0, 0, 1, 0, 0, 1, 1, 0], [1, 1, 1, 0, 1, 0, 1, 1, 0, 0], [0, 1, 1, 1, 1, 1, 1, 1, 0, 0], [0, 0, 0, 1, 1, 1, 0, 0, 0, 1], [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], [0, 1, 0, 0, 0, 0, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





# Main_act

In [69]:
path1 = 'word2vec_model_extra+emb/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [70]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.71it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.20it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.5974378881987578  acc:  0.38333333333333336 f1:  0.3934426229508196





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.49it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6926536731634183  acc:  0.4132231404958678 f1:  0.3931623931623932
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 113.74it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.70it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6387810559006212  acc:  0.475 f1:  0.4424778761061947
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 810.30it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7256371814092953  acc:  0.45454545454545453 f1:  0.41071428571428575
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.20it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.76it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6618788819875776  acc:  0.55 f1:  0.4705882352941177
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 802.09it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7432533733133433  acc:  0.5041322314049587 f1:  0.4339622641509434
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.31it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6777950310559007  acc:  0.5583333333333333 f1:  0.4952380952380952
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 797.20it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7541229385307348  acc:  0.512396694214876 f1:  0.4380952380952381
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.70it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 815.38it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6828416149068324  acc:  0.575 f1:  0.4742268041237113
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 815.07it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7582458770614692  acc:  0.5785123966942148 f1:  0.4742268041237113
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.73it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 826.20it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.68944099378882  acc:  0.6 f1:  0.4893617021276596
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 816.45it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7661169415292354  acc:  0.5950413223140496 f1:  0.4731182795698925
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.08it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.30it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6975931677018633  acc:  0.5916666666666667 f1:  0.4842105263157894
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.25it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7781109445277361  acc:  0.5950413223140496 f1:  0.4615384615384615
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.82it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.54it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7026397515527951  acc:  0.5916666666666667 f1:  0.4842105263157894
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.69it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7859820089955023  acc:  0.5950413223140496 f1:  0.4615384615384615
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.70it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.30it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.7069099378881988  acc:  0.575 f1:  0.4516129032258065
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.75it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7908545727136432  acc:  0.6033057851239669 f1:  0.4666666666666667
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.50it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 817.93it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7088509316770186  acc:  0.575 f1:  0.4516129032258065
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 810.42it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7934782608695652  acc:  0.6033057851239669 f1:  0.45454545454545453
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.18it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.26it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.7104037267080746  acc:  0.5833333333333334 f1:  0.45652173913043476
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.02it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7968515742128935  acc:  0.628099173553719 f1:  0.47058823529411764
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.91it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 818.29it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7142857142857143  acc:  0.5916666666666667 f1:  0.46153846153846156
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 812.85it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7961019490254873  acc:  0.628099173553719 f1:  0.47058823529411764
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.29it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.69it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.7150621118012422  acc:  0.5916666666666667 f1:  0.46153846153846156
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.03it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7991004497751124  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.13it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.64it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7162267080745341  acc:  0.5916666666666667 f1:  0.4731182795698925
13  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.88it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.8024737631184408  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.60it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.59it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.71972049689441  acc:  0.6333333333333333 f1:  0.48837209302325585
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.19it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.8050974512743628  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.20it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.60it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7208850931677019  acc:  0.625 f1:  0.49438202247191004
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 808.78it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.8058470764617691  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.40it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.48it/s]

 Average valid loss: 0.94
AUC_SCORE:  0.7228260869565217  acc:  0.6333333333333333 f1:  0.5
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 806.42it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.8125937031484258  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.85it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.09it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7255434782608695  acc:  0.625 f1:  0.49438202247191004
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.65it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.8137181409295353  acc:  0.6776859504132231 f1:  0.5063291139240508
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.33it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.59it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7255434782608696  acc:  0.6333333333333333 f1:  0.48837209302325585
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.46it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.8174662668665666  acc:  0.6859504132231405 f1:  0.5128205128205129
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.74it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 826.00it/s]

 Average valid loss: 0.93
AUC_SCORE:  0.7286490683229815  acc:  0.6333333333333333 f1:  0.48837209302325585
19  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.57it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.8159670164917541  acc:  0.6859504132231405 f1:  0.5128205128205129
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.02it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.34it/s]

 Average valid loss: 0.93
AUC_SCORE:  0.7302018633540373  acc:  0.6333333333333333 f1:  0.48837209302325585
20  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.20it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.8174662668665666  acc:  0.6859504132231405 f1:  0.5128205128205129
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.27it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 812.43it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7333074534161491  acc:  0.6416666666666667 f1:  0.49411764705882344
21  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 807.71it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.818215892053973  acc:  0.6942148760330579 f1:  0.5194805194805195
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.68it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.71it/s]

 Average valid loss: 0.93
AUC_SCORE:  0.734472049689441  acc:  0.65 f1:  0.5
22  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.89it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.81784107946027  acc:  0.6942148760330579 f1:  0.5194805194805195
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.38it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.95it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.733307453416149  acc:  0.65 f1:  0.5
23  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.77it/s]


 Average valid loss: 0.81
AUC_SCORE:  0.8163418290854574  acc:  0.7024793388429752 f1:  0.5263157894736842
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.00it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.12it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7329192546583851  acc:  0.65 f1:  0.5
24  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 807.96it/s]


 Average valid loss: 0.81
AUC_SCORE:  0.8167166416791605  acc:  0.7107438016528925 f1:  0.5454545454545455
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.07it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 814.81it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7305900621118013  acc:  0.6416666666666667 f1:  0.49411764705882344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 796.71it/s]


 Average valid loss: 0.81
AUC_SCORE:  0.8137181409295353  acc:  0.7024793388429752 f1:  0.5384615384615385
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.89it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 815.26it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7305900621118012  acc:  0.6583333333333333 f1:  0.5060240963855421
26  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 786.59it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.81784107946027  acc:  0.71900826446281 f1:  0.5526315789473684
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.56it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 806.68it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7286490683229813  acc:  0.6833333333333333 f1:  0.5250000000000001
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 792.36it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8174662668665668  acc:  0.7355371900826446 f1:  0.5675675675675675
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.50it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.38it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7286490683229814  acc:  0.65 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 806.07it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8159670164917541  acc:  0.71900826446281 f1:  0.564102564102564
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 110.76it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 779.33it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7302018633540373  acc:  0.65 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 782.40it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8163418290854574  acc:  0.7272727272727273 f1:  0.5714285714285715
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.25it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 797.53it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7302018633540373  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.69it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.815592203898051  acc:  0.743801652892562 f1:  0.5866666666666667
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 113.26it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 777.40it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7278726708074534  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 774.42it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.815592203898051  acc:  0.7272727272727273 f1:  0.5714285714285715
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.28it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.40it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7294254658385093  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 803.72it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8140929535232384  acc:  0.7272727272727273 f1:  0.5599999999999999
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 111.57it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.05it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7294254658385093  acc:  0.6666666666666666 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.33it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8152173913043479  acc:  0.71900826446281 f1:  0.5526315789473684
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.21it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.40it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7282608695652174  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 809.48it/s]


 Average valid loss: 0.80
AUC_SCORE:  0.8125937031484258  acc:  0.71900826446281 f1:  0.5526315789473684
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.82it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.26it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7294254658385093  acc:  0.6583333333333333 f1:  0.48101265822784806
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 803.17it/s]


 Average valid loss: 0.81
AUC_SCORE:  0.8144677661169415  acc:  0.7355371900826446 f1:  0.5675675675675675
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.21it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.16it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7313664596273293  acc:  0.65 f1:  0.475
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 837.47it/s]


 Average valid loss: 0.81
AUC_SCORE:  0.8080959520239881  acc:  0.71900826446281 f1:  0.5526315789473684
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.26it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.30it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7305900621118012  acc:  0.6583333333333333 f1:  0.48101265822784806
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.80it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8084707646176912  acc:  0.7272727272727273 f1:  0.5599999999999999
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.46it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.60it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7313664596273293  acc:  0.6583333333333333 f1:  0.48101265822784806
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.15it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8065967016491754  acc:  0.7272727272727273 f1:  0.5599999999999999
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.93it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 795.78it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7302018633540374  acc:  0.6583333333333333 f1:  0.48101265822784806
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 788.58it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8050974512743628  acc:  0.7272727272727273 f1:  0.5599999999999999


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 785.08it/s]

 Average valid loss: 0.80
AUC_SCORE:  0.81784107946027  acc:  0.71900826446281 f1:  0.5526315789473684
BEST MODEL
AUC_SCORE:  0.81784107946027  acc:  0.71900826446281 f1:  0.5526315789473684
{'auc_micro': 0.81784107946027, 'acc': 0.71900826446281, 'f1': 0.5526315789473684, 'pred': [[0, 0, 1, 1, 0, 1, 1, 1, 0, 0], [0, 0, 1, 0, 0, 0, 0, 0, 0, 0], [0, 1, 0, 1, 0, 0, 0, 0, 0, 0], [0, 1, 0, 0, 1, 0, 0, 1, 1, 0], [1, 0, 1, 0, 0, 0, 1, 1, 0, 0], [0, 0, 1, 0, 0, 1, 0, 1, 1, 1], [1, 0, 0, 1, 0, 0, 0, 1, 0, 1], [1, 1, 0, 0, 1, 1, 1, 1, 0, 0], [0, 1, 1, 1, 0, 1, 0, 1, 0, 0], [0, 1, 0, 1, 1, 1, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], [0, 1, 0, 0, 0, 1, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





# pos

In [53]:
path1 = 'word2vec_model_extra+pos/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,400)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [56]:
bert2 = BertModel(d_model=400).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=25)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 113.24it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 807.40it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5368788819875777  acc:  0.45 f1:  0.3773584905660377
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 794.66it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4967790829859795  acc:  0.35 f1:  0.3389830508474576
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 111.87it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 794.11it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5881211180124224  acc:  0.44166666666666665 f1:  0.40707964601769914
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.16it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5668813944676013  acc:  0.39166666666666666 f1:  0.37606837606837606
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 113.67it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 789.76it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6281055900621116  acc:  0.5166666666666667 f1:  0.4423076923076923
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.08it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6241000378931414  acc:  0.49166666666666664 f1:  0.41904761904761906
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 114.33it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 748.87it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6479037267080745  acc:  0.5416666666666666 f1:  0.4444444444444445
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 771.76it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6510041682455475  acc:  0.5333333333333333 f1:  0.45098039215686275
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 114.10it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 812.20it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6688664596273292  acc:  0.5583333333333333 f1:  0.45360824742268036
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 809.57it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.671845395983327  acc:  0.5333333333333333 f1:  0.45098039215686275
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.18it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.54it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6746894409937888  acc:  0.6083333333333333 f1:  0.4719101123595506
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.53it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6828344069723381  acc:  0.5583333333333333 f1:  0.46464646464646464
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.71it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.10it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6785714285714286  acc:  0.625 f1:  0.4827586206896552
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6991284577491474  acc:  0.6083333333333333 f1:  0.4835164835164835
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.83it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.90it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6812888198757764  acc:  0.6166666666666667 f1:  0.46511627906976755
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 779.42it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7142857142857143  acc:  0.6 f1:  0.47826086956521746
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.58it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.76it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.68555900621118  acc:  0.6166666666666667 f1:  0.46511627906976755
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 803.05it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.719969685486927  acc:  0.6 f1:  0.47826086956521746
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.03it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.84it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6847826086956522  acc:  0.6166666666666667 f1:  0.43902439024390244
9  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 826.08it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7302008336491096  acc:  0.6166666666666667 f1:  0.47727272727272724
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.95it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.93it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6875  acc:  0.6166666666666667 f1:  0.43902439024390244
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 814.87it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7317165593027662  acc:  0.6333333333333333 f1:  0.48837209302325585
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.43it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 818.87it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.6875000000000001  acc:  0.6166666666666667 f1:  0.43902439024390244
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.17it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7347480106100795  acc:  0.6166666666666667 f1:  0.47727272727272724
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.19it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 822.00it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.6847826086956522  acc:  0.625 f1:  0.45783132530120485
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.72it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7430845017051914  acc:  0.6166666666666667 f1:  0.47727272727272724
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.42it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 817.86it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.6828416149068323  acc:  0.6083333333333333 f1:  0.41975308641975306
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.87it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7434634331186055  acc:  0.6416666666666667 f1:  0.4941176470588236
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.47it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.24it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.6816770186335404  acc:  0.6333333333333333 f1:  0.4210526315789474
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.97it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7438423645320197  acc:  0.6583333333333333 f1:  0.5060240963855421
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.67it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.52it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6824534161490683  acc:  0.6333333333333333 f1:  0.4210526315789474
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.25it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7430845017051914  acc:  0.6583333333333333 f1:  0.5060240963855421
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.53it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 818.51it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6774068322981366  acc:  0.65 f1:  0.4324324324324324
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 809.59it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7453580901856763  acc:  0.6583333333333333 f1:  0.4938271604938272
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.83it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.65it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6793478260869565  acc:  0.6416666666666667 f1:  0.4266666666666666
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.41it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7464948844259189  acc:  0.6666666666666666 f1:  0.5
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.52it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.33it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6805124223602484  acc:  0.6583333333333333 f1:  0.4383561643835616
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.53it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7472527472527473  acc:  0.675 f1:  0.5063291139240508
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.45it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.94it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.6840062111801243  acc:  0.6416666666666667 f1:  0.4266666666666666
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 799.63it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7457370215990905  acc:  0.675 f1:  0.5063291139240508
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.63it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 825.66it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6828416149068323  acc:  0.6333333333333333 f1:  0.4210526315789474
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 769.29it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7476316786661614  acc:  0.675 f1:  0.5063291139240508
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.46it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 816.43it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6805124223602484  acc:  0.6416666666666667 f1:  0.4266666666666666
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 811.91it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7461159530125048  acc:  0.6666666666666666 f1:  0.5
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 117.16it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.52it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6801242236024845  acc:  0.6416666666666667 f1:  0.4266666666666666
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 798.84it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7419477074649488  acc:  0.675 f1:  0.5063291139240508
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 115.89it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 816.10it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6781832298136646  acc:  0.6333333333333333 f1:  0.4210526315789474
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 802.75it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7396741189844638  acc:  0.6666666666666666 f1:  0.48717948717948717
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 116.18it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.89it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6777950310559006  acc:  0.625 f1:  0.4
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 796.67it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7389162561576355  acc:  0.6666666666666666 f1:  0.47368421052631576


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 808.34it/s]

 Average valid loss: 0.92
AUC_SCORE:  0.7430845017051914  acc:  0.6583333333333333 f1:  0.5060240963855421
BEST MODEL
AUC_SCORE:  0.7430845017051914  acc:  0.6583333333333333 f1:  0.5060240963855421
{'auc_micro': 0.7430845017051914, 'acc': 0.6583333333333333, 'f1': 0.5060240963855421, 'pred': [[0, 0, 1, 0, 1, 1, 1, 0, 0, 0], [0, 1, 1, 1, 0, 1, 0, 0, 1, 0], [1, 0, 0, 0, 0, 0, 1, 1, 0, 1], [1, 0, 0, 1, 0, 0, 1, 0, 0, 1], [0, 0, 0, 0, 0, 1, 1, 0, 1, 0], [0, 1, 0, 0, 1, 0, 1, 1, 1, 1], [0, 0, 1, 1, 0, 0, 1, 0, 0, 1], [1, 1, 0, 0, 1, 1, 1, 0, 0, 0], [1, 1, 1, 1, 1, 0, 1, 0, 0, 1], [0, 0, 1, 1, 1, 0, 0, 0, 1, 0], [0, 0, 0, 1, 0, 1, 1, 0, 0, 1], [1, 0, 0, 0, 1, 1, 0, 0, 1, 0], [], [], [], [], [], [], [], []]}





# text_rank

In [88]:
path1 = 'word2vec_model_text/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [89]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.56it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.88it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5896739130434783  acc:  0.2833333333333333 f1:  0.3857142857142858
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.97it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4587706146926537  acc:  0.2809917355371901 f1:  0.37410071942446044
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.20it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.67it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6428571428571428  acc:  0.3416666666666667 f1:  0.4060150375939849
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.91it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5491004497751124  acc:  0.2975206611570248 f1:  0.3795620437956204
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.41it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.52it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6708074534161491  acc:  0.35833333333333334 f1:  0.40310077519379844
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 831.37it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6240629685157421  acc:  0.32231404958677684 f1:  0.3880597014925373
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.84it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.36it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6774068322981366  acc:  0.4083333333333333 f1:  0.4132231404958677
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.24it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6765367316341829  acc:  0.4049586776859504 f1:  0.40983606557377045
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.98it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.46it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6847826086956522  acc:  0.475 f1:  0.4424778761061947
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.67it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7042728635682157  acc:  0.4628099173553719 f1:  0.4247787610619469
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.80it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.15it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6882763975155279  acc:  0.5 f1:  0.4545454545454546
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7267616191904048  acc:  0.4793388429752066 f1:  0.4324324324324324
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.01it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.18it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6933229813664596  acc:  0.55 f1:  0.48076923076923084
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.98it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.732383808095952  acc:  0.5371900826446281 f1:  0.46153846153846156
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.12it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.69it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6979813664596273  acc:  0.55 f1:  0.4705882352941177
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.26it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7376311844077961  acc:  0.5454545454545454 f1:  0.46601941747572806
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.46it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.43it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6983695652173914  acc:  0.5666666666666667 f1:  0.4693877551020408
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.70it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7473763118440778  acc:  0.6033057851239669 f1:  0.48936170212765956
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.46it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.68it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7003105590062112  acc:  0.575 f1:  0.4742268041237113
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.48it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7559970014992504  acc:  0.6033057851239669 f1:  0.48936170212765956
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.19it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.21it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7006987577639752  acc:  0.5833333333333334 f1:  0.4680851063829786
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.65it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7589955022488757  acc:  0.6363636363636364 f1:  0.5111111111111111
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.89it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.53it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.702251552795031  acc:  0.5833333333333334 f1:  0.4680851063829786
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 811.06it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7638680659670165  acc:  0.6446280991735537 f1:  0.5168539325842697
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.26it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 828.46it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.702639751552795  acc:  0.5833333333333334 f1:  0.4680851063829786
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 809.29it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7706146926536732  acc:  0.6528925619834711 f1:  0.5227272727272727
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.82it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.89it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7034161490683231  acc:  0.5916666666666667 f1:  0.4731182795698925
13  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.26it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.778110944527736  acc:  0.6528925619834711 f1:  0.5227272727272727
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.30it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.39it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7053571428571428  acc:  0.6083333333333333 f1:  0.48351648351648346
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.35it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.7833583208395802  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.63it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.08it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7049689440993788  acc:  0.6 f1:  0.4666666666666667
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.59it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7863568215892055  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.22it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.37it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7049689440993789  acc:  0.6 f1:  0.4666666666666667
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.64it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7916041979010495  acc:  0.6776859504132231 f1:  0.5301204819277108
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.83it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.82it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7080745341614907  acc:  0.6 f1:  0.4666666666666667
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.57it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7934782608695653  acc:  0.6776859504132231 f1:  0.5301204819277108
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.68it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.60it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7065217391304348  acc:  0.6166666666666667 f1:  0.4772727272727271
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.20it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.795727136431784  acc:  0.6942148760330579 f1:  0.5432098765432098
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.69it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.76it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7076863354037267  acc:  0.6166666666666667 f1:  0.4772727272727271
19  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.53it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7961019490254874  acc:  0.6859504132231405 f1:  0.5365853658536586
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.81it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.03it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7088509316770186  acc:  0.6166666666666667 f1:  0.4772727272727271
20  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.20it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7972263868065967  acc:  0.6942148760330579 f1:  0.5432098765432098
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 114.38it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.56it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.7076863354037268  acc:  0.6083333333333333 f1:  0.4597701149425287
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.66it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7998500749625187  acc:  0.7024793388429752 f1:  0.55
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.55it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.99it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.7088509316770186  acc:  0.625 f1:  0.4705882352941177
22  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.97it/s]


 Average valid loss: 0.85
AUC_SCORE:  0.7976011994002998  acc:  0.7024793388429752 f1:  0.55
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.32it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.62it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7119565217391304  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.73it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.800224887556222  acc:  0.7024793388429752 f1:  0.55
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.90it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.60it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7123447204968945  acc:  0.6166666666666667 f1:  0.46511627906976755
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.03it/s]


 Average valid loss: 0.84
AUC_SCORE:  0.7983508245877062  acc:  0.71900826446281 f1:  0.5750000000000001
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.63it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.98it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7131211180124224  acc:  0.6166666666666667 f1:  0.46511627906976755
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.44it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.7983508245877061  acc:  0.71900826446281 f1:  0.5750000000000001
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.94it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.25it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7131211180124224  acc:  0.625 f1:  0.4705882352941177
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.72it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.7987256371814092  acc:  0.71900826446281 f1:  0.5750000000000001
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.62it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.42it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7111801242236024  acc:  0.6166666666666667 f1:  0.46511627906976755
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.79it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.8002248875562219  acc:  0.71900826446281 f1:  0.5750000000000001
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.74it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.48it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7092391304347826  acc:  0.6166666666666667 f1:  0.46511627906976755
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.28it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.7998500749625187  acc:  0.7355371900826446 f1:  0.5897435897435898
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.29it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.88it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7104037267080745  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.54it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8013493253373313  acc:  0.7520661157024794 f1:  0.5945945945945945
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.29it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.98it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7084627329192547  acc:  0.65 f1:  0.4878048780487805
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.42it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8032233883058472  acc:  0.743801652892562 f1:  0.5753424657534246
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.84it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.50it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7100155279503106  acc:  0.6333333333333333 f1:  0.4761904761904762
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.18it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8024737631184408  acc:  0.7355371900826446 f1:  0.5675675675675675
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.33it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.60it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7088509316770186  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.33it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8017241379310345  acc:  0.7355371900826446 f1:  0.5675675675675675
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.47it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.83it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7104037267080746  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.53it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.7998500749625187  acc:  0.743801652892562 f1:  0.5753424657534246
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.27it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.49it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7107919254658386  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.05it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8005997001499251  acc:  0.7355371900826446 f1:  0.5675675675675675
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.31it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.75it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7096273291925467  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.51it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.8009745127436282  acc:  0.743801652892562 f1:  0.5866666666666667
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.79it/s]


 Average training loss: 0.80


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.84it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7100155279503105  acc:  0.65 f1:  0.4878048780487805
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.61it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.8002248875562219  acc:  0.743801652892562 f1:  0.5753424657534246
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.84it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.31it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7115683229813664  acc:  0.6416666666666667 f1:  0.49411764705882344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.56it/s]


 Average valid loss: 0.82
AUC_SCORE:  0.7987256371814093  acc:  0.7355371900826446 f1:  0.5897435897435898
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.63it/s]


 Average training loss: 0.79


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.17it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7111801242236024  acc:  0.6583333333333333 f1:  0.5060240963855421
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.02it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.8017241379310345  acc:  0.743801652892562 f1:  0.5866666666666667
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.35it/s]


 Average training loss: 0.78


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.63it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7123447204968943  acc:  0.6583333333333333 f1:  0.5060240963855421
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.02it/s]


 Average valid loss: 0.83
AUC_SCORE:  0.7991004497751124  acc:  0.743801652892562 f1:  0.5866666666666667


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.62it/s]

 Average valid loss: 0.85
AUC_SCORE:  0.7976011994002998  acc:  0.7024793388429752 f1:  0.55
BEST MODEL
AUC_SCORE:  0.7976011994002998  acc:  0.7024793388429752 f1:  0.55
{'auc_micro': 0.7976011994002998, 'acc': 0.7024793388429752, 'f1': 0.55, 'pred': [[0, 0, 1, 1, 0, 1, 0, 1, 0, 0], [0, 0, 1, 1, 1, 0, 0, 0, 1, 1], [0, 1, 0, 0, 0, 0, 0, 0, 1, 0], [1, 1, 0, 0, 1, 0, 0, 1, 0, 1], [1, 0, 1, 0, 0, 0, 1, 1, 0, 0], [0, 0, 1, 0, 0, 1, 0, 1, 1, 1], [1, 0, 0, 1, 1, 0, 0, 1, 0, 1], [1, 1, 1, 0, 1, 0, 1, 1, 0, 0], [0, 1, 1, 1, 1, 1, 0, 1, 0, 0], [1, 0, 0, 0, 1, 1, 0, 0, 0, 1], [0, 0, 0, 0, 0, 0, 1, 1, 0, 0], [1, 1, 0, 0, 0, 0, 0, 1, 0, 0], [0], [], [], [], [], [], [], []]}





In [90]:
path1 = 'word2vec_model_text2/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [91]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.91it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.97it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5993788819875775  acc:  0.275 f1:  0.36496350364963503





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.37it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5071214392803598  acc:  0.30578512396694213 f1:  0.3823529411764706
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.00it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.86it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6513975155279503  acc:  0.2916666666666667 f1:  0.37037037037037035
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.83it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5914542728635681  acc:  0.32231404958677684 f1:  0.3880597014925373
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.66it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.22it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6828416149068323  acc:  0.375 f1:  0.4
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.92it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6405547226386806  acc:  0.4049586776859504 f1:  0.40983606557377045
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.88it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.44it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6948757763975156  acc:  0.43333333333333335 f1:  0.41379310344827586
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.71it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6694152923538231  acc:  0.4628099173553719 f1:  0.43478260869565216
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.19it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.58it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6921583850931676  acc:  0.44166666666666665 f1:  0.41739130434782606
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.98it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6922788605697151  acc:  0.4462809917355372 f1:  0.4273504273504274
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.69it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.54it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6894409937888198  acc:  0.4666666666666667 f1:  0.42857142857142855
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.06it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7061469265367316  acc:  0.5041322314049587 f1:  0.45454545454545453
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.61it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.62it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6933229813664596  acc:  0.49166666666666664 f1:  0.4403669724770642
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.03it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7151424287856072  acc:  0.5041322314049587 f1:  0.4444444444444445
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.38it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.35it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6944875776397516  acc:  0.55 f1:  0.4705882352941177
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.47it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7256371814092953  acc:  0.5454545454545454 f1:  0.46601941747572806
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.91it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.26it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6952639751552794  acc:  0.5666666666666667 f1:  0.48
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.70it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7293853073463269  acc:  0.5537190082644629 f1:  0.47058823529411764
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.24it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.66it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6956521739130435  acc:  0.5583333333333333 f1:  0.45360824742268036
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.28it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7353823088455772  acc:  0.5867768595041323 f1:  0.48979591836734687
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.66it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.56it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6987577639751552  acc:  0.575 f1:  0.46315789473684216
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.98it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7428785607196402  acc:  0.5950413223140496 f1:  0.4948453608247423
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.13it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.28it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.7010869565217391  acc:  0.5833333333333334 f1:  0.4680851063829786
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.69it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7522488755622189  acc:  0.6198347107438017 f1:  0.5106382978723405
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.94it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.64it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.704192546583851  acc:  0.5833333333333334 f1:  0.4680851063829786
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.95it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7537481259370314  acc:  0.6115702479338843 f1:  0.5052631578947369
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.38it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.58it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.7080745341614907  acc:  0.5916666666666667 f1:  0.4731182795698925
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.88it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7559970014992504  acc:  0.628099173553719 f1:  0.5161290322580646
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.33it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.62it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.7100155279503106  acc:  0.6083333333333333 f1:  0.48351648351648346
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.89it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7589955022488756  acc:  0.6115702479338843 f1:  0.4835164835164835
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 116.65it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.67it/s]

 Average valid loss: 0.97
AUC_SCORE:  0.7131211180124224  acc:  0.6083333333333333 f1:  0.48351648351648346
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.97it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7582458770614693  acc:  0.628099173553719 f1:  0.4943820224719101
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.87it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.74it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.7146739130434783  acc:  0.6083333333333333 f1:  0.48351648351648346
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.72it/s]


 Average valid loss: 0.92
AUC_SCORE:  0.762743628185907  acc:  0.628099173553719 f1:  0.4943820224719101
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.30it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.92it/s]

 Average valid loss: 0.96
AUC_SCORE:  0.7142857142857142  acc:  0.6166666666666667 f1:  0.48888888888888893
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.64it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7676161919040481  acc:  0.6363636363636364 f1:  0.4999999999999999
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.90it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.28it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7162267080745341  acc:  0.6166666666666667 f1:  0.48888888888888893
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.70it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7664917541229386  acc:  0.6446280991735537 f1:  0.5057471264367817
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.33it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.51it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.7170031055900621  acc:  0.6166666666666667 f1:  0.48888888888888893
19  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.77it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7657421289355323  acc:  0.6446280991735537 f1:  0.5057471264367817
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.73it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.16it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.720108695652174  acc:  0.6083333333333333 f1:  0.4719101123595506
20  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.91it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7679910044977512  acc:  0.6611570247933884 f1:  0.5176470588235293
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.75it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.06it/s]

 Average valid loss: 0.95
AUC_SCORE:  0.7228260869565217  acc:  0.6083333333333333 f1:  0.4719101123595506
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.77it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7694902548725637  acc:  0.6611570247933884 f1:  0.5176470588235293
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.54it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.51it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7267080745341615  acc:  0.6416666666666667 f1:  0.49411764705882344
22  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.97it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7717391304347826  acc:  0.6859504132231405 f1:  0.5365853658536586
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.66it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.56it/s]

 Average valid loss: 0.94
AUC_SCORE:  0.7274844720496895  acc:  0.625 f1:  0.4827586206896552
23  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.85it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7706146926536732  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.88it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.38it/s]

 Average valid loss: 0.94
AUC_SCORE:  0.7298136645962733  acc:  0.6333333333333333 f1:  0.48837209302325585
24  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.36it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7713643178410794  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.48it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.38it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7309782608695653  acc:  0.625 f1:  0.4827586206896552
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.30it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7687406296851573  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.15it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.31it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7302018633540374  acc:  0.6083333333333333 f1:  0.4719101123595506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.72it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7668665667166417  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.08it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.77it/s]

 Average valid loss: 0.94
AUC_SCORE:  0.7317546583850932  acc:  0.6416666666666667 f1:  0.5057471264367817
27  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.57it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7691154422788606  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.14it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.41it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7309782608695653  acc:  0.6416666666666667 f1:  0.5168539325842696
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.21it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.767616191904048  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.46it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.00it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7329192546583851  acc:  0.65 f1:  0.5227272727272727
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.00it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7698650674662669  acc:  0.6694214876033058 f1:  0.5238095238095237
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.66it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.97it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.734860248447205  acc:  0.65 f1:  0.5227272727272727
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.60it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7706146926536732  acc:  0.6776859504132231 f1:  0.5411764705882354
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.01it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.81it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7309782608695652  acc:  0.65 f1:  0.5116279069767441
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.24it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7672413793103449  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.70it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.13it/s]

 Average valid loss: 0.94
AUC_SCORE:  0.7309782608695652  acc:  0.6833333333333333 f1:  0.5365853658536585
32  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.17it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7616191904047976  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.31it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.14it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7298136645962733  acc:  0.6833333333333333 f1:  0.5365853658536585
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.49it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7619940029985008  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.26it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.50it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7278726708074534  acc:  0.6416666666666667 f1:  0.5057471264367817
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.95it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7604947526236883  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.44it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.75it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7278726708074534  acc:  0.6916666666666667 f1:  0.54320987654321
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.24it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7597451274362819  acc:  0.6611570247933884 f1:  0.5060240963855421
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.03it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.18it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7278726708074534  acc:  0.6916666666666667 f1:  0.54320987654321
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.40it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7589955022488755  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.09it/s]


 Average training loss: 0.80


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.46it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7278726708074534  acc:  0.6833333333333333 f1:  0.5250000000000001
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.12it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7586206896551724  acc:  0.6694214876033058 f1:  0.5
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.30it/s]


 Average training loss: 0.80


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.11it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7290372670807453  acc:  0.6833333333333333 f1:  0.5250000000000001
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.50it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7593703148425788  acc:  0.6694214876033058 f1:  0.5
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.21it/s]


 Average training loss: 0.79


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.32it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7309782608695652  acc:  0.6833333333333333 f1:  0.5250000000000001
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.88it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7582458770614693  acc:  0.6776859504132231 f1:  0.5185185185185185


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.66it/s]

 Average valid loss: 0.87
AUC_SCORE:  0.7616191904047976  acc:  0.6611570247933884 f1:  0.5060240963855421
BEST MODEL
AUC_SCORE:  0.7616191904047976  acc:  0.6611570247933884 f1:  0.5060240963855421
{'auc_micro': 0.7616191904047976, 'acc': 0.6611570247933884, 'f1': 0.5060240963855421, 'pred': [[0, 0, 1, 0, 0, 1, 0, 1, 0, 0], [0, 0, 1, 1, 1, 0, 0, 0, 0, 1], [1, 1, 0, 1, 0, 0, 0, 1, 1, 0], [1, 1, 0, 0, 1, 0, 0, 1, 0, 0], [1, 0, 1, 0, 0, 0, 1, 1, 0, 1], [1, 0, 0, 0, 0, 1, 0, 1, 1, 1], [0, 0, 0, 1, 1, 0, 0, 1, 1, 0], [1, 1, 1, 0, 1, 1, 1, 1, 0, 0], [0, 1, 1, 1, 1, 1, 1, 1, 0, 0], [0, 0, 0, 1, 1, 1, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], [0, 1, 0, 0, 0, 1, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





In [92]:
path1 = 'word2vec_model_text3/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [93]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.94it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.52it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.4553571428571429  acc:  0.31666666666666665 f1:  0.3492063492063492





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.68it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4872563718140929  acc:  0.35537190082644626 f1:  0.3389830508474576
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.91it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.64it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5089285714285714  acc:  0.31666666666666665 f1:  0.3492063492063492
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.35it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5543478260869565  acc:  0.36363636363636365 f1:  0.36363636363636365
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.69it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.70it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.5516304347826086  acc:  0.4083333333333333 f1:  0.3931623931623932
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.04it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6019490254872565  acc:  0.4132231404958678 f1:  0.37168141592920356
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.43it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.30it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5877329192546583  acc:  0.425 f1:  0.3783783783783783
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 842.98it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6394302848575713  acc:  0.4462809917355372 f1:  0.37383177570093457
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.16it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.19it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6020962732919255  acc:  0.4666666666666667 f1:  0.39622641509433965
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.80it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6622938530734632  acc:  0.5041322314049587 f1:  0.4
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.92it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.37it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6226708074534161  acc:  0.4666666666666667 f1:  0.39622641509433965
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.674287856071964  acc:  0.512396694214876 f1:  0.40404040404040403
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.97it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.57it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6347049689440993  acc:  0.5166666666666667 f1:  0.42
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.87it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6922788605697151  acc:  0.5619834710743802 f1:  0.43010752688172044
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.50it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.78it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6420807453416149  acc:  0.5416666666666666 f1:  0.4329896907216495
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7035232383808095  acc:  0.5619834710743802 f1:  0.43010752688172044
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.05it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.12it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6510093167701864  acc:  0.55 f1:  0.4375
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.24it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7170164917541229  acc:  0.5867768595041323 f1:  0.45652173913043476
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.08it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.31it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6611024844720497  acc:  0.575 f1:  0.4516129032258065
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 838.72it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7282608695652174  acc:  0.5867768595041323 f1:  0.45652173913043476
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.12it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.37it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6649844720496896  acc:  0.6 f1:  0.4666666666666667
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.15it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7383808095952024  acc:  0.6198347107438017 f1:  0.47727272727272724
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.40it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.73it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6688664596273292  acc:  0.6083333333333333 f1:  0.4719101123595506
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.20it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7485007496251874  acc:  0.6198347107438017 f1:  0.47727272727272724
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.14it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.88it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.671972049689441  acc:  0.6333333333333333 f1:  0.48837209302325585
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.21it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7604947526236882  acc:  0.628099173553719 f1:  0.47058823529411764
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.29it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.95it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6789596273291925  acc:  0.6333333333333333 f1:  0.5
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.53it/s]


 Average valid loss: 0.94
AUC_SCORE:  0.7619940029985007  acc:  0.628099173553719 f1:  0.4827586206896552
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.13it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.47it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6809006211180124  acc:  0.6333333333333333 f1:  0.5
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.26it/s]


 Average valid loss: 0.93
AUC_SCORE:  0.7653673163418291  acc:  0.628099173553719 f1:  0.47058823529411764
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.22it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.61it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6832298136645963  acc:  0.6583333333333333 f1:  0.5176470588235293
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 810.72it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7724887556221889  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.42it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.10it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.6859472049689441  acc:  0.65 f1:  0.5116279069767441
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.34it/s]


 Average valid loss: 0.91
AUC_SCORE:  0.7706146926536731  acc:  0.6528925619834711 f1:  0.4878048780487806
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.18it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.01it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6875  acc:  0.6666666666666666 f1:  0.5238095238095237
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 835.55it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.772488755622189  acc:  0.6611570247933884 f1:  0.48101265822784806
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.41it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.19it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.688664596273292  acc:  0.6666666666666666 f1:  0.5238095238095237
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.34it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7728635682158921  acc:  0.6611570247933884 f1:  0.4675324675324676
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.39it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.50it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6909937888198758  acc:  0.6416666666666667 f1:  0.49411764705882344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.39it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7784857571214393  acc:  0.6611570247933884 f1:  0.4675324675324676
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.68it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.62it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6937111801242237  acc:  0.6416666666666667 f1:  0.49411764705882344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.55it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7784857571214393  acc:  0.6694214876033058 f1:  0.48717948717948717
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.58it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.12it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6940993788819876  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.60it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7788605697151425  acc:  0.6859504132231405 f1:  0.4999999999999999
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.88it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.76it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.6948757763975155  acc:  0.6416666666666667 f1:  0.48192771084337355
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.18it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7822338830584709  acc:  0.7024793388429752 f1:  0.5263157894736842
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.77it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.88it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6944875776397517  acc:  0.65 f1:  0.4878048780487805
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.19it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7811094452773614  acc:  0.7024793388429752 f1:  0.5263157894736842
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.11it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.66it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6960403726708075  acc:  0.65 f1:  0.4878048780487805
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.81it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7833583208395802  acc:  0.7024793388429752 f1:  0.5263157894736842
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.06it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.54it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6956521739130435  acc:  0.6833333333333333 f1:  0.5128205128205129
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.68it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7863568215892055  acc:  0.7024793388429752 f1:  0.5135135135135135
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.09it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.38it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6956521739130436  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.15it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.785232383808096  acc:  0.6942148760330579 f1:  0.5066666666666666
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.83it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.42it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6964285714285715  acc:  0.6583333333333333 f1:  0.4938271604938272
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.46it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7837331334332834  acc:  0.6942148760330579 f1:  0.5066666666666666
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.07it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.79it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6983695652173914  acc:  0.6666666666666666 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.15it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7844827586206896  acc:  0.6859504132231405 f1:  0.4864864864864865
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.42it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.73it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6968167701863355  acc:  0.6666666666666666 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.57it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7818590704647677  acc:  0.6776859504132231 f1:  0.48
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.57it/s]


 Average training loss: 0.83


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.17it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6960403726708074  acc:  0.6666666666666666 f1:  0.48717948717948717
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.67it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7837331334332834  acc:  0.6942148760330579 f1:  0.49315068493150693
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.35it/s]


 Average training loss: 0.84


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.79it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6968167701863355  acc:  0.6666666666666666 f1:  0.48717948717948717
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.87it/s]


 Average valid loss: 0.86
AUC_SCORE:  0.7837331334332834  acc:  0.6942148760330579 f1:  0.49315068493150693
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.30it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6948757763975155  acc:  0.675 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.90it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7811094452773614  acc:  0.7024793388429752 f1:  0.5135135135135135
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.59it/s]


 Average training loss: 0.82


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.94it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6909937888198758  acc:  0.6583333333333333 f1:  0.4675324675324675
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.35it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7829835082458771  acc:  0.71900826446281 f1:  0.5277777777777777
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.54it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.27it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6921583850931677  acc:  0.6666666666666666 f1:  0.4736842105263159
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.95it/s]


 Average valid loss: 0.87
AUC_SCORE:  0.7807346326836582  acc:  0.71900826446281 f1:  0.5277777777777777
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.32it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.11it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6913819875776397  acc:  0.6666666666666666 f1:  0.4736842105263159
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.40it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7769865067466267  acc:  0.7107438016528925 f1:  0.5205479452054794
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.97it/s]


 Average training loss: 0.79


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.84it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6909937888198758  acc:  0.6666666666666666 f1:  0.4736842105263159
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.90it/s]


 Average valid loss: 0.88
AUC_SCORE:  0.7754872563718141  acc:  0.7107438016528925 f1:  0.5205479452054794
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.06it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.19it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.68944099378882  acc:  0.6666666666666666 f1:  0.45945945945945943
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.90it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.7754872563718141  acc:  0.71900826446281 f1:  0.5277777777777777
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.88it/s]


 Average training loss: 0.81


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.21it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.688664596273292  acc:  0.675 f1:  0.48
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.43it/s]


 Average valid loss: 0.89
AUC_SCORE:  0.772488755622189  acc:  0.7107438016528925 f1:  0.5205479452054794
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.10it/s]


 Average training loss: 0.78


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.11it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6875000000000001  acc:  0.6833333333333333 f1:  0.4722222222222222
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.14it/s]


 Average valid loss: 0.90
AUC_SCORE:  0.7721139430284858  acc:  0.7272727272727273 f1:  0.5352112676056338


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.57it/s]

 Average valid loss: 0.89
AUC_SCORE:  0.7728635682158921  acc:  0.6611570247933884 f1:  0.4675324675324676
BEST MODEL
AUC_SCORE:  0.7728635682158921  acc:  0.6611570247933884 f1:  0.4675324675324676
{'auc_micro': 0.7728635682158921, 'acc': 0.6611570247933884, 'f1': 0.4675324675324676, 'pred': [[0, 0, 1, 0, 0, 1, 0, 1, 0, 0], [0, 0, 1, 1, 0, 0, 1, 1, 0, 0], [0, 1, 0, 1, 0, 0, 0, 0, 1, 0], [1, 1, 0, 0, 1, 0, 0, 0, 0, 0], [0, 0, 1, 0, 0, 0, 1, 1, 0, 1], [0, 0, 0, 0, 0, 1, 0, 1, 1, 1], [1, 0, 0, 0, 1, 0, 0, 1, 0, 1], [1, 1, 0, 0, 0, 0, 1, 1, 0, 0], [0, 1, 1, 1, 1, 1, 0, 1, 0, 0], [1, 0, 0, 1, 1, 1, 0, 0, 0, 1], [0, 0, 1, 0, 1, 0, 1, 1, 1, 0], [1, 1, 0, 0, 0, 0, 0, 1, 0, 0], [0], [], [], [], [], [], [], []]}





# 거리로 분석

In [156]:
path1 = 'word2vec_model_dim=384/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1

    ans = torch.zeros(1,1,512)
    for i in range(scene_num):
        if i ==0:
            continue
        #ans[0,0,i] += util.cos_sim(embs[0][i],embs[0][i-1])[0][0]
        ans[0,0,i] += torch.cdist(embs[0][i].unsqueeze(0),embs[0][i-1].unsqueeze(0))[0][0]
        
    embs = ans
    
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [157]:
bert2 = BertModel(d_model=512).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=20)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.24it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 980.24it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5272873194221509  acc:  0.4700854700854701 f1:  0.3404255319148936
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.76it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 986.09it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5112359550561797  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.22it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.49357945425361155  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 124.12it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.98it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4903691813804173  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.37it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 961.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4875601926163724  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 987.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4759229534510433  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 991.71it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4751203852327447  acc:  0.47863247863247865 f1:  0.3146067415730337
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 953.18it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4695024077046549  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.18it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 960.79it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47351524879614765  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.41it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.61it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4715088282504013  acc:  0.4700854700854701 f1:  0.3111111111111111
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.94it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.471107544141252  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.74it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 924.25it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47110754414125194  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.17it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 964.84it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46709470304975925  acc:  0.4700854700854701 f1:  0.29545454545454547
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 122.37it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 947.42it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46629213483146065  acc:  0.452991452991453 f1:  0.30434782608695654
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 967.50it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4634831460674157  acc:  0.452991452991453 f1:  0.27272727272727276
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 981.79it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4610754414125201  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.53it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 979.93it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45947030497592295  acc:  0.4444444444444444 f1:  0.2696629213483146
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.62it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 974.33it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4550561797752809  acc:  0.46153846153846156 f1:  0.2758620689655173
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.12it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.75it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45626003210272875  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.28it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 989.84it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4562600321027287  acc:  0.47863247863247865 f1:  0.2823529411764706


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.66it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
BEST MODEL
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
{'auc_micro': 0.5497592295345104, 'acc': 0.41025641025641024, 'f1': 0.3551401869158879, 'pred': [[1, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 1, 0, 1, 1, 0, 0, 0, 1, 1], [0, 1, 1, 0, 1, 1, 1, 0, 1, 0], [1, 1, 1, 1, 1, 1, 0, 0, 1, 0], [0, 1, 0, 1, 1, 1, 1, 1, 1, 1], [1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [1, 1, 1, 0, 1, 1, 0, 0, 1, 1], [0, 1, 1, 1, 1, 1, 0, 1, 1, 0], [1, 0, 1, 0, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 1, 0, 0, 0, 0, 1], [1, 1, 1, 1, 0, 0, 1, 1, 0, 1], [1, 0, 1, 0, 1, 1, 0], [], [], [], [], [], [], []]}



