In [9]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import os
from tqdm import tqdm
import torch.nn.functional as F
from gensim.models import Word2Vec
from sklearn import metrics
from sklearn.metrics import classification_report
import itertools
import random

In [10]:
import torch
import torch.nn as nn

In [11]:
device = 'cuda'

In [12]:
pos_weight = 881/323

In [13]:
class BertModel(nn.Module):
    def __init__(self, voc_size:int=30000, seq_len: int=512, d_model: int=384, d_ff:int=3072, pad_idx: int=1,
                num_encoder: int=12, num_heads: int=12, n_layers=6, dropout: float=0.1):
        super(BertModel, self).__init__()
        self.pad_idx = pad_idx
        self.layers = nn.ModuleList([nn.TransformerEncoderLayer(d_model=d_model, nhead=8, batch_first=True) for _ in range(n_layers)])
        self.fc = nn.Linear(d_model, d_model)
        self.activ1 = nn.Tanh()
        self.classifier = nn.Linear(d_model, 1)
        
    def forward(self, input: torch.Tensor) -> torch.Tensor:
        output = input
        for layer in self.layers:
            output = layer(output)
        #output = output.mean(dim=1, keepdim=True)
        output = output[:,-1]
        h_pooled = self.activ1(self.fc(output)) # [batch_size, d_model]
        logits_clsf = self.classifier(h_pooled) # [batch_size, 2]
        return logits_clsf # [B, S, D_model]

In [14]:
def log_metrics(preds, labels):
    preds = torch.stack(preds)
    preds = preds.cpu().detach().numpy()
    labels = torch.stack(labels)
    labels = labels.cpu().detach().numpy()
    
    
    ## Method 2 using ravel()
    fpr_micro, tpr_micro, _ = metrics.roc_curve(labels.ravel(), preds.ravel())
    auc_micro = metrics.auc(fpr_micro, tpr_micro)
    n=10
    preds = [round(i) for i in preds.ravel()]
    acc = metrics.accuracy_score(labels.ravel(), preds)
    f1 = metrics.f1_score(labels.ravel(), preds)
    preds = [preds[i*n:(i+1)*n] for i in range(len(preds)//6)]
    #target_names = list(genre_list.keys())
    #print(classification_report(labels,preds, target_names=target_names))
    return {"auc_micro": auc_micro, "acc" : acc, "f1" : f1, 'pred' : preds}

In [15]:
def train_one_epoch(dataloader, model, optimizer, device, loss_fn):
    model.train()
    tk0 = tqdm(dataloader, total=len(dataloader))
    total_loss = 0.0
    
    for source_tensor, label in tk0:
        optimizer.zero_grad()
        output = model(source_tensor.to(device))
        loss = loss_fn(output.view(-1, output.size(-1)), torch.FloatTensor([label]).to(device))
        
        total_loss += loss
        loss.backward()
        optimizer.step()
        
    avg_train_loss = total_loss / len(dataloader) 
    print(" Average training loss: {0:.2f}".format(avg_train_loss))  

def test_one_epoch(testset, model, loss_fn):
    model.eval()
    tk0 = tqdm(testset, total=len(testset))
    targets = []
    outputs = []
    total_loss = 0.0
    with torch.no_grad():
        for source_tensor, label in tk0:
            label = torch.FloatTensor([label])
            output = model(source_tensor.to(device))
            loss = loss_fn(output.view(-1, output.size(-1)), label.to(device))
            total_loss += loss
            targets.extend(label)
            outputs.extend(torch.sigmoid(output[0]).to('cpu'))
    avg_valid_loss = total_loss / len(testset) 
    score = log_metrics(outputs, targets)
    print(" Average valid loss: {0:.2f}".format(avg_valid_loss))  
    print('AUC_SCORE: ', score["auc_micro"], " acc: ", score["acc"], "f1: ", score["f1"])
    return score, avg_valid_loss
    
def fit(model, train_dataloader, valid_dataloader=None,test_dataloader=None, EPOCHS=3, lr=0.0000005):
    loss_fn = nn.BCEWithLogitsLoss(pos_weight=torch.tensor(pos_weight)) #ignore padding
    optimizer = torch.optim.AdamW(model.parameters(),lr=lr)
    for i in range(EPOCHS):
        print(f"EPOCHS:{i+1}")
        print('TRAIN')
        train_one_epoch(train_dataloader, model, optimizer, device, loss_fn)
        auc, loss = test_one_epoch(valid_dataloader,model, loss_fn)
        if i == 0:
            torch.save(model,'rnn_best.model')
            best_loss = loss
        if  loss<best_loss:
            best_loss = loss
            print(i,' EPOCH BEST MODEL!')
            torch.save(model,'rnn_best.model')
        print('Test')
        auc, loss = test_one_epoch(test_dataloader,model, loss_fn)
    best_model = torch.load('rnn_best.model')
    auc, loss  = test_one_epoch(test_dataloader,best_model, loss_fn)
    print('BEST MODEL')
    print('AUC_SCORE: ', auc["auc_micro"], " acc: ", auc["acc"], "f1: ", auc["f1"])
    return auc

            best_f1 = auc['f1']
        if  auc['f1']>best_f1:
            best_f1 = auc['f1']

In [16]:
import pickle
with open('movie_split_flashback.pickle','rb') as fw:
    movie_split = pickle.load(fw)

In [17]:
path1 = 'word2vec_model_edge/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,400)
for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
                    
                    
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])

  emb = torch.from_numpy(emb)


In [18]:
bert = BertModel(d_model=400).to('cuda')
score = fit(bert, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:09<00:00, 102.94it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.73it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5852272727272727  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.17it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.47296348314606745  acc:  0.5785123966942148 f1:  0.28169014084507044
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 112.84it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.28it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5795454545454546  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.45it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4698033707865169  acc:  0.6033057851239669 f1:  0.27272727272727276
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.72it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.48it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5653409090909092  acc:  0.5916666666666667 f1:  0.26865671641791045
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.80it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4736657303370787  acc:  0.6198347107438017 f1:  0.28125
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.03it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.29it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5525568181818182  acc:  0.5833333333333334 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.40it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4729634831460674  acc:  0.6033057851239669 f1:  0.29411764705882354
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.14it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 797.57it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5440340909090908  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.48139044943820225  acc:  0.5289256198347108 f1:  0.3132530120481928
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.10it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.00it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5390625  acc:  0.49166666666666664 f1:  0.22784810126582278
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.13it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4863061797752809  acc:  0.5206611570247934 f1:  0.30952380952380953
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.15it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.31it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5298295454545454  acc:  0.5 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.39it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4922752808988764  acc:  0.5289256198347108 f1:  0.3132530120481928
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.51it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.16it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5241477272727273  acc:  0.5083333333333333 f1:  0.25316455696202533
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.70it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4908707865168539  acc:  0.5289256198347108 f1:  0.3132530120481928
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.78it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.68it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5198863636363636  acc:  0.55 f1:  0.27027027027027023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.19it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48946629213483145  acc:  0.5537190082644629 f1:  0.325
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.64it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.51953125  acc:  0.55 f1:  0.27027027027027023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.09it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4859550561797753  acc:  0.5454545454545454 f1:  0.32098765432098764
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.03it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5166903409090909  acc:  0.5416666666666666 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.90it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4884129213483146  acc:  0.5371900826446281 f1:  0.3170731707317073
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.22it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5181107954545454  acc:  0.5416666666666666 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.40it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4898174157303371  acc:  0.5371900826446281 f1:  0.3170731707317073
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.42it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.39it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5174005681818181  acc:  0.5416666666666666 f1:  0.2666666666666667
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.06it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49087078651685395  acc:  0.5454545454545454 f1:  0.3037974683544304
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.79it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.37it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.51953125  acc:  0.5666666666666667 f1:  0.2777777777777778
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.32it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4912219101123595  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.58it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.16it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5202414772727273  acc:  0.5583333333333333 f1:  0.273972602739726
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.24it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49297752808988765  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.85it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5209517045454546  acc:  0.55 f1:  0.2894736842105263
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.53it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4947331460674157  acc:  0.5785123966942148 f1:  0.3376623376623376
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.64it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5245028409090909  acc:  0.5666666666666667 f1:  0.2972972972972973
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.11it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49508426966292135  acc:  0.5702479338842975 f1:  0.3157894736842105
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.61it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5220170454545454  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.64it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49578651685393255  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.60it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.26it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5223721590909092  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.34it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4982443820224719  acc:  0.5702479338842975 f1:  0.3157894736842105
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.74it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.67it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5213068181818181  acc:  0.5583333333333333 f1:  0.29333333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.22it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49789325842696625  acc:  0.5785123966942148 f1:  0.3544303797468354
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.48it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.26it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5227272727272727  acc:  0.5833333333333334 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.72it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5024578651685394  acc:  0.5867768595041323 f1:  0.3421052631578948
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.13it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5245028409090908  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.45it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5070224719101124  acc:  0.5867768595041323 f1:  0.3421052631578948
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.50it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.89it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5234375  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.73it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5080758426966292  acc:  0.5785123966942148 f1:  0.3376623376623376
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.95it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.32it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5241477272727273  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.42it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5070224719101124  acc:  0.5867768595041323 f1:  0.358974358974359
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.87it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.08it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5227272727272727  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.509129213483146  acc:  0.5950413223140496 f1:  0.3636363636363637
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.02it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.14it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5230823863636364  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.00it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5094803370786517  acc:  0.6115702479338843 f1:  0.37333333333333335
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.61it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.81it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5230823863636364  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.92it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.511938202247191  acc:  0.5950413223140496 f1:  0.3636363636363637
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.89it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.24it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5223721590909091  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.74it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5126404494382022  acc:  0.6033057851239669 f1:  0.3684210526315789
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.66it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.69it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5230823863636364  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.10it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5158005617977528  acc:  0.6033057851239669 f1:  0.3684210526315789
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.23it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.24it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5223721590909091  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.95it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5189606741573034  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 124.83it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.48it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5266335227272727  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.96it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5242275280898877  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.71it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.93it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5280539772727273  acc:  0.625 f1:  0.3076923076923077
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.45it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5242275280898877  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.87it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 817.60it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5287642045454546  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.45it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5217696629213483  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.89it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.79it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5280539772727273  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.20it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5249297752808989  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.53it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.21it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5287642045454546  acc:  0.6416666666666667 f1:  0.3174603174603175
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.83it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5298455056179776  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.43it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.55it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.53125  acc:  0.6416666666666667 f1:  0.3174603174603175
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 842.88it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5294943820224719  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.63it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.56it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5326704545454546  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.88it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5323033707865169  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.75it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.18it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5326704545454546  acc:  0.6416666666666667 f1:  0.3174603174603175
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.71it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5361657303370786  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.92it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.05it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.53515625  acc:  0.6333333333333333 f1:  0.33333333333333337
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.71it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5354634831460674  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.73it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.16it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.536221590909091  acc:  0.6416666666666667 f1:  0.3174603174603175
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.41it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5396769662921349  acc:  0.6115702479338843 f1:  0.3380281690140845


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.73it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.47296348314606745  acc:  0.5785123966942148 f1:  0.28169014084507044
BEST MODEL
AUC_SCORE:  0.47296348314606745  acc:  0.5785123966942148 f1:  0.28169014084507044
{'auc_micro': 0.47296348314606745, 'acc': 0.5785123966942148, 'f1': 0.28169014084507044, 'pred': [[0, 1, 1, 1, 1, 0, 0, 1, 0, 0], [0, 0, 0, 1, 0, 0, 0, 1, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], [0, 1, 1, 1, 0, 0, 0, 1, 0, 1], [0, 0, 0, 1, 0, 0, 0, 1, 0, 0], [0, 0, 1, 0, 1, 0, 0, 0, 1, 1], [1, 1, 1, 1, 0, 1, 0, 0, 0, 0], [1, 0, 0, 0, 0, 1, 0, 1, 0, 1], [0, 0, 1, 0, 0, 0, 1, 0, 0, 1], [0, 0, 0, 1, 0, 1, 0, 0, 1, 1], [0], [], [], [], [], [], [], []]}





In [104]:
random.randint(0,100)

19

In [19]:
import random

# Doc2vce

In [None]:
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

# SUM

In [20]:
import pickle
with open('emb_sum.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [21]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
    if movie_name not in movie_emb.keys():
        continue
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [22]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

953
120
119


In [23]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.52it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.52it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.46626420454545453  acc:  0.6416666666666667 f1:  0.0851063829787234
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 809.84it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.4093632958801498  acc:  0.680672268907563 f1:  0.0
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.44it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.74it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.46768465909090906  acc:  0.6583333333333333 f1:  0.2545454545454546
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 811.22it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.42247191011235957  acc:  0.6470588235294118 f1:  0.0
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.59it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.92it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.47798295454545453  acc:  0.6583333333333333 f1:  0.2807017543859649
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.91it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.45880149812734083  acc:  0.6386554621848739 f1:  0.04444444444444444
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.05it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.63it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.4889914772727273  acc:  0.625 f1:  0.26229508196721313
3  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 859.26it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.4801498127340824  acc:  0.6302521008403361 f1:  0.15384615384615383
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 119.03it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.66it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5042613636363638  acc:  0.6166666666666667 f1:  0.23333333333333334
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 856.99it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.4887640449438202  acc:  0.6134453781512605 f1:  0.17857142857142855
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.52it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.52it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5113636363636364  acc:  0.6166666666666667 f1:  0.23333333333333334
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 829.98it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.4988764044943821  acc:  0.6218487394957983 f1:  0.23728813559322037
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.95it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 890.64it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5184659090909092  acc:  0.6083333333333333 f1:  0.2769230769230769
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 846.34it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5071161048689139  acc:  0.5882352941176471 f1:  0.24615384615384614
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.00it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.60it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5216619318181819  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 879.86it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.508988764044944  acc:  0.6050420168067226 f1:  0.253968253968254
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.30it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.71it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5252130681818182  acc:  0.6 f1:  0.3142857142857143
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 830.94it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5097378277153559  acc:  0.6134453781512605 f1:  0.303030303030303
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.96it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.57it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5287642045454546  acc:  0.6083333333333333 f1:  0.3380281690140845
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 831.24it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5146067415730338  acc:  0.5966386554621849 f1:  0.29411764705882354
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.41it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.05it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5319602272727273  acc:  0.625 f1:  0.34782608695652173
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 879.92it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5157303370786517  acc:  0.6302521008403361 f1:  0.3125
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.71it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 890.74it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.5333806818181819  acc:  0.5916666666666667 f1:  0.3636363636363637
11  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5176029962546816  acc:  0.5882352941176471 f1:  0.30985915492957744
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.32it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 891.15it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5348011363636365  acc:  0.6 f1:  0.3684210526315789
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 878.54it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5168539325842696  acc:  0.5882352941176471 f1:  0.30985915492957744
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.37it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.90it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5319602272727273  acc:  0.6333333333333333 f1:  0.3714285714285715
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 858.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5191011235955056  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.34it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.53125  acc:  0.625 f1:  0.36619718309859156
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 863.35it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5183520599250936  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 119.06it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.16it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5305397727272727  acc:  0.6166666666666667 f1:  0.37837837837837834
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 861.49it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5164794007490636  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 119.01it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5301846590909092  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.74it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5134831460674157  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 119.01it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.42it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5326704545454545  acc:  0.625 f1:  0.34782608695652173
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 860.38it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5127340823970037  acc:  0.6554621848739496 f1:  0.3492063492063492
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.72it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.33it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5330255681818181  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 856.20it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5142322097378277  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.31it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.30it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5326704545454546  acc:  0.625 f1:  0.3835616438356165
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.62it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5119850187265917  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.26it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.59it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5308948863636364  acc:  0.6083333333333333 f1:  0.37333333333333335
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 863.87it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5119850187265917  acc:  0.6134453781512605 f1:  0.32352941176470584
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 119.12it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.05it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5316051136363636  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 870.13it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5097378277153558  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.03it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.94it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5301846590909091  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 871.31it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5131086142322098  acc:  0.6386554621848739 f1:  0.3384615384615384
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.55it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.94it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5280539772727273  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 866.12it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5153558052434457  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.76it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.16it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5287642045454545  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 861.47it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5123595505617978  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.83it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.48it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5280539772727273  acc:  0.6 f1:  0.3513513513513513
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 875.43it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5138576779026217  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.21it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.24it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5291193181818182  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 856.92it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5127340823970038  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.60it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.51it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.52734375  acc:  0.6166666666666667 f1:  0.34285714285714286
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 862.97it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5127340823970037  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.88it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.61it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.52734375  acc:  0.6166666666666667 f1:  0.30303030303030304
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.71it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5131086142322098  acc:  0.6302521008403361 f1:  0.3125
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.01it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.52it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5255681818181819  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 867.75it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5134831460674156  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.54it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.18it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5262784090909091  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 860.26it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5142322097378278  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.87it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.42it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.52734375  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 863.49it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5146067415730338  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.35it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.98it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5266335227272728  acc:  0.6 f1:  0.33333333333333326
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 867.07it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5127340823970037  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.25it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.08it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5259232954545454  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 869.88it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5153558052434457  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.93it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.78it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5269886363636365  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 865.64it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5168539325842697  acc:  0.6302521008403361 f1:  0.3333333333333333
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.88it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.85it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.52734375  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.87it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5176029962546816  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.04it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.91it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5287642045454546  acc:  0.5916666666666667 f1:  0.26865671641791045
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 864.27it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5191011235955056  acc:  0.6218487394957983 f1:  0.3283582089552239
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.18it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.35it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5301846590909091  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 867.22it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5153558052434457  acc:  0.6218487394957983 f1:  0.30769230769230765
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.98it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.10it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5298295454545454  acc:  0.5833333333333334 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 868.27it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5161048689138577  acc:  0.6302521008403361 f1:  0.35294117647058826
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.61it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.82it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5291193181818182  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 869.28it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5153558052434457  acc:  0.6134453781512605 f1:  0.28125


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 868.07it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5176029962546816  acc:  0.5882352941176471 f1:  0.30985915492957744
BEST MODEL
AUC_SCORE:  0.5176029962546816  acc:  0.5882352941176471 f1:  0.30985915492957744
{'auc_micro': 0.5176029962546816, 'acc': 0.5882352941176471, 'f1': 0.30985915492957744, 'pred': [[0, 1, 0, 1, 1, 0, 0, 1, 0, 0], [1, 1, 0, 1, 1, 1, 0, 1, 0, 0], [0, 1, 0, 1, 0, 0, 0, 0, 1, 0], [0, 0, 1, 0, 1, 0, 0, 0, 0, 0], [1, 0, 0, 1, 1, 0, 0, 1, 0, 0], [1, 0, 1, 0, 0, 0, 0, 1, 0, 0], [0, 1, 1, 0, 1, 0, 0, 1, 0, 1], [0, 0, 0, 0, 0, 0, 1, 1, 0, 0], [0, 0, 1, 0, 0, 0, 0, 0, 1, 1], [0, 0, 1, 0, 1, 0, 0, 0, 0, 0], [0, 0, 1, 1, 0, 1, 0, 0, 1, 0], [0, 1, 1, 0, 0, 0, 0, 1, 0], [], [], [], [], [], [], []]}





# Doc2vec

In [24]:
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

In [25]:
path1 = 'doc2vec/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Doc2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.dv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.dv.index_to_key:
            emb = w2v.dv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [26]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.01it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 919.41it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5387073863636364  acc:  0.5833333333333334 f1:  0.3055555555555556





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 924.11it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4922752808988764  acc:  0.6033057851239669 f1:  0.1724137931034483
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.21it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 938.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5436789772727273  acc:  0.5583333333333333 f1:  0.345679012345679
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46980337078651685  acc:  0.5371900826446281 f1:  0.17647058823529413
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.16it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 918.71it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5518465909090908  acc:  0.5666666666666667 f1:  0.33333333333333337
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 889.16it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.45435393258426965  acc:  0.5867768595041323 f1:  0.16666666666666666
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.44it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 921.63it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5671164772727273  acc:  0.5916666666666667 f1:  0.3466666666666667
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.10it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4504915730337079  acc:  0.6115702479338843 f1:  0.17543859649122806
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.81it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 911.91it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.5692471590909091  acc:  0.575 f1:  0.3376623376623376
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.09it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4353932584269663  acc:  0.5950413223140496 f1:  0.19672131147540986
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.14it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 927.00it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5713778409090909  acc:  0.5666666666666667 f1:  0.33333333333333337
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 932.80it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.43258426966292135  acc:  0.6033057851239669 f1:  0.22580645161290322
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.51it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.50it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5823863636363636  acc:  0.6 f1:  0.3513513513513513
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 892.89it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4283707865168539  acc:  0.5950413223140496 f1:  0.19672131147540986
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.72it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.82it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5859375  acc:  0.6 f1:  0.3513513513513513
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.59it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.43047752808988765  acc:  0.5702479338842975 f1:  0.1875
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.36it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.96it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5933948863636364  acc:  0.6083333333333333 f1:  0.38961038961038963
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 938.22it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4213483146067416  acc:  0.5785123966942148 f1:  0.19047619047619047
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.12it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 931.72it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5926846590909092  acc:  0.65 f1:  0.4166666666666667
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.78it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4224016853932584  acc:  0.5702479338842975 f1:  0.1875
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.51it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 936.64it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5973011363636364  acc:  0.675 f1:  0.43478260869565216
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.20it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4234550561797753  acc:  0.5702479338842975 f1:  0.16129032258064516
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.36it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 932.08it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5994318181818182  acc:  0.6416666666666667 f1:  0.410958904109589
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.16it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.42872191011235955  acc:  0.5537190082644629 f1:  0.1818181818181818
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.70it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 938.61it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6008522727272727  acc:  0.6333333333333333 f1:  0.40540540540540543
12  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.91it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4252106741573034  acc:  0.5537190082644629 f1:  0.1818181818181818
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.64it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 930.71it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6015625  acc:  0.675 f1:  0.41791044776119407
13  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4231039325842697  acc:  0.5702479338842975 f1:  0.16129032258064516
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.30it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 929.62it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6029829545454545  acc:  0.6416666666666667 f1:  0.39436619718309857
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.51it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4234550561797753  acc:  0.5371900826446281 f1:  0.17647058823529413
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.18it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 931.65it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6044034090909091  acc:  0.6583333333333333 f1:  0.3880597014925374
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.25it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.42240168539325845  acc:  0.5537190082644629 f1:  0.15625
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.30it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 936.73it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6097301136363635  acc:  0.6333333333333333 f1:  0.38888888888888884
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.00it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4220505617977528  acc:  0.5371900826446281 f1:  0.17647058823529413
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.77it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 940.98it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6079545454545454  acc:  0.6333333333333333 f1:  0.3714285714285715
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.25it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.42801966292134835  acc:  0.5371900826446281 f1:  0.15151515151515152
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.45it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 941.81it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6100852272727273  acc:  0.625 f1:  0.36619718309859156
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.87it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4234550561797753  acc:  0.5454545454545454 f1:  0.24657534246575344
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.22it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 933.45it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6115056818181818  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 939.65it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4216994382022472  acc:  0.5619834710743802 f1:  0.2318840579710145
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.93it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 938.39it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6107954545454545  acc:  0.6333333333333333 f1:  0.3714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 938.10it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4213483146067416  acc:  0.5537190082644629 f1:  0.22857142857142856
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.68it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.05it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6100852272727273  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 938.86it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4224016853932584  acc:  0.5537190082644629 f1:  0.22857142857142856
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.85it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 942.30it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6122159090909091  acc:  0.65 f1:  0.38235294117647056
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 940.38it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4238061797752809  acc:  0.5454545454545454 f1:  0.1791044776119403
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.79it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 941.66it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6125710227272727  acc:  0.6333333333333333 f1:  0.3714285714285715
23  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.24it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4224016853932584  acc:  0.5454545454545454 f1:  0.1791044776119403
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.05it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.82it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6107954545454545  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 939.26it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4199438202247191  acc:  0.5537190082644629 f1:  0.2058823529411765
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.47it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 929.75it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.609375  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 934.69it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4259129213483146  acc:  0.5454545454545454 f1:  0.20289855072463767
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.27it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 936.17it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6051136363636364  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 938.79it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4259129213483146  acc:  0.5454545454545454 f1:  0.20289855072463767
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.51it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 938.44it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6047585227272727  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 936.04it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4259129213483146  acc:  0.5537190082644629 f1:  0.1818181818181818
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.44it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 941.48it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.6047585227272727  acc:  0.65 f1:  0.39999999999999997
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 940.28it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.425561797752809  acc:  0.5537190082644629 f1:  0.2058823529411765
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.45it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 935.44it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6036931818181818  acc:  0.65 f1:  0.39999999999999997
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 939.84it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4252106741573034  acc:  0.5537190082644629 f1:  0.2058823529411765
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.47it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 941.52it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6008522727272727  acc:  0.65 f1:  0.39999999999999997
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 943.60it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4238061797752809  acc:  0.5537190082644629 f1:  0.2058823529411765
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.06it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 938.02it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6019176136363635  acc:  0.65 f1:  0.38235294117647056
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 938.37it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.42275280898876405  acc:  0.5619834710743802 f1:  0.20895522388059704
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.11it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 931.15it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6012073863636364  acc:  0.65 f1:  0.4166666666666667
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 933.96it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.42450842696629215  acc:  0.5537190082644629 f1:  0.2058823529411765
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.59it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.26it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5980113636363638  acc:  0.65 f1:  0.4166666666666667
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 939.78it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4238061797752809  acc:  0.5619834710743802 f1:  0.20895522388059704
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.37it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 935.43it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5987215909090909  acc:  0.6416666666666667 f1:  0.3582089552238806
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 942.12it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4245084269662921  acc:  0.5454545454545454 f1:  0.15384615384615385
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.93it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 940.57it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6012073863636364  acc:  0.65 f1:  0.39999999999999997
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 945.14it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.4283707865168539  acc:  0.5537190082644629 f1:  0.15625
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.09it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 940.21it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5990767045454546  acc:  0.6333333333333333 f1:  0.3125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 934.37it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.4304775280898876  acc:  0.5454545454545454 f1:  0.09836065573770493
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 904.04it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.59765625  acc:  0.65 f1:  0.39999999999999997
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 904.17it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.430126404494382  acc:  0.5371900826446281 f1:  0.125
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.46it/s]


 Average training loss: 0.86


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 905.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.59765625  acc:  0.6416666666666667 f1:  0.2950819672131148
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 905.10it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.43293539325842695  acc:  0.5537190082644629 f1:  0.09999999999999999
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.76it/s]


 Average training loss: 0.85


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 937.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5944602272727273  acc:  0.625 f1:  0.3283582089552239
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 940.91it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.43433988764044945  acc:  0.5371900826446281 f1:  0.09677419354838711


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 937.15it/s]

 Average valid loss: 1.07
AUC_SCORE:  0.4224016853932584  acc:  0.5454545454545454 f1:  0.1791044776119403
BEST MODEL
AUC_SCORE:  0.4224016853932584  acc:  0.5454545454545454 f1:  0.1791044776119403
{'auc_micro': 0.4224016853932584, 'acc': 0.5454545454545454, 'f1': 0.1791044776119403, 'pred': [[0, 1, 1, 0, 1, 1, 0, 0, 0, 0], [1, 0, 1, 0, 0, 0, 0, 0, 0, 1], [0, 0, 0, 0, 1, 0, 0, 0, 0, 0], [1, 0, 0, 0, 0, 0, 1, 1, 0, 0], [0, 1, 0, 1, 0, 0, 1, 0, 0, 0], [0, 0, 0, 0, 0, 1, 0, 0, 1, 0], [0, 0, 1, 0, 1, 0, 1, 0, 0, 0], [1, 0, 0, 1, 0, 0, 1, 0, 0, 1], [1, 0, 1, 0, 1, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 1, 1, 0], [1, 1, 1, 0, 0, 0, 0, 0, 0, 0], [0, 0, 1, 0, 0, 0, 1, 1, 1, 0], [0], [], [], [], [], [], [], []]}





# 평균 임베딩

In [27]:
import pickle
with open('emb_avg2.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [28]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [29]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [30]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.86it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.01it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.3895596590909091  acc:  0.5166666666666667 f1:  0.17142857142857143





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.04it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5410814606741573  acc:  0.6115702479338843 f1:  0.25396825396825395
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.17it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.66it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.3973721590909091  acc:  0.5083333333333333 f1:  0.23376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.82it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5639044943820225  acc:  0.5950413223140496 f1:  0.24615384615384617
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.52it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.92it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4030539772727273  acc:  0.5166666666666667 f1:  0.23684210526315788
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.46it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5639044943820225  acc:  0.5867768595041323 f1:  0.24242424242424243
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.36it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.84it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.40731534090909083  acc:  0.5083333333333333 f1:  0.23376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.32it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5589887640449438  acc:  0.6198347107438017 f1:  0.30303030303030304
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.28it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.92it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.41370738636363635  acc:  0.5083333333333333 f1:  0.23376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.45it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5512640449438202  acc:  0.6033057851239669 f1:  0.29411764705882354
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.08it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.55it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4172585227272727  acc:  0.55 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 835.00it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5491573033707866  acc:  0.6446280991735537 f1:  0.3174603174603175
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.89it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.41903409090909094  acc:  0.49166666666666664 f1:  0.22784810126582278
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5526685393258427  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.24it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.57it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4232954545454546  acc:  0.5083333333333333 f1:  0.23376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.01it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5488061797752808  acc:  0.6115702479338843 f1:  0.3188405797101449
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.69it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.47it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4275568181818182  acc:  0.5083333333333333 f1:  0.23376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.42it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5463483146067416  acc:  0.6033057851239669 f1:  0.33333333333333326
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.39it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.42862215909090906  acc:  0.5333333333333333 f1:  0.2820512820512821
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.95it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.545997191011236  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.30it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.05it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.43004261363636365  acc:  0.5416666666666666 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5474016853932584  acc:  0.6198347107438017 f1:  0.34285714285714286
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.50it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.43075284090909094  acc:  0.5333333333333333 f1:  0.2820512820512821
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.33it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5474016853932585  acc:  0.6198347107438017 f1:  0.34285714285714286
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.05it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.26it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4328835227272727  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.95it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5445926966292135  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.14it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.09it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4357244318181818  acc:  0.5416666666666666 f1:  0.2857142857142857
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.51it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5452949438202247  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.54it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.00it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4357244318181818  acc:  0.5333333333333333 f1:  0.2820512820512821
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 842.97it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5466994382022472  acc:  0.6115702479338843 f1:  0.3188405797101449
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.32it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.94it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.43572443181818177  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.75it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5484550561797754  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.15it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.74it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.43714488636363635  acc:  0.5333333333333333 f1:  0.3
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.14it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5470505617977528  acc:  0.6115702479338843 f1:  0.3188405797101449
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.01it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.08it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4382102272727273  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.48it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5481039325842697  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.95it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.43998579545454547  acc:  0.5166666666666667 f1:  0.23684210526315788
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.91it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5516151685393258  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.25it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.17it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4403409090909091  acc:  0.525 f1:  0.27848101265822783
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 842.27it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5516151685393259  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.55it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.72it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4421164772727273  acc:  0.5166666666666667 f1:  0.2564102564102564
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.92it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.555126404494382  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.83it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.14it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.44566761363636365  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.19it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5533707865168539  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.46it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.90it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4428267045454546  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.17it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5547752808988764  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.96it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.00it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.44495738636363635  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.28it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5554775280898877  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.66it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.89it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4485085227272727  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 835.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5565308988764045  acc:  0.6446280991735537 f1:  0.3384615384615385
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.44it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.90it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4470880681818182  acc:  0.525 f1:  0.24
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.19it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5568820224719101  acc:  0.6611570247933884 f1:  0.3492063492063492
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.24it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.20it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4477982954545454  acc:  0.5666666666666667 f1:  0.2571428571428571
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.03it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5575842696629214  acc:  0.6942148760330579 f1:  0.37288135593220334
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.27it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.98it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4549005681818182  acc:  0.5416666666666666 f1:  0.24657534246575344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 838.48it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5607443820224719  acc:  0.6776859504132231 f1:  0.36065573770491804
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.97it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.78it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45525568181818177  acc:  0.55 f1:  0.2894736842105263
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.33it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5617977528089888  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.83it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.45454545454545453  acc:  0.5666666666666667 f1:  0.2571428571428571
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.55it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5642556179775281  acc:  0.6776859504132231 f1:  0.36065573770491804
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.97it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.27it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4552556818181818  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 844.34it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5667134831460674  acc:  0.6611570247933884 f1:  0.3492063492063492
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.02it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.06it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4563210227272727  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.46it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5656601123595506  acc:  0.6528925619834711 f1:  0.34375
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.55it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.53it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.4602272727272727  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.32it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.567064606741573  acc:  0.6611570247933884 f1:  0.3492063492063492
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.48it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.32it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.46129261363636365  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.86it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5684691011235955  acc:  0.6776859504132231 f1:  0.3389830508474576
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.80it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.88it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.4630681818181818  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.84it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5712780898876405  acc:  0.6694214876033058 f1:  0.3548387096774193
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.19it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.66it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.46484375  acc:  0.575 f1:  0.26086956521739135
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.72it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5709269662921348  acc:  0.6859504132231405 f1:  0.3448275862068966
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.54it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.05it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.46519886363636365  acc:  0.575 f1:  0.26086956521739135
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.98it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.572682584269663  acc:  0.6859504132231405 f1:  0.3448275862068966
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.58it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.70it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.4694602272727273  acc:  0.5833333333333334 f1:  0.2647058823529412
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 838.53it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5730337078651686  acc:  0.6942148760330579 f1:  0.3508771929824561
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.57it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.65it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.4701704545454545  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 838.28it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5733848314606742  acc:  0.6942148760330579 f1:  0.37288135593220334
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.87it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.01it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.4719460227272727  acc:  0.5833333333333334 f1:  0.2647058823529412
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.45it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5737359550561798  acc:  0.6942148760330579 f1:  0.3508771929824561


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.43it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5410814606741573  acc:  0.6115702479338843 f1:  0.25396825396825395
BEST MODEL
AUC_SCORE:  0.5410814606741573  acc:  0.6115702479338843 f1:  0.25396825396825395
{'auc_micro': 0.5410814606741573, 'acc': 0.6115702479338843, 'f1': 0.25396825396825395, 'pred': [[1, 0, 0, 0, 0, 0, 1, 1, 0, 0], [1, 0, 0, 1, 1, 0, 0, 0, 0, 0], [0, 1, 0, 0, 0, 0, 0, 1, 0, 0], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 1, 0, 0], [1, 0, 1, 0, 0, 1, 0, 0, 0, 0], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 1, 1, 1, 0, 0], [0, 0, 1, 0, 0, 0, 0, 1, 0, 0], [0, 0, 0, 1, 1, 0, 0, 0, 0, 1], [0, 0, 0, 0, 0, 0, 1, 0, 1, 1], [0, 0, 0, 0, 0, 1, 1, 0, 1, 0], [0], [], [], [], [], [], [], []]}





# 그냥 metapath

In [31]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [32]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [33]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.65it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.40it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4897017045454545  acc:  0.6833333333333333 f1:  0.2962962962962963
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 837.11it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.41678370786516855  acc:  0.5867768595041323 f1:  0.21875
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.99it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.39it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5056818181818181  acc:  0.7166666666666667 f1:  0.2916666666666667
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.55it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4027387640449438  acc:  0.6115702479338843 f1:  0.17543859649122806
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.74it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 894.58it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5010653409090908  acc:  0.6583333333333333 f1:  0.2807017543859649
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.85it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.41292134831460675  acc:  0.5619834710743802 f1:  0.20895522388059704
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.78it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.15it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4928977272727273  acc:  0.6416666666666667 f1:  0.2950819672131148
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.59it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4227528089887641  acc:  0.5454545454545454 f1:  0.22535211267605634
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.71it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.84it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49183238636363635  acc:  0.6166666666666667 f1:  0.23333333333333334
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.06it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4280196629213483  acc:  0.5289256198347108 f1:  0.21917808219178084
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.52it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.02it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49112215909090906  acc:  0.625 f1:  0.23728813559322032
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.79it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.44241573033707865  acc:  0.5785123966942148 f1:  0.23880597014925375
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.56it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 895.14it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.48579545454545453  acc:  0.5833333333333334 f1:  0.21875
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.01it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4483848314606742  acc:  0.5619834710743802 f1:  0.2318840579710145
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.53it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 893.88it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.48508522727272724  acc:  0.5666666666666667 f1:  0.2777777777777778
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 885.94it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4540028089887641  acc:  0.5371900826446281 f1:  0.2432432432432432
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.69it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.61it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4797585227272727  acc:  0.5583333333333333 f1:  0.2318840579710145
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.23it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4599719101123596  acc:  0.5702479338842975 f1:  0.2571428571428571
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.32it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.48153409090909094  acc:  0.5666666666666667 f1:  0.23529411764705882
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46629213483146065  acc:  0.5785123966942148 f1:  0.26086956521739135
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.57it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 890.28it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4865056818181818  acc:  0.5666666666666667 f1:  0.23529411764705882
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.25it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.47471910112359555  acc:  0.5785123966942148 f1:  0.23880597014925375
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.50it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.97it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4861505681818182  acc:  0.5666666666666667 f1:  0.2972972972972973
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.17it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4824438202247191  acc:  0.5619834710743802 f1:  0.3291139240506329
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.53it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.26it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.48650568181818177  acc:  0.575 f1:  0.19047619047619047
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.70it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4863061797752809  acc:  0.5867768595041323 f1:  0.21875
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.63it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.94it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.48401988636363635  acc:  0.5416666666666666 f1:  0.24657534246575344
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.40it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48771067415730335  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.68it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.78it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.48757102272727276  acc:  0.5333333333333333 f1:  0.22222222222222224
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48981741573033716  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.51it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.85it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4872159090909091  acc:  0.55 f1:  0.22857142857142856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.68it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48946629213483145  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.92it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.63it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.48721590909090906  acc:  0.525 f1:  0.21917808219178084
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.47it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49227528089887646  acc:  0.6033057851239669 f1:  0.3513513513513513
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.70it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.27it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4875710227272727  acc:  0.5083333333333333 f1:  0.19178082191780824
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4922752808988764  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.42it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4861505681818181  acc:  0.525 f1:  0.24
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.40it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.495435393258427  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.04it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.78it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48721590909090906  acc:  0.5166666666666667 f1:  0.19444444444444442
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.60it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5007022471910112  acc:  0.6033057851239669 f1:  0.3513513513513513
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.23it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.76it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48686079545454547  acc:  0.5333333333333333 f1:  0.2631578947368421
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.53it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4985955056179775  acc:  0.5785123966942148 f1:  0.3376623376623376
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.68it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.93it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48828125  acc:  0.525 f1:  0.24
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.29it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5024578651685393  acc:  0.5785123966942148 f1:  0.3376623376623376
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.31it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.71it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.49147727272727276  acc:  0.525 f1:  0.19718309859154928
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.28it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5049157303370786  acc:  0.6033057851239669 f1:  0.33333333333333326
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.59it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.60it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4925426136363636  acc:  0.5333333333333333 f1:  0.22222222222222224
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.17it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5052668539325843  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.49it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 890.52it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.49218750000000006  acc:  0.5416666666666666 f1:  0.20289855072463767
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 884.69it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.507373595505618  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.38it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.42it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4946732954545454  acc:  0.5333333333333333 f1:  0.19999999999999998
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5098314606741573  acc:  0.6115702479338843 f1:  0.37333333333333335
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.33it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.74it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.49538352272727276  acc:  0.5416666666666666 f1:  0.22535211267605634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.60it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.514747191011236  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.96it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.49431818181818177  acc:  0.5416666666666666 f1:  0.22535211267605634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.76it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5179073033707866  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.19it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.17it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4932528409090909  acc:  0.5416666666666666 f1:  0.22535211267605634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.94it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5214185393258427  acc:  0.5950413223140496 f1:  0.3636363636363637
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.79it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.47it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4950284090909091  acc:  0.55 f1:  0.27027027027027023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.03it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.523876404494382  acc:  0.5867768595041323 f1:  0.358974358974359
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.41it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.82it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.49431818181818177  acc:  0.55 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 886.31it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5249297752808989  acc:  0.5867768595041323 f1:  0.358974358974359
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.91it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.64it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.49183238636363635  acc:  0.5666666666666667 f1:  0.1875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 845.74it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5263342696629214  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.04it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.38it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.49325284090909094  acc:  0.55 f1:  0.22857142857142856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.89it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5301966292134832  acc:  0.5785123966942148 f1:  0.31999999999999995
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.60it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.42it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.49680397727272724  acc:  0.5583333333333333 f1:  0.273972602739726
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.03it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5294943820224719  acc:  0.5702479338842975 f1:  0.33333333333333337
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.97it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.84it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.49609374999999994  acc:  0.5583333333333333 f1:  0.273972602739726
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.84it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5291432584269663  acc:  0.5785123966942148 f1:  0.3376623376623376
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.17it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.06it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4989346590909091  acc:  0.5583333333333333 f1:  0.2535211267605634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.14it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5305477528089888  acc:  0.5702479338842975 f1:  0.3157894736842105
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.73it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.92it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.49964488636363635  acc:  0.5666666666666667 f1:  0.2571428571428571
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.62it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5351123595505618  acc:  0.5702479338842975 f1:  0.33333333333333337
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.11it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.23it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5024857954545454  acc:  0.575 f1:  0.26086956521739135
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.96it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5361657303370786  acc:  0.5702479338842975 f1:  0.33333333333333337
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.35it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.98it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5024857954545454  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.50it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.538623595505618  acc:  0.5867768595041323 f1:  0.3421052631578948
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.77it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.36it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.5028409090909092  acc:  0.6083333333333333 f1:  0.25396825396825395
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.02it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5400280898876405  acc:  0.5785123966942148 f1:  0.31999999999999995


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.26it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.4483848314606742  acc:  0.5619834710743802 f1:  0.2318840579710145
BEST MODEL
AUC_SCORE:  0.4483848314606742  acc:  0.5619834710743802 f1:  0.2318840579710145
{'auc_micro': 0.4483848314606742, 'acc': 0.5619834710743802, 'f1': 0.2318840579710145, 'pred': [[0, 0, 0, 1, 1, 0, 0, 0, 1, 0], [0, 0, 1, 0, 1, 1, 0, 0, 1, 0], [0, 0, 0, 1, 0, 0, 0, 1, 0, 1], [1, 0, 0, 0, 0, 0, 0, 1, 0, 1], [0, 0, 0, 1, 0, 0, 0, 0, 0, 1], [0, 0, 0, 0, 0, 1, 0, 0, 1, 1], [0, 1, 0, 0, 0, 0, 0, 1, 0, 0], [1, 1, 0, 0, 0, 1, 0, 1, 0, 0], [0, 1, 1, 1, 0, 0, 0, 0, 1, 1], [0, 0, 0, 0, 0, 1, 0, 1, 0, 1], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0], [1, 1, 0, 0, 0, 0, 1, 1, 0, 0], [0], [], [], [], [], [], [], []]}





# Main_act

In [34]:
path1 = 'word2vec_model_extra+emb/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [35]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.48it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.30it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.46768465909090906  acc:  0.6083333333333333 f1:  0.2769230769230769





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.35it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6077949438202247  acc:  0.6776859504132231 f1:  0.3157894736842105
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.48082386363636365  acc:  0.6166666666666667 f1:  0.17857142857142858
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 845.10it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6042837078651685  acc:  0.6611570247933884 f1:  0.19607843137254902
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.09it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4861505681818182  acc:  0.65 f1:  0.125
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.95it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5898876404494382  acc:  0.7107438016528925 f1:  0.2857142857142857
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.26it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.87it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49289772727272724  acc:  0.6333333333333333 f1:  0.15384615384615385
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 827.82it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5684691011235956  acc:  0.6942148760330579 f1:  0.3018867924528302
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.22it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.70it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.48970170454545453  acc:  0.575 f1:  0.19047619047619047
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.42it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5691713483146068  acc:  0.6776859504132231 f1:  0.36065573770491804
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.20it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.59it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49644886363636365  acc:  0.5916666666666667 f1:  0.19672131147540986
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.12it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5614466292134832  acc:  0.6859504132231405 f1:  0.32142857142857145
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.62it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.41it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5021306818181818  acc:  0.6166666666666667 f1:  0.23333333333333334
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.57it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5610955056179776  acc:  0.6694214876033058 f1:  0.3333333333333333
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.03it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.45it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.50390625  acc:  0.65 f1:  0.27586206896551724
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.80it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5547752808988764  acc:  0.6776859504132231 f1:  0.3389830508474576
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.78it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.35it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5063920454545454  acc:  0.5833333333333334 f1:  0.2647058823529412
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.555126404494382  acc:  0.6198347107438017 f1:  0.34285714285714286
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 116.25it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.80it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5110085227272727  acc:  0.6 f1:  0.27272727272727276
9  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.65it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.557935393258427  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.74it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.68it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5102982954545454  acc:  0.6 f1:  0.3142857142857143
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.17it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5547752808988764  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.09it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.49it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5127840909090909  acc:  0.6083333333333333 f1:  0.3188405797101449
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5516151685393258  acc:  0.6115702479338843 f1:  0.3188405797101449
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.23it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5166903409090908  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.82it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.550561797752809  acc:  0.6033057851239669 f1:  0.3142857142857143
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.98it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5159801136363635  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.01it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5452949438202248  acc:  0.6033057851239669 f1:  0.33333333333333326
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.36it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.00it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.51953125  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.78it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5421348314606742  acc:  0.6115702479338843 f1:  0.3561643835616438
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.38it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5230823863636364  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.07it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.543188202247191  acc:  0.6033057851239669 f1:  0.3513513513513513
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.30it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.65it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5262784090909092  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.86it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5410814606741573  acc:  0.6198347107438017 f1:  0.34285714285714286
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.77it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.05it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5269886363636364  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.43it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5393258426966293  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.35it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.75it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5287642045454546  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.29it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.540379213483146  acc:  0.6363636363636364 f1:  0.35294117647058826
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.42it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.95it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5276988636363636  acc:  0.6 f1:  0.33333333333333326
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.31it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5393258426966292  acc:  0.6198347107438017 f1:  0.34285714285714286
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.36it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.18it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5294744318181819  acc:  0.6 f1:  0.33333333333333326
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.63it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5438904494382022  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.69it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.54it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5301846590909091  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.49it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5463483146067416  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.03it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.38it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5319602272727273  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.22it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5438904494382022  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.82it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.75it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5308948863636364  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5407303370786518  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.71it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.96it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5323153409090909  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.35it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5393258426966292  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.19it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.54it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5333806818181819  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.28it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.538623595505618  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.68it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.77it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5323153409090908  acc:  0.6083333333333333 f1:  0.3188405797101449
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 834.52it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5379213483146067  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.59it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 670.25it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5337357954545454  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 790.50it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.543188202247191  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.26it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.98it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5344460227272727  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.543188202247191  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.35it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.27it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5362215909090908  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.14it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5442415730337078  acc:  0.6115702479338843 f1:  0.3188405797101449
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.06it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.79it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5358664772727273  acc:  0.6166666666666667 f1:  0.3235294117647059
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.59it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5470505617977528  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.38it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.52it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5390625  acc:  0.6333333333333333 f1:  0.35294117647058826
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.84it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5474016853932584  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.13it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.66it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5394176136363636  acc:  0.6333333333333333 f1:  0.35294117647058826
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.76it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5495084269662921  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.76it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.26it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5390625  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.74it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.550561797752809  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.14it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.36it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5383522727272727  acc:  0.625 f1:  0.34782608695652173
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 886.31it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5516151685393258  acc:  0.6198347107438017 f1:  0.3235294117647059
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.97it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.95it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5387073863636364  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.58it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5540730337078652  acc:  0.628099173553719 f1:  0.34782608695652173
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.14it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.02it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5390625  acc:  0.625 f1:  0.34782608695652173
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 885.22it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5554775280898876  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.63it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.38it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5408380681818181  acc:  0.625 f1:  0.34782608695652173
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.39it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5572331460674158  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.63it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.36it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5397727272727273  acc:  0.6333333333333333 f1:  0.38888888888888884
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.76it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.559691011235955  acc:  0.628099173553719 f1:  0.34782608695652173
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.07it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 890.69it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5411931818181819  acc:  0.6416666666666667 f1:  0.37681159420289856
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.43it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.559691011235955  acc:  0.6446280991735537 f1:  0.3582089552238806


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.94it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5547752808988764  acc:  0.6115702479338843 f1:  0.3380281690140845
BEST MODEL
AUC_SCORE:  0.5547752808988764  acc:  0.6115702479338843 f1:  0.3380281690140845
{'auc_micro': 0.5547752808988764, 'acc': 0.6115702479338843, 'f1': 0.3380281690140845, 'pred': [[0, 0, 0, 0, 1, 0, 0, 0, 1, 0], [0, 0, 1, 0, 0, 1, 0, 0, 0, 0], [0, 0, 0, 1, 1, 0, 0, 0, 1, 0], [0, 0, 0, 0, 0, 1, 0, 1, 0, 1], [1, 0, 1, 0, 1, 0, 0, 0, 0, 1], [1, 0, 1, 0, 0, 1, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 1, 1, 0], [1, 1, 0, 0, 1, 0, 1, 1, 0, 0], [0, 1, 1, 1, 0, 1, 0, 1, 1, 0], [1, 0, 1, 1, 0, 1, 0, 1, 0, 0], [0, 0, 0, 0, 0, 0, 1, 1, 0, 0], [0, 1, 0, 0, 0, 0, 1, 0, 0, 0], [0], [], [], [], [], [], [], []]}





# pos

In [36]:
path1 = 'word2vec_model_extra+pos/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,400)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [37]:
bert2 = BertModel(d_model=400).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=25)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.44it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.99it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4215198863636364  acc:  0.65 f1:  0.08695652173913043
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4740767045454546  acc:  0.6666666666666666 f1:  0.16666666666666666
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.94it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.55it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.44424715909090906  acc:  0.6583333333333333 f1:  0.16326530612244897
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 831.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4616477272727273  acc:  0.6333333333333333 f1:  0.15384615384615385
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.75it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.03it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.4485085227272727  acc:  0.65 f1:  0.16
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4737215909090909  acc:  0.6333333333333333 f1:  0.15384615384615385
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.92it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.37it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.45241477272727265  acc:  0.6666666666666666 f1:  0.23076923076923075
3  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 836.48it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4907670454545454  acc:  0.6166666666666667 f1:  0.14814814814814814
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 122.21it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.16it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.4580965909090909  acc:  0.6583333333333333 f1:  0.22641509433962265
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.69it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.49112215909090906  acc:  0.625 f1:  0.18181818181818182
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.24it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.59it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4634232954545454  acc:  0.65 f1:  0.27586206896551724
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 817.49it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4946732954545454  acc:  0.6 f1:  0.22580645161290322
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.11it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.05it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46803977272727276  acc:  0.6583333333333333 f1:  0.3050847457627119
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.68it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.49964488636363635  acc:  0.6083333333333333 f1:  0.2769230769230769
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.58it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.17it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.47265625  acc:  0.6333333333333333 f1:  0.29032258064516125
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 835.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5067471590909091  acc:  0.6166666666666667 f1:  0.30303030303030304
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 122.35it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.67it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4786931818181818  acc:  0.65 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.28it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5095880681818181  acc:  0.6 f1:  0.25
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.55it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.53it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4825994318181818  acc:  0.65 f1:  0.30000000000000004
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.88it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5181107954545454  acc:  0.6083333333333333 f1:  0.29850746268656714
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.35it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.09it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4840198863636364  acc:  0.6333333333333333 f1:  0.26666666666666666
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.97it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5209517045454546  acc:  0.6166666666666667 f1:  0.30303030303030304
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 122.41it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.84it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4857954545454546  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.49it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5269886363636364  acc:  0.6 f1:  0.3142857142857143
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.91it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.81it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.48863636363636365  acc:  0.625 f1:  0.26229508196721313
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.21it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5330255681818182  acc:  0.6166666666666667 f1:  0.3235294117647059
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.81it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.49it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.49076704545454547  acc:  0.6083333333333333 f1:  0.25396825396825395
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.01it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5344460227272727  acc:  0.6083333333333333 f1:  0.3188405797101449
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.55it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.12it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4911221590909091  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.57it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5383522727272727  acc:  0.6 f1:  0.3142857142857143
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.94it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.93it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.49183238636363646  acc:  0.625 f1:  0.23728813559322032
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.40it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5390625  acc:  0.6083333333333333 f1:  0.2769230769230769
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.22it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.09it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.48863636363636365  acc:  0.6166666666666667 f1:  0.23333333333333334
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.78it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5447443181818181  acc:  0.6083333333333333 f1:  0.2769230769230769
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.14it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.95it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4861505681818182  acc:  0.6166666666666667 f1:  0.23333333333333334
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.06it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.54296875  acc:  0.6166666666666667 f1:  0.28125
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.65it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.01it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4857954545454546  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.16it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.546875  acc:  0.6083333333333333 f1:  0.29850746268656714
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.12it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.33it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4847301136363637  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.57it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5479403409090909  acc:  0.6083333333333333 f1:  0.29850746268656714
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.65it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.66it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4850852272727273  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.10it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5522017045454546  acc:  0.6083333333333333 f1:  0.29850746268656714
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.09it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.91it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.48473011363636365  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.39it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5543323863636364  acc:  0.6166666666666667 f1:  0.3235294117647059
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.00it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.66it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.48330965909090906  acc:  0.5916666666666667 f1:  0.26865671641791045
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.36it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5582386363636364  acc:  0.6333333333333333 f1:  0.3714285714285715
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.62it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.78it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4850852272727273  acc:  0.5916666666666667 f1:  0.24615384615384617
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.03it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5610795454545454  acc:  0.6166666666666667 f1:  0.3235294117647059
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.04it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.61it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.48579545454545453  acc:  0.6083333333333333 f1:  0.25396825396825395
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.87it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5610795454545455  acc:  0.6166666666666667 f1:  0.28125


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.38it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.5067471590909091  acc:  0.6166666666666667 f1:  0.30303030303030304
BEST MODEL
AUC_SCORE:  0.5067471590909091  acc:  0.6166666666666667 f1:  0.30303030303030304
{'auc_micro': 0.5067471590909091, 'acc': 0.6166666666666667, 'f1': 0.30303030303030304, 'pred': [[0, 0, 0, 0, 0, 1, 0, 0, 0, 0], [1, 0, 0, 1, 1, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 1, 0, 0], [1, 0, 0, 1, 1, 0, 0, 0, 1, 1], [0, 1, 0, 0, 0, 1, 0, 0, 0, 0], [0, 0, 0, 0, 1, 0, 0, 1, 1, 0], [0, 0, 0, 0, 0, 0, 0, 1, 0, 1], [1, 0, 0, 0, 1, 1, 1, 0, 0, 0], [0, 0, 0, 0, 1, 0, 1, 1, 0, 1], [0, 0, 0, 1, 1, 0, 1, 0, 1, 0], [0, 0, 1, 1, 0, 1, 1, 0, 0, 0], [0, 0, 0, 0, 0, 1, 0, 0, 0, 0], [], [], [], [], [], [], [], []]}





# text_rank

In [38]:
path1 = 'word2vec_model_text/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [39]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.61it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5042613636363636  acc:  0.6583333333333333 f1:  0.16326530612244897
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.39it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4199438202247191  acc:  0.6776859504132231 f1:  0.1702127659574468
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.61it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.45it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5053267045454546  acc:  0.6416666666666667 f1:  0.1568627450980392
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.67it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.43995786516853935  acc:  0.6694214876033058 f1:  0.19999999999999998
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.83it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.76it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.50390625  acc:  0.6333333333333333 f1:  0.21428571428571427
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.56it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.45751404494382025  acc:  0.6776859504132231 f1:  0.23529411764705882
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.27it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.59it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5024857954545454  acc:  0.6083333333333333 f1:  0.29850746268656714
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.32it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46980337078651685  acc:  0.5619834710743802 f1:  0.20895522388059704
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.24it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.73it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49822443181818177  acc:  0.6416666666666667 f1:  0.21818181818181817
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 831.64it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4841994382022472  acc:  0.6446280991735537 f1:  0.2456140350877193
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.59it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.72it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5031960227272727  acc:  0.575 f1:  0.21538461538461537
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 855.49it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4957865168539326  acc:  0.6198347107438017 f1:  0.23333333333333334
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.63it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 891.70it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5046164772727273  acc:  0.5916666666666667 f1:  0.24615384615384617
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.88it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.502808988764045  acc:  0.5785123966942148 f1:  0.23880597014925375
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.20it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.68it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5017755681818181  acc:  0.5916666666666667 f1:  0.24615384615384617
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.72it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5087780898876405  acc:  0.5702479338842975 f1:  0.2571428571428571
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.37it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.14it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5035511363636365  acc:  0.6083333333333333 f1:  0.29850746268656714
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.68it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5112359550561797  acc:  0.5619834710743802 f1:  0.273972602739726
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.71it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.63it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5060369318181819  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.03it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.519311797752809  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.09it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.79it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5046164772727273  acc:  0.6 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.54it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5245786516853933  acc:  0.5950413223140496 f1:  0.2898550724637681
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.11it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5067471590909092  acc:  0.5916666666666667 f1:  0.24615384615384617
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.13it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5287921348314607  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.27it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.66it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5060369318181819  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.52it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5347612359550562  acc:  0.6115702479338843 f1:  0.37333333333333335
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.77it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.80it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5046164772727273  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.42it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5365168539325843  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.40it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.03it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5049715909090908  acc:  0.5916666666666667 f1:  0.26865671641791045
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.01it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.541432584269663  acc:  0.6528925619834711 f1:  0.39999999999999997
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.99it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.77it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5092329545454546  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.62it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5438904494382023  acc:  0.6446280991735537 f1:  0.37681159420289856
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.44it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.57it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5067471590909092  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.42it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5442415730337079  acc:  0.6528925619834711 f1:  0.39999999999999997
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.77it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.05it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5088778409090909  acc:  0.6 f1:  0.27272727272727276
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.74it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.545997191011236  acc:  0.6446280991735537 f1:  0.37681159420289856
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.10it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.37it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5095880681818181  acc:  0.55 f1:  0.2894736842105263
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.58it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5516151685393258  acc:  0.6033057851239669 f1:  0.3684210526315789
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.10it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.46it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5071022727272727  acc:  0.575 f1:  0.28169014084507044
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5502106741573034  acc:  0.6198347107438017 f1:  0.36111111111111116
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.92it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.15it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5110085227272727  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.92it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5512640449438202  acc:  0.628099173553719 f1:  0.36619718309859156
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.70it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.50it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5106534090909091  acc:  0.6083333333333333 f1:  0.3188405797101449
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.35it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5523174157303371  acc:  0.628099173553719 f1:  0.36619718309859156
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.13it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5095880681818182  acc:  0.575 f1:  0.3013698630136986
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5502106741573034  acc:  0.6115702479338843 f1:  0.3561643835616438
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.90it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.57it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5074573863636364  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.80it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5530196629213483  acc:  0.628099173553719 f1:  0.36619718309859156
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.78it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.29it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5110085227272727  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.39it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5547752808988764  acc:  0.628099173553719 f1:  0.36619718309859156
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.69it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.37it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5131392045454546  acc:  0.625 f1:  0.28571428571428575
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.90it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.557935393258427  acc:  0.6363636363636364 f1:  0.3714285714285715
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 116.09it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.92it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5120738636363636  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.31it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.557935393258427  acc:  0.6198347107438017 f1:  0.36111111111111116
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.19it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.40it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5102982954545454  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.54it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5561797752808989  acc:  0.6363636363636364 f1:  0.3714285714285715
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.64it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.60it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5142045454545454  acc:  0.6083333333333333 f1:  0.29850746268656714
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5586376404494382  acc:  0.6363636363636364 f1:  0.3714285714285715
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.97it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.09it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5170454545454546  acc:  0.6166666666666667 f1:  0.28125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.06it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5621488764044944  acc:  0.6446280991735537 f1:  0.37681159420289856
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.07it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.13it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5177556818181819  acc:  0.6166666666666667 f1:  0.28125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5646067415730337  acc:  0.6446280991735537 f1:  0.37681159420289856
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.07it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.16it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5184659090909091  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.03it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5656601123595506  acc:  0.6115702479338843 f1:  0.3561643835616438
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.54it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.16it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.51953125  acc:  0.6083333333333333 f1:  0.2769230769230769
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.34it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5674157303370786  acc:  0.6528925619834711 f1:  0.38235294117647056
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.43it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.81it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5216619318181819  acc:  0.6 f1:  0.33333333333333326
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.11it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5688202247191012  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.44it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.50it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5177556818181818  acc:  0.625 f1:  0.28571428571428575
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.23it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5702247191011236  acc:  0.6776859504132231 f1:  0.38095238095238093
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.02it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.07it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5181107954545454  acc:  0.6166666666666667 f1:  0.28125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 812.20it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5723314606741572  acc:  0.6694214876033058 f1:  0.375
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.11it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.30it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5177556818181819  acc:  0.6166666666666667 f1:  0.3235294117647059
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.87it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5709269662921348  acc:  0.628099173553719 f1:  0.34782608695652173
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.60it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.34it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5159801136363635  acc:  0.6166666666666667 f1:  0.28125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.93it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5747893258426966  acc:  0.6776859504132231 f1:  0.38095238095238093
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.61it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.97it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5163352272727273  acc:  0.625 f1:  0.3283582089552239
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.19it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5751404494382023  acc:  0.6528925619834711 f1:  0.3636363636363636
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.50it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.95it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5184659090909091  acc:  0.65 f1:  0.30000000000000004
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.37it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5751404494382022  acc:  0.6776859504132231 f1:  0.38095238095238093


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.31it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.5112359550561797  acc:  0.5619834710743802 f1:  0.273972602739726
BEST MODEL
AUC_SCORE:  0.5112359550561797  acc:  0.5619834710743802 f1:  0.273972602739726
{'auc_micro': 0.5112359550561797, 'acc': 0.5619834710743802, 'f1': 0.273972602739726, 'pred': [[0, 0, 0, 1, 0, 0, 0, 0, 0, 0], [0, 1, 0, 0, 1, 1, 1, 1, 0, 1], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0], [0, 1, 0, 0, 1, 1, 0, 0, 0, 1], [1, 0, 1, 0, 1, 1, 1, 1, 0, 0], [0, 0, 0, 0, 0, 1, 0, 0, 0, 0], [1, 0, 1, 0, 1, 0, 0, 0, 0, 0], [1, 0, 0, 0, 1, 1, 1, 1, 0, 0], [0, 1, 1, 1, 0, 0, 0, 1, 1, 0], [0, 0, 0, 0, 1, 1, 1, 1, 0, 0], [0, 0, 1, 0, 0, 0, 1, 0, 1, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0, 1], [0], [], [], [], [], [], [], []]}





In [40]:
path1 = 'word2vec_model_text2/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [41]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.00it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.87it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.4147727272727273  acc:  0.5833333333333334 f1:  0.13793103448275862





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 831.35it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4915730337078652  acc:  0.6115702479338843 f1:  0.20338983050847456
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.20it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.17it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.42613636363636365  acc:  0.5833333333333334 f1:  0.21875
1  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.52it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49648876404494385  acc:  0.5950413223140496 f1:  0.24615384615384617
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.66it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.11it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.44460227272727276  acc:  0.5666666666666667 f1:  0.23529411764705882
2  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 845.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5049157303370786  acc:  0.5702479338842975 f1:  0.23529411764705882
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.14it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.45028409090909094  acc:  0.5333333333333333 f1:  0.2432432432432432
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.91it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5063202247191011  acc:  0.5537190082644629 f1:  0.2894736842105263
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 116.92it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.45419034090909094  acc:  0.5583333333333333 f1:  0.2318840579710145
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.51it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5098314606741572  acc:  0.5454545454545454 f1:  0.24657534246575344
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 113.45it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.56it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4552556818181819  acc:  0.5416666666666666 f1:  0.22535211267605634
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.19it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5122893258426966  acc:  0.5619834710743802 f1:  0.31168831168831174
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.47it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.91it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4549005681818182  acc:  0.5166666666666667 f1:  0.23684210526315788
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.97it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5129915730337079  acc:  0.5454545454545454 f1:  0.32098765432098764
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.45it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.37it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4602272727272727  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 889.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5179073033707865  acc:  0.5537190082644629 f1:  0.325
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.06it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.42it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46484375  acc:  0.5 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.67it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5182584269662922  acc:  0.5371900826446281 f1:  0.3488372093023256
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.51it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.05it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4641335227272727  acc:  0.5 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.33it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5235252808988764  acc:  0.5537190082644629 f1:  0.325
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.33it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.63it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.46555397727272724  acc:  0.49166666666666664 f1:  0.2469135802469136
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.94it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5273876404494382  acc:  0.5371900826446281 f1:  0.3170731707317073
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.84it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.44it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.4669744318181818  acc:  0.5333333333333333 f1:  0.2631578947368421
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.58it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5301966292134832  acc:  0.5619834710743802 f1:  0.31168831168831174
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.32it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.63it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.47123579545454547  acc:  0.5 f1:  0.25
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.98it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5319522471910112  acc:  0.5371900826446281 f1:  0.33333333333333337
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.40it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.74it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4719460227272727  acc:  0.525 f1:  0.25974025974025977
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.87it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5382724719101124  acc:  0.5371900826446281 f1:  0.3
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.55it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.47372159090909094  acc:  0.5416666666666666 f1:  0.2666666666666667
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.04it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5403792134831461  acc:  0.5537190082644629 f1:  0.30769230769230765
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.31it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.88it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.4740767045454546  acc:  0.5416666666666666 f1:  0.2666666666666667
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.21it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5431882022471911  acc:  0.5454545454545454 f1:  0.3037974683544304
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.21it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.11it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4708806818181818  acc:  0.55 f1:  0.27027027027027023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.43it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5424859550561798  acc:  0.5537190082644629 f1:  0.30769230769230765
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.47it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.40it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.4733664772727273  acc:  0.5666666666666667 f1:  0.2777777777777778
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.78it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5502106741573034  acc:  0.5619834710743802 f1:  0.31168831168831174
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.75it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.67it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.47265625  acc:  0.55 f1:  0.27027027027027023
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.72it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5516151685393258  acc:  0.5371900826446281 f1:  0.3
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.17it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.05it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.47265625000000006  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.20it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5554775280898877  acc:  0.5537190082644629 f1:  0.2894736842105263
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.00it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.12it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.4754971590909091  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.10it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5575842696629214  acc:  0.5537190082644629 f1:  0.2894736842105263
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.30it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.97it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4758522727272727  acc:  0.5666666666666667 f1:  0.2777777777777778
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.17it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5610955056179775  acc:  0.5454545454545454 f1:  0.3037974683544304
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.50it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 891.00it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.4733664772727273  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 888.28it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5610955056179775  acc:  0.5619834710743802 f1:  0.31168831168831174
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.42it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.04it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.4751420454545455  acc:  0.575 f1:  0.3013698630136986
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.48it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5610955056179776  acc:  0.5537190082644629 f1:  0.30769230769230765
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.13it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 891.79it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.47407670454545453  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 885.89it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5625  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.45it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 893.09it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4737215909090909  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 887.28it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5628511235955056  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.51it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.86it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.46981534090909083  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.44it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5635533707865169  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.15it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.22it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4659090909090909  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.84it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.567064606741573  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.77it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 894.85it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4662642045454546  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 888.36it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5691713483146067  acc:  0.5950413223140496 f1:  0.3466666666666667
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.20it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.20it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.46839488636363635  acc:  0.6 f1:  0.3142857142857143
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.60it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5733848314606741  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.34it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.40it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.46875  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5772471910112359  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.28it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.74it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.46981534090909094  acc:  0.6083333333333333 f1:  0.3188405797101449
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.82it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5804073033707866  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.62it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.37it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.46875  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5811095505617978  acc:  0.6115702479338843 f1:  0.3380281690140845
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.75it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.37it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.46839488636363635  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.14it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5835674157303371  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.95it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.43it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.4673295454545454  acc:  0.5583333333333333 f1:  0.29333333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.58it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.5867275280898876  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.19it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.88it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.46875  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.15it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5905898876404495  acc:  0.6363636363636364 f1:  0.33333333333333337
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.11it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 896.72it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.46981534090909094  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 894.16it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5916432584269663  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.56it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 894.71it/s]


 Average valid loss: 1.19
AUC_SCORE:  0.4694602272727273  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 892.41it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.59375  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.09it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 899.84it/s]


 Average valid loss: 1.20
AUC_SCORE:  0.46590909090909094  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 894.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5976123595505617  acc:  0.628099173553719 f1:  0.3283582089552239
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.05it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 898.23it/s]


 Average valid loss: 1.21
AUC_SCORE:  0.4616477272727273  acc:  0.575 f1:  0.3013698630136986
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 893.98it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5976123595505618  acc:  0.6198347107438017 f1:  0.3235294117647059


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 886.83it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5063202247191011  acc:  0.5537190082644629 f1:  0.2894736842105263
BEST MODEL
AUC_SCORE:  0.5063202247191011  acc:  0.5537190082644629 f1:  0.2894736842105263
{'auc_micro': 0.5063202247191011, 'acc': 0.5537190082644629, 'f1': 0.2894736842105263, 'pred': [[0, 1, 1, 0, 1, 0, 1, 0, 0, 0], [0, 1, 1, 0, 1, 1, 0, 1, 1, 1], [0, 0, 0, 1, 0, 0, 0, 1, 1, 0], [0, 0, 1, 0, 1, 0, 0, 0, 0, 1], [1, 0, 0, 0, 0, 0, 0, 1, 0, 1], [1, 1, 0, 0, 0, 1, 0, 1, 1, 0], [0, 0, 0, 0, 1, 0, 0, 1, 0, 1], [1, 0, 1, 0, 0, 1, 1, 1, 0, 0], [0, 0, 0, 1, 0, 1, 0, 1, 0, 0], [0, 0, 0, 1, 1, 1, 1, 1, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 1, 0, 0, 0, 1, 0, 1, 0, 0], [0], [], [], [], [], [], [], []]}





In [42]:
path1 = 'word2vec_model_text3/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'flashback'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [43]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.25it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 900.08it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5017755681818181  acc:  0.6083333333333333 f1:  0.29850746268656714
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.62it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.524929775280899  acc:  0.6611570247933884 f1:  0.22641509433962265
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.49it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 897.56it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5142045454545455  acc:  0.6333333333333333 f1:  0.33333333333333337
1  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 892.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5066713483146068  acc:  0.628099173553719 f1:  0.21052631578947367
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.32it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 895.18it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.51953125  acc:  0.6333333333333333 f1:  0.33333333333333337
2  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.59it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.504564606741573  acc:  0.6198347107438017 f1:  0.14814814814814814
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.97it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.20it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5152698863636364  acc:  0.6583333333333333 f1:  0.3880597014925374
3  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.50it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4936797752808989  acc:  0.6198347107438017 f1:  0.17857142857142858
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.78it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.06it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5124289772727273  acc:  0.6083333333333333 f1:  0.37333333333333335
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 841.60it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.48735955056179775  acc:  0.5867768595041323 f1:  0.16666666666666666
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.02it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 897.44it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5145596590909091  acc:  0.575 f1:  0.3544303797468354
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.39it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.4943820224719101  acc:  0.5702479338842975 f1:  0.1875
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.32it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 899.74it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5131392045454546  acc:  0.5666666666666667 f1:  0.33333333333333337
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.49473314606741575  acc:  0.5867768595041323 f1:  0.19354838709677422
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.79it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 897.93it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5177556818181818  acc:  0.5583333333333333 f1:  0.31168831168831174
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5049157303370786  acc:  0.5867768595041323 f1:  0.19354838709677422
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 123.10it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 894.08it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5184659090909091  acc:  0.5416666666666666 f1:  0.2857142857142857
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.30it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5052668539325843  acc:  0.5867768595041323 f1:  0.19354838709677422
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.53it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.05it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.5191761363636364  acc:  0.5416666666666666 f1:  0.3037974683544304
9  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.67it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5042134831460674  acc:  0.5785123966942148 f1:  0.21538461538461537
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.06it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.76it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.515625  acc:  0.5416666666666666 f1:  0.3037974683544304
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.72it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5066713483146067  acc:  0.5950413223140496 f1:  0.26865671641791045
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.27it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.00it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5120738636363636  acc:  0.5416666666666666 f1:  0.3037974683544304
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.83it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5024578651685393  acc:  0.5702479338842975 f1:  0.2571428571428571
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.21it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 823.37it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5106534090909091  acc:  0.55 f1:  0.325
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.58it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5024578651685393  acc:  0.5950413223140496 f1:  0.32876712328767116
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.36it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.14it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5177556818181819  acc:  0.5583333333333333 f1:  0.3291139240506329
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.33it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5042134831460674  acc:  0.6033057851239669 f1:  0.33333333333333326
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.89it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.09it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.51953125  acc:  0.5666666666666667 f1:  0.33333333333333337
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.45it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.502808988764045  acc:  0.6033057851239669 f1:  0.33333333333333326
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.39it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.09it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5216619318181818  acc:  0.575 f1:  0.3376623376623376
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.04it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5031601123595506  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.73it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.71it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5234375  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.78it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5052668539325842  acc:  0.5950413223140496 f1:  0.3098591549295775
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.85it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.76it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5230823863636364  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.59it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5028089887640449  acc:  0.5785123966942148 f1:  0.3013698630136986
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.56it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.66it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.5252130681818182  acc:  0.5666666666666667 f1:  0.35000000000000003
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 884.25it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5056179775280899  acc:  0.5537190082644629 f1:  0.30769230769230765
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.16it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.71it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5259232954545454  acc:  0.5916666666666667 f1:  0.32876712328767116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.22it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5059691011235956  acc:  0.5785123966942148 f1:  0.28169014084507044
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.50it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.61it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5284090909090908  acc:  0.5833333333333334 f1:  0.358974358974359
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.81it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5108848314606742  acc:  0.5371900826446281 f1:  0.3
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.05it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.32it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5291193181818182  acc:  0.5916666666666667 f1:  0.32876712328767116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.71it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5133426966292135  acc:  0.5785123966942148 f1:  0.3013698630136986
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.32it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.08it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5301846590909091  acc:  0.5833333333333334 f1:  0.3243243243243243
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.64it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.511938202247191  acc:  0.5537190082644629 f1:  0.2894736842105263
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.63it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.02it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5255681818181819  acc:  0.5833333333333334 f1:  0.3055555555555556
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.95it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.511938202247191  acc:  0.5454545454545454 f1:  0.24657534246575344
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.73it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.30it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5298295454545454  acc:  0.5833333333333334 f1:  0.3421052631578948
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.5126404494382022  acc:  0.5206611570247934 f1:  0.23684210526315788
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.26it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.83it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5301846590909091  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 887.26it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5122893258426966  acc:  0.5702479338842975 f1:  0.2571428571428571
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.23it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.88it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5326704545454546  acc:  0.5916666666666667 f1:  0.3098591549295775
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.12it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5122893258426966  acc:  0.5371900826446281 f1:  0.2432432432432432
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.78it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.53515625  acc:  0.5916666666666667 f1:  0.32876712328767116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.98it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5133426966292135  acc:  0.5289256198347108 f1:  0.24
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.89it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.84it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5326704545454546  acc:  0.6 f1:  0.29411764705882354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 882.82it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5168539325842697  acc:  0.5454545454545454 f1:  0.22535211267605634
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.59it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.62it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5362215909090909  acc:  0.5916666666666667 f1:  0.32876712328767116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 885.87it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5186095505617977  acc:  0.5454545454545454 f1:  0.2857142857142857
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.57it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.77it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.5397727272727273  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.60it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.5203651685393258  acc:  0.5537190082644629 f1:  0.2894736842105263
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.11it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.83it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5401278409090908  acc:  0.5916666666666667 f1:  0.2898550724637681
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.77it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5207162921348315  acc:  0.5537190082644629 f1:  0.27027027027027023
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.65it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 830.63it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5383522727272727  acc:  0.6083333333333333 f1:  0.3380281690140845
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 807.90it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5224719101123596  acc:  0.5537190082644629 f1:  0.27027027027027023
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 117.01it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.71it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5376420454545454  acc:  0.6166666666666667 f1:  0.36111111111111116
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 881.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5245786516853932  acc:  0.5537190082644629 f1:  0.27027027027027023
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.43it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.86it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5401278409090909  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.98it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5287921348314607  acc:  0.5702479338842975 f1:  0.2972972972972973
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.56it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.95it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5401278409090909  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.53it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5354634831460674  acc:  0.5619834710743802 f1:  0.29333333333333333
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.94it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 893.30it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5387073863636364  acc:  0.6 f1:  0.3513513513513513
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 889.91it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5368679775280899  acc:  0.5702479338842975 f1:  0.33333333333333337
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.84it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.31it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5411931818181819  acc:  0.5916666666666667 f1:  0.3636363636363637
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.56it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5410814606741573  acc:  0.5702479338842975 f1:  0.33333333333333337
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.51it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.77it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5397727272727273  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.80it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.5466994382022472  acc:  0.5867768595041323 f1:  0.3243243243243243
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.67it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.62it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5419034090909091  acc:  0.6083333333333333 f1:  0.3561643835616438
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.59it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.547752808988764  acc:  0.5950413223140496 f1:  0.3466666666666667


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.79it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.5042134831460674  acc:  0.5785123966942148 f1:  0.21538461538461537
BEST MODEL
AUC_SCORE:  0.5042134831460674  acc:  0.5785123966942148 f1:  0.21538461538461537
{'auc_micro': 0.5042134831460674, 'acc': 0.5785123966942148, 'f1': 0.21538461538461537, 'pred': [[0, 0, 0, 1, 0, 0, 0, 1, 1, 0], [0, 0, 0, 1, 1, 1, 0, 0, 0, 0], [0, 1, 0, 1, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 1, 0, 0, 0, 1], [0, 0, 0, 0, 0, 0, 1, 0, 0, 0], [1, 0, 0, 0, 0, 1, 0, 1, 0, 1], [0, 0, 1, 0, 0, 0, 0, 0, 0, 0], [1, 1, 0, 0, 1, 0, 1, 1, 0, 0], [0, 0, 1, 1, 0, 0, 0, 1, 0, 0], [1, 0, 0, 0, 0, 1, 1, 1, 0, 1], [0, 0, 0, 0, 1, 0, 1, 0, 0, 0], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0], [0], [], [], [], [], [], [], []]}





# 거리로 분석

In [156]:
path1 = 'word2vec_model_dim=384/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'surprise ending'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1

    ans = torch.zeros(1,1,512)
    for i in range(scene_num):
        if i ==0:
            continue
        #ans[0,0,i] += util.cos_sim(embs[0][i],embs[0][i-1])[0][0]
        ans[0,0,i] += torch.cdist(embs[0][i].unsqueeze(0),embs[0][i-1].unsqueeze(0))[0][0]
        
    embs = ans
    
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [157]:
bert2 = BertModel(d_model=512).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=20)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.24it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 980.24it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5272873194221509  acc:  0.4700854700854701 f1:  0.3404255319148936
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.76it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 986.09it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5112359550561797  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.22it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.49357945425361155  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 124.12it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.98it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4903691813804173  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.37it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 961.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4875601926163724  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 987.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4759229534510433  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 991.71it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4751203852327447  acc:  0.47863247863247865 f1:  0.3146067415730337
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 953.18it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4695024077046549  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.18it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 960.79it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47351524879614765  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.41it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.61it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4715088282504013  acc:  0.4700854700854701 f1:  0.3111111111111111
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.94it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.471107544141252  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.74it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 924.25it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47110754414125194  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.17it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 964.84it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46709470304975925  acc:  0.4700854700854701 f1:  0.29545454545454547
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 122.37it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 947.42it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46629213483146065  acc:  0.452991452991453 f1:  0.30434782608695654
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 967.50it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4634831460674157  acc:  0.452991452991453 f1:  0.27272727272727276
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 981.79it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4610754414125201  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.53it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 979.93it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45947030497592295  acc:  0.4444444444444444 f1:  0.2696629213483146
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.62it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 974.33it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4550561797752809  acc:  0.46153846153846156 f1:  0.2758620689655173
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.12it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.75it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45626003210272875  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.28it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 989.84it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4562600321027287  acc:  0.47863247863247865 f1:  0.2823529411764706


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.66it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
BEST MODEL
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
{'auc_micro': 0.5497592295345104, 'acc': 0.41025641025641024, 'f1': 0.3551401869158879, 'pred': [[1, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 1, 0, 1, 1, 0, 0, 0, 1, 1], [0, 1, 1, 0, 1, 1, 1, 0, 1, 0], [1, 1, 1, 1, 1, 1, 0, 0, 1, 0], [0, 1, 0, 1, 1, 1, 1, 1, 1, 1], [1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [1, 1, 1, 0, 1, 1, 0, 0, 1, 1], [0, 1, 1, 1, 1, 1, 0, 1, 1, 0], [1, 0, 1, 0, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 1, 0, 0, 0, 0, 1], [1, 1, 1, 1, 0, 0, 1, 1, 0, 1], [1, 0, 1, 0, 1, 1, 0], [], [], [], [], [], [], []]}



