In [12]:
!pip install gensim==4.2.0

Collecting gensim==4.2.0
  Using cached gensim-4.2.0-cp38-cp38-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (24.1 MB)
Installing collected packages: gensim
  Attempting uninstall: gensim
    Found existing installation: gensim 3.4.0
    Uninstalling gensim-3.4.0:
      Successfully uninstalled gensim-3.4.0
Successfully installed gensim-4.2.0


In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import os
from tqdm import tqdm
import torch.nn.functional as F
from gensim.models import Word2Vec
from sklearn import metrics
from sklearn.metrics import classification_report
import itertools
import random



In [2]:
import torch
import torch.nn as nn

In [3]:
device = 'cuda'

# 313 881


In [4]:
pos_weight = 881/313

In [5]:
class BertModel(nn.Module):
    def __init__(self, voc_size:int=30000, seq_len: int=512, d_model: int=384, d_ff:int=3072, pad_idx: int=1,
                num_encoder: int=12, num_heads: int=12, n_layers=6, dropout: float=0.1):
        super(BertModel, self).__init__()
        self.pad_idx = pad_idx
        self.layers = nn.ModuleList([nn.TransformerEncoderLayer(d_model=d_model, nhead=8, batch_first=True) for _ in range(n_layers)])
        self.fc = nn.Linear(d_model, d_model)
        self.activ1 = nn.Tanh()
        self.classifier = nn.Linear(d_model, 1)
        
    def forward(self, input: torch.Tensor) -> torch.Tensor:
        output = input
        for layer in self.layers:
            output = layer(output)
        #output = output.mean(dim=1, keepdim=True)
        output = output[:,-1]
        h_pooled = self.activ1(self.fc(output)) # [batch_size, d_model]
        logits_clsf = self.classifier(h_pooled) # [batch_size, 2]
        return logits_clsf # [B, S, D_model]

In [6]:
def log_metrics(preds, labels):
    preds = torch.stack(preds)
    preds = preds.cpu().detach().numpy()
    labels = torch.stack(labels)
    labels = labels.cpu().detach().numpy()
    
    
    ## Method 2 using ravel()
    fpr_micro, tpr_micro, _ = metrics.roc_curve(labels.ravel(), preds.ravel())
    auc_micro = metrics.auc(fpr_micro, tpr_micro)
    n=10
    preds = [round(i) for i in preds.ravel()]
    acc = metrics.accuracy_score(labels.ravel(), preds)
    f1 = metrics.f1_score(labels.ravel(), preds)
    preds = [preds[i*n:(i+1)*n] for i in range(len(preds)//6)]
    #target_names = list(genre_list.keys())
    #print(classification_report(labels,preds, target_names=target_names))
    return {"auc_micro": auc_micro, "acc" : acc, "f1" : f1, 'pred' : preds}

In [7]:
def train_one_epoch(dataloader, model, optimizer, device, loss_fn):
    model.train()
    tk0 = tqdm(dataloader, total=len(dataloader))
    total_loss = 0.0
    
    for source_tensor, label in tk0:
        optimizer.zero_grad()
        output = model(source_tensor.to(device))
        loss = loss_fn(output.view(-1, output.size(-1)), torch.FloatTensor([label]).to(device))
        
        total_loss += loss
        loss.backward()
        optimizer.step()
        
    avg_train_loss = total_loss / len(dataloader) 
    print(" Average training loss: {0:.2f}".format(avg_train_loss))  

def test_one_epoch(testset, model, loss_fn):
    model.eval()
    tk0 = tqdm(testset, total=len(testset))
    targets = []
    outputs = []
    total_loss = 0.0
    with torch.no_grad():
        for source_tensor, label in tk0:
            label = torch.FloatTensor([label])
            output = model(source_tensor.to(device))
            loss = loss_fn(output.view(-1, output.size(-1)), label.to(device))
            total_loss += loss
            targets.extend(label)
            outputs.extend(torch.sigmoid(output[0]).to('cpu'))
    avg_valid_loss = total_loss / len(testset) 
    score = log_metrics(outputs, targets)
    print(" Average valid loss: {0:.2f}".format(avg_valid_loss))  
    print('AUC_SCORE: ', score["auc_micro"], " acc: ", score["acc"], "f1: ", score["f1"])
    return score, avg_valid_loss
    
def fit(model, train_dataloader, valid_dataloader=None,test_dataloader=None, EPOCHS=3, lr=0.0000005):
    loss_fn = nn.BCEWithLogitsLoss(pos_weight=torch.tensor(pos_weight)) #ignore padding
    optimizer = torch.optim.AdamW(model.parameters(),lr=lr)
    for i in range(EPOCHS):
        print(f"EPOCHS:{i+1}")
        print('TRAIN')
        train_one_epoch(train_dataloader, model, optimizer, device, loss_fn)
        auc, loss = test_one_epoch(valid_dataloader,model, loss_fn)
        if i == 0:
            torch.save(model,'rnn_best.model')
            best_f1 = auc['f1']
        if  best_f1<auc['f1']:
            best_f1 = auc['f1']
            print(i,' EPOCH BEST MODEL!')
            torch.save(model,'rnn_best.model')
        print('Test')
        auc, loss = test_one_epoch(test_dataloader,model, loss_fn)
    best_model = torch.load('rnn_best.model')
    auc, loss  = test_one_epoch(test_dataloader,best_model, loss_fn)
    print('BEST MODEL')
    print('AUC_SCORE: ', auc["auc_micro"], " acc: ", auc["acc"], "f1: ", auc["f1"])
    return auc

            best_f1 = auc['f1']
        if  auc['f1']>best_f1:
            best_f1 = auc['f1']

In [8]:
import pickle
with open('movie_split_cult.pickle','rb') as fw:
    movie_split = pickle.load(fw)

In [9]:
path1 = 'word2vec_model_edge/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,400)
for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
                    
                    
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])

  emb = torch.from_numpy(emb)


In [10]:
bert = BertModel(d_model=400).to('cuda')
score = fit(bert, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:09<00:00, 104.58it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 728.11it/s]

 Average valid loss: 1.09
AUC_SCORE:  0.5535659154059895  acc:  0.3416666666666667 f1:  0.5093167701863354





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.23it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5454268292682927  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.50it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.48it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5832046928064217  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 832.34it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6457317073170732  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.85it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 827.74it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6091386230318  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.43it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.7067073170731707  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.48it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6245754862611916  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.53it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7310975609756099  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.08it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.48it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6304414942883605  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 796.93it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7435975609756098  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.41it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.78it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6338376041988267  acc:  0.36666666666666664 f1:  0.5189873417721518
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.39it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.748780487804878  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.61it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.97it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6412472985489348  acc:  0.38333333333333336 f1:  0.5194805194805194
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 816.49it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7475609756097561  acc:  0.3305785123966942 f1:  0.49689440993788825
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.46it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.70it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6480395183698673  acc:  0.4 f1:  0.5263157894736842
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7496951219512196  acc:  0.35537190082644626 f1:  0.5063291139240506
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.59it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.01it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6526705773386847  acc:  0.43333333333333335 f1:  0.5405405405405405
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 807.95it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.751829268292683  acc:  0.38016528925619836 f1:  0.5161290322580645
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.34it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.04it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6557579499845632  acc:  0.43333333333333335 f1:  0.5342465753424658
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.63it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7527439024390244  acc:  0.39669421487603307 f1:  0.5228758169934641
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.06it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.74it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6576103735720903  acc:  0.475 f1:  0.553191489361702
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.73it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7582317073170731  acc:  0.4297520661157025 f1:  0.5369127516778524
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.02it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.07it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6591540598950293  acc:  0.475 f1:  0.553191489361702
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.31it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7548780487804878  acc:  0.4380165289256198 f1:  0.5342465753424658
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.81it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.83it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6622414325409077  acc:  0.475 f1:  0.553191489361702
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.81it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7551829268292682  acc:  0.4380165289256198 f1:  0.5342465753424658
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.52it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.64it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6653288051867859  acc:  0.475 f1:  0.553191489361702
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 844.59it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7573170731707317  acc:  0.4462809917355372 f1:  0.524822695035461
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.34it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.12it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6705773386847793  acc:  0.48333333333333334 f1:  0.557142857142857
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.03it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7579268292682927  acc:  0.45454545454545453 f1:  0.5285714285714286
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.80it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6733559740660697  acc:  0.49166666666666664 f1:  0.5611510791366906
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 810.29it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7573170731707317  acc:  0.47107438016528924 f1:  0.536231884057971
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.82it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.57it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6764433467119482  acc:  0.48333333333333334 f1:  0.5441176470588235
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.13it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7591463414634145  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.49it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6826180920037048  acc:  0.48333333333333334 f1:  0.5441176470588235
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.22it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7588414634146341  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.64it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.54it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6850879901204076  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.11it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7582317073170732  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.21it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.29it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6891015745600493  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.08it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7554878048780488  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.60it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.08it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6940413707934547  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.83it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7564024390243902  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.42it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.97it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6989811670268602  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 846.07it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7518292682926829  acc:  0.48760330578512395 f1:  0.5441176470588235
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.03it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.81it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7005248533497993  acc:  0.5 f1:  0.5522388059701492
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.91it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7509146341463415  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.89it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.30it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7020685396727385  acc:  0.5083333333333333 f1:  0.556390977443609
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.90it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7493902439024391  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.49it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.95it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.707008335906144  acc:  0.5166666666666667 f1:  0.5606060606060607
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.42it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7478658536585366  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.28it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.16it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7134918184624883  acc:  0.5166666666666667 f1:  0.5606060606060607
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.99it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7463414634146341  acc:  0.5041322314049587 f1:  0.5522388059701492
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.92it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.53it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7144180302562518  acc:  0.5166666666666667 f1:  0.5606060606060607
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 850.71it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7426829268292683  acc:  0.512396694214876 f1:  0.556390977443609
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 115.72it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 820.66it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.7147267675208397  acc:  0.525 f1:  0.5648854961832062
27  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 803.86it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7411585365853659  acc:  0.512396694214876 f1:  0.549618320610687
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.41it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 804.69it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.7175054029021302  acc:  0.5333333333333333 f1:  0.5692307692307692
28  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 834.84it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7417682926829268  acc:  0.5289256198347108 f1:  0.558139534883721
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.20it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.75it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7202840382834209  acc:  0.5333333333333333 f1:  0.5692307692307692
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.85it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7396341463414635  acc:  0.5371900826446281 f1:  0.5625
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.40it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 833.76it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7230626736647113  acc:  0.5416666666666666 f1:  0.5736434108527132
30  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.37it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.739939024390244  acc:  0.5371900826446281 f1:  0.5625
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.73it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 788.62it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7233714109292991  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 794.30it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7371951219512196  acc:  0.5537190082644629 f1:  0.5714285714285715
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 114.29it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.61it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7267675208397654  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7338414634146342  acc:  0.5371900826446281 f1:  0.5625
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.89it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.04it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7292374189564681  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.23it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7335365853658535  acc:  0.5537190082644629 f1:  0.5714285714285715
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.74it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.76it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7304723680148194  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.01it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7304878048780488  acc:  0.5454545454545454 f1:  0.5669291338582677
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.28it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 802.60it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7289286816918802  acc:  0.55 f1:  0.578125
35  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 802.75it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7304878048780488  acc:  0.5867768595041323 f1:  0.5901639344262294
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.51it/s]


 Average training loss: 0.89


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.60it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7307811052794073  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7283536585365854  acc:  0.5867768595041323 f1:  0.5901639344262294
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.60it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.37it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7320160543377586  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7259146341463415  acc:  0.5867768595041323 f1:  0.5901639344262294
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.89it/s]


 Average training loss: 0.88


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.75it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7332510033961099  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.43it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.723780487804878  acc:  0.5867768595041323 f1:  0.5901639344262294
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.33it/s]


 Average training loss: 0.87


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.73it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7378820623649275  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.48it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7240853658536586  acc:  0.5867768595041323 f1:  0.5901639344262294


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.66it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.7304878048780488  acc:  0.5867768595041323 f1:  0.5901639344262294
BEST MODEL
AUC_SCORE:  0.7304878048780488  acc:  0.5867768595041323 f1:  0.5901639344262294
{'auc_micro': 0.7304878048780488, 'acc': 0.5867768595041323, 'f1': 0.5901639344262294, 'pred': [[1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [0, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1, 0, 0, 1, 1, 1, 0], [1, 0, 0, 0, 1, 1, 0, 0, 1, 1], [1, 1, 1, 0, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 0, 1, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 0, 1, 1, 1], [1, 0, 1, 1, 1, 0, 0, 1, 0, 1], [0, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 0, 1, 0], [0, 1, 0, 1, 1, 1, 1, 1, 1, 0], [1, 1, 1, 0, 0, 1, 0, 1, 0, 0], [1], [], [], [], [], [], [], []]}





In [97]:
random.randint(0,100)

44

In [11]:
import random

# SUM

In [12]:
import pickle
with open('emb_sum.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [13]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
    if movie_name not in movie_emb.keys():
        continue
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [14]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

953
120
119


In [15]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.16it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.78it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6137696820006174  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 872.79it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.50093808630394  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.46it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.36it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6789132448286508  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 874.93it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6013133208255159  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.95it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.15it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.7017598024081507  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 877.50it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6635397123202001  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.84it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.08it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.7002161160852115  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 873.90it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.684490306441526  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.19it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.34it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6977462179685089  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 881.35it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.7001250781738586  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.46it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.53it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6958937943809818  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 873.03it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7088805503439649  acc:  0.3445378151260504 f1:  0.5125
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.44it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.30it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.6983636924976845  acc:  0.35833333333333334 f1:  0.5157232704402516
6  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 737.38it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.723264540337711  acc:  0.35294117647058826 f1:  0.5157232704402516
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 115.56it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.41it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.697437480703921  acc:  0.35833333333333334 f1:  0.5095541401273885
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 841.24it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7304565353345841  acc:  0.35294117647058826 f1:  0.5157232704402516
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.14it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.20it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.695276319851806  acc:  0.35833333333333334 f1:  0.5095541401273885
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 847.88it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.733270794246404  acc:  0.36134453781512604 f1:  0.5189873417721518
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.73it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.73it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.695893794380982  acc:  0.35833333333333334 f1:  0.503225806451613
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 851.97it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7376485303314572  acc:  0.37815126050420167 f1:  0.5256410256410257
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.59it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.14it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6924976844705156  acc:  0.36666666666666664 f1:  0.5064935064935066
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 818.20it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7420262664165103  acc:  0.3949579831932773 f1:  0.5324675324675325
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.34it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.67it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6937326335288669  acc:  0.36666666666666664 f1:  0.5064935064935066
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 839.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7467166979362102  acc:  0.3949579831932773 f1:  0.5324675324675325
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.66it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.99it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6940413707934548  acc:  0.375 f1:  0.5098039215686275
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 855.77it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7514071294559099  acc:  0.4117647058823529 f1:  0.5394736842105263
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.84it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.76it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6937326335288669  acc:  0.38333333333333336 f1:  0.5066666666666667
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 843.93it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7560975609756098  acc:  0.42857142857142855 f1:  0.5466666666666667
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.85it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.46it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6928064217351034  acc:  0.4 f1:  0.5135135135135136
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 839.14it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7592245153220764  acc:  0.44537815126050423 f1:  0.5540540540540541
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.92it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.14it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6921889472059278  acc:  0.4083333333333333 f1:  0.5170068027210885
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 835.71it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.758599124452783  acc:  0.453781512605042 f1:  0.5517241379310346
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.26it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.44it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6912627354121642  acc:  0.4083333333333333 f1:  0.5170068027210885
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 834.79it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7604752970606629  acc:  0.453781512605042 f1:  0.5517241379310346
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.75it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.02it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6912627354121643  acc:  0.425 f1:  0.5241379310344828
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 832.83it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7617260787992496  acc:  0.46218487394957986 f1:  0.5555555555555556
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.40it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.54it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6869404137079346  acc:  0.44166666666666665 f1:  0.5314685314685316
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 812.24it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7620387742338962  acc:  0.4789915966386555 f1:  0.5633802816901409
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.84it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.72it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6857054646495832  acc:  0.4666666666666667 f1:  0.5428571428571428
19  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 851.34it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7645403377110694  acc:  0.4957983193277311 f1:  0.5652173913043479
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.95it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.71it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6844705155912318  acc:  0.4583333333333333 f1:  0.5390070921985816
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 840.88it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7664165103189493  acc:  0.48739495798319327 f1:  0.5611510791366906
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.17it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.24it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6838530410620562  acc:  0.4583333333333333 f1:  0.5390070921985816
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 842.62it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7679799874921827  acc:  0.4789915966386555 f1:  0.5507246376811594
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.42it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.36it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6829268292682927  acc:  0.44166666666666665 f1:  0.5314685314685316
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 853.75it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.764853033145716  acc:  0.4789915966386555 f1:  0.5507246376811594
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.93it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.59it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6820006174745292  acc:  0.4666666666666667 f1:  0.5428571428571428
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 851.75it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7632895559724827  acc:  0.5042016806722689 f1:  0.562962962962963
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.50it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.70it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6807656684161778  acc:  0.49166666666666664 f1:  0.5547445255474452
24  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 860.62it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7651657285803627  acc:  0.5210084033613446 f1:  0.5648854961832062
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.46it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 816.39it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6820006174745292  acc:  0.475 f1:  0.5467625899280575
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 813.88it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7645403377110693  acc:  0.5294117647058824 f1:  0.5757575757575758
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 117.20it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 819.29it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6832355665328805  acc:  0.4583333333333333 f1:  0.5390070921985816
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 827.56it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7617260787992495  acc:  0.5210084033613446 f1:  0.5714285714285715
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 119.51it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.48it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6826180920037048  acc:  0.49166666666666664 f1:  0.5547445255474452
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 847.73it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7620387742338962  acc:  0.5210084033613446 f1:  0.5648854961832062
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.32it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.15it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6838530410620562  acc:  0.5 f1:  0.5588235294117647
28  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 857.03it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7582864290181364  acc:  0.5294117647058824 f1:  0.5692307692307692
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 122.84it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.54it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6838530410620562  acc:  0.5166666666666667 f1:  0.5606060606060607
29  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 849.21it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7579737335834896  acc:  0.5210084033613446 f1:  0.558139534883721
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.31it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.14it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.68045693115159  acc:  0.5166666666666667 f1:  0.5606060606060607
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 841.69it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7579737335834897  acc:  0.5210084033613446 f1:  0.558139534883721
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.13it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.27it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6798394566224144  acc:  0.5333333333333333 f1:  0.5692307692307692
31  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 848.51it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7573483427141964  acc:  0.5294117647058824 f1:  0.5625
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.90it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.48it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6798394566224144  acc:  0.5083333333333333 f1:  0.556390977443609
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 847.87it/s]


 Average valid loss: 0.95
AUC_SCORE:  0.7554721701063165  acc:  0.5294117647058824 f1:  0.5625
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 121.45it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.72it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6795307193578265  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 851.32it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7523452157598499  acc:  0.5210084033613446 f1:  0.5648854961832062
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.78it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.42it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6801481938870022  acc:  0.525 f1:  0.5648854961832062
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 845.90it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7498436522826767  acc:  0.5378151260504201 f1:  0.5669291338582677
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.51it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.60it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6776782957702995  acc:  0.5 f1:  0.5522388059701492
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 837.14it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7464040025015634  acc:  0.5210084033613446 f1:  0.558139534883721
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.93it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.74it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6792219820932387  acc:  0.5333333333333333 f1:  0.5692307692307692
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 857.43it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7445278298936835  acc:  0.5630252100840336 f1:  0.5806451612903226
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 953/953 [00:08<00:00, 118.89it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.18it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6816918802099413  acc:  0.5333333333333333 f1:  0.5692307692307692
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 831.79it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7429643527204502  acc:  0.5630252100840336 f1:  0.5806451612903226
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.11it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.74it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.68045693115159  acc:  0.55 f1:  0.578125
38  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 856.66it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7407754846779238  acc:  0.5714285714285714 f1:  0.5853658536585366
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 953/953 [00:07<00:00, 120.75it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.94it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6810744056807656  acc:  0.5666666666666667 f1:  0.5737704918032787
Test


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 850.96it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7392120075046904  acc:  0.5882352941176471 f1:  0.5882352941176471


100%|████████████████████████████████████████| 119/119 [00:00<00:00, 853.91it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7407754846779238  acc:  0.5714285714285714 f1:  0.5853658536585366
BEST MODEL
AUC_SCORE:  0.7407754846779238  acc:  0.5714285714285714 f1:  0.5853658536585366
{'auc_micro': 0.7407754846779238, 'acc': 0.5714285714285714, 'f1': 0.5853658536585366, 'pred': [[1, 1, 0, 1, 1, 1, 1, 1, 0, 1], [0, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1, 0, 0, 0, 1, 1, 0], [1, 0, 0, 1, 1, 1, 1, 0, 1, 1], [1, 0, 1, 1, 1, 1, 1, 1, 0, 0], [0, 1, 1, 1, 0, 1, 0, 1, 1, 1], [1, 1, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 1, 1, 1, 0, 1, 0, 0, 0], [1, 1, 0, 1, 1, 1, 1, 1, 1, 1], [0, 0, 1, 1, 0, 1, 1, 1, 1, 0], [0, 0, 0, 1, 1, 0, 1, 1, 0, 1], [1, 0, 1, 1, 0, 1, 0, 1, 1], [], [], [], [], [], [], []]}


# Doc2vec

In [16]:
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

In [17]:
path1 = 'doc2vec/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Doc2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.dv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.dv.index_to_key:
            emb = w2v.dv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [18]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.77it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 939.51it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.610991046619327  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 912.19it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5618902439024389  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.19it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 922.86it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5964803951836987  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 927.35it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.561280487804878  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.78it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 935.98it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5804260574251312  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 932.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5533536585365855  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.58it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 926.44it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.565606668724915  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 914.94it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5564024390243902  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.40it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 926.53it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5476999073788207  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 928.51it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5573170731707318  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.18it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 926.42it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5368941031182464  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 923.66it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5634146341463415  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.32it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 929.21it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.524235875270145  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 922.64it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5600609756097561  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.43it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 927.86it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5177523927138006  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 929.81it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.561280487804878  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.09it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 930.02it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5121951219512195  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 921.63it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5646341463414635  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.94it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 930.34it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5044766903365236  acc:  0.35 f1:  0.5125
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 909.15it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5661585365853659  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.57it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 923.85it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4967582587218277  acc:  0.35833333333333334 f1:  0.5157232704402516
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 920.22it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5689024390243902  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.96it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 931.45it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.48965730163630755  acc:  0.35833333333333334 f1:  0.5157232704402516
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 930.26it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5710365853658537  acc:  0.3305785123966942 f1:  0.49689440993788825
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.16it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 930.39it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.48965730163630755  acc:  0.35 f1:  0.5063291139240506
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 924.28it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5704268292682927  acc:  0.3305785123966942 f1:  0.49689440993788825
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.29it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 933.27it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4844087681383143  acc:  0.36666666666666664 f1:  0.5128205128205128
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 932.73it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5713414634146341  acc:  0.35537190082644626 f1:  0.5063291139240506
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.76it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 929.57it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4819388700216116  acc:  0.36666666666666664 f1:  0.5128205128205128
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 934.45it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5692073170731707  acc:  0.35537190082644626 f1:  0.5063291139240506
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.16it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 933.21it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4732942266131522  acc:  0.35833333333333334 f1:  0.503225806451613
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 931.65it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5673780487804878  acc:  0.371900826446281 f1:  0.5128205128205128
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.27it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 934.12it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4692806421735104  acc:  0.375 f1:  0.5098039215686275
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 933.15it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5673780487804878  acc:  0.38016528925619836 f1:  0.5161290322580645
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.27it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 929.06it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.46464958320469285  acc:  0.375 f1:  0.5098039215686275
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 929.67it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5652439024390243  acc:  0.371900826446281 f1:  0.5
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.33it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 928.77it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4618709478234023  acc:  0.38333333333333336 f1:  0.5131578947368421
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 923.36it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5643292682926829  acc:  0.38016528925619836 f1:  0.5033112582781456
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.99it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 931.80it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.45878357517752394  acc:  0.35833333333333334 f1:  0.4832214765100671
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 929.48it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.563719512195122  acc:  0.371900826446281 f1:  0.49333333333333335
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.03it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 893.75it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.4569311515899969  acc:  0.375 f1:  0.47552447552447547
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 906.63it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5646341463414635  acc:  0.371900826446281 f1:  0.49333333333333335
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.48it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 908.84it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.45631367706082127  acc:  0.375 f1:  0.47552447552447547
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 898.50it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5646341463414635  acc:  0.371900826446281 f1:  0.49333333333333335
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.48it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 935.14it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.4526088298857672  acc:  0.375 f1:  0.4680851063829787
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 921.24it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5658536585365854  acc:  0.39669421487603307 f1:  0.5034013605442177
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.86it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 920.18it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.4529175671503551  acc:  0.38333333333333336 f1:  0.4714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 917.54it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5652439024390243  acc:  0.4132231404958678 f1:  0.5103448275862069
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.78it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 920.98it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.45106514356282806  acc:  0.36666666666666664 f1:  0.4492753623188406
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 919.78it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.5634146341463415  acc:  0.4297520661157025 f1:  0.5174825174825175
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.10it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 935.27it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.45013893176906455  acc:  0.35833333333333334 f1:  0.437956204379562
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 913.49it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.5640243902439024  acc:  0.4380165289256198 f1:  0.5211267605633803
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.23it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 918.46it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.4482865081815375  acc:  0.36666666666666664 f1:  0.4492753623188406
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 908.90it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.563109756097561  acc:  0.4297520661157025 f1:  0.5174825174825175
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.09it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 912.10it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.44612534732942266  acc:  0.35833333333333334 f1:  0.4296296296296296
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 915.34it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5597560975609757  acc:  0.4462809917355372 f1:  0.5179856115107914
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.74it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 916.28it/s]


 Average valid loss: 1.19
AUC_SCORE:  0.4433467119481322  acc:  0.35833333333333334 f1:  0.4296296296296296
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 908.01it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.5600609756097562  acc:  0.4462809917355372 f1:  0.5179856115107914
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.18it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 910.98it/s]


 Average valid loss: 1.19
AUC_SCORE:  0.4433467119481321  acc:  0.35 f1:  0.417910447761194
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 910.24it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.5600609756097562  acc:  0.4380165289256198 f1:  0.5072463768115942
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.85it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 912.89it/s]


 Average valid loss: 1.20
AUC_SCORE:  0.4445816610064835  acc:  0.3416666666666667 f1:  0.40601503759398494
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 915.20it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.5585365853658536  acc:  0.4380165289256198 f1:  0.4999999999999999
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.79it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 894.76it/s]


 Average valid loss: 1.21
AUC_SCORE:  0.4445816610064835  acc:  0.35833333333333334 f1:  0.4210526315789474
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 909.31it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.5597560975609757  acc:  0.4380165289256198 f1:  0.4999999999999999
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.55it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 912.49it/s]


 Average valid loss: 1.21
AUC_SCORE:  0.4448903982710713  acc:  0.35833333333333334 f1:  0.4122137404580153
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 902.42it/s]


 Average valid loss: 1.14
AUC_SCORE:  0.5606707317073171  acc:  0.4462809917355372 f1:  0.5037037037037037
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.65it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 908.91it/s]


 Average valid loss: 1.22
AUC_SCORE:  0.4414942883606051  acc:  0.36666666666666664 f1:  0.4153846153846154
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 911.91it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.561280487804878  acc:  0.45454545454545453 f1:  0.5074626865671642
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.66it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 901.42it/s]


 Average valid loss: 1.23
AUC_SCORE:  0.43964186477307815  acc:  0.36666666666666664 f1:  0.4153846153846154
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 903.92it/s]


 Average valid loss: 1.15
AUC_SCORE:  0.560670731707317  acc:  0.4462809917355372 f1:  0.5037037037037037
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.06it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 910.24it/s]


 Average valid loss: 1.24
AUC_SCORE:  0.4384069157147268  acc:  0.36666666666666664 f1:  0.4153846153846154
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 910.73it/s]


 Average valid loss: 1.16
AUC_SCORE:  0.5564024390243903  acc:  0.4462809917355372 f1:  0.5037037037037037
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.94it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 915.00it/s]


 Average valid loss: 1.24
AUC_SCORE:  0.4350108058042606  acc:  0.35833333333333334 f1:  0.40310077519379844
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 905.79it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.554878048780488  acc:  0.4462809917355372 f1:  0.5037037037037037
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.35it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 908.92it/s]


 Average valid loss: 1.25
AUC_SCORE:  0.43562828033343626  acc:  0.38333333333333336 f1:  0.41269841269841273
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 913.94it/s]


 Average valid loss: 1.17
AUC_SCORE:  0.5533536585365854  acc:  0.47107438016528924 f1:  0.5076923076923078
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.06it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 916.01it/s]


 Average valid loss: 1.26
AUC_SCORE:  0.4353195430688484  acc:  0.38333333333333336 f1:  0.41269841269841273
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 907.82it/s]


 Average valid loss: 1.18
AUC_SCORE:  0.5536585365853659  acc:  0.4628099173553719 f1:  0.496124031007752
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.23it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 911.29it/s]


 Average valid loss: 1.27
AUC_SCORE:  0.43501080580426055  acc:  0.4 f1:  0.4098360655737705
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 910.51it/s]


 Average valid loss: 1.19
AUC_SCORE:  0.5530487804878049  acc:  0.4793388429752066 f1:  0.5039370078740157


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 904.98it/s]

 Average valid loss: 1.08
AUC_SCORE:  0.5689024390243902  acc:  0.33884297520661155 f1:  0.5061728395061729
BEST MODEL
AUC_SCORE:  0.5689024390243902  acc:  0.33884297520661155 f1:  0.5061728395061729
{'auc_micro': 0.5689024390243902, 'acc': 0.33884297520661155, 'f1': 0.5061728395061729, 'pred': [[1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1], [], [], [], [], [], [], []]}





# 평균 임베딩

In [19]:
import pickle
with open('emb_avg2.pickle','rb') as fw:
    movie_emb = pickle.load(fw)

In [20]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
end = torch.ones(1,1,384)

for filename in filenames:
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    embs = torch.zeros(1,len(movie_emb[movie_name])+1,384)
    for i,emb in enumerate(movie_emb[movie_name]):
        emb = torch.from_numpy(np.nan_to_num(emb))
        embs[0][i] = emb
        
    embs[0][-1] = end
        
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
        #valid_data.append([embs, [cult]])

In [21]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [22]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.77it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.80it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.44334671194813213  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 811.27it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.49054878048780487  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.78it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.70it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.505711639394875  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.25it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5862804878048781  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.13it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.05it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5325717814140167  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.85it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6384146341463415  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.67it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.92it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5523309663476381  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 817.86it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6679878048780489  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.82it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 834.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5674590923124421  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.53it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6792682926829268  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.20it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.24it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5736338376041988  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.10it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6835365853658536  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.40it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.75it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5761037357209016  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 815.51it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.686280487804878  acc:  0.34710743801652894 f1:  0.5093167701863354
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.58it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.09it/s]

 Average valid loss: 1.08
AUC_SCORE:  0.5813522692188948  acc:  0.375 f1:  0.5222929936305732
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.27it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6899390243902439  acc:  0.371900826446281 f1:  0.5189873417721518
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.45it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.36it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5896881753627663  acc:  0.4 f1:  0.5324675324675325
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.19it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6917682926829268  acc:  0.371900826446281 f1:  0.5128205128205128
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.03it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.76it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5952454461253474  acc:  0.4 f1:  0.52
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.86it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6914634146341463  acc:  0.3884297520661157 f1:  0.5131578947368421
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.48it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.41it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.599567767829577  acc:  0.38333333333333336 f1:  0.5
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.29it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6914634146341463  acc:  0.3884297520661157 f1:  0.5131578947368421
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.90it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.40it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.603272615004631  acc:  0.4083333333333333 f1:  0.5103448275862069
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 815.80it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6929878048780488  acc:  0.3884297520661157 f1:  0.5066666666666667
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.83it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.45it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6060512503859216  acc:  0.4166666666666667 f1:  0.513888888888889
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6926829268292684  acc:  0.3884297520661157 f1:  0.5066666666666667
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.67it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.18it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6112997838839147  acc:  0.4583333333333333 f1:  0.5323741007194245
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.94it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6914634146341464  acc:  0.4132231404958678 f1:  0.5170068027210885
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.59it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.33it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6146958937943809  acc:  0.4583333333333333 f1:  0.5323741007194245
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.85it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6917682926829268  acc:  0.4132231404958678 f1:  0.5170068027210885
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.71it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.19it/s]

 Average valid loss: 1.07
AUC_SCORE:  0.6193269527631985  acc:  0.475 f1:  0.5401459854014599
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 800.35it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6926829268292682  acc:  0.4214876033057851 f1:  0.5205479452054795
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.45it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.43it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6239580117320161  acc:  0.48333333333333334 f1:  0.5441176470588235
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.80it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6945121951219512  acc:  0.4132231404958678 f1:  0.5103448275862069
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.23it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 813.41it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6304414942883607  acc:  0.48333333333333334 f1:  0.5441176470588235
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 814.46it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6923780487804878  acc:  0.4132231404958678 f1:  0.5103448275862069
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.46it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.79it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6338376041988267  acc:  0.48333333333333334 f1:  0.5373134328358209
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.92it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6908536585365854  acc:  0.4297520661157025 f1:  0.5174825174825175
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.91it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.77it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6378511886384687  acc:  0.475 f1:  0.5263157894736842
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.20it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6923780487804878  acc:  0.4462809917355372 f1:  0.524822695035461
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.13it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.37it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.644643408459401  acc:  0.475 f1:  0.5263157894736842
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.31it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6926829268292682  acc:  0.4297520661157025 f1:  0.5174825174825175
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.44it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.74it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6477307811052795  acc:  0.475 f1:  0.5263157894736842
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.09it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6926829268292682  acc:  0.4380165289256198 f1:  0.5211267605633803
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.87it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.92it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6514356282803335  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.65it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6929878048780487  acc:  0.4628099173553719 f1:  0.5323741007194245
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.49it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6569928990429145  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.60it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6899390243902439  acc:  0.4380165289256198 f1:  0.5211267605633803
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 838.01it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6600802716887929  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.31it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6911585365853659  acc:  0.4462809917355372 f1:  0.5179856115107914
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.22it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 760.89it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6647113306576105  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 770.80it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6893292682926829  acc:  0.45454545454545453 f1:  0.5217391304347827
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.92it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.88it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6659462797159618  acc:  0.49166666666666664 f1:  0.5343511450381678
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.76it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6875  acc:  0.45454545454545453 f1:  0.5217391304347827
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.68it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 821.19it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6681074405680766  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 808.68it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6847560975609757  acc:  0.4462809917355372 f1:  0.5179856115107914
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.04it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.82it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6708860759493671  acc:  0.48333333333333334 f1:  0.5303030303030303
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.65it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6850609756097561  acc:  0.4380165289256198 f1:  0.5211267605633803
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.69it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.95it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.673047236801482  acc:  0.49166666666666664 f1:  0.5343511450381678
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 824.08it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6823170731707316  acc:  0.4380165289256198 f1:  0.5142857142857142
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.11it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 842.45it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6745909231244211  acc:  0.5 f1:  0.5384615384615385
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.22it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6810975609756098  acc:  0.4380165289256198 f1:  0.5142857142857142
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.80it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.15it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6773695585057117  acc:  0.5 f1:  0.5384615384615385
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.88it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6807926829268293  acc:  0.4380165289256198 f1:  0.5142857142857142
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.49it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.96it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6795307193578265  acc:  0.5 f1:  0.5384615384615385
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.35it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6832317073170732  acc:  0.4462809917355372 f1:  0.5179856115107914
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.70it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 845.09it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6838530410620561  acc:  0.5 f1:  0.5384615384615385
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.25it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6798780487804877  acc:  0.45454545454545453 f1:  0.5285714285714286
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.99it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.34it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6857054646495833  acc:  0.49166666666666664 f1:  0.5343511450381678
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 828.21it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6795731707317072  acc:  0.45454545454545453 f1:  0.5285714285714286
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.98it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.78it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6881753627662859  acc:  0.49166666666666664 f1:  0.5343511450381678
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 819.33it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6807926829268293  acc:  0.45454545454545453 f1:  0.5285714285714286
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.09it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.14it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6909539981475764  acc:  0.5 f1:  0.5384615384615385
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.98it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6795731707317073  acc:  0.45454545454545453 f1:  0.5285714285714286
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.80it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.05it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6940413707934547  acc:  0.5333333333333333 f1:  0.5555555555555556
37  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 818.40it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6810975609756098  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.85it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.22it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6965112689101575  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6820121951219511  acc:  0.47107438016528924 f1:  0.536231884057971
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.35it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.10it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6971287434393331  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 825.05it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6820121951219512  acc:  0.47107438016528924 f1:  0.536231884057971


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 821.67it/s]

 Average valid loss: 1.08
AUC_SCORE:  0.6810975609756098  acc:  0.4793388429752066 f1:  0.5401459854014599
BEST MODEL
AUC_SCORE:  0.6810975609756098  acc:  0.4793388429752066 f1:  0.5401459854014599
{'auc_micro': 0.6810975609756098, 'acc': 0.4793388429752066, 'f1': 0.5401459854014599, 'pred': [[1, 1, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 1, 1, 1, 1, 0, 1, 1, 1], [1, 1, 1, 1, 0, 1, 1, 1, 1, 1], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 0, 1, 0, 1, 1, 1, 1, 0, 1], [1, 1, 1, 0, 0, 1, 1, 0, 0, 1], [1, 1, 0, 1, 1, 0, 1, 1, 1, 1], [1, 0, 1, 0, 1, 0, 1, 1, 1, 1], [0, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 1, 0, 1, 1, 1, 1, 1, 0], [1, 1, 1, 1, 1, 1, 1, 1, 1, 0], [1], [], [], [], [], [], [], []]}





# 그냥 metapath

In [23]:
path1 = 'word2vec_model_char/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [24]:
print(len(train_data))
print(len(valid_data))
print(len(test_data))

963
120
121


In [25]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.25it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.15it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5365853658536586  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.05it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6484756097560976  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.30it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.08it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5751775239271381  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.79it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6673780487804878  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.35it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.04it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6001852423587527  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.16it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6853658536585365  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.65it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.74it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6156221055881445  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.36it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6914634146341464  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.23it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.10it/s]

 Average valid loss: 1.07
AUC_SCORE:  0.6261191725841309  acc:  0.35 f1:  0.5125
4  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.81it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6978658536585367  acc:  0.35537190082644626 f1:  0.5125
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.15it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.74it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6344550787280024  acc:  0.375 f1:  0.5222929936305732
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.46it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7042682926829269  acc:  0.35537190082644626 f1:  0.5125
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.51it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.37it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.63908613769682  acc:  0.36666666666666664 f1:  0.5128205128205128
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 883.60it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7067073170731708  acc:  0.371900826446281 f1:  0.5128205128205128
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.64it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.81it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6412472985489348  acc:  0.39166666666666666 f1:  0.5228758169934641
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.37it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7073170731707318  acc:  0.371900826446281 f1:  0.5064935064935066
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.37it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.25it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.646804569311516  acc:  0.4 f1:  0.5263157894736842
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.52it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7082317073170732  acc:  0.371900826446281 f1:  0.5
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 123.42it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.28it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6495832046928065  acc:  0.425 f1:  0.5369127516778524
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.84it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7109756097560975  acc:  0.4049586776859504 f1:  0.5135135135135136
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.88it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 891.85it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6520531028095091  acc:  0.4583333333333333 f1:  0.5454545454545454
10  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.47it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7128048780487805  acc:  0.4132231404958678 f1:  0.5170068027210885
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.38it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.60it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.656066687249151  acc:  0.475 f1:  0.553191489361702
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.70it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7149390243902439  acc:  0.4132231404958678 f1:  0.5170068027210885
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.51it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.33it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6585365853658537  acc:  0.48333333333333334 f1:  0.557142857142857
12  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7170731707317073  acc:  0.4297520661157025 f1:  0.5241379310344828
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.31it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.16it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6637851188638468  acc:  0.48333333333333334 f1:  0.5507246376811594
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.80it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7182926829268292  acc:  0.4380165289256198 f1:  0.5277777777777779
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.35it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.30it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.665328805186786  acc:  0.48333333333333334 f1:  0.5507246376811594
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7201219512195123  acc:  0.4462809917355372 f1:  0.5314685314685316
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.74it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.14it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6724297622723062  acc:  0.49166666666666664 f1:  0.5547445255474452
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.29it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7192073170731708  acc:  0.47107438016528924 f1:  0.5428571428571428
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.55it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.80it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6733559740660698  acc:  0.5 f1:  0.5588235294117647
16  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.82it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7189024390243903  acc:  0.4793388429752066 f1:  0.5467625899280575
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.10it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.61it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.68045693115159  acc:  0.5166666666666667 f1:  0.5671641791044776
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.20it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7189024390243903  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.81it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.97it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6813831429453535  acc:  0.525 f1:  0.5714285714285715
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.23it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7179878048780488  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.44it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.684161778326644  acc:  0.5166666666666667 f1:  0.5671641791044776
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.90it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7179878048780488  acc:  0.49586776859504134 f1:  0.5547445255474452
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.97it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.79it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6872491509725224  acc:  0.5333333333333333 f1:  0.5692307692307692
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 844.54it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7173780487804878  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.47it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.25it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6891015745600494  acc:  0.5333333333333333 f1:  0.5757575757575758
21  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.68it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7179878048780488  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.58it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.24it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6900277863538129  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.78it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7173780487804878  acc:  0.5289256198347108 f1:  0.5714285714285715
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.83it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.16it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6921889472059278  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.79it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7161585365853659  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.63it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.22it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6986724297622723  acc:  0.5333333333333333 f1:  0.5757575757575758
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.39it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7173780487804878  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.16it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.88it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7002161160852115  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.09it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7167682926829267  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.57it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.91it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7045384377894411  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7155487804878049  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.37it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.37it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7063908613769682  acc:  0.5416666666666666 f1:  0.5669291338582677
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.44it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7179878048780488  acc:  0.5371900826446281 f1:  0.5757575757575758
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.61it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.58it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7107131830811979  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.89it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7161585365853659  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.59it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.76it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7134918184624885  acc:  0.5333333333333333 f1:  0.5625
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.713719512195122  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.37it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.67it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7153442420500155  acc:  0.55 f1:  0.5714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.713719512195122  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.66it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.37it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7175054029021302  acc:  0.55 f1:  0.5714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.70it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7134146341463414  acc:  0.5289256198347108 f1:  0.5714285714285715
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.10it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.61it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.719975301018833  acc:  0.55 f1:  0.5714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.00it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7149390243902439  acc:  0.5371900826446281 f1:  0.5757575757575758
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.40it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.19it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.7202840382834208  acc:  0.5583333333333333 f1:  0.576
33  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.30it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7179878048780488  acc:  0.5371900826446281 f1:  0.5757575757575758
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.99it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.29it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7202840382834208  acc:  0.575 f1:  0.578512396694215
34  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7155487804878049  acc:  0.5537190082644629 f1:  0.5846153846153846
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.80it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.49it/s]

 Average valid loss: 0.98
AUC_SCORE:  0.7230626736647113  acc:  0.5666666666666667 f1:  0.5806451612903226
35  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.98it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7146341463414634  acc:  0.5454545454545454 f1:  0.5801526717557252
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.59it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.84it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7221364618709479  acc:  0.5833333333333334 f1:  0.5901639344262294
36  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.11it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.714329268292683  acc:  0.5454545454545454 f1:  0.5801526717557252
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.55it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.36it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.725841309046002  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.17it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.713719512195122  acc:  0.5371900826446281 f1:  0.5757575757575758
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 122.40it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.33it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7258413090460019  acc:  0.5916666666666667 f1:  0.5950413223140496
38  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7140243902439024  acc:  0.5371900826446281 f1:  0.5757575757575758
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.09it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.44it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7249150972522383  acc:  0.5833333333333334 f1:  0.5833333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.82it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7134146341463415  acc:  0.5619834710743802 f1:  0.5891472868217055


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.88it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7140243902439024  acc:  0.5371900826446281 f1:  0.5757575757575758
BEST MODEL
AUC_SCORE:  0.7140243902439024  acc:  0.5371900826446281 f1:  0.5757575757575758
{'auc_micro': 0.7140243902439024, 'acc': 0.5371900826446281, 'f1': 0.5757575757575758, 'pred': [[1, 1, 0, 1, 0, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1, 0, 0, 1, 1, 1, 1], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 0, 1, 0, 1], [1, 0, 1, 0, 0, 1, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 0, 1, 1, 0, 1, 1, 1], [0, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 0, 1, 1, 1, 1, 1, 1, 0], [1, 1, 1, 1, 0, 1, 0, 1, 0, 0], [0], [], [], [], [], [], [], []]}


# Main_act

In [26]:
path1 = 'word2vec_model_extra+emb/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [27]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.98it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.16it/s]

 Average valid loss: 1.08
AUC_SCORE:  0.6545230009262119  acc:  0.3416666666666667 f1:  0.5093167701863354





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.20it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.7091463414634146  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.17it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.38it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6677987033034888  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.04it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.7411585365853658  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 120.13it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.06it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6662550169805496  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.20it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7445121951219512  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.55it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.06it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.665328805186786  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.88it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7451219512195121  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.90it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 840.44it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6696511268910158  acc:  0.35 f1:  0.5125
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 823.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7426829268292684  acc:  0.34710743801652894 f1:  0.5093167701863354
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.50it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.81it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6684161778326644  acc:  0.38333333333333336 f1:  0.5256410256410257
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.81it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7439024390243902  acc:  0.34710743801652894 f1:  0.5031446540880503
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.66it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.79it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6715035504785427  acc:  0.38333333333333336 f1:  0.5194805194805194
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.87it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7429878048780487  acc:  0.35537190082644626 f1:  0.4999999999999999
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.53it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 851.31it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6727384995368941  acc:  0.4083333333333333 f1:  0.523489932885906
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 836.09it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7442073170731708  acc:  0.3884297520661157 f1:  0.5131578947368421
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.68it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.62it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6711948132139549  acc:  0.425 f1:  0.5241379310344828
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.59it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7426829268292682  acc:  0.4132231404958678 f1:  0.523489932885906
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.50it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.52it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6702686014201914  acc:  0.44166666666666665 f1:  0.5314685314685316
9  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 849.86it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7411585365853659  acc:  0.4132231404958678 f1:  0.523489932885906
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.92it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 865.51it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.669342389626428  acc:  0.48333333333333334 f1:  0.5507246376811594
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 833.02it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7420731707317073  acc:  0.45454545454545453 f1:  0.5416666666666666
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.62it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.39it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6733559740660697  acc:  0.49166666666666664 f1:  0.5547445255474452
11  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.56it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7417682926829269  acc:  0.4462809917355372 f1:  0.5314685314685316
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.76it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.57it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6739734485952456  acc:  0.5083333333333333 f1:  0.562962962962963
12  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.96it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7426829268292683  acc:  0.4380165289256198 f1:  0.5211267605633803
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.30it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.45it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6739734485952456  acc:  0.525 f1:  0.5714285714285715
13  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 835.27it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7432926829268294  acc:  0.4628099173553719 f1:  0.5323741007194245
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.97it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.74it/s]

 Average valid loss: 1.02
AUC_SCORE:  0.6786045075640631  acc:  0.5333333333333333 f1:  0.5757575757575758
14  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.51it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7417682926829269  acc:  0.4628099173553719 f1:  0.5323741007194245
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.98it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.52it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6807656684161779  acc:  0.5583333333333333 f1:  0.5891472868217055
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.65it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.739939024390244  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.23it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.89it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6807656684161779  acc:  0.5583333333333333 f1:  0.5891472868217055
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.20it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7399390243902438  acc:  0.48760330578512395 f1:  0.5441176470588235
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.32it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.54it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6847792528558196  acc:  0.5666666666666667 f1:  0.59375
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.20it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7414634146341463  acc:  0.48760330578512395 f1:  0.5441176470588235
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.71it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.23it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6897190490892251  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.46it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7417682926829269  acc:  0.48760330578512395 f1:  0.5441176470588235
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.51it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.20it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6897190490892251  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.24it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7423780487804879  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.86it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.03it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6921889472059278  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.55it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7411585365853658  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.43it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 868.72it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6934238962642791  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 812.38it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7402439024390244  acc:  0.49586776859504134 f1:  0.5481481481481482
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.48it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.57it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.695585057116394  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.44it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7387195121951219  acc:  0.512396694214876 f1:  0.556390977443609
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.09it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.29it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.699289904291448  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.48it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7378048780487805  acc:  0.512396694214876 f1:  0.556390977443609
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.20it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.08it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.702994751466502  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.84it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7371951219512195  acc:  0.5206611570247934 f1:  0.5606060606060607
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.75it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.707008335906144  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.74it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7371951219512195  acc:  0.5371900826446281 f1:  0.5692307692307692
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.35it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.50it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7094782340228466  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.95it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7350609756097561  acc:  0.5206611570247934 f1:  0.5606060606060607
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.90it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.08it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7131830811979006  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.10it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7314024390243903  acc:  0.5289256198347108 f1:  0.5648854961832062
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 117.91it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.66it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7144180302562518  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.99it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7298780487804878  acc:  0.5454545454545454 f1:  0.5736434108527132
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.55it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.45it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7178141401667181  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.16it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7274390243902439  acc:  0.5454545454545454 f1:  0.5736434108527132
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.98it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.31it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7184316146958937  acc:  0.55 f1:  0.5714285714285715
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7240853658536586  acc:  0.5371900826446281 f1:  0.5692307692307692
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 118.42it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.95it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7190490892250694  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.22it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7234756097560976  acc:  0.5537190082644629 f1:  0.578125
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.26it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.68it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7212102500771843  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.53it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7216463414634147  acc:  0.5454545454545454 f1:  0.5736434108527132
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.41it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.10it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7233714109292991  acc:  0.5583333333333333 f1:  0.576
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.27it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7179878048780488  acc:  0.5371900826446281 f1:  0.5692307692307692
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 120.67it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.58it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7252238345168261  acc:  0.5416666666666666 f1:  0.5669291338582677
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.49it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7173780487804878  acc:  0.5371900826446281 f1:  0.5692307692307692
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.11it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.53it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7280024698981167  acc:  0.5583333333333333 f1:  0.576
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.01it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7170731707317073  acc:  0.5371900826446281 f1:  0.5692307692307692
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 963/963 [00:07<00:00, 121.13it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.40it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.729237418956468  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.25it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7140243902439024  acc:  0.5619834710743802 f1:  0.576
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.75it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.09it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7304723680148194  acc:  0.5583333333333333 f1:  0.576
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 843.12it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.711280487804878  acc:  0.5371900826446281 f1:  0.5625
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.02it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.50it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7326335288669342  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.63it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7106707317073171  acc:  0.5537190082644629 f1:  0.5714285714285715
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 963/963 [00:08<00:00, 119.94it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.18it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7332510033961099  acc:  0.5583333333333333 f1:  0.576
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.18it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7054878048780489  acc:  0.5206611570247934 f1:  0.5606060606060607


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.78it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7414634146341463  acc:  0.48760330578512395 f1:  0.5441176470588235
BEST MODEL
AUC_SCORE:  0.7414634146341463  acc:  0.48760330578512395 f1:  0.5441176470588235
{'auc_micro': 0.7414634146341463, 'acc': 0.48760330578512395, 'f1': 0.5441176470588235, 'pred': [[1, 1, 1, 1, 0, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 0, 1, 1, 1], [1, 1, 1, 1, 0, 1, 0, 1, 1, 1], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 0, 1, 0, 1, 1, 1, 1, 0, 1], [1, 0, 1, 0, 0, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 0, 1, 1, 1, 1], [1, 1, 1, 0, 1, 1, 0, 1, 0, 1], [0, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 0, 0, 1, 1, 1, 1, 1, 0], [1, 1, 1, 1, 1, 1, 0, 1, 0, 1], [1], [], [], [], [], [], [], []]}


# pos

In [28]:
path1 = 'word2vec_model_extra+pos/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,400)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,400)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [29]:
bert2 = BertModel(d_model=400).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=25)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.27it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.64it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6523618400740969  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.49it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6350725532571782  acc:  0.3416666666666667 f1:  0.5093167701863354
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 120.16it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.53it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6677987033034888  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 844.10it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.7122568694041371  acc:  0.3416666666666667 f1:  0.5093167701863354
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.88it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.41it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6687249150972523  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 849.38it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.7233714109292992  acc:  0.3416666666666667 f1:  0.5093167701863354
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.87it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 857.45it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6758258721827725  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.74it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7119481321395492  acc:  0.3416666666666667 f1:  0.5093167701863354
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.46it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 832.74it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6782957702994752  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.05it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7107131830811979  acc:  0.3416666666666667 f1:  0.5093167701863354
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.84it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.74it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6835443037974683  acc:  0.35833333333333334 f1:  0.5157232704402516
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 829.46it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7100957085520223  acc:  0.35 f1:  0.5125
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.13it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.01it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6810744056807656  acc:  0.4083333333333333 f1:  0.5359477124183006
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 847.67it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7113306576103736  acc:  0.375 f1:  0.5222929936305732
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.20it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.05it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.68045693115159  acc:  0.4166666666666667 f1:  0.5394736842105263
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 824.63it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.714109292991664  acc:  0.375 f1:  0.5222929936305732
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.08it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.04it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6838530410620561  acc:  0.43333333333333335 f1:  0.5405405405405405
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.56it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7138005557270762  acc:  0.36666666666666664 f1:  0.5064935064935066
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.12it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.09it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6866316764433467  acc:  0.45 f1:  0.5352112676056339
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.86it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.714418030256252  acc:  0.38333333333333336 f1:  0.5066666666666667
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.64it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.69it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6863229391787589  acc:  0.4666666666666667 f1:  0.5428571428571428
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 822.88it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7156529793146033  acc:  0.38333333333333336 f1:  0.5066666666666667
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 118.73it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.36it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6891015745600495  acc:  0.4583333333333333 f1:  0.5323741007194245
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 846.77it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7165791911083668  acc:  0.39166666666666666 f1:  0.5100671140939598
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.26it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.72it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.687866625501698  acc:  0.475 f1:  0.5401459854014599
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.75it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7165791911083668  acc:  0.43333333333333335 f1:  0.5277777777777779
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.92it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6887928372954616  acc:  0.475 f1:  0.5401459854014599
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.05it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7150355047854277  acc:  0.44166666666666665 f1:  0.5314685314685316
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.76it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.84it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6894103118246373  acc:  0.49166666666666664 f1:  0.5481481481481482
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 843.84it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7131830811979006  acc:  0.475 f1:  0.5467625899280575
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.58it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.68it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6884841000308737  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.13it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7138005557270763  acc:  0.5083333333333333 f1:  0.562962962962963
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.88it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 860.74it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6918802099413399  acc:  0.49166666666666664 f1:  0.5481481481481482
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 839.04it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7134918184624885  acc:  0.5 f1:  0.5588235294117647
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 120.21it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.07it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6931151589996913  acc:  0.5 f1:  0.5522388059701492
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 837.90it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7125656066687249  acc:  0.5083333333333333 f1:  0.562962962962963
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 119.84it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.32it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6952763198518062  acc:  0.5083333333333333 f1:  0.556390977443609
18  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 848.98it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7079345476999074  acc:  0.5166666666666667 f1:  0.5671641791044776
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 120.18it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.37it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.695585057116394  acc:  0.5083333333333333 f1:  0.556390977443609
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 859.99it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7082432849644953  acc:  0.5166666666666667 f1:  0.5671641791044776
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.44it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.07it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6931151589996913  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 852.65it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7063908613769683  acc:  0.5166666666666667 f1:  0.5671641791044776
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.47it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 864.48it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6949675825872184  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.76it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7042297005248535  acc:  0.5166666666666667 f1:  0.5671641791044776
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 120.43it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 858.89it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6962025316455697  acc:  0.5166666666666667 f1:  0.5538461538461539
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 850.17it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7039209632602655  acc:  0.525 f1:  0.5714285714285715
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 962/962 [00:08<00:00, 120.25it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.64it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.697437480703921  acc:  0.5333333333333333 f1:  0.5625
23  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 861.21it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.704847175054029  acc:  0.5416666666666666 f1:  0.5801526717557252
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 962/962 [00:07<00:00, 121.86it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.75it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6995986415560359  acc:  0.525 f1:  0.5365853658536585
Test


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 853.22it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.702994751466502  acc:  0.5583333333333333 f1:  0.5891472868217055


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 854.61it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.704847175054029  acc:  0.5416666666666666 f1:  0.5801526717557252
BEST MODEL
AUC_SCORE:  0.704847175054029  acc:  0.5416666666666666 f1:  0.5801526717557252
{'auc_micro': 0.704847175054029, 'acc': 0.5416666666666666, 'f1': 0.5801526717557252, 'pred': [[1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 0, 1, 1, 1, 1], [1, 1, 1, 0, 0, 1, 1, 1, 1, 1], [1, 0, 0, 1, 0, 0, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 1, 0, 1, 1], [0, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 0, 1, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 1, 0, 1, 0], [1, 1, 1, 1, 1, 1, 1, 0, 1, 1], [0, 0, 1, 1, 1, 1, 1, 1, 1, 0], [1, 0, 1, 1, 1, 1, 1, 1, 0, 1], [1, 1, 0, 0, 1, 1, 1, 0, 0, 1], [], [], [], [], [], [], [], []]}





# Text rank

In [30]:
path1 = 'word2vec_model_text/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [31]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.23it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.19it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5072553257178142  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 848.26it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.62it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.24it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5646804569311517  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.89it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6323170731707317  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.30it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.23it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.5992590305649892  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.27it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6692073170731707  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.78it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.81it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6227230626736647  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.37it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6899390243902439  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.28it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.67it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6366162395801173  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.60it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7091463414634146  acc:  0.34710743801652894 f1:  0.5093167701863354
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.73it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.31it/s]

 Average valid loss: 1.07
AUC_SCORE:  0.6452608829885768  acc:  0.35833333333333334 f1:  0.5157232704402516
5  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.05it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7161585365853658  acc:  0.34710743801652894 f1:  0.5093167701863354
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.72it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.95it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6452608829885768  acc:  0.35833333333333334 f1:  0.5157232704402516
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.61it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7222560975609756  acc:  0.36363636363636365 f1:  0.5095541401273885
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.62it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.41it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6498919419573943  acc:  0.39166666666666666 f1:  0.5290322580645161
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 822.22it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.726829268292683  acc:  0.371900826446281 f1:  0.5128205128205128
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.60it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.94it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6523618400740969  acc:  0.4083333333333333 f1:  0.5298013245033113
8  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.29it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7329268292682926  acc:  0.371900826446281 f1:  0.5128205128205128
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.70it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.96it/s]

 Average valid loss: 1.05
AUC_SCORE:  0.6554492127199754  acc:  0.43333333333333335 f1:  0.5405405405405405
9  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.83it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7341463414634146  acc:  0.4049586776859504 f1:  0.5263157894736842
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.40it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 862.09it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6591540598950294  acc:  0.43333333333333335 f1:  0.5342465753424658
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.17it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.735670731707317  acc:  0.4132231404958678 f1:  0.5298013245033113
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.54it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.67it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.661623958011732  acc:  0.43333333333333335 f1:  0.5342465753424658
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.28it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7368902439024391  acc:  0.4297520661157025 f1:  0.5369127516778524
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.05it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.96it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6644025933930225  acc:  0.425 f1:  0.5241379310344828
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.68it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7353658536585366  acc:  0.4214876033057851 f1:  0.5205479452054795
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.25it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.53it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6640938561284347  acc:  0.44166666666666665 f1:  0.5314685314685316
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.30it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.738109756097561  acc:  0.4214876033057851 f1:  0.5205479452054795
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.85it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.79it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6656375424513739  acc:  0.4666666666666667 f1:  0.5294117647058824
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.23it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.738719512195122  acc:  0.4462809917355372 f1:  0.5314685314685316
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.32it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.10it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.665328805186786  acc:  0.4583333333333333 f1:  0.5255474452554745
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.03it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7393292682926831  acc:  0.4462809917355372 f1:  0.5314685314685316
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.43it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.19it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6668724915097252  acc:  0.475 f1:  0.5333333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.77it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.738109756097561  acc:  0.4462809917355372 f1:  0.5314685314685316
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.29it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.76it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6702686014201914  acc:  0.48333333333333334 f1:  0.5373134328358209
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.14it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7362804878048781  acc:  0.45454545454545453 f1:  0.5352112676056339
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.76it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.87it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6730472368014819  acc:  0.49166666666666664 f1:  0.5413533834586466
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.80it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7365853658536585  acc:  0.4628099173553719 f1:  0.5390070921985816
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.95it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 882.10it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6736647113306575  acc:  0.5 f1:  0.5454545454545454
19  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.16it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7375  acc:  0.4793388429752066 f1:  0.5467625899280575
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.04it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.73it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6736647113306576  acc:  0.5 f1:  0.5454545454545454
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.49it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7341463414634146  acc:  0.47107438016528924 f1:  0.5428571428571428
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.69it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.69it/s]

 Average valid loss: 1.03
AUC_SCORE:  0.6764433467119483  acc:  0.5083333333333333 f1:  0.549618320610687
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.11it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7320121951219511  acc:  0.47107438016528924 f1:  0.5428571428571428
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.76it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.05it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6798394566224143  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.39it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7310975609756099  acc:  0.47107438016528924 f1:  0.5428571428571428
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.31it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.23it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6820006174745292  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.41it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7317073170731708  acc:  0.4793388429752066 f1:  0.5467625899280575
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.53it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.96it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6835443037974682  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.51it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7335365853658538  acc:  0.4628099173553719 f1:  0.5390070921985816
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.31it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.25it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6823093547391169  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.60it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7317073170731708  acc:  0.4628099173553719 f1:  0.5390070921985816
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.72it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.72it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6866316764433468  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.87it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7323170731707317  acc:  0.47107438016528924 f1:  0.5428571428571428
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.40it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.16it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6900277863538129  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 877.07it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7292682926829268  acc:  0.49586776859504134 f1:  0.5547445255474452
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.39it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.56it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6909539981475764  acc:  0.5166666666666667 f1:  0.5538461538461539
28  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.71it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7280487804878049  acc:  0.49586776859504134 f1:  0.5547445255474452
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.68it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.45it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6943501080580425  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.26it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7280487804878049  acc:  0.49586776859504134 f1:  0.5547445255474452
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.00it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.11it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6943501080580425  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.04it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.725609756097561  acc:  0.5041322314049587 f1:  0.5522388059701492
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.68it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 888.83it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6971287434393332  acc:  0.5083333333333333 f1:  0.549618320610687
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.16it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7240853658536586  acc:  0.49586776859504134 f1:  0.5547445255474452
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.48it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.28it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6983636924976845  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.00it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7219512195121952  acc:  0.5206611570247934 f1:  0.5606060606060607
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.76it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.21it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6995986415560358  acc:  0.49166666666666664 f1:  0.5343511450381678
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.46it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7195121951219513  acc:  0.5041322314049587 f1:  0.5588235294117647
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 122.75it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.94it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6992899042914479  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 879.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7176829268292682  acc:  0.5289256198347108 f1:  0.5714285714285715
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.39it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 856.72it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6986724297622723  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.88it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7173780487804879  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.21it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 863.38it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6986724297622723  acc:  0.5083333333333333 f1:  0.5426356589147285
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.06it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7152439024390245  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.47it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 855.01it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6999073788206236  acc:  0.5083333333333333 f1:  0.5426356589147285
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.95it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.711890243902439  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.60it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.69it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7008335906143872  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.75it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.710060975609756  acc:  0.5289256198347108 f1:  0.5714285714285715
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.56it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.62it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.702994751466502  acc:  0.5166666666666667 f1:  0.546875
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.17it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7085365853658536  acc:  0.5289256198347108 f1:  0.5714285714285715


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.37it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.7280487804878049  acc:  0.49586776859504134 f1:  0.5547445255474452
BEST MODEL
AUC_SCORE:  0.7280487804878049  acc:  0.49586776859504134 f1:  0.5547445255474452
{'auc_micro': 0.7280487804878049, 'acc': 0.49586776859504134, 'f1': 0.5547445255474452, 'pred': [[1, 1, 0, 1, 0, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 0, 1, 1, 1], [1, 1, 1, 1, 0, 1, 0, 1, 1, 1], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 0, 1, 0, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 0, 1, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 1, 1, 1, 1], [1, 1, 1, 0, 1, 1, 1, 1, 1, 1], [0, 1, 1, 1, 1, 1, 1, 1, 1, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 0, 0, 1, 1, 1, 1, 1, 0], [1, 0, 1, 1, 1, 1, 1, 1, 0, 1], [1], [], [], [], [], [], [], []]}





In [32]:
path1 = 'word2vec_model_text2/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [33]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.61it/s]


 Average training loss: 1.11


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.54it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6554492127199754  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 847.56it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.5018292682926829  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.15it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.90it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6977462179685088  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.47it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6341463414634145  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.64it/s]


 Average training loss: 1.09


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.80it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.7073170731707317  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.02it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6865853658536586  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.71it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.07it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6965112689101574  acc:  0.35 f1:  0.5125
3  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.39it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6987804878048781  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.11it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.11it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6924976844705156  acc:  0.36666666666666664 f1:  0.5189873417721518
4  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.25it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7015243902439025  acc:  0.34710743801652894 f1:  0.5093167701863354
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.90it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.65it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6884841000308738  acc:  0.36666666666666664 f1:  0.5189873417721518
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.00it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7039634146341465  acc:  0.33884297520661155 f1:  0.5
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.44it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.74it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6853967273849954  acc:  0.4 f1:  0.5324675324675325
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.18it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7057926829268293  acc:  0.36363636363636365 f1:  0.5095541401273885
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.97it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.42it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6838530410620562  acc:  0.4166666666666667 f1:  0.5394736842105263
7  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.75it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7070121951219512  acc:  0.371900826446281 f1:  0.5064935064935066
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.98it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.23it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6816918802099413  acc:  0.4166666666666667 f1:  0.5333333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.75it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7082317073170732  acc:  0.371900826446281 f1:  0.5064935064935066
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.71it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.18it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6829268292682926  acc:  0.4666666666666667 f1:  0.5555555555555556
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 834.07it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7103658536585367  acc:  0.38016528925619836 f1:  0.5098039215686275
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.86it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 881.02it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6838530410620562  acc:  0.4666666666666667 f1:  0.5492957746478874
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.38it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7079268292682928  acc:  0.4132231404958678 f1:  0.523489932885906
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.23it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.65it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6857054646495833  acc:  0.4666666666666667 f1:  0.5492957746478874
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.34it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.708841463414634  acc:  0.4132231404958678 f1:  0.523489932885906
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.91it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 889.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6869404137079346  acc:  0.48333333333333334 f1:  0.5507246376811594
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.27it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7137195121951221  acc:  0.4132231404958678 f1:  0.523489932885906
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.35it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.54it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6891015745600495  acc:  0.5083333333333333 f1:  0.562962962962963
13  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 878.81it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7140243902439024  acc:  0.4297520661157025 f1:  0.5306122448979591
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.81it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.37it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6931151589996913  acc:  0.5083333333333333 f1:  0.556390977443609
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.46it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7146341463414634  acc:  0.4462809917355372 f1:  0.5379310344827586
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.66it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 790.87it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.6962025316455697  acc:  0.5416666666666666 f1:  0.5736434108527132
15  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 829.46it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7140243902439025  acc:  0.47107438016528924 f1:  0.5492957746478874
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.01it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.92it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.699289904291448  acc:  0.5333333333333333 f1:  0.5692307692307692
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7152439024390244  acc:  0.4628099173553719 f1:  0.5454545454545454
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.27it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.95it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7014510651435628  acc:  0.55 f1:  0.578125
17  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 868.53it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7161585365853659  acc:  0.47107438016528924 f1:  0.5492957746478874
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.42it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.43it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.7023772769373263  acc:  0.5583333333333333 f1:  0.5826771653543307
18  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 837.83it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7161585365853659  acc:  0.4793388429752066 f1:  0.553191489361702
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.27it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 879.17it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7039209632602654  acc:  0.5416666666666666 f1:  0.5669291338582677
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.05it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7167682926829269  acc:  0.4793388429752066 f1:  0.553191489361702
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.70it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.51it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7057733868477924  acc:  0.5583333333333333 f1:  0.576
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.77it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.714329268292683  acc:  0.48760330578512395 f1:  0.557142857142857
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.14it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.36it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7097869712874344  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 873.65it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7106707317073171  acc:  0.48760330578512395 f1:  0.557142857142857
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 123.18it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 886.29it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7122568694041371  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 872.38it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7103658536585366  acc:  0.48760330578512395 f1:  0.557142857142857
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.37it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.04it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.716270453843779  acc:  0.575 f1:  0.5853658536585366
23  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.75it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7094512195121951  acc:  0.48760330578512395 f1:  0.5507246376811594
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.30it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.36it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7175054029021303  acc:  0.5666666666666667 f1:  0.5737704918032787
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.60it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7085365853658536  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.68it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.83it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7196665637542451  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.02it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7039634146341462  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.89it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.73it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7196665637542451  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 874.39it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7021341463414634  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.21it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 887.54it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7236801481938869  acc:  0.5666666666666667 f1:  0.5737704918032787
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 880.09it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.698780487804878  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.91it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.07it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7276937326335289  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.09it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.697560975609756  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.17it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 885.03it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7298548934856437  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 875.32it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6957317073170732  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.14it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.09it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7320160543377585  acc:  0.5833333333333334 f1:  0.5901639344262294
30  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 839.54it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6948170731707317  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.53it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.96it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7338684779252855  acc:  0.575 f1:  0.578512396694215
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.76it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6942073170731707  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.64it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.38it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7363383760419883  acc:  0.5833333333333334 f1:  0.5901639344262294
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.81it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6914634146341463  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.70it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 866.15it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7366471133065761  acc:  0.575 f1:  0.578512396694215
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 851.42it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6908536585365854  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.98it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.07it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7384995368941031  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.13it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.688109756097561  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.15it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.20it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7394257486878666  acc:  0.575 f1:  0.578512396694215
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.32it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.686890243902439  acc:  0.5206611570247934 f1:  0.5606060606060607
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.71it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.91it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.7415869095399814  acc:  0.575 f1:  0.5853658536585366
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.42it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6829268292682926  acc:  0.5206611570247934 f1:  0.5671641791044776
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.51it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.89it/s]


 Average valid loss: 0.97
AUC_SCORE:  0.744365544921272  acc:  0.5666666666666667 f1:  0.5806451612903226
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 852.68it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6823170731707318  acc:  0.512396694214876 f1:  0.562962962962963
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.45it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 884.97it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7437480703920963  acc:  0.575 f1:  0.578512396694215
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 876.30it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6823170731707316  acc:  0.5289256198347108 f1:  0.5648854961832062
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.68it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.06it/s]


 Average valid loss: 0.96
AUC_SCORE:  0.7452917567150354  acc:  0.5833333333333334 f1:  0.5833333333333333
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.53it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.6810975609756098  acc:  0.5289256198347108 f1:  0.5648854961832062


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.32it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6948170731707317  acc:  0.5206611570247934 f1:  0.5671641791044776
BEST MODEL
AUC_SCORE:  0.6948170731707317  acc:  0.5206611570247934 f1:  0.5671641791044776
{'auc_micro': 0.6948170731707317, 'acc': 0.5206611570247934, 'f1': 0.5671641791044776, 'pred': [[1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [1, 1, 1, 1, 1, 1, 0, 1, 1, 1], [1, 1, 1, 1, 0, 0, 0, 1, 1, 1], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 0, 1, 1, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 0, 1, 1, 1, 1, 1], [1, 1, 0, 1, 1, 0, 1, 1, 1, 1], [1, 1, 1, 0, 1, 1, 0, 1, 1, 1], [0, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 0, 1, 1, 1, 1, 1, 1, 0], [1, 1, 1, 1, 0, 1, 0, 1, 0, 1], [1], [], [], [], [], [], [], []]}


In [34]:
path1 = 'word2vec_model_text3/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num+1,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1
    embs[0][-1] = end
        
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [35]:
bert2 = BertModel().to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=40)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.36it/s]


 Average training loss: 1.10


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 707.33it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.693423896264279  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 834.47it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.5475609756097561  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.85it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.75it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.7023772769373263  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.67it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.6326219512195123  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.99it/s]


 Average training loss: 1.08


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.86it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6940413707934547  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.11it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.6780487804878049  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.21it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.02it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6853967273849954  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 870.76it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.7012195121951219  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.83it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.62it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.6829268292682926  acc:  0.3416666666666667 f1:  0.5093167701863354
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.82it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.7149390243902438  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.75it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.91it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6816918802099414  acc:  0.36666666666666664 f1:  0.5189873417721518
5  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.76it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7228658536585366  acc:  0.33884297520661155 f1:  0.5061728395061729
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.82it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.35it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.682309354739117  acc:  0.38333333333333336 f1:  0.5194805194805194
6  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 853.64it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7277439024390243  acc:  0.35537190082644626 f1:  0.5063291139240506
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.98it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.89it/s]

 Average valid loss: 1.04
AUC_SCORE:  0.6804569311515899  acc:  0.4 f1:  0.5263157894736842
7  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 820.03it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7314024390243903  acc:  0.38016528925619836 f1:  0.5161290322580645
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.88it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.75it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.6820006174745292  acc:  0.4083333333333333 f1:  0.5298013245033113
8  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 867.11it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7329268292682927  acc:  0.38016528925619836 f1:  0.5098039215686275
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.08it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.59it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6810744056807657  acc:  0.425 f1:  0.5306122448979591
9  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 826.67it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7338414634146342  acc:  0.3884297520661157 f1:  0.5066666666666667
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.39it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 878.56it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.6841617783266439  acc:  0.44166666666666665 f1:  0.5379310344827586
10  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.22it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7362804878048781  acc:  0.39669421487603307 f1:  0.5100671140939598
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.37it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 883.27it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6838530410620561  acc:  0.44166666666666665 f1:  0.5314685314685316
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 871.06it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7375  acc:  0.4049586776859504 f1:  0.5135135135135136
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.40it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 874.40it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.6853967273849954  acc:  0.4666666666666667 f1:  0.536231884057971
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.80it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7371951219512195  acc:  0.4297520661157025 f1:  0.5241379310344828
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.21it/s]


 Average training loss: 1.01


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.03it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6860142019141711  acc:  0.48333333333333334 f1:  0.5441176470588235
13  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 858.12it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7365853658536585  acc:  0.4380165289256198 f1:  0.5277777777777779
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.96it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.49it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6897190490892251  acc:  0.5083333333333333 f1:  0.556390977443609
14  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 865.52it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.738719512195122  acc:  0.47107438016528924 f1:  0.536231884057971
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.31it/s]


 Average training loss: 1.00


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 880.52it/s]

 Average valid loss: 1.01
AUC_SCORE:  0.6934238962642791  acc:  0.5166666666666667 f1:  0.5606060606060607
15  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 845.68it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7420731707317074  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.01it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.94it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.6962025316455697  acc:  0.525 f1:  0.5648854961832062
16  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 830.44it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.738719512195122  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.32it/s]


 Average training loss: 0.99


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 867.81it/s]

 Average valid loss: 1.00
AUC_SCORE:  0.6974374807039209  acc:  0.55 f1:  0.578125
17  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.81it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7353658536585366  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.40it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.87it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7017598024081506  acc:  0.525 f1:  0.5648854961832062
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 860.59it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7317073170731708  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.49it/s]


 Average training loss: 0.98


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.96it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7051559123186169  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.56it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7314024390243902  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:21
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.88it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.30it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7107131830811978  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 856.60it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7274390243902439  acc:  0.4793388429752066 f1:  0.5401459854014599
EPOCHS:22
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.20it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.51it/s]

 Average valid loss: 0.99
AUC_SCORE:  0.712256869404137  acc:  0.5583333333333333 f1:  0.5826771653543307
21  EPOCH BEST MODEL!





Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.73it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7277439024390243  acc:  0.48760330578512395 f1:  0.5373134328358209
EPOCHS:23
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.02it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.81it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7178141401667182  acc:  0.5416666666666666 f1:  0.5736434108527132
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.41it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.724390243902439  acc:  0.47107438016528924 f1:  0.5294117647058824
EPOCHS:24
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.11it/s]


 Average training loss: 0.97


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.03it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7205927755480087  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.63it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7240853658536586  acc:  0.48760330578512395 f1:  0.5373134328358209
EPOCHS:25
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.87it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.46it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.72182772460636  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.61it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7240853658536586  acc:  0.512396694214876 f1:  0.549618320610687
EPOCHS:26
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.42it/s]


 Average training loss: 0.96


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 870.37it/s]


 Average valid loss: 1.00
AUC_SCORE:  0.7252238345168263  acc:  0.55 f1:  0.578125
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.00it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7219512195121951  acc:  0.47107438016528924 f1:  0.5294117647058824
EPOCHS:27
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.28it/s]


 Average training loss: 0.95


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 841.76it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7283112071627045  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 840.86it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7216463414634146  acc:  0.5041322314049587 f1:  0.5454545454545454
EPOCHS:28
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.19it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.62it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7280024698981167  acc:  0.5583333333333333 f1:  0.5826771653543307
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 864.73it/s]


 Average valid loss: 1.02
AUC_SCORE:  0.7179878048780488  acc:  0.49586776859504134 f1:  0.5413533834586466
EPOCHS:29
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 118.80it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.62it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7301636307502315  acc:  0.5666666666666667 f1:  0.5873015873015872
28  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 854.36it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7176829268292684  acc:  0.512396694214876 f1:  0.549618320610687
EPOCHS:30
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.21it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.99it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7304723680148194  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.07it/s]


 Average valid loss: 1.01
AUC_SCORE:  0.7164634146341464  acc:  0.5206611570247934 f1:  0.5538461538461539
EPOCHS:31
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.03it/s]


 Average training loss: 0.93


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 877.19it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7298548934856438  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 862.82it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7121951219512195  acc:  0.5041322314049587 f1:  0.5454545454545454
EPOCHS:32
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.63it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 876.38it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7310898425439951  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 869.62it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7128048780487806  acc:  0.512396694214876 f1:  0.549618320610687
EPOCHS:33
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.47it/s]


 Average training loss: 0.94


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.46it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7320160543377586  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 859.58it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7115853658536585  acc:  0.5206611570247934 f1:  0.5538461538461539
EPOCHS:34
TRAIN


100%|████████████████████████████████████████| 960/960 [00:08<00:00, 119.98it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.46it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7332510033961099  acc:  0.5666666666666667 f1:  0.5873015873015872
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.53it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7097560975609756  acc:  0.5206611570247934 f1:  0.5538461538461539
EPOCHS:35
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 121.07it/s]


 Average training loss: 0.92


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.66it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7323247916023464  acc:  0.575 f1:  0.592
34  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.55it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7076219512195122  acc:  0.5289256198347108 f1:  0.558139534883721
EPOCHS:36
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.92it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 869.36it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7341772151898734  acc:  0.575 f1:  0.592
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 861.03it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7051829268292683  acc:  0.5289256198347108 f1:  0.558139534883721
EPOCHS:37
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.30it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 871.71it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.735103426983637  acc:  0.5833333333333334 f1:  0.596774193548387
36  EPOCH BEST MODEL!
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 857.56it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7048780487804879  acc:  0.5371900826446281 f1:  0.5625
EPOCHS:38
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.26it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 872.14it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.738808274158691  acc:  0.575 f1:  0.592
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.20it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7021341463414635  acc:  0.512396694214876 f1:  0.549618320610687
EPOCHS:39
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.90it/s]


 Average training loss: 0.90


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 875.72it/s]


 Average valid loss: 0.98
AUC_SCORE:  0.7403519604816301  acc:  0.5833333333333334 f1:  0.596774193548387
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.53it/s]


 Average valid loss: 1.04
AUC_SCORE:  0.7015243902439025  acc:  0.5289256198347108 f1:  0.558139534883721
EPOCHS:40
TRAIN


100%|████████████████████████████████████████| 960/960 [00:07<00:00, 120.58it/s]


 Average training loss: 0.91


100%|████████████████████████████████████████| 120/120 [00:00<00:00, 873.58it/s]


 Average valid loss: 0.99
AUC_SCORE:  0.7434393331275084  acc:  0.575 f1:  0.592
Test


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 863.95it/s]


 Average valid loss: 1.05
AUC_SCORE:  0.6969512195121951  acc:  0.512396694214876 f1:  0.549618320610687


100%|████████████████████████████████████████| 121/121 [00:00<00:00, 866.67it/s]


 Average valid loss: 1.03
AUC_SCORE:  0.7048780487804879  acc:  0.5371900826446281 f1:  0.5625
BEST MODEL
AUC_SCORE:  0.7048780487804879  acc:  0.5371900826446281 f1:  0.5625
{'auc_micro': 0.7048780487804879, 'acc': 0.5371900826446281, 'f1': 0.5625, 'pred': [[1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [1, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1, 0, 1, 1, 1, 1, 0], [1, 1, 0, 0, 1, 1, 1, 1, 1, 1], [1, 1, 1, 0, 0, 1, 0, 1, 0, 1], [1, 0, 1, 0, 0, 0, 1, 1, 1, 1], [1, 1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 0, 1, 0, 0, 1, 1, 1], [0, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 0, 1, 1, 1, 1, 1, 1, 0], [1, 1, 1, 0, 0, 1, 0, 1, 0, 0], [1], [], [], [], [], [], [], []]}


# 거리로 분석

In [156]:
path1 = 'word2vec_model_dim=384/'
path2 = 'data/scriptbase/'
filenames = os.listdir(path1)
train_data = []
valid_data = []
test_data = []
one = 0
zero = 0
end = torch.ones(1,1,384)

for filename in filenames:
    genres = []
    movie_name = filename[:-14]
    cult = 0
    with open(path2+movie_name+'/processed/imdb_meta.txt','r') as f:
        lines = f.readlines()
        for line in lines:
            if 'keyword' in line:
                try:
                    keyword  = line.strip().split('\t')[1]
                    keywords.append(keyword)
                except:
                    pass
                if 'cult film'==keyword:
                    cult = 1
        
    w2v=Word2Vec.load(path1 + filename)
    base = 'scene_'
    scene_num = 0
    max_scene = 0
    for node in w2v.wv.index_to_key:
        if base in node:
            scene_num += 1
            if int(node[6:])>max_scene:
                max_scene = int(node[6:])
    embs = torch.zeros(1,scene_num,384)
    k = 0
    for i in range(1,max_scene+1):
        emb_name = base + str(i)
        if emb_name in w2v.wv.index_to_key:
            emb = w2v.wv[emb_name]
            emb = torch.from_numpy(emb)
            embs[0][k] = emb
            k += 1

    ans = torch.zeros(1,1,512)
    for i in range(scene_num):
        if i ==0:
            continue
        #ans[0,0,i] += util.cos_sim(embs[0][i],embs[0][i-1])[0][0]
        ans[0,0,i] += torch.cdist(embs[0][i].unsqueeze(0),embs[0][i-1].unsqueeze(0))[0][0]
        
    embs = ans
    
        
    rand = random.randint(0,100)    
    if movie_name in movie_split['train']:
        train_data.append([embs, [cult]])
    elif movie_name in movie_split['valid']:
        valid_data.append([embs, [cult]])
    
    elif movie_name in movie_split['test']:
        test_data.append([embs, [cult]])
    
    if cult:
        one += 1
    else:
        zero += 1

In [157]:
bert2 = BertModel(d_model=512).to('cuda')
score = fit(bert2, train_data,valid_data,test_data,EPOCHS=20)
print(score)

EPOCHS:1
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.24it/s]


 Average training loss: 1.07


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 980.24it/s]


 Average valid loss: 1.06
AUC_SCORE:  0.5272873194221509  acc:  0.4700854700854701 f1:  0.3404255319148936
EPOCHS:2
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.76it/s]


 Average training loss: 1.06


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 986.09it/s]


 Average valid loss: 1.07
AUC_SCORE:  0.5112359550561797  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:3
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.22it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.49357945425361155  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:4
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 124.12it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.98it/s]


 Average valid loss: 1.08
AUC_SCORE:  0.4903691813804173  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:5
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.37it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 961.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4875601926163724  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:6
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 987.17it/s]


 Average valid loss: 1.09
AUC_SCORE:  0.4759229534510433  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:7
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 991.71it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4751203852327447  acc:  0.47863247863247865 f1:  0.3146067415730337
EPOCHS:8
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.48it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 953.18it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4695024077046549  acc:  0.48717948717948717 f1:  0.33333333333333337
EPOCHS:9
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.18it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 960.79it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47351524879614765  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:10
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.41it/s]


 Average training loss: 1.05


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 958.61it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.4715088282504013  acc:  0.4700854700854701 f1:  0.3111111111111111
EPOCHS:11
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 982.94it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.471107544141252  acc:  0.47863247863247865 f1:  0.3296703296703297
EPOCHS:12
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.74it/s]


 Average training loss: 1.04


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 924.25it/s]


 Average valid loss: 1.10
AUC_SCORE:  0.47110754414125194  acc:  0.46153846153846156 f1:  0.32258064516129037
EPOCHS:13
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 123.17it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 964.84it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46709470304975925  acc:  0.4700854700854701 f1:  0.29545454545454547
EPOCHS:14
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 122.37it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 947.42it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.46629213483146065  acc:  0.452991452991453 f1:  0.30434782608695654
EPOCHS:15
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 125.93it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 967.50it/s]


 Average valid loss: 1.11
AUC_SCORE:  0.4634831460674157  acc:  0.452991452991453 f1:  0.27272727272727276
EPOCHS:16
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.36it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 981.79it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4610754414125201  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:17
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.53it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 979.93it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45947030497592295  acc:  0.4444444444444444 f1:  0.2696629213483146
EPOCHS:18
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 126.62it/s]


 Average training loss: 1.03


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 974.33it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.4550561797752809  acc:  0.46153846153846156 f1:  0.2758620689655173
EPOCHS:19
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.12it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.75it/s]


 Average valid loss: 1.12
AUC_SCORE:  0.45626003210272875  acc:  0.4444444444444444 f1:  0.2857142857142857
EPOCHS:20
TRAIN


100%|████████████████████████████████████████| 929/929 [00:07<00:00, 127.28it/s]


 Average training loss: 1.02


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 989.84it/s]


 Average valid loss: 1.13
AUC_SCORE:  0.4562600321027287  acc:  0.47863247863247865 f1:  0.2823529411764706


100%|████████████████████████████████████████| 117/117 [00:00<00:00, 985.66it/s]

 Average valid loss: 1.06
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
BEST MODEL
AUC_SCORE:  0.5497592295345104  acc:  0.41025641025641024 f1:  0.3551401869158879
{'auc_micro': 0.5497592295345104, 'acc': 0.41025641025641024, 'f1': 0.3551401869158879, 'pred': [[1, 1, 1, 1, 1, 1, 1, 1, 0, 1], [1, 1, 0, 1, 1, 0, 0, 0, 1, 1], [0, 1, 1, 0, 1, 1, 1, 0, 1, 0], [1, 1, 1, 1, 1, 1, 0, 0, 1, 0], [0, 1, 0, 1, 1, 1, 1, 1, 1, 1], [1, 1, 0, 1, 0, 1, 1, 1, 0, 1], [1, 1, 1, 0, 1, 1, 0, 0, 1, 1], [0, 1, 1, 1, 1, 1, 0, 1, 1, 0], [1, 0, 1, 0, 1, 1, 0, 1, 0, 1], [1, 1, 1, 0, 1, 0, 0, 0, 0, 1], [1, 1, 1, 1, 0, 0, 1, 1, 0, 1], [1, 0, 1, 0, 1, 1, 0], [], [], [], [], [], [], []]}



