In [1]:
import torch
import os
import pickle
import numpy as np
import pandas as pd
from tqdm import tqdm
from MelodyLSTMEmbV2 import MelodyLSTMEmb

# Getting data

In [2]:
class ChordMelodyDataset(torch.utils.data.Dataset):
    def __init__(self, track_count, compass_count_path, X_path, y_path, window_size=10):
        self.window_size = window_size
        
        print('Loading compass count')
        self.compass_count = pd.read_csv(compass_count_path, names=['tid', 'compass_count'], nrows=track_count)
        self.cc = self.compass_count['compass_count'].to_numpy()
        self.cc_w = self.compass_count['compass_count'].to_numpy() - window_size
        self.cum_cc = np.cumsum(self.cc)
        self.cum_cc_w = np.cumsum(self.cc_w)
        
        self.cum_cc = np.append([0], self.cum_cc)
        self.cum_cc_w = np.append([0], self.cum_cc_w)

        
        print('Loading X')
        self.X = pd.read_csv(X_path, names=['n'+str(i) for i in range(36)] + ['chord', 'prev'], nrows=self.cum_cc[-1])
        
        print('Loading y')
        self.y = pd.read_csv(y_path, names=['n'+str(i) for i in range(36)], nrows=self.cum_cc[-1])
        
    def __len__(self):
        return self.cum_cc_w[-1]
    
    def __getitem__(self, idx):
        bucket = np.searchsorted(self.cum_cc_w, idx, side='right')
        # print(bucket)
        delta = idx - self.cum_cc_w[bucket - 1]
        # print(delta)
        idx_start = self.cum_cc[bucket - 1]
        # print(idx_start)
        idx = idx_start + delta
        
        # print(idx)
        x_data = torch.tensor(self.X.iloc[idx : idx + self.window_size].to_numpy(dtype=float))
        y_data = torch.tensor(self.y.iloc[idx : idx + self.window_size].to_numpy(dtype=float))

        return x_data.float(), y_data.float()

# Training

In [3]:
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print("Device", device)

Device cuda


In [4]:
dataset = ChordMelodyDataset(100, '../data/compass_count2.csv', '../data/X2.csv', '../data/y2.csv', window_size=20)

Loading compass count
Loading X
Loading y


In [5]:
len(dataset)

77280

In [13]:
dataset[20]

(tensor([[0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
          0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 0.],
         [0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
          0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 0.],
         [1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
          0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 0.],
         [1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 1., 0., 0., 0., 1., 0.,
          0., 1., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
          0., 2.],
         [1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 1., 0., 0., 0., 1., 0.,
   

In [14]:
data_loader = torch.utils.data.DataLoader(dataset, batch_size=256)

In [15]:
num_epochs = 100
learning_rate = 1e-6

input_size = 56 #number of features
hidden_size = 512 #number of features in hidden state
num_layers = 1 #number of stacked lstm layers

output_size = 36 #number of output classes 

In [16]:
mlstm = MelodyLSTMEmb(input_size, hidden_size, output_size, 
                   num_layers, device, threshold=0.6)
mlstm = mlstm.to(device)

In [17]:
criterion = torch.nn.BCELoss()
optimizer = torch.optim.AdamW(mlstm.parameters(), lr=learning_rate) 

In [18]:
for epoch in range(num_epochs):
    for X, y in tqdm(data_loader):
        X = X.cuda()
        y = y.cuda()
        outputs = mlstm.forward(X) #forward pass
        optimizer.zero_grad() #calculate the gradient, manually setting to 0
        
        # obtain the loss function
        # print(outputs.shape, y[:,-1,:].shape)
        loss = criterion(outputs, y[:,-1,:])

        loss.backward() #calculates the loss of the loss function

        optimizer.step() #improve from loss, i.e backprop
        
    torch.save(mlstm.state_dict(), f'../models/muse2_t10000_bce_w20/checkpoint-{epoch:02}.pth')    
    print("Epoch: %d, loss: %1.8f" % (epoch, loss.item())) 

100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [28:46<00:00, 17.53it/s]


Epoch: 0, loss: 0.30035716


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [28:03<00:00, 17.98it/s]


Epoch: 1, loss: 0.29951110


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [27:09<00:00, 18.58it/s]


Epoch: 2, loss: 0.30019751


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [27:51<00:00, 18.11it/s]


Epoch: 3, loss: 0.29845989


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:26<00:00, 19.07it/s]


Epoch: 4, loss: 0.29688281


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:47<00:00, 18.83it/s]


Epoch: 5, loss: 0.29366133


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:40<00:00, 18.90it/s]


Epoch: 6, loss: 0.28096527


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:47<00:00, 18.82it/s]


Epoch: 7, loss: 0.26285785


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:41<00:00, 18.89it/s]


Epoch: 8, loss: 0.25153467


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:40<00:00, 18.91it/s]


Epoch: 9, loss: 0.24256660


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:46<00:00, 18.84it/s]


Epoch: 10, loss: 0.23363750


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:07<00:00, 19.30it/s]


Epoch: 11, loss: 0.22529981


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [27:01<00:00, 18.66it/s]


Epoch: 12, loss: 0.21821454


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:15<00:00, 19.21it/s]


Epoch: 13, loss: 0.21220200


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:46<00:00, 18.84it/s]


Epoch: 14, loss: 0.20692818


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:15<00:00, 19.21it/s]


Epoch: 15, loss: 0.20213598


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:45<00:00, 18.85it/s]


Epoch: 16, loss: 0.19769830


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:36<00:00, 18.96it/s]


Epoch: 17, loss: 0.19366595


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:20<00:00, 19.15it/s]


Epoch: 18, loss: 0.19003710


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:28<00:00, 19.05it/s]


Epoch: 19, loss: 0.18674183


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:50<00:00, 18.79it/s]


Epoch: 20, loss: 0.18376575


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:40<00:00, 18.91it/s]


Epoch: 21, loss: 0.18114826


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:14<00:00, 19.22it/s]


Epoch: 22, loss: 0.17886408


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:00<00:00, 19.39it/s]


Epoch: 23, loss: 0.17685512


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:16<00:00, 19.20it/s]


Epoch: 24, loss: 0.17507909


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:08<00:00, 19.29it/s]


Epoch: 25, loss: 0.17345332


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:02<00:00, 19.37it/s]


Epoch: 26, loss: 0.17191142


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:13<00:00, 19.23it/s]


Epoch: 27, loss: 0.17040190


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:08<00:00, 19.29it/s]


Epoch: 28, loss: 0.16888936


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:14<00:00, 19.22it/s]


Epoch: 29, loss: 0.16739331


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [25:49<00:00, 19.54it/s]


Epoch: 30, loss: 0.16596456


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [25:54<00:00, 19.47it/s]


Epoch: 31, loss: 0.16462967


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:25<00:00, 19.09it/s]


Epoch: 32, loss: 0.16337845


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:20<00:00, 19.15it/s]


Epoch: 33, loss: 0.16219373


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [25:54<00:00, 19.47it/s]


Epoch: 34, loss: 0.16104364


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:20<00:00, 19.15it/s]


Epoch: 35, loss: 0.15990652


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:32<00:00, 19.00it/s]


Epoch: 36, loss: 0.15879732


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:35<00:00, 18.97it/s]


Epoch: 37, loss: 0.15771997


100%|████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:20<00:00, 19.15it/s]


Epoch: 38, loss: 0.15666218


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:07<00:00, 19.30it/s]


Epoch: 39, loss: 0.15562770


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:09<00:00, 19.28it/s]


Epoch: 40, loss: 0.15460213


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:19<00:00, 19.16it/s]


Epoch: 41, loss: 0.15360001


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [25:46<00:00, 19.57it/s]


Epoch: 42, loss: 0.15261969


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:24<00:00, 19.09it/s]


Epoch: 43, loss: 0.15167892


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:29<00:00, 19.04it/s]


Epoch: 44, loss: 0.15077394


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:36<00:00, 18.96it/s]


Epoch: 45, loss: 0.14991808


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:27<00:00, 19.06it/s]


Epoch: 46, loss: 0.14907737


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:09<00:00, 19.28it/s]


Epoch: 47, loss: 0.14824456


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:37<00:00, 18.95it/s]


Epoch: 48, loss: 0.14742579


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:35<00:00, 18.97it/s]


Epoch: 49, loss: 0.14661624


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:27<00:00, 19.06it/s]


Epoch: 50, loss: 0.14579926


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:29<00:00, 19.04it/s]


Epoch: 51, loss: 0.14499709


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:09<00:00, 19.28it/s]


Epoch: 52, loss: 0.14418077


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:32<00:00, 19.00it/s]


Epoch: 53, loss: 0.14336464


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:26<00:00, 19.07it/s]


Epoch: 54, loss: 0.14255439


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:38<00:00, 18.93it/s]


Epoch: 55, loss: 0.14174138


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:30<00:00, 19.03it/s]


Epoch: 56, loss: 0.14094643


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:36<00:00, 18.95it/s]


Epoch: 57, loss: 0.14014472


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:37<00:00, 18.94it/s]


Epoch: 58, loss: 0.13934590


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:30<00:00, 19.02it/s]


Epoch: 59, loss: 0.13856821


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:18<00:00, 19.17it/s]


Epoch: 60, loss: 0.13781621


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:39<00:00, 18.92it/s]


Epoch: 61, loss: 0.13706981


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:31<00:00, 19.02it/s]


Epoch: 62, loss: 0.13635588


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:35<00:00, 18.97it/s]


Epoch: 63, loss: 0.13565961


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 30262/30262 [26:10<00:00, 19.27it/s]


Epoch: 64, loss: 0.13497289


 37%|██████████████████████████████████████████████████████▍                                                                                              | 11046/30262 [09:34<16:38, 19.24it/s]


KeyboardInterrupt: 

In [None]:
torch.save(mlstm.state_dict(), '../models/muse2_t2000_v1.pth')

In [None]:
mlstm.embedding(torch.tensor([1]).cuda())

In [None]:
with open('../data/chords/CHORD_DICT.pickle', 'rb') as f: 
    CHORD_DICT = pickle.load(f)

In [None]:
with open('../data/chords_reduced/CHORD_TO_EMB.pickle', 'rb') as f:
    CHORD_TO_EMB = pickle.load(f)

In [None]:
CHORD_TO_EMB

In [None]:
embeddings = mlstm.embedding.weight.data.cpu().numpy()

In [None]:
embeddings[51]