In [1]:
import torch
import os
import pickle
import numpy as np
import pandas as pd
from tqdm import tqdm

In [2]:
class MelodyLSTM(torch.nn.Module):
    def __init__(self, input_size, hidden_size, output_size, num_layers, device):
        super(MelodyLSTM, self).__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size
        self.num_layers = num_layers
        
        self.embedding = torch.nn.Embedding(num_embeddings=)
        
        self.lstm = torch.nn.LSTM(input_size=input_size, hidden_size=hidden_size, 
                                  num_layers=num_layers, batch_first=True)
        
        self.fc_1 = torch.nn.Linear(hidden_size, 256)
        self.fc = torch.nn.Linear(256, output_size)
        
        self.sigmoid = torch.nn.Sigmoid()
        self.threshold = torch.nn.Threshold()
        self.device = device
        
    def forward(self, x):
        x.to(self.device)
        h_0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size, requires_grad=True).to(self.device)
        c_0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size, requires_grad=True).to(self.device)
        
        # output, (hn, cn) = self.lstm(x, (h_0, c_0))
        hn, _ = self.lstm(x)
        
        #hn = hn.view(-1, self.hidden_size)
        hn = hn[:, -1, :]
        out = self.relu(hn)
        out = self.fc_1(out)
        out = self.relu(out)
        out = self.fc(out)
        
        return out

## Test Data

In [3]:
ub = 84
lb = 24

In [4]:
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print("Device", device)

Device cuda


In [5]:
class ChordMelodyDataset(torch.utils.data.Dataset):
    def __init__(self, size, X_path, y_path, window_size=10):
        self.size = size
        print('Loading features...')
        self.X = pd.read_csv(X_path, nrows=size)
        print('Loading labels...')
        self.y = pd.read_csv(y_path, nrows=size)
        self.window_size = window_size
        
    def __len__(self):
        return len(self.X.index) - self.window_size
    
    def __getitem__(self, idx):
        x_data = torch.tensor(self.X.iloc[idx : idx + self.window_size].to_numpy(dtype=float))
        y_data = torch.tensor(self.y.iloc[idx : idx + self.window_size].to_numpy(dtype=float))
        # x_data = torch.reshape(x_data, (x_data.shape[0], 1, x_data.shape[1]))
        return x_data.float(), y_data.float()
        

In [24]:
dataset = ChordMelodyDataset(300000, '../data/X.csv', '../data/y.csv')

Loading features...
Loading labels...


In [25]:
dataset[0][0].shape

torch.Size([10, 111])

In [26]:
data_loader = torch.utils.data.DataLoader(dataset, batch_size=64)

In [27]:
for X, y in data_loader:
    print(X.shape)
    print(y.shape)
    break

torch.Size([64, 10, 111])
torch.Size([64, 10, 60])


## Training

In [28]:
num_epochs = 100
learning_rate = 1e-6

input_size = 111 #number of features
hidden_size = 512 #number of features in hidden state
num_layers = 1 #number of stacked lstm layers

output_size = 60 #number of output classes 

In [29]:
mlstm = MelodyLSTM(input_size, hidden_size, output_size, num_layers, device)
mlstm = mlstm.to(device)

In [30]:
criterion = torch.nn.MSELoss()
optimizer = torch.optim.AdamW(mlstm.parameters(), lr=learning_rate) 

In [31]:
for epoch in range(num_epochs):
    for X, y in tqdm(data_loader):
        X = X.cuda()
        y = y.cuda()
        outputs = mlstm.forward(X[:,:-1,:]) #forward pass
        optimizer.zero_grad() #calculate the gradient, manually setting to 0
        
        # obtain the loss function
        # print(outputs.shape, y[:,-1,:].shape)
        loss = criterion(outputs, y[:,-1,:])

        loss.backward() #calculates the loss of the loss function

        optimizer.step() #improve from loss, i.e backprop
    if epoch % 1 == 0:
        print("Epoch: %d, loss: %1.5f" % (epoch, loss.item())) 

100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.89it/s]


Epoch: 0, loss: 0.04944


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.17it/s]


Epoch: 1, loss: 0.04503


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.56it/s]


Epoch: 2, loss: 0.03882


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.26it/s]


Epoch: 3, loss: 0.03652


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.42it/s]


Epoch: 4, loss: 0.03476


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 94.80it/s]


Epoch: 5, loss: 0.03259


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.60it/s]


Epoch: 6, loss: 0.03000


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.39it/s]


Epoch: 7, loss: 0.02719


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.36it/s]


Epoch: 8, loss: 0.02457


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.91it/s]


Epoch: 9, loss: 0.02221


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.68it/s]


Epoch: 10, loss: 0.02025


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.01it/s]


Epoch: 11, loss: 0.01859


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.90it/s]


Epoch: 12, loss: 0.01723


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.10it/s]


Epoch: 13, loss: 0.01601


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.02it/s]


Epoch: 14, loss: 0.01484


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.51it/s]


Epoch: 15, loss: 0.01371


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.27it/s]


Epoch: 16, loss: 0.01260


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.62it/s]


Epoch: 17, loss: 0.01152


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.53it/s]


Epoch: 18, loss: 0.01050


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.42it/s]


Epoch: 19, loss: 0.00954


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.08it/s]


Epoch: 20, loss: 0.00863


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.39it/s]


Epoch: 21, loss: 0.00778


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 99.31it/s]


Epoch: 22, loss: 0.00705


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.92it/s]


Epoch: 23, loss: 0.00640


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.77it/s]


Epoch: 24, loss: 0.00583


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 94.68it/s]


Epoch: 25, loss: 0.00531


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.44it/s]


Epoch: 26, loss: 0.00483


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 90.84it/s]


Epoch: 27, loss: 0.00439


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.44it/s]


Epoch: 28, loss: 0.00399


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.08it/s]


Epoch: 29, loss: 0.00363


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.37it/s]


Epoch: 30, loss: 0.00328


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.98it/s]


Epoch: 31, loss: 0.00297


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.96it/s]


Epoch: 32, loss: 0.00269


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.45it/s]


Epoch: 33, loss: 0.00242


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 99.30it/s]


Epoch: 34, loss: 0.00216


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.70it/s]


Epoch: 35, loss: 0.00193


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 99.35it/s]


Epoch: 36, loss: 0.00172


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 99.05it/s]


Epoch: 37, loss: 0.00153


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.41it/s]


Epoch: 38, loss: 0.00136


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.73it/s]


Epoch: 39, loss: 0.00121


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.68it/s]


Epoch: 40, loss: 0.00107


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.74it/s]


Epoch: 41, loss: 0.00094


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.42it/s]


Epoch: 42, loss: 0.00083


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.32it/s]


Epoch: 43, loss: 0.00073


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 94.92it/s]


Epoch: 44, loss: 0.00065


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.17it/s]


Epoch: 45, loss: 0.00057


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.72it/s]


Epoch: 46, loss: 0.00050


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.88it/s]


Epoch: 47, loss: 0.00044


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.11it/s]


Epoch: 48, loss: 0.00039


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.84it/s]


Epoch: 49, loss: 0.00034


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.36it/s]


Epoch: 50, loss: 0.00030


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.84it/s]


Epoch: 51, loss: 0.00027


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.46it/s]


Epoch: 52, loss: 0.00024


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.01it/s]


Epoch: 53, loss: 0.00021


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.84it/s]


Epoch: 54, loss: 0.00018


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 95.89it/s]


Epoch: 55, loss: 0.00016


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 95.61it/s]


Epoch: 56, loss: 0.00014


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.20it/s]


Epoch: 57, loss: 0.00013


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.02it/s]


Epoch: 58, loss: 0.00011


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 94.55it/s]


Epoch: 59, loss: 0.00010


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.28it/s]


Epoch: 60, loss: 0.00009


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.54it/s]


Epoch: 61, loss: 0.00008


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.24it/s]


Epoch: 62, loss: 0.00007


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.62it/s]


Epoch: 63, loss: 0.00007


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.91it/s]


Epoch: 64, loss: 0.00006


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.19it/s]


Epoch: 65, loss: 0.00006


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 95.41it/s]


Epoch: 66, loss: 0.00005


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 96.98it/s]


Epoch: 67, loss: 0.00005


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.07it/s]


Epoch: 68, loss: 0.00004


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.26it/s]


Epoch: 69, loss: 0.00004


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.16it/s]


Epoch: 70, loss: 0.00004


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.31it/s]


Epoch: 71, loss: 0.00003


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.97it/s]


Epoch: 72, loss: 0.00003


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.01it/s]


Epoch: 73, loss: 0.00003


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 91.98it/s]


Epoch: 74, loss: 0.00003


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.55it/s]


Epoch: 75, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:51<00:00, 91.48it/s]


Epoch: 76, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:49<00:00, 95.52it/s]


Epoch: 77, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.19it/s]


Epoch: 78, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 98.67it/s]


Epoch: 79, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.36it/s]


Epoch: 80, loss: 0.00002


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.31it/s]


Epoch: 81, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:58<00:00, 79.85it/s]


Epoch: 82, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:57<00:00, 81.35it/s]


Epoch: 83, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:59<00:00, 79.35it/s]


Epoch: 84, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:57<00:00, 81.65it/s]


Epoch: 85, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:53<00:00, 87.97it/s]


Epoch: 86, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:53<00:00, 87.34it/s]


Epoch: 87, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:53<00:00, 88.26it/s]


Epoch: 88, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:52<00:00, 89.83it/s]


Epoch: 89, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.60it/s]


Epoch: 90, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.13it/s]


Epoch: 91, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:47<00:00, 97.88it/s]


Epoch: 92, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.28it/s]


Epoch: 93, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:48<00:00, 97.44it/s]


Epoch: 94, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.82it/s]


Epoch: 95, loss: 0.00001


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 93.67it/s]


Epoch: 96, loss: 0.00000


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:50<00:00, 92.80it/s]


Epoch: 97, loss: 0.00000


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:53<00:00, 88.04it/s]


Epoch: 98, loss: 0.00000


100%|██████████████████████████████████████████████████████████████████████████████| 4688/4688 [00:52<00:00, 89.04it/s]


Epoch: 99, loss: 0.00000


In [32]:
torch.save(mlstm.state_dict(), '../models/muse_w10_v1.pth')

In [None]:
torch.__version__

In [None]:
seed = [0. for i in range(111)]

In [None]:
seed[60] = 1.

In [None]:
seed_t = torch.tensor(seed, requires_grad=True).float()

In [None]:
X_tensor_final.shape

In [None]:
seed_t = torch.reshape(seed_t, (1, 1, -1))

In [None]:
seed_t.shape

In [None]:
p = mlstm(seed_t)

In [None]:
p.shape

In [None]:
np.argmax(torch.nn.functional.softmax(p, dim=1).detach().numpy())

In [None]:
with open('../data/chords_reduced/CHORD_TO_EMB.pickle', 'rb') as f: 
    CHORD_TO_EMB = pickle.load(f)

In [None]:
CHORD_TO_EMB

In [None]:
with open('../data/chords/CHORD_DICT.pickle', 'rb') as f: 
    CHORD_DICT = pickle.load(f)

In [None]:
CHORD_DICT[2]

## Music generation

In [None]:
mlstm = MelodyLSTM(input_size, hidden_size, output_size, num_layers)
mlstm.load_state_dict(torch.load('../models/muse_v1_111ft.pth')) 
mlstm.eval()

In [None]:
with open('../data/chords/CHORD_DICT.pickle', 'rb') as f: 
    CHORD_DICT = pickle.load(f)

In [None]:
with open('../data/chords_reduced/CHORD_TO_EMB.pickle', 'rb') as f:
    CHORD_TO_EMB = pickle.load(f)

In [None]:
def get_chord_from_triad(t1, t2, t3):
    return t1 * 10000 + t2 * 100 + t3

In [None]:
def generate_melody_for_chord(chord, prev=None, ts=8):
    notes = []
    if prev == None:
        prev = torch.zeros(111)
        prev[(ub-lb) + chord] = 1.
        prev = torch.reshape(prev, (1, 1, -1))
    
    for _ in range(ts):
        p = mlstm(prev)
        # print(torch.nn.functional.softmax(p, dim=1).detach().numpy())
        notes.append(np.argmax(torch.nn.functional.softmax(p, dim=1).detach().numpy()))
        
        prev = torch.zeros(111)
        prev[(ub-lb) + chord] = 1.
        prev[notes[-1]] = 1.
        prev = torch.reshape(prev, (1, 1, -1))

    return notes, prev

In [None]:
def generate_melody_for_chords(chords):
    notes = []
    prev = None
    for chord in chords: 
        notes_i, prev = generate_melody_for_chord(chord, prev)
        print(len(notes_i))
        notes += notes_i
    return notes

In [None]:
notes = generate_melody_for_chords([0, 1, 2, 3])

In [None]:
piano_roll = np.zeros((128, 32))

In [None]:
for i, note in enumerate(notes):
    piano_roll[note + lb, i] = 100

In [None]:
np.count_nonzero(piano_roll)

In [None]:
notes

In [None]:
piano_roll[31+lb:37+lb]

In [None]:
piano_roll.T.shape

In [None]:
# create a PrettyMIDI object
midi = pretty_midi.PrettyMIDI()

# create an instrument object
instrument = pretty_midi.Instrument(program=0)

# add notes to the instrument object
for note_idx, time_slice in enumerate(piano_roll.T):
    note_numbers = np.nonzero(time_slice)[0]
    for note_number in note_numbers:
        note_start = note_idx / 4.0
        note_end = (note_idx + 1) / 4.0
        note_velocity = int(time_slice[note_number])
        note = pretty_midi.Note(
            velocity=note_velocity,
            pitch=note_number,
            start=note_start,
            end=note_end
        )
        instrument.notes.append(note)

# add the instrument object to the MIDI object
midi.instruments.append(instrument)

# write the MIDI object to a file
midi.write('output_test.mid')

In [None]:
generate_melody_for_chord(4)

In [None]:
CHORD_DICT[58]