In [1]:
import re
import os
import pandas as pd

regex = re.compile(r'\[.+\]\n', re.IGNORECASE)
file_paths, file_names, emotions, audios = [], [], [], []
emotion_map = {'anger': 'angry', 'happiness': 'happy', 'sadness': 'sad', 'fear': 'fear',
              'disgust': 'disgust'}

In [2]:
import torch
import torchaudio

print(torch.__version__)
print(torchaudio.__version__)

torch.random.manual_seed(0)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

print(device)

1.12.1+cu113
0.12.1+cu113
cuda


In [3]:
bundle = torchaudio.pipelines.WAV2VEC2_BASE
extractor = bundle.get_model()
print(extractor.__class__)
print(bundle.sample_rate)

<class 'torchaudio.models.wav2vec2.model.Wav2Vec2Model'>
16000


In [4]:
import os
os.listdir('../emotiondata/emotion_data')

['anger',
 'session_entries.csv',
 'fear',
 'Tools and Documentation',
 '.ipynb_checkpoints',
 'disgust',
 'sadness',
 'happiness']

In [5]:
folder_list = ['anger', 'disgust', 'fear', 'happiness', 'sadness']
entries = []
for folder in folder_list:
    cur_file_list = os.listdir(f'../emotiondata/emotion_data/{folder}')
    for i in cur_file_list:
        if i == 's05 (3).wav':
            print("found")
            continue
        entries.append(i)


found


In [6]:
len(entries)

604

# Assign Sessions (Once)

In [7]:
import random
random.shuffle(entries)
session = []
equal_parts = (len(entries)-1)//5 # for equally split the entries into 5 parts
count = 0
main_data_path = '../emotiondata/emotion_data'

In [8]:
#### Only Run once
from tqdm import tqdm 
folder_map = {'a':'anger', 'd':'disgust', 'f':'fear', 'h':'happiness', 's':'sadness'}

file_paths = []
file_names = []
emotions = []
# audios = []
# labels = []


for i in tqdm(range(len(entries))):
    entry = entries[i]
    if "wav" not in entry:
        continue
    folder = folder_map[entry[0]]
    file_path = f'../emotiondata/emotion_data/{folder}/{entry}'
    emotion = emotion_map[folder]
    file_paths.append(file_path)
    file_names.append(entry)
    emotions.append(emotion)

    # assign session to it
    part = (count//equal_parts)%6 + 1
    if part == 6:
        part = 5
    session.append(part)
    count += 1


file = pd.DataFrame({'path':file_paths, 'name': file_names, 'emotion': emotions, 'session': session})
dataframe_path = main_data_path + '/session_entries.csv'
file.to_csv(dataframe_path)


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 604/604 [00:00<00:00, 625057.89it/s]


In [9]:
os.listdir('../emotiondata/emotion_data')

['anger',
 'session_entries.csv',
 'fear',
 'Tools and Documentation',
 '.ipynb_checkpoints',
 'disgust',
 'sadness',
 'happiness']

# Extract Features using Models

In [10]:
dataframe_path = main_data_path + '/session_entries.csv'
file = pd.read_csv(dataframe_path)[['path', 'name', 'emotion', 'session']]
file.head()

Unnamed: 0,path,name,emotion,session
0,../emotiondata/emotion_data/happiness/h17 (5).wav,h17 (5).wav,happy,1
1,../emotiondata/emotion_data/happiness/h20 (2).wav,h20 (2).wav,happy,1
2,../emotiondata/emotion_data/disgust/d19 (4).wav,d19 (4).wav,disgust,1
3,../emotiondata/emotion_data/sadness/s12 (4).wav,s12 (4).wav,sad,1
4,../emotiondata/emotion_data/sadness/s01 (4).wav,s01 (4).wav,sad,1


In [11]:
from tqdm import tqdm
audios = []
to_be_discarded = []
discarded_name = []
for i in tqdm(range(len(file['path']))):
    path = file['path'][i]
    wave, sr = torchaudio.load(path)
    if sr != bundle.sample_rate:
        wave = torchaudio.functional.resample(wave, sr, bundle.sample_rate)
    with torch.inference_mode():
        feature, _ = extractor.extract_features(wave)
    
    feature = [f[0] for f in feature]
    audio = torch.stack(feature)
    audios.append(audio)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 604/604 [03:25<00:00,  2.93it/s]


In [12]:
# discarded_name

# Load Data

In [50]:
holdout = 5
train = file[file['session'] != holdout]
train_audios = [audios[i] for i in range(len(audios)) if file['session'][i] != holdout]
test = file[file['session'] == holdout]
test_audios = [audios[i] for i in range(len(audios)) if file['session'][i] == holdout]

In [51]:
class MyDataSet(torch.utils.data.Dataset):
    def __init__(self, audios, labels, label_transform):
        super(MyDataSet).__init__()
        self.audios = audios
        self.labels = labels
        self.label_transform = label_transform
        
    def __getitem__(self, idx):
        label = self.label_transform[self.labels[idx]]
        audio = self.audios[idx]
        length = audio.size(1)
        return audio, length, label
    
    def __len__(self):
        return len(self.labels)

In [52]:
def collate_indic(data):
    audios, lengths, labels = zip(*data)
    max_len = max(lengths)
    n_ftrs = audios[0].size(2)
    n_dims = audios[0].size(0)
    features = torch.zeros((len(audios), n_dims, max_len, n_ftrs))
    labels = torch.tensor(labels)
    lengths = torch.tensor(lengths)

    for i in range(len(data)):
        j, k = audios[i].size(1), audios[i].size(2)
        features[i] = torch.cat([audios[i], torch.zeros((n_dims, max_len - j, k))], dim=1)

    return features, lengths, labels

In [53]:
categories = ['angry', 'happy', 'sad', 'fear', 'disgust']
cate_dic = {}
for i, cate in enumerate(categories):
    cate_dic[cate] = i
cate_dic

{'angry': 0, 'happy': 1, 'sad': 2, 'fear': 3, 'disgust': 4}

In [54]:
from torch.utils.data import DataLoader

train_dataset = MyDataSet(train_audios, train['emotion'].tolist(), cate_dic)
trainloader_args = dict(batch_size=16, shuffle=True)
train_dataloader = DataLoader(train_dataset, **trainloader_args, 
                              collate_fn=collate_indic)

test_dataset = MyDataSet(test_audios, test['emotion'].tolist(), cate_dic)
testloader_args = dict(batch_size=16, shuffle=True)
test_dataloader = DataLoader(test_dataset, **testloader_args, 
                             collate_fn=collate_indic)

### 3CNN+LSTM

In [55]:
import torch.nn as nn
import torch.nn.functional as F

class ICASSP3CNN(nn.Module):
    def __init__(self, vocab_size, dims = 12, embed_size=128, hidden_size=512, num_lstm_layers = 2, 
                 bidirectional = False, label_size=5):
        super().__init__()
        self.n_layers = num_lstm_layers 
        self.hidden = hidden_size
        self.bidirectional = bidirectional
        
        self.aggr = nn.Conv1d(in_channels=dims, out_channels=1, kernel_size=1)
        
        self.embed = nn.Linear(in_features = vocab_size, out_features = embed_size)

        self.cnn  = nn.Conv1d(embed_size, embed_size, kernel_size=3, padding=1)
        self.cnn2 = nn.Conv1d(embed_size, embed_size, kernel_size=5, padding=2)
        self.cnn3 = nn.Conv1d(embed_size, embed_size, kernel_size=7, padding=3)

        self.batchnorm = nn.BatchNorm1d(3 * embed_size)

        self.lstm = nn.LSTM(input_size = 3 * embed_size, 
                            hidden_size = hidden_size, 
                            num_layers = num_lstm_layers, 
                            bidirectional = bidirectional)

        self.linear = nn.Linear(in_features = 2 * hidden_size if bidirectional else hidden_size, 
                                out_features = label_size)


    def forward(self, x, lengths):
        """
        padded_x: (B,T) padded LongTensor
        """
        n, d, b, t = x.size(0), x.size(1), x.size(2), x.size(3)
        x = torch.flatten(x, start_dim=2)
        input = self.aggr(x)
        input = torch.reshape(input, (n, b, t))
        input = self.embed(input)

        batch_size = input.size(0)
        input = input.transpose(1,2)    # (B,T,H) -> (B,H,T)

        cnn_output = torch.cat([self.cnn(input), self.cnn2(input), self.cnn3(input)], dim=1)

        input = F.relu(self.batchnorm(cnn_output))

        input = input.transpose(1,2)

        pack_tensor = nn.utils.rnn.pack_padded_sequence(input, lengths, batch_first=True, enforce_sorted=False)
        _, (hn, cn) = self.lstm(pack_tensor)

        if self.bidirectional:
            h_n = hn.view(self.n_layers, 2, batch_size, self.hidden)
            h_n = torch.cat([ h_n[-1, 0,:], h_n[-1,1,:] ], dim = 1)
        else:
            h_n = hn[-1]

        logits = self.linear(h_n)

        return logits


### Train Each Layer

In [56]:
from tqdm import tqdm
from torchsummary import summary
import torch.optim as optim

model = ICASSP3CNN(768)
model = model.to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

epochs = 50
train_losses = []
train_accuracies = []
valid_losses = []
valid_accuracies = []

for epoch in tqdm(range(epochs)):
    train_loss = 0
    acc_cnt = 0
    err_cnt = 0
    batch_cnt = 0
    model.train()
    for batch, (x, length, y) in enumerate(train_dataloader):
        x = x.to(device)
        y = y.to(device)
        optimizer.zero_grad()
        logits = model(x, length)
        loss = criterion(logits, y)
        loss.backward()
        optimizer.step()
        train_loss += loss.cpu().item()

        #model outputs
        out_val, out_indices = torch.max(logits, dim=1)
        tar_indices = y

        for i in range(len(out_indices)):
            if out_indices[i] == tar_indices[i]:
                acc_cnt += 1
            else:
                err_cnt += 1
        batch_cnt += 1
    
    train_loss = train_loss/batch_cnt
    train_accuracy = acc_cnt/(acc_cnt+err_cnt)
    train_accuracies.append(train_accuracy)
    train_losses.append(train_loss)
    
    print(f"epoch:{epoch+1}, train accu:{train_accuracy:.4f},", f"train loss:{train_loss:.2f}")

  2%|█████▋                                                                                                                                                                                                                                                                                         | 1/50 [00:04<03:59,  4.88s/it]

epoch:1, train accu:0.4062, train loss:1.35


  4%|███████████▍                                                                                                                                                                                                                                                                                   | 2/50 [00:09<03:54,  4.88s/it]

epoch:2, train accu:0.6979, train loss:0.92


  6%|█████████████████▏                                                                                                                                                                                                                                                                             | 3/50 [00:14<03:47,  4.85s/it]

epoch:3, train accu:0.7875, train loss:0.63


  8%|██████████████████████▉                                                                                                                                                                                                                                                                        | 4/50 [00:19<03:44,  4.88s/it]

epoch:4, train accu:0.8521, train loss:0.45


 10%|████████████████████████████▋                                                                                                                                                                                                                                                                  | 5/50 [00:24<03:37,  4.82s/it]

epoch:5, train accu:0.8063, train loss:0.55


 12%|██████████████████████████████████▍                                                                                                                                                                                                                                                            | 6/50 [00:29<03:33,  4.86s/it]

epoch:6, train accu:0.8562, train loss:0.43


 14%|████████████████████████████████████████▏                                                                                                                                                                                                                                                      | 7/50 [00:34<03:29,  4.87s/it]

epoch:7, train accu:0.9000, train loss:0.34


 16%|█████████████████████████████████████████████▉                                                                                                                                                                                                                                                 | 8/50 [00:38<03:24,  4.86s/it]

epoch:8, train accu:0.9437, train loss:0.20


 18%|███████████████████████████████████████████████████▋                                                                                                                                                                                                                                           | 9/50 [00:43<03:19,  4.86s/it]

epoch:9, train accu:0.9479, train loss:0.16


 20%|█████████████████████████████████████████████████████████▏                                                                                                                                                                                                                                    | 10/50 [00:49<03:24,  5.11s/it]

epoch:10, train accu:0.9437, train loss:0.18


 22%|██████████████████████████████████████████████████████████████▉                                                                                                                                                                                                                               | 11/50 [00:54<03:18,  5.10s/it]

epoch:11, train accu:0.9542, train loss:0.15


 24%|████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                                                         | 12/50 [00:59<03:11,  5.05s/it]

epoch:12, train accu:0.9187, train loss:0.26


 26%|██████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                                                                   | 13/50 [01:04<03:05,  5.01s/it]

epoch:13, train accu:0.9437, train loss:0.21


 28%|████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                                                              | 14/50 [01:09<02:57,  4.93s/it]

epoch:14, train accu:0.9625, train loss:0.13


 30%|█████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                                                                        | 15/50 [01:13<02:50,  4.88s/it]

epoch:15, train accu:0.9042, train loss:0.26


 32%|███████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                                  | 16/50 [01:20<02:59,  5.29s/it]

epoch:16, train accu:0.9729, train loss:0.11


 34%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                                            | 17/50 [01:26<03:08,  5.71s/it]

epoch:17, train accu:0.9854, train loss:0.04


 36%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                       | 18/50 [01:33<03:11,  6.00s/it]

epoch:18, train accu:0.9542, train loss:0.16


 38%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                 | 19/50 [01:40<03:16,  6.33s/it]

epoch:19, train accu:0.9500, train loss:0.16


 40%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                                           | 20/50 [01:48<03:28,  6.96s/it]

epoch:20, train accu:0.9771, train loss:0.09


 42%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                      | 21/50 [01:56<03:24,  7.05s/it]

epoch:21, train accu:0.9896, train loss:0.03


 44%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                                | 22/50 [02:02<03:14,  6.96s/it]

epoch:22, train accu:0.9833, train loss:0.08


 46%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                          | 23/50 [02:09<03:05,  6.88s/it]

epoch:23, train accu:0.9875, train loss:0.04


 48%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                    | 24/50 [02:16<02:58,  6.86s/it]

epoch:24, train accu:0.9729, train loss:0.09


 50%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                               | 25/50 [02:23<02:52,  6.89s/it]

epoch:25, train accu:0.9917, train loss:0.03


 52%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                         | 26/50 [02:30<02:45,  6.89s/it]

epoch:26, train accu:1.0000, train loss:0.00


 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                   | 27/50 [02:37<02:37,  6.85s/it]

epoch:27, train accu:1.0000, train loss:0.00


 56%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                             | 28/50 [02:44<02:31,  6.90s/it]

epoch:28, train accu:1.0000, train loss:0.00


 58%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                        | 29/50 [02:53<02:38,  7.55s/it]

epoch:29, train accu:1.0000, train loss:0.00


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                  | 30/50 [03:00<02:26,  7.35s/it]

epoch:30, train accu:1.0000, train loss:0.00


 62%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                            | 31/50 [03:06<02:16,  7.17s/it]

epoch:31, train accu:1.0000, train loss:0.00


 64%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                       | 32/50 [03:13<02:07,  7.07s/it]

epoch:32, train accu:1.0000, train loss:0.00


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                 | 33/50 [03:20<01:58,  6.96s/it]

epoch:33, train accu:1.0000, train loss:0.00


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                           | 34/50 [03:27<01:50,  6.92s/it]

epoch:34, train accu:1.0000, train loss:0.00


 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                     | 35/50 [03:34<01:43,  6.93s/it]

epoch:35, train accu:1.0000, train loss:0.00


 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                | 36/50 [03:41<01:38,  7.02s/it]

epoch:36, train accu:1.0000, train loss:0.00


 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                          | 37/50 [03:50<01:38,  7.61s/it]

epoch:37, train accu:1.0000, train loss:0.00


 76%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                    | 38/50 [03:57<01:28,  7.38s/it]

epoch:38, train accu:1.0000, train loss:0.00


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                               | 39/50 [04:04<01:20,  7.27s/it]

epoch:39, train accu:1.0000, train loss:0.00


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                         | 40/50 [04:11<01:11,  7.19s/it]

epoch:40, train accu:1.0000, train loss:0.00


 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                   | 41/50 [04:18<01:04,  7.12s/it]

epoch:41, train accu:1.0000, train loss:0.00


 84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 42/50 [04:25<00:56,  7.07s/it]

epoch:42, train accu:1.0000, train loss:0.00


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                        | 43/50 [04:31<00:48,  6.87s/it]

epoch:43, train accu:1.0000, train loss:0.00


 88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                  | 44/50 [04:37<00:40,  6.73s/it]

epoch:44, train accu:1.0000, train loss:0.00


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                            | 45/50 [04:45<00:34,  6.98s/it]

epoch:45, train accu:1.0000, train loss:0.00


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                       | 46/50 [04:54<00:30,  7.56s/it]

epoch:46, train accu:1.0000, train loss:0.00


 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 47/50 [05:01<00:22,  7.39s/it]

epoch:47, train accu:1.0000, train loss:0.00


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 48/50 [05:08<00:14,  7.30s/it]

epoch:48, train accu:1.0000, train loss:0.00


 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎     | 49/50 [05:15<00:07,  7.18s/it]

epoch:49, train accu:1.0000, train loss:0.00


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [05:22<00:00,  6.45s/it]

epoch:50, train accu:1.0000, train loss:0.00





# Model Test

In [57]:
test_loss = 0
acc_cnt = 0
err_cnt = 0
batch_cnt = 0
model.eval()

for x, lengths, y in test_dataloader:

    x = x.to(device)
    y = y.to(device)

    logits = model(x, lengths)
    loss = criterion(logits, y)
    test_loss += loss.cpu().item()

    out_val, out_indices = torch.max(logits, dim=1)
    tar_indices = y

    for i in range(len(out_indices)):
        if out_indices[i] == tar_indices[i]:
            acc_cnt += 1
        else:
            err_cnt += 1
    batch_cnt += 1

test_loss = test_loss/batch_cnt
test_accuracy = acc_cnt/(acc_cnt+err_cnt)
print(f'test accuracy: {test_accuracy}')

test accuracy: 0.7983870967741935


In [58]:
for name, param in model.named_parameters():
    if param.requires_grad:
        print(name, param.data)

aggr.weight tensor([[[-0.2328],
         [-0.0010],
         [-0.1324],
         [ 0.3584],
         [-0.1700],
         [ 0.2000],
         [ 0.1317],
         [ 0.1172],
         [-0.0024],
         [-0.1361],
         [-0.1509],
         [ 0.1165]]], device='cuda:0')
aggr.bias tensor([0.0497], device='cuda:0')
embed.weight tensor([[ 0.0582,  0.0027,  0.0191,  ...,  0.0647, -0.0124, -0.0205],
        [-0.0640, -0.0354,  0.0301,  ...,  0.0019, -0.0316,  0.0160],
        [ 0.0222, -0.0381, -0.0379,  ..., -0.0485, -0.0607,  0.0234],
        ...,
        [-0.0528,  0.0367,  0.0095,  ..., -0.0105,  0.0575,  0.0273],
        [-0.0066, -0.0223,  0.0203,  ...,  0.0595, -0.0011, -0.0072],
        [ 0.0561, -0.0107, -0.0276,  ...,  0.0053, -0.0524, -0.0444]],
       device='cuda:0')
embed.bias tensor([ 0.0149, -0.0535, -0.0499, -0.0189,  0.0271,  0.0476, -0.0184, -0.0128,
         0.0350, -0.0177, -0.0281,  0.0207,  0.0144,  0.0179,  0.0313, -0.0419,
        -0.0225,  0.0049,  0.0212,  0.0281,

In [80]:
# model_path = main_data_path + f'/models/wav2vecbase/holdout_{holdout}.pth'

# torch.save({'epoch':epochs,
#             'model_state_dict':model.state_dict(),
#             'optimizer_state_dict':optimizer.state_dict()},
#             model_path)