# Three bird classifier
This code is used to train and score the three bird classifier.

# Importing Libraries 📚

In [2]:
import os
import gc
import csv
import ast
import random
import math
import shutil
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
%matplotlib inline
# import seaborn as sns
from tqdm import tqdm
import torchaudio
import IPython.display as ipd
from collections import Counter
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import StratifiedKFold, GroupKFold
from sklearn.metrics import f1_score

import torch
import torch.nn as nn
from torch.optim import Adam
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
from torchvision import models

import timm

import warnings
warnings.filterwarnings('ignore')

  from .autonotebook import tqdm as notebook_tqdm


In [36]:
class config:
    seed = 2022
    num_fold = 5
    sample_rate = 32_000
    n_fft = 1024
    hop_length = 512
    n_mels = 64
    duration = 5
    num_classes = 4
    train_batch_size = 32
    valid_batch_size = 32
    model_name = 'resnet50'
    # model_name = 'efficientnet_b5'
    epochs = 30
    device = 'mps' if torch.backends.mps.is_available() else 'cpu'
    learning_rate = 1e-4

In [4]:
def seed_everything(seed):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True
seed_everything(config.seed)

In [5]:
def getRandomFile(path, not_in_dir):
    randomDir = random.choice([(x) for x in list(os.scandir(path)) if x.is_dir()]).name
    if randomDir in not_in_dir:
        return getRandomFile(path, not_in_dir)
    randomFile = random.choice([f for f in list(os.scandir(os.path.join(path, randomDir)))]).name
    return os.path.join(path, randomDir, randomFile)

<a id='2'></a>
# Reading the data 📖

In [6]:
root_dir = 'data/audio/'
class_names = ['galerida_cristata', 'picus_viridis', 'phasianus_colchicus', 'random_other']
# class_names = ['galerida_cristata', 'picus_viridis', 'phasianus_colchicus']
random_files = []

In [40]:
for i in range(352):
    random_files.append(getRandomFile(root_dir, class_names))

In [41]:
random_files = list(set(random_files))

In [42]:
for file in random_files:
    shutil.copy(file, 'data/audio/random_other')

In [6]:
files_df = pd.DataFrame(columns=['file_path', 'observation', 'target'])

In [64]:
for class_name in class_names:
    files_path = os.path.join(root_dir, class_name, 'ogg_5s')
    file_paths = []
    observations = []
    
    for file in os.listdir(files_path):
        observation = file.split(' ')[0]
        number = file.split('_')[1].split('.')[0]
        
        # Include the first minute for each file
        if int(number) <= 3:
            file_paths.append(os.path.join(files_path, file))
            observations.append(observation)
    
    #file_paths = [os.path.join(files_path, file) for file in os.listdir(files_path)]
    
    df = pd.DataFrame(list(zip(file_paths, observations)), columns=['file_path', 'observation'])
    df['target'] = class_name
    
    files_df = pd.concat([files_df, df], ignore_index=True)

In [7]:
files_df = pd.DataFrame(columns=['file_path', 'target'])

In [8]:
for class_name in class_names:
    files_path = os.path.join(root_dir, class_name, 'ogg')
    file_paths = [os.path.join(files_path, file) for file in os.listdir(files_path)]
    
    df = pd.DataFrame(file_paths, columns=['file_path'])
    df['target'] = class_name
    
    files_df = pd.concat([files_df, df], ignore_index=True)

In [1]:
# files_df[files_df['observation'] == 'XC630463']

In [9]:
files_df.groupby(['target']).count()

Unnamed: 0_level_0,file_path
target,Unnamed: 1_level_1
galerida_cristata,311
phasianus_colchicus,258
picus_viridis,487
random_other,345


<a id='4'></a>
# Dataset Preprocessing 🛠️

### Convert the target variable from string to integer using the LabelEncoder

In [10]:
encoder = LabelEncoder()
files_df['target_encoded'] = encoder.fit_transform(files_df['target'])

In [11]:
files_df.groupby(['target', 'target_encoded']).count()

Unnamed: 0_level_0,Unnamed: 1_level_0,file_path
target,target_encoded,Unnamed: 2_level_1
galerida_cristata,0,311
phasianus_colchicus,1,258
picus_viridis,2,487
random_other,3,345


### Next create folds.
When using multiple audio segments from one file, we want to use the group fold to keep them together and prevent overfitting. Otherwise, use the Stratified K Fold

In [69]:
# skf = StratifiedKFold(n_splits=config.num_fold)
skf = GroupKFold(n_splits=config.num_fold)

for k, (_, val_ind) in enumerate(skf.split(X=files_df, y=files_df['target_encoded'], groups=files_df['observation'])):
    files_df.loc[val_ind, 'fold'] = k

In [12]:
skf = StratifiedKFold(n_splits=config.num_fold)

for k, (_, val_ind) in enumerate(skf.split(X=files_df, y=files_df['target_encoded'])):
    files_df.loc[val_ind, 'fold'] = k

In [13]:
files_df.groupby(['fold', 'target', 'target_encoded']).count()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,file_path
fold,target,target_encoded,Unnamed: 3_level_1
0.0,galerida_cristata,0,63
0.0,phasianus_colchicus,1,52
0.0,picus_viridis,2,97
0.0,random_other,3,69
1.0,galerida_cristata,0,62
1.0,phasianus_colchicus,1,51
1.0,picus_viridis,2,98
1.0,random_other,3,69
2.0,galerida_cristata,0,62
2.0,phasianus_colchicus,1,51


In [14]:
files_df

Unnamed: 0,file_path,target,target_encoded,fold
0,data/audio/galerida_cristata/ogg/XC155090 - Cr...,galerida_cristata,0,0.0
1,data/audio/galerida_cristata/ogg/XC293927 - Cr...,galerida_cristata,0,0.0
2,data/audio/galerida_cristata/ogg/XC522185 - Cr...,galerida_cristata,0,0.0
3,data/audio/galerida_cristata/ogg/XC387237 - Cr...,galerida_cristata,0,0.0
4,data/audio/galerida_cristata/ogg/XC46297 - Cre...,galerida_cristata,0,0.0
...,...,...,...,...
1396,data/audio/random_other/ogg/XC568005 - Eurasia...,random_other,3,4.0
1397,data/audio/random_other/ogg/XC495312 - Eurasia...,random_other,3,4.0
1398,data/audio/random_other/ogg/XC133194 - Red-bac...,random_other,3,4.0
1399,data/audio/random_other/ogg/XC162216 - Long-ta...,random_other,3,4.0


In [14]:
mel_spectrogram = torchaudio.transforms.MelSpectrogram(sample_rate=config.sample_rate, 
                                                  n_fft=config.n_fft, 
                                                  hop_length=config.hop_length, 
                                                  n_mels=config.n_mels)

### So similarly we will extract mel spectrogram for each audio and will train the model using them. But wait, this is not the end. There are several things which we need to consider before extracting spectrograms from the audio files. We want our dataset to be uniform and to do that we should consider the below points:-
* As I mentioned above the audio data consist of two things - sample rate and sound. Not all the audio have same sample rate, and this is a huge problem if we want uniformity in the melspectrogram which we extract. So we resample the data so that all the data have same sample rates.
* Next if we talk about the sound, the dimension of sound is - (num_channels, num_samples). If we talk about number of channels, then each audio signals can have different number of channels. So we will ensure that they are mono, i.e., num_channels = 1.
* Lastly, each audio signal have different time durations which lead to difference in number of samples. So we ensure same number of samples by applying padding if it is less than the desired samples or by truncating if it is more than the desired samples.

### Now I will implement the custom Dataset class in which I will also implement all the above points. 

In [30]:
class BirdClefDataset(Dataset):
    def __init__(self, df, transformation, target_sample_rate, duration):
        self.audio_paths = df['file_path'].values
        self.labels = df['target_encoded'].values
        self.transformation = transformation
        self.target_sample_rate = target_sample_rate
        self.num_samples = target_sample_rate*duration
        
    def __len__(self):
        return len(self.audio_paths)
    
    def __getitem__(self, index):
        audio_path = self.audio_paths[index]
        signal, sr = torchaudio.load(audio_path) # loaded the audio
        
        # Now we first checked if the sample rate is same as TARGET_SAMPLE_RATE and if it not equal we perform resampling
        if sr != self.target_sample_rate:
            resampler = torchaudio.transforms.Resample(sr, self.target_sample_rate)
            signal = resampler(signal)
        
        # Next we check the number of channels of the signal
        #signal -> (num_channels, num_samples) - Eg.-(2, 14000) -> (1, 14000)
        if signal.shape[0]>1:
            signal = torch.mean(signal, axis=0, keepdim=True)
        
        # Lastly we check the number of samples of the signal
        #signal -> (num_channels, num_samples) - Eg.-(1, 14000) -> (1, self.num_samples)
        # If it is more than the required number of samples, we truncate the signal
        if signal.shape[1] > self.num_samples:
            signal = signal[:, :self.num_samples]
        
        # If it is less than the required number of samples, we pad the signal
        if signal.shape[1]<self.num_samples:
            num_missing_samples = self.num_samples - signal.shape[1]
            last_dim_padding = (0, num_missing_samples)
            signal = F.pad(signal, last_dim_padding)
        
        # Finally all the process has been done and now we will extract mel spectrogram from the signal
        mel = self.transformation(signal)
        
        # For pretrained models, we need 3 channel image, so for that we concatenate the extracted mel
        image = torch.cat([mel, mel, mel])
        
        # image = mel
        
        # Normalized the image
        max_val = torch.abs(image).max()
        image = image / max_val
        
        label = torch.tensor(self.labels[index])
        
        return image, label

In [16]:
# Function to get data according to the folds
def get_data(fold):    
    train_df = files_df[files_df['fold'] != fold].reset_index(drop=True)
    valid_df = files_df[files_df['fold'] == fold].reset_index(drop=True)
    
    train_dataset = BirdClefDataset(train_df, mel_spectrogram, config.sample_rate, config.duration)
    valid_dataset = BirdClefDataset(valid_df, mel_spectrogram, config.sample_rate, config.duration)

    # dataset = BirdClefDataset(files_df, mel_spectrogram, config.sample_rate, config.duration)
    # train_dataset, valid_dataset = random_split(dataset, [0.7, 0.3])
    
    train_loader = DataLoader(train_dataset, batch_size=config.train_batch_size, shuffle=True)
    valid_loader = DataLoader(valid_dataset, batch_size=config.valid_batch_size, shuffle=False)
    
    return train_loader, valid_loader

<a id='5'></a>
# Model 🤖

### We fine tune a pretrained model. We use Resnet50 and EfficientNet

In [31]:
class BirdCLEFResnet(nn.Module):
    def __init__(self):
        super(BirdCLEFResnet, self).__init__()
        self.base_model = models.__getattribute__(config.model_name)(pretrained=True)
        for param in self.base_model.parameters():
            param.requires_grad = False
            
        in_features = self.base_model.fc.in_features
        
        self.base_model.fc = nn.Sequential(
            nn.Linear(in_features, 1024), 
            nn.ReLU(), 
            nn.Dropout(p=0.2),
            nn.Linear(1024, 512), 
            nn.ReLU(), 
            nn.Dropout(p=0.2),
            nn.Linear(512, config.num_classes))
        
    def forward(self, x):
        x = self.base_model(x)
        return x

In [19]:
class BirdCLEFEfficientNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.cfg = config
        self.model = timm.create_model(self.cfg.model_name, pretrained=True, in_chans=1)
        self.n_features = self.model.classifier.in_features
        self.model.classifier = nn.Linear(self.n_features, self.cfg.num_classes)

    def forward(self, x):
        output = self.model(x)
        return output

<a id='6'></a>
# Utility Functions 📋

### Next we define some functions to train the model. These are the basic functions which we use to train any pytorch based models.

In [20]:
def loss_fn(outputs, labels):
    return nn.CrossEntropyLoss()(outputs, labels)

def train(model, data_loader, optimizer, scheduler, device, epoch):
    model.train()
    
    running_loss = 0
    loop = tqdm(data_loader, position=0)
    for i, (mels, labels) in enumerate(loop):
        mels = mels.to(device)
        labels = labels.to(device)
        
        outputs = model(mels)
        _, preds = torch.max(outputs, 1)
        
        loss = loss_fn(outputs, labels)
        
        loss.backward()
        optimizer.step()
        optimizer.zero_grad()
        
        if scheduler is not None:
            scheduler.step()
            
        running_loss += loss.item()
        
        loop.set_description(f"Epoch [{epoch+1}/{config.epochs}]")
        loop.set_postfix(loss=loss.item())

    return running_loss/len(data_loader)

In [21]:
def valid(model, data_loader, device, epoch):
    model.eval()
    
    running_loss = 0
    pred = []
    label = []
    
    loop = tqdm(data_loader, position=0)
    for mels, labels in loop:
        mels = mels.to(device)
        labels = labels.to(device)
        
        outputs = model(mels)
        _, preds = torch.max(outputs, 1)
        
        loss = loss_fn(outputs, labels)
            
        running_loss += loss.item()
        
        pred.extend(preds.view(-1).cpu().detach().numpy())
        label.extend(labels.view(-1).cpu().detach().numpy())
        
        loop.set_description(f"Epoch [{epoch+1}/{config.epochs}]")
        loop.set_postfix(loss=loss.item())
        
    valid_f1 = f1_score(label, pred, average='macro')
    
    return running_loss/len(data_loader), valid_f1

In [34]:
best_valid_log = []

def run(fold):
    train_loader, valid_loader = get_data(fold)
    
    # model = BirdClefModel().to(config.device) # check version 3 for this
    model = BirdCLEFResnet().to(config.device)
    # model = BirdCLEFEfficientNet().to(config.device)
    
    optimizer = Adam(model.parameters(), lr=config.learning_rate)
    
    scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, eta_min=1e-5, T_max=10)
    
    best_valid_f1 = 0
    for epoch in range(config.epochs):
        train_loss = train(model, train_loader, optimizer, scheduler, config.device, epoch)
        valid_loss, valid_f1 = valid(model, valid_loader, config.device, epoch)
        if valid_f1 > best_valid_f1:
            print(f"Validation F1 Improved - {best_valid_f1} ---> {valid_f1}")
            best_valid_log.append({fold, valid_f1})
            
            torch.save(model.state_dict(), f'./model_{fold}.bin')
            print(f"Saved model checkpoint at ./model_{fold}.bin")
            best_valid_f1 = valid_f1
            
    return best_valid_f1

<a id='7'></a>
# Training ⚙️

In [37]:
for fold in range(config.num_fold):
    print("=" * 30)
    print("Training Fold - ", fold)
    print("=" * 30)
    best_valid_f1 = run(fold)
    print(f'Best F1 Score: {best_valid_f1:.5f}')
    
    gc.collect()
    torch.cuda.empty_cache()

Training Fold -  0


Epoch [1/30]: 100%|████████████████████████████████████████████████████████████████| 35/35 [01:07<00:00,  1.93s/it, loss=1.33]
Epoch [1/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.81s/it, loss=1.32]


Validation F1 Improved - 0 ---> 0.1276595744680851
Saved model checkpoint at ./model_0.bin


Epoch [2/30]: 100%|████████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.69s/it, loss=1.28]
Epoch [2/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:18<00:00,  2.00s/it, loss=1.41]


Validation F1 Improved - 0.1276595744680851 ---> 0.22362285544103727
Saved model checkpoint at ./model_0.bin


Epoch [3/30]: 100%|████████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.70s/it, loss=1.19]
Epoch [3/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s/it, loss=1.13]


Validation F1 Improved - 0.22362285544103727 ---> 0.38844537944671664
Saved model checkpoint at ./model_0.bin


Epoch [4/30]: 100%|███████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.70s/it, loss=0.981]
Epoch [4/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s/it, loss=1.5]


Validation F1 Improved - 0.38844537944671664 ---> 0.4940145228800144
Saved model checkpoint at ./model_0.bin


Epoch [5/30]: 100%|███████████████████████████████████████████████████████████████████| 35/35 [01:00<00:00,  1.72s/it, loss=1]
Epoch [5/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.79s/it, loss=1.03]


Validation F1 Improved - 0.4940145228800144 ---> 0.5825422377133401
Saved model checkpoint at ./model_0.bin


Epoch [6/30]: 100%|███████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.71s/it, loss=0.979]
Epoch [6/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.77s/it, loss=0.992]
Epoch [7/30]: 100%|███████████████████████████████████████████████████████████████████| 35/35 [01:02<00:00,  1.78s/it, loss=1]
Epoch [7/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.90s/it, loss=1.16]
Epoch [8/30]: 100%|███████████████████████████████████████████████████████████████| 35/35 [01:08<00:00,  1.96s/it, loss=0.914]
Epoch [8/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.79s/it, loss=1.16]
Epoch [9/30]: 100%|███████████████████████████████████████████████████████████████| 35/35 [01:00<00:00,  1.73s/it, loss=0.818]
Epoch [9/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.98

Validation F1 Improved - 0.5825422377133401 ---> 0.624826602880038
Saved model checkpoint at ./model_0.bin


Epoch [10/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [01:01<00:00,  1.75s/it, loss=0.739]
Epoch [10/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.98s/it, loss=1.03]
Epoch [11/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [01:02<00:00,  1.79s/it, loss=0.791]
Epoch [11/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.68s/it, loss=1.25]
Epoch [12/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:58<00:00,  1.67s/it, loss=0.781]
Epoch [12/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.70s/it, loss=1.26]
Epoch [13/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:57<00:00,  1.64s/it, loss=0.644]
Epoch [13/30]: 100%|████████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.

Validation F1 Improved - 0.624826602880038 ---> 0.6278509542566986
Saved model checkpoint at ./model_0.bin


Epoch [20/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.69s/it, loss=0.585]
Epoch [20/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.91s/it, loss=1.15]
Epoch [21/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.70s/it, loss=0.644]
Epoch [21/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.79s/it, loss=0.997]
Epoch [22/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:58<00:00,  1.68s/it, loss=0.692]
Epoch [22/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.78s/it, loss=1.04]
Epoch [23/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [01:02<00:00,  1.80s/it, loss=0.572]
Epoch [23/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.74s

Validation F1 Improved - 0.6278509542566986 ---> 0.6312790894474063
Saved model checkpoint at ./model_0.bin


Epoch [27/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:59<00:00,  1.71s/it, loss=0.569]
Epoch [27/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.76s/it, loss=0.987]
Epoch [28/30]: 100%|███████████████████████████████████████████████████████████████| 35/35 [00:58<00:00,  1.66s/it, loss=0.83]
Epoch [28/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.94s/it, loss=0.768]
Epoch [29/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:58<00:00,  1.68s/it, loss=0.508]
Epoch [29/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:22<00:00,  2.49s/it, loss=1.11]
Epoch [30/30]: 100%|██████████████████████████████████████████████████████████████| 35/35 [00:57<00:00,  1.65s/it, loss=0.637]
Epoch [30/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.71s

Best F1 Score: 0.63128
Training Fold -  1


Epoch [1/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [05:10<00:00,  8.62s/it, loss=1.35]
Epoch [1/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.71s/it, loss=1.44]


Validation F1 Improved - 0 ---> 0.1459441489361702
Saved model checkpoint at ./model_1.bin


Epoch [2/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.64s/it, loss=1.81]
Epoch [2/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.67s/it, loss=1.36]


Validation F1 Improved - 0.1459441489361702 ---> 0.42095571194793646
Saved model checkpoint at ./model_1.bin


Epoch [3/30]: 100%|█████████████████████████████████████████████████████████████████| 36/36 [00:56<00:00,  1.58s/it, loss=2.4]
Epoch [3/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.69s/it, loss=1.24]


Validation F1 Improved - 0.42095571194793646 ---> 0.4738256932654216
Saved model checkpoint at ./model_1.bin


Epoch [4/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [00:57<00:00,  1.61s/it, loss=1.47]
Epoch [4/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.71s/it, loss=1.34]


Validation F1 Improved - 0.4738256932654216 ---> 0.5437813128007429
Saved model checkpoint at ./model_1.bin


Epoch [5/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.64s/it, loss=1.15]
Epoch [5/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.78s/it, loss=0.86]
Epoch [6/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.06]
Epoch [6/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.77s/it, loss=0.964]


Validation F1 Improved - 0.5437813128007429 ---> 0.5638704502284512
Saved model checkpoint at ./model_1.bin


Epoch [7/30]: 100%|███████████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.66s/it, loss=1]
Epoch [7/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.74s/it, loss=0.911]
Epoch [8/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.65s/it, loss=1.87]
Epoch [8/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.73s/it, loss=0.927]


Validation F1 Improved - 0.5638704502284512 ---> 0.5734064040193079
Saved model checkpoint at ./model_1.bin


Epoch [9/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.73s/it, loss=1.28]
Epoch [9/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.76s/it, loss=1.07]
Epoch [10/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.81s/it, loss=3.34]
Epoch [10/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.81s/it, loss=1.11]
Epoch [11/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.75s/it, loss=2.33]
Epoch [11/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:21<00:00,  2.37s/it, loss=1.06]
Epoch [12/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.82s/it, loss=0.903]
Epoch [12/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.95s/

Validation F1 Improved - 0.5734064040193079 ---> 0.6036310549668228
Saved model checkpoint at ./model_1.bin


Epoch [16/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.64s/it, loss=1.22]
Epoch [16/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.80s/it, loss=1.19]
Epoch [17/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.72s/it, loss=1.63]
Epoch [17/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s/it, loss=1.17]


Validation F1 Improved - 0.6036310549668228 ---> 0.6245176612606939
Saved model checkpoint at ./model_1.bin


Epoch [18/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.66s/it, loss=1.44]
Epoch [18/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:18<00:00,  2.03s/it, loss=1.17]


Validation F1 Improved - 0.6245176612606939 ---> 0.6595166271636861
Saved model checkpoint at ./model_1.bin


Epoch [19/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.63s/it, loss=2.71]
Epoch [19/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.72s/it, loss=1.07]
Epoch [20/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.76s/it, loss=1.3]
Epoch [20/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.81s/it, loss=1.43]
Epoch [21/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=1.15]
Epoch [21/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s/it, loss=1.09]
Epoch [22/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.79s/it, loss=1.01]
Epoch [22/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.80s/

Best F1 Score: 0.65952
Training Fold -  2


Epoch [1/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:07<00:00,  1.87s/it, loss=1.38]
Epoch [1/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.68s/it, loss=1.35]


Validation F1 Improved - 0 ---> 0.1459441489361702
Saved model checkpoint at ./model_2.bin


Epoch [2/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.65s/it, loss=1.19]
Epoch [2/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.63s/it, loss=1.67]


Validation F1 Improved - 0.1459441489361702 ---> 0.3410296919062199
Saved model checkpoint at ./model_2.bin


Epoch [3/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.63s/it, loss=0.915]
Epoch [3/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.85s/it, loss=2.98]


Validation F1 Improved - 0.3410296919062199 ---> 0.404414535936275
Saved model checkpoint at ./model_2.bin


Epoch [4/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.92]
Epoch [4/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.82s/it, loss=3.14]


Validation F1 Improved - 0.404414535936275 ---> 0.5269997606969589
Saved model checkpoint at ./model_2.bin


Epoch [5/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.81s/it, loss=1.46]
Epoch [5/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.79s/it, loss=4.52]


Validation F1 Improved - 0.5269997606969589 ---> 0.5654898909947198
Saved model checkpoint at ./model_2.bin


Epoch [6/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.68s/it, loss=0.865]
Epoch [6/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.83s/it, loss=3.17]
Epoch [7/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.69s/it, loss=1.27]
Epoch [7/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.76s/it, loss=1.08]
Epoch [8/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.69s/it, loss=2.16]
Epoch [8/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.66s/it, loss=5.23]
Epoch [9/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:07<00:00,  1.88s/it, loss=1.32]
Epoch [9/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s

Validation F1 Improved - 0.5654898909947198 ---> 0.5671921456781404
Saved model checkpoint at ./model_2.bin


Epoch [11/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.79s/it, loss=1.44]
Epoch [11/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.73s/it, loss=7.35]


Validation F1 Improved - 0.5671921456781404 ---> 0.5718927022746418
Saved model checkpoint at ./model_2.bin


Epoch [12/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:08<00:00,  1.89s/it, loss=0.864]
Epoch [12/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.64s/it, loss=3.97]
Epoch [13/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.64s/it, loss=2.39]
Epoch [13/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.68s/it, loss=4.74]
Epoch [14/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:06<00:00,  1.86s/it, loss=1.27]
Epoch [14/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.72s/it, loss=8.69]
Epoch [15/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.76s/it, loss=2.85]
Epoch [15/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.80s

Validation F1 Improved - 0.5718927022746418 ---> 0.5877597540288381
Saved model checkpoint at ./model_2.bin


Epoch [17/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.69s/it, loss=2.68]
Epoch [17/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.69s/it, loss=7.05]
Epoch [18/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=1.04]
Epoch [18/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:18<00:00,  2.11s/it, loss=7.09]
Epoch [19/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.72s/it, loss=1.69]
Epoch [19/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.69s/it, loss=8.01]
Epoch [20/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.76s/it, loss=1.22]
Epoch [20/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.74s

Validation F1 Improved - 0.5877597540288381 ---> 0.595815100362314
Saved model checkpoint at ./model_2.bin


Epoch [22/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.65s/it, loss=0.665]
Epoch [22/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:17<00:00,  1.89s/it, loss=5.21]
Epoch [23/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.81s/it, loss=2.23]
Epoch [23/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.62s/it, loss=8.18]


Validation F1 Improved - 0.595815100362314 ---> 0.600434332289963
Saved model checkpoint at ./model_2.bin


Epoch [24/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.62s/it, loss=1.11]
Epoch [24/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.63s/it, loss=13.5]
Epoch [25/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.62s/it, loss=1.06]
Epoch [25/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.63s/it, loss=3.33]
Epoch [26/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:58<00:00,  1.62s/it, loss=2.21]
Epoch [26/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.67s/it, loss=5.13]
Epoch [27/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.82s/it, loss=1.08]
Epoch [27/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.69s

Best F1 Score: 0.60043
Training Fold -  3


Epoch [1/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.80s/it, loss=1.42]
Epoch [1/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s/it, loss=1.33]


Validation F1 Improved - 0 ---> 0.14388985759953501
Saved model checkpoint at ./model_3.bin


Epoch [2/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.74s/it, loss=1.21]
Epoch [2/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.60s/it, loss=1.41]


Validation F1 Improved - 0.14388985759953501 ---> 0.3859951260336297
Saved model checkpoint at ./model_3.bin


Epoch [3/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.76s/it, loss=1.18]
Epoch [3/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.54s/it, loss=1.4]


Validation F1 Improved - 0.3859951260336297 ---> 0.5007224418093983
Saved model checkpoint at ./model_3.bin


Epoch [4/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.77s/it, loss=1.44]
Epoch [4/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.59s/it, loss=1.44]
Epoch [5/30]: 100%|█████████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.79s/it, loss=1.8]
Epoch [5/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.54]


Validation F1 Improved - 0.5007224418093983 ---> 0.583018399018416
Saved model checkpoint at ./model_3.bin


Epoch [6/30]: 100%|█████████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=1.6]
Epoch [6/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.06]


Validation F1 Improved - 0.583018399018416 ---> 0.6402080376559345
Saved model checkpoint at ./model_3.bin


Epoch [7/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.80s/it, loss=1.36]
Epoch [7/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.66s/it, loss=1.2]
Epoch [8/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [02:37<00:00,  4.38s/it, loss=0.603]
Epoch [8/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:15<00:00,  1.75s/it, loss=1.25]
Epoch [9/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [02:16<00:00,  3.80s/it, loss=1.13]
Epoch [9/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.49s/it, loss=0.923]
Epoch [10/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=0.837]
Epoch [10/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/

Validation F1 Improved - 0.6402080376559345 ---> 0.6434792232141445
Saved model checkpoint at ./model_3.bin


Epoch [13/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.77s/it, loss=1.3]
Epoch [13/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.17]
Epoch [14/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.80s/it, loss=0.793]
Epoch [14/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.54s/it, loss=1.21]


Validation F1 Improved - 0.6434792232141445 ---> 0.6517802033861086
Saved model checkpoint at ./model_3.bin


Epoch [15/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.79s/it, loss=0.856]
Epoch [15/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.53s/it, loss=1.31]
Epoch [16/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:08<00:00,  1.90s/it, loss=1.04]
Epoch [16/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.55s/it, loss=1.16]


Validation F1 Improved - 0.6517802033861086 ---> 0.6646264124440817
Saved model checkpoint at ./model_3.bin


Epoch [17/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.83s/it, loss=2.3]
Epoch [17/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.54s/it, loss=1.28]
Epoch [18/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.72s/it, loss=1.35]
Epoch [18/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.54s/it, loss=1.23]


Validation F1 Improved - 0.6646264124440817 ---> 0.6807299197513014
Saved model checkpoint at ./model_3.bin


Epoch [19/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:07<00:00,  1.87s/it, loss=3.35]
Epoch [19/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.53s/it, loss=1.12]
Epoch [20/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.82s/it, loss=1.22]
Epoch [20/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.59s/it, loss=1.35]
Epoch [21/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:17<00:00,  2.15s/it, loss=1.8]
Epoch [21/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:16<00:00,  1.81s/it, loss=1.22]
Epoch [22/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.77s/it, loss=1.47]
Epoch [22/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s

Validation F1 Improved - 0.6807299197513014 ---> 0.6874845092715349
Saved model checkpoint at ./model_3.bin


Epoch [23/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.81s/it, loss=2.67]
Epoch [23/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.53s/it, loss=1.15]
Epoch [24/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:04<00:00,  1.79s/it, loss=1.76]
Epoch [24/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.14]
Epoch [25/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.75s/it, loss=1.25]
Epoch [25/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s/it, loss=1.16]
Epoch [26/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.67s/it, loss=1.78]
Epoch [26/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s

Best F1 Score: 0.68748
Training Fold -  4


Epoch [1/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=1.49]
Epoch [1/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.36]


Validation F1 Improved - 0 ---> 0.1286472148541114
Saved model checkpoint at ./model_4.bin


Epoch [2/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.76s/it, loss=1.97]
Epoch [2/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.13]


Validation F1 Improved - 0.1286472148541114 ---> 0.30609358564818906
Saved model checkpoint at ./model_4.bin


Epoch [3/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:03<00:00,  1.75s/it, loss=1.42]
Epoch [3/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.53s/it, loss=0.992]


Validation F1 Improved - 0.30609358564818906 ---> 0.4995632587565865
Saved model checkpoint at ./model_4.bin


Epoch [4/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.72s/it, loss=1.02]
Epoch [4/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s/it, loss=1.3]


Validation F1 Improved - 0.4995632587565865 ---> 0.5556542560959841
Saved model checkpoint at ./model_4.bin


Epoch [5/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.86]
Epoch [5/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.35]
Epoch [6/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.71s/it, loss=1.52]
Epoch [6/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s/it, loss=1.14]


Validation F1 Improved - 0.5556542560959841 ---> 0.6146920696564615
Saved model checkpoint at ./model_4.bin


Epoch [7/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.72s/it, loss=1.65]
Epoch [7/30]: 100%|██████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.26]
Epoch [8/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=0.873]
Epoch [8/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s/it, loss=1.1]
Epoch [9/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:11<00:00,  1.98s/it, loss=1.73]
Epoch [9/30]: 100%|███████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.59s/it, loss=1.6]
Epoch [10/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:01<00:00,  1.70s/it, loss=1.14]
Epoch [10/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.52s

Validation F1 Improved - 0.6146920696564615 ---> 0.6171596139473391
Saved model checkpoint at ./model_4.bin


Epoch [11/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.75s/it, loss=2.28]
Epoch [11/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.11]
Epoch [12/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.68s/it, loss=1.85]
Epoch [12/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=0.929]


Validation F1 Improved - 0.6171596139473391 ---> 0.6443212447994954
Saved model checkpoint at ./model_4.bin


Epoch [13/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.37]
Epoch [13/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.51s/it, loss=1.08]
Epoch [14/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.66s/it, loss=2.33]
Epoch [14/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.06]
Epoch [15/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.24]
Epoch [15/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.08]


Validation F1 Improved - 0.6443212447994954 ---> 0.6600004025428786
Saved model checkpoint at ./model_4.bin


Epoch [16/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.67s/it, loss=1.02]
Epoch [16/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.49s/it, loss=1.44]
Epoch [17/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [00:59<00:00,  1.64s/it, loss=1.17]
Epoch [17/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=0.907]
Epoch [18/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:00<00:00,  1.68s/it, loss=1.44]
Epoch [18/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.50s/it, loss=1.11]
Epoch [19/30]: 100%|███████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.75s/it, loss=1.35]
Epoch [19/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.59s

Validation F1 Improved - 0.6600004025428786 ---> 0.669474244509979
Saved model checkpoint at ./model_4.bin


Epoch [27/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.74s/it, loss=1.1]
Epoch [27/30]: 100%|█████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.56s/it, loss=1.38]
Epoch [28/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.72s/it, loss=1.5]
Epoch [28/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.55s/it, loss=0.891]
Epoch [29/30]: 100%|████████████████████████████████████████████████████████████████| 36/36 [01:02<00:00,  1.74s/it, loss=1.1]
Epoch [29/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:13<00:00,  1.53s/it, loss=0.891]
Epoch [30/30]: 100%|██████████████████████████████████████████████████████████████| 36/36 [01:05<00:00,  1.81s/it, loss=0.853]
Epoch [30/30]: 100%|████████████████████████████████████████████████████████████████| 9/9 [00:14<00:00,  1.57s/

Best F1 Score: 0.66947


In [38]:
best_valid_log

[{0, 0.1276595744680851},
 {0, 0.22362285544103727},
 {0, 0.38844537944671664},
 {0, 0.4940145228800144},
 {0, 0.5825422377133401},
 {0, 0.624826602880038},
 {0, 0.6278509542566986},
 {0, 0.6312790894474063},
 {0.1459441489361702, 1},
 {0.42095571194793646, 1},
 {0.4738256932654216, 1},
 {0.5437813128007429, 1},
 {0.5638704502284512, 1},
 {0.5734064040193079, 1},
 {0.6036310549668228, 1},
 {0.6245176612606939, 1},
 {0.6595166271636861, 1},
 {0.1459441489361702, 2},
 {0.3410296919062199, 2},
 {0.404414535936275, 2},
 {0.5269997606969589, 2},
 {0.5654898909947198, 2},
 {0.5671921456781404, 2},
 {0.5718927022746418, 2},
 {0.5877597540288381, 2},
 {0.595815100362314, 2},
 {0.600434332289963, 2},
 {0.14388985759953501, 3},
 {0.3859951260336297, 3},
 {0.5007224418093983, 3},
 {0.583018399018416, 3},
 {0.6402080376559345, 3},
 {0.6434792232141445, 3},
 {0.6517802033861086, 3},
 {0.6646264124440817, 3},
 {0.6807299197513014, 3},
 {0.6874845092715349, 3},
 {0.1286472148541114, 4},
 {0.306093585

# Score

In [222]:
root_dir = 'data/test/ogg'
score_df = pd.DataFrame(columns=['file_path', 'target'])
file_paths = [os.path.join(root_dir, file) for file in os.listdir(root_dir)]
score_df['file_path'] = file_paths

score_df

Unnamed: 0,file_path,target
0,data/test/ogg/XC714560 - Kuifleeuwerik - Galer...,
1,data/test/ogg/XC790509 - Groene Specht - Picus...,
2,data/test/ogg/XC784467 - Groene Specht - Picus...,
3,data/test/ogg/XC577099 - Fazant - Phasianus co...,


In [223]:
encoder = LabelEncoder()
score_df['target_encoded'] = encoder.fit_transform(score_df['target'])

In [225]:
score_df

Unnamed: 0,file_path,target,target_encoded
0,data/test/ogg/XC714560 - Kuifleeuwerik - Galer...,,0
1,data/test/ogg/XC790509 - Groene Specht - Picus...,,0
2,data/test/ogg/XC784467 - Groene Specht - Picus...,,0
3,data/test/ogg/XC577099 - Fazant - Phasianus co...,,0


In [226]:
score_dataset = BirdClefDataset(score_df, mel_spectrogram, config.sample_rate, config.duration)
score_loader = DataLoader(score_dataset, batch_size=1, shuffle=False)

In [None]:
# Classes
# galerida_cristata		0
# phasianus_colchicus	1
# picus_viridis			2

In [26]:
def generate_model_output(filename, sensor, model, device):
    audio_path = os.path.join(f"data/recordings/ogg_files/{sensor}", filename)
    
    transformation = mel_spectrogram
    target_sample_rate = 32000
    num_samples = target_sample_rate * 5
    
    signals, sr = torchaudio.load(audio_path) # loaded the audio

    # Now we first checked if the sample rate is same as TARGET_SAMPLE_RATE and if it not equal we perform resampling
    if sr != target_sample_rate:
        resampler = torchaudio.transforms.Resample(sr, target_sample_rate)
        signals = resampler(signals)

    # Next we check the number of channels of the signal
    #signal -> (num_channels, num_samples) - Eg.-(2, 14000) -> (1, 14000)
    if signals.shape[0] > 1:
        signals = torch.mean(signals, axis=0, keepdim=True)
        
    chunks = math.ceil(torch.numel(signals) / num_samples)
    
    # opening the csv file in 'w' mode
    file_location = f"data/results_3b/{sensor}/" + filename.split('.')[0] + '.csv'
    file = open(file_location, 'w', newline ='')

    with file:
        # identifying header 
        header = ['frame', 'class', 'probability']
        writer = csv.DictWriter(file, fieldnames = header)

        # writing data row-wise into the csv file
        writer.writeheader()
    
        for i in range(chunks):
            # Split the signal into 5 second segments
            signal = signals[:, i*num_samples:num_samples*(i+1)]

            # Lastly we check the number of samples of the signal
            #signal -> (num_channels, num_samples) - Eg.-(1, 14000) -> (1, self.num_samples)
            # If it is more than the required number of samples, we truncate the signal
            if signal.shape[1] > num_samples:
                signal = signal[:, :num_samples]

            # If it is less than the required number of samples, we pad the signal
            if signal.shape[1] < num_samples:
                num_missing_samples = num_samples - signal.shape[1]
                last_dim_padding = (0, num_missing_samples)
                signal = F.pad(signal, last_dim_padding)

            # Finally all the process has been done and now we will extract mel spectrogram from the signal
            mel = transformation(signal)

            # For pretrained models, we need 3 channel image, so for that we concatenate the extracted mel
            # image = torch.cat([mel, mel, mel])
            
            image = mel

            # Normalized the image
            max_val = torch.abs(image).max()
            image = image / max_val

            # Insert image into model

            # Somehow it needs to go from 3D to 4D
            image = image.unsqueeze(0)

            # To MPS
            image = image.to(device)

            output = model(image)

            prob = F.softmax(output, dim=1)
            top_p, top_class = prob.topk(1, dim = 1)
            
            writer.writerow({'frame' : i,
                             'class': class_names[top_class],
                             'probability': float(top_p)})
            
            if float(top_p) > 0.95:
                print(i, float(top_p), class_names[top_class])

In [25]:
def predict(model, data_loader, device):
    loop = tqdm(data_loader, position=0)
    for mels, labels in loop:
        mels = mels.to(device)
        
        output = model(mels)
        
        prob = F.softmax(output, dim=1)
        top_p, top_class = prob.topk(1, dim = 1)
        
        print(top_p, top_class)
        
        _, preds = torch.max(output, 1)

In [27]:
# model = BirdCLEFResnet().to(config.device)
# model.load_state_dict(torch.load('model_best_more_data.bin'))

model = BirdCLEFEfficientNet().to(config.device)
model.load_state_dict(torch.load('model_4.bin'))
model.eval()

# predict(model, score_loader, config.device)

BirdCLEFEfficientNet(
  (model): EfficientNet(
    (conv_stem): Conv2d(1, 48, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (bn1): BatchNormAct2d(
      48, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True
      (drop): Identity()
      (act): SiLU(inplace=True)
    )
    (blocks): Sequential(
      (0): Sequential(
        (0): DepthwiseSeparableConv(
          (conv_dw): Conv2d(48, 48, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=48, bias=False)
          (bn1): BatchNormAct2d(
            48, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True
            (drop): Identity()
            (act): SiLU(inplace=True)
          )
          (se): SqueezeExcite(
            (conv_reduce): Conv2d(48, 12, kernel_size=(1, 1), stride=(1, 1))
            (act1): SiLU(inplace=True)
            (conv_expand): Conv2d(12, 48, kernel_size=(1, 1), stride=(1, 1))
            (gate): Sigmoid()
          )
          (conv_pw): Conv2d(48, 24, kerne

In [28]:
# Get the list of all files and directories
# sensor = '9_035_217'
sensor = '1_041_209'

path = f"data/recordings/ogg_files/{sensor}"
audio_recordings = os.listdir(path)

audio_recordings_done = [f.replace('csv', 'ogg') for f in os.listdir(f"data/results_3b/{sensor}/")]

audio_recordings_todo = list(set(audio_recordings) - set(audio_recordings_done))
audio_recordings_todo.sort()
audio_recordings_todo

['20221230_143000.ogg',
 '20221230_213000.ogg',
 '20221231_060000.ogg',
 '20221231_143000.ogg',
 '20221231_213000.ogg',
 '20230101_000001.ogg',
 '20230101_060000.ogg',
 '20230101_143000.ogg',
 '20230101_213000.ogg',
 '20230102_000001.ogg',
 '20230102_060000.ogg',
 '20230102_143000.ogg',
 '20230102_213000.ogg',
 '20230103_000001.ogg',
 '20230103_060000.ogg',
 '20230103_213000.ogg',
 '20230104_000001.ogg',
 '20230104_060000.ogg',
 '20230104_143000.ogg',
 '20230104_213000.ogg',
 '20230105_000001.ogg',
 '20230105_060000.ogg',
 '20230105_143000.ogg',
 '20230105_213000.ogg',
 '20230106_000001.ogg',
 '20230106_060000.ogg',
 '20230106_143000.ogg',
 '20230106_213000.ogg',
 '20230107_000001.ogg',
 '20230107_060000.ogg',
 '20230107_143000.ogg',
 '20230107_213000.ogg',
 '20230108_000001.ogg']

In [29]:
generate_model_output('20230103_143000.ogg', sensor, model, config.device)

0 0.9983048439025879 random_other
2 0.9974689483642578 picus_viridis
5 0.9819239974021912 random_other
6 0.9553951025009155 picus_viridis
8 0.9761852622032166 picus_viridis
10 0.9707343578338623 picus_viridis
11 0.9812889099121094 picus_viridis
13 0.9986477494239807 picus_viridis
14 0.9981998205184937 random_other
15 0.993457019329071 picus_viridis
18 0.9725377559661865 picus_viridis
19 0.9983454942703247 picus_viridis
20 0.988653838634491 picus_viridis
21 0.9987242817878723 picus_viridis
22 0.9801102876663208 picus_viridis
23 0.9984299540519714 picus_viridis
24 0.9928951859474182 picus_viridis
25 0.9671839475631714 picus_viridis
28 0.9773991107940674 picus_viridis
29 0.9542649388313293 picus_viridis
31 0.977627694606781 picus_viridis
34 0.9746886491775513 random_other
35 0.9943013191223145 picus_viridis
37 0.9697950482368469 random_other
38 0.9950359463691711 picus_viridis
39 0.9966028928756714 picus_viridis
42 0.984915018081665 picus_viridis
47 0.9925175905227661 picus_viridis
48 0.9

KeyboardInterrupt: 