In [1]:
import os
import random
import torch
import torchaudio
import librosa
import time
import numpy as np
from io import BytesIO
from tqdm import tqdm
from pydub import AudioSegment
from torch import nn, optim
from torch.optim import Adam
from torch.optim.lr_scheduler import ReduceLROnPlateau
from torch.utils.data import Dataset, DataLoader, random_split, WeightedRandomSampler
from torchaudio.transforms import Resample
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from torch.utils.data import random_split
from torchaudio.transforms import Resample
from pydub import AudioSegment
from collections import Counter

In [2]:
import os
import random
import torch
import torchaudio
from torch.utils.data import Dataset, DataLoader, WeightedRandomSampler
from pydub import AudioSegment
from io import BytesIO
import librosa
import numpy as np
from torchaudio.transforms import Resample

class AphasiaDataset(Dataset):
    def __init__(self, root_dir, target_sample_rate=16000, fft_size=512, 
                hop_length=256, win_length=512, min_duration=10, max_duration=30):
        self.root_dir = root_dir
        self.target_sample_rate = target_sample_rate
        self.fft_size = fft_size
        self.hop_length = hop_length
        self.win_length = win_length
        self.min_duration = min_duration * 1000  # конвертируем в миллисекунды
        self.max_duration = max_duration * 1000
        self.data = []

        # Собираем исходные данные
        raw_data = []
        for label, folder in enumerate(["Aphasia", "Norm"]):
            folder_path = os.path.join(root_dir, folder)
            if not os.path.exists(folder_path):
                continue
            for file_name in os.listdir(folder_path):
                if file_name.endswith(".3gp"):
                    file_path = os.path.join(folder_path, file_name)
                    raw_data.append((file_path, label))

        # Обработка и сегментация аудио
        for file_path, label in raw_data:
            try:
                segments = self.process_audio(file_path)
                self.data.extend([(s, label) for s in segments])
            except Exception as e:
                print(f"Error processing {file_path}: {str(e)}")

        # Балансировка классов
        self.balance_classes()
        random.shuffle(self.data)

    def balance_classes(self):
        # Подсчет количества образцов для каждого класса
        class_counts = {}
        for _, label in self.data:
            class_counts[label] = class_counts.get(label, 0) + 1
        
        if len(class_counts) < 2:
            return
            
        # Определение весов для семплера
        weights = [1/class_counts[label] for _, label in self.data]
        sampler = WeightedRandomSampler(weights, len(weights), replacement=True)
        self.sampler = sampler

    def process_audio(self, file_path):
        audio = AudioSegment.from_file(file_path, format="3gp")
        duration = len(audio)  # в миллисекундах
        segments = []

        # Короткие файлы обрабатываем целиком
        if duration < self.min_duration:
            return [self.create_spectrogram(audio)]
            
        # Нарезка на сегменты
        start = 0
        while start + self.min_duration <= duration:
            segment_duration = min(
                random.randint(self.min_duration, self.max_duration),
                duration - start
            )
            end = start + segment_duration
            segment = audio[start:end]
            spectrogram = self.create_spectrogram(segment)
            if spectrogram is not None:
                segments.append(spectrogram)
            start = end  # Следующий сегмент начинается с конца текущего

        return segments

    def create_spectrogram(self, segment):
        try:
            # Конвертация в waveform
            buffer = BytesIO()
            segment.export(buffer, format="wav")
            buffer.seek(0)
            waveform, sample_rate = torchaudio.load(buffer)
            
            # Ресемплинг
            if sample_rate != self.target_sample_rate:
                resampler = Resample(sample_rate, self.target_sample_rate)
                waveform = resampler(waveform)
            
            # Проверка минимальной длины
            if waveform.shape[1] < self.fft_size:
                return None
                
            # Создание спектрограммы
            y = waveform.numpy().squeeze()
            spectrogram = librosa.stft(
                y, 
                n_fft=self.fft_size,
                hop_length=self.hop_length,
                win_length=self.win_length
            )
            mag = np.abs(spectrogram).astype(np.float32)
            return torch.tensor(mag.T).unsqueeze(0)  # (1, T, F)
            
        except Exception as e:
            print(f"Spectrogram error: {str(e)}")
            return None

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        spectrogram, label = self.data[idx]
        return spectrogram, torch.tensor(label, dtype=torch.long)

def pad_sequence(batch):
    # Обработка пустых батчей
    if not batch:
        return torch.zeros(0), torch.zeros(0)
    
    spectrograms, labels = zip(*batch)
    
    # Определение максимальной длины
    max_len = max(s.shape[1] for s in spectrograms)
    freq_bins = spectrograms[0].shape[2]
    
    # Создание паддинг-тензора
    padded = torch.zeros(len(spectrograms), 1, max_len, freq_bins)
    for i, s in enumerate(spectrograms):
        padded[i, :, :s.shape[1], :] = s
        
    return padded, torch.stack(labels)

In [3]:
t = time.time()
dataset = AphasiaDataset("aphasia")
print(f"Время на создание датасета: {time.time() - t}")

Время на создание датасета: 198.43577003479004


было Train samples: 648, Test samples: 162

Повыводил, в среднем примерно от 700 до 1800. Это базовая нарезка(то есть без учета того что может в кусок попатсь молчание)

In [4]:
# Удаляем балансировку из конструктора класса
del dataset.sampler  # если sampler был создан в balance_classes()

# Разделение на train/test БЕЗ использования sampler на этом этапе
total_size = len(dataset)
train_size = int(0.8 * total_size)
test_size = total_size - train_size
train_dataset, test_dataset = random_split(dataset, [train_size, test_size])

# Создаем веса только для тренировочного набора
train_labels = [dataset.data[i][1] for i in train_dataset.indices]
class_counts = Counter(train_labels)

# Проверяем что есть оба класса
if len(class_counts) < 2:
    raise ValueError("Один из классов отсутствует в тренировочном наборе")

class_weights = {label: 1.0 / count for label, count in class_counts.items()}
weights = [class_weights[label] for label in train_labels]

# Создаем sampler только для тренировочного набора
train_sampler = WeightedRandomSampler(weights, num_samples=len(train_dataset), replacement=True)

# Создаем DataLoader'ы
train_dataloader = DataLoader(
    train_dataset,
    batch_size=4,
    sampler=train_sampler,
    collate_fn=pad_sequence,
    drop_last=True  # добавляем для игнорирования последнего неполного батча
)

test_dataloader = DataLoader(
    test_dataset,
    batch_size=4,
    shuffle=False,
    collate_fn=pad_sequence,
    drop_last=True
)

In [5]:
for w, m in train_dataloader:
    print(w.shape, m.shape)
    print(m)
    break

torch.Size([4, 1, 1837, 257]) torch.Size([4])
tensor([0, 0, 0, 1])


In [6]:
print(len(train_dataloader), len(test_dataloader))

583 146


In [7]:
print(total_size)

2917


In [8]:
class TimeDistributed(nn.Module):
    def __init__(self, module, batch_first=True):
        super(TimeDistributed, self).__init__()
        self.module = module
        self.batch_first = batch_first

    def forward(self, input_seq):
        assert len(input_seq.size()) > 2
        reshaped_input = input_seq.contiguous().view(-1, input_seq.size(-1))
        output = self.module(reshaped_input)
        if self.batch_first:
            output = output.contiguous().view(input_seq.size(0), -1, output.size(-1))
        else:
            output = output.contiguous().view(-1, input_seq.size(1), output.size(-1))
        return output


class CNN_BLSTM(nn.Module):
    def __init__(self, num_classes=2):
        super(CNN_BLSTM, self).__init__()
        # CNN
        self.conv1 = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=16, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(16, 16, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(16, 16, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(32, 32, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(32, 32, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv3 = nn.Sequential(
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(64, 64, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(64, 64, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv4 = nn.Sequential(
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(128, 128, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(128, 128, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )

        # BLSTM
        self.blstm1 = nn.LSTM(512, 128, bidirectional=True, batch_first=True)
        self.dropout = nn.Dropout(0.3)

        # Fully Connected
        self.flatten = TimeDistributed(nn.Flatten(), batch_first=True)
        self.dense1 = nn.Sequential(
            TimeDistributed(nn.Linear(in_features=256, out_features=128), batch_first=True),
            nn.ReLU(),
            nn.Dropout(0.3),
        )

        # Final classification layer
        self.final_linear = nn.Linear(128, num_classes)

    def forward(self, forward_input):
        conv1_output = self.conv1(forward_input)
        conv2_output = self.conv2(conv1_output)
        conv3_output = self.conv3(conv2_output)
        conv4_output = self.conv4(conv3_output)

        # Reshape for LSTM
        conv4_output = conv4_output.permute(0, 2, 1, 3)
        conv4_output = torch.reshape(conv4_output, (conv4_output.shape[0], conv4_output.shape[1], 4 * 128))

        # BLSTM
        blstm_output, _ = self.blstm1(conv4_output)
        blstm_output = self.dropout(blstm_output)

        # Fully Connected
        flatten_output = self.flatten(blstm_output)
        fc_output = self.dense1(flatten_output)
        #print(fc_output.shape)
        # Apply final linear layer to the last time step
        logits = self.final_linear(fc_output[:, -1, :])  # [batch_size, num_classes]
  
        return logits  # [batch_size, num_classes]

In [9]:
def evaluate_model(model, dataloader, criterion, device):
    model.eval()
    acc = 0.0
    prec = 0.0
    rec = 0.0

    with torch.no_grad():
        for spectrograms, labels in tqdm(dataloader, desc="Validation"):
            spectrograms = spectrograms.to(device)
            labels = labels.to(device)
            
            outputs = model(spectrograms)
            preds = torch.argmax(outputs, dim=1).cpu().numpy()  # Получаем предсказанные классы
            labels = labels.cpu().numpy()
            #print(preds, labels)
            acc += accuracy_score(labels, preds)
            prec += precision_score(labels, preds, zero_division=1)
            rec += recall_score(labels, preds, zero_division=1)
            #print(acc, prec, rec)

    acc = acc / len(dataloader)
    prec = prec / len(dataloader)
    rec = rec / len(dataloader)

    return acc, prec, rec

In [11]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
num_classes = 2
model = CNN_BLSTM(num_classes).to(device)
criterion = nn.CrossEntropyLoss()  # Используем CrossEntropyLoss для многоклассовой классификации
optimizer = optim.Adam(model.parameters(), lr=1e-4)
num_epochs = 50
#scheduler = ReduceLROnPlateau(optimizer, mode='max', factor=0.5, patience=5, verbose=True)

In [12]:
for epoch in range(1, num_epochs + 1):
    model.train()
    train_loss_list = []
    
    for spectrograms, labels in tqdm(train_dataloader, desc=f"Training Epoch {epoch}"):
        spectrograms = spectrograms.to(device)
        labels = labels.long().to(device)  # Метки должны быть типа long для CrossEntropyLoss

        outputs = model(spectrograms)
        
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        train_loss_list.append(loss.item())

    avg_train_loss = torch.tensor(train_loss_list).mean().item()
    acc, prec, rec = evaluate_model(model, test_dataloader, criterion, device)
    
    #scheduler.step(acc)
    
    print(f"Epoch {epoch}/{num_epochs} - Train Loss: {avg_train_loss:.4f}")
    print(f"Validation Metrics - Accuracy: {acc:.4f}, Precision: {prec:.4f}, Recall: {rec:.4f}")

Training Epoch 1: 100%|█████████████████████████████████████████████████████| 583/583 [01:16<00:00,  7.60it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:07<00:00, 19.98it/s]


Epoch 1/50 - Train Loss: 0.6936
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 2: 100%|█████████████████████████████████████████████████████| 583/583 [01:55<00:00,  5.07it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:07<00:00, 20.03it/s]


Epoch 2/50 - Train Loss: 0.6931
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 3: 100%|█████████████████████████████████████████████████████| 583/583 [01:21<00:00,  7.15it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:07<00:00, 19.23it/s]


Epoch 3/50 - Train Loss: 0.6937
Validation Metrics - Accuracy: 0.1301, Precision: 0.1301, Recall: 1.0000


Training Epoch 4: 100%|█████████████████████████████████████████████████████| 583/583 [01:25<00:00,  6.82it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:07<00:00, 18.29it/s]


Epoch 4/50 - Train Loss: 0.6933
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 5: 100%|█████████████████████████████████████████████████████| 583/583 [01:27<00:00,  6.67it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 17.74it/s]


Epoch 5/50 - Train Loss: 0.6933
Validation Metrics - Accuracy: 0.8476, Precision: 0.8699, Recall: 0.5947


Training Epoch 6: 100%|█████████████████████████████████████████████████████| 583/583 [01:30<00:00,  6.46it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 17.28it/s]


Epoch 6/50 - Train Loss: 0.6932
Validation Metrics - Accuracy: 0.8476, Precision: 0.8973, Recall: 0.5753


Training Epoch 7: 100%|█████████████████████████████████████████████████████| 583/583 [01:31<00:00,  6.40it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.92it/s]


Epoch 7/50 - Train Loss: 0.6905
Validation Metrics - Accuracy: 0.8236, Precision: 0.7671, Recall: 0.5982


Training Epoch 8: 100%|█████████████████████████████████████████████████████| 583/583 [01:34<00:00,  6.19it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.68it/s]


Epoch 8/50 - Train Loss: 0.6877
Validation Metrics - Accuracy: 0.8185, Precision: 0.7397, Recall: 0.6050


Training Epoch 9: 100%|█████████████████████████████████████████████████████| 583/583 [01:37<00:00,  6.00it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.59it/s]


Epoch 9/50 - Train Loss: 0.6816
Validation Metrics - Accuracy: 0.2705, Precision: 0.1427, Recall: 0.9703


Training Epoch 10: 100%|████████████████████████████████████████████████████| 583/583 [01:35<00:00,  6.11it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.60it/s]


Epoch 10/50 - Train Loss: 0.6678
Validation Metrics - Accuracy: 0.2928, Precision: 0.1433, Recall: 0.9532


Training Epoch 11: 100%|████████████████████████████████████████████████████| 583/583 [01:35<00:00,  6.09it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.31it/s]


Epoch 11/50 - Train Loss: 0.6662
Validation Metrics - Accuracy: 0.2825, Precision: 0.1461, Recall: 0.9737


Training Epoch 12: 100%|████████████████████████████████████████████████████| 583/583 [01:36<00:00,  6.03it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 16.18it/s]


Epoch 12/50 - Train Loss: 0.6541
Validation Metrics - Accuracy: 0.2945, Precision: 0.1427, Recall: 0.9532


Training Epoch 13: 100%|████████████████████████████████████████████████████| 583/583 [01:36<00:00,  6.03it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.29it/s]


Epoch 13/50 - Train Loss: 0.6685
Validation Metrics - Accuracy: 0.2774, Precision: 0.1461, Recall: 0.9772


Training Epoch 14: 100%|████████████████████████████████████████████████████| 583/583 [01:37<00:00,  5.95it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 16.11it/s]


Epoch 14/50 - Train Loss: 0.6544
Validation Metrics - Accuracy: 0.2962, Precision: 0.1416, Recall: 0.9463


Training Epoch 15: 100%|████████████████████████████████████████████████████| 583/583 [01:37<00:00,  6.01it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 16.00it/s]


Epoch 15/50 - Train Loss: 0.6569
Validation Metrics - Accuracy: 0.2894, Precision: 0.1404, Recall: 0.9463


Training Epoch 16: 100%|████████████████████████████████████████████████████| 583/583 [01:39<00:00,  5.88it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.63it/s]


Epoch 16/50 - Train Loss: 0.6489
Validation Metrics - Accuracy: 0.2688, Precision: 0.1387, Recall: 0.9555


Training Epoch 17: 100%|████████████████████████████████████████████████████| 583/583 [01:40<00:00,  5.82it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.96it/s]


Epoch 17/50 - Train Loss: 0.6479
Validation Metrics - Accuracy: 0.2791, Precision: 0.1393, Recall: 0.9486


Training Epoch 18: 100%|████████████████████████████████████████████████████| 583/583 [01:42<00:00,  5.67it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.89it/s]


Epoch 18/50 - Train Loss: 0.6437
Validation Metrics - Accuracy: 0.3253, Precision: 0.1473, Recall: 0.9475


Training Epoch 19: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.63it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.86it/s]


Epoch 19/50 - Train Loss: 0.5915
Validation Metrics - Accuracy: 0.8048, Precision: 0.5811, Recall: 0.8893


Training Epoch 20: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.49it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.56it/s]


Epoch 20/50 - Train Loss: 0.5108
Validation Metrics - Accuracy: 0.5993, Precision: 0.2568, Recall: 0.9543


Training Epoch 21: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.57it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.80it/s]


Epoch 21/50 - Train Loss: 0.5166
Validation Metrics - Accuracy: 0.7158, Precision: 0.4304, Recall: 0.8779


Training Epoch 22: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.43it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.75it/s]


Epoch 22/50 - Train Loss: 0.4808
Validation Metrics - Accuracy: 0.8082, Precision: 0.5537, Recall: 0.8847


Training Epoch 23: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.44it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.73it/s]


Epoch 23/50 - Train Loss: 0.4867
Validation Metrics - Accuracy: 0.6747, Precision: 0.3664, Recall: 0.9053


Training Epoch 24: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.49it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.61it/s]


Epoch 24/50 - Train Loss: 0.4494
Validation Metrics - Accuracy: 0.8031, Precision: 0.5776, Recall: 0.9018


Training Epoch 25: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.47it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.38it/s]


Epoch 25/50 - Train Loss: 0.4964
Validation Metrics - Accuracy: 0.7894, Precision: 0.5479, Recall: 0.9212


Training Epoch 26: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.47it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.54it/s]


Epoch 26/50 - Train Loss: 0.4720
Validation Metrics - Accuracy: 0.8750, Precision: 0.7614, Recall: 0.8539


Training Epoch 27: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.45it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.78it/s]


Epoch 27/50 - Train Loss: 0.4305
Validation Metrics - Accuracy: 0.7860, Precision: 0.5126, Recall: 0.8995


Training Epoch 28: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.43it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.68it/s]


Epoch 28/50 - Train Loss: 0.4219
Validation Metrics - Accuracy: 0.8853, Precision: 0.8299, Recall: 0.8139


Training Epoch 29: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.42it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.71it/s]


Epoch 29/50 - Train Loss: 0.4606
Validation Metrics - Accuracy: 0.8904, Precision: 0.9212, Recall: 0.7295


Training Epoch 30: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.43it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.49it/s]


Epoch 30/50 - Train Loss: 0.4595
Validation Metrics - Accuracy: 0.7517, Precision: 0.4669, Recall: 0.8881


Training Epoch 31: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.51it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.92it/s]


Epoch 31/50 - Train Loss: 0.4586
Validation Metrics - Accuracy: 0.6764, Precision: 0.3191, Recall: 0.9406


Training Epoch 32: 100%|████████████████████████████████████████████████████| 583/583 [01:46<00:00,  5.49it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.53it/s]


Epoch 32/50 - Train Loss: 0.4198
Validation Metrics - Accuracy: 0.8425, Precision: 0.6735, Recall: 0.8379


Training Epoch 33: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.63it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.87it/s]


Epoch 33/50 - Train Loss: 0.4263
Validation Metrics - Accuracy: 0.7072, Precision: 0.3864, Recall: 0.9463


Training Epoch 34: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.55it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.81it/s]


Epoch 34/50 - Train Loss: 0.4732
Validation Metrics - Accuracy: 0.8442, Precision: 0.6313, Recall: 0.8995


Training Epoch 35: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.59it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.89it/s]


Epoch 35/50 - Train Loss: 0.4957
Validation Metrics - Accuracy: 0.6610, Precision: 0.3539, Recall: 0.9486


Training Epoch 36: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.64it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.85it/s]


Epoch 36/50 - Train Loss: 0.4388
Validation Metrics - Accuracy: 0.7243, Precision: 0.4247, Recall: 0.9189


Training Epoch 37: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.55it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.91it/s]


Epoch 37/50 - Train Loss: 0.4553
Validation Metrics - Accuracy: 0.8236, Precision: 0.6159, Recall: 0.8779


Training Epoch 38: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.61it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.78it/s]


Epoch 38/50 - Train Loss: 0.4260
Validation Metrics - Accuracy: 0.8545, Precision: 0.6769, Recall: 0.8687


Training Epoch 39: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.60it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.86it/s]


Epoch 39/50 - Train Loss: 0.4257
Validation Metrics - Accuracy: 0.7860, Precision: 0.5325, Recall: 0.9041


Training Epoch 40: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.64it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.61it/s]


Epoch 40/50 - Train Loss: 0.3913
Validation Metrics - Accuracy: 0.8510, Precision: 0.6929, Recall: 0.8584


Training Epoch 41: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.62it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.88it/s]


Epoch 41/50 - Train Loss: 0.4120
Validation Metrics - Accuracy: 0.8099, Precision: 0.5725, Recall: 0.9075


Training Epoch 42: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.62it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.96it/s]


Epoch 42/50 - Train Loss: 0.4276
Validation Metrics - Accuracy: 0.8682, Precision: 0.7397, Recall: 0.8527


Training Epoch 43: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.55it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.78it/s]


Epoch 43/50 - Train Loss: 0.4169
Validation Metrics - Accuracy: 0.8253, Precision: 0.6079, Recall: 0.8847


Training Epoch 44: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.61it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.69it/s]


Epoch 44/50 - Train Loss: 0.4061
Validation Metrics - Accuracy: 0.7620, Precision: 0.4658, Recall: 0.9155


Training Epoch 45: 100%|████████████████████████████████████████████████████| 583/583 [01:44<00:00,  5.58it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.79it/s]


Epoch 45/50 - Train Loss: 0.4221
Validation Metrics - Accuracy: 0.8459, Precision: 0.7078, Recall: 0.7991


Training Epoch 46: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.53it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.58it/s]


Epoch 46/50 - Train Loss: 0.4093
Validation Metrics - Accuracy: 0.8236, Precision: 0.6221, Recall: 0.8893


Training Epoch 47: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.51it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.79it/s]


Epoch 47/50 - Train Loss: 0.4133
Validation Metrics - Accuracy: 0.8664, Precision: 0.7477, Recall: 0.8425


Training Epoch 48: 100%|████████████████████████████████████████████████████| 583/583 [01:48<00:00,  5.37it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.61it/s]


Epoch 48/50 - Train Loss: 0.4044
Validation Metrics - Accuracy: 0.8134, Precision: 0.5833, Recall: 0.9087


Training Epoch 49: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.43it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.65it/s]


Epoch 49/50 - Train Loss: 0.3921
Validation Metrics - Accuracy: 0.8493, Precision: 0.6627, Recall: 0.9041


Training Epoch 50: 100%|████████████████████████████████████████████████████| 583/583 [01:48<00:00,  5.37it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.56it/s]

Epoch 50/50 - Train Loss: 0.4690
Validation Metrics - Accuracy: 0.8271, Precision: 0.6495, Recall: 0.8733





In [13]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
num_classes = 2
model = CNN_BLSTM(num_classes).to(device)
criterion = nn.CrossEntropyLoss()  # Используем CrossEntropyLoss для многоклассовой классификации
optimizer = optim.Adam(model.parameters(), lr=1e-4)
num_epochs = 70
#scheduler = ReduceLROnPlateau(optimizer, mode='max', factor=0.5, patience=5, verbose=True)

In [14]:
for epoch in range(1, num_epochs + 1):
    model.train()
    train_loss_list = []
    
    for spectrograms, labels in tqdm(train_dataloader, desc=f"Training Epoch {epoch}"):
        spectrograms = spectrograms.to(device)
        labels = labels.long().to(device)  # Метки должны быть типа long для CrossEntropyLoss

        outputs = model(spectrograms)
        
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        train_loss_list.append(loss.item())

    avg_train_loss = torch.tensor(train_loss_list).mean().item()
    acc, prec, rec = evaluate_model(model, test_dataloader, criterion, device)
    
    #scheduler.step(acc)
    
    print(f"Epoch {epoch}/{num_epochs} - Train Loss: {avg_train_loss:.4f}")
    print(f"Validation Metrics - Accuracy: {acc:.4f}, Precision: {prec:.4f}, Recall: {rec:.4f}")

Training Epoch 1: 100%|█████████████████████████████████████████████████████| 583/583 [01:20<00:00,  7.27it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:07<00:00, 19.14it/s]


Epoch 1/70 - Train Loss: 0.6935
Validation Metrics - Accuracy: 0.1301, Precision: 0.1301, Recall: 1.0000


Training Epoch 2: 100%|█████████████████████████████████████████████████████| 583/583 [01:23<00:00,  6.98it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 17.46it/s]


Epoch 2/70 - Train Loss: 0.6929
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 3: 100%|█████████████████████████████████████████████████████| 583/583 [01:31<00:00,  6.38it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.88it/s]


Epoch 3/70 - Train Loss: 0.6934
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 4: 100%|█████████████████████████████████████████████████████| 583/583 [01:33<00:00,  6.24it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.46it/s]


Epoch 4/70 - Train Loss: 0.6935
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 5: 100%|█████████████████████████████████████████████████████| 583/583 [01:38<00:00,  5.95it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:08<00:00, 16.25it/s]


Epoch 5/70 - Train Loss: 0.6935
Validation Metrics - Accuracy: 0.8425, Precision: 0.8767, Recall: 0.5753


Training Epoch 6: 100%|█████████████████████████████████████████████████████| 583/583 [01:36<00:00,  6.01it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 16.17it/s]


Epoch 6/70 - Train Loss: 0.6935
Validation Metrics - Accuracy: 0.8613, Precision: 0.9589, Recall: 0.5685


Training Epoch 7: 100%|█████████████████████████████████████████████████████| 583/583 [01:36<00:00,  6.02it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 16.05it/s]


Epoch 7/70 - Train Loss: 0.6928
Validation Metrics - Accuracy: 0.8493, Precision: 0.8767, Recall: 0.5947


Training Epoch 8: 100%|█████████████████████████████████████████████████████| 583/583 [01:40<00:00,  5.81it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.78it/s]


Epoch 8/70 - Train Loss: 0.6919
Validation Metrics - Accuracy: 0.2277, Precision: 0.1381, Recall: 0.9772


Training Epoch 9: 100%|█████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.62it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.53it/s]


Epoch 9/70 - Train Loss: 0.6847
Validation Metrics - Accuracy: 0.2603, Precision: 0.1393, Recall: 0.9703


Training Epoch 10: 100%|████████████████████████████████████████████████████| 583/583 [01:43<00:00,  5.64it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.01it/s]


Epoch 10/70 - Train Loss: 0.6757
Validation Metrics - Accuracy: 0.2466, Precision: 0.1404, Recall: 0.9703


Training Epoch 11: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.53it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.26it/s]


Epoch 11/70 - Train Loss: 0.6684
Validation Metrics - Accuracy: 0.3014, Precision: 0.1455, Recall: 0.9703


Training Epoch 12: 100%|████████████████████████████████████████████████████| 583/583 [01:45<00:00,  5.51it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.78it/s]


Epoch 12/70 - Train Loss: 0.6631
Validation Metrics - Accuracy: 0.3134, Precision: 0.1450, Recall: 0.9566


Training Epoch 13: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.42it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.06it/s]


Epoch 13/70 - Train Loss: 0.6628
Validation Metrics - Accuracy: 0.2877, Precision: 0.1444, Recall: 0.9658


Training Epoch 14: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.33it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 15.09it/s]


Epoch 14/70 - Train Loss: 0.6682
Validation Metrics - Accuracy: 0.2928, Precision: 0.1438, Recall: 0.9635


Training Epoch 15: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.33it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.71it/s]


Epoch 15/70 - Train Loss: 0.6694
Validation Metrics - Accuracy: 0.3116, Precision: 0.1438, Recall: 0.9475


Training Epoch 16: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.28it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.55it/s]


Epoch 16/70 - Train Loss: 0.6560
Validation Metrics - Accuracy: 0.3065, Precision: 0.1433, Recall: 0.9498


Training Epoch 17: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.29it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.51it/s]


Epoch 17/70 - Train Loss: 0.6692
Validation Metrics - Accuracy: 0.6541, Precision: 0.3259, Recall: 0.7454


Training Epoch 18: 100%|████████████████████████████████████████████████████| 583/583 [01:48<00:00,  5.38it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.38it/s]


Epoch 18/70 - Train Loss: 0.6980
Validation Metrics - Accuracy: 0.8305, Precision: 0.7877, Recall: 0.6050


Training Epoch 19: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.32it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.43it/s]


Epoch 19/70 - Train Loss: 0.6964
Validation Metrics - Accuracy: 0.1301, Precision: 0.1301, Recall: 1.0000


Training Epoch 20: 100%|████████████████████████████████████████████████████| 583/583 [01:47<00:00,  5.44it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.88it/s]


Epoch 20/70 - Train Loss: 0.6934
Validation Metrics - Accuracy: 0.8253, Precision: 0.7842, Recall: 0.6016


Training Epoch 21: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.28it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.63it/s]


Epoch 21/70 - Train Loss: 0.6818
Validation Metrics - Accuracy: 0.7637, Precision: 0.5856, Recall: 0.7192


Training Epoch 22: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.28it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.43it/s]


Epoch 22/70 - Train Loss: 0.6939
Validation Metrics - Accuracy: 0.8596, Precision: 0.9521, Recall: 0.5651


Training Epoch 23: 100%|████████████████████████████████████████████████████| 583/583 [01:48<00:00,  5.38it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.74it/s]


Epoch 23/70 - Train Loss: 0.6958
Validation Metrics - Accuracy: 0.8459, Precision: 0.8767, Recall: 0.5879


Training Epoch 24: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.27it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.69it/s]


Epoch 24/70 - Train Loss: 0.6924
Validation Metrics - Accuracy: 0.3990, Precision: 0.1313, Recall: 0.8288


Training Epoch 25: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.29it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.66it/s]


Epoch 25/70 - Train Loss: 0.6872
Validation Metrics - Accuracy: 0.2380, Precision: 0.1370, Recall: 0.9772


Training Epoch 26: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.28it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.45it/s]


Epoch 26/70 - Train Loss: 0.6891
Validation Metrics - Accuracy: 0.7140, Precision: 0.4640, Recall: 0.7215


Training Epoch 27: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.22it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.42it/s]


Epoch 27/70 - Train Loss: 0.6806
Validation Metrics - Accuracy: 0.7038, Precision: 0.4258, Recall: 0.7409


Training Epoch 28: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.24it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.63it/s]


Epoch 28/70 - Train Loss: 0.6893
Validation Metrics - Accuracy: 0.8253, Precision: 0.7568, Recall: 0.6187


Training Epoch 29: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.33it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.50it/s]


Epoch 29/70 - Train Loss: 0.6984
Validation Metrics - Accuracy: 0.7791, Precision: 0.5651, Recall: 0.6256


Training Epoch 30: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.22it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.51it/s]


Epoch 30/70 - Train Loss: 0.6945
Validation Metrics - Accuracy: 0.7842, Precision: 0.5925, Recall: 0.6187


Training Epoch 31: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.28it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.54it/s]


Epoch 31/70 - Train Loss: 0.6984
Validation Metrics - Accuracy: 0.7911, Precision: 0.6199, Recall: 0.6187


Training Epoch 32: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.27it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.46it/s]


Epoch 32/70 - Train Loss: 0.6953
Validation Metrics - Accuracy: 0.7842, Precision: 0.5925, Recall: 0.6187


Training Epoch 33: 100%|████████████████████████████████████████████████████| 583/583 [01:52<00:00,  5.19it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.50it/s]


Epoch 33/70 - Train Loss: 0.6948
Validation Metrics - Accuracy: 0.7979, Precision: 0.6404, Recall: 0.6256


Training Epoch 34: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.34it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.70it/s]


Epoch 34/70 - Train Loss: 0.6951
Validation Metrics - Accuracy: 0.8373, Precision: 0.8185, Recall: 0.6050


Training Epoch 35: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.31it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.46it/s]


Epoch 35/70 - Train Loss: 0.6936
Validation Metrics - Accuracy: 0.8356, Precision: 0.8116, Recall: 0.6050


Training Epoch 36: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.31it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.38it/s]


Epoch 36/70 - Train Loss: 0.6942
Validation Metrics - Accuracy: 0.1301, Precision: 0.1301, Recall: 1.0000


Training Epoch 37: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.32it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.67it/s]


Epoch 37/70 - Train Loss: 0.6954
Validation Metrics - Accuracy: 0.8236, Precision: 0.7568, Recall: 0.6119


Training Epoch 38: 100%|████████████████████████████████████████████████████| 583/583 [01:52<00:00,  5.20it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.86it/s]


Epoch 38/70 - Train Loss: 0.6947
Validation Metrics - Accuracy: 0.8682, Precision: 0.9863, Recall: 0.5685


Training Epoch 39: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.23it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.42it/s]


Epoch 39/70 - Train Loss: 0.6950
Validation Metrics - Accuracy: 0.2500, Precision: 0.1410, Recall: 0.9772


Training Epoch 40: 100%|████████████████████████████████████████████████████| 583/583 [01:49<00:00,  5.30it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.39it/s]


Epoch 40/70 - Train Loss: 0.6933
Validation Metrics - Accuracy: 0.2962, Precision: 0.1376, Recall: 0.9338


Training Epoch 41: 100%|████████████████████████████████████████████████████| 583/583 [01:50<00:00,  5.27it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.51it/s]


Epoch 41/70 - Train Loss: 0.6951
Validation Metrics - Accuracy: 0.8716, Precision: 1.0000, Recall: 0.5685


Training Epoch 42: 100%|████████████████████████████████████████████████████| 583/583 [01:48<00:00,  5.36it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.23it/s]


Epoch 42/70 - Train Loss: 0.6917
Validation Metrics - Accuracy: 0.2997, Precision: 0.1376, Recall: 0.9269


Training Epoch 43: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.24it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.36it/s]


Epoch 43/70 - Train Loss: 0.6928
Validation Metrics - Accuracy: 0.3185, Precision: 0.1370, Recall: 0.9132


Training Epoch 44: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.15it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.41it/s]


Epoch 44/70 - Train Loss: 0.6919
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 45: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.22it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.36it/s]


Epoch 45/70 - Train Loss: 0.6920
Validation Metrics - Accuracy: 0.3202, Precision: 0.1393, Recall: 0.9201


Training Epoch 46: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.12it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.25it/s]


Epoch 46/70 - Train Loss: 0.6889
Validation Metrics - Accuracy: 0.3202, Precision: 0.1387, Recall: 0.9201


Training Epoch 47: 100%|████████████████████████████████████████████████████| 583/583 [01:54<00:00,  5.10it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.39it/s]


Epoch 47/70 - Train Loss: 0.6924
Validation Metrics - Accuracy: 0.3065, Precision: 0.1381, Recall: 0.9269


Training Epoch 48: 100%|████████████████████████████████████████████████████| 583/583 [01:51<00:00,  5.22it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.23it/s]


Epoch 48/70 - Train Loss: 0.6892
Validation Metrics - Accuracy: 0.3116, Precision: 0.1353, Recall: 0.9132


Training Epoch 49: 100%|████████████████████████████████████████████████████| 583/583 [01:52<00:00,  5.19it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.38it/s]


Epoch 49/70 - Train Loss: 0.6916
Validation Metrics - Accuracy: 0.3082, Precision: 0.1376, Recall: 0.9201


Training Epoch 50: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.12it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:09<00:00, 14.74it/s]


Epoch 50/70 - Train Loss: 0.6895
Validation Metrics - Accuracy: 0.3031, Precision: 0.1381, Recall: 0.9269


Training Epoch 51: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.14it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.19it/s]


Epoch 51/70 - Train Loss: 0.6885
Validation Metrics - Accuracy: 0.3099, Precision: 0.1376, Recall: 0.9201


Training Epoch 52: 100%|████████████████████████████████████████████████████| 583/583 [01:52<00:00,  5.20it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.46it/s]


Epoch 52/70 - Train Loss: 0.6871
Validation Metrics - Accuracy: 0.3014, Precision: 0.1364, Recall: 0.9201


Training Epoch 53: 100%|████████████████████████████████████████████████████| 583/583 [01:54<00:00,  5.08it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.03it/s]


Epoch 53/70 - Train Loss: 0.6868
Validation Metrics - Accuracy: 0.3151, Precision: 0.1364, Recall: 0.9132


Training Epoch 54: 100%|████████████████████████████████████████████████████| 583/583 [01:54<00:00,  5.10it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.39it/s]


Epoch 54/70 - Train Loss: 0.6873
Validation Metrics - Accuracy: 0.3048, Precision: 0.1364, Recall: 0.9201


Training Epoch 55: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.12it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.13it/s]


Epoch 55/70 - Train Loss: 0.6858
Validation Metrics - Accuracy: 0.3014, Precision: 0.1341, Recall: 0.9132


Training Epoch 56: 100%|████████████████████████████████████████████████████| 583/583 [01:55<00:00,  5.04it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.12it/s]


Epoch 56/70 - Train Loss: 0.6850
Validation Metrics - Accuracy: 0.3048, Precision: 0.1347, Recall: 0.9132


Training Epoch 57: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  4.98it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.92it/s]


Epoch 57/70 - Train Loss: 0.6901
Validation Metrics - Accuracy: 0.3014, Precision: 0.1381, Recall: 0.9269


Training Epoch 58: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  5.02it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.79it/s]


Epoch 58/70 - Train Loss: 0.6855
Validation Metrics - Accuracy: 0.3082, Precision: 0.1347, Recall: 0.9132


Training Epoch 59: 100%|████████████████████████████████████████████████████| 583/583 [01:58<00:00,  4.92it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.61it/s]


Epoch 59/70 - Train Loss: 0.6869
Validation Metrics - Accuracy: 0.3099, Precision: 0.1353, Recall: 0.9132


Training Epoch 60: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  5.01it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.33it/s]


Epoch 60/70 - Train Loss: 0.6922
Validation Metrics - Accuracy: 0.3116, Precision: 0.1353, Recall: 0.9132


Training Epoch 61: 100%|████████████████████████████████████████████████████| 583/583 [01:58<00:00,  4.91it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.61it/s]


Epoch 61/70 - Train Loss: 0.6873
Validation Metrics - Accuracy: 0.3116, Precision: 0.1353, Recall: 0.9132


Training Epoch 62: 100%|████████████████████████████████████████████████████| 583/583 [01:58<00:00,  4.92it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.03it/s]


Epoch 62/70 - Train Loss: 0.6836
Validation Metrics - Accuracy: 0.3031, Precision: 0.1370, Recall: 0.9235


Training Epoch 63: 100%|████████████████████████████████████████████████████| 583/583 [01:58<00:00,  4.94it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.81it/s]


Epoch 63/70 - Train Loss: 0.6841
Validation Metrics - Accuracy: 0.8699, Precision: 1.0000, Recall: 0.5616


Training Epoch 64: 100%|████████████████████████████████████████████████████| 583/583 [01:55<00:00,  5.04it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.91it/s]


Epoch 64/70 - Train Loss: 0.6784
Validation Metrics - Accuracy: 0.3048, Precision: 0.1393, Recall: 0.9304


Training Epoch 65: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  5.01it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.73it/s]


Epoch 65/70 - Train Loss: 0.6710
Validation Metrics - Accuracy: 0.3065, Precision: 0.1398, Recall: 0.9304


Training Epoch 66: 100%|████████████████████████████████████████████████████| 583/583 [01:55<00:00,  5.05it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.93it/s]


Epoch 66/70 - Train Loss: 0.6792
Validation Metrics - Accuracy: 0.6524, Precision: 0.3219, Recall: 0.8231


Training Epoch 67: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  4.99it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 13.99it/s]


Epoch 67/70 - Train Loss: 0.6864
Validation Metrics - Accuracy: 0.3014, Precision: 0.1364, Recall: 0.9235


Training Epoch 68: 100%|████████████████████████████████████████████████████| 583/583 [01:53<00:00,  5.12it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.04it/s]


Epoch 68/70 - Train Loss: 0.6780
Validation Metrics - Accuracy: 0.2894, Precision: 0.1376, Recall: 0.9304


Training Epoch 69: 100%|████████████████████████████████████████████████████| 583/583 [01:56<00:00,  5.02it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.34it/s]


Epoch 69/70 - Train Loss: 0.6869
Validation Metrics - Accuracy: 0.3065, Precision: 0.1364, Recall: 0.9167


Training Epoch 70: 100%|████████████████████████████████████████████████████| 583/583 [01:54<00:00,  5.08it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 146/146 [00:10<00:00, 14.35it/s]

Epoch 70/70 - Train Loss: 0.6805
Validation Metrics - Accuracy: 0.3082, Precision: 0.1427, Recall: 0.9395





Теперь попробуем с разбиением Захара

In [6]:
import pandas as pd
df = pd.read_csv("splited_data/train_filenames.csv")
df

Unnamed: 0,file_name,label
0,N-0919-RAT-1-bike.wav,0
1,N-0919-RAT-1-robb.wav,0
2,N-0927-RAT-1-robb.wav,0
3,N-0927-RAT-1-bike.wav,0
4,N-0926-RAT-1-bike.wav,0
...,...,...
467,A-396-RAT-1-robb.wav,1
468,A-473-RAT-4-bike.wav,1
469,A-473-RAT-1-robb.wav,1
470,A-473-RAT-1-bike.wav,1


In [11]:
import os
import random
import torch
import pandas as pd
import torchaudio
from torch.utils.data import Dataset, DataLoader, WeightedRandomSampler
from pydub import AudioSegment
from io import BytesIO
import librosa
import numpy as np
from torchaudio.transforms import Resample
from collections import Counter

class AphasiaDataset(Dataset):
    def __init__(self, csv_file, root_dir, target_sample_rate=16000, fft_size=512, 
                 hop_length=256, win_length=512, min_duration=10, max_duration=30):
        self.root_dir = root_dir
        self.target_sample_rate = target_sample_rate
        self.fft_size = fft_size
        self.hop_length = hop_length
        self.win_length = win_length
        self.min_duration = min_duration * 1000  # конвертируем в миллисекунды
        self.max_duration = max_duration * 1000
        self.data = []

        # Загружаем список файлов из CSV
        df = pd.read_csv(csv_file)

        # Обработка и сегментация аудио
        for _, row in df.iterrows():
            file_name, label = row['file_name'], row['label']
            file_path = self.find_audio_file(file_name, label)
            if file_path:
                try:
                    segments = self.process_audio(file_path)
                    self.data.extend([(s, label) for s in segments])
                except Exception as e:
                    print(f"Error processing {file_path}: {str(e)}")
        
        random.shuffle(self.data)
    
    def find_audio_file(self, file_name, label):
        """Ищем файл в соответствующей папке по метке"""
        folder = "Aphasia" if label == 1 else "Norm"
        file_name = file_name[:-4]
        file_path = os.path.join(self.root_dir, folder, f"{file_name}.3gp")  # Убрано ".wav"
        if os.path.exists(file_path):
            return file_path
        print(f"Warning: {file_name}.3gp not found in {folder} folder.")
        return None

    def process_audio(self, file_path):
        audio = AudioSegment.from_file(file_path, format="3gp")
        duration = len(audio)  # в миллисекундах
        segments = []

        if duration < self.min_duration:
            return [self.create_spectrogram(audio)]

        start = 0
        while start + self.min_duration <= duration:
            segment_duration = min(random.randint(self.min_duration, self.max_duration), duration - start)
            end = start + segment_duration
            segment = audio[start:end]
            spectrogram = self.create_spectrogram(segment)
            if spectrogram is not None:
                segments.append(spectrogram)
            start = end
        return segments

    def create_spectrogram(self, segment):
        try:
            buffer = BytesIO()
            segment.export(buffer, format="wav")
            buffer.seek(0)
            waveform, sample_rate = torchaudio.load(buffer)
            
            if sample_rate != self.target_sample_rate:
                resampler = Resample(sample_rate, self.target_sample_rate)
                waveform = resampler(waveform)
            
            if waveform.shape[1] < self.fft_size:
                return None
            
            y = waveform.numpy().squeeze()
            spectrogram = librosa.stft(y, n_fft=self.fft_size, hop_length=self.hop_length, win_length=self.win_length)
            mag = np.abs(spectrogram).astype(np.float32)
            return torch.tensor(mag.T).unsqueeze(0)  # (1, T, F)
        except Exception as e:
            print(f"Spectrogram error: {str(e)}")
            return None

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        spectrogram, label = self.data[idx]
        return spectrogram, torch.tensor(label, dtype=torch.long)

def pad_sequence(batch):
    if not batch:
        return torch.zeros(0), torch.zeros(0)
    
    spectrograms, labels = zip(*batch)
    max_len = max(s.shape[1] for s in spectrograms)
    freq_bins = spectrograms[0].shape[2]
    
    padded = torch.zeros(len(spectrograms), 1, max_len, freq_bins)
    for i, s in enumerate(spectrograms):
        padded[i, :, :s.shape[1], :] = s
    
    return padded, torch.stack(labels) 


In [12]:
root_dir = "aphasia"
train_dataset = AphasiaDataset("splited_data/train_filenames.csv", root_dir)
test_dataset = AphasiaDataset("splited_data/test_filenames.csv", root_dir)
val_dataset = AphasiaDataset("splited_data/val_filenames.csv", root_dir)

# Балансировка классов для train
train_labels = [label for _, label in train_dataset.data]
class_counts = Counter(train_labels)
if len(class_counts) < 2:
    raise ValueError("Один из классов отсутствует в тренировочном наборе")

class_weights = {label: 1.0 / count for label, count in class_counts.items()}
weights = [class_weights[label] for _, label in train_dataset.data]
train_sampler = WeightedRandomSampler(weights, num_samples=len(train_dataset), replacement=True)

# DataLoader'ы
train_dataloader = DataLoader(train_dataset, batch_size=4, sampler=train_sampler, collate_fn=pad_sequence, drop_last=True)
test_dataloader = DataLoader(test_dataset, batch_size=4, shuffle=False, collate_fn=pad_sequence, drop_last=True)
val_dataloader = DataLoader(val_dataset, batch_size=4, shuffle=False, collate_fn=pad_sequence, drop_last=True)


In [14]:
print(len(train_dataloader), len(test_dataloader))

415 160


In [16]:
class TimeDistributed(nn.Module):
    def __init__(self, module, batch_first=True):
        super(TimeDistributed, self).__init__()
        self.module = module
        self.batch_first = batch_first

    def forward(self, input_seq):
        assert len(input_seq.size()) > 2
        reshaped_input = input_seq.contiguous().view(-1, input_seq.size(-1))
        output = self.module(reshaped_input)
        if self.batch_first:
            output = output.contiguous().view(input_seq.size(0), -1, output.size(-1))
        else:
            output = output.contiguous().view(-1, input_seq.size(1), output.size(-1))
        return output


class CNN_BLSTM(nn.Module):
    def __init__(self, num_classes=2):
        super(CNN_BLSTM, self).__init__()
        # CNN
        self.conv1 = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=16, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(16, 16, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(16, 16, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(32, 32, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(32, 32, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv3 = nn.Sequential(
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(64, 64, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(64, 64, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )
        self.conv4 = nn.Sequential(
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=(3, 3), stride=(1, 1), padding=1),
            nn.ReLU(),
            nn.Conv2d(128, 128, (3, 3), (1, 1), 1),
            nn.ReLU(),
            nn.Conv2d(128, 128, (3, 3), (1, 3), 1),
            nn.ReLU(),
        )

        # BLSTM
        self.blstm1 = nn.LSTM(512, 128, bidirectional=True, batch_first=True)
        self.dropout = nn.Dropout(0.3)

        # Fully Connected
        self.flatten = TimeDistributed(nn.Flatten(), batch_first=True)
        self.dense1 = nn.Sequential(
            TimeDistributed(nn.Linear(in_features=256, out_features=128), batch_first=True),
            nn.ReLU(),
            nn.Dropout(0.3),
        )

        # Final classification layer
        self.final_linear = nn.Linear(128, num_classes)

    def forward(self, forward_input):
        conv1_output = self.conv1(forward_input)
        conv2_output = self.conv2(conv1_output)
        conv3_output = self.conv3(conv2_output)
        conv4_output = self.conv4(conv3_output)

        # Reshape for LSTM
        conv4_output = conv4_output.permute(0, 2, 1, 3)
        conv4_output = torch.reshape(conv4_output, (conv4_output.shape[0], conv4_output.shape[1], 4 * 128))

        # BLSTM
        blstm_output, _ = self.blstm1(conv4_output)
        blstm_output = self.dropout(blstm_output)

        # Fully Connected
        flatten_output = self.flatten(blstm_output)
        fc_output = self.dense1(flatten_output)
        #print(fc_output.shape)
        # Apply final linear layer to the last time step
        logits = self.final_linear(fc_output[:, -1, :])  # [batch_size, num_classes]
  
        return logits  # [batch_size, num_classes]

In [17]:
def evaluate_model(model, dataloader, criterion, device):
    model.eval()
    acc = 0.0
    prec = 0.0
    rec = 0.0

    with torch.no_grad():
        for spectrograms, labels in tqdm(dataloader, desc="Validation"):
            spectrograms = spectrograms.to(device)
            labels = labels.to(device)
            
            outputs = model(spectrograms)
            preds = torch.argmax(outputs, dim=1).cpu().numpy()  # Получаем предсказанные классы
            labels = labels.cpu().numpy()
            #print(preds, labels)
            acc += accuracy_score(labels, preds)
            prec += precision_score(labels, preds, zero_division=1)
            rec += recall_score(labels, preds, zero_division=1)
            #print(acc, prec, rec)

    acc = acc / len(dataloader)
    prec = prec / len(dataloader)
    rec = rec / len(dataloader)

    return acc, prec, rec

In [18]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
num_classes = 2
model = CNN_BLSTM(num_classes).to(device)
criterion = nn.CrossEntropyLoss()  # Используем CrossEntropyLoss для многоклассовой классификации
optimizer = optim.Adam(model.parameters(), lr=1e-4)
num_epochs = 50
#scheduler = ReduceLROnPlateau(optimizer, mode='max', factor=0.5, patience=5, verbose=True)

In [19]:
for epoch in range(1, num_epochs + 1):
    model.train()
    train_loss_list = []
    
    for spectrograms, labels in tqdm(train_dataloader, desc=f"Training Epoch {epoch}"):
        spectrograms = spectrograms.to(device)
        labels = labels.long().to(device)  # Метки должны быть типа long для CrossEntropyLoss

        outputs = model(spectrograms)
        
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        train_loss_list.append(loss.item())

    avg_train_loss = torch.tensor(train_loss_list).mean().item()
    acc, prec, rec = evaluate_model(model, test_dataloader, criterion, device)
    
    #scheduler.step(acc)
    
    print(f"Epoch {epoch}/{num_epochs} - Train Loss: {avg_train_loss:.4f}")
    print(f"Validation Metrics - Accuracy: {acc:.4f}, Precision: {prec:.4f}, Recall: {rec:.4f}")

Training Epoch 1: 100%|█████████████████████████████████████████████████████| 415/415 [00:56<00:00,  7.36it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:08<00:00, 19.77it/s]


Epoch 1/50 - Train Loss: 0.6931
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 2: 100%|█████████████████████████████████████████████████████| 415/415 [00:58<00:00,  7.14it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:08<00:00, 19.41it/s]


Epoch 2/50 - Train Loss: 0.6931
Validation Metrics - Accuracy: 0.8516, Precision: 0.8516, Recall: 1.0000


Training Epoch 3: 100%|█████████████████████████████████████████████████████| 415/415 [01:02<00:00,  6.66it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 17.56it/s]


Epoch 3/50 - Train Loss: 0.6931
Validation Metrics - Accuracy: 0.8516, Precision: 0.8516, Recall: 1.0000


Training Epoch 4: 100%|█████████████████████████████████████████████████████| 415/415 [01:07<00:00,  6.15it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 16.71it/s]


Epoch 4/50 - Train Loss: 0.6936
Validation Metrics - Accuracy: 0.8516, Precision: 0.8516, Recall: 1.0000


Training Epoch 5: 100%|█████████████████████████████████████████████████████| 415/415 [01:08<00:00,  6.04it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 16.41it/s]


Epoch 5/50 - Train Loss: 0.6933
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 6: 100%|█████████████████████████████████████████████████████| 415/415 [01:10<00:00,  5.89it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 16.33it/s]


Epoch 6/50 - Train Loss: 0.6935
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 7: 100%|█████████████████████████████████████████████████████| 415/415 [01:11<00:00,  5.83it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 16.30it/s]


Epoch 7/50 - Train Loss: 0.6933
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 8: 100%|█████████████████████████████████████████████████████| 415/415 [01:10<00:00,  5.89it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:09<00:00, 16.21it/s]


Epoch 8/50 - Train Loss: 0.6936
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 9: 100%|█████████████████████████████████████████████████████| 415/415 [01:09<00:00,  5.93it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.80it/s]


Epoch 9/50 - Train Loss: 0.6936
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 10: 100%|████████████████████████████████████████████████████| 415/415 [01:14<00:00,  5.54it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.58it/s]


Epoch 10/50 - Train Loss: 0.6915
Validation Metrics - Accuracy: 0.1484, Precision: 1.0000, Recall: 0.0000


Training Epoch 11: 100%|████████████████████████████████████████████████████| 415/415 [01:13<00:00,  5.61it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.89it/s]


Epoch 11/50 - Train Loss: 0.6928
Validation Metrics - Accuracy: 0.8203, Precision: 0.8562, Recall: 0.9516


Training Epoch 12: 100%|████████████████████████████████████████████████████| 415/415 [01:14<00:00,  5.56it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.51it/s]


Epoch 12/50 - Train Loss: 0.6889
Validation Metrics - Accuracy: 0.8422, Precision: 0.8552, Recall: 0.9823


Training Epoch 13: 100%|████████████████████████████████████████████████████| 415/415 [01:13<00:00,  5.62it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.56it/s]


Epoch 13/50 - Train Loss: 0.6905
Validation Metrics - Accuracy: 0.8406, Precision: 0.8573, Recall: 0.9771


Training Epoch 14: 100%|████████████████████████████████████████████████████| 415/415 [01:14<00:00,  5.59it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.34it/s]


Epoch 14/50 - Train Loss: 0.6856
Validation Metrics - Accuracy: 0.3312, Precision: 0.9344, Recall: 0.2427


Training Epoch 15: 100%|████████████████████████████████████████████████████| 415/415 [01:16<00:00,  5.44it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.11it/s]


Epoch 15/50 - Train Loss: 0.6892
Validation Metrics - Accuracy: 0.8438, Precision: 0.8552, Recall: 0.9839


Training Epoch 16: 100%|████████████████████████████████████████████████████| 415/415 [01:16<00:00,  5.46it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.25it/s]


Epoch 16/50 - Train Loss: 0.6805
Validation Metrics - Accuracy: 0.3141, Precision: 0.9437, Recall: 0.2208


Training Epoch 17: 100%|████████████████████████████████████████████████████| 415/415 [01:17<00:00,  5.36it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.86it/s]


Epoch 17/50 - Train Loss: 0.6765
Validation Metrics - Accuracy: 0.3125, Precision: 0.9500, Recall: 0.2161


Training Epoch 18: 100%|████████████████████████████████████████████████████| 415/415 [01:18<00:00,  5.27it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 15.18it/s]


Epoch 18/50 - Train Loss: 0.6696
Validation Metrics - Accuracy: 0.3203, Precision: 0.9656, Recall: 0.2135


Training Epoch 19: 100%|████████████████████████████████████████████████████| 415/415 [01:18<00:00,  5.26it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.91it/s]


Epoch 19/50 - Train Loss: 0.6680
Validation Metrics - Accuracy: 0.3391, Precision: 0.9094, Recall: 0.2568


Training Epoch 20: 100%|████████████████████████████████████████████████████| 415/415 [01:18<00:00,  5.26it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.63it/s]


Epoch 20/50 - Train Loss: 0.6748
Validation Metrics - Accuracy: 0.3500, Precision: 0.9094, Recall: 0.2688


Training Epoch 21: 100%|████████████████████████████████████████████████████| 415/415 [01:19<00:00,  5.22it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.67it/s]


Epoch 21/50 - Train Loss: 0.6556
Validation Metrics - Accuracy: 0.3500, Precision: 0.9406, Recall: 0.2552


Training Epoch 22: 100%|████████████████████████████████████████████████████| 415/415 [01:20<00:00,  5.13it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.38it/s]


Epoch 22/50 - Train Loss: 0.6518
Validation Metrics - Accuracy: 0.3484, Precision: 0.9000, Recall: 0.2703


Training Epoch 23: 100%|████████████████████████████████████████████████████| 415/415 [01:19<00:00,  5.23it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.79it/s]


Epoch 23/50 - Train Loss: 0.6670
Validation Metrics - Accuracy: 0.3516, Precision: 0.9219, Recall: 0.2672


Training Epoch 24: 100%|████████████████████████████████████████████████████| 415/415 [01:20<00:00,  5.16it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.20it/s]


Epoch 24/50 - Train Loss: 0.6464
Validation Metrics - Accuracy: 0.3641, Precision: 0.9094, Recall: 0.2859


Training Epoch 25: 100%|████████████████████████████████████████████████████| 415/415 [01:21<00:00,  5.11it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.18it/s]


Epoch 25/50 - Train Loss: 0.6466
Validation Metrics - Accuracy: 0.3422, Precision: 0.9406, Recall: 0.2510


Training Epoch 26: 100%|████████████████████████████████████████████████████| 415/415 [01:22<00:00,  5.01it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:10<00:00, 14.60it/s]


Epoch 26/50 - Train Loss: 0.6527
Validation Metrics - Accuracy: 0.8406, Precision: 0.8818, Recall: 0.9385


Training Epoch 27: 100%|████████████████████████████████████████████████████| 415/415 [01:24<00:00,  4.90it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.18it/s]


Epoch 27/50 - Train Loss: 0.6588
Validation Metrics - Accuracy: 0.8500, Precision: 0.8547, Recall: 0.9927


Training Epoch 28: 100%|████████████████████████████████████████████████████| 415/415 [01:25<00:00,  4.83it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.89it/s]


Epoch 28/50 - Train Loss: 0.6667
Validation Metrics - Accuracy: 0.5750, Precision: 0.9510, Recall: 0.5214


Training Epoch 29: 100%|████████████████████████████████████████████████████| 415/415 [01:24<00:00,  4.92it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.38it/s]


Epoch 29/50 - Train Loss: 0.6648
Validation Metrics - Accuracy: 0.3859, Precision: 0.9448, Recall: 0.3010


Training Epoch 30: 100%|████████████████████████████████████████████████████| 415/415 [01:24<00:00,  4.93it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.00it/s]


Epoch 30/50 - Train Loss: 0.6665
Validation Metrics - Accuracy: 0.3328, Precision: 0.9594, Recall: 0.2365


Training Epoch 31: 100%|████████████████████████████████████████████████████| 415/415 [01:24<00:00,  4.94it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.52it/s]


Epoch 31/50 - Train Loss: 0.6517
Validation Metrics - Accuracy: 0.8500, Precision: 0.8646, Recall: 0.9771


Training Epoch 32: 100%|████████████████████████████████████████████████████| 415/415 [01:23<00:00,  4.98it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.35it/s]


Epoch 32/50 - Train Loss: 0.6499
Validation Metrics - Accuracy: 0.3297, Precision: 0.9437, Recall: 0.2307


Training Epoch 33: 100%|████████████████████████████████████████████████████| 415/415 [01:21<00:00,  5.11it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.33it/s]


Epoch 33/50 - Train Loss: 0.6477
Validation Metrics - Accuracy: 0.4391, Precision: 0.9323, Recall: 0.3698


Training Epoch 34: 100%|████████████████████████████████████████████████████| 415/415 [01:23<00:00,  4.97it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.87it/s]


Epoch 34/50 - Train Loss: 0.6364
Validation Metrics - Accuracy: 0.8359, Precision: 0.8688, Recall: 0.9453


Training Epoch 35: 100%|████████████████████████████████████████████████████| 415/415 [01:26<00:00,  4.81it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.00it/s]


Epoch 35/50 - Train Loss: 0.6219
Validation Metrics - Accuracy: 0.8609, Precision: 0.8740, Recall: 0.9818


Training Epoch 36: 100%|████████████████████████████████████████████████████| 415/415 [01:25<00:00,  4.88it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.03it/s]


Epoch 36/50 - Train Loss: 0.6199
Validation Metrics - Accuracy: 0.8344, Precision: 0.9385, Recall: 0.8719


Training Epoch 37: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.77it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.08it/s]


Epoch 37/50 - Train Loss: 0.5498
Validation Metrics - Accuracy: 0.8656, Precision: 0.8703, Recall: 0.9938


Training Epoch 38: 100%|████████████████████████████████████████████████████| 415/415 [01:29<00:00,  4.65it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.82it/s]


Epoch 38/50 - Train Loss: 0.5993
Validation Metrics - Accuracy: 0.8953, Precision: 0.9229, Recall: 0.9594


Training Epoch 39: 100%|████████████████████████████████████████████████████| 415/415 [01:28<00:00,  4.68it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.83it/s]


Epoch 39/50 - Train Loss: 0.6022
Validation Metrics - Accuracy: 0.8812, Precision: 0.8990, Recall: 0.9693


Training Epoch 40: 100%|████████████████████████████████████████████████████| 415/415 [01:29<00:00,  4.63it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.00it/s]


Epoch 40/50 - Train Loss: 0.5753
Validation Metrics - Accuracy: 0.8562, Precision: 0.9536, Recall: 0.8682


Training Epoch 41: 100%|████████████████████████████████████████████████████| 415/415 [01:29<00:00,  4.64it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:12<00:00, 13.18it/s]


Epoch 41/50 - Train Loss: 0.5974
Validation Metrics - Accuracy: 0.8156, Precision: 0.9448, Recall: 0.8161


Training Epoch 42: 100%|████████████████████████████████████████████████████| 415/415 [01:29<00:00,  4.65it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.83it/s]


Epoch 42/50 - Train Loss: 0.6060
Validation Metrics - Accuracy: 0.9031, Precision: 0.9224, Recall: 0.9698


Training Epoch 43: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.73it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.86it/s]


Epoch 43/50 - Train Loss: 0.6207
Validation Metrics - Accuracy: 0.8688, Precision: 0.8682, Recall: 0.9964


Training Epoch 44: 100%|████████████████████████████████████████████████████| 415/415 [01:28<00:00,  4.67it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.06it/s]


Epoch 44/50 - Train Loss: 0.6275
Validation Metrics - Accuracy: 0.8922, Precision: 0.9484, Recall: 0.9240


Training Epoch 45: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.74it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.17it/s]


Epoch 45/50 - Train Loss: 0.6400
Validation Metrics - Accuracy: 0.6547, Precision: 0.9604, Recall: 0.6182


Training Epoch 46: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.72it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.95it/s]


Epoch 46/50 - Train Loss: 0.5873
Validation Metrics - Accuracy: 0.7328, Precision: 0.9646, Recall: 0.7052


Training Epoch 47: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.76it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.89it/s]


Epoch 47/50 - Train Loss: 0.6078
Validation Metrics - Accuracy: 0.7016, Precision: 0.9552, Recall: 0.6823


Training Epoch 48: 100%|████████████████████████████████████████████████████| 415/415 [01:27<00:00,  4.73it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.17it/s]


Epoch 48/50 - Train Loss: 0.5801
Validation Metrics - Accuracy: 0.6766, Precision: 0.9646, Recall: 0.6401


Training Epoch 49: 100%|████████████████████████████████████████████████████| 415/415 [01:25<00:00,  4.85it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 13.88it/s]


Epoch 49/50 - Train Loss: 0.6120
Validation Metrics - Accuracy: 0.5109, Precision: 0.9719, Recall: 0.4333


Training Epoch 50: 100%|████████████████████████████████████████████████████| 415/415 [01:26<00:00,  4.80it/s]
Validation: 100%|███████████████████████████████████████████████████████████| 160/160 [00:11<00:00, 14.25it/s]

Epoch 50/50 - Train Loss: 0.6232
Validation Metrics - Accuracy: 0.8781, Precision: 0.8969, Recall: 0.9604





In [20]:
acc, prec, rec = evaluate_model(model, val_dataloader, criterion, device)

Validation: 100%|███████████████████████████████████████████████████████████| 138/138 [00:10<00:00, 12.95it/s]


In [21]:
print(f"Validation Metrics - Accuracy: {acc:.4f}, Precision: {prec:.4f}, Recall: {rec:.4f}")

Validation Metrics - Accuracy: 0.8460, Precision: 0.9179, Recall: 0.9010
