In [1]:
import os
import cv2
import numpy as np

def load_images_to_numpy(folder_path, size=(60, 40)):
    """
    Загружает изображения из папки, изменяет их размер и конвертирует в массивы NumPy.

    :param folder_path: Путь к папке с изображениями.
    :param size: Новый размер изображений (ширина, высота).
    :return: Массив NumPy, содержащий изображения.
    """
    images = []
    for filename in os.listdir(folder_path):
        img_path = os.path.join(folder_path, filename)
        if os.path.isfile(img_path) and filename.lower().endswith(('.png', '.jpg', '.jpeg')):
            img = cv2.imread(img_path)
            img_resized = cv2.resize(img, size, interpolation=cv2.INTER_AREA)
            images.append(img_resized)
    return np.array(images, dtype='uint8')

# Загрузка изображений из каждой папки
proliv_images = load_images_to_numpy('dataset/proliv')
test_images = load_images_to_numpy('dataset/test/imgs')
train_images = load_images_to_numpy('dataset/train')

# Вывод информации о загруженных массивах
print(f'Проливы: {proliv_images.shape}')
print(f'Тестовые изображения: {test_images.shape}')
print(f'Обучающие изображения: {train_images.shape}')


Проливы: (154, 40, 60, 3)
Тестовые изображения: (3794, 40, 60, 3)
Обучающие изображения: (10000, 40, 60, 3)


In [32]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import numpy as np
from torchvision import transforms
from torch.utils.data import DataLoader, TensorDataset

# Функция load_images_to_numpy из предыдущего примера

class Encoder(nn.Module):
    def __init__(self, latent_dims):
        super(Encoder, self).__init__()
        self.linear1 = nn.Linear(60 * 40 * 3, 512)  # Изменен размер входа
        self.linear2 = nn.Linear(512, latent_dims)

    def forward(self, x):
        x = torch.flatten(x, start_dim=1)  # Выпрямление изображения в одномерный вектор
        x = F.relu(self.linear1(x))
        return self.linear2(x)

class Decoder(nn.Module):
    def __init__(self, latent_dims):
        super(Decoder, self).__init__()
        self.linear1 = nn.Linear(latent_dims, 512)
        self.linear2 = nn.Linear(512, 60 * 40 * 3)  # Изменен размер выхода

    def forward(self, z):
        z = F.relu(self.linear1(z))
        z = torch.sigmoid(self.linear2(z))
        return z.view(-1, 3, 40, 60)  # Изменение формы выхода для соответствия размеру изображения

class Autoencoder(nn.Module):
    def __init__(self, latent_dims):
        super(Autoencoder, self).__init__()
        self.encoder = Encoder(latent_dims)
        self.decoder = Decoder(latent_dims)

    def forward(self, x):
        z = self.encoder(x)
        return self.decoder(z)

import tqdm

import tqdm

def train(autoencoder, data_loader, epochs=100, device=torch.device("cuda" if torch.cuda.is_available() else "cpu")):
    optimizer = torch.optim.Adam(autoencoder.parameters())
    criterion = nn.MSELoss()

    for epoch in tqdm.tqdm(range(epochs)):
        total_loss = 0  # Суммарная потеря за эпоху
        num_batches = 0  # Количество батчей

        for img_batch in data_loader:
            img = img_batch[0].to(device)  # Перенос на GPU, если доступно
            optimizer.zero_grad()
            reconstructed = autoencoder(img)
            loss = criterion(reconstructed, img)
            loss.backward()
            optimizer.step()

            total_loss += loss.item()  # Добавление потери от батча к общей сумме
            num_batches += 1

        average_loss = total_loss / num_batches  # Средняя потеря за эпоху
        print(f"Epoch {epoch+1}/{epochs}, Average Loss: {average_loss:.4f}")

    return autoencoder




# Загрузка и подготовка данных
proliv_images = load_images_to_numpy('dataset/proliv')  # Пример использования функции
train_images = load_images_to_numpy('dataset/train')  # Пример использования функции

# Преобразование массивов NumPy в тензоры PyTorch
train_images_tensor = torch.tensor(train_images, dtype=torch.float32).permute(0, 3, 1, 2) / 255.0  # Преобразование и нормализация

# Создание DataLoader
train_loader = DataLoader(TensorDataset(train_images_tensor), batch_size=64, shuffle=True)

# Инициализация и обучение автоэнкодера
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
latent_dims = 1024  # Можно настроить
autoencoder = Autoencoder(latent_dims).to(device)
train(autoencoder, train_loader, epochs=100)


  1%|▊                                                                                 | 1/100 [00:00<00:50,  1.95it/s]

Epoch 1/100, Average Loss: 0.0017


  2%|█▋                                                                                | 2/100 [00:01<00:49,  1.99it/s]

Epoch 2/100, Average Loss: 0.0014


  3%|██▍                                                                               | 3/100 [00:01<00:48,  1.98it/s]

Epoch 3/100, Average Loss: 0.0013


  4%|███▎                                                                              | 4/100 [00:02<00:48,  1.98it/s]

Epoch 4/100, Average Loss: 0.0013


  5%|████                                                                              | 5/100 [00:02<00:47,  1.98it/s]

Epoch 5/100, Average Loss: 0.0013


  6%|████▉                                                                             | 6/100 [00:03<00:47,  1.99it/s]

Epoch 6/100, Average Loss: 0.0013


  7%|█████▋                                                                            | 7/100 [00:03<00:47,  1.98it/s]

Epoch 7/100, Average Loss: 0.0012


  8%|██████▌                                                                           | 8/100 [00:04<00:46,  1.99it/s]

Epoch 8/100, Average Loss: 0.0012


  9%|███████▍                                                                          | 9/100 [00:04<00:45,  1.99it/s]

Epoch 9/100, Average Loss: 0.0011


 10%|████████                                                                         | 10/100 [00:05<00:45,  1.99it/s]

Epoch 10/100, Average Loss: 0.0011


 11%|████████▉                                                                        | 11/100 [00:05<00:44,  1.98it/s]

Epoch 11/100, Average Loss: 0.0011


 12%|█████████▋                                                                       | 12/100 [00:06<00:44,  1.98it/s]

Epoch 12/100, Average Loss: 0.0011


 13%|██████████▌                                                                      | 13/100 [00:06<00:43,  1.98it/s]

Epoch 13/100, Average Loss: 0.0011


 14%|███████████▎                                                                     | 14/100 [00:07<00:43,  1.98it/s]

Epoch 14/100, Average Loss: 0.0011


 15%|████████████▏                                                                    | 15/100 [00:07<00:43,  1.96it/s]

Epoch 15/100, Average Loss: 0.0011


 16%|████████████▉                                                                    | 16/100 [00:08<00:42,  1.96it/s]

Epoch 16/100, Average Loss: 0.0011


 17%|█████████████▊                                                                   | 17/100 [00:08<00:42,  1.95it/s]

Epoch 17/100, Average Loss: 0.0011


 18%|██████████████▌                                                                  | 18/100 [00:09<00:41,  1.96it/s]

Epoch 18/100, Average Loss: 0.0011


 19%|███████████████▍                                                                 | 19/100 [00:09<00:41,  1.95it/s]

Epoch 19/100, Average Loss: 0.0011


 20%|████████████████▏                                                                | 20/100 [00:10<00:40,  1.97it/s]

Epoch 20/100, Average Loss: 0.0011


 21%|█████████████████                                                                | 21/100 [00:10<00:39,  1.98it/s]

Epoch 21/100, Average Loss: 0.0011


 22%|█████████████████▊                                                               | 22/100 [00:11<00:39,  1.99it/s]

Epoch 22/100, Average Loss: 0.0011


 23%|██████████████████▋                                                              | 23/100 [00:11<00:38,  1.99it/s]

Epoch 23/100, Average Loss: 0.0011


 24%|███████████████████▍                                                             | 24/100 [00:12<00:38,  2.00it/s]

Epoch 24/100, Average Loss: 0.0011


 25%|████████████████████▎                                                            | 25/100 [00:12<00:37,  1.98it/s]

Epoch 25/100, Average Loss: 0.0011


 26%|█████████████████████                                                            | 26/100 [00:13<00:37,  1.99it/s]

Epoch 26/100, Average Loss: 0.0011


 27%|█████████████████████▊                                                           | 27/100 [00:13<00:36,  1.99it/s]

Epoch 27/100, Average Loss: 0.0011


 28%|██████████████████████▋                                                          | 28/100 [00:14<00:36,  2.00it/s]

Epoch 28/100, Average Loss: 0.0011


 29%|███████████████████████▍                                                         | 29/100 [00:14<00:35,  1.99it/s]

Epoch 29/100, Average Loss: 0.0011


 30%|████████████████████████▎                                                        | 30/100 [00:15<00:34,  2.00it/s]

Epoch 30/100, Average Loss: 0.0011


 31%|█████████████████████████                                                        | 31/100 [00:15<00:34,  1.98it/s]

Epoch 31/100, Average Loss: 0.0011


 32%|█████████████████████████▉                                                       | 32/100 [00:16<00:34,  1.99it/s]

Epoch 32/100, Average Loss: 0.0011


 33%|██████████████████████████▋                                                      | 33/100 [00:16<00:33,  1.98it/s]

Epoch 33/100, Average Loss: 0.0011


 34%|███████████████████████████▌                                                     | 34/100 [00:17<00:33,  1.99it/s]

Epoch 34/100, Average Loss: 0.0011


 35%|████████████████████████████▎                                                    | 35/100 [00:17<00:32,  1.99it/s]

Epoch 35/100, Average Loss: 0.0011


 36%|█████████████████████████████▏                                                   | 36/100 [00:18<00:31,  2.00it/s]

Epoch 36/100, Average Loss: 0.0011


 37%|█████████████████████████████▉                                                   | 37/100 [00:18<00:31,  1.99it/s]

Epoch 37/100, Average Loss: 0.0011


 38%|██████████████████████████████▊                                                  | 38/100 [00:19<00:31,  2.00it/s]

Epoch 38/100, Average Loss: 0.0011


 39%|███████████████████████████████▌                                                 | 39/100 [00:19<00:30,  1.99it/s]

Epoch 39/100, Average Loss: 0.0011


 40%|████████████████████████████████▍                                                | 40/100 [00:20<00:30,  1.99it/s]

Epoch 40/100, Average Loss: 0.0011


 41%|█████████████████████████████████▏                                               | 41/100 [00:20<00:29,  1.97it/s]

Epoch 41/100, Average Loss: 0.0011


 42%|██████████████████████████████████                                               | 42/100 [00:21<00:29,  1.98it/s]

Epoch 42/100, Average Loss: 0.0011


 43%|██████████████████████████████████▊                                              | 43/100 [00:21<00:28,  1.97it/s]

Epoch 43/100, Average Loss: 0.0011


 44%|███████████████████████████████████▋                                             | 44/100 [00:22<00:28,  1.98it/s]

Epoch 44/100, Average Loss: 0.0011


 45%|████████████████████████████████████▍                                            | 45/100 [00:22<00:27,  1.97it/s]

Epoch 45/100, Average Loss: 0.0011


 46%|█████████████████████████████████████▎                                           | 46/100 [00:23<00:27,  1.97it/s]

Epoch 46/100, Average Loss: 0.0011


 47%|██████████████████████████████████████                                           | 47/100 [00:23<00:27,  1.96it/s]

Epoch 47/100, Average Loss: 0.0011


 48%|██████████████████████████████████████▉                                          | 48/100 [00:24<00:26,  1.97it/s]

Epoch 48/100, Average Loss: 0.0011


 49%|███████████████████████████████████████▋                                         | 49/100 [00:24<00:25,  1.97it/s]

Epoch 49/100, Average Loss: 0.0011


 50%|████████████████████████████████████████▌                                        | 50/100 [00:25<00:25,  1.98it/s]

Epoch 50/100, Average Loss: 0.0011


 51%|█████████████████████████████████████████▎                                       | 51/100 [00:25<00:24,  1.97it/s]

Epoch 51/100, Average Loss: 0.0011


 52%|██████████████████████████████████████████                                       | 52/100 [00:26<00:24,  1.97it/s]

Epoch 52/100, Average Loss: 0.0011


 53%|██████████████████████████████████████████▉                                      | 53/100 [00:26<00:23,  1.96it/s]

Epoch 53/100, Average Loss: 0.0011


 54%|███████████████████████████████████████████▋                                     | 54/100 [00:27<00:23,  1.96it/s]

Epoch 54/100, Average Loss: 0.0010


 55%|████████████████████████████████████████████▌                                    | 55/100 [00:27<00:23,  1.95it/s]

Epoch 55/100, Average Loss: 0.0011


 56%|█████████████████████████████████████████████▎                                   | 56/100 [00:28<00:22,  1.97it/s]

Epoch 56/100, Average Loss: 0.0011


 57%|██████████████████████████████████████████████▏                                  | 57/100 [00:28<00:21,  1.96it/s]

Epoch 57/100, Average Loss: 0.0011


 58%|██████████████████████████████████████████████▉                                  | 58/100 [00:29<00:21,  1.97it/s]

Epoch 58/100, Average Loss: 0.0011


 59%|███████████████████████████████████████████████▊                                 | 59/100 [00:29<00:21,  1.95it/s]

Epoch 59/100, Average Loss: 0.0011


 60%|████████████████████████████████████████████████▌                                | 60/100 [00:30<00:20,  1.96it/s]

Epoch 60/100, Average Loss: 0.0010


 61%|█████████████████████████████████████████████████▍                               | 61/100 [00:30<00:19,  1.96it/s]

Epoch 61/100, Average Loss: 0.0010


 62%|██████████████████████████████████████████████████▏                              | 62/100 [00:31<00:19,  1.96it/s]

Epoch 62/100, Average Loss: 0.0011


 63%|███████████████████████████████████████████████████                              | 63/100 [00:31<00:18,  1.96it/s]

Epoch 63/100, Average Loss: 0.0011


 64%|███████████████████████████████████████████████████▊                             | 64/100 [00:32<00:18,  1.98it/s]

Epoch 64/100, Average Loss: 0.0011


 65%|████████████████████████████████████████████████████▋                            | 65/100 [00:32<00:17,  1.96it/s]

Epoch 65/100, Average Loss: 0.0010


 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:33<00:17,  1.97it/s]

Epoch 66/100, Average Loss: 0.0011


 67%|██████████████████████████████████████████████████████▎                          | 67/100 [00:33<00:16,  1.97it/s]

Epoch 67/100, Average Loss: 0.0011


 68%|███████████████████████████████████████████████████████                          | 68/100 [00:34<00:16,  1.98it/s]

Epoch 68/100, Average Loss: 0.0011


 69%|███████████████████████████████████████████████████████▉                         | 69/100 [00:34<00:15,  1.96it/s]

Epoch 69/100, Average Loss: 0.0011


 70%|████████████████████████████████████████████████████████▋                        | 70/100 [00:35<00:15,  1.97it/s]

Epoch 70/100, Average Loss: 0.0011


 71%|█████████████████████████████████████████████████████████▌                       | 71/100 [00:35<00:14,  1.98it/s]

Epoch 71/100, Average Loss: 0.0011


 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [00:36<00:14,  1.99it/s]

Epoch 72/100, Average Loss: 0.0011


 73%|███████████████████████████████████████████████████████████▏                     | 73/100 [00:36<00:13,  1.99it/s]

Epoch 73/100, Average Loss: 0.0011


 74%|███████████████████████████████████████████████████████████▉                     | 74/100 [00:37<00:13,  2.00it/s]

Epoch 74/100, Average Loss: 0.0011


 75%|████████████████████████████████████████████████████████████▊                    | 75/100 [00:37<00:12,  1.99it/s]

Epoch 75/100, Average Loss: 0.0011


 76%|█████████████████████████████████████████████████████████████▌                   | 76/100 [00:38<00:12,  2.00it/s]

Epoch 76/100, Average Loss: 0.0010


 77%|██████████████████████████████████████████████████████████████▎                  | 77/100 [00:38<00:11,  1.99it/s]

Epoch 77/100, Average Loss: 0.0010


 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:39<00:10,  2.00it/s]

Epoch 78/100, Average Loss: 0.0010


 79%|███████████████████████████████████████████████████████████████▉                 | 79/100 [00:39<00:10,  2.00it/s]

Epoch 79/100, Average Loss: 0.0011


 80%|████████████████████████████████████████████████████████████████▊                | 80/100 [00:40<00:09,  2.00it/s]

Epoch 80/100, Average Loss: 0.0010


 81%|█████████████████████████████████████████████████████████████████▌               | 81/100 [00:40<00:09,  2.00it/s]

Epoch 81/100, Average Loss: 0.0011


 82%|██████████████████████████████████████████████████████████████████▍              | 82/100 [00:41<00:08,  2.00it/s]

Epoch 82/100, Average Loss: 0.0011


 83%|███████████████████████████████████████████████████████████████████▏             | 83/100 [00:41<00:08,  2.00it/s]

Epoch 83/100, Average Loss: 0.0010


 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:42<00:08,  1.99it/s]

Epoch 84/100, Average Loss: 0.0011


 85%|████████████████████████████████████████████████████████████████████▊            | 85/100 [00:42<00:07,  1.97it/s]

Epoch 85/100, Average Loss: 0.0011


 86%|█████████████████████████████████████████████████████████████████████▋           | 86/100 [00:43<00:07,  1.97it/s]

Epoch 86/100, Average Loss: 0.0011


 87%|██████████████████████████████████████████████████████████████████████▍          | 87/100 [00:43<00:06,  1.98it/s]

Epoch 87/100, Average Loss: 0.0011


 88%|███████████████████████████████████████████████████████████████████████▎         | 88/100 [00:44<00:06,  1.98it/s]

Epoch 88/100, Average Loss: 0.0010


 89%|████████████████████████████████████████████████████████████████████████         | 89/100 [00:44<00:05,  1.97it/s]

Epoch 89/100, Average Loss: 0.0010


 90%|████████████████████████████████████████████████████████████████████████▉        | 90/100 [00:45<00:05,  1.97it/s]

Epoch 90/100, Average Loss: 0.0010


 91%|█████████████████████████████████████████████████████████████████████████▋       | 91/100 [00:45<00:04,  1.98it/s]

Epoch 91/100, Average Loss: 0.0011


 92%|██████████████████████████████████████████████████████████████████████████▌      | 92/100 [00:46<00:04,  1.99it/s]

Epoch 92/100, Average Loss: 0.0010


 93%|███████████████████████████████████████████████████████████████████████████▎     | 93/100 [00:46<00:03,  1.99it/s]

Epoch 93/100, Average Loss: 0.0010


 94%|████████████████████████████████████████████████████████████████████████████▏    | 94/100 [00:47<00:03,  1.98it/s]

Epoch 94/100, Average Loss: 0.0011


 95%|████████████████████████████████████████████████████████████████████████████▉    | 95/100 [00:48<00:02,  1.98it/s]

Epoch 95/100, Average Loss: 0.0010


 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [00:48<00:02,  1.98it/s]

Epoch 96/100, Average Loss: 0.0010


 97%|██████████████████████████████████████████████████████████████████████████████▌  | 97/100 [00:49<00:01,  1.97it/s]

Epoch 97/100, Average Loss: 0.0010


 98%|███████████████████████████████████████████████████████████████████████████████▍ | 98/100 [00:49<00:01,  1.96it/s]

Epoch 98/100, Average Loss: 0.0011


 99%|████████████████████████████████████████████████████████████████████████████████▏| 99/100 [00:50<00:00,  1.97it/s]

Epoch 99/100, Average Loss: 0.0010


100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:50<00:00,  1.98it/s]

Epoch 100/100, Average Loss: 0.0011





Autoencoder(
  (encoder): Encoder(
    (linear1): Linear(in_features=7200, out_features=512, bias=True)
    (linear2): Linear(in_features=512, out_features=1024, bias=True)
  )
  (decoder): Decoder(
    (linear1): Linear(in_features=1024, out_features=512, bias=True)
    (linear2): Linear(in_features=512, out_features=7200, bias=True)
  )
)

In [33]:
def test_autoencoder(autoencoder, data_loader, device):
    autoencoder.eval()  # Переключение в режим оценки
    total_loss = 0
    criterion = nn.MSELoss()

    with torch.no_grad():
        for img_batch in data_loader:
            img = img_batch[0].to(device)  # Изменение здесь
            reconstructed = autoencoder(img)
            loss = criterion(reconstructed, img)
            total_loss += loss.item()

    average_loss = total_loss / len(data_loader)
    return average_loss

# Преобразование изображений с проливами в тензоры PyTorch и создание DataLoader
proliv_images_tensor = torch.tensor(proliv_images, dtype=torch.float32).permute(0, 3, 1, 2) / 255.0
proliv_loader = DataLoader(TensorDataset(proliv_images_tensor), batch_size=64, shuffle=False)

# Тестирование модели
proliv_loss = test_autoencoder(autoencoder, proliv_loader, device)
print(f"Average loss on proliv images: {proliv_loss}")


Average loss on proliv images: 0.005532826607426007


In [34]:
def calculate_mse(autoencoder, data_loader):
    mse_loss = nn.MSELoss(reduction='none')
    losses = []
    with torch.no_grad():
        for img in data_loader:
            img = img[0].to(device)
            reconstructed = autoencoder(img)
            loss = mse_loss(reconstructed, img).mean([1, 2, 3])  # Средняя ошибка по каждому изображению
            losses.extend(loss.cpu().numpy())
    return np.array(losses)

In [35]:
proliv_images = load_images_to_numpy('dataset/proliv')
proliv_images_tensor = torch.tensor(proliv_images, dtype=torch.float32).permute(0, 3, 1, 2) / 255.0

In [36]:
proliv_loader = DataLoader(TensorDataset(proliv_images_tensor), batch_size=64, shuffle=False)

In [37]:
proliv_mse = calculate_mse(autoencoder, proliv_loader)

In [42]:
threshold = np.percentile(proliv_mse, 0.0020579725969582796)

In [43]:
test_images = load_images_to_numpy('dataset/test/imgs')
test_images_tensor = torch.tensor(test_images, dtype=torch.float32).permute(0, 3, 1, 2) / 255.0
test_loader = DataLoader(TensorDataset(test_images_tensor), batch_size=64, shuffle=False)

test_mse = calculate_mse(autoencoder, test_loader)
test_predictions = test_mse > threshold

In [45]:

import numpy as np
import pandas as pd
from sklearn.metrics import confusion_matrix

# Функция для загрузки меток из файла аннотаций
def load_labels(label_file_path):
    labels = pd.read_csv(label_file_path, header=None, sep=' ')
    return labels.iloc[:, 1].values  # Предполагая, что метки находятся во втором столбце

# Загрузка меток
test_labels = load_labels('dataset/test/test_annotation.txt')  # Укажите правильный путь к файлу

# Получение предсказаний из ранее выполненного шага
test_predictions = test_mse > threshold

# Вычисление confusion matrix
tn, fp, fn, tp = confusion_matrix(test_labels, test_predictions).ravel()

# Вычисление TPR и TNR
tpr = tp / (tp + fn)
tnr = tn / (tn + fp)

print(f"True Positive Rate: {tpr * 100:.2f}%")
print(f"True Negative Rate: {tnr * 100:.2f}%")


True Positive Rate: 91.38%
True Negative Rate: 95.13%


In [41]:
from sklearn.metrics import roc_curve, auc

def find_optimal_cutoff(test_labels, test_scores):
    fpr, tpr, thresholds = roc_curve(test_labels, test_scores)
    optimal_idx = np.argmax(tpr - fpr)
    optimal_threshold = thresholds[optimal_idx]
    return optimal_threshold

# Вычисление оптимального порога
optimal_threshold = find_optimal_cutoff(test_labels, test_mse)
print(f"Оптимальный порог MSE: {optimal_threshold}")

# Применение оптимального порога для классификации
test_predictions_optimal = test_mse > optimal_threshold


Оптимальный порог MSE: 0.0020579725969582796
