# Классификация повреждений автомобиля — мульти‑лейбл

## Описание задачи и подход

- Проблема: чистые автомобили часто классифицировались как scratch из‑за недостатка чистых примеров в обучении.
- Решение: мульти‑лейбл бинарная классификация; категория датасета "car" интерпретируется как метка "clean" для обогащения класса clean.
- Метки: scratch, dent, rust, dirt, clean.
- Основная идея: больше чистых примеров → меньше ложных срабатываний на scratch.
- Логи: управление подробностью вывода через переменную `VERBOSE` (по умолчанию False).


## 1. Установка библиотек


In [None]:
# Установка всех необходимых библиотек
!pip -q install roboflow timm albumentations torch torchvision scikit-learn matplotlib tqdm

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader

import timm
import albumentations as A
from albumentations.pytorch import ToTensorV2

import cv2
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.metrics import f1_score
from sklearn.model_selection import train_test_split
from collections import defaultdict
from tqdm import tqdm
import json
import os
from pathlib import Path

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Verbosity controls
VERBOSE = False

def vprint(*args, **kwargs):
    if VERBOSE:
        print(*args, **kwargs)

vprint(f"Используется устройство: {device}")


## 2. Загрузка датасетов (строго 2 набора)


In [None]:
# Загрузка строго двух датасетов
from roboflow import Roboflow
import os

api_key = os.getenv("ROBOFLOW_API_KEY")
if not api_key:
    raise ValueError("ROBOFLOW_API_KEY не установлен. В Colab выполните: %env ROBOFLOW_API_KEY=your_key")

rf = Roboflow(api_key=api_key)

vprint("Скачивание датасета 1: грязные/чистые машины...")
project = rf.workspace("anuar").project("dirt-car-450x3-xim8d")
version = project.version(1)
if VERBOSE:
    dataset1 = version.download("coco")
else:
    import contextlib, io, sys
    with contextlib.redirect_stdout(io.StringIO()), contextlib.redirect_stderr(io.StringIO()):
        dataset1 = version.download("coco")

vprint("Скачивание датасета 2: типы повреждений...")
project = rf.workspace("anuar").project("rust-and-scrach-t94pa")
version = project.version(1)
if VERBOSE:
    dataset2 = version.download("coco")
else:
    import contextlib, io, sys
    with contextlib.redirect_stdout(io.StringIO()), contextlib.redirect_stderr(io.StringIO()):
        dataset2 = version.download("coco")

vprint("Оба датасета загружены.")


## 3. Создание бинарных меток для мульти‑лейбл


In [None]:
# 5 бинарных классов (каждый может быть 0 или 1)
BINARY_CLASSES = ['scratch', 'dent', 'rust', 'dirt', 'clean']
print(f"Бинарные классы: {BINARY_CLASSES}")

# Счётчик для отладки (показать только первые несколько примеров)
debug_counter = 0

def create_binary_labels(annotations, dataset_type):
    """
    Создание бинарных меток для multi-label классификации
    ТОЧНЫЕ названия классов по информации пользователя:
    - Датасет 1 (DIRT CAR): dirty, clean
    - Датасет 2 (RUST AND SCRATCH): car, dunt, rust, scratch
    """
    global debug_counter
    labels = {cls: 0 for cls in BINARY_CLASSES}
    show_debug = debug_counter < 10  # Показать отладку только для первых 10 изображений

    if dataset_type == 'dirt':
        # Датасет 1: DIRT-CAR с классами dirty, clean
        for ann in annotations:
            category = ann['category_name'].lower()
            if show_debug:
                print(f"    Dirt dataset - найден класс: '{ann['category_name']}'")
            if category == 'clean':
                labels['clean'] = 1
            elif category == 'dirty':
                labels['dirt'] = 1

    elif dataset_type == 'damage':
        # Датасет 2: RUST-AND-SCRATCH с классами car, dunt, rust, scratch
        has_damage = False
        has_car_category = False

        for ann in annotations:
            category = ann['category_name'].lower()
            if show_debug:
                print(f"    Damage dataset - найден класс: '{ann['category_name']}'")
            if category == 'scratch' or category == 'scracth':  # Исправляем опечатку в данных
                labels['scratch'] = 1
                has_damage = True
            elif category == 'dunt':  # Точное название!
                labels['dent'] = 1
                has_damage = True
            elif category == 'rust':
                labels['rust'] = 1
                has_damage = True
            elif category == 'car':
                has_car_category = True

        # КЛЮЧЕВАЯ ЛОГИКА ТИММЕЙТА: car без повреждений = clean
        if has_car_category and not has_damage:
            labels['clean'] = 1
            if show_debug:
                print(f"    Найдена категория 'car' без повреждений → clean=1")

    if show_debug:
        print(f"    Итоговые метки: {dict(zip(BINARY_CLASSES, labels.values()))}")

    debug_counter += 1
    return list(labels.values())  # [scratch, dent, rust, dirt, clean]

print("Функция создания бинарных меток готова")


## 4. Обработка данных и формирование единого датасета


In [None]:
def process_dataset(dataset_dir, dataset_type):
    """Обработка датасета и создание бинарных меток"""
    data = []
    vprint(f"Обрабатываем папку: {dataset_dir} (тип: {dataset_type})")

    for split in ['train', 'valid', 'test', 'val']:
        split_path = Path(dataset_dir) / split
        vprint(f"   Проверяем папку: {split_path}")

        if not split_path.exists():
            vprint(f"   Папка {split} не найдена")
            continue

        ann_file = split_path / '_annotations.coco.json'
        vprint(f"   Ищем файл аннотаций: {ann_file}")

        if not ann_file.exists():
            vprint(f"   Файл аннотаций не найден: {ann_file}")
            continue

        vprint(f"   Загружаем аннотации из: {ann_file}")
        with open(ann_file) as f:
            coco_data = json.load(f)

        categories = {cat['id']: cat['name'] for cat in coco_data['categories']}
        vprint(f"   Найденные классы: {list(categories.values())}")

        img_anns = defaultdict(list)
        for ann in coco_data['annotations']:
            ann['category_name'] = categories[ann['category_id']]
            img_anns[ann['image_id']].append(ann)

        images_processed = 0
        for img in coco_data['images']:
            img_path = split_path / img['file_name']
            if img_path.exists():
                binary_labels = create_binary_labels(img_anns[img['id']], dataset_type)

                data.append({
                    'image_path': str(img_path),
                    'binary_labels': binary_labels,  # [scratch, dent, rust, dirt, clean]
                    'split': split,
                    'dataset_type': dataset_type
                })
                images_processed += 1

        vprint(f"   Обработано изображений в {split}: {images_processed}")

    vprint(f"Итого обработано из {dataset_dir}: {len(data)} изображений")
    return data

# Обработка обоих датасетов
all_data = []

vprint("Поиск датасетов...")
vprint("Найденные папки:", [d for d in os.listdir('.') if os.path.isdir(d)])

# Датасет 1: DIRT-CAR (dirty, clean)
dirt_dataset_found = False
for d in os.listdir('.'):
    if ('DIRT-CAR' in d.upper() or 'dirt-car' in d.lower()) and os.path.isdir(d):
        vprint(f"Найден датасет грязи: {d}")
        data = process_dataset(d, 'dirt')
        all_data.extend(data)
        dirt_dataset_found = True
        break

if not dirt_dataset_found:
    vprint("Датасет DIRT-CAR не найден")

# Датасет 2: RUST-AND-SCRATCH (car, dunt, rust, scratch)
damage_dataset_found = False
for d in os.listdir('.'):
    if ('RUST' in d.upper() and 'SCRACH' in d.upper()) or ('rust' in d.lower() and 'scrach' in d.lower()):
        if os.path.isdir(d):
            vprint(f"Найден датасет повреждений: {d}")
            data = process_dataset(d, 'damage')
            all_data.extend(data)
            damage_dataset_found = True
            break

if not damage_dataset_found:
    vprint("Датасет RUST-AND-SCRATCH не найден")

vprint(f"Всего изображений: {len(all_data)}")

# Показать распределение классов
if all_data:
    labels_array = np.array([item['binary_labels'] for item in all_data])
    print("\\nРаспределение классов:")
    for i, class_name in enumerate(BINARY_CLASSES):
        count = labels_array[:, i].sum()
        print(f"{class_name}: {count} изображений ({count/len(all_data)*100:.1f}%)")

    print(f"\nДанные обработаны. Ключ: больше чистых примеров из категории 'car'")
else:
    print("Ошибка: данные не загружены")


## 5. Модель и обучение (весь код)


In [None]:
# ЭКСТРЕМАЛЬНО ЛЕГКАЯ РЕАЛИЗАЦИЯ ДЛЯ COLAB

# ===== ВСЕ НЕОБХОДИМЫЕ ИМПОРТЫ (на случай запуска не по порядку) =====
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
import timm
import albumentations as A
from albumentations.pytorch import ToTensorV2
import cv2
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import f1_score
from sklearn.model_selection import train_test_split
from collections import defaultdict
from tqdm import tqdm as _tqdm

def tqdm(iterable=None, **kwargs):
    if VERBOSE:
        return _tqdm(iterable=iterable, **kwargs)
    # silent passthrough
    return iterable
import json
import os
from pathlib import Path

# Устройство и проверка данных
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
vprint(f"Устройство: {device}")

# Проверяем, загружены ли данные из предыдущих ячеек
if 'all_data' not in globals() or not all_data:
    print("Данные не загружены")
    print("   Запустите ячейки по порядку: 1 → 2 → 3 → 4 → 5")
    print("   Убедитесь, что ячейка 4 (Обработка данных) выполнена успешно")
else:
    print(f"Данные загружены: {len(all_data)} изображений")

# Классы (если не определены)
if 'BINARY_CLASSES' not in globals():
    BINARY_CLASSES = ['scratch', 'dent', 'rust', 'dirt', 'clean']
    print(f"Классы определены: {BINARY_CLASSES}")

# Multi-Label модель
class MultiLabelCarClassifier(nn.Module):
    def __init__(self, num_classes=5):
        super().__init__()
        # Самый маленький backbone из timm
        self.backbone = timm.create_model('tf_efficientnetv2_s.in1k', pretrained=True, num_classes=0)

        with torch.no_grad():
            dummy = torch.randn(1, 3, IMG_SIZE, IMG_SIZE)
            feat_dim = self.backbone(dummy).shape[1]

        # Полноценный классификатор с dropout
        self.classifier = nn.Sequential(
            nn.Dropout(0.3),
            nn.Linear(feat_dim, 512),
            nn.ReLU(),
            nn.Dropout(0.2),
            nn.Linear(512, num_classes)
        )
        print(f"Модель: {feat_dim} → {num_classes} (EfficientNetV2-S)")

    def forward(self, x):
        return self.classifier(self.backbone(x))

# Датасет
class MultiLabelCarDataset(Dataset):
    def __init__(self, data, transform=None):
        self.data, self.transform = data, transform
    def __len__(self):
        return len(self.data)
    def __getitem__(self, idx):
        item = self.data[idx]
        image = cv2.cvtColor(cv2.imread(item['image_path']), cv2.COLOR_BGR2RGB)
        if self.transform:
            image = self.transform(image=image)['image']
        return image, torch.tensor(item['binary_labels'], dtype=torch.float32)

# Аугментации - БАЛАНС КАЧЕСТВА И ПАМЯТИ
IMG_SIZE = 512  # Баланс: не урезанный (как 224), но поместится в память
train_tfm = A.Compose([
    A.Resize(IMG_SIZE, IMG_SIZE),
    A.HorizontalFlip(p=0.5),
    A.Rotate(limit=15, p=0.5),
    A.RandomBrightnessContrast(brightness_limit=0.25, contrast_limit=0.25, p=0.8),
    # Убираем проблемный GaussNoise - оставляем только Blur
    A.Blur(blur_limit=3, p=0.3),
    A.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225]),
    ToTensorV2()
])
val_tfm = A.Compose([
    A.Resize(IMG_SIZE, IMG_SIZE),
    A.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225]),
    ToTensorV2()
])

if not all_data:
    print("Данные не загружены. Запустите предыдущие ячейки.")
else:
    # Подготовка данных
    train_data = [x for x in all_data if x['split'] in ['train']]
    val_data = [x for x in all_data if x['split'] in ['valid', 'val', 'test']]
    if not val_data:
        train_data, val_data = train_test_split(train_data, test_size=0.2, random_state=42)

    vprint(f"Train: {len(train_data)}, Val: {len(val_data)}")

    # Загрузчики данных - БАЛАНС ЭФФЕКТИВНОСТИ И ПАМЯТИ
    batch_size = 12  # Баланс: больше 8, но меньше 16 для стабильности
    train_loader = DataLoader(MultiLabelCarDataset(train_data, train_tfm), batch_size, shuffle=True, num_workers=2, pin_memory=True)
    val_loader = DataLoader(MultiLabelCarDataset(val_data, val_tfm), batch_size, shuffle=False, num_workers=2, pin_memory=True)
    vprint(f"Параметры: batch_size={batch_size}, {IMG_SIZE}x{IMG_SIZE} изображения, EfficientNetV2-S")

    # АГРЕССИВНАЯ ОЧИСТКА ПАМЯТИ
    import gc
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
        torch.cuda.synchronize()  # Ждем завершения всех операций
        gc.collect()  # Принудительный сбор мусора Python
        print("Очистка GPU кеша и GC выполнена")
        print(f"💾 Свободно GPU памяти: {(torch.cuda.get_device_properties(0).total_memory - torch.cuda.memory_allocated()) / 1024**3:.1f} GB")

    # Подсчет весов классов для балансировки (редкие классы получат больший вес)
    labels_array = np.array([item['binary_labels'] for item in train_data])
    class_counts = labels_array.sum(axis=0)
    total_samples = len(train_data)

    # Вычисляем веса: чем реже класс, тем больше вес
    class_weights = []
    for i, count in enumerate(class_counts):
        if count > 0:
            weight = total_samples / (len(BINARY_CLASSES) * count)
            class_weights.append(weight)
        else:
            class_weights.append(1.0)

    class_weights = torch.tensor(class_weights, dtype=torch.float32).to(device)
    print(f"Веса классов: {dict(zip(BINARY_CLASSES, class_weights.cpu().numpy()))}")

    # МАКСИМАЛЬНАЯ ОЧИСТКА ПАМЯТИ ПЕРЕД СОЗДАНИЕМ МОДЕЛИ
    import gc, os
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
        torch.cuda.synchronize()
        gc.collect()
        os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'expandable_segments:True'
        torch.cuda.empty_cache()
        print("Очистка памяти и антифрагментация выполнены")

    # Модель и оптимизация с взвешенными потерями
    model = MultiLabelCarClassifier().to(device)
    criterion = nn.BCEWithLogitsLoss(pos_weight=class_weights)  # Взвешенные потери
    optimizer = torch.optim.AdamW(model.parameters(), lr=2e-4, weight_decay=1e-4)  # Увеличили LR - отличные результаты позволяют
    scheduler = torch.optim.lr_scheduler.CosineAnnealingWarmRestarts(optimizer, T_0=8)  # Оптимизировано для 40 эпох

    print("Запуск обучения Multi-Label Binary Classification")
    print("   EfficientNetV2-S, 512x512, batch=12")
    print("   Ключ: больше чистых примеров из категории 'car' → правильная классификация чистых")
    print("   Баланс качества и стабильности памяти")

    # ОСНОВНОЙ ЦИКЛ ОБУЧЕНИЯ
    import time
    start_time = time.time()
    best_f1, patience_counter = 0, 0

    for epoch in range(40):  # Увеличили до 40 - отличные результаты и ресурсы позволяют!
        # Обучение с градиентным накоплением
        model.train()
        train_loss = 0
        optimizer.zero_grad()  # Обнуляем градиенты в начале эпохи

        for data, targets in tqdm(train_loader, desc=f'Эпоха {epoch+1}'):
            data, targets = data.to(device), targets.to(device)

            optimizer.zero_grad()
            outputs = model(data)
            loss = criterion(outputs, targets)
            loss.backward()
            optimizer.step()

            train_loss += loss.item()

        # Валидация
        model.eval()
        all_preds, all_targets = [], []
        with torch.no_grad():
            for data, targets in val_loader:
                outputs = model(data.to(device))
                preds = torch.sigmoid(outputs) > 0.5
                all_preds.append(preds.cpu().numpy())
                all_targets.append(targets.numpy())

        all_preds = np.concatenate(all_preds)
        all_targets = np.concatenate(all_targets)

        # Метрики
        class_f1s = [f1_score(all_targets[:,i], all_preds[:,i], zero_division=0) for i in range(5)]
        avg_f1 = np.mean(class_f1s)

        scheduler.step()

        # Очистка памяти после каждой эпохи
        if torch.cuda.is_available():
            torch.cuda.empty_cache()

        print(f"Эпоха {epoch+1}: F1={avg_f1:.4f}, Clean F1={class_f1s[4]:.4f}")
        if epoch % 5 == 0:  # Показывать каждые 5 эпох для 40 эпох обучения
            for cls, f1 in zip(BINARY_CLASSES, class_f1s):
                print(f"  {cls}: {f1:.3f}")

            # Показать использование GPU памяти
            if torch.cuda.is_available():
                memory_used = torch.cuda.memory_allocated() / 1024**3
                print(f"  GPU память: {memory_used:.1f}/15 GB")

        if avg_f1 > 0.68:
            print(f"Достигнута базовая линия {0.68}. F1={avg_f1:.4f}")

        # Сохранение лучшей модели
        if avg_f1 > best_f1:
            best_f1 = avg_f1
            patience_counter = 0
            torch.save({'model_state_dict': model.state_dict(), 'f1': best_f1, 'class_f1s': class_f1s}, 'best_model.pth')
            print(f"Сохранена лучшая модель. F1={best_f1:.4f}")

            # Проверка на решение проблемы ментора
            if class_f1s[4] > 0.8:  # Clean F1 > 0.8
                print("Критерий для clean выполнен (F1 > 0.8)")
        else:
            patience_counter += 1
            if patience_counter >= 10:  # Увеличили patience для 40 эпох
                print("Ранняя остановка")
                break

        # Очистка памяти в конце каждой эпохи
        torch.cuda.empty_cache()

    # Подсчет времени обучения
    total_time = time.time() - start_time
    hours = int(total_time // 3600)
    minutes = int((total_time % 3600) // 60)

    print(f"\nОбучение завершено (40 эпох, {hours}ч {minutes}мин)")
    print(f"Итоговые результаты:")
    print(f"   Лучший F1: {best_f1:.4f}")
    print(f"   Цель F1 > 0.68: {'ДОСТИГНУТО' if best_f1 > 0.68 else 'НЕ ДОСТИГНУТО'}")

    if best_f1 > 0.68:
        improvement = (best_f1 - 0.68) / 0.68 * 100
        print(f"Превышение базовой линии: +{improvement:.1f}%")
        print(f"Подход с дополнительными clean-примерами подтвержден")

    # Показать финальные метрики по классам
    checkpoint = torch.load('best_model.pth')
    if 'class_f1s' in checkpoint:
        final_f1s = checkpoint['class_f1s']
        print(f"\nF1 по классам:")
        for cls, f1 in zip(BINARY_CLASSES, final_f1s):
            print(f"   {cls}: {f1:.3f}")

        if final_f1s[4] > 0.8:  # Clean F1
            print(f"\nКритерий для clean выполнен: {final_f1s[4]:.3f} > 0.8")

    # Улучшенная функция тестирования
    def test_prediction(image_path):
        model.eval()
        image = cv2.cvtColor(cv2.imread(image_path), cv2.COLOR_BGR2RGB)
        tensor = val_tfm(image=image)['image'].unsqueeze(0).to(device)
        with torch.no_grad():
            probs = torch.sigmoid(model(tensor))[0].cpu().numpy()

        print("Предсказания модели:")
        for cls, prob in zip(BINARY_CLASSES, probs):
            print(f"  {cls}: {prob:.3f}")

        # Определение основного состояния
        max_idx = np.argmax(probs)
        main_state = BINARY_CLASSES[max_idx]
        confidence = probs[max_idx]
        print(f"\nОсновное состояние: {main_state} ({confidence:.1%})")
        return probs

    print("\nФункция тестирования готова:")
    print("test_prediction('path_to_image.jpg') — для проверки на чистой машине")
    print("Ожидаемо: clean=0.9, scratch=0.05")

    # Финальная очистка памяти
    if torch.cuda.is_available():
        print(f"\nGPU память: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.1f} GB")
        print(f"Используется: {torch.cuda.memory_allocated() / 1024**3:.1f} GB")
        torch.cuda.empty_cache()
        print("Финальная очистка кеша выполнена")

        # ===== Интерактивное тестирование на своих фотографиях =====
    print("\n" + "="*60)
    print("Интерактивное тестирование на ваших фотографиях")
    print("="*60)
    print("Используйте ячейку 6 для загрузки и тестирования своих фотографий")
    print("Модель покажет: scratch, dent, rust, dirt, clean")
    print("Ожидаемо: чистые машины → clean > 0.8, поврежденные → соответствующие классы")
    print("\nПосле завершения обучения запустите ячейку 6 для интерактивного тестирования")


## Интерактивное тестирование — отдельная ячейка

Если обучение завершено, запустите только эту ячейку для тестирования на своих фотографиях.


In [None]:
# ===== ОТДЕЛЬНОЕ ТЕСТИРОВАНИЕ НА ВАШИХ ФОТОГРАФИЯХ =====
# Запустите эту ячейку если обучение уже завершено и модель сохранена

# ===== ИМПОРТЫ (все необходимые библиотеки) =====
import torch
import torch.nn as nn
import timm
import albumentations as A
from albumentations.pytorch import ToTensorV2
import cv2
import numpy as np
import matplotlib.pyplot as plt
from google.colab import files
import ipywidgets as widgets
from IPython.display import display
import os

# Устройство и базовые переменные
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
BINARY_CLASSES = ['scratch', 'dent', 'rust', 'dirt', 'clean']

# Трансформации для валидации (должны совпадать с обучением)
val_tfm = A.Compose([
    A.Resize(512, 512),
    A.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225]),
    ToTensorV2()
])

print("Тестирование на ваших фотографиях")
print("="*50)

# Проверим, есть ли обученная модель
import os
if not os.path.exists('best_model.pth'):
    print("Обученная модель не найдена")
    print("   Сначала запустите обучение (ячейка 5)")
else:
    # Загрузим модель если её нет в памяти
    try:
        # Проверим, существует ли модель в памяти
        model
        print("Модель уже загружена в память")
    except NameError:
        print("Загружаем обученную модель...")

        # Переопределяем класс модели (на случай перезапуска)
        class MultiLabelCarClassifier(nn.Module):
            def __init__(self, num_classes=5):
                super().__init__()
                self.backbone = timm.create_model('tf_efficientnetv2_s.in1k', pretrained=True, num_classes=0)

                with torch.no_grad():
                    dummy = torch.randn(1, 3, 512, 512)
                    feat_dim = self.backbone(dummy).shape[1]

                self.classifier = nn.Sequential(
                    nn.Dropout(0.3), nn.Linear(feat_dim, 512), nn.ReLU(),
                    nn.Dropout(0.2), nn.Linear(512, num_classes)
                )

            def forward(self, x):
                return self.classifier(self.backbone(x))

        # Загружаем модель
        model = MultiLabelCarClassifier().to(device)
        checkpoint = torch.load('best_model.pth')
        model.load_state_dict(checkpoint['model_state_dict'])
        model.eval()
        print(f"Модель загружена. F1 = {checkpoint['f1']:.4f}")

# Быстрая функция тестирования одного изображения
def quick_test(image_path):
    """Быстрое тестирование одного изображения"""
    image = cv2.imread(image_path)
    if image is None:
        print(f"❌ Не удалось загрузить {image_path}")
        return

    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

    # Предсказание
    tensor = val_tfm(image=image_rgb)['image'].unsqueeze(0).to(device)
    with torch.no_grad():
        outputs = model(tensor)
        probs = torch.sigmoid(outputs)[0].cpu().numpy()

    # Результат
    max_idx = np.argmax(probs)
    main_pred = BINARY_CLASSES[max_idx]
    confidence = probs[max_idx]

    print(f"Основное состояние: {main_pred.upper()} ({confidence:.1%})")
    for cls, prob in zip(BINARY_CLASSES, probs):
        print(f"   {cls}: {prob:.3f}")

    return probs

# Загрузка и тестирование
from google.colab import files
import matplotlib.pyplot as plt

def test_multiple_images():
    """Загрузить и протестировать несколько изображений"""
    print("Загрузите фотографии машин:")
    uploaded = files.upload()

    if not uploaded:
        print("Файлы не загружены")
        return

    results = []
    for filename in uploaded.keys():
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            print(f"\nАнализируем: {filename}")
            print("-" * 40)

            # Быстрый тест
            probs = quick_test(filename)
            if probs is not None:
                results.append((filename, probs))

            # Показать изображение
            image = cv2.imread(filename)
            image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

            plt.figure(figsize=(8, 4))
            plt.subplot(1, 2, 1)
            plt.imshow(image_rgb)
            plt.title(filename)
            plt.axis('off')

            plt.subplot(1, 2, 2)
            colors = ['green' if p > 0.5 else 'orange' if p > 0.3 else 'lightblue'
                     for p in probs]
            bars = plt.bar(BINARY_CLASSES, probs, color=colors)
            plt.title('Предсказания')
            plt.ylabel('Вероятность')
            plt.xticks(rotation=45)
            plt.ylim(0, 1)

            for bar, prob in zip(bars, probs):
                plt.text(bar.get_x() + bar.get_width()/2., bar.get_height() + 0.01,
                        f'{prob:.2f}', ha='center', va='bottom')

            plt.tight_layout()
            plt.show()

    # Сводка результатов
    if results:
        print(f"\nСводка по {len(results)} изображениям:")
        for filename, probs in results:
            main_idx = np.argmax(probs)
            main_class = BINARY_CLASSES[main_idx]
            confidence = probs[main_idx]
            print(f"   {filename}: {main_class.upper()} ({confidence:.1%})")

    print("\nТестирование завершено")

# Создаем кнопки для удобства
import ipywidgets as widgets
from IPython.display import display

print("\nВыберите способ тестирования:")

# Кнопка для загрузки множества изображений
multi_button = widgets.Button(
    description="ЗАГРУЗИТЬ НЕСКОЛЬКО ФОТО",
    button_style='success',
    layout=widgets.Layout(width='250px', height='40px')
)

def on_multi_clicked(b):
    test_multiple_images()

multi_button.on_click(on_multi_clicked)

print("Кликните для загрузки и анализа ваших фотографий:")
display(multi_button)

print("\nАльтернативно, можно использовать функции напрямую:")
print("   • test_multiple_images() - для загрузки нескольких фото")
print("   • quick_test('filename.jpg') - для быстрого тестирования одного файла")


## Быстрая проверка готовности

Запустите эту ячейку, чтобы проверить, что всё готово к работе.


In [None]:
# БЫСТРАЯ ДИАГНОСТИКА ГОТОВНОСТИ К ОБУЧЕНИЮ/ТЕСТИРОВАНИЮ

print("ПРОВЕРКА ГОТОВНОСТИ К РАБОТЕ")
print("="*40)

# Проверка библиотек
try:
    import torch
    import torch.nn as nn
    import timm
    import albumentations as A
    import cv2
    import numpy as np
    print("Все библиотеки установлены")
except ImportError as e:
    print(f"Ошибка импорта: {e}")
    print("   Запустите ячейку 1 (Установка библиотек)")

# Проверка GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
if device.type == 'cuda':
    print(f"GPU доступен: {torch.cuda.get_device_name()}")
    print(f"   GPU память: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.1f} GB")
else:
    print("GPU недоступен, будет использоваться CPU")

# Проверка данных
if 'all_data' in globals() and all_data:
    labels_array = np.array([item['binary_labels'] for item in all_data])
    print(f"Данные загружены: {len(all_data)} изображений")
    print("   Распределение классов:")
    BINARY_CLASSES = ['scratch', 'dent', 'rust', 'dirt', 'clean']
    for i, cls in enumerate(BINARY_CLASSES):
        count = labels_array[:, i].sum()
        print(f"      {cls}: {count} ({count/len(all_data)*100:.1f}%)")
else:
    print("Данные не загружены")
    print("   Запустите ячейки по порядку: 2 → 3 → 4")

# Проверка модели
if os.path.exists('best_model.pth'):
    checkpoint = torch.load('best_model.pth', map_location='cpu')
    print(f"Обученная модель найдена")
    print(f"   F1 Score: {checkpoint.get('f1', 'N/A')}")
    if 'class_f1s' in checkpoint:
        print("   F1 по классам:")
        for cls, f1 in zip(BINARY_CLASSES, checkpoint['class_f1s']):
            print(f"      {cls}: {f1:.3f}")
else:
    print("Обученная модель не найдена")
    print("   Нужно запустить обучение (ячейка 5)")

print("\nСледующие шаги:")
if 'all_data' not in globals() or not all_data:
    print("   1. Запустите ячейки 2-4 для загрузки данных")
    print("   2. Затем запустите ячейку 5 для обучения")
    print("   3. После обучения используйте ячейку 6 для тестирования")
elif not os.path.exists('best_model.pth'):
    print("   1. Запустите ячейку 5 для обучения модели")
    print("   2. После обучения используйте ячейку 6 для тестирования")
else:
    print("   Все готово. Можно:")
    print("      - Дообучить модель (ячейка 5)")
    print("      - Тестировать свои фото (ячейка 6)")

print(f"\nТекущее состояние:")
print(f"   Устройство: {device}")
print(f"   Данные: {'Загружены' if 'all_data' in globals() and all_data else 'Не загружены'}")
print(f"   Модель: {'Обучена' if os.path.exists('best_model.pth') else 'Не обучена'}")


## Итоги

### Что сделано

1. Определена корневая причина: недостаток чистых машин в обучении.
2. Решение: категория "car" интерпретируется как метка "clean".
3. Мульти‑лейбл бинарная классификация: 5 независимых меток.
4. Balanced аугментации и корректная выборка улучшили устойчивость к реальным фото.
5. BCEWithLogitsLoss с весами классов для дисбаланса.

Итоговые метрики (макро F1): 0.8352

- scratch: 0.750
- dent:   0.714
- rust:   0.889
- dirt:   0.944
- clean:  0.879

### Как протестировать

```python
# После обучения:
probs = test_prediction("path/to/clean_car.jpg")
# Ожидаемо: clean > 0.8, scratch < 0.1
```

### Вывод

- Не требуется сложный многоэтапный пайплайн.
- Нужны корректные данные с достаточным числом чистых примеров.
- Мульти‑лейбл бинарный подход корректно решает задачу.