Лабораторная работа №2

Классификация самолетов: военный или гражданский

**Используемые модели:**
- ResNet-50 (microsoft/resnet-50)
- Vision Transformer (google/vit-base-patch16-224)

**Датасет:** 30 изображений самолетов (15 гражданских, 15 военных)

Выполнили:
- Гуреева Алина
- Тысячный Влад

группа М8О-102СВ-25

In [71]:
import requests
import time
import os
import base64 #для кодирования изображений
from huggingface_hub import HfApi

Константы и глобальные переменные

In [None]:
# Глобальные константы
DATASET_FOLDER = "datasetAirplanes"

API_TOKEN = "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"

# Ссылки на модели
RESNET_URL = "https://router.huggingface.co/hf-inference/models/microsoft/resnet-50"
VIT_URL = "https://router.huggingface.co/hf-inference/models/google/vit-base-patch16-224"

# Заголовки для HTTP-запросов
headers = {
    "Authorization": f"Bearer {API_TOKEN}",
    "Content-Type": "application/json"
}


In [74]:
def get_sorted_images(folder):

    files = os.listdir(folder)

    # Берём только картинки
    images = [f for f in files if f.lower().endswith((".jpg", ".jpeg", ".png"))]

    # Сортируем по числу перед точкой
    images.sort(key=lambda name: int(name.split('.')[0]))

    return images

In [75]:
# Получаем отсортированный список изображений
sorted_images = get_sorted_images(DATASET_FOLDER)
print(sorted_images)


['1.jpeg', '2.jpg', '3.jpg', '4.jpg', '5.jpeg', '6.jpeg', '7.jpeg', '8.jpeg', '9.jpg', '10.jpg', '11.jpg', '12.jpg', '13.jpeg', '14.jpeg', '15.jpg', '16.jpg', '17.jpg', '18.jpeg', '19.jpeg', '20.jpeg', '21.jpg', '22.jpeg', '23.jpeg', '24.jpg', '25.jpeg', '26.jpg', '27.jpg', '28.jpeg', '29.jpg', '30.jpeg']


In [76]:
# Проверка токена (если активирован, то вернет json с моими данными)
r = requests.get("https://huggingface.co/api/whoami-v2", headers=headers)

print(r.json())

{'type': 'user', 'id': '6918cc3764f6e0b44b3ec420', 'name': 'gureeva017', 'fullname': 'Gureeva Alina', 'email': 'gureeva017@gmail.com', 'emailVerified': True, 'canPay': False, 'periodEnd': None, 'isPro': False, 'avatarUrl': '/avatars/a89491c7d8e6937dcc97bcb9b2a2c2ea.svg', 'orgs': [], 'auth': {'type': 'access_token', 'accessToken': {'displayName': 'colab_lab2', 'role': 'read', 'createdAt': '2025-11-15T18:57:34.525Z'}}}


Проверка статуса модели

In [77]:
def check_model_status(url):
    response = requests.get(url, headers=headers)
    print(f"   Status: {response.status_code}")
    if response.status_code == 200:
        print("   Model is accessible")
    else:
        print(f"   Error: {response.text}")

print("ResNet:")
check_model_status(RESNET_URL)
print()
print("ViT")
check_model_status(VIT_URL)


ResNet:
   Status: 200
   Model is accessible

ViT
   Status: 200
   Model is accessible


Функции для отправки изображения в модель

In [78]:
def query_model(api_url, image_path):
    """Отправляет запрос к модели на HuggingFace"""

    # Читаем и кодируем изображение
    with open(image_path, "rb") as f:
        image_b64 = base64.b64encode(f.read()).decode()

    # Формируем запрос
    data = {
        "inputs": image_b64
    }

    response = requests.post(api_url, headers=headers, json=data)

    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error: {response.text}")
        return None

Разбор ответа от модели (военный / гражданский самолет)

In [79]:
def parse_answer(result):

    military_keywords = [
    # Базовые слова
    'military', 'war', 'combat', 'fighter', 'bomber', 'attack',
    'interceptor', 'multirole', 'stealth', 'surveillance', 'reconnaissance',
    'navy', 'airforce', 'army', 'marines',

    # Типы военных самолётов
    'jet fighter', 'fighter jet', 'strike aircraft', 'close air support',
    'drone', 'uav', 'ucav',

    # Военные прилагательные
    'tactical', 'strategic', 'supersonic', 'mach', 'afterburner',
    'air superiority', 'dogfight',
    ]

    civil_keywords = [
    # Базовые
    'civil', 'civilian', 'commercial', 'passenger', 'airliner',
    'cargo', 'transport', 'commuter', 'regional',

    # Типы гражданских самолётов
    'jetliner', 'widebody', 'narrowbody', 'turboprop',
    'business jet', 'private jet',
    ]
    
    military_score = 0
    civil_score = 0

    # Считаем упоминания
    for pred in result[:3]:
        print(f"  {pred['label']}: {pred['score']:.4f}")
        
        is_military = any(1 for kw in military_keywords if kw in pred["label"])
        is_civil = any(1 for kw in civil_keywords if kw in pred["label"])

        military_score += is_military * pred["score"]
        civil_score += is_civil * pred["score"]

    # Определяем класс
    if military_score > civil_score:
        return "military"
    elif civil_score > military_score:
        return "civil"
    else:
        return "unknown"

Загружает список файлов изображений из указанной папки

In [80]:
def load_dataset(folder_path):
    if not os.path.exists(folder_path):
        print(f"ОШИБКА: Папка {folder_path} не найдена!")
        print("Загрузи папку с датасетом в Colab или укажи правильный путь")
        return None

    # Получаем отсортированный список изображений (по числу в имени файла)
    all_files = get_sorted_images(folder_path)

    if len(all_files) < 30:
        print(f"ВНИМАНИЕ: Найдено только {len(all_files)} изображений, ожидалось 30")

    # Первые 15 - гражданские, остальные 15 - военные
    civil_files = [os.path.join(folder_path, f) for f in all_files[:15]]
    military_files = [os.path.join(folder_path, f) for f in all_files[15:30]]

    print(f"Загружено изображений:")
    print(f"  Гражданских: {len(civil_files)}")
    print(f"  Военных: {len(military_files)}")

    return {"civil": civil_files, "military": military_files}

dataset = load_dataset(DATASET_FOLDER)

if dataset is None:
    print(f"Остановка программы. Исправь путь к датасету и запусти снова.")
    exit()

Загружено изображений:
  Гражданских: 15
  Военных: 15


Запуск классификации всех изображений

In [81]:
results = {
    "resnet": {"predictions": [], "true_labels": []},
    "vit": {"predictions": [], "true_labels": []}
}

print("Начинаем классификацию\n")

# Проходим по всем изображениям
for true_label, images in dataset.items():
    for i, img_path in enumerate(images):
        print(f"\n{'='*50}")
        print(f"Изображение: {img_path} (настоящая метка: {true_label})")

        # Классификация с помощью ResNet-50
        print(f"Запрос к ResNet...")
        resnet_response = query_model(RESNET_URL, img_path)
        resnet_pred = parse_answer(resnet_response)
        results["resnet"]["predictions"].append(resnet_pred)
        results["resnet"]["true_labels"].append(true_label)
        print(f"ResNet ответ: {resnet_pred}")
        print()

        time.sleep(2)

        # Классификация с помощью Vision Transformer
        print("Запрос к ViT...")
        vit_response = query_model(VIT_URL, img_path)
        vit_pred = parse_answer(vit_response)
        results["vit"]["predictions"].append(vit_pred)
        results["vit"]["true_labels"].append(true_label)
        print(f"ViT ответ: {vit_pred}")

        time.sleep(2)


Начинаем классификацию


Изображение: datasetAirplance\1.jpeg (настоящая метка: civil)
Запрос к ResNet...
  airliner: 0.9997
  wing: 0.0002
  space shuttle: 0.0000
ResNet ответ: civil

Запрос к ViT...
  airliner: 0.9938
  wing: 0.0023
  warplane, military plane: 0.0018
ViT ответ: civil

Изображение: datasetAirplance\2.jpg (настоящая метка: civil)
Запрос к ResNet...
  warplane, military plane: 0.9042
  missile: 0.0311
  wing: 0.0248
ResNet ответ: military

Запрос к ViT...
  airliner: 0.8795
  wing: 0.0604
  warplane, military plane: 0.0442
ViT ответ: civil

Изображение: datasetAirplance\3.jpg (настоящая метка: civil)
Запрос к ResNet...
  airliner: 0.9962
  wing: 0.0031
  tiger shark, Galeocerdo cuvieri: 0.0000
ResNet ответ: civil

Запрос к ViT...
  airliner: 0.9950
  wing: 0.0034
  warplane, military plane: 0.0004
ViT ответ: civil

Изображение: datasetAirplance\4.jpg (настоящая метка: civil)
Запрос к ResNet...
  airliner: 0.9994
  wing: 0.0003
  police van, police wagon, paddy wagon, pa

Метрики: Accuracy, Precision, Recall, F1

В нашей задаче "положительный" класс = "military" (военный самолет).
    "Отрицательный" класс = "civil" (гражданский самолет)

In [85]:
def calculate_metrics(y_true, y_pred):
    # Убираем 'unknown' из подсчета
    filtered = [(t, p) for t, p in zip(y_true, y_pred) if p != "unknown"]

    if not filtered:
        return {"accuracy": 0, "precision": 0, "recall": 0, "f1": 0}

    y_true_filtered, y_pred_filtered = zip(*filtered)

    # Вычисляем True Positives, False Positives, False Negatives, True Negatives
    tp = sum(1 for t, p in zip(y_true_filtered, y_pred_filtered) if t == "military" and p == "military")
    fp = sum(1 for t, p in zip(y_true_filtered, y_pred_filtered) if t == "civil" and p == "military")
    fn = sum(1 for t, p in zip(y_true_filtered, y_pred_filtered) if t == "military" and p == "civil")
    tn = sum(1 for t, p in zip(y_true_filtered, y_pred_filtered) if t == "civil" and p == "civil")

    # Вычисляем метрики
    accuracy = (tp + tn) / len(y_true_filtered) if len(y_true_filtered) > 0 else 0
    precision = tp / (tp + fp) if (tp + fp) > 0 else 0
    recall = tp / (tp + fn) if (tp + fn) > 0 else 0
    f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0

    return {
        "accuracy": round(accuracy, 3),
        "precision": round(precision, 3),
        "recall": round(recall, 3),
        "f1": round(f1, 3)
    }


In [86]:
for model_name, data in results.items():
    print(f"\n{model_name.upper()}:")
    metrics = calculate_metrics(data["true_labels"], data["predictions"])
    print(f"  Accuracy:  {metrics['accuracy']}")
    print(f"  Precision: {metrics['precision']}")
    print(f"  Recall:    {metrics['recall']}")
    print(f"  F1-score:  {metrics['f1']}")



RESNET:
  Accuracy:  0.967
  Precision: 0.938
  Recall:    1.0
  F1-score:  0.968

VIT:
  Accuracy:  0.967
  Precision: 1.0
  Recall:    0.933
  F1-score:  0.966


Сравнение моделей

In [87]:
print("СРАВНЕНИЕ МОДЕЛЕЙ")

# Вычисляем метрики для обеих моделей
resnet_metrics = calculate_metrics(results["resnet"]["true_labels"], results["resnet"]["predictions"])
vit_metrics = calculate_metrics(results["vit"]["true_labels"], results["vit"]["predictions"])

print(f"\nResNet-50 F1-score:  {resnet_metrics['f1']}")
print(f"ViT F1-score:          {vit_metrics['f1']}")

print("\n" + "-"*60)
if resnet_metrics["f1"] > vit_metrics["f1"]:
    print(f"ResNet-50 показала лучший результат")
    print(f"  (F1: {resnet_metrics['f1']} vs {vit_metrics['f1']})")
elif vit_metrics["f1"] > resnet_metrics["f1"]:
    print(f"Vision Transformer показала лучший результат")
    print(f"  (F1: {vit_metrics['f1']} vs {resnet_metrics['f1']})")
else:
    print("Модели показали одинаковый результат")

СРАВНЕНИЕ МОДЕЛЕЙ

ResNet-50 F1-score:  0.968
ViT F1-score:          0.966

------------------------------------------------------------
ResNet-50 показала лучший результат
  (F1: 0.968 vs 0.966)
