In [1]:
import os
import pandas as pd
from PIL import Image

# Пути к данным
train_images_dir = "dataset/images/train"
annotations_file = "data/train_solution_bounding_boxes.csv"
output_labels_dir = "dataset/labels/train"

# Создаем выходную папку для аннотаций
os.makedirs(output_labels_dir, exist_ok=True)

# Загружаем аннотации из CSV
annotations = pd.read_csv(annotations_file)

# Обрабатываем каждое изображение
for image_name in annotations['image'].unique():
    # Фильтруем аннотации для текущего изображения
    image_annotations = annotations[annotations['image'] == image_name]

    # Открываем изображение, чтобы узнать его размеры
    image_path = os.path.join(train_images_dir, image_name)
    with Image.open(image_path) as img:
        img_width, img_height = img.size

    # Создаем файл аннотации YOLO
    label_file_path = os.path.join(output_labels_dir, f"{os.path.splitext(image_name)[0]}.txt")
    with open(label_file_path, 'w') as f:
        for _, row in image_annotations.iterrows():
            # Конвертация координат из xmin, ymin, xmax, ymax в YOLO формат
            xmin, ymin, xmax, ymax = row['xmin'], row['ymin'], row['xmax'], row['ymax']
            x_center = (xmin + xmax) / 2 / img_width
            y_center = (ymin + ymax) / 2 / img_height
            width = (xmax - xmin) / img_width
            height = (ymax - ymin) / img_height

            # В данном случае предполагается один класс (class_id=0)
            class_id = 0

            # Записываем строку в файл
            f.write(f"{class_id} {x_center} {y_center} {width} {height}\n")

print("Конвертация завершена!")


Конвертация завершена!
