In [10]:
from tensorflow.keras.preprocessing.image import smart_resize
import numpy as np
# Пример функции, которая масштабирует изображение без искажений
def preprocess_image(image, size):
    return smart_resize(image, (size[0], size[1]))  # 0 - h, 1 - w


In [11]:
import os
import pandas as pd
import shutil
from PIL import Image

# Пути
images_dir = os.path.join(os.getcwd(), 'Military and Civilian Vehicles Classification', 'Images')  # Папка с исходными изображениями
labels_csv_path_train = os.path.join(os.getcwd(), 'Military and Civilian Vehicles Classification', 'Labels', 'CSV Format', 'train_labels.csv')  
labels_csv_path_test  = os.path.join(os.getcwd(), 'Military and Civilian Vehicles Classification', 'Labels', 'CSV Format', 'test_labels.csv')  
output_path_train = os.path.join(os.getcwd(), 'dataset_temp', 'train')  # Папка для сохранения изображений по классам
output_path_test  = os.path.join(os.getcwd(), 'dataset_temp', 'test')
target_size = (256, 256)  # Задаем целевое разрешение (ширина, высота)


def process_csv_file(csv_path, output_path, size_tuple):
    # Создаем выходную папку, если её нет
    os.makedirs(output_path, exist_ok=True)

    # Загружаем CSV файл
    data = pd.read_csv(csv_path)

    # Проходим по каждой строке CSV файла
    for _, row in data.iterrows():
        # Получаем имя файла и класс
        filename = row['filename']
        class_name = str(row['class'])  # Преобразуем класс в строку, если он числовой
        
        # Путь к исходному изображению
        src_path = os.path.join(images_dir, filename)
        
        # Путь к папке класса и создаем её, если она не существует
        class_dir = os.path.join(output_path, class_name)
        os.makedirs(class_dir, exist_ok=True)
        
        # Путь к месту назначения
        dst_path = os.path.join(class_dir, filename)

        # Проверка на наличие файла в целевой папке
        if os.path.exists(dst_path):
            print(f"Файл {filename} уже существует в {class_dir}, пропускаем.")
            continue  # Пропускаем обработку и переходим к следующему изображению

        # Открываем изображение и изменяем размер
        try:
            with Image.open(src_path) as img:
                # Преобразуем изображение в RGB, если оно имеет другую цветовую модель
                # img = img.convert("RGB")
                # img.thumbnail((256, 256))
                # Преобразуем изображение в массив и применяем smart_resize
                # img_array = np.array(img)
                # resized_array = smart_resize(img_array, target_size)
                # Преобразуем тензор в формат uint8, масштабируя его до 0-255
                # resized_array = (resized_array * 255).astype(np.uint8)
                # Преобразуем обратно в PIL.Image для сохранения
                # resized_img = Image.fromarray(resized_array)
                img.save(dst_path)  # Сохраняем изображение с новым разрешением
        except Exception as e:
            print(f"Ошибка при обработке {filename}: {e}")

    print("Изображения успешно скопированы с заданным разрешением в папки классов.")


In [12]:
process_csv_file(csv_path=labels_csv_path_train, output_path=output_path_train, size_tuple=target_size)
process_csv_file(csv_path=labels_csv_path_test,  output_path=output_path_test,  size_tuple=target_size)

Файл 000_14M0LD-e1525732547750-400x250.jpg уже существует в d:\AVClassificator\dataset_temp\train\military tank, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civilian aircraft, пропускаем.
Файл 0158.jpg уже существует в d:\AVClassificator\dataset_temp\train\civili