# Готовим данные для CVAT

In [4]:
import os
import re

def rename_files(directory):
    """
    Переименовывает файлы в указанной директории, заменяя пробелы и круглые скобки на подчеркивания.
    """
    for root, _, files in os.walk(directory):
        for file in files:
            old_path = os.path.join(root, file)
            # Заменяем пробелы и круглые скобки на подчеркивания
            new_file = re.sub(r'\s*\(\s*|\s*\)\s*', '_', file)
            new_file = re.sub(r'\s+', '_', new_file)  # Убираем возможные лишние пробелы
            new_path = os.path.join(root, new_file)
            if old_path != new_path:  # Избегаем ненужного переименования
                os.rename(old_path, new_path)
                print(f"Renamed: {old_path} -> {new_path}")

def save_jpeg_paths(directory, output_file):
    """
    Находит все .jpg файлы в указанной директории, сортирует их и сохраняет пути в текстовом файле.
    """
    base_path = 'data/obj_train_data/'
    paths = []

    for root, _, files in os.walk(directory):
        for file in files:
            if file.endswith('.jpg'):
                # Формируем относительный путь с фиксированной базой
                relative_path = os.path.join(base_path, file).replace('\\', '/')
                paths.append(relative_path)
    
    # Сортируем по числовой части
    paths.sort(key=lambda x: list(map(int, re.findall(r'\d+', os.path.basename(x)))))

    with open(output_file, 'w') as f:
        for path in paths:
            f.write(path + '\n')
            print(f"Added to file: {path}")

# Укажите директорию и файл для сохранения путей
directory = '/Users/user/virtualenv/rosatom/dataset'
output_file = '/Users/user/virtualenv/rosatom/Сварные швы/data/train.txt'

# Выполняем переименование файлов
rename_files(directory)

# Сохраняем пути к .jpg файлам
save_jpeg_paths(directory, output_file)


Added to file: data/obj_train_data/1_1_.jpg
Added to file: data/obj_train_data/1_2_.jpg
Added to file: data/obj_train_data/1_3_.jpg
Added to file: data/obj_train_data/1_4_.jpg
Added to file: data/obj_train_data/1_5_.jpg
Added to file: data/obj_train_data/1_6_.jpg
Added to file: data/obj_train_data/1_7_.jpg
Added to file: data/obj_train_data/1_8_.jpg
Added to file: data/obj_train_data/1_9_.jpg
Added to file: data/obj_train_data/1_10_.jpg
Added to file: data/obj_train_data/1_11_.jpg
Added to file: data/obj_train_data/1_12_.jpg
Added to file: data/obj_train_data/1_13_.jpg
Added to file: data/obj_train_data/2_1_.jpg
Added to file: data/obj_train_data/2_2_.jpg
Added to file: data/obj_train_data/2_3_.jpg
Added to file: data/obj_train_data/2_4_.jpg
Added to file: data/obj_train_data/2_5_.jpg
Added to file: data/obj_train_data/2_6_.jpg
Added to file: data/obj_train_data/2_7_.jpg
Added to file: data/obj_train_data/2_8_.jpg
Added to file: data/obj_train_data/2_9_.jpg
Added to file: data/obj_trai