In [11]:
import os
import glob

def count_yolo_classes(folder_path):
    """
    Считывает разметку YOLOv8 из файлов .txt в указанной папке и
    выводит количество объектов для каждого класса.

    Args:
        folder_path: Путь к папке с файлами .txt.
    """

    class_counts = {}

    # Находим все файлы .txt в указанной папке
    txt_files = glob.glob(os.path.join(folder_path, '*.txt'))

    # Обработка каждого .txt файла
    for txt_file in txt_files:
        with open(txt_file, 'r') as f:
            # Чтение каждой строки в файле
            for line in f:
                class_id = int(line.split()[0])  # Извлечение ID класса
                
                # Подсчет количества объектов для каждого класса
                if class_id in class_counts:
                    class_counts[class_id] += 1
                else:
                    class_counts[class_id] = 1

    # Вывод результатов
    print("Количество объектов по классам:")
    for class_id, count in class_counts.items():
        print(f"Класс {class_id}: {count} объектов")


# Путь к папке с файлами разметки 
folder_path = 'data_set_03_07v1/obj_Train_data'

# Запуск функции подсчета
count_yolo_classes(folder_path)


Количество объектов по классам:
Класс 0: 2035 объектов
Класс 4: 834 объектов
Класс 1: 490 объектов
Класс 2: 1109 объектов
Класс 5: 800 объектов
Класс 3: 152 объектов


# Счётчик элементов класса

In [101]:
import os
import glob

def count_yolo_classes(folder_path):
    """
    Считывает разметку YOLOv8 из файлов .txt в указанной папке и
    выводит количество объектов для каждого класса, заменяя ID на имена.

    Args:
        folder_path: Путь к папке с файлами .txt.
    """

    class_names = {
        0: "bird",
        1: "helicopter",
        2: "airplane",
        3: "drone",
        4: "ballon",
        5: "ballon_c"
    }
    class_counts = {}

    # Находим все файлы .txt в указанной папке
    txt_files = glob.glob(os.path.join(folder_path, '*.txt'))

    # Обработка каждого .txt файла
    for txt_file in txt_files:
        with open(txt_file, 'r') as f:
            # Чтение каждой строки в файле
            for line in f:
                class_id = int(line.split()[0])  # Извлечение ID класса

                # Подсчет количества объектов для каждого класса
                class_name = class_names.get(class_id, f"unknown_class_{class_id}")
                if class_name in class_counts:
                    class_counts[class_name] += 1
                else:
                    class_counts[class_name] = 1

    # Вывод результатов
    print("Количество объектов по классам:")
    for class_name, count in class_counts.items():
        print(f"{class_name}: {count} объектов")


# Путь к папке с файлами разметки 
folder_path = 'data_yolo_08_07v1_80_n_20/labels/train'
folder_path1 = 'data_yolo_08_07v1_80_n_20/labels/val'
# Запуск функции подсчета
print("для train")
count_yolo_classes(folder_path)
print("для val")
count_yolo_classes(folder_path1)


для train
Количество объектов по классам:
ballon: 926 объектов
helicopter: 730 объектов
ballon_c: 846 объектов
drone: 559 объектов
для val
Количество объектов по классам:
airplane: 196 объектов
ballon: 106 объектов
bird: 532 объектов
drone: 68 объектов
helicopter: 159 объектов
ballon_c: 216 объектов


# пермещение всех трансформ в train

In [103]:
import os
import shutil

# Путь к основной директории
base_dir = 'data_yolo_08_07v1_80_n_20'

# Папки с изображениями и описаниями
folders = {
    'images': {
        'train': os.path.join(base_dir, 'images', 'train'),
        'val': os.path.join(base_dir, 'images', 'val')
    },
    'labels': {
        'train': os.path.join(base_dir, 'labels', 'train'),
        'val': os.path.join(base_dir, 'labels', 'val')
    }
}

# Функция для перемещения файлов
def move_files(src_folder, dest_folder, keyword):
    for filename in os.listdir(src_folder):
        if keyword in filename:
            src_file = os.path.join(src_folder, filename)
            dest_file = os.path.join(dest_folder, filename)
            shutil.move(src_file, dest_file)
            print(f'Moved: {src_file} to {dest_file}')

# Перемещение изображений
move_files(folders['images']['val'], folders['images']['train'], 'transform')

# Перемещение описаний
move_files(folders['labels']['val'], folders['labels']['train'], 'transform')

Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_80000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_80000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_8000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_8000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_82000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_82000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_84000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_84000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_86000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_86000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_88000_transform.jpg to data_yolo_08_07v1_80_n_20\images\train\airplane (1)_88000_transform.jpg
Moved: data_yolo_08_07v1_80_n_20\images\val\airplane (1)_90000_transform.jpg to data_yolo_

# Разбиение на train и val в соотношение 80 на 20

In [1]:
import os
import glob
import shutil
from collections import defaultdict
class_names = ["bidr", "helicopter", "airplane", "drone", "ballon", "ballon_c"]
def split_yolo_dataset(source_train, source_val, dest_folder, train_ratio=0.8):
    """
    Разделяет датасет YOLOv8 на обучающую и валидационную выборки,
    сохраняя соотношение классов.

    Args:
        source_train: Путь к папке с обучающей выборкой (labels).
        source_val: Путь к папке с валидационной выборкой (labels).
        dest_folder: Путь к папке назначения.
        train_ratio: Доля данных для обучения (0.0 - 1.0).
    """

    os.makedirs(os.path.join(dest_folder, 'labels/train'), exist_ok=True)
    os.makedirs(os.path.join(dest_folder, 'labels/val'), exist_ok=True)
    os.makedirs(os.path.join(dest_folder, 'images/train'), exist_ok=True)
    os.makedirs(os.path.join(dest_folder, 'images/val'), exist_ok=True)

    # Собираем информацию о файлах и классах
    image_class_map = defaultdict(list) 
    for dataset_path in [source_train, source_val]:
        for txt_file in glob.glob(os.path.join(dataset_path, '*.txt')):
            image_name = os.path.basename(txt_file).replace('.txt', '.jpg') 
            with open(txt_file, 'r') as f:
                for line in f:
                    class_id = int(line.split()[0])
                    image_class_map[class_id].append((image_name, txt_file))

    # Распределение файлов по папкам train/val для каждого класса
    for class_id, images in image_class_map.items():
        print(f'Класс:{class_names[class_id]}  len: {len(images)}')
        split_index = int(len(images) * train_ratio)
        train_images = images[:split_index]
        val_images = images[split_index:]
        print(f'train: {len(train_images)} val: {len(val_images)}')

        # Копируем файлы в соответствующие папки
        for image_name, txt_file in train_images:
            shutil.copy(txt_file, os.path.join(dest_folder, 'labels/train', os.path.basename(txt_file)))
            shutil.copy(os.path.join(os.path.dirname(txt_file).replace('labels', 'images'), image_name), 
                        os.path.join(dest_folder, 'images/train', image_name))

        for image_name, txt_file in val_images:
            shutil.copy(txt_file, os.path.join(dest_folder, 'labels/val', os.path.basename(txt_file)))
            shutil.copy(os.path.join(os.path.dirname(txt_file).replace('labels', 'images'), image_name), 
                        os.path.join(dest_folder, 'images/val', image_name))

# Пути к исходным папкам с данными
source_train = 'data_yolo_08_07v1/labels/train'
source_val = 'data_yolo_08_07v1/labels/val'
dest_folder = 'data_yolo_08_07v2'  

# Запускаем функцию разделения датасета
split_yolo_dataset(source_train, source_val, dest_folder)


Класс:helicopter  len: 954
train: 763 val: 191
Класс:drone  len: 629
train: 503 val: 126
Класс:ballon_c  len: 956
train: 764 val: 192
Класс:airplane  len: 994
train: 795 val: 199
Класс:ballon  len: 970
train: 776 val: 194
Класс:bidr  len: 964
train: 771 val: 193


# Удаление лишних фото


In [100]:
import os
import glob
import shutil
from collections import defaultdict

class_names = ["bidr", "helicopter", "airplane", "drone", "ballon", "ballon_c"]

def delete_excess_class_data(labels_folder, images_folder, max_samples_per_class=1000):
    """
    Удаляет лишние изображения и аннотации, если количество объектов класса 
    превышает заданное значение. Подсчитывает количество объектов каждого 
    класса до и после удаления.

    Args:
        labels_folder (str): Путь к папке с аннотациями (labels).
        images_folder (str): Путь к папке с изображениями (images).
        max_samples_per_class (int): Максимальное количество образцов для каждого класса.
    """

    class_counts_before = defaultdict(int)
    class_counts_after = defaultdict(int)
    files_to_delete = []

    # Подсчет объектов до удаления
    for txt_file in glob.glob(os.path.join(labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                class_counts_before[class_id] += 1

    # Поиск файлов для удаления
    for txt_file in glob.glob(os.path.join(labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                if class_counts_before[class_id] > max_samples_per_class:
                    files_to_delete.append(txt_file)
                    image_file = os.path.join(images_folder, os.path.basename(txt_file).replace('.txt', '.jpg'))
                    files_to_delete.append(image_file)

    # Удаляем файлы
    for file_path in set(files_to_delete): 
        try:
            os.remove(file_path)
            print(f"Удален файл: {file_path}")
        except FileNotFoundError:
            print(f"Файл не найден: {file_path}")

    # Подсчет объектов после удаления
    for txt_file in glob.glob(os.path.join(labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                class_counts_after[class_id] += 1

    print(f"Количество объектов в {labels_folder.split('/')[-1]}:")
    for class_id, count in class_counts_before.items():
        print(f"- {class_names[class_id]}: {count} (до удаления) / {class_counts_after.get(class_id, 0)} (после удаления)")

# Пути к папкам с данными
base_folder = 'data_yolo_08_07v1_80_n_20'
train_labels_folder = os.path.join(base_folder, 'labels', 'train')
train_images_folder = os.path.join(base_folder, 'images', 'train')
val_labels_folder = os.path.join(base_folder, 'labels', 'val')
val_images_folder = os.path.join(base_folder, 'images', 'val')

# Удаляем лишние данные и выводим статистику
delete_excess_class_data(train_labels_folder, train_images_folder)
delete_excess_class_data(val_labels_folder, val_images_folder)



Удален файл: data_yolo_08_07v1_80_n_20\labels\train\airplane (6)_94000_transform.txt
Удален файл: data_yolo_08_07v1_80_n_20\images\train\bird (5)_29000.jpg
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\KVhOBj0xNr234585.txt
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\bird (4)_30160.txt
Удален файл: data_yolo_08_07v1_80_n_20\images\train\bird (4)_7280_transform.jpg
Удален файл: data_yolo_08_07v1_80_n_20\images\train\6450634707.jpg
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\middle-20230831132011-2.txt
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\bird (4)_1560_transform.txt
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\bird (6)_175675_transform.txt
Удален файл: data_yolo_08_07v1_80_n_20\images\train\6321.970.jpg
Удален файл: data_yolo_08_07v1_80_n_20\labels\train\bird (6)_167167.txt
Удален файл: data_yolo_08_07v1_80_n_20\images\train\beach-sea-coast-ocean-horizon-cloud-wave-wind-seabird-vehicle-flight-atmosphere-of-earth-wind-wave-120404_transform.jpg
Уд

In [15]:
import os
import glob
import shutil
from collections import defaultdict

class_names = ["bidr", "helicopter", "airplane", "drone", "ballon", "ballon_c"]

def delete_excess_class_data(train_labels_folder, train_images_folder, 
                             val_labels_folder, val_images_folder, 
                             max_samples_per_class=2000,
                             max_val_ratio=0.2): 
    """
    Удаляет лишние изображения и аннотации, если количество объектов класса 
    превышает заданное значение. Удаляет избыточные объекты из валидационной 
    выборки, если их количество превышает заданное соотношение 
    относительно обучающей выборки. Записывает результаты в файл 'class_statistics.txt'.

    Args:
        train_labels_folder (str): Путь к папке с аннотациями train (labels).
        train_images_folder (str): Путь к папке с изображениями train (images).
        val_labels_folder (str): Путь к папке с аннотациями val (labels).
        val_images_folder (str): Путь к папке с изображениями val (images).
        max_samples_per_class (int): Максимальное количество образцов для каждого класса.
        max_val_ratio (float): Максимальное соотношение объектов в val к train (0.0 - 1.0).
    """

    class_counts_train = defaultdict(int)
    class_counts_val = defaultdict(int)
    files_to_delete = []

    # --- Обработка train ---
    # Подсчет объектов в train
    for txt_file in glob.glob(os.path.join(train_labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                class_counts_train[class_id] += 1

    # Удаление избыточных объектов из train (если необходимо)
    for txt_file in glob.glob(os.path.join(train_labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                if class_counts_train[class_id] > max_samples_per_class:
                    files_to_delete.append(txt_file)
                    image_file = os.path.join(train_images_folder, os.path.basename(txt_file).replace('.txt', '.jpg'))
                    files_to_delete.append(image_file)

    # --- Обработка val ---
    # Подсчет объектов в val
    for txt_file in glob.glob(os.path.join(val_labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                class_counts_val[class_id] += 1

    # Удаление избыточных объектов из val (если необходимо)
    for txt_file in glob.glob(os.path.join(val_labels_folder, '*.txt')):
        with open(txt_file, 'r') as f:
            for line in f:
                class_id = int(line.split()[0])
                # Проверка соотношения val/train
                if class_counts_val[class_id] > max_val_ratio * class_counts_train.get(class_id, 0): 
                    files_to_delete.append(txt_file)
                    image_file = os.path.join(val_images_folder, os.path.basename(txt_file).replace('.txt', '.jpg'))
                    files_to_delete.append(image_file)

    # --- Удаление файлов ---
    for file_path in set(files_to_delete): 
        try:
            os.remove(file_path)
            print(f"Удален файл: {file_path}")
        except FileNotFoundError:
            print(f"Файл не найден: {file_path}")

    # --- Запись статистики в файл ---
    with open('class_statistics.txt', 'w') as f:
        f.write("Количество объектов в train:\n")
        for class_id, count in class_counts_train.items():
            f.write(f"- {class_names[class_id]}: {count}\n")

        f.write("\nКоличество объектов в val:\n")
        for class_id, count in class_counts_val.items():
            f.write(f"- {class_names[class_id]}: {count}\n")

# Пути к папкам с данными
base_folder = 'data_yolo_03_07v2'
train_labels_folder = os.path.join(base_folder, 'labels', 'train')
train_images_folder = os.path.join(base_folder, 'images', 'train')
val_labels_folder = os.path.join(base_folder, 'labels', 'val')
val_images_folder = os.path.join(base_folder, 'images', 'val')

# Удаляем лишние данные и записываем статистику в файл
delete_excess_class_data(train_labels_folder, train_images_folder,
                         val_labels_folder, val_images_folder) 

Удален файл: data_yolo_03_07v2\images\val\airplane (7)_72000.jpg
Удален файл: data_yolo_03_07v2\images\val\helicopter (4)_48000_transform.jpg
Удален файл: data_yolo_03_07v2\images\val\drone (7)_4000.jpg
Удален файл: data_yolo_03_07v2\labels\val\bird1 (2)_14000_transform.txt
Удален файл: data_yolo_03_07v2\labels\val\bird (5)_24500_transform.txt
Удален файл: data_yolo_03_07v2\labels\val\ballon (3)_32000.txt
Удален файл: data_yolo_03_07v2\images\val\drone (3)_20166.jpg
Удален файл: data_yolo_03_07v2\images\val\ballon (1)_28000.jpg
Удален файл: data_yolo_03_07v2\labels\val\helicopter (6)_78000.txt
Удален файл: data_yolo_03_07v2\images\val\airplane (1)_12000.jpg
Удален файл: data_yolo_03_07v2\images\val\bird (5)_36000_transform.jpg
Удален файл: data_yolo_03_07v2\images\val\ballon (9)_6000.jpg
Удален файл: data_yolo_03_07v2\labels\val\bird (1)_15500.txt
Удален файл: data_yolo_03_07v2\labels\val\drone (7)_56000.txt
Удален файл: data_yolo_03_07v2\labels\val\airplane (3)_16000.txt
Удален файл: 

# ПОдсчёт количества с удаленем наше

In [71]:
import os
def read_txt_file(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            content = file.read()
            return content
    except FileNotFoundError:
        print(f"Файл '{file_path}' не найден.")
        return None
    except IOError:
        print(f"Ошибка ввода-вывода при чтении файла '{file_path}'.")
        return None
def get_files_in_directory(directory):
    files = []
    # Проверяем, что директория существует
    if os.path.exists(directory):
        # Получаем список всех файлов и папок в указанной директории
        for file in os.listdir(directory):
            # Проверяем, является ли объект файлом
            if os.path.isfile(os.path.join(directory, file)):
                files.append(file)
    else:
        print(f"Директория '{directory}' не существует.")

    return files

name_classes={'0':'bird','1':'helicopter','2':'airplane','3':'drone','4':'ballon','5':'ballon_c'}
nubmer_of_Classes={'bird':0,'helicopter':0,'airplane':0,'drone':0,'ballon':0,'ballon_c':0}
# Пример использования функции
#directory_path = 'data_yolo_08_07v1_80_n_20/labels/train/'
directory_path='data_yolo_08_07v1/labels/train/'
files_list = get_files_in_directory(directory_path)

#print(f"Файлы в директории '{directory_path}':")
for file_name in files_list:
    
    with open(directory_path+file_name, 'r') as f:
        for line in f:
            class_id = int(line.split()[0])
           
            nubmer_of_Classes[name_classes[str(class_id)]]=nubmer_of_Classes[name_classes[str(class_id)]]+1
   
print("nubmer of classes",nubmer_of_Classes) 
List_of_names=[]
for test in nubmer_of_Classes:
    
    if(nubmer_of_Classes[test])>=1000:
        #print("больше 1000")
        print("Сейчас идёт по птицам",test)
        for file_name in files_list:
    
            with open(directory_path+file_name, 'r') as f:
                for line in f:
                    class_id = int(line.split()[0])
                    #print(name_classes[str(class_id)])

                    if test==name_classes[str(class_id)]:
                        #print("Должен удалить",'data_yolo_08_07v1_80_n_20/labels/train/'+file_name)
                        #print("Должен удалить",'data_yolo_08_07v1_80_n_20/images/train/'+file_name[:-3]+'jpg')
                        if(nubmer_of_Classes[test])>1000:
                            nubmer_of_Classes[test]=nubmer_of_Classes[test]-1
                            List_of_names.append(directory_path+file_name)
                            List_of_names.append('data_yolo_08_07v1/images/train/'+file_name[:-3]+'jpg')
                        
                        #os.remove('data_yolo_08_07v1_80_n_20/labels/train/'+file_name)
                        #os.remove('data_yolo_08_07v1_80_n_20/images/train/'+file_name[:-3]+'jpg')
                        f.close
print("nubmer of classes",nubmer_of_Classes) 
print(len(List_of_names))
for name in List_of_names:
    try:
        os.remove(name)
        print("name deleted:",name)
    except:
        print("что-то не так с",name)

nubmer of classes {'bird': 2921, 'helicopter': 954, 'airplane': 1851, 'drone': 629, 'ballon': 1047, 'ballon_c': 1026}
Сейчас идёт по птицам bird
Сейчас идёт по птицам airplane
Сейчас идёт по птицам ballon
Сейчас идёт по птицам ballon_c
nubmer of classes {'bird': 1000, 'helicopter': 954, 'airplane': 1000, 'drone': 629, 'ballon': 1000, 'ballon_c': 1000}
5690
name deleted: data_yolo_08_07v1/labels/train/ballon (9)_10000.txt
name deleted: data_yolo_08_07v1/images/train/ballon (9)_10000.jpg
name deleted: data_yolo_08_07v1/labels/train/ballon (9)_10000_transform.txt
name deleted: data_yolo_08_07v1/images/train/ballon (9)_10000_transform.jpg
name deleted: data_yolo_08_07v1/labels/train/ballon (9)_4000.txt
name deleted: data_yolo_08_07v1/images/train/ballon (9)_4000.jpg
что-то не так с data_yolo_08_07v1/labels/train/ballon (9)_4000.txt
что-то не так с data_yolo_08_07v1/images/train/ballon (9)_4000.jpg
что-то не так с data_yolo_08_07v1/labels/train/ballon (9)_4000.txt
что-то не так с data_yolo_

In [1]:
def read_txt_file(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            content = file.read()
            return content
    except FileNotFoundError:
        print(f"Файл '{file_path}' не найден.")
        return None
    except IOError:
        print(f"Ошибка ввода-вывода при чтении файла '{file_path}'.")
        return None
def get_files_in_directory(directory):
    files = []
    # Проверяем, что директория существует
    if os.path.exists(directory):
        # Получаем список всех файлов и папок в указанной директории
        for file in os.listdir(directory):
            # Проверяем, является ли объект файлом
            if os.path.isfile(os.path.join(directory, file)):
                files.append(file)
    else:
        print(f"Директория '{directory}' не существует.")

    return files

name_classes={'0':'bird','1':'helicopter','2':'airplane','3':'drone','4':'ballon','5':'ballon_c'}
nubmer_of_Classes={'bird':0,'helicopter':0,'airplane':0,'drone':0,'ballon':0,'ballon_c':0}
# Пример использования функции
#directory_path = 'data_yolo_08_07v1_80_n_20/labels/train/'
directory_path='data_yolo_08_07v1/labels/train/'
files_list = get_files_in_directory(directory_path)

#print(f"Файлы в директории '{directory_path}':")
for file_name in files_list:
    
    with open(directory_path+file_name, 'r') as f:
        for line in f:
            class_id = int(line.split()[0])
           
            nubmer_of_Classes[name_classes[str(class_id)]]=nubmer_of_Classes[name_classes[str(class_id)]]+1
   
print("nubmer of classes",nubmer_of_Classes) 

NameError: name 'os' is not defined

In [7]:
def read_txt_file(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            content = file.read()
            return content
    except FileNotFoundError:
        print(f"Файл '{file_path}' не найден.")
        return None
    except IOError:
        print(f"Ошибка ввода-вывода при чтении файла '{file_path}'.")
        return None

# Пример использования функции для чтения файла
file_path = 'data_yolo_08_07v1_80_n_20/labels/train/-Pi-_QdI2K4_transform.txt'
file_content = read_txt_file(file_path)

if file_content is not None:
    print(f"Содержимое файла '{file_path}':")
    print(file_content[0])


Содержимое файла 'data_yolo_08_07v1_80_n_20/labels/train/-Pi-_QdI2K4_transform.txt':
0


# Перенос файлов трансофрм

In [6]:
import os
import shutil

# Это функция, которая ищет и перемещает файлы
def move_transform_files(src_folder, dst_folder):
    # Проверяем, существует ли исходная папка
    if not os.path.exists(src_folder):
        print(f"Папка {src_folder} не существует.")  # Говорим, что папка не найдена
        return

    # Проверяем, существует ли целевая папка, если нет - создаем её
    if not os.path.exists(dst_folder):
        os.makedirs(dst_folder)  # Создаем папку, если её нет
    
    # Берем все файлы и папки внутри исходной папки
    for filename in os.listdir(src_folder):
        # Полный путь к файлу или папке
        src_path = os.path.join(src_folder, filename)
        
        # Если это файл и в его названии есть слово "transform"
        if os.path.isfile(src_path) and 'transform' in filename:
            # Полный путь к новому месту для файла
            dst_path = os.path.join(dst_folder, filename)
            
            # Перемещаем файл в новую папку
            shutil.move(src_path, dst_path)
            print(f"Файл {filename} перемещен в папку {dst_folder}")  # Говорим, что файл перемещен

# Путь к исходной папке, где ищем файлы
source_folder = 'data_yolo_08_07v2/images/val'  # Замените это на путь к вашей исходной папке
# Путь к новой папке, куда перемещаем файлы
destination_folder = 'data_yolo_08_07v2/images/train'  # Замените это на путь к вашей целевой папке

# Запускаем функцию для перемещения файлов
move_transform_files(source_folder, destination_folder)


Файл ballon (8)_2000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (8)_4000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (8)_6000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (9)_12000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (9)_14000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (9)_2000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл ballon (9)_6000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл caTiz-rXrac_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл drone (2)_4000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл drone (4)_28000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл drone (4)_30000_transform.jpg перемещен в папку data_yolo_08_07v2/images/train
Файл drone (4)_32000_transform.jpg перемещен в папку data_yolo_08_07v2/images/t

In [138]:
import os

def check_files_in_directories(dir1, dir2, start_words):
    def find_files_with_prefix(directory, prefix):
        matched_files = []
        for root, dirs, files in os.walk(directory):
            for file in files:
                if file.startswith(prefix):
                    matched_files.append(os.path.join(root, file))
        return matched_files

    found_in_dir1 = any(find_files_with_prefix(dir1, word) for word in start_words)
    found_in_dir2 = any(find_files_with_prefix(dir2, word) for word in start_words)

    return found_in_dir1, found_in_dir2

def count_matching_files_in_directories(dir1, dir2, start_words):
    def find_files_with_prefix(directory, prefix):
        matched_files = []
        for root, dirs, files in os.walk(directory):
            for file in files:
                if file.startswith(prefix):
                    matched_files.append(os.path.basename(file))
        return matched_files

    # Создаем список всех файлов, начинающихся на указанные слова в обеих папках
    dir1_files = {file for word in start_words for file in find_files_with_prefix(dir1, word)}
    dir2_files = {file for word in start_words for file in find_files_with_prefix(dir2, word)}
    print("в папке train",len(dir1_files))
    print("в папке val",len(dir2_files))
    # Подсчитываем количество совпадающих файлов
    matching_files_count = len(dir1_files & dir2_files)

    return matching_files_count

# Пример использования:
dir1_path = 'data_yolo_08_07v2_1/images/train'
dir2_path = 'data_yolo_08_07v2_1/images/val'

start_words = ['bidr (1)', 'word2', 'word3']

found_in_dir1, found_in_dir2 = check_files_in_directories(dir1_path, dir2_path, start_words)
matching_files_count = count_matching_files_in_directories(dir1_path, dir2_path, start_words)

print(f"Found in directory 1: {found_in_dir1}")
print(f"Found in directory 2: {found_in_dir2}")
print(f"Number of matching files: {matching_files_count}")

в папке train 0
в папке val 0
Found in directory 1: False
Found in directory 2: False
Number of matching files: 0


In [131]:
import os
import shutil

def find_and_move_files_with_same_name(dir1, dir2, start_words):
    def find_files_with_prefix(directory, prefix):
        matched_files = []
        for root, dirs, files in os.walk(directory):
            for file in files:
                if file.startswith(prefix):
                    matched_files.append(os.path.join(root, file))
        return matched_files

    # Создаем список всех файлов, начинающихся на указанные слова в обеих папках
    dir1_files = {os.path.basename(file): file for word in start_words for file in find_files_with_prefix(dir1, word)}
    dir2_files = {os.path.basename(file): file for word in start_words for file in find_files_with_prefix(dir2, word)}
    print(dir1_files)
    print(dir2_files)
    # Перемещаем файлы с одинаковыми именами из второй папки в первую
    for file_name, file_path in dir2_files.items():
        #if file_name in dir1_files:
        shutil.move(file_path, os.path.join(dir1, file_name))
        print(f"Moved {file_name} from {dir2} to {dir1}")

# Пример использования:
dir1_path = 'data_yolo_08_07v2_1/images/train'
dir2_path = 'data_yolo_08_07v2_1/images/val'
start_words = ['helicopter (5)', 'word2', 'word3']

find_and_move_files_with_same_name(dir1_path, dir2_path, start_words)

{'helicopter (5)_10000.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_10000.jpg', 'helicopter (5)_100000.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_100000.jpg', 'helicopter (5)_100000_transform.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_100000_transform.jpg', 'helicopter (5)_10000_transform.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_10000_transform.jpg', 'helicopter (5)_102000.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_102000.jpg', 'helicopter (5)_102000_transform.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_102000_transform.jpg', 'helicopter (5)_104000.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_104000.jpg', 'helicopter (5)_104000_transform.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_104000_transform.jpg', 'helicopter (5)_106000.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_106000.jpg', 'helicopter (5)_106000_transform.jpg': 'data_yolo_08_07v2_1/images/train\\helicopter (5)_106000

In [139]:
import os
import shutil

def get_file_names(directory):
    """Получает имена файлов без расширения из указанной директории."""
    file_names = set()
    for root, dirs, files in os.walk(directory):
        for file in files:
            file_name, _ = os.path.splitext(file)
            file_names.add(file_name)
    return file_names

def move_matching_files(src_dir, dst_dir, matching_names):
    """Перемещает файлы из src_dir в dst_dir, если их имена (без расширения) находятся в matching_names."""
    moved_files_count = 0
    for root, dirs, files in os.walk(src_dir):
        for file in files:
            file_name, _ = os.path.splitext(file)
            if file_name in matching_names:
                src_path = os.path.join(root, file)
                dst_path = os.path.join(dst_dir, file)
                shutil.move(src_path, dst_path)
                moved_files_count += 1
                print(f"Moved {file} from {src_dir} to {dst_dir}")
    return moved_files_count

# Пути к директориям
train_images_dir = 'data_yolo_08_07v2_1/images/train'
val_images_dir = 'data_yolo_08_07v2_1/images/val'
train_labels_dir = 'data_yolo_08_07v2_1/labels/train'
val_labels_dir = 'data_yolo_08_07v2_1/labels/val'

# Получаем имена файлов без расширения из директорий с изображениями
train_image_names = get_file_names(train_images_dir)
val_image_names = get_file_names(val_images_dir)

# Перемещаем файлы разметок в соответствующие директории
moved_train_labels_count = move_matching_files(train_labels_dir, train_labels_dir, train_image_names)
moved_val_labels_count = move_matching_files(val_labels_dir, val_labels_dir, val_image_names)

print(f"Number of matching train labels moved: {moved_train_labels_count}")
print(f"Number of matching val labels moved: {moved_val_labels_count}")


Moved 08-02-2019-8-07-40.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 10.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 1006569_full.jpeg.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 10_transform.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 11.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 11939229t1hf7d6.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 11_transform.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 1200x600_0x108_wide_crop_20201021170947_d6c1e95f_b561f36e4190470e3317a4f8e7e17a4fca14dbe571da2eb150d01a27d4258311.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 12312415.txt from data_yolo_08_07v2_1/labels/train to data_yolo_08_07v2_1/labels/train
Moved 123maxresdefault.txt from data