In [1]:
import os
import shutil
from pycocotools.coco import COCO
from tqdm import tqdm

# Путь к аннотациям COCO датасета
dataDir = 'D:/COCO Dataset'
dataType = 'train2017'  # Или другой тип данных, например, 'val2017' или 'test2017'

# Путь к папке, где будут сохранены изображения с людьми
person_dir = 'D:/Data/Train/Person'
# Путь к папке, где будут сохранены изображения заднего фона
background_dir = 'D:/Data/Train/Background'

# Ограничение на количество фотографий
max_person_images = 25000  # Максимальное количество фотографий с людьми для копирования
max_background_images = 25000  # Максимальное количество фотографий заднего фона для копирования

# Загрузка аннотаций COCO
annFile = os.path.join(dataDir, 'annotations', f'instances_{dataType}.json')
coco = COCO(annFile)

# Получение идентификаторов категорий
catIds = coco.getCatIds(catNms=['person'])
imgIds = coco.getImgIds(catIds=catIds)  # Ограничение количества фотографий с людьми

# Вывод информации о количестве изображений с людьми
print(f"Найдено {len(imgIds)} изображений с людьми.")
# Извлечение фотографий с людьми
print("Копирование изображений с людьми...")
for imgId in tqdm(imgIds):
    imgInfo = coco.loadImgs(imgId)[0]
    imgPath = os.path.join(dataDir, dataType, imgInfo['file_name'])
    shutil.copy(imgPath, person_dir)

# Вывод информации о количестве скопированных изображений с людьми
print(f"Скопировано {len(imgIds)} изображений с людьми.")

# Получение идентификаторов фотографий без людей
imgIds_all = coco.getImgIds()
imgIds_background = list(set(imgIds_all) - set(imgIds)) # Ограничение количества фотографий без людей

# Вывод информации о количестве фотографий без людей
print(f"Найдено {len(imgIds_background)} фотографий без людей.")

print("Копирование фотографий без людей...")
for imgId in tqdm(imgIds_background):
    imgInfo = coco.loadImgs(imgId)[0]
    imgPath = os.path.join(dataDir, dataType, imgInfo['file_name'])
    shutil.copy(imgPath, background_dir)

# Вывод информации о количестве скопированных фотографий без людей
print(f"Скопировано {len(imgIds_background)} фотографий без людей.")

loading annotations into memory...
Done (t=27.03s)
creating index...
index created!
Найдено 64115 изображений с людьми.
Копирование изображений с людьми...


100%|██████████| 64115/64115 [1:06:11<00:00, 16.14it/s]


Скопировано 64115 изображений с людьми.
Найдено 54172 фотографий без людей.
Копирование фотографий без людей...


100%|██████████| 54172/54172 [52:09<00:00, 17.31it/s]

Скопировано 54172 фотографий без людей.



