In [1]:
import json
import os
import shutil  # Thư viện để copy file
from pycocotools.coco import COCO

In [2]:
def copy_annotated_images(image_dir, annotation_file, output_dir):
    """
    Sao chép các ảnh có trong file annotation từ thư mục gốc sang thư mục khác.

    Args:
        image_dir: Đường dẫn đến thư mục chứa tất cả ảnh (thư mục gốc).
        annotation_file: Đường dẫn đến file COCO JSON annotation.
        output_dir: Đường dẫn đến thư mục đầu ra (ảnh sẽ được sao chép vào đây).
    """

    # Tạo thư mục đầu ra nếu chưa tồn tại
    os.makedirs(output_dir, exist_ok=True)

    # Load annotations
    with open(annotation_file, 'r') as f:
        coco_data = json.load(f)

    # Lấy danh sách tên file ảnh từ annotations
    image_filenames = [img['file_name'] for img in coco_data['images']]

    # Lặp qua danh sách tên file và copy ảnh
    for filename in image_filenames:
        src_path = os.path.join(image_dir, filename)  # Đường dẫn đầy đủ đến ảnh gốc
        dst_path = os.path.join(output_dir, filename)  # Đường dẫn đầy đủ đến nơi lưu bản sao

        # Kiểm tra xem file có tồn tại không (đề phòng trường hợp lỗi)
        if os.path.exists(src_path):
            shutil.copy2(src_path, dst_path)  # Copy file (giữ nguyên metadata)
            print(f"Đã sao chép: {src_path} -> {dst_path}")
        else:
            print(f"Không tìm thấy file: {src_path}")

In [16]:
# Thay đổi các đường dẫn cho phù hợp
image_dir = './ChessPieces_Dataset/train/Pawn' 
annotation_file = './annotations/Pawn/pawn_train_coco.json'  
output_dir = './dataset/train/images'  

In [17]:
copy_annotated_images(image_dir, annotation_file, output_dir)

Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_1.jpg -> ./dataset/train/images\brightness_normalized_pawn_1.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_100.jpg -> ./dataset/train/images\brightness_normalized_pawn_100.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_102.jpg -> ./dataset/train/images\brightness_normalized_pawn_102.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_103.jpg -> ./dataset/train/images\brightness_normalized_pawn_103.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_105.jpg -> ./dataset/train/images\brightness_normalized_pawn_105.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_106.jpg -> ./dataset/train/images\brightness_normalized_pawn_106.jpg
Đã sao chép: ./ChessPieces_Dataset/train/Pawn\brightness_normalized_pawn_107.jpg -> ./dataset/train/images\brightness_normalized_pawn_107.jpg
Đã sao ché