In [1]:
import pandas as pd
import os
import shutil
import random



In [2]:
# ====== CẤU HÌNH ======
ROOT = "eyepacs_2015"
TRAIN_DIR = os.path.join(ROOT, "train")
VAL_DIR   = os.path.join(ROOT, "val")
CLASSES = [str(i) for i in range(5)]   # ["0","1","2","3","4"]
N_PER_CLASS = 200
MOVE_FILES = True                      # True=move, False=copy
RANDOM_SEED = 42
IMAGE_EXTS = {".jpg", ".jpeg", ".png"}
random.seed(RANDOM_SEED)

In [None]:
summary = {}
cls="0"
src_dir = os.path.join(TRAIN_DIR, cls)
dst_dir = os.path.join(VAL_DIR, cls)
os.makedirs(dst_dir, exist_ok=True)

if not os.path.isdir(src_dir):
    print(f"Không thấy thư mục: {src_dir}")
    summary[cls] = (0, 0)

In [None]:
def get_unique_path(dst_path):
    """Nếu file trùng tên tự thêm _1, _2,... trước phần mở rộng."""
    if not os.path.exists(dst_path):
        return dst_path
    base, ext = os.path.splitext(dst_path)
    i = 1
    new_path = f"{base}_{i}{ext}"
    while os.path.exists(new_path):
        i += 1
        new_path = f"{base}_{i}{ext}"
    return new_path

os.makedirs(VAL_DIR, exist_ok=True)

summary = {}
for cls in CLASSES:
    src_dir = os.path.join(TRAIN_DIR, cls)
    dst_dir = os.path.join(VAL_DIR, cls)
    os.makedirs(dst_dir, exist_ok=True)

    if not os.path.isdir(src_dir):
        print(f"[Cảnh báo] Không thấy thư mục: {src_dir}")
        summary[cls] = (0, 0)
        continue

    # Lấy danh sách file ảnh
    files = [
        f for f in os.listdir(src_dir)
        if os.path.splitext(f)[1].lower() in IMAGE_EXTS
    ]
    # files=[]
    # for f in os.listdir(src_dir):
        
    #     print (f)
    #     files.append(f)

    if len(files) == 0:
        print(f"Không có ảnh trong: {src_dir}")
        summary[cls] = (0, 0)
        continue

    k = min(N_PER_CLASS, len(files))
    pick = random.sample(files, k)

    moved = 0
    for fname in pick:
        src = os.path.join(src_dir, fname)
        dst = os.path.join(dst_dir, fname)
        dst = get_unique_path(dst)  # tránh đè file nếu trùng tên

        if MOVE_FILES:
            shutil.move(src, dst)
        else:
            shutil.copy2(src, dst)
        moved += 1

    summary[cls] = (k, moved)
    action = "moved" if MOVE_FILES else "copied"
    print(f"[{cls}] {action}: {moved}/{k}")

# In tổng kết
total = sum(m for _, m in summary.values())
print("\n===== TỔNG KẾT =====")
for cls, (k, m) in summary.items():
    print(f"Lớp {cls}: chọn {k}, đưa vào val {m}")
print(f"Tổng ảnh đưa vào val: {total}")

# Đếm lại số ảnh trong val sau khi chia
val_counts = {}
for cls in CLASSES:
    d = os.path.join(VAL_DIR, cls)
    if os.path.isdir(d):
        cnt = sum(
            1 for f in os.listdir(d)
            if os.path.isfile(os.path.join(d, f))
            and os.path.splitext(f)[1].lower() in IMAGE_EXTS
        )
        val_counts[cls] = cnt
print("\nSố ảnh hiện có trong eyepascs_2015/val:")
for cls in CLASSES:
    print(f" - {cls}: {val_counts.get(cls, 0)}")

[0] moved: 200/200
[1] moved: 200/200
[2] moved: 200/200
[3] moved: 200/200
[4] moved: 200/200

===== TỔNG KẾT =====
Lớp 0: chọn 200, đưa vào val 200
Lớp 1: chọn 200, đưa vào val 200
Lớp 2: chọn 200, đưa vào val 200
Lớp 3: chọn 200, đưa vào val 200
Lớp 4: chọn 200, đưa vào val 200
Tổng ảnh đưa vào val: 1000

Số ảnh hiện có trong eyepascs_2015/val:
 - 0: 200
 - 1: 200
 - 2: 200
 - 3: 200
 - 4: 200


In [None]:
files = [
    f for f in os.listdir("eyepacs_2015/train/4")
    if os.path.isfile(os.path.join(src_dir, f))
    ]
print(files)
print(os.path.isfile(os.path.join("eyepacs_2015/train/4", "16413_right.jpg")))
if len(files) == 0:
    print(f"Không có ảnh trong: {src_dir}")
    summary[cls] = (0, 0)

[]
True
[Cảnh báo] Không có ảnh trong: eyepascs_2015/train/4
