In [2]:
import os
import shutil
import random
from pathlib import Path
from tqdm import tqdm

# ✅ 경로 설정 -----------------------------------------------------------------
# base_dir를 기준으로 모든 하위 경로를 Path 객체로 정의합니다.
base_dir = Path(r'D:\golfDataset\dataset\test')    # test 폴더 기준, train 원하면 train
true_dir = base_dir / 'true'  # true 비디오들이 있는 곳
false_dir = base_dir / 'false'  # false 비디오들이 있는 곳

# mp4_dir는 true_dir 내의 'video' 폴더를 가리킵니다.
true_mp4_dir = true_dir / 'video'
false_mp4_dir = false_dir / 'video'  # false 비디오들이 있는 곳

# balanced_dir와 save_mp4_dir도 base_dir를 기준으로 정의합니다.
balanced_dir = base_dir / 'balanced_true'
save_mp4_dir = balanced_dir / 'video'  # 선택된 true 비디오를 저장할 곳

# 비디오 저장 폴더를 생성합니다.
save_mp4_dir.mkdir(parents=True, exist_ok=True)

# ✅ 무작위 추출 ---------------------------------------------------------------
# false 비디오 수에 맞춰 true 비디오를 무작위로 선택
# false_dir에 있는 파일의 수를 세어 num_to_select를 설정합니다.
num_to_select = len(list(false_mp4_dir.iterdir()))  # false 비디오 수에 맞춰 true 비디오 수 설정 (폴더 내 모든 항목)

# mp4_dir 내의 .mp4 파일만 필터링합니다.
mp4_files = [f for f in true_mp4_dir.iterdir() if f.is_file() and f.suffix.lower() == '.mp4']
print(f'총 true 비디오 수: {len(mp4_files)}')

if len(mp4_files) < num_to_select:
    raise ValueError(f'true 비디오가 {num_to_select}개보다 적습니다.')

random.shuffle(mp4_files)
selected_videos = mp4_files[:num_to_select]

# ✅ 파일 복사(또는 이동) -------------------------------------------------------
for vid_path in tqdm(selected_videos, desc='Copying selected mp4 files'):
    # Path 객체를 사용하므로 바로 src와 dst를 조합할 수 있습니다.
    src = vid_path
    dst = save_mp4_dir / vid_path.name
    shutil.copy2(src, dst)  # ➡️ 만약 '이동'이 필요하면 shutil.move(src, dst) 사용

print("비디오 분류 및 복사 완료.")

총 true 비디오 수: 169


Copying selected mp4 files: 100%|██████████| 1/1 [00:00<00:00, 45.79it/s]

비디오 분류 및 복사 완료.



