使用 Python 脚本遍历源目录中的所有子文件夹，找到所有的 .mp4 文件并将它们复制到目标目录。

In [None]:
import os
import shutil
import glob
from tqdm import tqdm

def copy_all_mp4_files(source_root, destination_root):
    # 检查源目录是否存在
    if not os.path.exists(source_root):
        raise ValueError('Source directory does not exist')
    
    # 如果目标目录不存在，则创建
    if not os.path.exists(destination_root):
        os.makedirs(destination_root)

    # 获取所有 mp4 文件列表
    mp4_files = [os.path.join(root, file)
                 for root, dirs, files in os.walk(source_root)
                 for file in files if file.endswith('.mp4')]

    # 使用 tqdm 显示进度条
    for source_file in tqdm(mp4_files, desc="Copying mp4 files", unit="file"):
        # 构建目标文件路径
        destination_file = os.path.join(destination_root, os.path.basename(source_file))
        # 复制文件
        shutil.copy2(source_file, destination_file)
        print(f"Copied {source_file} to {destination_file}")

if __name__ == '__main__':
    source_root = '/pfs/mt-1oY5F7/luoyihao/project/DJL/dataset_raw/B站视频数据'
    destination_root = '/pfs/mt-1oY5F7/luoyihao/project/DJL/dataset/dataset_from_bilibili'
    copy_all_mp4_files(source_root, destination_root)
    print("All mp4 files have been copied successfully.")
