In [40]:
import os
import random
import shutil
import math

def split_files(source_folder, train_folder, test_folder, split_ratio):
    
    # 대상 폴더들이 없으면 생성
    if not os.path.exists(train_folder):
        os.makedirs(train_folder)
    if not os.path.exists(test_folder):
        os.makedirs(test_folder)
    
    # train 폴더 안에 barking과 whining 폴더 생성
    train_barking_folder = os.path.join(train_folder, 'barking')
    train_whining_folder = os.path.join(train_folder, 'whining')
    if not os.path.exists(train_barking_folder):
        os.makedirs(train_barking_folder)
    
    if not os.path.exists(train_whining_folder):
        os.makedirs(train_whining_folder)
    
    # test 폴더 안에 barking과 whining 폴더 생성
    test_barking_folder = os.path.join(test_folder, 'barking')
    test_whining_folder = os.path.join(test_folder, 'whining')
    if not os.path.exists(test_barking_folder):
        os.makedirs(test_barking_folder)
    
    if not os.path.exists(test_whining_folder):
        os.makedirs(test_whining_folder)

    
    # 소스 폴더 내의 모든 파일 리스트 가져오기
    source_list = os.listdir(source_folder)
    
    # 파일을 랜덤하게 섞음
    random.shuffle(source_list)
    # 분할 인덱스 계산 (소수점 올림)
    split_index = math.ceil(len(source_list) * split_ratio)

    
    # 80%의 파일을 train 폴더로 이동 또는 복사
    for file_name in source_list[:split_index]:
        source_file = os.path.join(source_folder, file_name)
        if 'whining' in file_name:
            destination_file = os.path.join(train_whining_folder, file_name)
        else:
            destination_file = os.path.join(train_barking_folder, file_name)
        if os.path.isfile(source_file):
            shutil.move(source_file, destination_file)
            print(f"{source_file}을(를) {destination_file}로 이동했습니다.")
    
    # 20%의 파일을 test 폴더로 이동 또는 복사
    for file_name in source_list[split_index:]:
        source_file = os.path.join(source_folder, file_name)
        if 'whining' in file_name:
            destination_file = os.path.join(test_whining_folder, file_name)
        else:
            destination_file = os.path.join(test_barking_folder, file_name)
        if os.path.isfile(source_file):
            shutil.move(source_file, destination_file)
            print(f"{source_file}을(를) {destination_file}로 이동했습니다.")
       

# 원본 폴더 경로
whining_folder = './whining_2'
barking_folder = './barking_2'

# train 폴더 경로
train_folder = './train4'

# test 폴더 경로
test_folder = './test4'

# 분할 비율 (0.8: train, 0.2: test)
split_ratio = 0.8

# 파일 분할 실행
split_files(whining_folder, train_folder, test_folder, split_ratio)
split_files(barking_folder, train_folder, test_folder, split_ratio)


./whining_2/whining (429).wav을(를) ./train4/whining/whining (429).wav로 이동했습니다.
./whining_2/whining (131).wav을(를) ./train4/whining/whining (131).wav로 이동했습니다.
./whining_2/whining (98).wav을(를) ./train4/whining/whining (98).wav로 이동했습니다.
./whining_2/whining (158).wav을(를) ./train4/whining/whining (158).wav로 이동했습니다.
./whining_2/whining (222).wav을(를) ./train4/whining/whining (222).wav로 이동했습니다.
./whining_2/whining (246).wav을(를) ./train4/whining/whining (246).wav로 이동했습니다.
./whining_2/whining (275).wav을(를) ./train4/whining/whining (275).wav로 이동했습니다.
./whining_2/whining (406).wav을(를) ./train4/whining/whining (406).wav로 이동했습니다.
./whining_2/whining (72).wav을(를) ./train4/whining/whining (72).wav로 이동했습니다.
./whining_2/whining (207).wav을(를) ./train4/whining/whining (207).wav로 이동했습니다.
./whining_2/whining (379).wav을(를) ./train4/whining/whining (379).wav로 이동했습니다.
./whining_2/whining (37).wav을(를) ./train4/whining/whining (37).wav로 이동했습니다.
./whining_2/whining (336).wav을(를) ./train4/whining/whining (336).wav로 