In [3]:
import tarfile
import os

def extract_tar_file(file_path, extract_path='.'):
    """
    주어진 tar 파일의 압축을 풉니다.

    Parameters:
    file_path (str): 압축을 풀 tar 파일의 경로
    extract_path (str): 파일을 추출할 경로. 기본값은 현재 디렉토리('.')

    Returns:
    None
    """
    try:
        # tar 파일 열기
        with tarfile.open(file_path, 'r:*') as tar:
            # 모든 파일 압축 풀기
            tar.extractall(path=extract_path)
    except Exception as e:
        print(f"압축 해제 중 오류가 발생했습니다: {e}")

def extract_all_tar_files_in_folder(folder_path, base_extract_path='.'):
    """
    주어진 폴더 내 모든 tar 파일을 찾아 압축을 풉니다.
    각 tar 파일은 '[원천]파일이름.tar' 형식으로 주어지며,
    파일 이름에 기반한 폴더를 생성하여 그 폴더에 압축을 풉니다.

    Parameters:
    folder_path (str): tar 파일들이 있는 폴더의 경로
    base_extract_path (str): 기본 추출 경로. 기본값은 현재 디렉토리('.')

    Returns:
    None
    """
    # 폴더 내 tar 파일 목록 가져오기
    tar_files = [f for f in os.listdir(folder_path) if f.endswith(('.tar', '.tar.gz', '.tar.bz2'))]
    total_files = len(tar_files)
    
    if total_files == 0:
        print("압축을 풀 tar 파일이 없습니다.")
        return

    for i, file_name in enumerate(tar_files):
        tar_file_path = os.path.join(folder_path, file_name)
        
        # 파일 이름에서 '[xx]' 뒤에 있는 이름 추출
        # if ']' in file_name:
        #     folder_name = file_name.split(']')[1].replace('.tar', '').replace('.tar.gz', '').replace('.tar.bz2', '').strip()
        # else:
        #     folder_name = file_name.replace('.tar', '').replace('.tar.gz', '').replace('.tar.bz2', '').strip()

        folder_name = file_name.replace('.tar', '').replace('.tar.gz', '').replace('.tar.bz2', '').strip()
        
        # 추출할 폴더 경로
        extract_path = os.path.join(base_extract_path, folder_name)
        
        # 폴더가 존재하지 않으면 생성
        os.makedirs(extract_path, exist_ok=True)
        
        # tar 파일 압축 풀기
        extract_tar_file(tar_file_path, extract_path)
        
        # 진행 상황 출력
        progress = (i + 1) / total_files * 100
        print(f"[{i + 1}/{total_files}] '{file_name}'의 압축을 '{extract_path}'에 성공적으로 풀었습니다. 진행 상황: {progress:.2f}%")


In [4]:
folder_path = 'D:/pj_data/시설 작물 개체 이미지/Validation/라벨'
base_extract_path = 'D:/pj_data/Validation'
extract_all_tar_files_in_folder(folder_path, base_extract_path)

[1/20] '[라벨]가지.tar'의 압축을 'D:/pj_data/Validation\[라벨]가지'에 성공적으로 풀었습니다. 진행 상황: 5.00%
[2/20] '[라벨]거베라.tar'의 압축을 'D:/pj_data/Validation\[라벨]거베라'에 성공적으로 풀었습니다. 진행 상황: 10.00%
[3/20] '[라벨]고추_꽈리.tar'의 압축을 'D:/pj_data/Validation\[라벨]고추_꽈리'에 성공적으로 풀었습니다. 진행 상황: 15.00%
[4/20] '[라벨]고추_풋고추.tar'의 압축을 'D:/pj_data/Validation\[라벨]고추_풋고추'에 성공적으로 풀었습니다. 진행 상황: 20.00%
[5/20] '[라벨]고추청양.tar'의 압축을 'D:/pj_data/Validation\[라벨]고추청양'에 성공적으로 풀었습니다. 진행 상황: 25.00%
[6/20] '[라벨]국화.tar'의 압축을 'D:/pj_data/Validation\[라벨]국화'에 성공적으로 풀었습니다. 진행 상황: 30.00%
[7/20] '[라벨]딸기.tar'의 압축을 'D:/pj_data/Validation\[라벨]딸기'에 성공적으로 풀었습니다. 진행 상황: 35.00%
[8/20] '[라벨]멜론.tar'의 압축을 'D:/pj_data/Validation\[라벨]멜론'에 성공적으로 풀었습니다. 진행 상황: 40.00%
[9/20] '[라벨]부추.tar'의 압축을 'D:/pj_data/Validation\[라벨]부추'에 성공적으로 풀었습니다. 진행 상황: 45.00%
[10/20] '[라벨]상추.tar'의 압축을 'D:/pj_data/Validation\[라벨]상추'에 성공적으로 풀었습니다. 진행 상황: 50.00%
[11/20] '[라벨]안개.tar'의 압축을 'D:/pj_data/Validation\[라벨]안개'에 성공적으로 풀었습니다. 진행 상황: 55.00%
[12/20] '[라벨]애플망고.tar'의 압축을 'D:/pj_data/Validation\[라벨]