In [1]:
import gzip
import shutil
import os

# 테스트용 큰 텍스트 데이터 생성
text_data = "Gzip 압축 테스트를 위한 대량의 텍스트 데이터입니다. " * 500
large_file_name = 'large_data.txt'
compressed_file_name = large_file_name + '.gz'

try:
    # 원본 파일 쓰기
    with open(large_file_name, 'w', encoding='utf-8') as f:
        f.write(text_data)
    original_size = os.path.getsize(large_file_name)
    print(f"원본 파일 '{large_file_name}' 크기: {original_size} 바이트")

    # 1. gzip으로 압축하기
    with open(large_file_name, 'rb') as f_in: # 파일을 바이너리 읽기 모드로 열기
        # gzip.open을 'wb' 모드로 열어 압축 쓰기
        with gzip.open(compressed_file_name, 'wb') as f_out:
            shutil.copyfileobj(f_in, f_out) # 파일 내용을 압축하며 복사
    compressed_size = os.path.getsize(compressed_file_name)
    print(f"압축 파일 '{compressed_file_name}' 크기: {compressed_size} 바이트")
    
    # 압축률 계산
    if original_size > 0:
        compression_ratio = ((original_size - compressed_size) / original_size) * 100
        print(f"압축률: {compression_ratio:.2f}%")

    # 2. gzip 파일 읽기 (압축 해제하며)
    print(f"\n--- '{compressed_file_name}' 압축 해제하여 읽기 ---")
    with gzip.open(compressed_file_name, 'rt', encoding='utf-8') as f:
        decompressed_text = f.read()
        print(f"해제된 텍스트 (첫 100자): {decompressed_text[:100]}...")
        # 원본 데이터와 비교 (길이만 체크)
        print(f"해제된 텍스트 길이: {len(decompressed_text)} (원본 길이: {len(text_data)})")

finally:
    # 테스트 파일 정리
    if os.path.exists(large_file_name): os.remove(large_file_name)
    if os.path.exists(compressed_file_name): os.remove(compressed_file_name)
    print("\n테스트 파일 정리 완료.")


원본 파일 'large_data.txt' 크기: 36000 바이트
압축 파일 'large_data.txt.gz' 크기: 249 바이트
압축률: 99.31%

--- 'large_data.txt.gz' 압축 해제하여 읽기 ---
해제된 텍스트 (첫 100자): Gzip 압축 테스트를 위한 대량의 텍스트 데이터입니다. Gzip 압축 테스트를 위한 대량의 텍스트 데이터입니다. Gzip 압축 테스트를 위한 대량의 텍스트 데이터입니다. Gzip...
해제된 텍스트 길이: 16000 (원본 길이: 16000)

테스트 파일 정리 완료.
