# Title: Optimized CSV to Parquet Converter
## Description
대용량 CSV 파일을 컬럼 기반의 Parquet 형식으로 변환하여 저장합니다. 이는 I/O 병목을 줄이고, 디스크 공간을 절약하며, 후속 분석 시 특정 컬럼만 빠르게 로드할 수 있게 합니다.

## Input
- `csv_path` (str): 원본 CSV 파일 경로
- `save_name` (str): 저장할 파일명 (확장자 제외)

## Output
- `.parquet` file: 변환된 파케이 파일

## Check Point
- `pyarrow` 혹은 `fastparquet` 엔진이 설치되어 있어야 합니다.
- 메모리 관리를 위해 변환 후 즉시 DataFrame을 메모리에서 해제(`del`, `gc.collect`)합니다.

In [None]:
import pandas as pd
import gc

def csv_to_parquet(csv_path, save_name):
    # 1. Load Data
    df = pd.read_csv(csv_path)

    # 2. Convert & Save
    # index=False는 불필요한 인덱스 저장을 방지함
    df.to_parquet(f'./{save_name}.parquet', index=False)

    # 3. Memory Cleanup
    del df
    gc.collect()

    print(f"{save_name}.parquet conversion done.")

# Customizing Guide
**How to Use:**
- 대회 데이터나 로그 데이터 등 GB 단위의 대용량 CSV를 처음 받았을 때, 1회성으로 이 함수를 실행하여 데이터를 변환하세요.
- 이후 분석부터는 `pd.read_parquet()`을 사용하여 로딩 시간을 단축합니다.

**Troubleshooting:**
- **ModuleNotFoundError:** `pip install pyarrow`를 실행하세요.
- **Memory Error:** CSV가 RAM보다 큰 경우, `pd.read_csv(chunksize=...)` 옵션을 사용하여 분할 변환하는 로직으로 확장이 필요합니다.