In [None]:
import os
import pandas as pd
import json

# ✅ CSV → Document 스타일 전처리 함수
def csv_to_doc_dicts(file_path: str) -> list[dict]:
    df = pd.read_csv(file_path)
    doc_dicts = []
    for _, row in df.iterrows():
        row_dict = row.to_dict()
        content = row_dict.pop("설명", "")  # 설명 = 본문
        doc_dicts.append({"내용": content, **row_dict})
    return doc_dicts

# ✅ 저장 함수 (CSV, JSON)
def save_docs(doc_dicts: list[dict], prefix: str):
    pd.DataFrame(doc_dicts).to_csv(f"{prefix}_documents.csv", index=False, encoding="utf-8-sig")
    with open(f"{prefix}_documents.json", "w", encoding="utf-8") as f:
        json.dump(doc_dicts, f, ensure_ascii=False, indent=2)
    print(f"✅ 저장 완료: {prefix}_documents.csv / .json")

# ✅ 처리할 파일명 리스트 (확장자 제외)
files_name = [
    "jeju_heritage", "seoul_heritage", "busan_heritage", "gyeonggi_heritage",
    # ... 여기에 나머지 13개 파일명도 추가
]

# ✅ 메인 루프
for name in files_name:
    file_path = f"{name}.csv"  # 예: jeju_heritage.csv
    if not os.path.exists(file_path):
        print(f"❌ 파일 없음: {file_path}")
        continue

    try:
        doc_dicts = csv_to_doc_dicts(file_path)
        save_docs(doc_dicts, name)
    except Exception as e:
        print(f"⚠️ 처리 실패: {file_path} - {e}")