In [None]:
import json
from pathlib import Path

# 파일 경로 설정
IN_PATH = Path("youth_policies_api.json")
OUT_PATH = Path("youth_policies_filtered_kr_revised.json")


# 원본 필드명 -> 전처리 결과(한글) 필드명 매핑
FIELD_MAP = {
    # 기본 정보
    "plcyNm": "정책명",
    "plcyKywdNm": "정책키워드",
    "plcyExplnCn": "정책설명",
    "lclsfNm": "대분류",
    "mclsfNm": "중분류",

    # 지원 내용·조건
    "plcySprtCn": "지원내용",
    "earnMinAmt": "최소지원금액",
    "earnMaxAmt": "최대지원금액",
    "earnEtcCn": "기타지원조건",
    "sprtTrgtMinAge": "지원최소연령",
    "sprtTrgtMaxAge": "지원최대연령",

    # 기관 정보
    "sprvsnInstCdNm": "주관기관명",
    "operInstCdNm": "운영기관명",
    "rgtrInstCdNm": "등록기관명",
    "rgtrUpInstCdNm": "상위기관명",
    "rgtrHghrkInstCdNm": "상위등록기관명",

    # 신청·사업 기간/방법
    "aplyYmd": "신청기간",
    "plcyAplyMthdCn": "신청방법",
    "sbmsnDcmntCn": "제출서류",
    "bizPrdBgngYmd": "사업시작일",
    "bizPrdEndYmd": "사업종료일",

    # 심사·선정
    "srngMthdCn": "선정방법",

    # URL
    "aplyUrlAddr": "신청URL",
    "refUrlAddr1": "참고URL1",
    "refUrlAddr2": "참고URL2",

    # 기타 텍스트 조건
    "addAplyQlfcCndCn": "추가자격조건",
    "ptcpPrpTrgtCn": "참여제외대상",
}


def transform_record(src: dict) -> dict:
    """
    원본 한 건(src)을 전처리 형식(dict)으로 변환.
    - FIELD_MAP에 정의된 항목만 남기고,
    - 값이 비어 있으면 생략
    """
    dst = {}

    for src_key, dst_key in FIELD_MAP.items():
        value = src.get(src_key)
        if value is None:
            continue

        if isinstance(value, str) and value.strip() == "":
            continue

        dst[dst_key] = value

    return dst


def main():
    # 1) 원본 JSON 로드
    with IN_PATH.open("r", encoding="utf-8") as f:
        raw = json.load(f)

    # 2) 정책 리스트 꺼내기 (result > youthPolicyList)
    policies = raw["result"]["youthPolicyList"]

    # 3) 각 정책을 전처리 포맷으로 변환
    transformed = []
    for p in policies:
        rec = transform_record(p)


        transformed.append(rec)

    # 4) 리스트 형태로 저장
    with OUT_PATH.open("w", encoding="utf-8") as f:
        json.dump(transformed, f, ensure_ascii=False, indent=2)

    print(f"변환 완료: {len(transformed)}건 -> {OUT_PATH}")


if __name__ == "__main__":
    main()


변환 완료: 3000건 -> youth_policies_filtered_kr_revised.json
