In [2]:
import json

def extract_locations(file_path):
    """
    주어진 JSON 파일에서 'id_'와 'locations' 필드만 추출하여 새로운 리스트를 반환합니다.

    Args:
        file_path (str): JSON 파일의 경로.

    Returns:
        list: 'id_'와 'locations'만 포함된 딕셔너리들의 리스트.
              오류 발생 시 빈 리스트를 반환합니다.
    """
    extracted_data = []
    try:
        with open(file_path, 'r', encoding='utf-8') as f:
            # 파일이 JSONL 형식일 경우를 대비하여 한 줄씩 읽어서 처리
            for line in f:
                item = json.loads(line.strip())
                # 'id_'와 'locations' 필드가 존재하는지 확인
                if 'id_' in item and 'locations' in item:
                    extracted_data.append({
                        'id_': item['id_'],
                        'locations': item['locations']
                    })
    except FileNotFoundError:
        print(f"오류: 파일을 찾을 수 없습니다 - {file_path}")
    except json.JSONDecodeError:
        print(f"오류: JSON 디코딩에 실패했습니다. 파일 형식을 확인해주세요.")
    except Exception as e:
        print(f"예상치 못한 오류가 발생했습니다: {e}")
        
    return extracted_data

def save_results(data, output_file_path):
    """
    추출된 데이터를 JSONL 형식으로 파일에 저장합니다.
    JSONL 형식은 각 JSON 객체가 한 줄에 하나씩 작성된 형식입니다.

    Args:
        data (list): 저장할 데이터가 담긴 딕셔너리 리스트.
        output_file_path (str): 결과를 저장할 파일의 경로.
    """
    try:
        with open(output_file_path, 'w', encoding='utf-8') as f:
            for item in data:
                f.write(json.dumps(item, ensure_ascii=False) + '\n')
        print(f"결과가 성공적으로 {output_file_path}에 저장되었습니다.")
    except Exception as e:
        print(f"오류: 파일 저장 중 문제가 발생했습니다: {e}")

# 입력 파일 경로
input_file_path = '/home/ds4_sia_nolb/#FINAL_POLARIS/06_Geo_coding/re_extracted_locations_ten_year_all.jsonl'
# 출력 파일 경로 (원하는 이름으로 변경 가능)
output_file_path = '/home/ds4_sia_nolb/#FINAL_POLARIS/06_Geo_coding/re_extracted_locations_result_ten_year_all.jsonl'

# 함수 실행 및 결과 저장
result = extract_locations(input_file_path)

if result:
    print("데이터 추출 성공. 결과를 파일에 저장합니다.")
    save_results(result, output_file_path)
else:
    print("추출된 데이터가 없거나 오류가 발생했습니다.")

데이터 추출 성공. 결과를 파일에 저장합니다.
결과가 성공적으로 /home/ds4_sia_nolb/#FINAL_POLARIS/06_Geo_coding/re_extracted_locations_result_ten_year_all.jsonl에 저장되었습니다.
