In [6]:
import pandas as pd
import sys

# --- 1. 사용자 설정 ---
# !!! 여기에 처리할 파일 이름을 입력하세요 !!!
# (예: 'combined_sorted_earthquakes.csv', 'earthquakes.csv' 등)
input_file = 'second_final_data.csv'

# 저장할 파일 이름
output_file = 'second_final_data_proceed.csv'

# --- 2. 유지할 컬럼 목록 ---
# (이 목록에 있는 7개의 컬럼만 남깁니다)
keep_columns = [
    'magnitude',
    'depth',
    # 'latitude',
    # 'longitude',
    # 'Year',
    # 'Month',
    'is_ocean',
    'is_steep_slope',
    'horizontal_count_1y_full',
    'vertical_count_1y_full',
    'tsunami'
]

try:
    # --- 3. 파일 읽기 ---
    df = pd.read_csv(input_file)
    print(f"'{input_file}' 파일 로드 완료.")
    print(f"원본 컬럼 (총 {len(df.columns)}개): {df.columns.tolist()}")

    # --- 4. 'mag' 컬럼이 있으면 'magnitude'로 변경 ---
    if 'mag' in df.columns:
        df.rename(columns={'mag': 'magnitude'}, inplace=True)
        print("\n[알림] 'mag' 컬럼을 'magnitude'로 변경했습니다.")

    # --- 5. 유지할 컬럼만 필터링 ---
    #    (파일에 존재하지 않는 컬럼은 무시하고, 존재하는 컬럼만 선택)

    final_columns_to_keep = []
    for col in keep_columns:
        if col in df.columns:
            final_columns_to_keep.append(col)
        else:
            print(f"[경고] 요청한 컬럼 '{col}'이(가) 원본 파일에 없어 제외됩니다.")

    # 최종 컬럼 목록으로 데이터프레임 재구성
    df_cleaned = df[final_columns_to_keep]

    print(f"\n[성공] 최종 {len(df_cleaned.columns)}개 컬럼만 남겼습니다.")
    print(f"최종 컬럼: {df_cleaned.columns.tolist()}")

    # --- 6. 새 파일로 저장 ---
    df_cleaned.to_csv(output_file, index=False, encoding='utf-8-sig')
    print(f"\n[성공] 정리된 데이터가 '{output_file}'(으)로 저장되었습니다.")

    print("\n--- 저장된 데이터 (상위 5행) ---")
    print(df_cleaned.head().to_markdown(index=False, numalign="left", stralign="left"))

except FileNotFoundError:
    print(f"\n[오류] '{input_file}' 파일을 찾을 수 없습니다.", file=sys.stderr)
    print("     파일 이름이 정확한지, 스크립트와 같은 폴더에 있는지 확인하세요.", file=sys.stderr)
except Exception as e:
    print(f"\n[오류] 처리 중 오류 발생: {e}", file=sys.stderr)

'second_final_data.csv' 파일 로드 완료.
원본 컬럼 (총 11개): ['magnitude', 'depth', 'latitude', 'longitude', 'Year', 'Month', 'is_ocean', 'is_steep_slope', 'horizontal_count_1y_full', 'vertical_count_1y_full', 'tsunami']

[성공] 최종 7개 컬럼만 남겼습니다.
최종 컬럼: ['magnitude', 'depth', 'is_ocean', 'is_steep_slope', 'horizontal_count_1y_full', 'vertical_count_1y_full', 'tsunami']

[성공] 정리된 데이터가 'second_final_data_proceed.csv'(으)로 저장되었습니다.

--- 저장된 데이터 (상위 5행) ---
| magnitude   | depth   | is_ocean   | is_steep_slope   | horizontal_count_1y_full   | vertical_count_1y_full   | tsunami   |
|:------------|:--------|:-----------|:-----------------|:---------------------------|:-------------------------|:----------|
| 7           | 14      | 1          | 1                | 1                          | 1                        | 1         |
| 6.9         | 25      | 1          | 1                | 0                          | 1                        | 0         |
| 7           | 579     | 1          | 1              