In [3]:
import pandas as pd

# 1. 파일 읽기
try:
    df = pd.read_csv('train_data_with_elevation.csv')
    print(f"파일 읽기 성공: 'train_data_with_elevation.csv' (총 {len(df)}행)")
except FileNotFoundError:
    print("오류: 'train_data_with_elevation.csv' 파일을 찾을 수 없습니다.")
    print("스크립트와 같은 폴더에 있는지 확인하세요.")
    exit()


# 2. 'is_ocean'과 'is_steep_slope' 열을 정수(int)로 변환
#    (True -> 1, False -> 0)
if 'is_ocean' in df.columns:
    df['is_ocean'] = df['is_ocean'].astype(int)
    print("'is_ocean' 열을 정수로 변환했습니다. (True->1, False->0)")
else:
    print("경고: 'is_ocean' 열이 없습니다.")

if 'is_steep_slope' in df.columns:
    df['is_steep_slope'] = df['is_steep_slope'].astype(int)
    print("'is_steep_slope' 열을 정수로 변환했습니다. (True->1, False->0)")
else:
    print("경고: 'is_steep_slope' 열이 없습니다.")


# 3. (추가된 코드) 'nst', 'Year', 'Month' 컬럼 제거
cols_to_drop = ['nst', 'Year', 'Month']
existing_cols_to_drop = [col for col in cols_to_drop if col in df.columns]

if existing_cols_to_drop:
    df = df.drop(columns=existing_cols_to_drop)
    print(f"\n'{', '.join(existing_cols_to_drop)}' 컬럼을 제거했습니다.")
else:
    print(f"\n제거할 컬럼({', '.join(cols_to_drop)})이 이미 없습니다.")


# 4. 변경된 결과 (컬럼 목록) 확인
print("\n--- 최종 컬럼 목록 ---")
print(list(df.columns))


# 5. 새 파일로 저장
output_filename = 'train_data_processed.csv'
df.to_csv(output_filename, index=False)

print(f"\n모든 전처리가 완료된 데이터를 '{output_filename}' 파일로 저장했습니다.")

print("\n--- 전처리 완료된 데이터 상위 5개 ---")
print(df.head().to_markdown(index=False))

파일 읽기 성공: 'train_data_with_elevation.csv' (총 782행)
'is_ocean' 열을 정수로 변환했습니다. (True->1, False->0)
'is_steep_slope' 열을 정수로 변환했습니다. (True->1, False->0)

'nst, Year, Month' 컬럼을 제거했습니다.

--- 최종 컬럼 목록 ---
['magnitude', 'dmin', 'gap', 'depth', 'latitude', 'longitude', 'tsunami', 'is_ocean', 'is_steep_slope']

모든 전처리가 완료된 데이터를 'train_data_processed.csv' 파일로 저장했습니다.

--- 전처리 완료된 데이터 상위 5개 ---
|   magnitude |   dmin |   gap |   depth |   latitude |   longitude |   tsunami |   is_ocean |   is_steep_slope |
|------------:|-------:|------:|--------:|-----------:|------------:|----------:|-----------:|-----------------:|
|         7   |  0.509 |    17 |  14     |    -9.7963 |     159.596 |         1 |          1 |                1 |
|         6.9 |  2.229 |    34 |  25     |    -4.9559 |     100.738 |         0 |          1 |                1 |
|         7   |  3.125 |    18 | 579     |   -20.0508 |    -178.346 |         1 |          1 |                1 |
|         7.3 |  1.865 |    21 |  37     | 