# 주거취약지수 분석

이 노트북은 주거취약지수를 분석하고 계산합니다.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
from pathlib import Path

# 한글 폰트 설정
plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['axes.unicode_minus'] = False

# 프로젝트 디렉토리 설정
project_dir = r"/Users/sullem/yj/HIuniv_Project"
os.chdir(project_dir)

print(f"현재 작업 디렉토리: {os.getcwd()}")

In [None]:
# 데이터 로드
data_path = os.path.join(project_dir, "data", "processed", "processed_data.csv")
df = pd.read_csv(data_path)

print(f"데이터 로드 완료: {len(df)}개 행")
print(f"컬럼: {list(df.columns)}")
df.head()

In [None]:
# 주거취약지수 계산
# 노후주택비율을 기준으로 취약지수 계산
df['vulnerability_normalized'] = (df['aged_housing_ratio'] - df['aged_housing_ratio'].min()) / (df['aged_housing_ratio'].max() - df['aged_housing_ratio'].min()) * 100

# 취약등급 분류
def classify_vulnerability(score):
    if score >= 80:
        return '매우 높음'
    elif score >= 60:
        return '높음'
    elif score >= 40:
        return '보통'
    elif score >= 20:
        return '낮음'
    else:
        return '매우 낮음'

df['vulnerability_level'] = df['vulnerability_normalized'].apply(classify_vulnerability)

print("주거취약지수 계산 완료")
df[['region', 'vulnerability_normalized', 'vulnerability_level', 'aged_housing_ratio']].head()

In [None]:
# 결과 저장
output_path = os.path.join(project_dir, "results", "housing_vulnerability_analysis.csv")
df.to_csv(output_path, index=False, encoding='utf-8')
print(f"결과가 저장되었습니다: {output_path}")

# 취약등급별 분포 확인
print("\n=== 취약등급별 분포 ===")
grade_counts = df['vulnerability_level'].value_counts()
for grade, count in grade_counts.items():
    print(f"{grade}: {count}개 ({count/len(df)*100:.1f}%)")

# 상위 5개 지역 (취약도 높음)
print("\n=== 상위 5개 지역 (취약도 높음) ===")
top_5 = df.nlargest(5, 'vulnerability_normalized')[['region', 'vulnerability_normalized', 'vulnerability_level', 'aged_housing_ratio']]
print(top_5)