## 스팟 추출

In [None]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 위험 요소와 가중치 데이터
risk_weights = {
    "경사로": 0.124,
    "보도 폭": 0.167,
    "공사 현장": 0.042,
    "상업구역": 0.148,
    "유동인구": 0.185,
    "갈림길": 0.029
}

# CSV 파일 경로를 지정
file_path = '유동인구_위험요인_추가.csv'

# CSV 파일 읽기
df = pd.read_csv(file_path)

# 위험 요소 선택
risk_columns = list(risk_weights.keys())
risk_data = df[risk_columns]

# 정규화
scaler = MinMaxScaler()
normalized_risk_data = scaler.fit_transform(risk_data)

# 정규화된 데이터를 데이터프레임으로 변환
normalized_df = pd.DataFrame(normalized_risk_data, columns=risk_columns)

# 위험 점수 계산 함수 정의
def calculate_risk(row):
    total_risk = 0
    for column in normalized_df.columns:
        total_risk += row[column] * risk_weights[column]
    return total_risk

# 정규화된 데이터프레임에 위험 점수 계산 적용
normalized_df['총 위험 점수'] = normalized_df.apply(calculate_risk, axis=1)

# 원래 데이터에 총 위험 점수 병합
df['총 위험 점수'] = normalized_df['총 위험 점수']

# 위험 점수를 기준으로 내림차순 정렬하여 상위 10개 추출
top_10_risks = df.sort_values(by='총 위험 점수', ascending=False).head(10)

# 상위 10개 지역의 X좌표와 Y좌표 추출
coordinates = top_10_risks[['X좌표', 'Y좌표', '총 위험 점수']]

# 결과 출력
import ace_tools as tools; tools.display_dataframe_to_user(name="위험한 상위 10개 지역의 좌표", dataframe=coordinates)
