In [8]:
import os

# 루트 폴더 기준 (예: "C:/Users/사용자명/프로젝트명/")
base_path = "../../../data/Combine/"  # ← 여기만 본인 PC 경로에 맞게 수정하세요

# 서브 디렉토리
people_path = os.path.join(base_path, "People")
light_path = os.path.join(base_path, "Light")
child_path = os.path.join(base_path, "Child")
cctv_path = os.path.join(base_path, "CCTV")

# 예시: 파일 로드
import pandas as pd

# child 폴더 안의 CSV 불러오기 (파일명 예시는 임의입니다)
child_df = pd.read_csv(os.path.join(child_path, "gwangjin_child_zone_with_coords_filtered.csv"))

# CCTV 예시
cctv_df = pd.read_csv(os.path.join(cctv_path, "proceeded_cctv.csv"))


Child 폴더 내 파일: ['Seoul_child_zone_clean_final_utf8.csv', 'gwangjin_child_zone_with_coords_filtered.csv', 'no_cctv_childzone.csv']


In [10]:
# 예시: 파일 로드
import pandas as pd

# child 폴더 안의 CSV 불러오기 (파일명 예시는 임의입니다)
child_df = pd.read_csv(os.path.join(child_path, "gwangjin_child_zone_with_coords_filtered.csv"))

# CCTV 예시
cctv_df = pd.read_csv(os.path.join(cctv_path, "proceeded_cctv.csv"))

In [11]:
import numpy as np

# 거리 계산 함수 (Haversine 공식)
def haversine_distance(lat1, lon1, lat2, lon2):
    R = 6371000  # 지구 반지름 (m)
    phi1, phi2 = np.radians(lat1), np.radians(lat2)
    delta_phi = np.radians(lat2 - lat1)
    delta_lambda = np.radians(lon2 - lon1)

    a = np.sin(delta_phi / 2.0) ** 2 + \
        np.cos(phi1) * np.cos(phi2) * np.sin(delta_lambda / 2.0) ** 2

    return R * 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))

# 각 보호구역에 대해 CCTV 수량 집계
cctv_counts = []

for _, child_row in child_df.iterrows():
    lat1, lon1 = child_row["위도"], child_row["경도"]
    distances = haversine_distance(lat1, lon1, cctv_df["위도"], cctv_df["경도"])
    nearby_cctvs = cctv_df[distances <= 50]
    total_cctvs = nearby_cctvs["CCTV 수량"].sum()
    cctv_counts.append(total_cctvs)

# 결과 저장
child_df["50m 이내 CCTV 수량"] = cctv_counts

# 커버율 계산
covered = (child_df["50m 이내 CCTV 수량"] >= 1).sum()
total = len(child_df)
coverage_rate = round(covered / total * 100, 2)

print(f"📌 50m 이내 CCTV 커버율: {coverage_rate}%")


📌 50m 이내 CCTV 커버율: 77.27%


In [12]:
import os

people_path = "../../../data/Combine/People"
print("People 폴더 내 파일 목록:", os.listdir(people_path))


People 폴더 내 파일 목록: ['주민등록인구기타현황(고령 인구현황)_월간.csv', '연령별인구현황_월간.csv', '주민등록인구기타현황(세대원수별 세대수)_월간.csv', '행정동별 성연령별 주민등록 1인세대수_월간.csv']


In [14]:
people_df = pd.read_csv(
    os.path.join(people_path, "연령별인구현황_월간.csv"),
    encoding="cp949"  # 또는 "euc-kr"
)

print(people_df.columns)
people_df.head()

Index(['행정구역', '2025년03월_계_총인구수', '2025년03월_계_연령구간인구수', '2025년03월_계_0~4세',
       '2025년03월_계_5~9세', '2025년03월_계_10~14세', '2025년03월_계_15~19세',
       '2025년03월_계_20~24세', '2025년03월_계_25~29세', '2025년03월_계_30~34세',
       '2025년03월_계_35~39세', '2025년03월_계_40~44세', '2025년03월_계_45~49세',
       '2025년03월_계_50~54세', '2025년03월_계_55~59세', '2025년03월_계_60~64세',
       '2025년03월_계_65~69세', '2025년03월_계_70~74세', '2025년03월_계_75~79세',
       '2025년03월_계_80~84세', '2025년03월_계_85~89세', '2025년03월_계_90~94세',
       '2025년03월_계_95~99세', '2025년03월_계_100세 이상', '2025년03월_남_총인구수',
       '2025년03월_남_연령구간인구수', '2025년03월_남_0~4세', '2025년03월_남_5~9세',
       '2025년03월_남_10~14세', '2025년03월_남_15~19세', '2025년03월_남_20~24세',
       '2025년03월_남_25~29세', '2025년03월_남_30~34세', '2025년03월_남_35~39세',
       '2025년03월_남_40~44세', '2025년03월_남_45~49세', '2025년03월_남_50~54세',
       '2025년03월_남_55~59세', '2025년03월_남_60~64세', '2025년03월_남_65~69세',
       '2025년03월_남_70~74세', '2025년03월_남_75~79세', '2025년03월_남_80~84세',
       '2025년03월_남_85

Unnamed: 0,행정구역,2025년03월_계_총인구수,2025년03월_계_연령구간인구수,2025년03월_계_0~4세,2025년03월_계_5~9세,2025년03월_계_10~14세,2025년03월_계_15~19세,2025년03월_계_20~24세,2025년03월_계_25~29세,2025년03월_계_30~34세,...,2025년03월_여_55~59세,2025년03월_여_60~64세,2025년03월_여_65~69세,2025년03월_여_70~74세,2025년03월_여_75~79세,2025년03월_여_80~84세,2025년03월_여_85~89세,2025년03월_여_90~94세,2025년03월_여_95~99세,2025년03월_여_100세 이상
0,서울특별시 광진구 (1121500000),331934,331934,5783,8080,10813,12192,21627,34933,32360,...,13301,12427,11517,7862,5957,4355,2467,936,229,34
1,서울특별시 광진구 화양동(1121571000),23050,23050,136,141,180,560,4384,5626,3317,...,442,394,395,344,269,175,114,29,7,3
2,서울특별시 광진구 군자동(1121573000),18648,18648,223,322,426,504,1586,2514,2080,...,632,646,665,423,353,284,147,56,9,5
3,서울특별시 광진구 중곡제1동(1121574000),15022,15022,236,239,307,322,777,1820,1889,...,617,583,558,345,294,224,108,40,14,1
4,서울특별시 광진구 중곡제2동(1121575000),20086,20086,260,450,563,629,1030,2114,2194,...,913,856,787,550,403,259,131,44,18,0


In [18]:
# 1. 아동 인구 합산 컬럼 생성
people_df["아동인구수"] = (
    people_df["2025년03월_계_0~4세"].str.replace(",", "").astype(int) +
    people_df["2025년03월_계_5~9세"].str.replace(",", "").astype(int) +
    people_df["2025년03월_계_10~14세"].str.replace(",", "").astype(int)
)

# 2. 정규식으로 행정동 추출 후, 공백 제거
people_df["행정동"] = people_df["행정구역"].str.extract(r"광진구\s(.+?)\(")[0].str.replace("제", "").str.strip()


# 3. 필요한 컬럼만 정리
people_clean = people_df[["행정동", "아동인구수"]]
child_df["행정동"] = child_df["행정동"].str.strip()

merged_df = child_df.merge(people_clean, on="행정동", how="left")

# 5. 결과 확인
print(merged_df[["행정동", "아동인구수"]].drop_duplicates().sort_values("행정동").tail(10))



     행정동  아동인구수
4   구의3동   2524
16   군자동    971
0     능동    618
15  자양1동   1197
8   자양2동   1994
7   자양3동   2910
14  중곡2동   1273
17  중곡3동    866
13  중곡4동   1594
5    화양동    457


In [19]:
merged_df["위험점수"] = 0

# 50m 이내 CCTV가 없는 경우 1점
merged_df.loc[merged_df["50m 이내 CCTV 수량"] == 0, "위험점수"] += 1

# 아동인구수가 상위 25% 이상이면 1점
threshold = merged_df["아동인구수"].quantile(0.75)
merged_df.loc[merged_df["아동인구수"] >= threshold, "위험점수"] += 1


In [20]:
top_risks = merged_df.sort_values("위험점수", ascending=False)
print(top_risks[["시설명", "행정동", "50m 이내 CCTV 수량", "아동인구수", "위험점수"]].head(10))


         시설명   행정동  50m 이내 CCTV 수량  아동인구수  위험점수
1   서울광남초등학교   광장동               0   5086     2
7   서울동자초등학교  자양3동               0   2910     2
25     보성유치원   광장동               0   5086     2
0     경복초등학교    능동               0    618     1
9   서울신양초등학교  자양3동               1   2910     1
2   서울광장초등학교   광장동               2   5086     1
12  서울양진초등학교   광장동               1   5086     1
17  서울중광초등학교  중곡3동               0    866     1
11  서울양남초등학교  자양2동               0   1994     1
4   서울구남초등학교  구의3동               0   2524     1


In [21]:
import folium

# 지도 초기화 (광진구 중심)
m = folium.Map(location=[37.545, 127.085], zoom_start=13)

# 마커 반복 추가
for _, row in merged_df.iterrows():
    color = "red" if row["50m 이내 CCTV 수량"] == 0 else "green"
    radius = max(5, min(row["아동인구수"] / 100, 15))  # 마커 크기 제한

    folium.CircleMarker(
        location=(row["위도"], row["경도"]),
        radius=radius,
        color=color,
        fill=True,
        fill_color=color,
        fill_opacity=0.7,
        popup=f"""<b>{row["시설명"]}</b><br>
                  행정동: {row["행정동"]}<br>
                  아동인구수: {int(row["아동인구수"])}명<br>
                  CCTV 수량: {row["50m 이내 CCTV 수량"]}대"""
    ).add_to(m)

# 결과 지도 표시
m


In [27]:
# 분석 결과가 달라서 새로 세팅

def color_abs(score):
    if score == 2:
        return "orange"   # 최고 위험
    elif score == 1:
        return "yellow"   # 주의
    else:
        return "green"    # 안전
merged_df["마커색상"] = merged_df["위험점수"].apply(color_abs)



In [28]:
# Percentile 기반
percentiles = merged_df["위험점수"].rank(pct=True)  # 0~1
def color_rel(p):
    if p >= 0.9:
        return "red"
    elif p >= 0.7:
        return "orange"
    elif p >= 0.4:
        return "yellow"
    else:
        return "green"
merged_df["마커색상"] = percentiles.apply(color_rel)

In [26]:
import folium

m = folium.Map(location=[37.545, 127.085], zoom_start=13)

for _, r in merged_df.iterrows():
    folium.CircleMarker(
        location=(r["위도"], r["경도"]),
        radius=max(5, min(r["아동인구수"] / 100, 15)),
        color=r["마커색상"],
        fill=True, fill_color=r["마커색상"], fill_opacity=0.8,
        popup=(f"<b>{r['시설명']}</b><br>"
               f"행정동: {r['행정동']}<br>"
               f"아동인구수: {int(r['아동인구수'])}명<br>"
               f"CCTV: {r['50m 이내 CCTV 수량']}대<br>"
               f"위험점수: {r['위험점수']}")
    ).add_to(m)

m  # 주피터에서 실행 시 지도 표시