In [1]:
import pandas as pd

police_st = pd.read_csv("./tokyo_lat_lon_번역.csv", encoding="UTF-8")

police_st.head()

Unnamed: 0,X,Y,P18_001,P18_002,P18_003,P18_004
0,139.752268,35.677043,경시청,13101,1,지요다구 카스미가세키 2-1-1
1,139.752186,35.676892,제1면 본부,13101,1,지요다구 카스미가 세키 2-1-1
2,139.724994,35.693587,제4방면 본부,13104,1,신주쿠구 이치타니혼무라초 6-1
3,139.747832,35.708215,제5방면 본부,13105,1,분쿄구 가스가 1-5-12
4,139.797835,35.724528,제6방면본부,13106,1,타이토구 히가시아사쿠사 2-27-12


In [2]:
new_column_names = ["위도", "경도", "경찰_시설_명칭", "행정구역_코드", "경찰시설_구분", "소재지"]
police_st.columns = new_column_names
police_st

Unnamed: 0,위도,경도,경찰_시설_명칭,행정구역_코드,경찰시설_구분,소재지
0,139.752268,35.677043,경시청,13101,1,지요다구 카스미가세키 2-1-1
1,139.752186,35.676892,제1면 본부,13101,1,지요다구 카스미가 세키 2-1-1
2,139.724994,35.693587,제4방면 본부,13104,1,신주쿠구 이치타니혼무라초 6-1
3,139.747832,35.708215,제5방면 본부,13105,1,분쿄구 가스가 1-5-12
4,139.797835,35.724528,제6방면본부,13106,1,타이토구 히가시아사쿠사 2-27-12
...,...,...,...,...,...,...
1314,139.78689328,35.751586,오쿠 경찰서 오오 다케하시 교번,13118,4,아라카와구 마치야 7-4-5
1315,139.770395,35.813675,다케노츠카 경찰서견 누마시로 친수공원 앞 교번,13121,4,아다치 구사인 5-21-24
1316,139.38198,35.616194,미나미오사와 경찰서,13201,2,하치오지시 미나미오사와 1-8-3
1317,139.301407,35.651938,타카오 경찰서 나미키마치 교번,13201,4,하치오지시 나미키마치 13-1


In [3]:
selected_columns = ["소재지","위도", "경도"]

location = police_st[selected_columns]

location = location.dropna(subset=["소재지"])

location.head()

Unnamed: 0,소재지,위도,경도
0,지요다구 카스미가세키 2-1-1,139.752268,35.677043
1,지요다구 카스미가 세키 2-1-1,139.752186,35.676892
2,신주쿠구 이치타니혼무라초 6-1,139.724994,35.693587
3,분쿄구 가스가 1-5-12,139.747832,35.708215
4,타이토구 히가시아사쿠사 2-27-12,139.797835,35.724528


In [4]:
wards = [
    "아다치구", "지요다구", "이타바시구", "고토구", "나카노구",
    "세타가야구", "신주쿠구", "타이토구", "아라카와구", "추오구",
    "카츠시카구", "메구로구", "네리마구", "시부야구", "스기나미구",
    "도시마구", "분쿄구", "에도가와구", "기타구", "미나토구",
    "오타구", "시나가와구", "스미다구"
]

ward_data = {}

for ward in wards:
    ward_rows = location[location["소재지"].str.startswith(ward)]
    ward_data[ward] = ward_rows

for ward, data in ward_data.items():
    globals()[f"{ward}_data"] = data

아다치구_data
스미다구_data

Unnamed: 0,소재지,위도,경도
37,스미다구 후미카 3-18-9,139.82726,35.711736
38,스미다구 료고쿠 4-29-5,139.796127,35.694348
282,스미다구 히가시코지마 2-27-1,139.817067,35.717597
283,스미다구 쿄지마 3-20-1,139.824399,35.715291
284,스미다구 쿄지마 2-9-4,139.819983,35.715097
285,스미다구 하치히로 6-1-1,139.825399,35.728652
287,스미다구 스미다 2-10-15,139.819428,35.733234
292,스미다구 스미다4-22-9,139.82315,35.732179
293,스미다구 스미다 3-6-17,139.820678,35.72793
294,스미다구 오시아게 1-10-1,139.81415,35.710069


In [5]:
# math 모듈에서 삼각함수 및 수학적 계산을 위해 사용되는 함수들을 가져옴
from math import sin, cos, sqrt, atan2, radians

# calculate_distance : 두 지점 간의 거리를 계산하는 함수
def calculate_distance(lat1, lon1, lat2, lon2):
    R = 6371.0  # R : 지구의 반경을 의미, 단위 -> 킬로미터
    
    # 위도와 경도를 '라디안' 이라는 각의 크기를 재는 단위로 변환
    lat1 = radians(lat1) # 첫번재 위도
    lon1 = radians(lon1) # 첫번째 경도
    lat2 = radians(lat2) # 두번째 위도
    lon2 = radians(lon2) # 두번째 경도
    
    # 위도와 경도의 차이 계산 
    dlat = lat2 - lat1 # 두 위치의 위도 값의 차
    dlon = lon2 - lon1 # 두 위치의 경도 값의 차
    
    # Haversine 공식 : 두 위치 사이의 곡선거리를 구하는 공식
    a = sin(dlat / 2)**2 + cos(lat1) * cos(lat2) * sin(dlon / 2)**2
    ''' a = Haversine 공식의 일부로, 주어진 위도, 경도 차이를 사용하여 구해짐
        sin(dlat / 2)**2 : 위도 차이의 절반에 대한 사인 값 **
        cos(lat1), cos(lat2) : 각 지점의 위도에 대한 코사인 값의 곱과 경도 차이의
                                         절반 각도에 대한 삼각함수 값의 제곱 '''
    c = 2 * atan2(sqrt(a), sqrt(1 - a))
    # c = 계산 된 a를 사용해 구한 중심 각
    distance = R * c # 중심 각과 지구의 반경 R을 곱해 직선 거리로 만듬
    
    return distance

# calculate_distances_for_ward : 각 구의 첫 번째 소재지를 기준으로 모든 소재지와의 거리를 계산하는 함수
def calculate_distances_for_ward(ward_data):
    first_location = ward_data.iloc[0]  # 해당 구의 첫번째 소재지를 지정 (중심으로 비교)
    distances = []

     # iterrows 로 각 소재지의 위도와 경도를 가져옴 (데이터프레임의 행의 데이터를 반복 - 반환하는 메서드)
    for index, location in ward_data.iterrows():
        lat1, lon1 = float(first_location['위도']), float(first_location['경도'])  # 숫자로 변환
        lat2, lon2 = float(location['위도']), float(location['경도'])  # 숫자로 변환
        distance = calculate_distance(lat1, lon1, lat2, lon2)
        distances.append((location['소재지'], distance))
    
    return distances

# 각 구별로 거리를 계산하여 데이터프레임으로 출력
for ward, data in ward_data.items():
    distances = calculate_distances_for_ward(data)
    distances_df = pd.DataFrame(distances, columns=['소재지', '거리(km)'])
    # 데이터프레임 이름을 {ward}_df로 설정
    globals()[f"{ward}_df"] = distances_df

고토구_df

Unnamed: 0,소재지,거리(km)
0,고토구 신키바 4-2-31,0.0
1,고토구 아오미 2-7-1,7.267778
2,고토구 기타사 2-1-24,3.30812
3,고토구 키바 3-18-6,4.39808
4,고토구 히가시사 5-14-1,2.850513
5,고토구 카메이도 2-21-9,4.946965
6,고토구 가메이도9-5-1,4.695644
7,고토구 남사 7-14-16,2.279322
8,고토구 기타사 4-20-25,3.016438
9,고토구 신키바 1-5-11,1.313688
