In [27]:
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
import folium
from geopy.distance import great_circle
from k_means_constrained import KMeansConstrained 

df= pd.read_csv("택배생성데이터_20k.csv",encoding="utf-8-sig")
df = df.loc[df.index.repeat(df['화물 개수'])].reset_index(drop=True)
df['화물 개수'] = 1 

# ✅ 기존 거점 좌표 (지도에 표시할 실제 좌표)
hub_coords_real = [
    (37.5431586580816, 126.948894324085),  
    (37.5992108624948, 126.78440979783),
    (37.570379, 126.990688),  # 서울 종로구 수표로 84
    (37.575928, 126.994411),
    (37.552487, 126.937269),  # 서울 마포구 신촌역 근처
    (37.564719, 126.977069),  # 서울 중구 명동 근처
    (37.585791, 126.925488)   # 서울 서대문구 연희동 근처

]

# ✅ 배송지 중심 좌표 계산
delivery_center_lat = df['위도'].mean()
delivery_center_lon = df['경도'].mean()

# ✅ 거점 중심 좌표 계산 (거점 평균 좌표)
hub_center_lat = np.mean([lat for lat, lon in hub_coords_real])
hub_center_lon = np.mean([lon for lat, lon in hub_coords_real])

# ✅ 계산을 위한 거점 좌표 조정 (거점들의 상대적 위치 유지)
hub_coords_adjusted = []
for lat, lon in hub_coords_real:
    delta_lat = lat - hub_center_lat  # 중심과의 위도 차이
    delta_lon = lon - hub_center_lon  # 중심과의 경도 차이
    # 배송지 중심을 기준으로 새로운 거점 좌표 설정 (계산용)
    new_lat = delivery_center_lat + delta_lat*100
    new_lon = delivery_center_lon + delta_lon*100
    hub_coords_adjusted.append((new_lat, new_lon))

# ✅ 거리 기반 feature 추가 (조정된 좌표를 기반으로 계산)
for i, hub in enumerate(hub_coords_adjusted):
    df[f'distance_to_hub_{i}'] = df.apply(lambda row: great_circle((row['위도'], row['경도']), hub).miles, axis=1)

# ✅ 거리 가중치 적용 (비선형 변환)
for i in range(len(hub_coords_adjusted)):
    df[f'distance_to_hub_{i}'] = df[f'distance_to_hub_{i}'] ** 1  # 거리 차이를 극대화


# ✅ 데이터 정규화 (위경도 + 거리 feature 포함)
features = ['위도', '경도'] + [f'distance_to_hub_{i}' for i in range(len(hub_coords_adjusted))]
scaler = StandardScaler()
df_scaled = scaler.fit_transform(df[features])  

# ✅ 클러스터 개수 설정 (거점 개수에 맞춤)

num_clusters = len(hub_coords_adjusted)  

# ✅ 균등한 개수로 클러스터링 수행 (가중치 포함)
kmeans = KMeansConstrained(
    n_clusters=num_clusters, 
    size_min=len(df) // num_clusters,
    size_max=(len(df) // num_clusters) + 1,
    random_state=42
)
df['cluster'] = kmeans.fit_predict(df_scaled)
# ✅ 원래 데이터 개수(2만 개)로 복원
df_restored = df.groupby("택배ID").agg({
    "위도": "first",      # 동일 위치 유지
    "경도": "first",      # 동일 위치 유지
    "화물 개수": "sum",   # 늘린 개수 합산하여 복원
    "무게(kg)": "first",    # 무게 합산 복원
    "부피(cm³)": "first",   # 부피 합산 복원
    "cluster": "first",    # 같은 ID는 동일한 클러스터에 속함
    "도로명주소": "first"
}).reset_index()


# ✅ CSV 저장
df_restored.to_csv("택배생성데이터_clustered.csv", encoding="utf-8-sig", index=False)
# ✅ 군집별 색상 설정
color_list = ['red', 'blue', 'green', 'purple','darkgreen','orange','gray']
df_restored['color'] = df['cluster'].apply(lambda x: color_list[x % len(color_list)])

# ✅ 지도 시각화
center = [df_restored['위도'].mean(), df_restored['경도'].mean()]
map_ = folium.Map(location=center, zoom_start=12)

# ✅ 원래 거점 좌표로 지도에 표시 (위치 변경 없음)
for idx, (lat, lon) in enumerate(hub_coords_real):
    folium.Marker(
        location=[lat, lon],
        popup=f"택배 거점 {idx + 1} (원래 위치)",
        icon=folium.Icon(color="black", icon="cloud")
    ).add_to(map_)

# ✅ 클러스터별로 1/10 샘플링 (비율 유지)
df_sampled = df_restored.groupby('cluster', group_keys=False).apply(lambda x: x.sample(frac=1/40, random_state=42))

# ✅ 샘플링된 데이터로 folium.Marker 표시
for _, row in df_sampled.iterrows():
    folium.CircleMarker(
        location=[row['위도'], row['경도']],
        radius=5,  # 원 크기 조절
        color=row['color'],
        fill=True,
        fill_color=row['color'],
        fill_opacity=0.7,
        popup=f"Cluster {row['cluster']}"
    ).add_to(map_)

# ✅ 지도 저장
map_.save("map_weighted_adjusted.html")
print("✅ 지도 저장 완료! 'map_weighted_adjusted.html' 파일을 열어보세요.")



  df_sampled = df_restored.groupby('cluster', group_keys=False).apply(lambda x: x.sample(frac=1/40, random_state=42))


✅ 지도 저장 완료! 'map_weighted_adjusted.html' 파일을 열어보세요.


In [2]:
num_clusters = len(hub_coords_adjusted)

# ✅ 균등한 개수로 클러스터링 수행 (가중치 포함)
kmeans = KMeansConstrained(
    n_clusters=num_clusters, 
    size_min=len(df) // num_clusters,
    size_max=(len(df) // num_clusters) + 1,
    random_state=42
)
df['cluster'] = kmeans.fit_predict(df_scaled)

In [7]:
import networkx as nx
import pandas as pd
import osmnx as ox
import folium

# ✅ 데이터 로드
graph_path = "서울시_간소화.graphml"
meta_data_path = "meta_data_clustered.csv"

df = pd.read_csv(meta_data_path, encoding="utf-8-sig")
graph = ox.load_graphml(graph_path)  # 도로 네트워크

# ✅ 도로 네트워크에서 노드 및 엣지 추출
nodes, edges = ox.graph_to_gdfs(graph, nodes=True, edges=True)

# ✅ 거점 좌표 (클러스터 중심)
hub_coords_real = [
    (37.5431586580816, 126.948894324085),  
    (37.5992108624948, 126.78440979783),
    (37.570379, 126.990688),
    (37.575928, 126.994411),
    (37.552487, 126.937269),
    (37.564719, 126.977069),
    (37.585791, 126.925488)
]

# ✅ 클러스터별 거점 매칭
def find_nearest_node(lat, lon):
    """주어진 위경도에 가장 가까운 OSM 노드를 찾는 함수"""
    return ox.distance.nearest_nodes(graph, X=lon, Y=lat)

# ✅ 거점 노드 찾기
hub_nodes = {i: find_nearest_node(lat, lon) for i, (lat, lon) in enumerate(hub_coords_real)}

# ✅ 클러스터별 배송지 노드 찾기
df["osm_node"] = df.apply(lambda row: find_nearest_node(row["위도"], row["경도"]), axis=1)

# ✅ 경로 최적화 (거점 → 모든 배송지 → 거점)
def find_optimal_route(cluster_id):
    """거점에서 출발하여 모든 배송지를 방문하고 다시 거점으로 돌아오는 최적 경로"""
    cluster_data = df[df["cluster"] == cluster_id]
    start_node = hub_nodes[cluster_id]
    delivery_nodes = cluster_data["osm_node"].unique().tolist()
    
    if not delivery_nodes:
        return [start_node, start_node], 0
    
    # 🚀 최근접 이웃 방식으로 경로 탐색 (도로 네트워크 기반)
    current_node = start_node
    route = [current_node]
    total_distance = 0

    while delivery_nodes:
        nearest_node = min(
            delivery_nodes, 
            key=lambda x: nx.shortest_path_length(graph, current_node, x, weight="length")
        )
        path = nx.shortest_path(graph, current_node, nearest_node, weight="length")
        total_distance += nx.shortest_path_length(graph, current_node, nearest_node, weight="length")
        
        route.extend(path[1:])  # 현재 경로를 추가
        current_node = nearest_node
        delivery_nodes.remove(nearest_node)
    
    # 다시 거점으로 돌아옴
    path_back = nx.shortest_path(graph, current_node, start_node, weight="length")
    total_distance += nx.shortest_path_length(graph, current_node, start_node, weight="length")
    route.extend(path_back[1:])

    return route, total_distance

# ✅ 모든 클러스터에 대해 최적 경로 찾기
optimal_routes = {}
for cluster_id in df["cluster"].unique():
    route, distance = find_optimal_route(cluster_id)
    optimal_routes[cluster_id] = {"route": route, "distance": distance}

# ✅ 지도 시각화
center = [df["위도"].mean(), df["경도"].mean()]
map_ = folium.Map(location=center, zoom_start=12)

# ✅ 거점 표시
for idx, (lat, lon) in enumerate(hub_coords_real):
    folium.Marker(
        location=[lat, lon],
        popup=f"거점 {idx}",
        icon=folium.Icon(color="black", icon="cloud")
    ).add_to(map_)

# ✅ 클러스터별 고유 색상 설정
color_palette = ['red', 'blue', 'green', 'purple', 'pink', 'orange', 'gray']

# ✅ 최적 경로 시각화 (각 클러스터별 다른 색상 적용)
for i, (cluster_id, route_info) in enumerate(optimal_routes.items()):
    route = route_info["route"]
    
    # 클러스터 ID에 따라 색상 선택
    route_color = color_palette[i % len(color_palette)]

    # 도로 네트워크를 따라가는 경로 생성
    route_coords = [(nodes.loc[node]["y"], nodes.loc[node]["x"]) for node in route if node in nodes.index]

    folium.PolyLine(
        locations=route_coords,
        color=route_color,
        weight=3,
        popup=f"Cluster {cluster_id} - Distance: {route_info['distance']:.2f}m"
    ).add_to(map_)

# ✅ 지도 저장
map_.save("optimal_delivery_routes.html")
print("✅ 최적 경로 지도 저장 완료! 'optimal_delivery_routes.html' 파일을 열어보세요.")

# ✅ Jupyter Notebook에서 실행 중이라면 지도 표시
try:
    from IPython.display import display
    display(map_)
except ImportError:
    pass


✅ 최적 경로 지도 저장 완료! 'optimal_delivery_routes.html' 파일을 열어보세요.


In [5]:
import networkx as nx
import pandas as pd
import osmnx as ox
import folium

# ✅ 데이터 로드
graph_path = "서울시_간소화.graphml"
meta_data_path = "meta_data_clustered.csv"

df = pd.read_csv(meta_data_path, encoding="utf-8-sig")
graph = ox.load_graphml(graph_path)  # 도로 네트워크

# ✅ 도로 네트워크에서 노드 및 엣지 추출
nodes, edges = ox.graph_to_gdfs(graph, nodes=True, edges=True)

# ✅ 거점 좌표 (클러스터 중심)
hub_coords_real = [
    (37.5431586580816, 126.948894324085),  
    (37.5992108624948, 126.78440979783),
    (37.570379, 126.990688),
    (37.575928, 126.994411),
    (37.552487, 126.937269),
    (37.564719, 126.977069),
    (37.585791, 126.925488)
]

# ✅ 클러스터별 거점 매칭
def find_nearest_node(lat, lon):
    """주어진 위경도에 가장 가까운 OSM 노드를 찾는 함수"""
    return ox.distance.nearest_nodes(graph, X=lon, Y=lat)

# ✅ 거점 노드 찾기
hub_nodes = {i: find_nearest_node(lat, lon) for i, (lat, lon) in enumerate(hub_coords_real)}

# ✅ 클러스터별 배송지 노드 찾기
df["osm_node"] = df.apply(lambda row: find_nearest_node(row["위도"], row["경도"]), axis=1)

# ✅ 경로 최적화 (거점 → 모든 배송지 → 거점)
def find_optimal_route(cluster_id):
    """거점에서 출발하여 모든 배송지를 방문하고 다시 거점으로 돌아오는 최적 경로"""
    cluster_data = df[df["cluster"] == cluster_id]
    start_node = hub_nodes[cluster_id]
    delivery_nodes = cluster_data["osm_node"].unique().tolist()
    
    if not delivery_nodes:
        return [start_node, start_node], 0
    
    # 🚀 최근접 이웃 방식으로 경로 탐색 (도로 네트워크 기반)
    current_node = start_node
    route = [current_node]
    total_distance = 0
    visited_delivery_nodes = []

    while delivery_nodes:
        nearest_node = min(
            delivery_nodes, 
            key=lambda x: nx.shortest_path_length(graph, current_node, x, weight="length")
        )
        path = nx.shortest_path(graph, current_node, nearest_node, weight="length")
        total_distance += nx.shortest_path_length(graph, current_node, nearest_node, weight="length")
        
        route.extend(path[1:])  # 현재 경로를 추가
        current_node = nearest_node
        visited_delivery_nodes.append(nearest_node)  # 배송지 방문 순서 저장
        delivery_nodes.remove(nearest_node)
    
    # 다시 거점으로 돌아옴
    path_back = nx.shortest_path(graph, current_node, start_node, weight="length")
    total_distance += nx.shortest_path_length(graph, current_node, start_node, weight="length")
    route.extend(path_back[1:])

    return route, total_distance, visited_delivery_nodes  # 🚀 방문한 배송지 리스트도 반환

# ✅ 모든 클러스터에 대해 최적 경로 찾기
optimal_routes = {}
for cluster_id in df["cluster"].unique():
    route, distance, visited_delivery_nodes = find_optimal_route(cluster_id)
    optimal_routes[cluster_id] = {
        "route": route,
        "distance": distance,
        "delivery_order": visited_delivery_nodes  # 🚀 실제 배송지 도착 순서 저장
    }

# ✅ 클러스터별 개별 지도 저장
color_palette = ['red', 'blue', 'green', 'purple', 'pink', 'orange', 'gray']

for i, (cluster_id, route_info) in enumerate(optimal_routes.items()):
    # ✅ 지도 생성 (클러스터별 개별 지도)
    center = [df[df["cluster"] == cluster_id]["위도"].mean(), df[df["cluster"] == cluster_id]["경도"].mean()]
    map_cluster = folium.Map(location=center, zoom_start=12)

    # ✅ 해당 클러스터의 거점만 지도에 표시
    hub_lat, hub_lon = hub_coords_real[cluster_id]
    folium.Marker(
        location=[hub_lat, hub_lon],
        popup=f"거점 {cluster_id}",
        icon=folium.Icon(color="black", icon="cloud")
    ).add_to(map_cluster)

    # ✅ 배송지 도착 순서 매핑 (🚀 방문 순서대로 1번부터 매핑)
    delivery_order = {node: idx+1 for idx, node in enumerate(route_info["delivery_order"])}

    # ✅ 클러스터별 배송지 표시 (🚀 실제 도착 순서 적용)
    cluster_data = df[df["cluster"] == cluster_id]
    route_color = color_palette[i % len(color_palette)]

    for _, row in cluster_data.iterrows():
        node = row["osm_node"]
        order_num = delivery_order.get(node, "?")  # 배송지 도착 순서
    
        # ✅ 원형 숫자 마커 (흰색 배경 + 검은색 테두리 + 중앙 정렬)
        folium.Marker(
            location=[row["위도"], row["경도"]],
            icon=folium.DivIcon(
                html=f"""
                    <div style="
                        font-size: 14pt; 
                        color: black; 
                        background: white; 
                        padding: 8px; 
                        border-radius: 50%;
                        border: 2px solid black;
                        text-align: center;
                        width: 35px;
                        height: 35px;
                        display: flex;
                        align-items: center;
                        justify-content: center;
                        font-weight: bold;">
                        {order_num}
                    </div>
                """
            )
        ).add_to(map_cluster)

    # ✅ 클러스터별 경로 추가
    route = route_info["route"]
    route_coords = [(nodes.loc[node]["y"], nodes.loc[node]["x"]) for node in route if node in nodes.index]

    folium.PolyLine(
        locations=route_coords,
        color=route_color,
        weight=3,
        popup=f"Cluster {cluster_id} - Distance: {route_info['distance']:.2f}m"
    ).add_to(map_cluster)

    # ✅ 클러스터별 지도 저장
    file_name = f"optimal_delivery_routes_cluster_{cluster_id}.html"
    map_cluster.save(file_name)
    print(f"✅ 클러스터 {cluster_id} 경로 저장 완료! 파일: {file_name}")

# ✅ Jupyter Notebook에서 실행 중이라면 지도 표시 (첫 번째 클러스터)
try:
    from IPython.display import display
    first_cluster_id = list(optimal_routes.keys())[0]
    display(folium.Map(location=center, zoom_start=12))
except ImportError:
    pass 

✅ 클러스터 1 경로 저장 완료! 파일: optimal_delivery_routes_cluster_1.html
✅ 클러스터 5 경로 저장 완료! 파일: optimal_delivery_routes_cluster_5.html
✅ 클러스터 0 경로 저장 완료! 파일: optimal_delivery_routes_cluster_0.html
✅ 클러스터 4 경로 저장 완료! 파일: optimal_delivery_routes_cluster_4.html
✅ 클러스터 2 경로 저장 완료! 파일: optimal_delivery_routes_cluster_2.html
✅ 클러스터 3 경로 저장 완료! 파일: optimal_delivery_routes_cluster_3.html
✅ 클러스터 6 경로 저장 완료! 파일: optimal_delivery_routes_cluster_6.html


In [10]:
import networkx as nx
import pandas as pd
import osmnx as ox
import folium
from heapq import nsmallest

# ✅ 데이터 로드
graph_path = "서울시_간소화.graphml"
meta_data_path = "meta_data_clustered.csv"

df = pd.read_csv(meta_data_path, encoding="utf-8-sig")
graph = ox.load_graphml(graph_path)  # 도로 네트워크

# ✅ 도로 네트워크에서 노드 및 엣지 추출
nodes, edges = ox.graph_to_gdfs(graph, nodes=True, edges=True)

# ✅ 거점 좌표 (클러스터 중심)
hub_coords_real = [
    (37.5431586580816, 126.948894324085),  
    (37.5992108624948, 126.78440979783),
    (37.570379, 126.990688),
    (37.575928, 126.994411),
    (37.552487, 126.937269),
    (37.564719, 126.977069),
    (37.585791, 126.925488)
]

# ✅ 클러스터별 거점 매칭
def find_nearest_node(lat, lon):
    """주어진 위경도에 가장 가까운 OSM 노드를 찾는 함수"""
    return ox.distance.nearest_nodes(graph, X=lon, Y=lat)

# ✅ 거점 노드 찾기
hub_nodes = {i: find_nearest_node(lat, lon) for i, (lat, lon) in enumerate(hub_coords_real)}

# ✅ 클러스터별 배송지 노드 찾기
df["osm_node"] = df.apply(lambda row: find_nearest_node(row["위도"], row["경도"]), axis=1)

# ✅ 최근접 k개 후보 중 최적 경로 선택하는 함수
def find_nearest_k_nodes(graph, src, delivery_nodes, k=5):
    """ 주어진 노드(src)에서 가장 가까운 k개의 노드 반환 """
    distances = {node: nx.shortest_path_length(graph, src, node, weight="length") for node in delivery_nodes}
    return nsmallest(k, distances, key=distances.get)

# ✅ 최적 경로 탐색 (최근접 k개 후보 활용)
def find_optimal_route_with_k_nearest(cluster_id, k=10):
    """거점에서 출발하여 모든 배송지를 방문하고 다시 거점으로 돌아오는 최적 경로"""
    cluster_data = df[df["cluster"] == cluster_id]
    start_node = hub_nodes[cluster_id]
    delivery_nodes = cluster_data["osm_node"].unique().tolist()
    
    if not delivery_nodes:
        return [start_node, start_node], 0, []

    visited = set()
    optimal_route = [start_node]
    total_distance = 0
    current_node = start_node
    visited_delivery_nodes = []

    while len(visited) < len(delivery_nodes):
        visited.add(current_node)

        # ✅ 최근접 k개 노드 중 최적 선택
        nearest_k = find_nearest_k_nodes(graph, current_node, [n for n in delivery_nodes if n not in visited], k)
        if not nearest_k:
            break  # 방문할 노드가 없으면 종료

        next_node = min(nearest_k, key=lambda n: nx.shortest_path_length(graph, current_node, n, weight="length"))
        
        path = nx.shortest_path(graph, current_node, next_node, weight="length")
        path_length = nx.shortest_path_length(graph, current_node, next_node, weight="length")

        total_distance += path_length
        optimal_route.extend(path[:-1])  # 중복 방지
        visited_delivery_nodes.append(next_node)

        current_node = next_node

    # 다시 거점으로 복귀
    path_back = nx.shortest_path(graph, current_node, start_node, weight="length")
    total_distance += nx.shortest_path_length(graph, current_node, start_node, weight="length")
    optimal_route.extend(path_back[1:])

    return optimal_route, total_distance, visited_delivery_nodes

# ✅ 모든 클러스터에 대해 최적 경로 찾기
optimal_routes = {}
for cluster_id in df["cluster"].unique():
    route, distance, visited_delivery_nodes = find_optimal_route_with_k_nearest(cluster_id, k=5)
    optimal_routes[cluster_id] = {
        "route": route,
        "distance": distance,
        "delivery_order": visited_delivery_nodes
    }

# ✅ 클러스터별 개별 지도 저장
color_palette = ['red', 'blue', 'green', 'purple', 'pink', 'orange', 'gray']

for i, (cluster_id, route_info) in enumerate(optimal_routes.items()):
    # ✅ 지도 생성 (클러스터별 개별 지도)
    center = [df[df["cluster"] == cluster_id]["위도"].mean(), df[df["cluster"] == cluster_id]["경도"].mean()]
    map_cluster = folium.Map(location=center, zoom_start=12)

    # ✅ 해당 클러스터의 거점만 지도에 표시
    hub_lat, hub_lon = hub_coords_real[cluster_id]
    folium.Marker(
        location=[hub_lat, hub_lon],
        popup=f"거점 {cluster_id}",
        icon=folium.Icon(color="black", icon="cloud")
    ).add_to(map_cluster)

    # ✅ 배송지 도착 순서 매핑
    delivery_order = {node: idx+1 for idx, node in enumerate(route_info["delivery_order"])}

    # ✅ 클러스터별 배송지 표시
    cluster_data = df[df["cluster"] == cluster_id]
    route_color = color_palette[i % len(color_palette)]

    for _, row in cluster_data.iterrows():
        node = row["osm_node"]
        order_num = delivery_order.get(node, "?")  

        # ✅ 원형 숫자 마커
        folium.Marker(
            location=[row["위도"], row["경도"]],
            icon=folium.DivIcon(
                html=f"""
                    <div style="
                        font-size: 14pt; 
                        color: black; 
                        background: white; 
                        padding: 8px; 
                        border-radius: 50%;
                        border: 2px solid black;
                        text-align: center;
                        width: 35px;
                        height: 35px;
                        display: flex;
                        align-items: center;
                        justify-content: center;
                        font-weight: bold;">
                        {order_num}
                    </div>
                """
            )
        ).add_to(map_cluster)

    # ✅ 클러스터별 경로 추가
    route = route_info["route"]
    route_coords = [(nodes.loc[node]["y"], nodes.loc[node]["x"]) for node in route if node in nodes.index]

    folium.PolyLine(
        locations=route_coords,
        color=route_color,
        weight=3,
        popup=f"Cluster {cluster_id} - Distance: {route_info['distance']:.2f}m"
    ).add_to(map_cluster)

    # ✅ 클러스터별 지도 저장
    file_name = f"optimal_delivery_routes_cluster_{cluster_id}.html"
    map_cluster.save(file_name)
    print(f"✅ 클러스터 {cluster_id} 경로 저장 완료! 파일: {file_name}")


✅ 클러스터 1 경로 저장 완료! 파일: optimal_delivery_routes_cluster_1.html
✅ 클러스터 5 경로 저장 완료! 파일: optimal_delivery_routes_cluster_5.html
✅ 클러스터 0 경로 저장 완료! 파일: optimal_delivery_routes_cluster_0.html
✅ 클러스터 4 경로 저장 완료! 파일: optimal_delivery_routes_cluster_4.html
✅ 클러스터 2 경로 저장 완료! 파일: optimal_delivery_routes_cluster_2.html
✅ 클러스터 3 경로 저장 완료! 파일: optimal_delivery_routes_cluster_3.html
✅ 클러스터 6 경로 저장 완료! 파일: optimal_delivery_routes_cluster_6.html


In [26]:
import networkx as nx
import pandas as pd
import osmnx as ox
import folium
import heapq  # 🚀 heapq를 사용하여 최근접 k개 후보 탐색 속도 개선

# ✅ 데이터 로드 및 간소화
graph_path = "seoul_road_network.graphml"
meta_data_path = "meta_data_clustered.csv"

df = pd.read_csv(meta_data_path, encoding="utf-8-sig")
graph = ox.load_graphml(graph_path)  # 도로 네트워크

# ✅ 도로 네트워크에서 연결된 노드만 남기기 (최대 연결 그래프 선택)
connected_components = list(nx.connected_components(graph.to_undirected()))
largest_component = max(connected_components, key=len)
graph = graph.subgraph(largest_component)
print(f"🚀 연결된 노드만 포함된 그래프 노드 수: {len(graph.nodes)}")

# ✅ 거점 좌표 (클러스터 중심)
hub_coords_real = [
    (37.5431586580816, 126.948894324085),  
    (37.5992108624948, 126.78440979783),
    (37.570379, 126.990688),
    (37.575928, 126.994411),
    (37.552487, 126.937269),
    (37.564719, 126.977069),
    (37.585791, 126.925488)
]

# ✅ 연결된 노드만 선택하는 함수
def find_nearest_connected_node(lat, lon):
    """연결된 OSM 노드 중 가장 가까운 노드 찾기"""
    try:
        nearest_node = ox.distance.nearest_nodes(graph, X=lon, Y=lat)
        if nearest_node in graph and list(graph.neighbors(nearest_node)):
            return nearest_node
    except Exception:
        pass

    # ✅ 연결된 노드 중 가장 가까운 노드 찾기
    connected_nodes = [n for n in graph.nodes if list(graph.neighbors(n))]
    nearest_node = min(
        connected_nodes, 
        key=lambda n: ox.distance.great_circle(lat, lon, graph.nodes[n]['y'], graph.nodes[n]['x'])
    )
    
    return nearest_node

# ✅ 거점 노드 찾기
hub_nodes = {i: find_nearest_connected_node(lat, lon) for i, (lat, lon) in enumerate(hub_coords_real)}
df["osm_node"] = df.apply(lambda row: find_nearest_connected_node(row["위도"], row["경도"]), axis=1)

# ✅ 최단 경로 탐색 (예외 처리 포함)
def safe_shortest_path(graph, src, dst):
    try:
        return nx.shortest_path(graph, src, dst, weight="length")
    except nx.NetworkXNoPath:
        print(f"🚨 경로 없음: {src} -> {dst}, 대체 경로 탐색")
        return []

# ✅ 최근접 k개 노드 찾는 함수 (최적화)
def find_nearest_k_nodes(graph, src, delivery_nodes, k=5):
    """src에서 가장 가까운 k개의 배송지 노드를 찾는 함수"""
    candidates = []
    for node in delivery_nodes:
        try:
            distance = nx.shortest_path_length(graph, src, node, weight="length")
            heapq.heappush(candidates, (distance, node))
        except nx.NetworkXNoPath:
            continue  # 경로 없으면 건너뛰기

    return [heapq.heappop(candidates)[1] for _ in range(min(k, len(candidates)))]

# ✅ 최적 경로 탐색 (최근접 k개 후보 활용 - 속도 개선)
def find_optimal_route_with_k_nearest(cluster_id, k=10):
    cluster_data = df[df["cluster"] == cluster_id]
    start_node = hub_nodes[cluster_id]
    delivery_nodes = set(cluster_data["osm_node"].unique())  # 🚀 set()으로 관리하여 탐색 속도 개선
    
    if not delivery_nodes:
        return [start_node, start_node], 0, []

    visited = {}  # 🚀 방문 체크를 딕셔너리로 변경 (set()보다 빠름)
    optimal_route = [start_node]
    total_distance = 0
    current_node = start_node
    visited_delivery_nodes = []

    while delivery_nodes:
        visited[current_node] = True

        # ✅ 최근접 k개 후보 중 최적 선택 (미리 k개만 계산해서 최적화)
        nearest_k = find_nearest_k_nodes(graph, current_node, list(delivery_nodes), k)
        if not nearest_k:
            break  

        next_node = min(nearest_k, key=lambda n: nx.shortest_path_length(graph, current_node, n, weight="length"))

        path = safe_shortest_path(graph, current_node, next_node)
        if path:
            total_distance += nx.shortest_path_length(graph, current_node, next_node, weight="length")
            optimal_route.extend(path[:-1])
            visited_delivery_nodes.append(next_node)
            current_node = next_node
            delivery_nodes.remove(next_node)  # 🚀 방문한 노드는 삭제

    # ✅ 다시 거점으로 복귀
    path_back = safe_shortest_path(graph, current_node, start_node)
    if path_back:
        total_distance += nx.shortest_path_length(graph, current_node, start_node, weight="length")
        optimal_route.extend(path_back[1:])

    return optimal_route, total_distance, visited_delivery_nodes

# ✅ 모든 클러스터에 대해 최적 경로 찾기 및 즉시 저장
color_palette = ['red', 'blue', 'green', 'purple', 'darkgreen', 'orange', 'gray']

for i, cluster_id in enumerate(df["cluster"].unique()):
    route, distance, visited_delivery_nodes = find_optimal_route_with_k_nearest(cluster_id, k=5)

    # ✅ 지도 생성 (클러스터별 개별 지도)
    center = [df[df["cluster"] == cluster_id]["위도"].mean(), df[df["cluster"] == cluster_id]["경도"].mean()]
    map_cluster = folium.Map(location=center, zoom_start=12)

    # ✅ 해당 클러스터의 거점만 지도에 표시
    hub_lat, hub_lon = hub_coords_real[cluster_id]
    folium.Marker(
        location=[hub_lat, hub_lon],
        popup=f"거점 {cluster_id}",
        icon=folium.Icon(color="black", icon="cloud")
    ).add_to(map_cluster)

    # ✅ 배송지 도착 순서 매핑
    delivery_order = {node: idx+1 for idx, node in enumerate(visited_delivery_nodes)}

    # ✅ 클러스터별 배송지 표시
    cluster_data = df[df["cluster"] == cluster_id]
    route_color = color_palette[i % len(color_palette)]

    for _, row in cluster_data.iterrows():
        node = row["osm_node"]
        order_num = delivery_order.get(node, "?")  

        folium.Marker(
            location=[row["위도"], row["경도"]],
            icon=folium.DivIcon(
                html=f"""
                    <div style="
                        font-size: 14pt; 
                        color: black; 
                        background: white; 
                        padding: 8px; 
                        border-radius: 50%;
                        border: 2px solid black;
                        text-align: center;
                        width: 35px;
                        height: 35px;
                        display: flex;
                        align-items: center;
                        justify-content: center;
                        font-weight: bold;">
                        {order_num}
                    </div>
                """
            )
        ).add_to(map_cluster)

    # ✅ 클러스터별 경로 추가
    route_coords = [(graph.nodes[node]["y"], graph.nodes[node]["x"]) for node in route if node in graph.nodes]
    folium.PolyLine(
        locations=route_coords,
        color=route_color,
        weight=3,
        popup=f"Cluster {cluster_id} - Distance: {distance:.2f}m"
    ).add_to(map_cluster)

    # ✅ 🚀 클러스터 개별 즉시 저장
    file_name = f"optimal_delivery_routes_cluster_{cluster_id}.html"
    map_cluster.save(file_name)
    print(f"✅ 클러스터 {cluster_id} 즉시 저장 완료! 파일: {file_name}")

print(f"✅ 모든 클러스터 최적 경로 계산 완료!") 


🚀 연결된 노드만 포함된 그래프 노드 수: 68160


KeyboardInterrupt: 