In [6]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import heapq
import random
from io import StringIO

# ==============================================================================
# PHẦN 1: NẠP DỮ LIỆU TỪ FILE VÀ XÂY DỰNG ĐỒ THỊ
# ==============================================================================

# 1.1. Cấu hình tên file
# Bạn hãy đổi tên này thành đúng tên file hoặc đường dẫn file trên máy của bạn
FILE_PATH = r'D:\GIS_Project\data\6_DSCanhKQ2_CanTho_XoaCon3Cot_XoaDongTrung.txt'

print(f"--- 1. ĐANG ĐỌC FILE DỮ LIỆU: {FILE_PATH} ---")

try:
    # 1.2. Đọc file vào DataFrame
    # sep='\t' nghĩa là các cột cách nhau bằng phím Tab.
    # Nếu file của bạn cách nhau bằng khoảng trắng, hãy thêm tham số: delim_whitespace=True
    df = pd.read_csv(FILE_PATH, sep='\t')
    
    print(f"-> Đã đọc thành công {len(df)} dòng (cạnh).")
    print("-> 5 dòng đầu tiên của dữ liệu:")
    print(df.head())

    # 1.3. Tạo đồ thị NetworkX từ DataFrame
    # source: Cột điểm đầu, target: Cột điểm cuối, edge_attr: Trọng số (độ dài)
    G = nx.from_pandas_edgelist(df, source='IdStart', target='IdEnd', edge_attr='Length')

    # 1.4. Chuẩn hóa tên trọng số (Đổi 'Length' thành 'weight' cho thuật toán hiểu)
    for u, v in G.edges():
        G[u][v]['weight'] = G[u][v]['Length']

    # 1.5. Tạo tọa độ giả lập để vẽ hình (Vì file txt chỉ có nối, không có x,y)
    # seed=42 để giữ hình cố định, không bị nhảy lung tung mỗi lần chạy
    pos = nx.spring_layout(G, seed=42) 
    
    print(f"-> Đã xây dựng xong đồ thị: {G.number_of_nodes()} nút, {G.number_of_edges()} cạnh.")

    # 1.6. Chuẩn bị danh sách điểm sự kiện (Data Points)
    # Vì file txt chỉ là bản đồ đường đi, ta cần danh sách các điểm cần phân cụm.
    # Ở đây code sẽ lấy TẤT CẢ các điểm có trong file để chạy phân cụm.
    data_nodes = list(G.nodes())
    print(f"-> Số lượng điểm cần phân tích: {len(data_nodes)}")

except FileNotFoundError:
    print(f"\n[LỖI] Không tìm thấy file '{FILE_PATH}'!")
    print("Hãy chắc chắn rằng bạn đã upload file này lên cùng thư mục với file code Python.")
    # Tạo một đồ thị rỗng để code phía sau không bị crash ngay lập tức
    G = nx.Graph()
    data_nodes = []
    pos = {}

--- 1. ĐANG ĐỌC FILE DỮ LIỆU: D:\GIS_Project\data\6_DSCanhKQ2_CanTho_XoaCon3Cot_XoaDongTrung.txt ---
-> Đã đọc thành công 3093 dòng (cạnh).
-> 5 dòng đầu tiên của dữ liệu:
   IdStar  IdEnd      Length
0       0      8    3.785510
1       1   2539    2.983633
2       2    193    7.865300
3       3    214  122.200679
4       3   1060   40.103606


KeyError: 'IdStart'

In [2]:
# ==============================================================================
# 2. HÀM VẼ CÓ MŨI TÊN (DIRECTED VISUALIZATION)
# ==============================================================================
def visualize_directed_flow(G, center_node, eps, pos):
    distances = {center_node: 0}
    queue = [(0, center_node)]
    
    # Lưu đường đi CÓ HƯỚNG: (từ_điểm, đến_điểm)
    path_edges = [] 
    reachable_nodes = []
    
    print(f"--- LUỒNG ĐI TỪ NODE {center_node} (Eps={eps}) ---")
    
    while queue:
        curr_dist, u = heapq.heappop(queue)
        
        if curr_dist > eps: continue
        
        if u != center_node:
            reachable_nodes.append(u)
            
        for v in G.neighbors(u):
            weight = G[u][v]['weight']
            new_dist = curr_dist + weight
            
            if new_dist <= eps:
                # Cập nhật đường đi
                if new_dist < distances.get(v, float('inf')):
                    distances[v] = new_dist
                    heapq.heappush(queue, (new_dist, v))
                    
                    # QUAN TRỌNG: Lưu hướng đi từ u -> v
                    path_edges.append((u, v))
                    print(f"  > Bước nhảy: {u} -> {v} (Cạnh: {weight}, Tổng: {new_dist})")

    # --- VẼ HÌNH ---
    plt.figure(figsize=(14, 10))
    
    # 1. Vẽ nền (Mờ)
    nx.draw_networkx_edges(G, pos, edge_color='#DDDDDD', width=1, arrows=False)
    # Vẽ nhãn trọng số cho tất cả cạnh (màu xám nhạt)
    all_weights = nx.get_edge_attributes(G, 'weight')
    # Làm tròn số cho đẹp
    all_weights = {k: f"{v:.1f}" for k, v in all_weights.items()}
    nx.draw_networkx_edge_labels(G, pos, edge_labels=all_weights, font_color='#AAAAAA', font_size=8)

    # 2. Vẽ các điểm không chạm tới
    unreachable = [n for n in G.nodes() if n not in reachable_nodes and n != center_node]
    nx.draw_networkx_nodes(G, pos, nodelist=unreachable, node_color='lightgray', node_size=200, label='Ngoài vùng')

    # 3. Vẽ MŨI TÊN ĐƯỜNG ĐI (Màu đỏ)
    # arrows=True sẽ vẽ mũi tên chỉ hướng
    nx.draw_networkx_edges(G, pos, edgelist=path_edges, 
                           edge_color='red', width=2.5, 
                           arrows=True, arrowstyle='-|>', arrowsize=20,
                           label='Luồng đi (Flow)')

    # 4. Vẽ điểm trong vùng (Xanh) và Tâm (Vàng)
    if reachable_nodes:
        nx.draw_networkx_nodes(G, pos, nodelist=reachable_nodes, node_color='#90EE90', edgecolors='black', node_size=500, label='Hàng xóm')
    nx.draw_networkx_nodes(G, pos, nodelist=[center_node], node_color='yellow', edgecolors='red', linewidths=2, node_size=700, label='Tâm')

    # 5. Nhãn tên điểm
    nx.draw_networkx_labels(G, pos, font_size=10, font_weight='bold')
    
    # 6. Tô đậm trọng số trên đường đi đỏ
    red_edge_labels = {edge: f"{G.edges[edge]['weight']:.1f}" for edge in path_edges}
    # Lưu ý: nx.draw_networkx_edge_labels mặc định nhận key là tuple (u,v) theo thứ tự nhỏ->lớn nếu là Graph vô hướng.
    # Để vẽ đúng, ta cần trick một chút hoặc chấp nhận nó đè lên label xám.
    # Ở đây vẽ đè lên màu đỏ cho rõ:
    nx.draw_networkx_edge_labels(G, pos, edge_labels=red_edge_labels, font_color='red', font_weight='bold', font_size=10)

    plt.title(f"MÔ PHỎNG LUỒNG ĐI CÓ HƯỚNG (DIRECTED FLOW)\nTâm: {center_node} | Eps: {eps}", fontsize=15)
    plt.legend(loc='upper right')
    plt.axis('off')
    plt.show()

In [3]:
# ==============================================================================
# PHẦN 3: CHẠY THỬ NGHIỆM
# ==============================================================================

# Kịch bản 1: Đứng ở Node 0, tìm các điểm trong bán kính 55m
# Node 0 nối với 19 (50m) và 4 (50.7m). Cả hai đều <= 55 nên sẽ màu Xanh.
# Node 20 cũng nối với 0 (50m) nên cũng Xanh.
visualize_directed_flow(G, center_node=0, eps=55.0, pos=pos)

# Kịch bản 2: Đứng ở Node 7, tìm các điểm trong bán kính 50m
# Node 7 là một ngã tư lớn nối với 4, 6, 8, 23. Tất cả đều gần nhau.
visualize_directed_flow(G, center_node=7, eps=50.0, pos=pos)

--- LUỒNG ĐI TỪ NODE 0 (Eps=55.0) ---


NetworkXError: The node 0 is not in the graph.