# Lab 01: Các thuật toán tìm kiếm BFS, DFS và UCS

In [1]:
from collections import defaultdict
from queue import Queue, PriorityQueue

## Program
Cài đặt và thực thi chương trình

**INPUT:** file `*.txt` có cấu trúc như sau:

* **Dòng 1:** số node trên đồ thị
* **Dòng 2:** node xuất phát và node đích
* **Những dòng tiếp theo:** ma trận kề M của đồ thị với quy ước:
    * $M[i][j] = 0$: không có đường nối trực tiếp từ i tới j.
    * $M[i][j] = 1$: có đường nối trực tiếp từ i tới j ($M[i][j] = w$: có đường nối trực tiếp từ i tới j với chi phí là $w$ ($w > 0$) cho thuật toán UCS)

Ta lần lượt đọc 2 file `Input.txt` và `InputUCS.txt` là ma trận kề của đồ thị Đại học Khoa học Tự nhiên (*v1*) tới sân bay Tân Sơn Nhất (*v18*)

In [None]:
# convert matrix to adjacency list
def convert_graph(a, size):
    adjList = defaultdict(list)
    for i in range (size):
        edged = False
        for j in range(len(a[i])):
            if a[i][j] == 1:
                adjList[i].append(j)
                edged = True
        if not edged:
            adjList[i] = []
    return adjList

def convert_graph_weight(a, size):
    adjList = defaultdict(list)
    for i in range (size):
        edged = False
        for j in range(len(a[i])):
            if a[i][j] != 0:
                adjList[i].append((j, a[i][j]))
                edged = True
        if not edged:
            adjList[i] = []
    return adjList

In [603]:
graph_1 = convert_graph(matrix_1, size_1)
graph_2 = convert_graph_weight(matrix_2, size_2)

In [604]:
graph_1

defaultdict(list,
            {0: [1, 2, 3],
             1: [6],
             2: [5, 7],
             3: [4],
             4: [13],
             5: [11],
             6: [2],
             7: [8, 9],
             8: [10],
             9: [],
             10: [9, 14],
             11: [12],
             12: [13],
             13: [10],
             14: [15],
             15: [16],
             16: [17],
             17: []})

In [605]:
graph_2

defaultdict(list,
            {0: [(1, 50), (2, 350), (3, 300)],
             1: [(6, 600)],
             2: [(5, 100), (7, 900)],
             3: [(4, 1300)],
             4: [(13, 1400)],
             5: [(11, 700)],
             6: [(2, 800)],
             7: [(8, 790), (9, 300)],
             8: [(10, 1200)],
             9: [],
             10: [(9, 800), (14, 400)],
             11: [(12, 950)],
             12: [(13, 600)],
             13: [(10, 1300)],
             14: [(15, 1300)],
             15: [(16, 770)],
             16: [(17, 1200)],
             17: []})

### BFS

In [608]:
def BFS(graph, start, end):
    visited = []
    frontier = Queue()

    # add node start into frontier and visited
    frontier.put(start)
    visited.append(start)

    # start has no father
    parent = dict()
    parent[start] = None

    path_found = False
    
    while True:
        if frontier.empty():
            raise Exception("No way Exception")
        current_node = frontier.get()
        # # visited.append(current_node) 
        
        # Check if `current_node` is `end`?
        if current_node == end:
            path_found = True
            break

        for node in graph[current_node]:
            if node not in visited:
                frontier.put(node)
                parent[node] = current_node
                visited.append(node)

    # create path
    path = []
    if path_found:
        path.append(end)
        while parent[end] is not None:
            path.append(parent[end])
            end = parent[end]
        path.reverse()
    return path

### DFS

In [610]:
def DFS(graph, start, end):

    visited = []
    frontier = []

    # add node start into frontier and visited
    frontier.append(start)
    visited.append(start)

    # start has no father
    parent = dict()
    parent[start] = None

    path_found = False

    while True:
        if frontier == []:
            raise Exception("No way Exception")
        current_node = frontier.pop()
        # visited.append(current_node) # loại bỏ câu lệnh này
        
        # Check if `current_node` is `end`?
        if current_node == end:
            path_found = True
            break

        for node in graph[current_node]:
            if node not in visited:
                frontier.append(node)
                parent[node] = current_node
                visited.append(node)
        
    # create path
    path = []
    if path_found:
        path.append(end)
        while parent[end] is not None:
            path.append(parent[end])
            end = parent[end]
        path.reverse()
    return path

### UCS

In [612]:
def UCS(graph, start, end):

    visited = {} # change visited to dict where each node stores ('total_cost', 'parent')
    frontier = PriorityQueue()

    # add node start into frontier and visited
    frontier.put((0, start))
    visited[start] = (0, None) # start has no father.

    path_found = False
    
    while True:
        if frontier.empty():
            raise Exception("No way Exception")
        current_w, current_node = frontier.get()
        
        # Check if `current_node` is `end`?
        if current_node == end:
            path_found = True
            break

        for nodei in graph[current_node]:
            node, weight = nodei
            total_cost = current_w + weight
            if node not in visited or total_cost < visited[node][0]:
                frontier.put((total_cost, node))
                # update node in visited
                visited[node] = (total_cost, current_node)

    # create path
    path = []
    if path_found:
        path.append(end)
        while visited[end][1] is not None:
            path.append(visited[end][1])
            end = visited[end][1]
        path.reverse()
    return current_w, path

### Result

* Nếu tồn tại đường đi: xuất ra màn hình thứ tự đường đi từ *v1* tới *v18*.
* Nếu không tồn tại đường đi: thông báo không có đường đi

In [None]:
# Implement BFS algorithm
result_bfs = BFS(graph_1, start_1, goal_1)
print("Kết quả sử dụng thuật toán BFS: \n", result_bfs)

# Implement DFS algorithm
result_dfs = DFS(graph_1, start_1, goal_1)
print("Kết quả sử dụng thuật toán DFS: \n", result_dfs)

# Implement UCS algorithm
cost, result_ucs = UCS(graph_2, start_2, goal_2)
print("Kết quả sử dụng thuật toán UCS: \n", result_ucs, "với tổng số chi phí là", cost)

## Xây dựng class Graph

Xây dựng 2 class: 
1. **class Graph** với các methods sau:
   * print_graph: in ra đồ thị
   * BFS: trả về thứ tự duyệt đồ thị bằng thuật toán BFS
   * find_BFS_path: giải quyết bài toán tìm đường đi bằng thuật toán BFS
   * DFS: trả về thứ tự duyệt đồ thị bằng thuật toán DFS
   * find_DFS_path: giải quyết bài toán tìm đường đi bằng thuật toán DFS
   * reconstruct_path: truy vết đường đi của các thuật toán

2. **class Graph_Weight** với các methods sau:
   * print_graph: in ra đồ thị
   * find_UCS_path: giải quyết bài toán tìm đường đi với chi phí thấp nhất bằng thuật toán UCS
   * reconstruct_path: truy vết đường đi của các thuật toán

### class Graph

In [615]:
class Graph:
    def __init__(self, graph=None):
        if graph is None:
            self.graph = defaultdict(list)
        else:
            self.graph = graph

    def convert_graph(self, a, size):
        adjList = defaultdict(list)
        for i in range (size):
            edged = False
            for j in range(len(a[i])):
                if a[i][j] == 1:
                    adjList[i].append(j)
                    edged = True
            if not edged:
                adjList[i] = []
        self.graph = adjList

    def print_graph(self):
        return self.graph
        # for node, neighbors in self.graph.items():
        #     print(f"{node}: [{', '.join(map(str, neighbors))}]")
    
    def BFS(self, start):
        browsed = []
        visited = [False] * (len(self.graph)+1)
        frontier = Queue()

        # add node start into frontier and visited
        frontier.put(start)
        visited[start] = True

        while not frontier.empty():
            current_node = frontier.get()
            browsed.append(current_node) 
            
            for node in self.graph[current_node]:
                if visited[node] == False:
                    frontier.put(node)
                    visited[node] = True
        return browsed

    def find_BFS_path(self, start, end):
        visited = []
        frontier = Queue()
    
        # add node start into frontier and visited
        frontier.put(start)
        visited.append(start)
    
        # start has no father
        parent = dict()
        parent[start] = None
        
        while True:
            if frontier.empty():
                raise Exception("No way Exception")
                return None
            current_node = frontier.get()
            
            # Check if `current_node` is `end`?
            if current_node == end:
                return self.reconstruct_path(parent, end)
    
            for node in self.graph[current_node]:
                if node not in visited:
                    frontier.put(node)
                    parent[node] = current_node
                    visited.append(node)

    def DFS(self, start):
        browsed = []
        visited = {key: False for key in self.graph}
        frontier = []

        # add node start into frontier and visited
        frontier.append(start)
        visited[start] = True

        while frontier:
            current_node = frontier.pop()
            browsed.append(current_node) 
            
            for node in self.graph[current_node]:
                if visited[node] == False:
                    frontier.append(node)
                    visited[node] = True
        return browsed

    def find_DFS_path(self, start, end):
        visited = []
        frontier = []
    
        # add node start into frontier and visited
        frontier.append(start)
        visited.append(start)
    
        # start has no father
        parent = dict()
        parent[start] = None
    
        while True:
            if frontier == []:
                raise Exception("No way Exception")
                return None
            current_node = frontier.pop()
            # # visited.append(current_node)
            
            # Check if `current_node` is `end`?
            if current_node == end:
                return self.reconstruct_path(parent, end)
    
            for node in self.graph[current_node]:
                if node not in visited:
                    frontier.append(node)
                    parent[node] = current_node
                    visited.append(node)
                    
    def reconstruct_path(self, parent, end):
        path = []
        path.append(end)
        while parent[end] is not None:
            path.append(parent[end])
            end = parent[end]
        path.reverse()
        return path
    

In [616]:
G = Graph(graph_1)
G.print_graph()

defaultdict(list,
            {0: [1, 2, 3],
             1: [6],
             2: [5, 7],
             3: [4],
             4: [13],
             5: [11],
             6: [2],
             7: [8, 9],
             8: [10],
             9: [],
             10: [9, 14],
             11: [12],
             12: [13],
             13: [10],
             14: [15],
             15: [16],
             16: [17],
             17: []})

In [617]:
print('Thứ tự duyệt đồ thị bắt đầu từ nút 0 của thuật toán BFS:')
print(G.BFS(0))

Thứ tự duyệt đồ thị bắt đầu từ nút 0 của thuật toán BFS:
[0, 1, 2, 3, 6, 5, 7, 4, 11, 8, 9, 13, 12, 10, 14, 15, 16, 17]


In [618]:
print('Thứ tự duyệt đồ thị bắt đầu từ nút 0 của thuật toán DFS:')
G.DFS(0)

Thứ tự duyệt đồ thị bắt đầu từ nút 0 của thuật toán DFS:


[0, 3, 4, 13, 10, 14, 15, 16, 17, 9, 2, 7, 8, 5, 11, 12, 1, 6]

In [619]:
print('Kết quả đường đi của thuật toán BFS:')
G.find_BFS_path(0, 17)

Kết quả đường đi của thuật toán BFS:


[0, 2, 7, 8, 10, 14, 15, 16, 17]

In [620]:
print('Kết quả đường đi của thuật toán DFS:')
G.find_DFS_path(0, 17)

Kết quả đường đi của thuật toán DFS:


[0, 3, 4, 13, 10, 14, 15, 16, 17]

### class Graph_Weight

In [622]:
class Graph_Weight:
    def __init__(self, graph=None):
        if graph is None:
            self.graph = defaultdict(list)
        else:
            self.graph = graph

    def convert_graph_weight(self, a, size):
        adjList = defaultdict(list)
        for i in range (size):
            edged = False
            for j in range(len(a[i])):
                if a[i][j] != 0:
                    adjList[i].append((j, a[i][j]))
                    edged = True
            if not edged:
                adjList[i] = []
        self.graph = adjList
    
    def print_graph(self):
        return self.graph
        # for node, edges in self.graph.items():
        #     edge_list = [f"({neighbor}, {weight})" for neighbor, weight in edges]
        #     print(f"{node}: [{', '.join(edge_list)}]")

    def find_UCS_path(self, start, end):
        visited = {} # change visited to dict where each node stores ('total_cost', 'parent')
        frontier = PriorityQueue()
    
        # add node start into frontier and visited
        frontier.put((0, start))
        visited[start] = (0, None) # start has no father.
        
        while True:
            if frontier.empty():
                raise Exception("No way Exception")
                return None
            current_w, current_node = frontier.get()
            
            # Check if `current_node` is `end`?
            if current_node == end:
                return self.reconstruct_path(visited, end)
    
            for nodei in self.graph[current_node]:
                node, weight = nodei
                total_cost = current_w + weight
                if node not in visited or total_cost < visited[node][0]:
                    frontier.put((total_cost, node))
                    # update node in visited
                    visited[node] = (total_cost, current_node)
                    
    def reconstruct_path(self, visited, end):
        path = []
        total_cost = visited[end][0]
        path.append(end)
        while visited[end][1] is not None:
            path.append(visited[end][1])
            end = visited[end][1]
        path.reverse()
        return total_cost, path
    

In [623]:
GW = Graph_Weight(graph_2)
GW.print_graph()

defaultdict(list,
            {0: [(1, 50), (2, 350), (3, 300)],
             1: [(6, 600)],
             2: [(5, 100), (7, 900)],
             3: [(4, 1300)],
             4: [(13, 1400)],
             5: [(11, 700)],
             6: [(2, 800)],
             7: [(8, 790), (9, 300)],
             8: [(10, 1200)],
             9: [],
             10: [(9, 800), (14, 400)],
             11: [(12, 950)],
             12: [(13, 600)],
             13: [(10, 1300)],
             14: [(15, 1300)],
             15: [(16, 770)],
             16: [(17, 1200)],
             17: []})

In [624]:
total_cost, path = GW.find_UCS_path(0, 17)
print(f'Kết quả đường đi ngắn nhất bằng thuật toán UCS: {path}, với tổng chi phí tối ưu: {total_cost}')

Kết quả đường đi ngắn nhất bằng thuật toán UCS: [0, 2, 7, 8, 10, 14, 15, 16, 17], với tổng chi phí tối ưu: 6910
