## <center>Computer Science Intensive Course - MindX</center>
![](./assets/logo.png)
# <center>BÀI 11. THUẬT TOÁN TÌM ĐƯỜNG (1)</center>

# 1. Tìm Kiếm Theo Chiều Sâu (Depth-First Search / DFS)

**DFS** là thuật toán duyệt qua các đỉnh trong một đồ thị với tư tưởng: bắt đầu từ một đỉnh bất kì, duyệt theo các đỉnh kề để đến đỉnh xa nhất có thể trên mỗi nhánh, sau đó trở lại các điểm rẽ nhánh và tiếp tục duyệt.  

Ta có thể tìm hiểu thứ tự duyệt của DFS qua ví dụ trên tree dưới đây:

![](./assets/dfs.gif)
<div style='text-align: right'><i>Ảnh: commons.wikimedia.org</i></div>

**Thuật toán** duyệt của DFS:
1. Duyệt đỉnh xuất phát, đánh dấu đỉnh xuất phát đã được duyệt
2. Xét các đỉnh kề với đỉnh đang duyệt:  
   2.1. Nếu đỉnh đang xét chưa được duyệt => duyệt đỉnh đang xét  
   2.2. Nếu đỉnh đang xét đã được duyệt   => bỏ qua
   
**Visualization**: https://visualgo.net/en/dfsbfs.

### Code

DFS chính là thuật toán được dùng để duyệt cây và đồ thị ở bài trước: Bắt đầu từ một đỉnh, ta lần theo các cạnh để đi đến các đỉnh liền kề. Khi hết đường, ta quay lại đường đã đi để tiếp tục duyệt các nhánh chưa đi qua.  

Thuật toán DFS có thể được cài đặt khá đơn giản với một hàm đệ quy như sau:

In [1]:
# traverse graph recursively from `vertex`
def dfs_recursive(vertex, graph, visited):
    
    # mark current vertex as visited
    visited.add(vertex)
    print(vertex, end=' ')
    
    # traverse adjacent branches recursively
    for next_vertex in graph[vertex]:
        if next_vertex not in visited:
            dfs_recursive(next_vertex, graph, visited)
    

# traverse graph from `start` vertex
def dfs(graph, start):
    print('Treverse path: ', end='')
    dfs_recursive(start, graph, set())  # init `visited` set

**Ví dụ**: Thứ tự duyệt các đỉnh của DFS trên đồ thị sau:

![](./assets/graph2.png)

In [2]:
graph = {
    0: [1, 4],
    1: [0, 2, 3, 4],
    2: [1, 3],
    3: [1, 2, 4],
    4: [0, 1, 3]
}

# change starting vertex to see how the path changes
dfs(graph, 0)

Treverse path: 0 1 2 3 4 

### Độ Phức Tạp

Giả sử ta có một đồ thị vô hướng liên thông (mọi đỉnh đều có kết nối với nhau) là *G=(V, E)*, với *V* là danh sách các đỉnh (vertex), *E* là danh sách các cạnh (edge). Ta có *|V |* là số đỉnh, *|E |* là số cạnh trong đồ thị.

**Độ phức tạp thời gian**:
- Ta gọi DFS đúng một lần trên mỗi đỉnh với độ phức tạp là *O(|V |)*.
- Với đồ thị vô hướng, DFS duyệt qua mỗi cạnh đúng hai lần với độ phức tạp là *O(|2E |)* = *O(|E |)*.
- Như vậy, độ phức tạp về thời gian của thuật toán là:
  \begin{equation} O(|V|) + O(|E|) = O(|V|+|E|) \end{equation}

**Độ phức tạp không gian**:
- Việc lưu trữ đồ thị dưới dạng danh sách kề chiếm *O(|V | + |2E |)* = *O(|V | + |E |)* bộ nhớ.
- Ta đánh dấu các đỉnh đã thăm với *O(|V |)* bộ nhớ.
- Bên cạnh đó, việc gọi đệ quy cũng chiếm *O(|V |)* vùng nhớ stack.
- Tổng hợp, độ phức tạp về không gian của thuật toán là:
  \begin{equation} O(|V|+|E|) + O(|V|) + O(|V|) = O(|V|+|E|) \end{equation}
  
### Đặc Điểm:
- Thuật toán DFS không đảm bảo tìm được đường đi ngắn nhất giữa hai đỉnh.
- Để tránh bị tràn bộ nhớ do đệ quy, ta có thể dùng cấu trúc dữ liệu *stack* để lưu các đỉnh cần thăm tiếp theo.

### Ứng dụng:

DFS được dùng để duyệt các cấu trúc đồ thị và cây nên có thể được áp dụng cho những bài toán có cấu trúc dữ liệu dạng đồ thị:
- Tìm đường để thoát khỏi mê cung
- Xác định các vật thể khác nhau trong một bức ảnh

Ngoài ra, DFS còn làm nền tảng cho các thuật toán phức tạp hơn trên đồ thị:
- Xác định các thành phần liên thông của đồ thị
- Sắp xếp tô-pô cho đồ thị
- Xác định các thành phần liên thông mạnh của đồ thị có hướng
- Kiểm tra một đồ thị có phải là đồ thị phẳng hay không

# 2. Thực Hành

## 2.1. In Biểu Thức

**Yêu cầu**: Cho một cây biểu thức với các toán tử hai ngôi như bên dưới, hãy dùng thuật toán DFS để in ra biểu thức dạng *prefix, postfix, infix* từ cây trên.

![](./assets/expression-tree.png)

**Kết quả**:
<pre>
- Prefix:  + 3 * + 5 9 2
- Postfix: 3 5 9 + 2 * + 
- Infix:   (3 + ((5 + 9) * 2))
</pre>

Cây biểu thức và hàm in biểu thức *prefix* đã được cho sẵn bên dưới, hãy viết hàm in ra biểu thức dạng *postfix* và *infix*.  

*Lưu ý*: Dùng các dấu ngoặc ở mỗi phép tính trong biểu thức *infix* để đảm bảo các phép tính được thực hiện đúng thứ tự.

In [3]:
class Node:
    def __init__(self, data):
        self.data = data
        self.left = None
        self.right = None
        
root = Node('+')
root.left, root.right = Node(3), Node('*')
root.right.left, root.right.right = Node('+'), Node(2)
root.right.left.left, root.right.left.right = Node(5), Node(9)

In [4]:
def print_prefix(node):
    
    # print current node
    print(node.data, end=' ')
    
    # if node have left child, node would also have right child
    if node.left is not None:
        print_prefix(node.left)   # print left then right child
        print_prefix(node.right)


print('Prefix:  ', end='')
print_prefix(root)

Prefix:  + 3 * + 5 9 2 

In [5]:
# SOLUTION

def print_postfix(node):
    
    # if node have left child, node would also have right child
    if node.left is not None:
        print_postfix(node.left)
        print_postfix(node.right)
        
    # print current node after printing sub-trees
    print(node.data, end=' ')


def print_infix(node):
    
    # if node have left child, node would also have right child
    # if node have children, node is an operation
    if node.left is not None:
        print('(', end='')       # open bracket before each operation
        print_infix(node.left)   
        print(' ' + node.data + ' ', end='')  # print current operation in the middle
        print_infix(node.right)
        print(')', end='')       # open bracket before each operation
                           
    else:  # node does not have children => node is an operand
        print(node.data, end='')  # print node and stop traversing


print('\nPostfix: ', end='')
print_postfix(root)
print('\nInfix:   ', end='')
print_infix(root)


Postfix: 3 5 9 + 2 * + 
Infix:   (3 + ((5 + 9) * 2))

## 2.2. Kiểm Tra Cây

**Yêu cầu**: Cho một đồ thị vô hướng không có trọng số. Hãy kiểm tra đồ thị có phải là cây hay không.  

**Input**: Một đồ thị vô hướng không trọng số dưới dạng danh sách kề, với các đỉnh là các số nguyên được đánh số từ 0. Biết *0 < |V | < 100* và *0 <= |E | < 1000*.  
**Output**: Trả về True nếu đồ thị là một cây, ngược lại trả về False.  
**Ví dụ**:

![](./assets/graph-tree.png)

*Gợi ý*: Cây là một dạng đặc biệt của đồ thị với các tính chất:
- Liên thông: tất cả các đỉnh đều được kết nối với nhau
- Không có chu trình: bắt đầu từ một đỉnh bất kì, không tồn tại một đường đi nào để quay lại đỉnh đó mà không quay lại các cạnh đã đi
- Từ hai điều trên, ta có thể suy ra một cây luôn có *|E | = |V | - 1*

In [6]:
not_tree = {
    0: [1, 4],
    1: [0, 2, 3, 4],
    2: [1, 3],
    3: [1, 2, 4],
    4: [0, 1, 3]
}

tree = {
    0: [4],
    1: [4],
    2: [3],
    3: [2, 4],
    4: [0, 1, 3]
}

In [8]:
# SOLUTION

# traverse graph recursively from `vertex`
def dfs_recursive(vertex, graph, visited):
    
    # mark current vertex as visited
    visited.add(vertex)
    
    # traverse adjacent branches recursively
    for next_vertex in graph[vertex]:
        if next_vertex not in visited:
            dfs_recursive(next_vertex, graph, visited)


def is_tree(graph):
    
    # count |V| and |E|
    v_num = len(graph)
    e_num = 0
    for _, adj_vertices in graph.items():
        e_num += len(adj_vertices)
    e_num //= 2
    
    # a tree must have |E| = |V| - 1
    if e_num != v_num - 1:
        return False
    
    # traverse the tree
    visited = set()
    dfs_recursive(0, graph, visited)
    
    # if we can visit every vertex with |V|-1 edges => the graph is a tree
    return len(visited) == v_num


# driver code
is_tree(not_tree)

False