## 7. Примеры алгоритмов

### Задача о кратчайшем пути

Самый короткий путь - это тот, где сумма ребер как можно меньше.

Если у нас есть невзвешенный граф, то кратчайшим путем будет тот, у которого наименьшее количество ребер.

Решением этой проблемы для невзвешенного графа на самом деле является простой поиск вширь: вы начинаете с одного узла и сначала посещаете ближайшие узлы, постепенно переходя к более удаленным узлам, пока не найдете тот, который искали.

Чтобы решить задачу о кратчайшем пути для графа со взвешенными ребрами, мы можем использовать алгоритм Дейкстры.

### Алгоритм Дейкстры

Этот алгоритм является жадным алгоритмом, который находит кратчайший путь (расстояние) между начальным узлом и всеми остальными узлами в графе.

Жадный означает, что он всегда выбирает наилучший вариант на данный момент, т.е. выбирает следующий узел для посещения, исходя из минимальной стоимости на его границе.

Расстояние - это сумма весов ребер на пути между нашей начальной точкой и вершиной, на которой мы находимся.  
В конце выполнения алгоритма Дейкстры расстояние будет равно кратчайшему пути.

In [1]:
import heapq


def dijkstra(graph, start_node, end_node):
    # Create a dictionary to store the distance to each node
    distances = {node: float('inf') for node in graph}
    distances[start_node] = 0

    # Create a dictionary to store the previous node in the shortest path
    previous_nodes = {node: None for node in graph}

    # Create a priority queue to store nodes that we haven't visited yet
    priority_queue = [(0, start_node)]

    while priority_queue:
        # Get the node with the smallest distance
        current_distance, current_node = heapq.heappop(priority_queue)

        # If we've already visited this node, skip it
        if current_distance > distances[current_node]:
            continue

        # Check all of the neighbors of this node
        for neighbor, weight in graph[current_node].items():
            distance = current_distance + weight

            # If we've found a new shortest path to this neighbor,
            # update our records and add it to the queue
            if distance < distances[neighbor]:
                distances[neighbor] = distance
                previous_nodes[neighbor] = current_node
                heapq.heappush(priority_queue, (distance, neighbor))

        # If we've reached the end node, we can stop searching
        if current_node == end_node:
            break

    # Build the path from the previous nodes dictionary
    path = []
    node = end_node
    while node is not None:
        path.append(node)
        node = previous_nodes[node]
    path.reverse()

    return distances[end_node], path


# Example usage
graph = {
    'A': {'B': 5, 'C': 1},
    'B': {'A': 5, 'C': 2, 'D': 1},
    'C': {'A': 1, 'B': 2, 'D': 4, 'E': 8},
    'D': {'B': 1, 'C': 4, 'E': 3, 'F': 6},
    'E': {'C': 8, 'D': 3},
    'F': {'D': 6}
}

start_node = 'A'
end_node = 'D'

dijkstra(graph, start_node, end_node)

(4, ['A', 'C', 'B', 'D'])

Алгоритм работает, поддерживая приоритетную очередь узлов для посещения, при этом первым посещается узел с наименьшим расстоянием от начального узла. Расстояния до каждого узла обновляются по мере выполнения алгоритма, и для каждого узла также записывается предыдущий узел на кратчайшем пути.

Как только достигается конечный узел, алгоритм останавливается и строится кратчайший путь, следуя указателям предыдущих узлов от конечного узла к начальному узлу.

Временная сложность алгоритма Дейкстры равна O(V ^ 2), где V - количество вершин в графе.  
Это связано с тем, что в худшем случае нам нужно было бы посетить каждую вершину графа один или два раза, и каждый раз, когда мы посещаем вершину, нам нужно выполнить поиск в очереди приоритетов, чтобы найти минимальный элемент.  
Но если реализация приоритетной очереди очень эффективна, то временная сложность алгоритма Дейкстры равна O(E + V log V).


### Проблема с рюкзаком

Задача о рюкзаке - классическая задача оптимизации в информатике. Задача включает в себя рюкзак (или ранцевую сумку-переноску) с ограниченным весом и набором предметов, имеющих свой собственный вес и ценность.  

Цель состоит в том, чтобы определить комбинацию предметов, которые можно поместить в рюкзак таким образом, чтобы общая стоимость предметов была максимальной, а также чтобы общий вес предметов не превышал вместимости рюкзака.

Решением этой задачи методом перебора будет O(2^ n). И это экспоненциальный промежуток времени:

In [2]:
# O(2^n) solution
def knapSack(W, wt, val, n):
    # Base case
    if n == 0 or W == 0:
        return 0
    
    # If weight of the nth item is more than Knapsack capacity W,
    # then this item cannot be included in the optimal solution
    if (wt[n-1] > W):
        return knapSack(W, wt, val, n-1)
    
    # Return the maximum of two cases:
    # (1) nth item included
    # (2) not included
    else:
        return max(val[n-1] + knapSack(W-wt[n-1], wt, val, n-1),
                   knapSack(W, wt, val, n-1))

# Example usage
val = [60, 100, 120]
wt = [10, 20, 30]
W = 50
n = len(val)

knapSack(W, wt, val, n)

220

### Динамическое программирование

С помощью **динамического программирования** вы можете значительно ускорить решение действительно сложной задачи, разбив ее на подзадачи.

Решения для динамического программирования используют преимущества как решения задачи для тривиального случая, так и сохранения решения в справочной таблице, используя их для постепенного усложнения задачи.

Еще одной особенностью решения для динамического программирования является уравнение, используемое на каждом шаге по мере усложнения.   
Уравнение часто объединяет некоторые значения, ранее вычисленные в справочной таблице, иногда друг с другом, а иногда и с новым значением, которое вы вводите (например, значение любого объекта, на который вы смотрите).

Мы используем значения, уже сохраненные в таблице при добавлении нового объекта - метод, называемый "запоминание". Таким образом, нам определенно не нужно каждый раз пересчитывать их заново - вы вводите в компьютер и сохраняете решения для небольших задач, а затем вам не нужно вычислять их снова для более сложных задач.

Если вы хотите использовать подход динамического программирования, сначала спросите себя: могу ли я разбить эту проблему на подзадачи?  
Если ответ ПОЛОЖИТЕЛЬНЫЙ, то у вас проблема с решением, основанным на динамическом программировании.

Для задачи с рюкзаком:
- задача: найти максимальное значение для ограничения веса 
- подзадача: найти максимальное значение для некоторого меньшего веса
- базовый вариант (подзадача настолько мала, что ответ на нее очень прост или тривиален для вычисления): наименьшее вычисление (вычисление значений для одного объекта)

In [3]:
# O(nW) solution using dynamic programming
def knapSack(W, wt, val, n):
    # Initialize a 2D array K with all zeros
    K = [[0 for x in range(W + 1)] for x in range(n + 1)]
    
    # Build table K[][] in bottom up manner
    for i in range(n + 1):
        for w in range(W + 1):
            # Base case
            if i == 0 or w == 0:
                K[i][w] = 0
            # If weight of the ith item is less than or equal to w
            elif wt[i-1] <= w:
                # Take the maximum of two cases:
                # (1) ith item included
                # (2) not included
                K[i][w] = max(val[i-1] + K[i-1][w-wt[i-1]], K[i-1][w])
            else:
                # If weight of the ith item is more than w,
                # then this item cannot be included in the optimal solution
                K[i][w] = K[i-1][w]
    
    # Return the maximum value that can be put in a knapsack of capacity W
    return K[n][W]


# Example usage
val = [60, 100, 120]
wt = [10, 20, 30]
W = 50
n = len(val)

knapSack(W, wt, val, n)

220

### Проблема коммивояжера

Задача коммивояжера (TSP) - классическая задача в информатике и математике. В этой задаче у нас есть граф, все вершины которого представляют города, а все ребра - дороги между ними. Цель TSP - найти кратчайший возможный маршрут, который посещает каждый город ровно один раз и возвращается в исходный город.

TSP - это задача оптимизации, которая означает, что мы ищем наилучшее решение из всех возможных.   
TSP является хорошо известным примером NP-сложной задачи, что означает, что вычислительно сложно найти оптимальное решение для больших экземпляров задачи (NP - недетерминированное полиномиальное время).

TSP имеет множество практических применений, например, в логистике и на транспорте, где он используется для оптимизации маршрутов доставки. Он также используется в разработке микрочипов, секвенировании ДНК и многих других областях.

In [4]:
# O(n!) solution
import itertools

def tsp_brute_force(graph):
    # Generate all possible paths
    nodes = list(graph.keys())
    paths = itertools.permutations(nodes)
    
    # Find the shortest path
    shortest_path = None
    shortest_distance = float('inf')
    for path in paths:
        distance = 0
        for i in range(len(path)-1):
            for neighbor, d in graph[path[i]]:
                if neighbor == path[i+1]:
                    distance += d
        if distance < shortest_distance:
            shortest_path = path
            shortest_distance = distance
    
    return shortest_path, shortest_distance

# Example usage
graph = {
    'A': [('B', 10), ('C', 15), ('D', 20)],
    'B': [('A', 10), ('C', 35), ('D', 25)],
    'C': [('A', 15), ('B', 35), ('D', 30)],
    'D': [('A', 20), ('B', 25), ('C', 30)]
}
path, distance = tsp_brute_force(graph)
print(path, distance)

('C', 'A', 'B', 'D') 50


Использование перестановок может быть очень медленным процессом, особенно для больших графов. На самом деле, временная сложность метода грубой силы с использованием перестановок составляет O (n!), что быстро становится невозможным даже для графов среднего размера.

In [5]:
def tsp_nn(graph, start):
    # Find the shortest path using the nearest neighbor algorithm
    path = [start]
    visited = {start}
    while len(path) < len(graph):
        current = path[-1]
        next_node = None
        min_distance = float('inf')
        for neighbor, distance in graph[current]:
            if neighbor not in visited and distance < min_distance:
                next_node = neighbor
                min_distance = distance
        if next_node is None:
            break
        path.append(next_node)
        visited.add(next_node)
    
    # Calculate the distance of the path
    distance = 0
    for i in range(len(path)-1):
        for neighbor, d in graph[path[i]]:
            if neighbor == path[i+1]:
                distance += d
    
    return path, distance

# Example usage
graph = {
    'A': [('B', 10), ('C', 15), ('D', 20)],
    'B': [('A', 10), ('C', 35), ('D', 25)],
    'C': [('A', 15), ('B', 35), ('D', 30)],
    'D': [('A', 20), ('B', 25), ('C', 30)]
}
start = 'A'
path, distance = tsp_nn(graph, start)
print(path, distance)

['A', 'B', 'D', 'C'] 65


Приведенный выше фрагмент кода представляет собой реализацию алгоритма ближайшего соседа, который представляет собой эвристический подход к решению задачи коммивояжера. Хотя он не всегда может дать оптимальное решение, он намного быстрее, чем метод грубой силы, и часто может дать хорошее приближение к оптимальному решению.

Временная сложность алгоритма поиска ближайшего соседа равна O (n ^ 2), что намного быстрее, чем при использовании метода грубой силы.

Однако алгоритм грубой силы нашел оптимальное решение, которое является (‘C’, ‘A’, ‘B’, ‘D’) с расстоянием 50. Алгоритм ближайшего соседа нашел неоптимальное решение, которое равно [‘A’, ‘B’, ‘D’, ‘C’] с расстоянием 65. Алгоритм ближайшего соседа не гарантирует нахождения оптимального решения, но обычно он намного быстрее алгоритма грубой силы и может быть использован в качестве хорошего приближения при больших значениях n.