# Проектная работа «Московское метро»

### Постановка задачи

Требуется: разработать граф станций Московского метрополитена для построения оптимальных маршрутов.

## Теория

### Тип алгоритмической задачи

Данная задача относится к такому типу алгоритмических задач как «Задача коммивояжера».

### Задача коммивояжера

Задача коммивояжёра (от англ. TSP - travelling salesman problem) — одна из самых известных задач комбинаторной оптимизации, заключающаяся в поиске самого выгодного маршрута, проходящего через указанные города хотя бы по одному разу с последующим возвратом в исходный город(в нашем случае вместо городов выступают станциии метро). В условиях задачи указываются критерий выгодности маршрута (кратчайший, самый дешёвый и совокупный критерий) и его стоимости. Важным условием считается, что маршрут должен проходить через каждый город только один раз — в таком случае выбор осуществляется среди гамильтоновых циклов. 

Гамильтоновый цикл - такой цикл (замкнутый путь), который проходит через каждую вершину данного графа ровно по одному разу, то есть простой цикл, в который входят все вершины графа.

![](./src/g-line.png)

Существует несколько частных случаев общей постановки задачи, в частности, геометрическая задача коммивояжёра (также называемая планарной или евклидовой, когда матрица расстояний отражает расстояния между точками на плоскости), метрическая задача коммивояжёра (когда на матрице стоимостей выполняется неравенство треугольника), симметричная и асимметричная задачи коммивояжёра.

### Чуть-чуть истории

С задачей коммивояжёра связана задача о поиске гамильтонового цикла. Примером такой задачи является задача о ходе коня, известная с XVIII века(задача о нахождении маршрута шахматного коня, проходящего через все поля доски по одному разу). Леонард Эйлер посвятил ей большую работу «Решение одного любопытного вопроса, который, кажется, не подчиняется никакому исследованию», датированную 1759 годом. Другим примером задачи на поиск гамильтонового цикла является икосиан: математическая головомка, в которой надо пройти по додекаэдру (графу с 20 узлами) побывав в каждой вершине ровно один раз. Эта задача была предложена Уильямом Гамильтоном в XIX веке, он же определил класс таких путей.

![](./src/HWR.png)

В 1832 году была издана книга с названием «Коммивояжёр — как он должен вести себя и что должен делать для того, чтобы доставлять товар и иметь успех в своих делах — советы старого курьера», в которой описана задача, но математический аппарат для её решения не применяется. Зато в ней предложены примеры маршрутов для некоторых регионов Германии и Швейцарии.

Первые упоминания в качестве математической задачи на оптимизацию принадлежат Карлу Менгеру, который сформулировал её на математическом коллоквиуме в 1930 году так:

«Мы называем задачей посыльного (поскольку этот вопрос возникает у каждого почтальона, в частности, её решают многие путешественники) задачу найти кратчайший путь между конечным множеством мест, расстояние между которыми известно.»

Вскоре появилось известное сейчас название задача странствующего торговца (англ. traveling salesman problem), которую предложил Хасслер Уитни (англ. Hassler Whitney) из Принстонского университета.

### Сложность задачи коммивояжера

Задача коммивояжера - это NP-полная задача и даже, вероятно, трансвычислительна. «NP-полная задача» означает, что нам не известен способ нахождения её наилучшего решения, кроме перебора всех возможных ответов. «Трансвычислительнвя задача» означает, что перебирать нам придётся довольно долго (не менее, чем миллиарды лет). На практике, однако, можно попробовать организовать перебор таким способом, чтобы постепенно находить всё более хорошие решения и остановиться «по готовности».

### Способы решения

Cуществует множество способов решения задачи коммиявояжера, вот их малая часть:

1. Полный перебор
2. Случайный перебор
3. Жадные алгоритм - алгоритм, заключающийся в принятии локально оптимальных решений на каждом этапе, допуская, что конечное решение также окажется оптимальным.
4. Метод минимального остовного дерева - это остовное дерево этого графа, имеющее минимальный возможный вес, где под весом дерева понимается сумма весов входящих в него рёбер.
5. Метод имитации отжига - это техника оптимизации, использующая упорядоченный случайный поиск на основе аналогии с процессом образования в веществе кристаллической структуры с минимальной энергией при охлаждении.
6. Метод ветвей и границ - перебор вариантов и рассмотрении лишь тех из них, которые по определенным признакам оказываются перспективными, и отбрасывании бесперспективных вариантов.
7. Метод эластичной сети.
8. Муравьиный алгоритм.
9. Генетический алгоритм.
10. Алгоритм динамического программирования.

## Генетический алгоритм

### Описание алгоритма

Генетические алгоритмы предназначены для решения задач оптимизации. В основе генетических алгоритмов лежит метод случайного направленного поиска. Для нашей задачи мы будем использовать классическую модель ГА, предложенную в 1975 г. Джоном Холландом (John Holland) в Мичиганском университете.

Схема алгоритма Холланда:

1. Сгенерировать исходную популяцию, состоящую из N особей;
2. Оценить приспособленность хромосом в популяции на основе целевой функции F(x);
3. Выполнить операцию селекции;
4. Применить генетические операторы (мутация, скрещивание);
5. Сформировать новую популяцию;
6. критерий останова алгоритма не достигнут, перейти к шагу 2, иначе завершить работу;

### Кодирование решений

Для начала нам нужно выбрать способ представления графа в виде хромосомы. Проанализировав различные способы кодирования, было выбрано кодирование перестановка: такой способ выбран по причине того, что нам нужно чтобы гены в хромосоме не повторялись. Приведем кодирование решений: имеется вектор H, |H|  — количество вершин графа. Таким образом мы определили кодирование решений(хромосом).

![](./src/gen1.png)

### Стратегия отбора

В качестве метода селекции выбирается турнирный отбор. Данный метод можно описать следующим образом: из популяции, содержащей N особей, выбирается случайным образом t особей и лучшая особь записывается в промежуточную популяцию (между выбранными особями проводится турнир). Это операция повторяется N раз. Затем особи в полученной промежуточной популяции скрещиваются (также случайным образом). С ростом параметра t ужесточается отбор между особями, т.к. если у особи низкий показатель приспособленности, у нее нет шансов «завести потомство». Преимуществом данной стратегии является то, что она не требует дополнительных вычислений и упорядочивания особей в популяции по возрастанию приспособленности.

### Оператор скрещивания

В качестве оператора скрещивания выбирвется модифицированный одноточечный кроссинговер. По принципу работы оператора похож на одноточечный кроссинговер Холанда но т. к. нам нельзя чтобы гены в хромосоме после скрещивания повторялись использовался модифицированный оператор кроссинговера. Например у нас имеются пара хромосом-родителей. Случайным образом выберем точку разреза p, 1<p<n. После того как была выбрана точка разреза, мы переносим все гены до точки разреза из родителя 1 в первого потомка, а из родителя 2 во второго потомка. Для того чтобы закончить потомка нам нужно заполнить вторую часть хромосом; для этого мы начинаем переносить гены после точки разреза из родителя 1 во второго потомка, а из родителя 2 в первого, но когда мы встречаем повторяющийся ген в потомке мы его пропускаем, так двигаясь до самого конца генов родителей. Если у нас получается так, что гены потомка еще не до конца заполнены, то мы начинаем брать гены сначала родителя, т. е. делаем цикличный сдвиг хромосомы в лево. Проиллюстрируем все выше сказанное. Например у нас имеется точка разреза p=3, хромосомы-родители.

![](./src/gen2.png)

Теперь применим к ним описанный оператор кроссинговера.

![](./src/gen3.png)

Таким образом мы получили двух потомков со схожими значениями приспособленности.

### Оператор мутации

Оператор мутации в генетических алгоритмах используется для того, что бы «выбивать» решения из локальных оптимумов, которые далеки от глобальных.
Для мутации генов использовался простой способ обмена двух генов. Например у нас есть такая хромосома рис. 4. Теперь выберем случайно два гена и поменяем их местами.

Хромосома до мутации:

![](./src/gen5.png)

Хромосома после мутации:

![](./src/gen6.png)

## Практическая реализация

### Парсинг станций метро c сайта hh.ru

In [None]:
import requests


def prepare_frame(url: str)->tuple:
    response = requests.get(url)
    frame = response.json()
    return (frame)    


def build_metro()->tuple:
    frame = prepare_frame('https://api.hh.ru/metro/1') 
    metro = {} 
    for branch in frame['lines']:
        prev_name = None 
        prev = None
        for station in branch['stations']:
            if station['name'] not in metro.keys():
                metro[station['name']] = {}
            curr = metro[station['name']]
            if prev is not None:
                prev[station['name']] = branch['hex_color']
                curr[prev_name] = branch['hex_color']
            prev_name = station['name']
            prev = curr 
        circulars = ['915133', 'CC4C6E', '88CDCF']
        if branch['hex_color'] in circulars:
            first = branch['stations'][0]['name']
            last = branch['stations'][-1]['name']
            metro[first].update({last: branch['hex_color']})
            metro[last].update({first: branch['hex_color']})
    return (metro)

### Алгоритм A* - оптимальный путь между 2 станциями

Поиск A* (произносится «А звезда» или «А стар», от англ. A star) — алгоритм поиска по первому наилучшему совпадению на графе, который находит маршрут с наименьшей стоимостью от одной вершины (начальной) к другой (целевой, конечной).A* пошагово просматривает все пути, ведущие от начальной вершины в конечную, пока не найдёт минимальный. Как и все информированные алгоритмы поиска, он просматривает сначала те маршруты, которые «кажутся» ведущими к цели. От жадного алгоритма, который тоже является алгоритмом поиска по первому лучшему совпадению, его отличает то, что при выборе вершины он учитывает, помимо прочего, весь пройденный до неё путь.

![](./src/astar.gif)

In [26]:
import heapq
import json


def heuristic(node, goal):
    return 0


def a_star(graph, start, goal):
    open_set = []
    heapq.heappush(open_set, (0, start))
    came_from = {}
    g_score = {vertex: float('inf') for vertex in graph}
    g_score[start] = 0

    while open_set:
        current = heapq.heappop(open_set)[1]
        if current == goal:
            return reconstruct_path(came_from, current)

        for neighbor, color in graph[current].items():
            tentative_g_score = g_score[current] + 1

            if tentative_g_score < g_score[neighbor] or (
                    tentative_g_score == g_score[neighbor] and color == graph[came_from[current]][current]):
                came_from[neighbor] = current
                g_score[neighbor] = tentative_g_score
                f_score = tentative_g_score + heuristic(neighbor, goal)
                heapq.heappush(open_set, (f_score, neighbor))

    return None


def reconstruct_path(came_from, current):
    total_path = [current]
    while current in came_from:
        current = came_from[current]
        total_path.append(current)
    return total_path[::-1]

def count_color_transitions(graph, path):
    transitions = 0
    for i in range(len(path) - 1):
        start_vertex = path[i]
        end_vertex = path[i+1]
        start_color = graph[start_vertex][end_vertex]
        if i < len(path) - 2:
            next_vertex = path[i+2]
            next_color = graph[end_vertex][next_vertex]
            if start_color != next_color:
                transitions += 1
    return transitions

with open('./src/moscow_metro.json') as json_file:
    graph = json.load(json_file)

start_vertex = 'Первомайская'
goal_vertex = 'Марьина Роща'

path = a_star(graph, start_vertex, goal_vertex)
time = (len(path) - 1)*3

if path:
    print(f"Минимальный путь от вершины {start_vertex} до вершины {goal_vertex}:")
    print(" -> ".join(path))
    num_trans = count_color_transitions(graph, path)
    print(num_trans, "- количество пересадок с ветку на ветку")
    print(time+num_trans*3, "- расчетное время маршрута(мин.)")
else:
    print(f"Путь от вершины {start_vertex} до вершины {goal_vertex} не найден.")

Минимальный путь от вершины Первомайская до вершины Марьина Роща:
Первомайская -> Измайловская -> Партизанская -> Семеновская -> Электрозаводская -> Сокольники -> Рижская -> Марьина Роща
1 - количество пересадок с ветку на ветку
24 - расчетное время маршрута(мин.)


![](./src/road1.png)

Реализацию полного обхода метро не представляется возможным сделать, так как возникла сложность с математическим моделированием целевой функции F(X), функциями мутации и скрещивания, поэтому ранее было изложено только теоритическое представление генетического алгоритма.

## Работу выпонили

1. Большедворский Сергей
2. Зуйков Илия
3. Рязанов Егор

## Источники литературы

1. Кормен Т., Лейзерсон Ч., Ривест Р., Штайн К. Алгоритмы. Построение и анализ.

2. Емельянов В. В., Курейчик В. В., Курейчик В. М. Теория и практика эволюционного моделирования. — М.: ФИЗМАТЛИТ, 2003. — С. 264-275.

3. Holland J.N. Adaptation in Natural and Artificial Systems. Ann Arbor, Michigan: Univ. Michigan Press, 1975.

4. Цой Ю.Р. Стратегии отбора и формирования нового поколения [Электронный ресурс] / Ю. Цой. — Режим доступа: www.qai.narod.ru/GA/strategies.html

5. Панченко, Т. В. Генетические алгоритмы: учебно-методическое пособие / под ред. Ю. Ю. Тарасевича. — Астрахань: Издательский дом«Астраханский университет», 2007. — С. 20.