## Краткое описание

Разработка программы, которая осуществляет поиск кратчайшего пути для информационного пакета (сообщения) в компьютерной сети с помощью генетических алгоритмов.

### 1. Цель работы

Ознакомиться с подходом и приобрести практический навык решения оптимизационных задач с помощью генетических алгоритмов (ГА).

### 2. Порядок выполнения работы

1. Изучить теоретическое введение.
2. Самостоятельно разработать компьютерную программу (среда разработки выбирается студентом самостоятельно).
3. Провести серию из 5+ испытаний для изучения принципов работы ГА.
4. Оформить отчет по лабораторной работе.

### 3. Требования к функциональности компьютерной программы

- Возможность задания топологии сети с указанием её размерности и пропускной способностью каналов.
- Настройки работы генетического алгоритма: размер популяции, количество поколений, варианты кроссовера, вероятность мутации и др.
- Указание исходных данных (компьютер-отправитель и компьютер-получатель) и автоматическое заполнение исходных данных топологии сети.
- Два режима работы:
  - **Пошаговый**: на экране должны отображаться все представители (хромосомы) одного поколения до и после применения каждого оператора (скрещивания, селекции, редукции и мутации).
  - **Циклический**: на экране должны отражаться только агрегированные данные по каждому поколению и итоговый набор хромосом.
- На одной из экранных форм должны быть указаны ФИО и e-mail автора приложения, ссылка на учебный курс и год разработки. Эти данные должны быть продублированы в тексте программы (каждого программного модуля).
- Дополнительно необходимо реализовать возможность динамического изменения исходных данных (матрицы связанности графа) во время пошагового режима работы алгоритма.

### 4. Рекомендации по реализации

- В качестве хромосомы рекомендуется выбрать постоянную по длине последовательность вершин или дуг. Длину можно выбрать произвольную, но не меньше, чем `N–2`, где `N` — общее количество компьютеров в сети.
- Для упрощения расчётов граф сети лучше сделать полносвязанным (каждая пара вершин имеет связь). Для обозначения отсутствия связи нужно выбрать очень большое значение веса дуги, а для петли — значение веса равное 0.
- Если в качестве хромосомы используется последовательность вершин, необходимо либо исключить первую и последнюю вершину (т.е. задавать только вершины пути), либо не изменять их в результате применения генетических операторов. 
- Допускается использование в качестве генов букв или чисел в десятеричной системе. Если используется битовая строка, лучше выбрать количество серверов, равное `2^n` (16, 32, 64 и т.д.).
- Если в исходной популяции не представлены все возможные вершины (гены), они могут появиться только в результате мутации, поэтому рекомендуется в начальной выборке представить весь генофонд.
- Если выбранный алгоритм скрещивания изменяет только правую (левую) часть хромосомы или только 4 гена из 10, его эффективность может быть низкой, и остаётся надежда только на мутацию и удачные исходные данные.
- Повторяющиеся (идентичные) хромосомы лучше исключать (удалять, мутировать) на начальных этапах. Если размер популяции фиксированный, это может быть неизбежным при сходимости алгоритма и вырождении популяции.

### 5. Содержание отчета

1. Название и цель работы.
2. Задание, краткое описание предметной области и выбранной задачи.
3. Блок-схема с пояснениями реализованного ГА и каждого оператора в отдельности.
4. Протоколы проведенных экспериментов (5+), представленные в форме графиков (допускаются скриншоты при программной реализации этой функциональности).
5. Выводы и рекомендации по использованию разработанных ГА.

# Выполнение задания

Выполнил: Журавлев Д. А. Группа 211-321 

Учебный курс: Методы работы с большими данными

## Основы генетических алгоритмов (ГА)

Генетический алгоритм — это метод оптимизации, основанный на принципах естественного отбора и генетики. Алгоритм имитирует процесс эволюции, чтобы найти решение задачи, начиная с набора случайных решений и улучшая их через последовательные итерации.

## Основные этапы генетического алгоритма:

1. **Инициализация популяции:**
   - Создается начальная популяция возможных решений (хромосом).
   - Хромосомы могут быть представлены в виде строк (например, последовательности чисел или битов).

2. **Оценка пригодности (fitness function):**
   - Каждой хромосоме присваивается значение пригодности, которое оценивает её качество в контексте задачи.

3. **Селекция (отбор):**
   - Выбираются лучшие хромосомы для создания следующего поколения. Популярные методы: турнирный отбор, рулетка.

4. **Кроссовер (скрещивание):**
   - Избранные хромосомы объединяются, образуя потомков. Это позволяет комбинировать черты родительских решений.

5. **Мутация:**
   - В потомках случайным образом изменяются отдельные гены с определённой вероятностью. Это предотвращает преждевременную сходимость и поддерживает генетическое разнообразие.

6. **Редукция и замена популяции:**
   - Формируется новая популяция из потомков, возможно с сохранением лучших представителей предыдущего поколения (элитизм).

7. **Завершение алгоритма:**
   - Алгоритм завершается, когда достигнуто максимальное количество поколений или решение стабилизировалось (не изменяется от поколения к поколению).

## Поиск кратчайшего пути в сети

Задача поиска кратчайшего пути заключается в нахождении оптимального маршрута между двумя узлами (вершинами) в графе, минимизируя суммарный вес дуг (рёбер), представляющих пропускную способность или расстояние.

### Особенности задачи:

- Граф — это полносвязная сеть, где отсутствующие связи заменяются большим значением веса.
- Хромосома будет представлять собой последовательность узлов (вершин) от источника к приёмнику.
- Оценка пригодности (fitness function) будет определяться длиной пути — чем короче путь, тем выше значение пригодности.

In [211]:
import numpy as np

#Key parameters

NUM_NODES = 10
MAX_WEIGHT = 1000

POPULATION_SIZE = 10
START_NODE = 0
END_NODE = 9

NUM_GENERATIONS = 50
TOURNAMENT_SIZE = 3
MUTATION_RATE = 0.3

STEP_BY_STEP = True
GENERATION_LOG_STEP = 1 if STEP_BY_STEP else 5

TRACE_ENABLED = True
DEBUG_ENABLED = True if STEP_BY_STEP else False
INFO_ENABLED = True

ALTER_TOPOLOGY = True
ALTER_TOPOLOGY_MAP = {
    10: np.array([[  0, 436, 861, 271, 107,  72, 701,  21, 615, 122],
                  [467,   0, 331, 459,  88, 373, 100, 872, 664, 131],
                  [662, 309,   0, 344, 492, 414, 806, 386, 192, 956],
                  [277, 161, 460,   0,  22, 253, 748, 857, 561, 475],
                  [ 59, 511, 682, 476,   0, 976, 783, 190, 958, 687],
                  [958, 563, 876, 567, 244,   0, 505, 131, 485, 819],
                  [647,  21, 841, 167, 274, 388,   0, 316,  14, 242],
                  [777, 346, 565, 898, 340,  92, 367,   0, 455, 428],
                  [509, 776, 943,  35, 206,  81, 932, 562,   0, 388],
                  [  2, 390, 566, 106, 772, 822, 477, 703, 402,   0]]),
}

np.random.seed(42)

In [212]:
### Helper functions
from enum import Enum

class Level(Enum):
    TRACE = 0
    DEBUG = 1
    INFO = 2

def log(level: Level, obj):
    if (level == Level.TRACE and TRACE_ENABLED):
        print(obj)
    if (level == Level.DEBUG and DEBUG_ENABLED):
        print(obj)
    if (level == Level.INFO and INFO_ENABLED):
        print(obj)


In [213]:
def init_topology(num_nodes: int, max_weight: int):
    adjacency_matrix = np.random.randint(1, max_weight, size=(num_nodes, num_nodes))
    np.fill_diagonal(adjacency_matrix, 0)
    return adjacency_matrix

topology = init_topology(NUM_NODES, MAX_WEIGHT)

def alter_topology(generation): 
    global topology
    if (ALTER_TOPOLOGY and generation in ALTER_TOPOLOGY_MAP):
        log(Level.DEBUG, "\n---\n")
        log(Level.DEBUG, f"Alter topology: \n{topology}\n before ---> after \n{ALTER_TOPOLOGY_MAP[generation]}\n")
        if (ALTER_TOPOLOGY_MAP[generation].shape != (NUM_NODES, NUM_NODES)):
            raise Exception(f"Invalid Alter Topology {ALTER_TOPOLOGY_MAP[generation].shape}")
        topology = ALTER_TOPOLOGY_MAP[generation]

topology

array([[  0, 436, 861, 271, 107,  72, 701,  21, 615, 122],
       [467,   0, 331, 459,  88, 373, 100, 872, 664, 131],
       [662, 309,   0, 344, 492, 414, 806, 386, 192, 956],
       [277, 161, 460,   0,  22, 253, 748, 857, 561, 475],
       [ 59, 511, 682, 476,   0, 976, 783, 190, 958, 687],
       [958, 563, 876, 567, 244,   0, 505, 131, 485, 819],
       [647,  21, 841, 167, 274, 388,   0, 316,  14, 242],
       [777, 346, 565, 898, 340,  92, 367,   0, 455, 428],
       [509, 776, 943,  35, 206,  81, 932, 562,   0, 388],
       [  2, 390, 566, 106, 772, 822, 477, 703, 402,   0]])

In [214]:
def initialize_population(population_size: int, num_nodes: int, start_node: int, end_node: int):
    population = []
    for _ in range(population_size):
        route = list(np.random.permutation(num_nodes))
        route.remove(start_node)
        route.remove(end_node)
        route = [start_node] + route + [end_node]
        population.append(route)
    return population

initial_population = initialize_population(POPULATION_SIZE, NUM_NODES, START_NODE, END_NODE)
log(Level.INFO, '\n'.join(map(str, initial_population)))


[0, 4, 2, 8, 7, 6, 5, 3, 1, 9]
[0, 5, 2, 7, 3, 8, 6, 1, 4, 9]
[0, 1, 5, 2, 4, 3, 7, 6, 8, 9]
[0, 3, 1, 4, 5, 8, 6, 7, 2, 9]
[0, 2, 4, 5, 1, 7, 3, 8, 6, 9]
[0, 7, 1, 8, 3, 2, 4, 5, 6, 9]
[0, 6, 1, 3, 8, 7, 5, 4, 2, 9]
[0, 4, 7, 8, 3, 5, 1, 2, 6, 9]
[0, 1, 8, 5, 2, 7, 4, 3, 6, 9]
[0, 8, 4, 1, 5, 7, 2, 6, 3, 9]


In [215]:
def calculate_route_len(route, adjacency_matrix, showTrace=False):
    total_distance = 0
    route_trace = f"Trace route {str(route)}: 0 "
    for i in range(len(route) - 1):
        total_distance += adjacency_matrix[route[i]][route[i + 1]]
        route_trace = route_trace + f"-> {adjacency_matrix[route[i]][route[i + 1]]} "

    if (showTrace):
        log(Level.TRACE, route_trace)

    return total_distance

def calculate_fitness(route, adjacency_matrix):
    return int(10000000 / calculate_route_len(route, adjacency_matrix))

def route_to_str(route):
    return f"{route}/Len-{calculate_route_len(route, topology)}/Fit-{calculate_fitness(route, topology)}"

log(Level.INFO, '\n'.join(map(route_to_str, initial_population)))

[0, 4, 2, 8, 7, 6, 5, 3, 1, 9]/Len-3157/Fit-3167
[0, 5, 2, 7, 3, 8, 6, 1, 4, 9]/Len-4521/Fit-2211
[0, 1, 5, 2, 4, 3, 7, 6, 8, 9]/Len-4279/Fit-2336
[0, 3, 1, 4, 5, 8, 6, 7, 2, 9]/Len-4750/Fit-2105
[0, 2, 4, 5, 1, 7, 3, 8, 6, 9]/Len-6397/Fit-1563
[0, 7, 1, 8, 3, 2, 4, 5, 6, 9]/Len-3741/Fit-2673
[0, 6, 1, 3, 8, 7, 5, 4, 2, 9]/Len-4278/Fit-2337
[0, 4, 7, 8, 3, 5, 1, 2, 6, 9]/Len-2982/Fit-3353
[0, 1, 8, 5, 2, 7, 4, 3, 6, 9]/Len-4249/Fit-2353
[0, 8, 4, 1, 5, 7, 2, 6, 3, 9]/Len-3849/Fit-2598


In [216]:
def selection(population: list, fitness_scores):
    selected_indices = np.random.choice(len(population), TOURNAMENT_SIZE, replace=False)
    best_index = selected_indices[np.argmax([fitness_scores[i] for i in selected_indices])]

    intdent = "\n                 "
    log(Level.DEBUG, f"selection:\n\t\
        indexes: {selected_indices}\n\t\
        tournament:{intdent}{intdent.join(map(route_to_str, [population[i] for i in selected_indices]))}\n\t\
        winner: {route_to_str(population[best_index])}")

    return population[best_index]

In [217]:
def crossover(parent1, parent2):
    size = len(parent1)
    crossover_point = np.random.randint(1, size - 1)
    child1 = parent1[:crossover_point] + [node for node in parent2 if node not in parent1[:crossover_point]]
    child2 = parent2[:crossover_point] + [node for node in parent1 if node not in parent2[:crossover_point]]
    
    log(Level.DEBUG, f"crossover:\n\t\
        point {crossover_point}:\n\t\
        Child1 = {parent1} + {parent2} -> {child1}\n\t\
        Child2 = {parent1} + {parent2} -> {child2}")

    return child1, child2

In [218]:
def mutate(route):
    old_route = route[:]
    if np.random.rand() < MUTATION_RATE:
        idx1, idx2 = np.random.choice(range(1, len(route) - 1), size=2, replace=False)
        route[idx1], route[idx2] = route[idx2], route[idx1]
        log(Level.DEBUG, f"mutation: {old_route} -> {route}")
    return route

In [219]:
def genetic_algorithm(adjacency_matrix):    

    population = initial_population
    
    for generation in range(NUM_GENERATIONS + 1):

        alter_topology(generation)

        fitness_scores = [calculate_fitness(route, adjacency_matrix) for route in population]
        
        log_generation(generation, population, fitness_scores)

        new_population = []
        while len(new_population) < POPULATION_SIZE:
            parent1 = selection(population, fitness_scores)
            parent2 = selection(population, fitness_scores)
            children = crossover(parent1, parent2)
            for child in children:
                child = mutate(child)
                if child not in new_population:
                    new_population.append(child)
                else:
                    log(Level.DEBUG, f"Child already present in population {child}")
        
        population = new_population[:POPULATION_SIZE]

    final_fitness_scores = [calculate_fitness(route, adjacency_matrix) for route in population]
    best_fitness = max(final_fitness_scores)
    best_route = population[np.argmax(final_fitness_scores)]

    print(f"\nBest fitness: {best_fitness}")
    print(f"Route len: {calculate_route_len(best_route, topology, True)}")
    
    return best_route, best_fitness

def log_generation(generation, population, fitness_scores):
    if generation % GENERATION_LOG_STEP != 0:
        return
    best_fitness = max(fitness_scores)
    best_route = population[np.argmax(fitness_scores)]
    full_population_string = '\n'.join(map(route_to_str, population))
    log(Level.DEBUG, "\n---\n")
    log(Level.INFO, f"Generation {generation}: Best Fitness = {best_fitness}, Best Route = {best_route}, Best Route len = {str(calculate_route_len(best_route, topology))}")
    log(Level.DEBUG, f"Full population:\n{full_population_string}\n")

# Запуск алгоритма
best_route, best_fitness = genetic_algorithm(topology)


---

Generation 0: Best Fitness = 3353, Best Route = [0, 4, 7, 8, 3, 5, 1, 2, 6, 9], Best Route len = 2982
Full population:
[0, 4, 2, 8, 7, 6, 5, 3, 1, 9]/Len-3157/Fit-3167
[0, 5, 2, 7, 3, 8, 6, 1, 4, 9]/Len-4521/Fit-2211
[0, 1, 5, 2, 4, 3, 7, 6, 8, 9]/Len-4279/Fit-2336
[0, 3, 1, 4, 5, 8, 6, 7, 2, 9]/Len-4750/Fit-2105
[0, 2, 4, 5, 1, 7, 3, 8, 6, 9]/Len-6397/Fit-1563
[0, 7, 1, 8, 3, 2, 4, 5, 6, 9]/Len-3741/Fit-2673
[0, 6, 1, 3, 8, 7, 5, 4, 2, 9]/Len-4278/Fit-2337
[0, 4, 7, 8, 3, 5, 1, 2, 6, 9]/Len-2982/Fit-3353
[0, 1, 8, 5, 2, 7, 4, 3, 6, 9]/Len-4249/Fit-2353
[0, 8, 4, 1, 5, 7, 2, 6, 3, 9]/Len-3849/Fit-2598

selection:
	        indexes: [0 2 1]
	        tournament:
                 [0, 4, 2, 8, 7, 6, 5, 3, 1, 9]/Len-3157/Fit-3167
                 [0, 1, 5, 2, 4, 3, 7, 6, 8, 9]/Len-4279/Fit-2336
                 [0, 5, 2, 7, 3, 8, 6, 1, 4, 9]/Len-4521/Fit-2211
	        winner: [0, 4, 2, 8, 7, 6, 5, 3, 1, 9]/Len-3157/Fit-3167
selection:
	        indexes: [1 2 7]
	        tournament:
    