# Задание по курсу «Дискретная оптимизация», МФТИ, весна 2017

## Задача 2-2. Эвристика Кернигана—Лина

В этой задаче Вам предлагается добавить к локальному поиска в задаче о сбалансированном разбиении графа эвристику Кернигана—Лина, когда мы, «застряв» в локальном минимуме, тем не менее пытаемся сделать несколько шагов из него, даже если они приводят к временному ухудшению. Надежда здесь на то, что после ухудшения может наступить заметное улучшение результата: нам удастся выпрыгнуть из локального оптимума. Мы рассматриваем безвесовый вариант задачи о разбиении с параметром балансировки $\alpha=\frac{1}{2}$:

**Даны:**
* $G=(V,E)$ — граф без весов на рёбрах

**Найти:**
* Разбиение $V=V'\sqcup V''$, такое, что $V'=\lfloor |V|/2 \rfloor$ и число рёбер между $V'$ и $V''$ минимально возможное.

Сделайте следующее:
* Скачайте файл [`partition-instances.zip`](https://github.com/dainiak/discrete-optimization-course/raw/master/partition-instances.zip) и разархивируйте из него файлы со входами задачи.
* Для каждого из графов найдите локальным поиском с эвристикой Кернигана—Лина локально минимальное (по количеству рёбер между частями) разбиение вершин графа на две части, мощности которых отличаются не более чем на единицу. 
* Реализуйте функцию `variable_depth_local_search`; она должна принимать на вход граф в формате, предоставляемом функцией `read_instance`, и возвращать найденное разбиение как множество вершин, лежащих в одной любой из двух компонент разбиения. Ваш локальный поиск должен начинаться с того разбиение, которое уже находится в переменной `starting_point`.
* Подберите для каждого из четырёх входных графов глубину поиска так, чтобы он работал не более 60 секунд на Вашем компьютере, и сохраните информацию о подобранных параметрах и любые свои интересные наблюдения в отдельную ячейку настоящего ipynb-файла.

In [92]:
def read_instance(filename):
    with open(filename, 'r') as file:
        n_vertices = int(file.readline().strip().split()[0])
        vertices, edges = set(range(1, n_vertices + 1)), set()
        for u in range(1, n_vertices + 1):
            for v in map(int, file.readline().strip().split()):
                edges.add((u,v))
        return (vertices, edges)

In [93]:
def differences(graph, partition):
    # Разница, которую мы получаем при перенесении вершины в другую часть.
    diff_exch = [0] * len(graph[0])
    for u, v in graph[1]:
        if (u in partition) != (v in partition):
            diff_exch[u - 1] -= 1
            diff_exch[v - 1] -= 1
        else:
            diff_exch[u - 1] += 1
            diff_exch[v - 1] += 1    
    return diff_exch

In [94]:
# Выбор оптимального обмена вершина при фиксированных данных
def best_candidates(graph, part_first, part_second, fixed_first, fixed_second):
    diff_exch = differences(graph, part_first)
    best_u, best_v, best_diff = -1, -1, 0
    for u in part_first - set(fixed_first):
        for v in part_second - set(fixed_second):
            flag = 0
            # Если было ребро между вершинами из разных частей,
            # то мы ошибочно посчитали его, и даже дважды.
            if (u, v) in graph[1] or (v, u) in graph[1]:
                flag = 1
            new_diff = diff_exch[u - 1] + diff_exch[v - 1] + 2 * flag
            if best_u == -1 or new_diff < best_diff:
                best_u = u
                best_v = v
                best_diff = new_diff
    return best_u, best_v, best_diff

In [130]:
def variable_depth_local_search(graph, max_depth):
    starting_point = set(range(1, len(graph[0]) // 2 + 1))
    quality = get_quality(graph, starting_point)
    part_first = starting_point.copy()
    part_second = graph[0] - part_first
    fixed_first = set([])
    fixed_second = set([])
    diff_now = 0
    best_diff = 0
    depth = 0
    while (depth < max_depth):
        best_u, best_v, new_diff = best_candidates(graph, part_first, part_second,
                                       fixed_first, fixed_second)
        diff_now += new_diff
        part_first.remove(best_u)
        part_first.add(best_v)
        part_second.remove(best_v)
        part_second.add(best_u)
        if diff_now < best_diff:
            quality -= diff_now
            best_diff = 0
            diff_now = 0
            depth = 0
            fixed_first = set([])
            fixed_second = set([])
        else:
            depth += 1
            print('Quality {} not updated, depth {}.'.format(quality, depth))
            fixed_first.add(best_v)
            fixed_second.add(best_u)
    return (part_first - fixed_first) | fixed_second

In [131]:
import time

def get_quality(graph, partition_part):
    if not (partition_part <= graph[0]) or abs(len(partition_part) - len(graph[0]) / 2) > 0.6:
        return -1
    other_part = set(graph[0]) - partition_part
    return sum(1 for edge in graph[1] if set(edge) <= partition_part or set(edge) <= other_part )

def run_all():
    filenames = ['add20.graph', 'cti.graph', 'm14b.graph', 't60k.graph']
    depths = [3, 3, 3, 3]
    for filename, depth in zip(filenames, depths):
        instance = read_instance(filename)
        print('Solving instance {}…'.format(filename))
        time_start = time.monotonic()
        partition = variable_depth_local_search(instance, depth)
        quality = get_quality(instance, partition)
        time_elapsed = time.monotonic() - time_start
        print('Done in {:.2} seconds with quality {}'.format(time_elapsed, quality))

In [132]:
run_all()

Solving instance add20.graph…
Quality 12462 not updated, depth 1.
Quality 12528 not updated, depth 1.
Quality 12554 not updated, depth 1.
Quality 12580 not updated, depth 1.
Quality 12584 not updated, depth 1.
Quality 12588 not updated, depth 1.
Quality 12622 not updated, depth 1.
Quality 12626 not updated, depth 1.
Quality 12630 not updated, depth 1.
Quality 12672 not updated, depth 1.
Quality 12710 not updated, depth 1.
Quality 12714 not updated, depth 1.
Quality 12718 not updated, depth 1.
Quality 12722 not updated, depth 1.
Quality 12726 not updated, depth 1.
Quality 12730 not updated, depth 1.
Quality 12734 not updated, depth 1.
Quality 12762 not updated, depth 1.
Quality 12788 not updated, depth 1.
Quality 12790 not updated, depth 1.
Quality 12790 not updated, depth 2.
Quality 12790 not updated, depth 3.
Done in 2.6e+02 seconds with quality 12790
Solving instance cti.graph…
Quality 94080 not updated, depth 1.
Quality 94080 not updated, depth 2.
Quality 94080 not updated, depth 3.

KeyboardInterrupt: 

In [135]:
def run_t60k():
    filenames = ['t60k.graph']
    depths = [3]
    for filename, depth in zip(filenames, depths):
        instance = read_instance(filename)
        print('Solving instance {}…'.format(filename))
        time_start = time.monotonic()
        partition = variable_depth_local_search(instance, depth)
        quality = get_quality(instance, partition)
        time_elapsed = time.monotonic() - time_start
        print('Done in {:.2} seconds with quality {}'.format(time_elapsed, quality))

In [136]:
run_t60k()

Solving instance t60k.graph…


KeyboardInterrupt: 

## Выводы
Для графа add20 результат не улучшается на глубинах 2-3 относительно глубины 1 (если считать, что мы начинаем с глубины 0). Для графа cti достаточно вообще только глубины 0. Для остальных двух даже переход по значениям меньше работает очень долго.