# Задание по курсу «Дискретная оптимизация», МФТИ, весна 2017

## Задача 2-2. Эвристика Кернигана—Лина

В этой задаче Вам предлагается добавить к локальному поиска в задаче о сбалансированном разбиении графа эвристику Кернигана—Лина, когда мы, «застряв» в локальном минимуме, тем не менее пытаемся сделать несколько шагов из него, даже если они приводят к временному ухудшению. Надежда здесь на то, что после ухудшения может наступить заметное улучшение результата: нам удастся выпрыгнуть из локального оптимума. Мы рассматриваем безвесовый вариант задачи о разбиении с параметром балансировки $\alpha=\frac{1}{2}$:

**Даны:**
* $G=(V,E)$ — граф без весов на рёбрах

**Найти:**
* Разбиение $V=V'\sqcup V''$, такое, что $V'=\lfloor |V|/2 \rfloor$ и число рёбер между $V'$ и $V''$ минимально возможное.

Сделайте следующее:
* Скачайте файл [`partition-instances.zip`](https://github.com/dainiak/discrete-optimization-course/raw/master/partition-instances.zip) и разархивируйте из него файлы со входами задачи.
* Для каждого из графов найдите локальным поиском с эвристикой Кернигана—Лина локально минимальное (по количеству рёбер между частями) разбиение вершин графа на две части, мощности которых отличаются не более чем на единицу. 
* Реализуйте функцию `variable_depth_local_search`; она должна принимать на вход граф в формате, предоставляемом функцией `read_instance`, и возвращать найденное разбиение как множество вершин, лежащих в одной любой из двух компонент разбиения. Ваш локальный поиск должен начинаться с того разбиение, которое уже находится в переменной `starting_point`.
* Подберите для каждого из четырёх входных графов глубину поиска так, чтобы он работал не более 60 секунд на Вашем компьютере, и сохраните информацию о подобранных параметрах и любые свои интересные наблюдения в отдельную ячейку настоящего ipynb-файла.

In [1]:
def read_instance(filename):
    with open(filename, 'r') as file:
        n_vertices = int(file.readline().strip().split()[0])
        vertices, edges = set(range(1, n_vertices + 1)), set()
        for u in range(1, n_vertices + 1):
            for v in map(int, file.readline().strip().split()):
                edges.add((u,v))
        return (vertices, edges)

In [2]:
from random import randrange

In [3]:
import time
import numpy as np

In [16]:
def adj_list(v, e):
    n = len(v)
    E = [[] for i in range(n + 1)]
    for v, u in e:
        E[v].append(u)
        E[u].append(v)
    for i in range(n + 1):
        E[i] = set(E[i])
    return E

def adj_matr(v, e):
    n = len(v)
    M = [[False] * (n + 1) for i in range(n + 1)]
    for v, u in e:
        M[v][u] = True
        M[u][v] = True
    return M

def edges_between(V1, V2):
    res = 0
    for x in V1:
        res += len(E[x] & V2)
    return res

def find_best_swap(V1, V2, maxN, used):
    max_delta = -len(V1) ** 2 - len(V2) ** 2
    argmin = (0, 0)
    for i in range(maxN):
        v = list(V1)[randrange(len(V1))]
        u = list(V2)[randrange(len(V2))]
        if used[v] or used[u]:
            continue
        V1_P = V1 - {v}
        V2_P = V2 - {u}
        delta = edges_between({u}, V1_P) + edges_between({v}, V2_P) - \
                edges_between({v}, V1_P) - edges_between({u}, V2_P)
        if delta > max_delta:
            max_delta = delta
            argmin = (v, u)
    return (max_delta, argmin)

def from_canon_by_sparrows(V1, V2, used):
    n = len(V1) + len(V2)
    diff_exch = [0] * (n + 1)
    for u, v in e:
        if (u in V1) != (v in V1):
            diff_exch[u] -= 1
            diff_exch[v] -= 1
        else:
            diff_exch[u] += 1
            diff_exch[v] += 1
    diff_exch = np.array(diff_exch)
    set_of_used = set()
    for i in range(n + 1):
        if used[i]:
            set_of_used.add(i)
    L1 = list(V1 - set_of_used)
    L2 = list(V2 - set_of_used)
    de1 = diff_exch[L1]
    de2 = diff_exch[L2]
    cut_M = (np.array(M))[np.ix_(L1, L2)]
    old = edges_between(V1, V2)
    new_V1 = (V1 - {L1[1]}) | {L2[0]}
    new_V2 = (V2 - {L2[0]}) | {L1[1]}
    new = edges_between(new_V1, new_V2)
    De1 = np.tile(de1, de2.shape[0]).reshape((de2.shape[0], de1.shape[0]))
    De2 = np.tile(de2, de1.shape[0]).reshape((de1.shape[0], de2.shape[0])).T
    F = (De1 + De2) // 2 + cut_M.T
    best_res = np.min(F)
    p = np.argmin(F)
    j = p // cut_M.shape[0]
    i = p % cut_M.shape[0]
    v = L1[i]
    u = L2[j]
    return (-best_res, (v, u))
    

def variable_depth_local_search(graph, hard_alg = True):
    time_start = time.monotonic()
    n = len(graph[0])
    V = list(graph[0])
    V1 = set(V[:n // 2])
    V2 = set(graph[0]) - V1
    cur_f = edges_between(V1, V2)
    print("starting point:", cur_f, "edges")
    n_iter = 0
    iterKL = 0
    while True:
        if time.monotonic() - time_start > 60:
            break
        n_iter += 1
        if n_iter % report_freq == 0:
            print("current result:", cur_f)
        used = [False] * (n + 1)
        delta, argmin = find_best_swap(V1, V2, maxLS, used)
        v = argmin[0]
        u = argmin[1]
        V1 = (V1 - {v}) | {u}
        V2 = (V2 - {u}) | {v}
        cur_f -= delta
        if delta <= 0:
            old_V1 = V1
            old_V2 = V2
            sum_delta = delta
            V1 = (V1 - {v}) | {u}
            V2 = (V2 - {u}) | {v}
            used[v] = True
            used[u] = True
            for i in range(max_depth - 1):
                iterKL += 1
                if iterKL % report_freq == 0:
                    print('after KL:', cur_f)
                delta, argmin = find_best_swap(V1, V2, maxKL, used)
                cur_f -= delta
                sum_delta += delta
                v = argmin[0]
                u = argmin[1]
                V1 = (V1 - {v}) | {u}
                V2 = (V2 - {u}) | {v}
                if time.monotonic() - time_start > 60:
                    if sum_delta <= 0:
                        V1 = old_V1
                        V2 = old_V2
                    break
            if sum_delta <= 0:
                sum_delta1 = sum_delta
                if hard_alg:
                    used = [False] * (n + 1)
                    for i in range(max_depth_f):
                        if time.monotonic() - time_start > 60:
                            if sum_delta1 <= 0:
                                V1 = old_V1
                                V2 = old_V2
                            return V1
                        delta, (v, u) = from_canon_by_sparrows(V1, V2, used)
                        used[u] = True
                        used[v] = True
                        cur_f -= delta
                        print("after FCBS:", cur_f)
                        sum_delta1 += delta
                        V1 = (V1 - {v}) | {u}
                        V2 = (V2 - {u}) | {v}
                if sum_delta1 <= 0:
                    V1 = old_V1
                    V2 = old_V2
                break
    return V1

In [18]:
%%time
v, e = read_instance('ht2-2/add20.graph')
E = adj_list(v, e)
M = adj_matr(v, e)
max_depth = 10
max_depth_f = 10
maxLS = 300
maxKL = 500
report_freq = 20
V1 = variable_depth_local_search((v, e))
V2 = set(v) - V1
print(edges_between(V1, V2))

starting point: 1927 edges
current result: 1845
current result: 1776
current result: 1706
current result: 1627
current result: 1558
current result: 1498
current result: 1458
current result: 1420
current result: 1380
current result: 1342
current result: 1310
current result: 1249
after KL: 1244
after KL: 1203
current result: 1188
after KL: 1165
after KL: 1140
after KL: 1125
after KL: 1112
after KL: 1096
after KL: 1082
current result: 1079
after KL: 1063
after KL: 1054
after KL: 1043
after FCBS: 1041
after FCBS: 1039
after FCBS: 1037
after FCBS: 1035
after FCBS: 1034
after FCBS: 1032
after FCBS: 1029
after FCBS: 1028
after FCBS: 1027
after FCBS: 1025
1025
CPU times: user 33.5 s, sys: 296 ms, total: 33.8 s
Wall time: 34.1 s


In [20]:
%%time
v, e = read_instance('ht2-2/cti.graph')
E = adj_list(v, e)
M = adj_matr(v, e)
print(len(v), len(e))
max_depth = 3
max_depth_f = 10
maxLS = 1000
maxKL = 100
report_freq = 1
V1 = variable_depth_local_search((v, e))
V2 = set(v) - V1
print(edges_between(V1, V2))

16840 96464
starting point: 1206 edges
current result: 1206
after KL: 1212
after KL: 1219
after FCBS: 1219
after FCBS: 1212
after FCBS: 1206
after FCBS: 1204
1204
CPU times: user 1min 4s, sys: 2.58 s, total: 1min 7s
Wall time: 1min 21s


In [None]:
%%time
v, e = read_instance('ht2-2/m14b.graph')
E = adj_list(v, e)
M = adj_matr(v, e)
print(len(v), len(e))
max_depth = 3
max_depth_f = 10
maxLS = 10
maxKL = 10
report_freq = 1
V1 = variable_depth_local_search((v, e), False)
V2 = set(v) - V1
print(edges_between(V1, V2))

In [29]:
import time

def get_quality(graph, partition_part):
    if not (partition_part <= graph[0]) or abs(len(partition_part) - len(graph[0]) / 2) > 0.6:
        return -1
    other_part = set(graph[0]) - partition_part
    return sum(1 for edge in graph[1] if set(edge) <= partition_part or set(edge) <= other_part )

def run_all():
    filenames = ['add20.graph', 'cti.graph', 't60k.graph', 'm14b.graph']
    for filename in filenames:
        instance = read_instance(filename)
        print('Solving instance {}…'.format(filename), end='')
        time_start = time.monotonic()
        quality = get_quality(instance, variable_depth_local_search(instance))
        time_elapsed = time.monotonic()-time_start
        print(' done in {:.2} seconds with quality {}'.format(time_elapsed, quality))

In [30]:
run_all()

Solving instance add20.graph… done in 0.015 seconds with quality 11070
Solving instance cti.graph… done in 0.16 seconds with quality 94052
Solving instance t60k.graph… done in 0.23 seconds with quality 178236
Solving instance m14b.graph… done in 5.4 seconds with quality 2888974


## Выводы
(Здесь опишите свои наблюдения и подобранные параметры для каждогр из четырёх входных графов.)