# Паросочетания

Пусть есть $n$ мальчиков и $m$ девочек. Про каждого мальчика и про каждую девочку известно, с кем они не против танцевать. Нужно составить как можно больше пар.

Паросочетанием $M$ называется набор попарно несмежных рёбер графа (иными словами, любой вершине графа должно быть инцидентно не более одного ребра из множества M). Мощностью паросочетания назовём количество рёбер в нём. Наибольшим (или максимальным) паросочетанием назовём паросочетание, мощность которого максимальна среди всех возможных паросочетаний в данном графе. Все те вершины, у которых есть смежное ребро из паросочетания (т.е. которые имеют степень ровно один в подграфе, образованном M), назовём насыщенными этим паросочетанием.

**Цепью** длины $k$ назовём некоторый простой путь (т.е. не содержащий повторяющихся вершин или рёбер), содержащий k рёбер.

**Чередующейся цепью** относительно некоторого паросочетания назовём простой путь длины $k$ в которой рёбра поочередно принадлежат/не принадлежат паросочетанию.

**Увеличивающей цепью** относительно некоторого паросочетания назовём чередующуюся цепь, у которой начальная и конечная вершины не принадлежат паросочетанию.

Зачем нужны увеличивающие цепи? Оказывается, можно с их помощью увеличивать паросочетание на единичку. Можно увеличивающую цепь и провести **чередование** — выкинуть и добавить поочетедно рёбра. Всего в увеличивающей цепи нечетное число рёбер, а первое и последнее были не в паросочетании. Значит, мощность паросочетания увеличилась ровно на единицу.

Как их искать? Можно просто запустить поиск пути из произвольной незаматченной вершины из левой доли в правую. В реализации для краткости сделан немного нестандартный dfs, но в принципе это можно делать как угодно.

Для алгоритма недостаточно факта, что увеличивающие цепи. Оказывается, верен ещё и следующий факт, подтверждающий корректность алгоритма:

**Теорема (Бержа)**. Паросочетание без увеличивающих цепей является максимальным.

**Доказательство** проведём от противного. Пусть есть два паросочетания вершин $|A| \leq |B|$. Раскрасим ребра из паросочетания, соответствующего $A$ в красный цвет, $B$ — в синий, а ребра из обоих паросочетаний — в пурпурный. Рассмотрим граф из красных и синих ребер. Любая компонента связности в нём представляет собой либо путь, либо цикл, состоящий из чередующихся красных и синих ребер. В любом цикле будет равное число красных и синих ребер, а так как всего синих ребер больше, то должен существовать путь, начинающийся и оканчивающийся синим ребром  — он и будет увеличивающей цепью для $A$.

In [0]:
const int maxn;

vector<int> g[maxn];
int mt[maxn];
bool used[maxn];

bool kuhn (int v) {
    if (used[v]) return 0;
    used[v] = 1;
    for (int u : g[v]) {
        if (mt[u] == -1 || kuhn(mt[u])) {
            mt[u] = v;
            return 1;
        }
    }
    return 1;
}

// где-то в main:

memset(mt, -1, sizeof(mt));
for (int i = 0; i < n; i++) {
    memset(used, 0, sizeof(mt));
    if (kuhn(i)) cnt++;
}


## Скорость работы

 Такой алгоритм ровно $n$ раз ищет увеличивающий путь, каждый раз просматривая не более $m$ рёбер, значит, работает за $O(nm)$.
 
 Что примечательно, его можно не бояться запускать на ограничениях и побольше ($n, m \approx 10^4$), потому что есть неасимптотические оптимизации:
 

Можно жадно проинициализировать.

Иногда графы какого-то специального вида, и это работает лучше.

Можно не пересоздавать массив used, и использовать следующий трюк: хранить версию последнего изменения. В каком-то смысле это позволяет эмулировать очищение массива за константу.

Очень часто граф приходит из какой-то другой задачи, природа которой накладывает на него ограничения, так что он работает даже быстрее. Наверное, антитест в таком случае тоже можно сгенерировать, но авторы задач редко так заморачиваются.
 
 Вообще говоря, паросочетание — частный случай потоков. Существует и более асимптотически быстрый алгоритм — если применить алгоритм Диница (тот, который про потоки) к двудольным графам с единичной пропускной способностью, то работать он будет за $O(n \sqrt m)$.

## Примеры задач

> 123

## Мощное обобщение: матроиды

**Матроидом** называется пара $(X, I)$, где $X$ — множество элементов, называемое **носителем матроида**, а $I$ — некоторое множество подмножеств $X$, называемое **семейством независимых множеств**. В матроиде должны выполняться следующие свойства:

* Пустое множество является независимым: $\varnothing \in I$

* Любое подмножество независимого множества тоже независимо: 
$$A \subset B, B \in I \implies A \in I$$

* Если в независимом множестве $A$ меньше элементов, чем в независимом множестве $B$, то будет существовать элемент из $B$, дополняющий $A$ до независимого множества размера $|A|+1$:
$$A, B \in I, |A| < |B| \implies \exists x \in B \setminus A: A \cup \{x\} \in I$$

Матроид называется **взвешенным**, если на нем существует аддитивная весовая функция: $w(A) = \sum w(a_i)$.

На самом деле паросочетания — это тоже как бы матроид. Давайте пройдемся по пунктам в определении:

Рассмотрим двудольный граф $G = (L, R, E)$. Пусть $I$ — множество наборов вершин левой доли, которых можно покрыть каким-нибудь паросочетанием. Тогда $M = (L, I)$ является матроидом:

* Любое паросочетание покрывает пустое множество вершин.
* Исходное паросочетание покрывает также и любое подмножество исходных вершин.
* Доказательство теоремы Бержа.

Пусть у вершин левой доли есть веса, и нам нужно найти максимальное паросочетание минимального веса. Согласно теореме, мы можем отсортировать вершины левой доли по их весам, а затем пытаться добавлять их в паросочетание. Сделать это можно стандартным алгоритмом Куна.

## Лемма Холла

> Полное паросочетание существует тогда и только тогда, когда любая группа вершин левой доли соединена с не меньшим количеством вершин левой доли.

Доказательство немного муторное по мнению автора. Сами [почитаете](https://www.mccme.ru/s43/math/uroki/2009_2010/9mat_0910/spec/59_hall_lect.pdf), если захотите — у нас не маткружок.

## Теорема Радо-Эдмондса

Математика вообще занимается тем, чтобы обобщать всякие объекты и формулировать все теоремы очень абстрактно. Так, концепцию *хороших подмножеств* (паросочетаний) инкапсулирует понятие [матроида](http://sereja.me/a/matroid). Об этом тоже как-нибудь не сегодня.

Практическое применение матроидов — жадный алгоритм Радо-Эдмондса. Пусть у вершин левой доли есть вес, и нам нужно набрать максимальное паросочетание минимального веса. Тогда можно просто отсортировать вершины левой доли по весу и пытаться в таком порядке добавлять их в паросочетание.

## В недвудольных графах

В недрудольных тоже можно искать максимальные паросочетания. Алгоритм работает за $O(n^3)$ и весьма противно кодится.