# P vs NP — главный ноутбук

**Статус (важно):** на текущий момент (2025) общая проблема $\mathrm{P}$ vs $\mathrm{NP}$ остаётся открытой. Этот ноутбук — строгий, проверяемый журнал: фиксирует постановку, корректные (доказанные) леммы, барьеры и места, где именно должен появиться новый нерелятивизирующий/ненатуральный аргумент.

**Цель:** либо построить корректное доказательство $\mathrm{P}\neq\mathrm{NP}$, либо (что столь же революционно) доказать $\mathrm{P}=\mathrm{NP}$. Пока что здесь нет такого доказательства; любые новые идеи добавляются в виде лемм с явными зависимостями и проверкой на контрпримеры.

**Последнее обновление (2025-03):** добавлены источники по барьерам и схемным нижним оценкам 2024–2025 (Chen-Hu-Ren 2025; Grewal-Kumar 2024).

**Ближайший фокус:** зафиксировать краткую карту достаточных условий и барьеров (NP ⊄ P/poly как цель; proof complexity lower bounds; алгебраический аналог VP vs VNP/GCT).


## 0. Договор о «формальной проверяемости»

Под «формально проверяемым» в этом ноутбуке понимается:

1. **Фиксирована модель вычислений** и единая договорённость о полиномиальности (робастность между стандартными моделями оговаривается явно).
2. Каждое утверждение записано как **теорема/лемма** с явными предпосылками.
3. Для каждой леммы: **полное доказательство** (или явная пометка *«цитируется»* с точной ссылкой).
4. Для конструкций/редукций: явный алгоритм и доказательство корректности + оценка времени.
5. Для «новых идей»: обязательные разделы **контрпримеры/крайние случаи** и **проверка на барьеры** (релятивизация, natural proofs, algebrization).
6. Для пометок *«цитируется»*: точная ссылка должна быть в Разделе «Источники» и в `resources/manifest.tsv` (по возможности — скачанный PDF в `resources/downloads/`).
7. Для code-ячееек: воспроизводимый прогон без Jupyter: `python3 scripts/verify_notebook.py P_vs_NP.ipynb`.


## 1. Формальная постановка

Пусть $\Sigma$ — конечный алфавит, $\Sigma^\*$ — множество всех конечных строк над $\Sigma$.

**Язык** — это множество $L\subseteq\Sigma^\*$.

Фиксируем стандартную модель: детерминированные/недетерминированные многоленточные машины Тьюринга. Временная сложность измеряется числом шагов как функция длины входа $n=|x|$.

**Определение (класс $\mathrm{P}$).** $L\in\mathrm{P}$, если существует детерминированная МТ $M$ и константа $k$, такие что для всех $x\in\Sigma^\*$ машина $M$ останавливается за $O(|x|^k)$ шагов и принимает тогда и только тогда, когда $x\in L$.

**Определение (класс $\mathrm{NP}$).** $L\in\mathrm{NP}$, если существует недетерминированная МТ $N$ и константа $k$, такие что $N$ останавливается за $O(|x|^k)$ шагов на всех ветвях, и $x\in L$ тогда и только тогда, когда существует принимающая ветвь вычисления $N(x)$.

**Замечание (робастность).** Выбор любой стандартной модели вычислений и разумного кодирования объектов влияет лишь на полиномиальные множители. Далее достаточно оценивать время редукций по длине естественного описания (формулы/графа).

**Гипотеза $\mathrm{P}\neq\mathrm{NP}$.** Существует язык $L\in\mathrm{NP}$, такой что $L\notin\mathrm{P}$.


## 2. Эквивалентная «сертификатная» формулировка NP

Часто удобно определять $\mathrm{NP}$ через полиномиально проверяемые сертификаты.

**Определение (верификатор).** Детерминированная машина $V$ — *верификатор* для языка $L$, если существует полином $p$ такой, что

$$x\in L \iff \exists y\in\Sigma^\*,\ |y|\le p(|x|):\ V(x,y)=1,$$

и время работы $V$ на паре $(x,y)$ ограничено полиномом от $|x|$.

**Лемма 2.1.** Язык $L\in\mathrm{NP}$ тогда и только тогда, когда у него есть полиномиальный верификатор.

*Доказательство.*

($\Rightarrow$) Пусть $L$ распознаётся НМТ $N$ за время $n^k$. Сертификатом $y$ возьмём последовательность недетерминированных выборов, которая кодирует одну ветвь вычисления длины $\le n^k$. Верификатор $V(x,y)$ детерминированно симулирует $N$ по этим выборам и проверяет, что симуляция корректна и ветвь принимает. Длина $y$ и время симуляции ограничены полиномом от $n$.

($\Leftarrow$) Пусть есть верификатор $V$ и полином $p$. Недетерминированная машина $N$ на входе $x$ недетерминированно «угадывает» строку $y$ длины $\le p(|x|)$ и запускает $V(x,y)$. Тогда существует принимающая ветвь тогда и только тогда, когда существует сертификат, т.е. $x\in L$. Время — полиномиально.

$\square$


## 3. Базовые включения (полные доказательства)

**Лемма 3.1.** $\mathrm{P}\subseteq\mathrm{NP}$.

*Доказательство.* Детерминированная машина — частный случай недетерминированной (без ветвлений). Если $L$ решается за полиномиальное время детерминированно, то он решается за то же время и недетерминированно. $\square$

**Лемма 3.2.** $\mathrm{NP}\subseteq\mathrm{PSPACE}$.

*Доказательство (классическое).* Пусть $L\in\mathrm{NP}$ распознаётся НМТ $N$ за $n^k$. Рассмотрим граф конфигураций $G_x$ для входа $x$: вершины — конфигурации $N$ на $x$, ребро — один шаг вычисления. Число конфигураций ограничено $2^{O(n^k)}$, но каждая конфигурация занимает $O(n^k)$ памяти.

Детерминированная машина может проверить существование пути от стартовой конфигурации к принимающей, используя DFS с рекурсией по длине пути (или алгоритм достижимости Сэвича для NL⊆SPACE(log²) в более общем виде). Конкретно: можно перебрать недетерминированные ветви «вглубь», храня текущую конфигурацию и счётчик шагов до $n^k$. Это требует $O(n^k)$ памяти для конфигурации и $O(\log n)$ для счётчиков, т.е. полиномиальную память. Следовательно, $L\in\mathrm{PSPACE}$. $\square$

**Лемма 3.3.** Если $\mathrm{P}=\mathrm{NP}$, то $\mathrm{NP}=\mathrm{coNP}$.

*Доказательство.* Из $\mathrm{P}=\mathrm{NP}$ следует $\mathrm{NP}=\mathrm{P}$. Но $\mathrm{P}$ замкнут по дополнению: если $M$ решает $L$ за полиномиальное время, то машина, меняющая ответы accept/reject, решает $\overline{L}$ за то же время. Значит $\overline{L}\in\mathrm{P}=\mathrm{NP}$ для любого $L\in\mathrm{NP}$, то есть $\mathrm{coNP}\subseteq\mathrm{NP}$. Обратное включение $\mathrm{NP}\subseteq\mathrm{coNP}$ симметрично. $\square$


## 4. Редукции и NP‑полнота (минимальный аппарат)

**Определение (полиномиальная many‑one редукция).** Язык $A$ *сводится* к $B$ (обозначение $A\le_m^p B$), если существует полиномиально вычислимая функция $f$ такая, что для всех $x$:
$$x\in A \iff f(x)\in B.$$

**Определение (NP‑полный).** Язык $B$ NP‑полон, если (i) $B\in\mathrm{NP}$ и (ii) для любого $A\in\mathrm{NP}$ верно $A\le_m^p B$.

**Лемма 4.1.** $\mathrm{SAT}\in\mathrm{NP}$.

*Доказательство.* Сертификат — присваивание булевых переменных. Верификатор за полиномиальное время подставляет его в формулу и проверяет, что каждая клауза истинна. $\square$

**Теорема 4.2 (Cook–Levin).** SAT NP‑полна.

*Доказательство.* Пусть $L\in\mathrm{NP}$. По сертификатной формулировке (Раздел 2) существует полином $p$ и детерминированный полиномиальный верификатор $V$, такой что
$$x\in L \iff \exists y\in\{0,1\}^{p(|x|)}:\ V(x,y)=1.$$

Зафиксируем детерминированную одноленточную МТ $M$, вычисляющую $V$ (по робастности модели это не меняет полиномиальности). Пусть для входа $x$ длины $n$ машина $M$ останавливается не более чем за $T(n)$ шагов на всех строках $\langle x,y\rangle$ (где $|y|=p(n)$). Заменим $T(n)$ на $T(n)+n+p(n)+2$, чтобы гарантировать, что места под вход на ленте достаточно; без потери общности дополним $M$ холостыми шагами так, чтобы она делала **ровно** $T:=T(n)$ шагов.

Построим по $x$ CNF‑формулу $\varphi_x$, выполнимую тогда и только тогда, когда существует сертификат $y$, при котором $M$ принимает $\langle x,y\rangle$.

**Переменные.** Пусть $\Gamma$ — алфавит ленты $M$ (включая символы $0,1$, пустой символ $\square$, разделитель $\#$ и левый маркер $\triangleright$), а $Q$ — множество состояний, $q_0$ — стартовое, $q_{\mathrm{acc}}$ — принимающее.
Рассмотрим расширенный алфавит $\Gamma':=\Gamma\cup(Q\times\Gamma)$: символ $(q,a)$ означает, что головка стоит в этой клетке, машина в состоянии $q$, и «под головкой» записан символ $a$.

Положим $W:=T+2$ и рассматриваем клетки ленты $i\in\{0,1,\dots,W\}$ (крайние клетки будут фиксированы маркерами и нужны только для границ). Для каждого $t\in\{0,1,\dots,T\}$, $i\in\{0,1,\dots,W\}$ и $s\in\Gamma'$ вводим булеву переменную $X_{t,i,s}$ со смыслом: «в момент $t$ в клетке $i$ записан символ $s$».

**Клаузы (CNF).** Формула $\varphi_x$ — конъюнкция следующих семейств.

(A) *(Ровно один символ в клетке.)* Для каждого $(t,i)$:
- «хотя бы один» : $\bigvee_{s\in\Gamma'} X_{t,i,s}$;
- «не более одного» : для всех $s\ne s'$ добавляем $(\neg X_{t,i,s}\lor\neg X_{t,i,s'})$.

(B) *(Ровно одна позиция головки/состояние.)* Для каждого $t$ требуем, что ровно одна клетка содержит «состоянийный» символ:
- $\bigvee_{i\in\{1,\dots,W-1\},\ q\in Q,\ a\in\Gamma} X_{t,i,(q,a)}$;
- попарные запреты для разных троек $(i,q,a)$.

(C) *(Границы и начальная конфигурация.)* Для всех $t$ фиксируем границы: $X_{t,0,\triangleright}$ и $X_{t,W,\square}$.
Пусть $x=x_1\dots x_n$. В момент $0$ задаём ленту вида $\triangleright\ x\ \#\ y\ \square\cdots$ и стартовое состояние в первой букве $x$:
- $X_{0,1,(q_0,x_1)}$;
- для $i=2,\dots,n$ : $X_{0,i,x_i}$;
- $X_{0,n+1,\#}$;
- для «сертификатной зоны» $i=n+2,\dots,n+1+p(n)$ : добавляем $(X_{0,i,0}\lor X_{0,i,1})$;
- для остальных $i>n+1+p(n)$ фиксируем $X_{0,i,\square}$.

(D) *(Один шаг вычисления, локальные ограничения.)* Для каждого $t<T$ и каждого $i\in\{1,\dots,W-1\}$ требуем, чтобы окно $3\times 2$ вокруг $i$ согласовывалось с функцией перехода $\delta$ машины $M$.
Формально: рассмотрим все 6‑тройки символов
$$(a_{-1},a_0,a_{+1};\ b_{-1},b_0,b_{+1})\in(\Gamma')^6,$$
которые **не могут** встретиться как
$$(\text{символы в }(t,i-1),(t,i),(t,i+1);\ \text{символы в }(t+1,i-1),(t+1,i),(t+1,i+1))$$
в корректном ходе $M$. Для каждой такой запрещённой 6‑тройки добавляем одну CNF‑клаузу, запрещающую её одновременное появление:
$$(\neg X_{t,i-1,a_{-1}}\lor\neg X_{t,i,a_0}\lor\neg X_{t,i+1,a_{+1}}\lor\neg X_{t+1,i-1,b_{-1}}\lor\neg X_{t+1,i,b_0}\lor\neg X_{t+1,i+1,b_{+1}}).$$
Так как $M$ фиксирована, $|\Gamma'|$ — константа, поэтому число таких локальных шаблонов — константа; суммарное число клауз в (D) равно $O(T\cdot W)=O(T^2)$.

(E) *(Принятие.)* Требуем, чтобы на шаге $T$ машина была в принимающем состоянии:
$$\bigvee_{i\in\{1,\dots,W-1\},\ a\in\Gamma} X_{T,i,(q_{\mathrm{acc}},a)}.$$

**Оценка размера.** Число переменных $|\{X_{t,i,s}\}|=(T+1)(W+1)|\Gamma'|=O(T^2)$, а число клауз также $O(T^2)$ (так как в (A),(B),(D) константы зависят только от $M$). Значит $x\mapsto\varphi_x$ вычисляется за время $\mathrm{poly}(|x|)$.

**Корректность.**
- Если $x\in L$, то существует $y$ такое, что $M$ принимает $\langle x,y\rangle$. Таблица (tableau) её вычисления длины $T$ задаёт истинностные значения переменных $X_{t,i,s}$; по построению выполняются (A)–(E), значит $\varphi_x$ выполнима.
- Если $\varphi_x$ выполнима, то из (A),(B) получаем корректное кодирование «ровно одного символа» и «ровно одной головки/состояния» в каждом такте, (C) фиксирует вход $x$ и задаёт некоторый сертификат $y$ в выделенной зоне, а (D) гарантирует, что каждые два соседних такта согласованы с одним шагом $\delta$. Следовательно, переменные описывают корректное вычисление $M$ на $\langle x,y\rangle$, и по (E) оно принимающее; значит $x\in L$.

Итак, для любого $L\in\mathrm{NP}$ имеем $L\le_m^p\mathrm{SAT}$, то есть SAT NP‑трудна. Совместно с Леммой 4.1 получаем, что SAT NP‑полна. $\square$

Ниже — полностью выписанная редукция SAT $\le_m^p$ 3SAT.


## 5. Лемма: SAT $\le_m^p$ 3SAT (полное доказательство)

Будем кодировать CNF‑формулу $F$ как конъюнкцию клауз (дизъюнктов) из литералов. Литерал — переменная $x_i$ или её отрицание $\neg x_i$.

**Теорема 5.1.** Существует полиномиально вычислимая функция $T$, которая по CNF‑формуле $F$ строит 3CNF‑формулу $T(F)$ такую, что $F$ выполнима тогда и только тогда, когда $T(F)$ выполнима.

*Конструкция.* Пусть $F=\bigwedge_{j=1}^m C_j$, где $C_j$ — дизъюнкт из $k_j$ литералов.

1) Если $k_j=1$, то $C_j=(\ell_1)$ заменяем на $(\ell_1\lor\ell_1\lor\ell_1)$.

2) Если $k_j=2$, то $C_j=(\ell_1\lor\ell_2)$ заменяем на $(\ell_1\lor\ell_2\lor\ell_2)$.

3) Если $k_j=3$, оставляем как есть.

4) Если $k_j>3$ и $C_j=(\ell_1\lor\ell_2\lor\cdots\lor\ell_{k_j})$, вводим новые переменные $y_1,\dots,y_{k_j-3}$ и заменяем $C_j$ на конъюнкцию $k_j-2$ трёхлитеральных клауз:

$$(\ell_1\lor\ell_2\lor y_1)\ \wedge\ (\neg y_1\lor\ell_3\lor y_2)\ \wedge\ \cdots\ \wedge\ (\neg y_{k_j-4}\lor\ell_{k_j-2}\lor y_{k_j-3})\ \wedge\ (\neg y_{k_j-3}\lor\ell_{k_j-1}\lor\ell_{k_j}).$$

Определим $T(F)$ как конъюнкцию преобразованных клауз для всех $j$.

*Корректность (эквисатисфайбилити).* Достаточно проверить для каждой клаузы $C_j$.

- Случаи $k_j\le 3$ очевидно сохраняют выполнимость: замена добавляет дубликаты литералов.

- Пусть $k_j>3$. Обозначим полученную цепочку клауз как $D_1\wedge\cdots\wedge D_{k_j-2}$.

($\Rightarrow$) Если исходная клауза $C_j$ истинна на некотором присваивании переменных $x$, то существует индекс $t$ такой, что $\ell_t$ истинна. Расширим присваивание на новые $y$ так: если $t\in\{1,2\}$, положим $y_1=\mathrm{false}$; иначе положим $y_1=\mathrm{true}$. Далее для каждого шага выбираем $y_i$ так, чтобы «протащить» истинность до момента, когда встретится истинный литерал $\ell_t$; формально, можно задать $y_i=\mathrm{true}$ для $i< t-2$ и $y_i=\mathrm{false}$ для $i\ge t-2$. Тогда проверкой по цепочке видно, что каждый дизъюнкт содержит хотя бы один истинный литерал (либо один из $\ell$ до $\ell_t$, либо соответствующий $y_i$ или $\neg y_i$). Значит цепочка выполнима.

($\Leftarrow$) Пусть цепочка выполнима некоторым присваиванием, расширяющим $x$. Предположим противное: все $\ell_1,\dots,\ell_{k_j}$ ложны на $x$. Тогда из $D_1=(\ell_1\lor\ell_2\lor y_1)$ следует $y_1=\mathrm{true}$. Из $D_2=(\neg y_1\lor\ell_3\lor y_2)$ при $y_1=\mathrm{true}$ и ложном $\ell_3$ следует $y_2=\mathrm{true}$. Продолжая, получаем $y_{k_j-3}=\mathrm{true}$. Но последняя клауза $D_{k_j-2}=(\neg y_{k_j-3}\lor\ell_{k_j-1}\lor\ell_{k_j})$ при $y_{k_j-3}=\mathrm{true}$ и ложных $\ell_{k_j-1},\ell_{k_j}$ становится ложной — противоречие. Значит хотя бы один $\ell_t$ истинен, то есть исходная клауза $C_j$ истинна.

Таким образом, $C_j$ выполнима $\iff$ соответствующая 3CNF‑замена выполнима. По конъюнкции по всем $j$ получаем $F$ выполнима $\iff T(F)$ выполнима.

*Сложность.* Размер увеличивается линейно по суммарной длине клауз (для клаузы длины $k$ создаётся $k-2$ клауз и $k-3$ новых переменных). Значит $T$ вычислима за полиномиальное время.

$\square$


In [None]:
from __future__ import annotations

from dataclasses import dataclass
from itertools import product
import random
from typing import Iterable


Literal = int  # +i means x_i, -i means ¬x_i, variables indexed from 1
Clause = tuple[Literal, ...]
CNF = list[Clause]


def eval_literal(lit: Literal, assignment: dict[int, bool]) -> bool:
    var = abs(lit)
    val = assignment[var]
    return val if lit > 0 else (not val)


def eval_cnf(formula: CNF, assignment: dict[int, bool]) -> bool:
    return all(any(eval_literal(l, assignment) for l in clause) for clause in formula)


def satisfiable(formula: CNF, num_vars: int) -> bool:
    for bits in product([False, True], repeat=num_vars):
        assignment = {i + 1: bits[i] for i in range(num_vars)}
        if eval_cnf(formula, assignment):
            return True
    return False


def to_3cnf(formula: CNF, num_vars: int) -> tuple[CNF, int]:
    next_var = num_vars + 1
    out: CNF = []

    for clause in formula:
        k = len(clause)
        if k == 0:
            # empty clause -> unsatisfiable; keep as is
            out.append(clause)
            continue
        if k == 1:
            l1 = clause[0]
            out.append((l1, l1, l1))
            continue
        if k == 2:
            l1, l2 = clause
            out.append((l1, l2, l2))
            continue
        if k == 3:
            out.append(tuple(clause))
            continue

        # k > 3
        l1, l2, *rest = clause
        y_vars = list(range(next_var, next_var + (k - 3)))
        next_var += (k - 3)

        # (l1 ∨ l2 ∨ y1)
        out.append((l1, l2, y_vars[0]))

        # (¬y_{i} ∨ l_{i+3} ∨ y_{i+1}) for i=0..k-5
        for i in range(k - 4):
            out.append((-y_vars[i], rest[i], y_vars[i + 1]))

        # last: (¬y_{k-4} ∨ l_{k-1} ∨ l_k)
        out.append((-y_vars[-1], rest[-2], rest[-1]))

    return out, next_var - 1


def random_cnf(num_vars: int, num_clauses: int, min_len: int = 1, max_len: int = 5) -> CNF:
    out: CNF = []
    for _ in range(num_clauses):
        k = random.randint(min_len, max_len)
        clause: list[int] = []
        for _ in range(k):
            v = random.randint(1, num_vars)
            clause.append(v if random.random() < 0.5 else -v)
        out.append(tuple(clause))
    return out


def check_sat_to_3sat_trials(trials: int = 200, seed: int = 0) -> None:
    random.seed(seed)
    for t in range(trials):
        n = random.randint(1, 6)
        m = random.randint(0, 8)
        f = random_cnf(n, m)
        f3, n3 = to_3cnf(f, n)
        a = satisfiable(f, n)
        b = satisfiable(f3, n3)
        if a != b:
            raise AssertionError((t, n, m, f, f3, n3, a, b))


check_sat_to_3sat_trials()
print("OK: SAT ↔ 3SAT на случайных малых тестах")


## 6. Редукция 3SAT $\le_m^p$ CLIQUE (доказательство + проверка на малых случаях)

**Задача CLIQUE (decision).** Вход: неориентированный граф $G=(V,E)$ и число $k$. Вопрос: существует ли клика размера $\ge k$?

**Теорема 6.1.** 3SAT $\le_m^p$ CLIQUE.

*Конструкция.* Пусть 3CNF‑формула $\varphi$ имеет $m$ клауз $C_1,\dots,C_m$, каждая — дизъюнкт из трёх литералов. Строим граф $G$:

- Вершины: по одной вершине на каждый литерал в каждой клаузе, т.е. $v_{i,\ell}$ для $\ell\in C_i$.
- Рёбра: соединяем $v_{i,\ell}$ и $v_{j,\ell'}$ (где $i\ne j$) тогда и только тогда, когда литералы **совместимы**: не являются взаимоисключающими, т.е. не имеют вид $x$ и $\neg x$ для одной переменной.

Выход: пара $(G,k)$ где $k=m$.

*Корректность.*

- Если $\varphi$ выполнима, выберем в каждой клаузе $C_i$ один истинный литерал $\ell_i$ (на фиксированном удовлетворяющем присваивании). Тогда никакие два выбранных литерала не противоречат (иначе присваивание делало бы один из них ложным). Значит для любых $i\ne j$ вершины $v_{i,\ell_i}$ и $v_{j,\ell_j}$ соединены ребром; получаем клику из $m$ вершин.

- Если в $G$ есть клика размера $m$, то она содержит ровно по одной вершине из каждой группы $\{v_{i,\ell}:\ell\in C_i\}$ (поскольку рёбер внутри одной клаузы нет). Это задаёт выбор литерала $\ell_i$ в каждой клаузе. Совместимость всех пар означает отсутствие пары вида $x$ и $\neg x$. Тогда можно построить присваивание: присвоить каждой переменной значение, согласованное с выбранными литералами (если переменная нигде не выбрана — произвольно). Тогда каждый $C_i$ удовлетворён выбранным литералом $\ell_i$, значит удовлетворена вся формула.

*Сложность.* Граф имеет $3m$ вершин и $O(m^2)$ потенциальных рёбер; построение занимает полиномиальное время.

$\square$

**Лемма 6.2.** 3SAT $\in\mathrm{NP}$.

*Доказательство.* Сертификат — присваивание булевых значений переменным. Верификатор за время $O(|\varphi|)$ проверяет истинность каждой клаузы. $\square$

**Следствие 6.3.** Если SAT NP‑полна (Cook–Levin), то 3SAT NP‑полна.

*Доказательство.* Из Теоремы 5.1 имеем SAT $\le_m^p$ 3SAT. Так как 3SAT $\in\mathrm{NP}$, то 3SAT NP‑трудна и принадлежит NP, значит NP‑полна. $\square$

**Лемма 6.4.** CLIQUE $\in\mathrm{NP}$.

*Доказательство.* Сертификат — список из $k$ вершин. Верификатор проверяет за $O(k^2)$, что все пары соединены ребром. $\square$

**Следствие 6.5.** CLIQUE NP‑полна.

*Доказательство.* По Теореме 6.1 имеем 3SAT $\le_m^p$ CLIQUE. По Следствию 6.3 задача 3SAT NP‑полна. Вместе с Леммой 6.4 (CLIQUE $\in\mathrm{NP}$) получаем NP‑полноту CLIQUE. $\square$


In [None]:
from itertools import combinations, product


def is_complementary(a: Literal, b: Literal) -> bool:
    return a == -b


def three_sat_to_clique(formula_3cnf: CNF) -> tuple[dict[tuple[int, int], set[tuple[int, int]]], int]:
    # vertices are (clause_index, literal)
    adj: dict[tuple[int, int], set[tuple[int, int]]] = {}
    m = len(formula_3cnf)

    vertices: list[tuple[int, int]] = []
    for i, clause in enumerate(formula_3cnf):
        if len(clause) != 3:
            raise ValueError("expected 3CNF")
        for lit in clause:
            v = (i, lit)
            vertices.append(v)
            adj[v] = set()

    for (i, lit1), (j, lit2) in combinations(vertices, 2):
        if i == j:
            continue
        if is_complementary(lit1, lit2):
            continue
        adj[(i, lit1)].add((j, lit2))
        adj[(j, lit2)].add((i, lit1))

    return adj, m


def has_clique_one_per_clause(adj: dict[tuple[int, int], set[tuple[int, int]]], formula_3cnf: CNF) -> bool:
    # brute force: choose 1 literal per clause
    choices = [list(clause) for clause in formula_3cnf]
    for picked_lits in product(*choices):
        vertices = [(i, picked_lits[i]) for i in range(len(picked_lits))]
        ok = True
        for u, v in combinations(vertices, 2):
            if v not in adj[u]:
                ok = False
                break
        if ok:
            return True
    return False


def random_3cnf(num_vars: int, num_clauses: int) -> CNF:
    out: CNF = []
    for _ in range(num_clauses):
        clause: list[int] = []
        for _ in range(3):
            v = random.randint(1, num_vars)
            clause.append(v if random.random() < 0.5 else -v)
        out.append(tuple(clause))
    return out


def check_3sat_to_clique_trials(trials: int = 200, seed: int = 0) -> None:
    random.seed(seed)
    for t in range(trials):
        n = random.randint(1, 6)
        m = random.randint(0, 7)
        f3 = random_3cnf(n, m)
        adj, k = three_sat_to_clique(f3)
        a = satisfiable(f3, n)
        b = has_clique_one_per_clause(adj, f3)
        if a != b:
            raise AssertionError((t, n, m, f3, a, b, k))


check_3sat_to_clique_trials()
print("OK: 3SAT ↔ CLIQUE на случайных малых тестах")


## 6.6. Ещё две NP‑полные задачи: INDEPENDENT SET и VERTEX COVER

**INDEPENDENT SET (IS).** Вход: неориентированный граф $G=(V,E)$ и число $k$. Вопрос: существует ли независимое множество вершин размера $\ge k$?

**VERTEX COVER (VC).** Вход: неориентированный граф $G=(V,E)$ и число $k$. Вопрос: существует ли вершинное покрытие размера $\le k$ (множество вершин, инцидентное каждому ребру)?

**Лемма 6.6.1.** $(G,k)\in\mathrm{CLIQUE}$ тогда и только тогда, когда $(\overline{G},k)\in\mathrm{IS}$, где $\overline{G}$ — дополнение графа $G$.

*Доказательство.* Подмножество $S\subseteq V$ — клика в $G$ тогда и только тогда, когда для любых двух различных вершин из $S$ есть ребро в $G$. Это эквивалентно тому, что для любых двух вершин из $S$ **нет** ребра в $\overline{G}$, то есть $S$ — независимое множество в $\overline{G}$. $\square$

**Лемма 6.6.2.** Для любого графа $G=(V,E)$ множество $S\subseteq V$ является независимым тогда и только тогда, когда $V\setminus S$ является вершинным покрытием.

*Доказательство.* Если $S$ независимое, то ни одно ребро не имеет оба конца в $S$, значит каждое ребро имеет хотя бы один конец в $V\setminus S$, то есть $V\setminus S$ — vertex cover. Обратно, если $C$ — vertex cover, то в $V\setminus C$ не может быть ребра (иначе оно было бы непокрыто), значит $V\setminus C$ — independent set. $\square$

**Следствие 6.6.3.** $(G,k)\in\mathrm{IS}$ тогда и только тогда, когда $(G,|V|-k)\in\mathrm{VC}$.

*Доказательство.* По Лемме 6.6.2 наличие независимого множества размера $\ge k$ эквивалентно наличию вершинного покрытия размера $\le |V|-k$. $\square$

**Лемма 6.6.4.** IS $\in\mathrm{NP}$ и VC $\in\mathrm{NP}$.

*Доказательство.* Сертификат для IS — список из $k$ вершин; проверка: нет ли ребра между любыми двумя вершинами из списка (или эквивалентно — что ни одно ребро не лежит внутри списка) за полиномиальное время. Сертификат для VC — список из $k$ вершин; проверка: каждое ребро имеет хотя бы один конец в списке за $O(|E|)$ времени. $\square$

**Следствие 6.6.5.** IS и VC NP‑полны.

*Доказательство.* CLIQUE NP‑полна (Следствие 6.5). По Лемме 6.6.1 имеем полиномиальную редукцию CLIQUE $\le_m^p$ IS (построение $\overline{G}$). По Следствию 6.6.3 имеем IS $\le_m^p$ VC. Вместе с Леммой 6.6.4 получаем NP‑полноту IS и VC. $\square$


In [None]:
from itertools import combinations
import random


Edge = tuple[int, int]  # always (u, v) with u < v


def random_graph(n: int, p: float = 0.5) -> set[Edge]:
    edges: set[Edge] = set()
    for u, v in combinations(range(n), 2):
        if random.random() < p:
            edges.add((u, v))
    return edges


def complement_graph(n: int, edges: set[Edge]) -> set[Edge]:
    comp: set[Edge] = set()
    for u, v in combinations(range(n), 2):
        if (u, v) not in edges:
            comp.add((u, v))
    return comp


def is_clique(vertices: tuple[int, ...], edges: set[Edge]) -> bool:
    for u, v in combinations(vertices, 2):
        a, b = (u, v) if u < v else (v, u)
        if (a, b) not in edges:
            return False
    return True


def is_independent(vertices: tuple[int, ...], edges: set[Edge]) -> bool:
    for u, v in combinations(vertices, 2):
        a, b = (u, v) if u < v else (v, u)
        if (a, b) in edges:
            return False
    return True


def is_vertex_cover(vertices: tuple[int, ...], edges: set[Edge]) -> bool:
    cover = set(vertices)
    for u, v in edges:
        if u not in cover and v not in cover:
            return False
    return True


def max_clique_size(n: int, edges: set[Edge]) -> int:
    best = 0
    for r in range(n + 1):
        for vs in combinations(range(n), r):
            if is_clique(vs, edges):
                best = r
    return best


def max_independent_size(n: int, edges: set[Edge]) -> int:
    best = 0
    for r in range(n + 1):
        for vs in combinations(range(n), r):
            if is_independent(vs, edges):
                best = r
    return best


def min_vertex_cover_size(n: int, edges: set[Edge]) -> int:
    for r in range(n + 1):
        for vs in combinations(range(n), r):
            if is_vertex_cover(vs, edges):
                return r
    raise RuntimeError("unreachable")


def check_clique_is_vc_trials(trials: int = 100, seed: int = 0) -> None:
    random.seed(seed)
    for t in range(trials):
        n = random.randint(1, 9)
        p = random.random()
        g = random_graph(n, p=p)
        gc = complement_graph(n, g)

        omega = max_clique_size(n, g)
        alpha_comp = max_independent_size(n, gc)
        assert omega == alpha_comp

        alpha = max_independent_size(n, g)
        tau = min_vertex_cover_size(n, g)
        assert tau == n - alpha

        # decision versions
        k = random.randint(0, n)
        assert (omega >= k) == (alpha_comp >= k)
        assert (alpha >= k) == (tau <= n - k)


check_clique_is_vc_trials()
print("OK: CLIQUE ↔ IS ↔ VC на случайных малых графах")


## 7. Три барьера: где «простые» идеи ломаются

Эти результаты не доказывают $\mathrm{P}\neq\mathrm{NP}$, но являются фильтром: они объясняют, почему многие правдоподобные идеи *не могут* решить задачу в общем виде.

### 7.1. Релятивизация (oracles)

**Определение (оракульная МТ).** Машина $M^A$ (с оракулом $A\subseteq\Sigma^\*$) имеет дополнительную *оракульную ленту* и *оракульное состояние*: записав строку $q$ на оракульную ленту и войдя в оракульное состояние, машина за один шаг получает ответ, верно ли $q\in A$.

Классы $\mathrm{P}^A,\mathrm{NP}^A$ определяются так же, как $\mathrm{P},\mathrm{NP}$, но для машин с доступом к $A$.

**Теорема (Baker–Gill–Solovay, 1975, цитируется; см. `resources/downloads/jkatz_relativization_2005.pdf`).** Существуют оракулы $A,B$ такие, что $\mathrm{P}^A=\mathrm{NP}^A$ и $\mathrm{P}^B\ne\mathrm{NP}^B$.

**Следствие (барьер).** Если бы существовало доказательство, которое одинаково работает при добавлении произвольного оракула (т.е. *релятивизирует*), то оно давало бы один и тот же ответ для всех $A$. Это невозможно из-за существования $A,B$ выше.

**Пример релятивизирующей техники.** «Голая» диагонализация и теоремы иерархий по времени/памяти обычно переносятся на оракульный мир почти без изменений: строится язык, который на диагонали «обманывает» все машины из класса, даже если у них есть доступ к $A$ (см. Arora–Impagliazzo–Vazirani 1992, `resources/downloads/arora_impagliazzo_vazirani_1992.pdf`).

**Что значит обойти.** Нужен нерелятивизирующий аргумент: такой, который использует структуру вычислений, исчезающую/ломающуюся при добавлении произвольного оракула (типичный пример семейства идей — аритметизация и интерактивные протоколы).


### 7.2. Natural proofs

Барьер Razborov–Rudich формализует, почему «типичные» методы нижних оценок на схемы не расширяются до общего случая.

Рассматривается неравномерная модель схем: $\mathrm{P/poly}$ — языки, распознаваемые семейством булевых схем полиномиального размера.

**Определение (natural property, грубо).** Свойство $\mathcal{P}$ булевых функций (по их таблице истинности) называется *естественным* против класса схем $\mathcal{C}$, если оно удовлетворяет трём условиям:

1) *(Конструктивность)* по таблице истинности функции на $n$ битах можно проверить принадлежность $\mathcal{P}$ за время $\mathrm{poly}(2^n)$;
2) *(Большинство / largeness)* случайная булева функция удовлетворяет $\mathcal{P}$ с заметной вероятностью (обычно $\ge 2^{-O(n)}$);
3) *(Полезность / usefulness)* если функция удовлетворяет $\mathcal{P}$, то она не вычисляется схемами из $\mathcal{C}$ (например, размера $n^k$).

**Теорема (Razborov–Rudich, 1997, цитируется; PDF: `resources/downloads/razborov_rudich_1997.pdf`).** Если существуют псевдослучайные функции (PRF) полиномиального размера схем, то не существует естественного свойства, полезного против $\mathrm{P/poly}$.

**Интуиция.** Естественное свойство, которое отделяет «случайные» функции от функций из $\mathrm{P/poly}$, можно превратить в различитель PRF от истинного рандома — что противоречит псевдослучайности.

**Пример «естественности».** Многие известные нижние оценки для ограниченных классов (AC⁰, монотонные схемы и т.п.) задают свойства, которые (а) проверяются по таблице истинности и (б) выполняются для большой доли функций. Барьер говорит, что такой шаблон не должен дать сильных нижних оценок для общего $\mathrm{P/poly}$ при стандартных криптодопущениях.

**Что значит обойти.** Нужно нарушить хотя бы одно из условий: строить «ненатуральное» свойство (небольшое множество функций), или отказаться от конструктивности, или использовать допущения/структуру, которые не приводят к различению PRF.

### 7.3. Algebrization

Aaronson–Wigderson (2008/2009) предложили усиление релятивизации (PDF: `resources/downloads/aaronson_wigderson_2008.pdf`).

**Идея.** В ряде нерелятивизирующих доказательств (например, через *аритметизацию*) мы заменяем булеву функцию её полиномиальным продолжением над полем и работаем с многочленами. Algebrization формализует класс методов, которые остаются корректными даже если машинам дать доступ не только к булевому оракулу $A$, но и к его «алгебраическому» (низкостепенному) расширению.

**Результат (барьер, неформально).** Существуют алгебризующие оракулы, при которых ключевые разделения и включения принимают противоположные значения (аналогично BGS), поэтому методы, которые *алгебризируют*, не способны решить ряд центральных вопросов (в частности, тех, где одних «оракульных» рассуждений недостаточно).

**Что значит обойти.** Нужны техники, которые не сохраняются при переходе к алгебраическому расширению оракула; грубо говоря, требуется ещё более «структурный» аргумент, чем просто нерелятивизирующий.

**Свежий пример барьера.** Chen–Hu–Ren (2025, arXiv:2511.14038) усиливают алгебризационные барьеры для схемных нижних оценок через коммуникационную сложность XOR-Missing-String (см. `resources/downloads/chen_hu_ren_2025_algebrization_barriers.pdf`).


## 8. Линии атаки (выбрать одну и углублять)

1) **Схемная сложность:** нижние оценки на размер/глубину схем для явных функций (SAT/CLIQUE и т.д.).
2) **Proof complexity:** нижние оценки на длину доказательств (связь с NP vs coNP).
3) **Hardness vs Randomness / дерэндомизация:** эквивалентности между нижними оценками и псевдослучайностью.
4) **Алгебраическая сложность (VP vs VNP):** иногда техника переносится лучше.
Статус VP≠VNP: см. Sec. 9 (определения и примеры).
Примеры (det/perm) — тоже в Sec. 9.
Глоссарий: булевые схемы работают над {0,1} с AND/OR/NOT, алгебраические — над полем с $+$/$	imes$. 
Кратко: VP — семейства многочленов, вычислимые полиномиальными алгебраическими схемами; VNP — «NP‑аналоги» по Валианту (полиномиальные суммы от VP).
Обзор: Bläser–Ikenmeyer 2025 (GCT intro), `resources/downloads/blaser_ikenmeyer_2025_gct_intro.pdf`; первоисточник VP/VNP: Valiant 1979 (см. Bürgisser 2024, `resources/downloads/burgisser_2024_valiant_overview.pdf`).
5) **IPS / алгебраические proof systems:** алгебраические сертификаты; суперполиномиальные нижние оценки IPS ⇒ VP≠VNP (см. Sec. 15.7).
Замечание: EF — булевы доказательства, IPS — алгебраический аналог (см. Sec. 15.7).

**Выбранная линия (текущая): proof complexity.** Цель — понять, где именно “упираются” стандартные системы доказательств и как это связано с $\mathrm{NP}$ vs $\mathrm{coNP}$.
Конкретный открытый таргет: показать, что $\mathrm{EF}+tt(h_{0,n},2^{n/4},t(n))$ не p‑bounded (см. Sec. 15.7).

Минимальная цель (выполнено в Sec. 15): зафиксировать определения (proof system/резолюция), выписать $\mathrm{PHP}$ и проверить на малых $n$, **полностью доказать** экспоненциальную нижнюю оценку для резолюции на $\mathrm{PHP}$ (Теорема 15.2).

Следующий шаг:
- зафиксировать минимальные факты о сильных системах (PHP легко в Frege/CP, трудно в AC⁰‑Frege) и затем фокусироваться на EF‑нижних оценках из Sec. 15.7.

**Карта импликаций (аккуратно).**
- Полиномиально ограниченная proof system для TAUT ⇒ $\mathrm{NP}=\mathrm{coNP}$ (Лемма 15.1); это само по себе не решает $\mathrm{P}$ vs $\mathrm{NP}$.
- Для вывода $\mathrm{P}\ne\mathrm{NP}$ через proof complexity достаточно $\mathrm{NP}\ne\mathrm{coNP}$; эквивалентно: для **каждой** proof system существуют тавтологии, требующие суперполиномиальных доказательств.
- Если существует p-оптимальная система (p-симулирует все остальные; это открыто) и для неё получены суперполиномиальные нижние оценки, то $\mathrm{NP}\ne\mathrm{coNP}$.
- Условные результаты (Pich–Santhanam 2023): определённые EF-нижние оценки + предпосылки о доказуемости в $\mathrm{S}^1_2$ ⇒ $\mathrm{P}\ne\mathrm{NP}$.
- Различие уровней и совет: $\mathrm{SIZE}$/$\mathrm{P/poly}$ — неравномерные (сильнее), а $\mathrm{Time}[n^k]/u(n)$ — равномерные с ограниченным советом; меньший $u(n)$ усиливает равномерный результат (крайний случай $u(n)=0$), а $\mathrm{P/poly}\approx\mathrm{Time}[n^{O(1)}]/n^{O(1)}$. Cor. 2 даёт переход к равномерным нижним оценкам при фиксированном $u(n)$ (см. Sec. 15.7).


## 9. Схемная сложность: базовые определения
См. также алгебраический аналог (IPS) и связь с VP vs VNP в Sec. 15.7.
IPS работает с алгебраическими схемами (многочлены), а не с булевыми схемами.
Замечание: в алгебраических схемах размер считают по числу операций $+$/$	imes$, в булевых — по числу логических элементов.
Мини‑определения (алгебраические классы): VP — семейства полиномов p‑ограниченной степени, вычислимые полиномиальными алгебраическими схемами; VNP — семейства вида $f_n(x)=\sum_{y\in\{0,1\}^{m(n)}} g_n(x,y)$ с $g_n\in\mathrm{VP}$ и $m(n)=\mathrm{poly}(n)$ (Валиант).
Фиксируем поле $\mathbb{F}$ (например, $\mathbb{Q}$ или $\mathbb{F}_p$): определения VP/VNP зависят от выбранного поля.
Примеры/эталон: $\det$ в VP, $\mathrm{perm}$ VNP‑полон (Valiant 1979; обзор: Bürgisser 2024).
Статус: VP≠VNP — открытая проблема (алгебраический аналог P≠NP).
См. обзор: Bürgisser 2024, `resources/downloads/burgisser_2024_valiant_overview.pdf`.

Здесь фиксируем минимальный язык для разговоров о нижних оценках на булевые схемы.

**Булева функция/семейство.** Рассматриваем семейство $f=\{f_n\}_{n\ge 1}$, где $f_n:\{0,1\}^n\to\{0,1\}$.

**Схема (circuit).** Булева схема $C$ — ориентированный ациклический граф с входами $x_1,\dots,x_n$ и элементами AND/OR/NOT, вычисляющий булеву функцию.

**Размер** $|C|$ — число логических элементов; **глубина** $\mathrm{depth}(C)$ — длина максимального пути от входа до выхода.

**Неограниченный fan-in.** В моделях AC⁰ разрешаем AND/OR с произвольным числом входов (unbounded fan-in). Отрицания удобно считать стоящими только на входах (проталкивание NOT по законам де Моргана сохраняет постоянную глубину с увеличением глубины на константу).

**Класс P/poly (неформально).** Язык в $\mathrm{P/poly}$, если существует семейство булевых схем полиномиального размера, вычисляющих его, или эквивалентно: существует детерминированный полиномиальный алгоритм с полиномиальным советом $a_n$ длины $n^{O(1)}$, зависящим только от $n$.

**Обозначение (SIZE).** $\mathrm{SIZE}(s(n))$ — языки, распознаваемые семейством булевых схем размера $O(s(n))$ (неравномерно).

**Обозначение (Circuit).** $\mathrm{Circuit}(s(n))$ — тот же класс, что $\mathrm{SIZE}(s(n))$.
Используется взаимозаменяемо с $\mathrm{SIZE}(s)$ (см. Sec. 15.7, Cor. 2).

См. Sec. 8 и Sec. 15.7 (Cor. 2) для связи с нижними оценками.

**Определение (Time[n^k]/u(n), грубо).** Это классы языков, решаемых детерминированными алгоритмами за $O(n^k)$ с советом длины $u(n)$, зависящим только от $n$.

См. Sec. 15.7 (Cor. 2) для последствий по SAT и схеме $w_{n,k,u}(f)$.

**Класс AC⁰.** Семейство $f$ лежит в AC⁰, если существует константа $d$ и семейство схем $\{C_n\}$ такое, что $\mathrm{depth}(C_n)\le d$, размер $|C_n|\le n^{O(1)}$, и $C_n(x)=f_n(x)$ для всех $x\in\{0,1\}^n$.

**DNF/CNF как частный случай.** DNF — схема глубины 2 вида OR от AND‑термов; CNF — AND от OR‑клауз.

Задача схемных нижних оценок: доказать, что для явного семейства функций (например, SAT/CLIQUE/PARITY) *любой* представитель из выбранного класса должен иметь большой размер/глубину.

**Монотонные схемы.** Функция $f$ монотонна, если $x\le x'$ покоординатно влечёт $f(x)\le f(x')$. Для монотонной $f$ рассмотрим схемы без NOT (только AND/OR); минимальный размер обозначим $L_f^+$. Очевидно $L_f\le L_f^+$.

**Теорема 9.1 (Razborov, 1985, цитируется).** Пусть $f_{m,s}$ — функция на $n_m=\binom m2$ битах, равная 1 тогда и только тогда, когда граф на $m$ вершинах содержит клику размера $\ge s$. Тогда:

- при $s=\lfloor \tfrac14\ln m\rfloor$ имеем $L_{f_{m,s}}^+\ge m^{C\log m}$ для некоторой константы $C>0$;
- при фиксированном $s$ имеем $L_{f_{m,s}}^+\ge \Omega\big(m^s/(\log m)^{2s}\big)$.

Замечание: это нижняя оценка именно в **монотонной** модели (без NOT) и потому сама по себе не даёт нижних оценок для общих булевых схем.

**Современный контекст.** Grewal-Kumar (2024) показывают, что ряд AC^0[p]-нижних оценок переносится на расширенный класс GC^0[p], давая экспоненциальные нижние оценки для MAJ.


## 10. Полная нижняя оценка в глубине 2: PARITY

Определим $\mathrm{PARITY}_n(x_1,\dots,x_n)=x_1\oplus\cdots\oplus x_n$ (значение 1 тогда и только тогда, когда число единиц нечётно).

**Определение (терм).** Терм $T$ — конъюнкция литералов, в которой каждая переменная встречается не более одного раза: $T=\bigwedge_{i\in S} \ell_i$, где $\ell_i\in\{x_i,\neg x_i\}$. Множество входов, удовлетворяющих $T$, — подкуб, полученный фиксацией переменных из $S$.

**Лемма 10.1.** Если терм $T$ не фиксирует хотя бы одну переменную (то есть $S\ne\{1,\dots,n\}$), то на множестве входов, удовлетворяющих $T$, функция $\mathrm{PARITY}_n$ не является константой.

*Доказательство.* Пусть $j\notin S$ — свободная переменная. Возьмём любой вход $a$, удовлетворяющий $T$, и вход $a'$, полученный из $a$ инверсией только $x_j$. Тогда $a'$ тоже удовлетворяет $T$, но $\mathrm{PARITY}_n(a')=1-\mathrm{PARITY}_n(a)$ (так как меняется ровно один бит). Значит, на $T^{-1}(1)$ значения паритета не константны. $\square$

**Лемма 10.2.** Для $n\ge 1$ множество $\mathrm{PARITY}_n^{-1}(1)$ имеет размер $2^{n-1}$.

*Доказательство.* Отображение $\phi(x_1,\dots,x_n)=(1-x_1,x_2,\dots,x_n)$ — биекция на $\{0,1\}^n$, которая меняет паритет (переворачивает ровно один бит). Значит она взаимно-однозначно сопоставляет входы с паритетом 0 и входы с паритетом 1, а вместе их $2^n$, следовательно, каждого вида ровно $2^{n-1}$. $\square$

**Теорема 10.3.** Любая DNF‑формула, вычисляющая $\mathrm{PARITY}_n$, содержит как минимум $2^{n-1}$ термов. Аналогично, любая CNF‑формула для $\mathrm{PARITY}_n$ содержит как минимум $2^{n-1}$ клауз.

*Доказательство (DNF).* Пусть $F=\bigvee_{r=1}^m T_r$ — DNF, вычисляющая $\mathrm{PARITY}_n$. Для любого $r$ множество $T_r^{-1}(1)$ должно лежать внутри $\mathrm{PARITY}_n^{-1}(1)$, иначе существовал бы вход, где $T_r=1$ но паритет 0, и тогда $F$ ошибается.

По Лемме 10.1 это возможно лишь если каждый $T_r$ фиксирует все переменные, то есть $T_r^{-1}(1)$ состоит ровно из одного входа (минтерм).

Значит каждый терм покрывает не более одного входа из $\mathrm{PARITY}_n^{-1}(1)$. По Лемме 10.2 таких входов $2^{n-1}$, следовательно $m\ge 2^{n-1}$.

*Доказательство (CNF).* Если $G$ — CNF для $\mathrm{PARITY}_n$, то $\neg G$ — DNF для $\neg\mathrm{PARITY}_n$ (проталкиваем отрицания и применяем де Моргана). Поскольку $\neg\mathrm{PARITY}_n$ также имеет ровно $2^{n-1}$ единиц, применяем DNF‑часть к $\neg\mathrm{PARITY}_n$ и получаем, что $\neg G$ имеет $\ge 2^{n-1}$ термов, а значит $G$ имеет $\ge 2^{n-1}$ клауз.

$\square$


In [None]:
from itertools import product


def parity(bits: tuple[int, ...]) -> int:
    return sum(bits) % 2


def check_parity_subcubes(nmax: int = 10) -> None:
    for n in range(1, nmax + 1):
        ones = sum(parity(bits) == 1 for bits in product([0, 1], repeat=n))
        assert ones == 2 ** (n - 1)

        # Verify Lemma 10.1 on all nontrivial subcubes represented by partial assignments.
        # partial[i] in {0, 1, None}, where None means "free".
        for partial in product([0, 1, None], repeat=n):
            if None not in partial:
                continue
            j = partial.index(None)
            base = [0 if v is None else v for v in partial]
            b1 = tuple(base)
            base[j] ^= 1
            b2 = tuple(base)
            assert parity(b1) != parity(b2)

        print(f"n={n}: OK (|PARITY^-1(1)|={ones}, all nontrivial subcubes bichromatic)")


check_parity_subcubes(10)


## 11. От глубины 2 к AC⁰: switching lemma (цитируется) → PARITY ∉ AC⁰

Нижняя оценка из Раздела 10 относится к глубине 2 (DNF/CNF). Для произвольной постоянной глубины $d$ ключевой инструмент — переключательная лемма Хастада. Здесь фиксируем формальный «скелет» доказательства: какие определения/леммы нужны и где именно применяется switching lemma.

### 11.0. Ограничения и decision trees

**Определение (ограничение).** Ограничение $\rho$ на переменные $x_1,\dots,x_n$ — это вектор из $\{0,1,*\}^n$. Координата $\rho_i\in\{0,1\}$ означает фиксацию $x_i=\rho_i$, а $\rho_i=*\,$ означает «свободно». Обозначим через $m(\rho)$ число свободных переменных.

Для булевой функции $f:\{0,1\}^n\to\{0,1\}$ ограниченная функция $f\upharpoonright\rho$ получается подстановкой фиксированных значений и рассматривается как функция от $m(\rho)$ свободных переменных.

**Определение (decision tree).** Decision tree для $f$ — адаптивный алгоритм, который на входе $x$ последовательно запрашивает значения отдельных $x_i$ и в листе выдаёт 0/1. *Глубина* — максимальное число запросов на пути корень→лист. Обозначим минимальную возможную глубину через $\mathrm{DT}(f)$.

**Факт 11.6.** Если $\mathrm{DT}(f)\le d$, то $f$ имеет DNF ширины $\le d$ и CNF ширины $\le d$.

*Доказательство.* Возьмём decision tree глубины $d$ для $f$. Каждый путь, ведущий к листу со значением 1, задаёт терм (конъюнкцию запрошенных литералов) длины $\le d$; OR всех таких термов вычисляет $f$, давая DNF ширины $\le d$. Для CNF применяем тот же аргумент к $\neg f$ и затем де Моргана. $\square$

### 11.1. PARITY под ограничениями (полное доказательство)

**Лемма 11.3.** Для любого ограничения $\rho$ функция $\mathrm{PARITY}_n\upharpoonright\rho$ равна $\mathrm{PARITY}_{m(\rho)}$ или $\neg\mathrm{PARITY}_{m(\rho)}$ (то есть $\mathrm{PARITY}_{m(\rho)}\oplus c$ для некоторой константы $c\in\{0,1\}$).

*Доказательство.* Паритет есть XOR всех битов. После подстановки фиксированных переменных их вклад становится константой $c\in\{0,1\}$, а оставшиеся $m(\rho)$ свободных переменных остаются под XOR. Значит $\mathrm{PARITY}_n\upharpoonright\rho = \mathrm{PARITY}_{m(\rho)}\oplus c$; при $c=0$ это паритет, при $c=1$ — его отрицание. $\square$

### 11.2. PARITY требует полной decision-tree глубины (полное доказательство)

**Лемма 11.4.** $\mathrm{DT}(\mathrm{PARITY}_m)=m$.

*Доказательство.* Верхняя оценка $\le m$ очевидна: запросить все $m$ переменных и вычислить XOR.

Для нижней оценки предположим, что существует decision tree глубины $<m$, вычисляющее $\mathrm{PARITY}_m$. Тогда на любом пути к листу запрашивается $<m$ переменных, значит в листе остаётся хотя бы одна свободная переменная. Но лист соответствует подкубу, заданному фиксацией запрошенных переменных, и по Лемме 10.1 паритет на таком подкубе не может быть константой, тогда как decision tree в листе выдаёт константу. Противоречие. $\square$

**Следствие 11.5.** Для любого $\rho$ с $m(\rho)=m$ имеем $\mathrm{DT}(\mathrm{PARITY}_n\upharpoonright\rho)=m$ (в частности, если $m\ge 1$, то $\mathrm{PARITY}_n\upharpoonright\rho$ не константа).

*Доказательство.* По Лемме 11.3 ограничение паритета — это $\mathrm{PARITY}_m$ или $\neg\mathrm{PARITY}_m$, а инверсия выхода не меняет decision-tree глубину. Применяем Лемму 11.4. $\square$

### 11.3. Switching lemma → PARITY $\notin$ AC⁰

Далее даём доказательство Теоремы 11.2, принимая switching lemma (Теорема 11.1).

**Теорема 11.1 (Håstad switching lemma, цитируется; форма с явными константами).** Пусть $F$ — DNF (или CNF) ширины не более $w$ над $n$ переменными. Пусть $\rho$ — случайное ограничение, выбираемое равномерно среди ограничений с ровно $s=\sigma n$ свободными переменными, где $\sigma\le 1/5$. Тогда для любого $t\le s$
$$\Pr\big[\mathrm{DT}(F\upharpoonright\rho)>t\big] \le (10\sigma w)^t.$$

Источник: O’Donnell, Lecture 14 (The Switching Lemma), Theorem 1.8; исходный результат — Håstad (1986).

**Теорема 11.2 (PARITY $\notin$ AC⁰, доказательство при Теореме 11.1).** Для любого фиксированного $k\ge 2$ любая глубины-$k$ AC⁰‑схема, вычисляющая $\mathrm{PARITY}_n$, имеет размер $S\ge 2^{\Omega(n^{1/(k-1)})}$.

*Доказательство.* Пусть $C$ — глубины-$k$ схема размера $S$, вычисляющая $\mathrm{PARITY}_n$.

1) *(Нормализация, цитируется.)* Можно считать, что схема «слоистая» (уровни чередуют AND/OR), входы — литералы, а fan-out равен 1 (формула). При фиксированном $k$ это увеличивает размер лишь до $S^{O(1)}$; переобозначим его снова через $S$.

2) Положим $w:=20\log_2 S$. Далее (также стандартно) сведёмся к случаю, когда fan-in всех нижних гейтов не превосходит $w$; это делается дополнительным случайным ограничением, которое с положительной вероятностью убивает все нижние гейты ширины $>w$ (см. O’Donnell, Lecture 14, конец доказательства Теоремы 3.1). Снова переобозначим полученную схему через $C$.

3) Предположим без потери общности, что нижний слой — AND. Тогда каждый гейт следующего слоя вычисляет DNF ширины $\le w$.

Возьмём $\sigma:=1/(20w)$ и применим случайное ограничение $\rho_1$ с ровно $\sigma n$ свободными переменными. По Теореме 11.1 для фиксированного такого DNF вероятность события $\mathrm{DT}(\cdot)>w$ не превосходит $(10\sigma w)^w=(1/2)^w=S^{-20}$.

По объединённой оценке (union bound) по всем $\le S$ гейтам этого слоя существует ограничение $\rho_1$, при котором *каждый* из них после ограничения имеет $\mathrm{DT}\le w$. По Факту 11.6 каждый такой гейт эквивалентен CNF ширины $\le w$, и потому два соседних слоя схемы становятся одного типа и могут быть слиты. В результате получаем схему глубины $k-1$ с тем же ограничением fan-in $\le w$ на нижнем уровне.

4) Повторяем шаг (3) ещё $k-3$ раза (каждый раз оставляя долю $\sigma$ свободных переменных). Пусть $\rho$ — композиция полученных ограничений. Через $k-2$ таких шагов получаем глубину 2 и число свободных переменных
$$m := n\cdot \sigma^{k-2} = \frac{n}{(20w)^{k-2}} = \frac{n}{(400\log_2 S)^{k-2}}.$$

По Лемме 11.3 ограничение $\mathrm{PARITY}_n\upharpoonright\rho$ — это $\mathrm{PARITY}_m$ или его отрицание.

5) Но по Теореме 10.3 любая глубины‑2 DNF/CNF для $\mathrm{PARITY}_m$ требует размера $\ge 2^{m-1}$. Размер нашей формулы после ограничений не превосходит $S$, значит $S\ge 2^{m-1}$ и, следовательно, $m=O(\log S)$.

Подставляя $m=\Theta\big(n/(\log S)^{k-2}\big)$, получаем $(\log S)^{k-1}=\Omega(n)$, то есть $\log S=\Omega(n^{1/(k-1)})$. Следовательно, $S\ge 2^{\Omega(n^{1/(k-1)})}$. $\square$

**Цель на продолжение:** либо выписать доказательство Теоремы 11.1 (switching lemma), либо зафиксировать одну выбранную ссылку как «доверенную» и дальше двигаться к другим моделям/функциям.


## 12. Иерархия по времени: диагонализация (полное доказательство)

Этот раздел нужен как «калибровка»: мы докажем строгий результат о разделении классов по времени и явно увидим, что доказательство **релятивизирует** (см. барьер Baker–Gill–Solovay).

**Определение (time-constructible).** Функция $t:\mathbb{N}\to\mathbb{N}$ называется *времени‑конструируемой*, если существует детерминированная МТ $T$ такая, что на входе $1^n$ она останавливается ровно через $t(n)$ шагов (или, эквивалентно, может выписать $t(n)$ в унарном виде за $O(t(n))$ времени).

**Лемма 12.1 (универсальная симуляция, цитируется).** Существует универсальная детерминированная многоленточная МТ $U$, которая по входу $(\langle M\rangle, x, 1^s)$ симулирует работу детерминированной МТ $M$ на $x$ в течение $s$ шагов и останавливается за $O(s\log s)$ шагов.

*Комментарий.* Этот лог‑фактор — стандартная плата за универсальность (кодирование переходов, адресация лент и т.п.). Для целей иерархии он допустим.

**Определение (диагональный язык).** Зафиксируем кодирование, которое каждому слову $y\in\{0,1\}^\*$ сопоставляет детерминированную МТ $M_y$ (если $y$ некорректен как код, считаем $M_y$ машиной, которая всегда отвергает).

Для time-constructible $t$ определим язык
$$L_t:=\{y:\ M_y(y)\ \text{не принимает за}\ \le t(|y|)\ \text{шагов}\}.$$

**Теорема 12.2 (Deterministic Time Hierarchy).** Пусть $t(n)\ge n$ — time-constructible. Тогда
$$\mathrm{TIME}(t(n))\subsetneq\mathrm{TIME}(t(n)\log t(n)).$$

*Доказательство.*

1) Покажем, что $L_t\in\mathrm{TIME}(t(n)\log t(n))$. Алгоритм $A$ на входе $y$ длины $n$:

- с помощью машины‑«часов» (существует по time-constructible) получаем лимит $t(n)$;
- запускаем универсальную симуляцию $U(\langle M_y\rangle, y, 1^{t(n)})$;
- если симуляция обнаружила принятие за $\le t(n)$ шагов — отвергаем, иначе принимаем.

По Лемме 12.1 симуляция занимает $O(t(n)\log t(n))$ времени, остальная работа доминируемо меньше, значит $A$ укладывается в $O(t(n)\log t(n))$.

2) Покажем, что $L_t\notin\mathrm{TIME}(t(n))$. Предположим противное: существует детерминированная МТ $D$, которая решает $L_t$ за $\le t(n)$ шагов на входах длины $n$.

Рассмотрим вход $y:=\langle D\rangle$ (код самой $D$). Так как $D$ решает $L_t$, имеем:

- если $D(y)$ принимает, то $y\in L_t$, то есть по определению $M_y(y)=D(y)$ **не** принимает за $\le t(|y|)$ шагов — противоречие;
- если $D(y)$ отвергает, то $y\notin L_t$, то есть $D(y)$ принимает за $\le t(|y|)$ шагов — противоречие.

Следовательно, такого $D$ не существует и $L_t\notin\mathrm{TIME}(t(n))$.

Из пункта (1) и (2) следует строгость включения. $\square$

**Замечание 12.3 (релятивизация).** Это доказательство переносится почти дословно в оракульный мир: для любого оракула $A$ верно $\mathrm{TIME}^A(t)\subsetneq\mathrm{TIME}^A(t\log t)$. Поэтому оно не может напрямую решить $\mathrm{P}$ vs $\mathrm{NP}$ из-за существования оракулов $A,B$ с противоположными ответами.

**Следствие 12.4.** $\mathrm{P}\subsetneq\mathrm{EXP}$.

*Доказательство.* Сначала отметим, что $\mathrm{P}\subseteq\mathrm{TIME}(2^n)$: любая функция $n^k$ в конце концов не превосходит $2^n$, значит $\bigcup_k\mathrm{TIME}(n^k)\subseteq\mathrm{TIME}(2^n)$.

Применим Теорему 12.2 к $t(n)=2^n$ (она time-constructible). Получаем язык $L\in\mathrm{TIME}(2^n\cdot n)\setminus\mathrm{TIME}(2^n)$. Тогда $L\notin\mathrm{P}$, так как $\mathrm{P}\subseteq\mathrm{TIME}(2^n)$. При этом $\mathrm{TIME}(2^n\cdot n)\subseteq\mathrm{EXP}$. Значит $\mathrm{P}\subsetneq\mathrm{EXP}$. $\square$


## 13. Теорема Сэвича: NSPACE ⊆ SPACE (полное доказательство)

**Определение (SPACE/NSPACE).** Для функции $s(n)$ класс $\mathrm{SPACE}(s(n))$ — языки, решаемые детерминированной МТ, использующей $O(s(n))$ рабочих ячеек на входе длины $n$. Аналогично $\mathrm{NSPACE}(s(n))$ — для недетерминированной МТ.

Рабочая память не включает входную ленту (вход только читается).

**Теорема 13.1 (Savitch).** Для любой $s(n)\ge \log n$ верно
$$\mathrm{NSPACE}(s(n))\subseteq\mathrm{SPACE}(s(n)^2).$$

*Доказательство.* Пусть язык $L$ распознаётся недетерминированной МТ $N$ с использованием $s(n)$ памяти. Зафиксируем вход $x$ длины $n$.

Рассмотрим **граф конфигураций** $G_x$: вершины — конфигурации $N$ на входе $x$ (содержимое рабочих лент, позиции головок, состояние), а ребро $c\to c'$ существует, если $N$ может за один шаг перейти из $c$ в $c'$.

Так как память ограничена $s(n)$, длина описания конфигурации равна $O(s(n))$, а число конфигураций ограничено
$$|V(G_x)|\le 2^{O(s(n))}=:M.$$

Вход $x$ принимается тогда и только тогда, когда в $G_x$ существует путь из стартовой конфигурации $c_{\mathrm{start}}$ в некоторую принимающую конфигурацию $c_{\mathrm{acc}}$.

Ключевой подалгоритм — процедура $\mathrm{REACH}(c_1,c_2,\ell)$: существует ли путь из $c_1$ в $c_2$ длины $\le \ell$.

- База: $\ell=0$ — ответ «да» тогда и только тогда, когда $c_1=c_2$.
- Переход: для $\ell>0$ положим $m=\lceil \ell/2\rceil$ и проверим
$$\exists c\in V(G_x):\ \mathrm{REACH}(c_1,c,m)\ \wedge\ \mathrm{REACH}(c,c_2,m).$$

Если путь длины $\le \ell$ существует, то на его середине есть вершина $c$, разбивающая путь на две части длины $\le m$. Обратно, если существуют обе половины, их конкатенация даёт путь длины $\le 2m\ge\ell$.

Чтобы решить достижимость в $G_x$, достаточно проверить $\mathrm{REACH}(c_{\mathrm{start}},c_{\mathrm{acc}},M)$ для всех $c_{\mathrm{acc}}$.

**Оценка памяти.** Одна конфигурация кодируется $O(s(n))$ битами. В каждом рекурсивном вызове храним $(c_1,c_2,\ell)$ и текущего кандидата $c$ — это $O(s(n))$ памяти. Глубина рекурсии равна $O(\log M)=O(s(n))$, значит суммарная память $O(s(n)\cdot s(n))=O(s(n)^2)$.

Таким образом, достижимость в $G_x$ решается детерминированно в $O(s(n)^2)$ памяти, и значит $L\in\mathrm{SPACE}(s(n)^2)$. $\square$

**Следствие 13.2.** $\mathrm{NPSPACE}=\mathrm{PSPACE}$.

*Доказательство.* Очевидно $\mathrm{PSPACE}\subseteq\mathrm{NPSPACE}$. Обратно, применяем Теорему 13.1 к $s(n)=n^k$ и получаем $\mathrm{NPSPACE}\subseteq\mathrm{PSPACE}$. $\square$

**Следствие 13.3.** $\mathrm{NP}\subseteq\mathrm{PSPACE}$.

*Доказательство.* $\mathrm{NP}\subseteq\mathrm{NPSPACE}$ (недетерминированное полиномиальное время использует не больше полиномиальной памяти), а затем Следствие 13.2. $\square$


In [None]:
from __future__ import annotations

from functools import lru_cache
from collections import deque
from itertools import combinations
import math
import random


def savitch_reachable(n: int, edges: set[tuple[int, int]], s: int, t: int) -> bool:
    adj = {i: set() for i in range(n)}
    for u, v in edges:
        adj[u].add(v)

    # any reachable pair has a simple path of length ≤ n-1
    L = max(1, n - 1)
    k = math.ceil(math.log2(L))

    @lru_cache(maxsize=None)
    def reach(u: int, v: int, kk: int) -> bool:
        if kk == 0:
            return u == v or (v in adj[u])
        for m in range(n):
            if reach(u, m, kk - 1) and reach(m, v, kk - 1):
                return True
        return False

    return reach(s, t, k)


def bfs_reachable(n: int, edges: set[tuple[int, int]], s: int, t: int) -> bool:
    adj = {i: set() for i in range(n)}
    for u, v in edges:
        adj[u].add(v)

    q = deque([s])
    seen = {s}
    while q:
        u = q.popleft()
        if u == t:
            return True
        for v in adj[u]:
            if v not in seen:
                seen.add(v)
                q.append(v)
    return False


def random_digraph(n: int, p: float) -> set[tuple[int, int]]:
    edges: set[tuple[int, int]] = set()
    for u in range(n):
        for v in range(n):
            if u == v:
                continue
            if random.random() < p:
                edges.add((u, v))
    return edges


def check_savitch_trials(trials: int = 100, seed: int = 0) -> None:
    random.seed(seed)
    for _ in range(trials):
        n = random.randint(1, 9)
        p = random.random() * 0.6
        edges = random_digraph(n, p)
        s = random.randrange(n)
        t = random.randrange(n)
        a = savitch_reachable(n, edges, s, t)
        b = bfs_reachable(n, edges, s, t)
        assert a == b


check_savitch_trials()
print("OK: Savitch-REACH совпадает с BFS на малых случайных графах")


## 14. Полиномиальная иерархия (PH): определения и базовые коллапсы

Полиномиальная иерархия — это «надстройка» над NP/coNP, получающаяся из чередования кванторов (или эквивалентно — из оракульных машин).

### 14.1. Определения через оракулы

Напомним: в оракульной модели машина может за один шаг спрашивать принадлежность строки оракулу.

**Определение.** Положим $\Sigma_0^p=\Pi_0^p:=\mathrm{P}$. Для $k\ge 0$ определим рекурсивно:

- $\Sigma_{k+1}^p := \mathrm{NP}^{\Sigma_k^p}$,
- $\Pi_{k+1}^p := \mathrm{coNP}^{\Sigma_k^p}$,
- $\mathrm{PH} := \bigcup_{k\ge 0} \Sigma_k^p$.

**Лемма 14.1.** $\Sigma_1^p=\mathrm{NP}$ и $\Pi_1^p=\mathrm{coNP}$.

*Доказательство.* По определению $\Sigma_1^p=\mathrm{NP}^{\Sigma_0^p}=\mathrm{NP}^{\mathrm{P}}$. Покажем, что $\mathrm{NP}^{\mathrm{P}}=\mathrm{NP}$: оракульная NP‑машина делает полиномиально много запросов к оракулу из $\mathrm{P}$ и работает полиномиальное время. Каждый запрос можно вычислить детерминированно за полиномиальное время «внутри» той же ветви недетерминированного вычисления, поэтому суммарное время остаётся полиномиальным; значит $\mathrm{NP}^{\mathrm{P}}\subseteq\mathrm{NP}$. Обратное включение тривиально (не делать запросов). Аналогично $\Pi_1^p=\mathrm{coNP}^{\mathrm{P}}=\mathrm{coNP}$. $\square$

### 14.2. Кванторная характеристика (для дальнейших доказательств)

Эквивалентно оракульному определению, уровни PH можно задавать через фиксированное число чередований кванторов над полиномиально проверяемым предикатом.

**Определение (кванторная форма).** Язык $L$ принадлежит $\Sigma_k^p$ (для $k\ge 1$), если существует полином $p$ и детерминированная полиномиальная машина $V$ такие, что
$$x\in L \iff \exists y_1\in\{0,1\}^{p(|x|)}\ \forall y_2\in\{0,1\}^{p(|x|)}\ \exists y_3\cdots Q_k y_k:\ V(x,y_1,\dots,y_k)=1,$$
где кванторы чередуются и $Q_k$ равен $\exists$ при нечётном $k$ и $\forall$ при чётном $k$.

Аналогично, $L\in\Pi_k^p$ если формула начинается с $\forall$ и далее чередуется.

**Лемма 14.2.** Кванторная форма эквивалентна оракульному определению уровней PH.

*Комментарий.* Это стандартная теорема; подробное доказательство см. Arora–Barak (разделы про PH). Ниже мы используем кванторную форму только для доказательства коллапса (Теорема 14.4).

### 14.3. Базовые факты о коллапсах

**Теорема 14.3.** Если $\mathrm{P}=\mathrm{NP}$, то $\mathrm{PH}=\mathrm{P}$.

*Доказательство.* Докажем по индукции, что для всех $k\ge 0$ выполняется $\Sigma_k^p=\mathrm{P}$.

База: $\Sigma_0^p=\mathrm{P}$ по определению.

Переход: пусть $\Sigma_k^p=\mathrm{P}$. Тогда
$$\Sigma_{k+1}^p=\mathrm{NP}^{\Sigma_k^p}=\mathrm{NP}^{\mathrm{P}}=\mathrm{NP}.$$
При предположении $\mathrm{P}=\mathrm{NP}$ получаем $\Sigma_{k+1}^p=\mathrm{P}$. Следовательно, все уровни равны $\mathrm{P}$, а значит и $\mathrm{PH}=\mathrm{P}$. $\square$

**Теорема 14.4 (коллапс на уровне $k$, классическая).** Если для некоторого $k\ge 1$ выполнено $\Sigma_k^p=\Pi_k^p$, то $\mathrm{PH}=\Sigma_k^p$.

*Доказательство.* Достаточно показать, что $\Sigma_{k+1}^p\subseteq\Sigma_k^p$ и $\Pi_{k+1}^p\subseteq\Sigma_k^p$, после чего по индукции получим включение всех более высоких уровней в $\Sigma_k^p$.

Возьмём $L\in\Sigma_{k+1}^p$ и воспользуемся кванторной формой. Тогда существует полином $p$ и полиномиальный предикат $V$ такие, что
$$x\in L\iff \exists y\in\{0,1\}^{p(|x|)}:\ \Psi(x,y),$$
где $\Psi(x,y)$ — формула с $k$ чередованиями, начинающаяся с $\forall$ (то есть язык $L':=\{\langle x,y\rangle:\ \Psi(x,y)\}$ лежит в $\Pi_k^p$).

По предположению коллапса $\Pi_k^p=\Sigma_k^p$, значит $L'\in\Sigma_k^p$. Тогда
$$L=\{x:\ \exists y\ \langle x,y\rangle\in L'\}$$
является *экзистенциальной проекцией* языка из $\Sigma_k^p$. Такая проекция добавляет один ведущий квантор $\exists$, но если $k\ge 1$, то добавление ведущего $\exists$ к $\Sigma_k^p$ не увеличивает уровень: оно поглощается первым квантором $\exists$ уже имеющейся $\Sigma_k$‑формулы для $L'$ (можно объединить два экзистенциальных блока в один, увеличив полином на длину свидетеля).

Следовательно, $L\in\Sigma_k^p$, то есть $\Sigma_{k+1}^p\subseteq\Sigma_k^p$.

Аналогично для $L\in\Pi_{k+1}^p$ имеем представление $x\in L\iff \forall y\ \Theta(x,y)$, где $\Theta$ задаёт язык из $\Sigma_k^p$. Перепишем как дополнение:
$$x\in L\iff \neg\exists y:\ \neg\Theta(x,y).$$
Язык $\{\langle x,y\rangle:\ \neg\Theta(x,y)\}$ лежит в $\Pi_k^p=\Sigma_k^p$, а далее тем же аргументом получаем $L\in\Pi_k^p=\Sigma_k^p$.

Итак, уровни $k+1$ (и, следовательно, все выше) лежат в $\Sigma_k^p$, а тривиально $\Sigma_k^p\subseteq\mathrm{PH}$. Значит $\mathrm{PH}=\Sigma_k^p$. $\square$

### 14.4. Karp–Lipton: NP ⊆ P/poly ⇒ коллапс PH

Напомним: $\mathrm{P/poly}$ — языки, распознаваемые семейством булевых схем полиномиального размера (неравномерная модель).

**Лемма 14.5 (поиск из решения для SAT).** Если $\mathrm{SAT}\in\mathrm{P/poly}$, то существует семейство схем $\{W_m\}$ полиномиального размера, которое по коду выполнимой SAT‑формулы $\varphi$ возвращает удовлетворяющее присваивание.

*Доказательство.* Пусть $\{C_m\}$ — семейство схем полиномиального размера, решающее SAT на формулах длины $m$.

Используем стандартную self‑reduction: фиксируем переменные по одной. Для $i=1,\dots,t$ (где $t$ — число переменных в $\varphi$) проверяем выполнимость формулы с добавленной фиксацией $u_i=0$; если выполнима — ставим $u_i:=0$, иначе $u_i:=1$. Если $\varphi$ выполнима, этот процесс построит удовлетворяющее присваивание за полиномиальное число вызовов SAT.

Заменяя каждый вызов SAT схемой $C_m$ и разворачивая последовательные вычисления в схему, получаем $W_m$ размера $\mathrm{poly}(m)\cdot|C_m|=\mathrm{poly}(m)$. $\square$

**Теорема 14.6 (Karp–Lipton, классическая).** Если $\mathrm{NP}\subseteq\mathrm{P/poly}$, то $\mathrm{PH}=\Sigma_2^p$.

*Доказательство.* Достаточно показать $\Pi_2^p\subseteq\Sigma_2^p$ и применить Теорему 14.4 при $k=2$.

Пусть $L\in\Pi_2^p$. По кванторной форме существует полиномиальный предикат $R$ и полином $p$ такие, что
$$x\in L \iff \forall y\in\{0,1\}^{p(|x|)}\ \exists z\in\{0,1\}^{p(|x|)}:\ R(x,y,z)=1.$$ 

Рассмотрим язык
$$A:=\{\langle x,y\rangle:\ \exists z\ R(x,y,z)=1\}.$$ 
Тогда $A\in\mathrm{NP}$, а значит по предположению $A\in\mathrm{P/poly}$.

По Cook–Levin (цитируется, в верификаторной форме) из отношения $\exists z\ R(x,y,z)$ можно полиномиально построить SAT‑формулу $\varphi_{x,y}$, такая что $\varphi_{x,y}$ выполнима тогда и только тогда, когда существует подходящий $z$; и более того, из любого удовлетворяющего присваивания $\varphi_{x,y}$ можно полиномиально извлечь такой $z$.

Так как $\mathrm{SAT}\in\mathrm{P/poly}$, по Лемме 14.5 существует полиномиальная witness‑схема для SAT. Композицией (построение $\varphi_{x,y}$ → witness для $\varphi_{x,y}$ → извлечение $z$) получаем: для каждого фиксированного $x$ существует полиномиальная схема $W_x$, которая по входу $y$ выдаёт некоторый свидетель $z=W_x(y)$, удовлетворяющий $R(x,y,z)$, если такой существует.

Тогда
$$x\in L \iff \exists W_x\ \forall y:\ R(x,y,W_x(y))=1,$$
что является $\Sigma_2^p$‑описанием. Следовательно, $\Pi_2^p\subseteq\Sigma_2^p$, значит $\Sigma_2^p=\Pi_2^p$ и по Теореме 14.4 имеем $\mathrm{PH}=\Sigma_2^p$. $\square$


## 15. Proof complexity: резолюция и PHP

В proof complexity изучают **длины доказательств** (proofs) в фиксированных системах. Это удобная «калибровка»: строгие нижние оценки возможны в слабых системах, но их перенос на сильные системы тесно связан с $\mathrm{NP}$ vs $\mathrm{coNP}$.

**Определение (proof system, Cook–Reckhow; грубо).** Для языка $L\subseteq\Sigma^\*$ это полиномиальный верификатор $V(x,\pi)$, где:
- *(звук)* $V(x,\pi)=1 \Rightarrow x\in L$;
- *(полнота)* $x\in L \Rightarrow \exists \pi,\ |\pi|\le \mathrm{poly}(|x|):\ V(x,\pi)=1$.

**Лемма 15.1 (Cook–Reckhow, 1979).** $\mathrm{NP}=\mathrm{coNP}$ тогда и только тогда, когда существует полиномиально ограниченная proof system для $\mathrm{TAUT}$.

*Доказательство.* Если есть полиномиально ограниченная proof system для $\mathrm{TAUT}$, то $\mathrm{TAUT}\in\mathrm{NP}$, то есть $\mathrm{coNP}\subseteq\mathrm{NP}$. Беря дополнение, получаем $\mathrm{NP}\subseteq\mathrm{coNP}$, значит $\mathrm{NP}=\mathrm{coNP}$. Обратно, если $\mathrm{NP}=\mathrm{coNP}$, то $\mathrm{TAUT}\in\mathrm{NP}$ и определение NP даёт полиномиальный верификатор с полиномиальными свидетелями, т.е. proof system. $\square$

**Резолюция (Resolution).** Работаем с CNF (конъюнкцией дизъюнктов литералов). Правило резолюции: из $(A\lor x)$ и $(B\lor\neg x)$ выводим $(A\lor B)$. *Рефутация* CNF‑формулы $F$ — вывод пустой клаузы из клауз $F$.

**CNF‑формулировка принципа Дирихле (PHP).**
Связь: PHP — один из кандидатов для EF‑нижних оценок (см. Sec. 15.7). Пусть переменная $x_{i,j}$ означает «голубь $i$ сидит в норке $j$». CNF $\mathrm{PHP}^{n}_{m}$ состоит из:
- *(птица где‑то сидит)* для каждого $i$: $x_{i,1}\lor\cdots\lor x_{i,n}$;
- *(не вместе)* для каждого $j$ и $i\ne i'$: $(\neg x_{i,j}\lor\neg x_{i',j})$.
Для $m=n+1$ формула невыполнима.

**Теорема 15.2 (Haken, 1985).** Существует константа $c>1$ такая, что любая резолюционная рефутация $\mathrm{PHP}^{n}_{n+1}$ имеет размер $\ge c^n$ (то есть $2^{\Omega(n)}$).

*Комментарий.* Ниже приведено полное доказательство по стандартной схеме «критические присваивания → положительная версия → ограничения» (изложение близко к конспектам TSS). Дополнительно: `resources/downloads/tss_proof_complexity_notes.pdf`, Theorem 2 (Hak85) и Sec. 3.

Современная «упаковка» таких результатов: связь размера с *шириной* (Ben‑Sasson–Wigderson, 2001). Она особенно полезна для 3‑CNF (где начальная ширина константна).

**Определение (ширина резолюции).** Ширина вывода — максимум числа литералов в клаузе, встретившейся в резолюционном выводе.

**Теорема 15.3 (Ben‑Sasson–Wigderson, 2001, Thm 3.5 + Cor 3.6).** Пусть $F$ — CNF на $N$ переменных, $w_0$ — максимальная ширина исходных клауз, $W$ — минимальная ширина резолюционной рефутации. Тогда размер любой рефутации $\ge 2^{\Omega((W-w_0)^2/N)}$.

**Замечание.** Применение size–width требует аккуратного выбора формулировки (малая $w_0$ и контроль числа переменных); см. Ben‑Sasson–Wigderson, Sec. 4 и конспекты TSS/de Wolf для современного вывода экспоненциальной оценки для PHP.

### 15.4. Критические присваивания и «положительная версия» (полное доказательство)

Дальше полезно фиксировать подмножество присваиваний, на которых отрицания можно заменить «положительными» дизъюнкциями.

**Определение (критическое присваивание).** Для $\mathrm{PHP}^{n}_{n+1}$ присваивание $\alpha$ переменным $\{x_{i,j}\}$ называется *критическим*, если существует индекс $i_0\in\{1,\dots,n+1\}$ такой, что:
- для каждого $j\in\{1,\dots,n\}$ существует **ровно один** $i\ne i_0$ с $x_{i,j}(\alpha)=1$ (каждая норка занята ровно одним голубем);
- для каждого $i\ne i_0$ существует **ровно один** $j$ с $x_{i,j}(\alpha)=1$ (каждый из остальных голубей сидит ровно в одной норке);
- для $i=i_0$ верно $x_{i_0,j}(\alpha)=0$ для всех $j$ (один «лишний» голубь не сидит нигде).

**Определение (положительная замена отрицания).** Определим
$$X_{i,j}:=\bigvee_{i'\ne i} x_{i',j}.$$
Для клаузы $C$ над литералами $x_{i,j}$, $\neg x_{i,j}$ определим $C^+$ как дизъюнкцию, полученную заменой каждого $\neg x_{i,j}$ на $X_{i,j}$ и раскрытием (в результате $C^+$ — клауза из только положительных литералов).

**Лемма 15.4.** Для любого критического $\alpha$ и любой клаузы $C$ верно $C(\alpha)=C^+(\alpha)$.

*Доказательство.* На критическом $\alpha$ в каждом столбце $j$ стоит ровно одна единица. Поэтому для любых $i,j$:

- если $x_{i,j}(\alpha)=1$, то все $x_{i',j}(\alpha)=0$ при $i'\ne i$, значит $X_{i,j}(\alpha)=0$ и также $(\neg x_{i,j})(\alpha)=0$;
- если $x_{i,j}(\alpha)=0$, то единица в столбце $j$ стоит в некоторой строке $i'\ne i$, значит $X_{i,j}(\alpha)=1$ и также $(\neg x_{i,j})(\alpha)=1$.

Итак, на критических присваиваниях $\neg x_{i,j}$ эквивалентно $X_{i,j}$, а значит и любая клауза сохраняет значение при такой замене. $\square$

(Код‑проверка Леммы 15.4 на малых $n$ — в следующей ячейке.)

### 15.5. «Широкая клауза» в положительной версии (полное доказательство)

Зафиксируем $\mathrm{PHP}^{n}_{n+1}$ и критические присваивания из Sec. 15.4.

**Определение.** Для клаузы $C$ пусть $\mathrm{Pigeon}(C)\subseteq\{1,\dots,n+1\}$ — множество индексов $i$, для которых существует $i$‑критическое $\alpha$ с $C(\alpha)=0$. Обозначим $\mu(C):=|\mathrm{Pigeon}(C)|$.

**Лемма 15.5 (wide clause).** Для любой резолюционной рефутации $\mathrm{PHP}^{n}_{n+1}$ существует клауза $C$ из вывода такая, что
$$\mathrm{width}(C^+)\ \ge\ \frac{2(n+1)^2}{9}\ =\ \Omega(n^2).$$

*Доказательство.*

1) Для каждого голубя $i$ исходная «птичья» клауза $P_i:=(x_{i,1}\lor\cdots\lor x_{i,n})$ имеет $\mu(P_i)=1$, потому что среди критических присваиваний она ложна ровно на $i$‑критических.

2) Для пустой клаузы $\emptyset$ имеем $\mu(\emptyset)=n+1$, так как $\emptyset(\alpha)=0$ на любом присваивании.

3) Если $C$ получена резолюцией из $A,B$, то $\mu(C)\le\mu(A)+\mu(B)$: если $C(\alpha)=0$ на некотором критическом $\alpha$, то по звуковости резолюции $A(\alpha)=0$ или $B(\alpha)=0$, значит $\alpha$ свидетельствует принадлежность соответствующего индекса в $\mathrm{Pigeon}(A)$ или $\mathrm{Pigeon}(B)$.

Рассмотрим в выводе первую (по порядку появления) клаузу $C$ с $\mu(C)>(n+1)/3$. Она существует, потому что $\mu(P_i)=1\le(n+1)/3$, а финальная $\mu(\emptyset)=n+1>(n+1)/3$. По пункту (3) такая первая клауза удовлетворяет $\mu(C)\le 2(n+1)/3$.

Положим $s:=\mu(C)$, так что $(n+1)/3 < s\le 2(n+1)/3$.

Теперь покажем, что $\mathrm{width}(C^+)\ge s((n+1)-s)$. Возьмём $i\in\mathrm{Pigeon}(C)$ и $i$‑критическое $\alpha$ с $C(\alpha)=0$. Для любого $j\notin\mathrm{Pigeon}(C)$ построим $j$‑критическое $\alpha'$ так: в матричном представлении присваивания поменяем местами строки $i$ и $j$ (голубь $i$ садится в ту же норку, где сидел $j$, а $j$ становится «лишним»).

Так как $j\notin\mathrm{Pigeon}(C)$, имеем $C(\alpha')=1$. По Лемме 15.4 получаем $C^+(\alpha)=0$ и $C^+(\alpha')=1$.

Клауза $C^+$ содержит только положительные литералы. Переход $\alpha\to\alpha'$ меняет из 0 в 1 ровно одну переменную $x_{i,k}$ (где $k$ — норка, в которой сидел голубь $j$ в $\alpha$). Следовательно, чтобы $C^+$ стало истинным, литерал $x_{i,k}$ обязан входить в $C^+$.

Для фиксированного $i$ разные $j\notin\mathrm{Pigeon}(C)$ соответствуют разным норкам $k$ (потому что в $i$‑критическом присваивании остальные $n$ голубей образуют биекцию с $n$ норками). Значит, из одной строки $i$ мы получаем как минимум $(n+1)-s$ различных литералов в $C^+$. Суммируя по всем $i\in\mathrm{Pigeon}(C)$, получаем $\mathrm{width}(C^+)\ge s((n+1)-s)$.

Так как функция $s((n+1)-s)$ на интервале $(n+1)/3 < s\le 2(n+1)/3$ минимальна на концах, имеем $s((n+1)-s)\ge 2(n+1)^2/9$. $\square$

### 15.6. Ограничения $\Rightarrow$ экспонента (полное доказательство)

Пусть $R$ — резолюционная рефутация $\mathrm{PHP}^{n}_{n+1}$. Положим $m:=n+1$ (число голубей) и $N:=n(n+1)=m(m-1)$ (число переменных $x_{i,j}$).

Зафиксируем константу $\varepsilon\in(0,1)$ и назовём клаузу $C\in R$ *$\varepsilon$‑широкой*, если $\mathrm{width}(C^+)\ge \varepsilon N$. Пусть $S$ — число $\varepsilon$‑широких клауз в $R$.

**Лемма 15.6.1.** Существует переменная $x_{i,j}$, которая входит хотя бы в $\varepsilon S$ $\varepsilon$‑широких клауз (в их положительных версиях).

*Доказательство.* Каждая $\varepsilon$‑широкая клауза содержит $\ge \varepsilon N$ различных положительных литералов, значит общее число вхождений переменных среди $\varepsilon$‑широких клауз не меньше $\varepsilon N\cdot S$. Так как переменных ровно $N$, по принципу Дирихле найдётся переменная, входящая хотя бы в $(\varepsilon N\cdot S)/N=\varepsilon S$ таких клауз. $\square$

Выберем такую переменную $x_{i,j}$ и рассмотрим ограничение $\rho$, которое «сажает» голубя $i$ в норку $j$:
$$x_{i,j}=1,\quad x_{i',j}=0\ (i'\ne i),\quad x_{i,j'}=0\ (j'\ne j).$$
После этого ограничения исходная CNF естественно превращается в $\mathrm{PHP}^{n-1}_{n}$ (убираем строку $i$ и столбец $j$).

**Лемма 15.6.2.** Если применить $\rho$ ко всем клаузам вывода $R$ (удаляя истинные клаузы и выкидывая ложные литералы), получится резолюционная рефутация $\mathrm{PHP}^{n-1}_{n}$.

*Доказательство.* Применение ограничения к CNF эквивалентно подстановке значений и упрощению. Резолюционное правило замкнуто относительно ограничений: если $C$ — резольвента из $A,B$, то $C\upharpoonright\rho$ является резольвентой из $A\upharpoonright\rho, B\upharpoonright\rho$ или тривиально следует из них (возможны вырождения, когда один из литералов фиксируется). Поэтому образ вывода остаётся корректным выводом; финальная пустая клауза остаётся пустой. $\square$

**Лемма 15.6.3.** После применения $\rho$ число $\varepsilon$‑широких клауз в $R$ уменьшается как минимум в $(1-\varepsilon)$ раз.

*Доказательство.* Все $\varepsilon S$ широких клауз, содержащие $x_{i,j}$, становятся истинными (так как $x_{i,j}=1$) и исчезают. Остальные клаузы могут лишь потерять литералы из‑за фиксирования переменных, поэтому новые $\varepsilon$‑широкие клаузы появиться не могут. $\square$

Итак, после одного шага получаем рефутацию $\mathrm{PHP}^{n-1}_{n}$, в которой число широких клауз $\le (1-\varepsilon)S$. Повторяя процедуру, после $k$ шагов имеем рефутацию $\mathrm{PHP}^{n-k}_{n+1-k}$, где число широких клауз $\le S(1-\varepsilon)^k$.

Выберем $k:=\left\lceil\frac{\ln S}{\varepsilon}\right\rceil+1$. Так как $1-\varepsilon\le e^{-\varepsilon}$, получаем
$$S(1-\varepsilon)^k\le S e^{-\varepsilon k}<1,$$
то есть после $k$ шагов *нет* $\varepsilon$‑широких клауз: для любой клаузы $D$ в полученном выводе выполнено $\mathrm{width}(D^+)<\varepsilon N\le \varepsilon m^2$.

С другой стороны, применим Лемму 15.5 к полученной рефутации $\mathrm{PHP}^{n-k}_{n+1-k}$: существует клауза $D$ такая, что
$$\mathrm{width}(D^+)\ge \frac{2(n+1-k)^2}{9} = \frac{2(m-k)^2}{9}.$$ 
Значит обязательно
$$\frac{2(m-k)^2}{9}<\varepsilon m^2,$$
то есть $m-k<\frac{3}{\sqrt2}\sqrt\varepsilon\,m$ и
$$k>\Bigl(1-\tfrac{3}{\sqrt2}\sqrt\varepsilon\Bigr)m.$$ 

Но по определению $k\le \frac{\ln S}{\varepsilon}+2$. Следовательно,
$$\ln S\ \ge\ \varepsilon\Bigl(1-\tfrac{3}{\sqrt2}\sqrt\varepsilon\Bigr)m\ -\ 2\varepsilon.$$
Берём, например, $\varepsilon=1/100$ и получаем $\ln S=\Omega(m)=\Omega(n)$, то есть $S\ge 2^{\Omega(n)}$. Так как $S\le |R|$, получаем экспоненциальную нижнюю оценку на размер любой рефутации. Это доказывает Теорему 15.2. $\square$

### 15.7. За пределами резолюции: что известно и что открыто

Резолюция — слабая система. Экспоненциальные нижние оценки здесь не приближают напрямую $\mathrm{NP}$ vs $\mathrm{coNP}$: нужны нижние оценки для **существенно более сильных** (в идеале — для всех) proof systems в смысле Cook–Reckhow.

**Определение (p-bounded).** Proof system $P$ — p-bounded, если для любой тавтологии $\varphi$ существует $P$-доказательство размера $\mathrm{poly}(|\varphi|)$.

**Определение (p-симуляция).** $P$ p-симулирует $Q$, если существует полиномиально вычислимая функция, переводящая доказательство $\pi$ $Q$-системы тавтологии $\varphi$ в $P$-доказательство $\varphi$ размера $\mathrm{poly}(|\pi|)$.

**Определение (p-оптимальная система).** $P$ p-оптимальна, если она p-симулирует все системы. Вопрос о существовании p-оптимальной системы открыт.

**Следствие (ориентир).** Если p-оптимальная система существует и для нее доказаны суперполиномиальные нижние оценки, то $\mathrm{NP}\ne\mathrm{coNP}$ (а значит $\mathrm{P}\ne\mathrm{NP}$).

**Контраст на примере PHP.**
- *(Frege легко)* Для (полной) системы Frege существуют полиномиальные доказательства $\mathrm{PHP}$: Buss (1987), PDF: resources/downloads/buss_1987_php_frege.pdf.
- *(bounded‑depth Frege трудно)* Для bounded‑depth Frege (AC⁰‑Frege) есть экспоненциальные нижние оценки для $\mathrm{PHP}$: Beame–Impagliazzo–Krajíček–Pitassi–Pudlák–Woods (1992), PDF: resources/downloads/beame_et_al_1992_php_bounded_depth_frege.pdf.
- *(Cutting Planes легко)* Для системы Cutting Planes (CP) существуют полиномиальные опровержения $\neg\mathrm{PHP}$: см. Buss–Clote (2002), PDF: resources/downloads/buss_cutting_planes_notes.pdf (см. также `resources/downloads/buss_cutting_planes_notes.pdf`).

**Открытая цель линии proof complexity.** Доказать суперполиномиальные нижние оценки для достаточно сильных систем (например, Extended Frege / общих полиномиально ограниченных систем) на явных семействах тавтологий. Это уже бы дало $\mathrm{NP}\ne\mathrm{coNP}$, а значит и $\mathrm{P}\ne\mathrm{NP}$.
С учётом Cor. 2 из Pich–Santhanam: EF‑нижние оценки в сочетании с $W_{n,k,u}(f)$ дают равномерные нижние оценки для $\mathrm{Time}[n^k]/u(n)$, то есть путь к $\mathrm{P}\ne\mathrm{NP}$.
Связанная свежая (условная) связка: Pich–Santhanam (2023) выводят $\mathrm{P}\ne\mathrm{NP}$ из определённых EF‑нижних оценок при допущениях о формализуемой сложности (bounded arithmetic); см. Theorem 1 и Theorems 7–9 в `resources/downloads/pich_santhanam_2023_ef_lower_bounds.pdf`.

**Определение (Pich–Santhanam, введение).** Для константы $k\ge 1$ и полиномиально вычислимой (p‑time) функции $f$ вводится формула‑шаблон
$$w_{n,k}(f) := [\mathrm{SAT}_n(x,y)\to \mathrm{SAT}_n(x,C(x))]\ \lor\ [\mathrm{SAT}_n(f_1(C),f_2(C))\wedge \neg\mathrm{SAT}_n(f_1(C),C(f_1(C)))].$$
Здесь $C$ — код схемы размера $n^k$, $\mathrm{SAT}_n(x,y)$ — предикат «$y$ удовлетворяет формулу $x$ размера $n$», а $f(C)$ возвращает пару $\langle f_1(C),f_2(C)\rangle$.
Интуиция: $w_{n,k}(f)$ — тавтология тогда и только тогда, когда $f$ **свидетельствует ошибку** любой схемы $C$, которая не решает search‑SAT на длине $n$.

**Определение (Pich–Santhanam, введение/Sec. 2.2).** Обозначение $W_{n,k}(f)$ — «естественная» $\forall\Pi^b_1$‑формулировка в bounded arithmetic утверждения: существует $n_0$, что для всех $n>n_0$ формулы $w_{n,k}(f)$ — тавтологии. Здесь $\mathrm{S}^1_2$ — теория Бусса bounded arithmetic, формализующая p‑time рассуждения. По соответствию $\mathrm{S}^1_2\leftrightarrow$ EF, доказуемость такого $W_{n,k}(f)$ в $\mathrm{S}^1_2$ даёт полиномиальные EF‑доказательства для $w_{n,k}(f)$ при всех достаточно больших $n$.

**Определение (S$^1_2$).** $\mathrm{S}^1_2$ — теория Бусса ограниченной арифметики в стандартном языке $L_{BA}$; допускает только ограниченные кванторы и содержит схему $\Sigma^b_1$‑индукции по длине $|x|$. Используется для формализации p‑time рассуждений (см. Buss 1995; Krajíček 1995; Cook–Nguyen 2010).

**Напоминание (ограниченные кванторы).** Кванторы в $L_{BA}$ пишутся как $\forall x\le t$ и $\exists x\le t$ (аббревиатуры $\forall x(x\le t\to\varphi)$ и $\exists x(x\le t\wedge\varphi)$); длина $|x|$ — число битов двоичной записи. (Buss 1995; Krajíček 1995; Cook–Nguyen 2010).

**Напоминание ($\Sigma^b_1$‑формулы).** $\Sigma^b_1$‑формулы имеют ведущий блок ограниченных существований (например, $\exists y\le t(x)\,\psi$), где матрица $\psi$ — bounded ($\Delta^b_0$). (Buss 1995; Krajíček 1995; Cook–Nguyen 2010).

**Лемма-мост (S$^1_2$ → EF; цитируется).** Если $\Pi^b_1$‑формула $\varphi$ доказуема в $\mathrm{S}^1_2$, то её пропозициональные переводы $\lVert\varphi\rVert_n$ образуют семейство тавтологий с полиномиальными EF‑доказательствами, эффективно строимыми за $\mathrm{poly}(n)$. (Pich–Santhanam, Sec. 2.2; Buss 1995; Krajíček 1995; Cook–Nguyen 2010.)

**Теорема (Pich–Santhanam, Theorem 1; цитируется).** Существует универсальная константа $\varepsilon>0$ такая, что для любого $k\ge 1$:
- если $w_{n,k}(f)$ — тавтологии для всех больших $n$ и система $\mathrm{EF}+w_k(f)$ не полиномиально ограничена, то $\mathrm{SAT}\notin\mathrm{SIZE}(n^{\varepsilon k})$ бесконечно часто;
- если $\mathrm{S}^1_2\vdash W_{n,k}(f)$ и EF не полиномиально ограничена, то то же заключение.

**Ориентир (Pich–Santhanam, Abstract).** При двух предпосылках о доказуемости в $\mathrm{S}^1_2$ (hardness в $\mathrm{E}$ и «learning from $\neg\exists$OWF») и при существовании явного семейства функций, для которого EF *не* имеет полиномиальных доказательств корректных схем‑нижних оценок, авторы получают следствие $\mathrm{P}\ne\mathrm{NP}$.
В формулировке аннотации (кратко):
Пусть далее $t(n):=1/2-1/2^{n/4}$.
1) (I) $\mathrm{S}^1_2$ доказывает, что для некоторой явной $h_0\in\mathrm{E}$ и всех больших $n$ формулы $tt(h_{0,n},2^{n/4},t(n))$ — тавтологии (трудность аппроксимации; см. Pich–Santhanam, Thm 8/9).
   *(Формализация $h_0\in\mathrm{E}$):* $h_0$ вычисляется за время $2^{O(n)}$ (формализуется в $\mathrm{S}^1_2$ через bounded‑проверку машины).
2) (II) $\mathrm{S}^1_2$ доказывает $\forall n\,\forall C\,\exists y\le\mathrm{poly}(n)$ $\mathrm{RedCorr}(n,C,y)$, где $\mathrm{RedCorr}$ — предикат корректности p‑time редукции «$\neg\exists$OWF → обучение схем» (и $C$ кодирует гипотезу/схему, $y$ — выход редукции).
   $\mathrm{RedCorr}(n,C,y)$: «$y$ — корректный выход редукции на входе $(n,C)$ и порождает гипотезу, ошибающуюся на доле $\ge t(n)$ входов» (bounded‑формулировка; см. Pich–Santhanam, Thm 9).
3) (IIa) «$\neg\exists$OWF»: для любого p-time $f$ существует p-time инвертор $A$ и полином $p$ с $\Pr_{x\in\{0,1\}^n}[A(f(x))=x]\ge 1/p(n)$ для бесконечно многих $n$; кодируется в $\mathrm{S}^1_2$ через bounded‑кванторы по кодам $f,A$ и их случайным битам (см. Cook–Nguyen 2010, гл. 11).


Чтобы превратить это в «чек‑лист» для работы в этом ноутбуке, нужны (все пункты пока *цитируются* из статьи/обзоров):
- ключевая цель: показать, что система $\mathrm{EF}+tt(h_{0,n},2^{n/4},t(n))$ не p‑bounded (суперполиномиальные нижние оценки на длину EF‑доказательств); конкретный вариант (Thm 9): нет $2^{a n}$‑доказательств EF для $tt(g_n,n^t)$ (см. шаблон выше).
Статус: неизвестно даже для явных $tt$‑семейств (см. шаблон; ср. Pudlák 1998; Buss 2011); суперполиномиальные EF‑нижние оценки остаются открыты.
**Кандидаты (в EF открыто).** PHP, Tseitin, Clique-Coloring (см. Pudlák 1998; Buss 2011).
**Контур попытки.**
1) Явное $g_n$ с аппроксимационной схемной сложностью в $\mathrm{E}$ (открыто).
   (т.е. нет схем размера $n^t$, ошибающихся на доле < $t(n)$; см. Thm 8/9).
2) EF‑нижняя оценка для $tt(g_n,n^t,t(n))$ (открыто).
   (т.е. доказать сверхполиномиальную длину EF‑доказательств таких $tt$‑формул).
Боттлнек: шаг 2 — основное открытое место.
См. также (альтернативная ветка): алгебраические proof systems (IPS) и связь с PIT/VP vs VNP (Grochow–Pitassi 2014; `resources/downloads/grochow_pitassi_2014_pit.pdf`).
Суперполиномиальные нижние оценки IPS ⇒ VP≠VNP; обзор/техники: Forbes–Shpilka–Tzameret–Wigderson 2021 (`resources/downloads/forbes_shpilka_tzameret_wigderson_2021_ips.pdf`).
**Определение (IPS, грубо).** IPS (Ideal Proof System) опровергает невыполнимую CNF как алгебраический сертификат: после перевода клауз в многочлены $f_i$ над полем даётся схема, вычисляющая многочлены $g_i$, такие что $\sum_i g_i f_i = 1$; это и есть опровержение. (Grochow–Pitassi 2014, Def. 1.1.)
Замечание: полнота IPS следует из Nullstellensatz (без ограничений на размер; см. `resources/downloads/allcock_nullstellensatz_2005.pdf`).
Напоминание: IPS‑опровержение — алгебраический сертификат, а не цепочка логических правил над CNF.
**Формализационный минимум (IPS).** (i) перевод CNF в систему $f_i=0$; (ii) выбор поля/характеристики; (iii) мера размера: алгебраическая схема для $g_i$ и их комбинации $\sum_i g_i f_i$. 
Краткий контраст: EF‑нижние оценки на явных тавтологиях ⇒ $\mathrm{NP}\ne\mathrm{coNP}$ (следовательно $\mathrm{P}\ne\mathrm{NP}$), а IPS‑нижние оценки ⇒ $\mathrm{VP}\ne\mathrm{VNP}$ (алгебраическая линия).
Напоминание: VP/VNP — алгебраические аналоги P/NP для полиномиальных вычислений; см. Sec. 8, пункт 4.
Статус (IPS): общие суперполиномиальные нижние оценки остаются открыты; известны лишь частичные результаты для ограниченных моделей (см. Grochow–Pitassi 2014; Forbes–Shpilka–Tzameret–Wigderson 2021).
Пример ограниченных подсистем: IPS с сертификатами в классах sparse polynomials, depth‑3 powering formulas, ROABP и multilinear formulas; для них получены нижние оценки (FSTW 2021, Sec. 1.3).
ROABP (read‑once oblivious algebraic branching program): слоистая схема с фиксированным порядком переменных, каждая переменная появляется ровно в одном слое.
Depth‑3 powering formula: сумма полиномов вида $\sum_i \prod_j Q_{ij}^{e_{ij}}$ (глубина 3), где $Q_{ij}$ — малой степени; ограничения на степень/размер дают «powering»‑класс.
Multilinear formulas: формулы, вычисляющие multilinear‑полиномы (в каждой мономиальной терме каждая переменная имеет степень ≤ 1); естественный класс ограничений для IPS.
Почему IPS ⇒ VP≠VNP (очень кратко): Grochow–Pitassi связывают нижние оценки IPS с алгебраическими схемами; суперполиномиальные IPS‑нижние оценки для явных тавтологий дают суперполиномиальные нижние оценки для соответствующих алгебраических вычислений, т.е. разделение VP/VNP.
**Скелет доказательства (для шага 2).**
Параметры: фиксируем константы $a,t$ (из Theorem 9), рассматриваем $n$ достаточно большие.
Формализация в $\mathrm{S}^1_2$: определения $\mathrm{Enc}$, $\mathrm{Len}$ и редукции $R$ должны быть выразимы как bounded-формулы (см. лемму-мост EF$\leftrightarrow\mathrm{S}^1_2$).
Указание: bounded-формула для $\mathrm{Enc}$ квантифицирует индексы строк $i\le |\pi|$ и проверяет локальные правила вывода и аксиомы.
Аналогично, $\mathrm{Len}$ задаётся через bounded-предикат длины кода, а редукция $R$ задаётся p-time вычислимой функцией (см. Sec. 2.2 в Pich–Santhanam).
Итог: L2/L3 остаются открытыми; именно они требуют нетривиальной EF-нижней оценки.
Кандидаты семейств: PHP, Tseitin, Clique-Coloring (см. выше в Sec. 15.7). Связь: PHP введен в Sec. 15.2.
Кратко: Tseitin - паритетные ограничения на графе (невыполнимые при несогласованной сумме зарядов); Clique-Coloring - тавтологии, кодирующие несовместимость клики и раскраски.
Указание по кодированию: Tseitin обычно задается XOR-уравнениями по вершинам, Clique-Coloring — CNF, запрещающей одновременную клику и корректную раскраску.
Подробнее: для Clique-Coloring используют переменные для цветов вершин, клаузы "вершина имеет цвет" и "смежные вершины не одного цвета" + клаузы на клику.
См. обсуждения/кодировки в Pudlak 1998 и Buss 2011 (ссылки выше).
Замечание: формулы Tseitin невыполнимы тогда и только тогда, когда сумма зарядов нечетна (несогласованность паритетов).
Указатель: обсуждение этих семейств см. в Pudlak 1998 и Buss 2011 (см. ссылки выше).
Статус: для этих семейств EF-нижние оценки остаются открыты.
PHP определен в Sec. 15.2; для Tseitin/Clique-Coloring см. обзоры (Pudlak 1998; Buss 2011; `resources/downloads/pudlak_1998_lengths_of_proofs.pdf`, `resources/downloads/buss_2011_np_p_proof_complexity.pdf`).
Замечание: уже сверхполиномиальная EF-нижняя оценка на таких $tt$-формулах достаточна для вывода (через Pich–Santhanam).
Точнее: для Theorem 9 требуется отсутствие доказательств длины $2^{a n}$ (экспоненциальная граница), а для Cor. 2 достаточно суперполиномиальной неполиномиальности EF+$w$.
Речь о формулах вида $tt(g_n,n^t,t(n))$ (см. шаблон выше).
Здесь $t(n)=1/2-1/2^{n/4}$ по настройке из Pich–Santhanam (см. аннотацию в Sec. 15.7).
Чем ближе $t(n)$ к $1/2$, тем сильнее требование средней-сложности (меньше допустимая корреляция).
Напоминание: $t(n)$ — порог ошибки в определении $tt(f_n,s,t)$ (доля входов, на которых схема ошибается).
- (L1) Лемма (кодирование EF). Требуется: существует p-time кодирование $\mathrm{Enc}(n,\pi)$ EF-вывода $\pi$ и предикат длины $\mathrm{Len}(n,\pi)$, так что «существует EF-вывод $tt(g_n,n^t,t(n))$ длины $\le 2^{a n}$» выражается как $\exists\pi\,\mathrm{Enc}(n,\pi)\wedge(\mathrm{Len}(n,\pi)\le 2^{a n})$.
Конкретизация: $\pi$ кодирует последовательность строк EF, $\mathrm{Enc}(n,\pi)$ проверяет локально корректность правил/аксиом и что последняя строка — $tt(g_n,n^t,t(n))$; $\mathrm{Len}(n,\pi)$ — длина кода (в битах).
Замечание: проверка $\mathrm{Enc}$ — p‑time (Cook–Reckhow: EF — полиномиально проверяемая proof system).
- (L2) Лемма (короткий EF $\Rightarrow$ аппроксимация). Требуется: из существования EF-вывода длины $\le 2^{a n}$ вывести схему размера $n^t$, аппроксимирующую $g_n$ с ошибкой $<t(n)$.
  Формально: существует p-time редукция $R$ такая, что по коду короткого EF-вывода $\pi$ для $tt(g_n,n^t,t(n))$ она строит схему $C$ размера $n^t$ с $\Pr_x[C(x)\ne g_n(x)]<t(n)$. 
  Идея: из короткого EF-вывода извлечь "свидетель" для $tt$-формулы (по сути, компактное описание схемы/гипотезы) и декодировать его в $C$. 
  Связь: это соответствует формализуемой редукции вида RedCorr/learning в Pich–Santhanam (см. шаг 2 и Theorem 9).
- (L3) Лемма (противоречие). Предпосылка: $g_n\in\mathrm{E}$ не аппроксимируется схемами размера $n^t$ с ошибкой $<t(n)$ (шаг 1). Тогда L2 дает схему такого размера с ошибкой $<t(n)$, что противоречит предпосылке.
**Формализационный минимум.**
**Шаблон.** $tt(g_n,n^t)$: никакая схема размера $n^t$ не аппроксимирует $g_n$ (ошибка ≥ $t(n)=1/2-1/2^{n/4}$, то есть $tt(g_n,n^t,t(n))$).
- (A+B) $\mathrm{S}^1_2$: кодирование $tt(h_{0,n},2^{n/4},t(n))$ и формализация $\mathrm{RedCorr}$ (редукция "learning $\leftarrow$ $\neg\exists$OWF").
- (C) EF: нижняя оценка (нет $2^{a n}$‑доказательств для $tt(g_n,n^t)$); затем Thm 9 / Cor. 2 $\Rightarrow$ схемные и равномерные нижние оценки.

**Определение (tt-формулы; Pich–Santhanam Sec. 2.4).** Пусть $f_n:\{0,1\}^n\to\{0,1\}$ задана своей таблицей истинности. Формула $tt(f_n,s)$ выражает, что ни одна схема размера $s$ не вычисляет $f_n$. Тогда $tt(f_n,s)$ --- тавтология тогда и только тогда, когда $f_n$ требует схем размера $>s$; размер формулы $\mathrm{poly}(2^n,s)$ (см. Sec. 2.4 для кодировки схем и формул). Аналогично, $tt(f_n,s,t)$ выражает, что все схемы размера $s$ ошибаются на доле входов $\ge t$; именно такие $tt$‑формулы используются как аксиомы в EF+tt (ср. шаблон $tt(g_n,n^t)$ выше).

**Определение (схема аксиом EF + tt(h,s,t); Pich–Santhanam Sec. 2.4).** Пусть $h\in\mathrm{E}$ и $s(2^n),t(2^n)$ --- p-time функции от $2^n$ такие, что для всех больших $n$ всякая схема размера $s(2^n)$ ошибается на доле не менее $t(2^n)$ при вычислении $h_n$. Тогда система $\mathrm{EF}+tt(h,s,t)$ --- это EF, расширенная возможностью использовать подстановочные экземпляры формул $tt(h_n,s(2^n),t(2^n))$ (для всех $n\ge n_0$) как аксиомы.

**Определение (anticheckers; Lipton-Young).** Для функции $f$ и параметра $s$ множество $A_n^{f,s}\subseteq\{0,1\}^n$ называется antichecker, если $|A_n^{f,s}|=\mathrm{poly}(s)$ и любая схема размера $s$ ошибается хотя бы на одном входе из $A_n^{f,s}$. Для функций $f$, трудных для схем размера $s^3$ (при $s\ge n^3$), такие множества существуют.
Связь: средняя (аппроксимационная) сложность $f$ дает anticheckers (Lipton-Young); это используется в Theorem 7.
См. построение в Pich–Santhanam, Sec. 3 (`resources/downloads/pich_santhanam_2023_ef_lower_bounds.pdf`).
Идея Theorem 7: anticheckers дают компактные свидетельства ошибки для всех схем размера $n^k$, что позволяет вывести схемные нижние оценки при неполиномиальности EF.
Замечание: это средняя-случайная линия и опирается на аппроксимационную сложность (см. условия Thm 7).
Связь с $tt$: antichecker можно рассматривать как компактный набор входов, который подкрепляет формулу $tt(f_n,s,t)$ (ошибка на заметной доле входов).
Различие: antichecker дает свидетель (существование набора входов), тогда как $tt$ утверждает универсально, что все схемы размера $s$ ошибаются на доле $\ge t(n)$.
Следствие: antichecker фиксирует средний случай и не дает худшего случая нижней оценки без дополнительных аргументов.
Замечание: antichecker — средний (approximation) объект, а не худший случай.
Связь с $t(n)$: antichecker фиксирует небольшой набор входов, на котором любая схема ошибается, что соответствует нижней оценке доли ошибок.
Это и есть average-case предпосылка: функция трудна для аппроксимации на заметной доле входов.
Связь с EF+$w$: при feasible anticheckers (Theorem 7) их существование формализуется через EF+$w$ и ведет к нижним оценкам на схемы.
Замечание: это дает средний случай; переход к худшему случаю требует дополнительных предположений.

**Теоремы 7–9 (Pich–Santhanam 2023, Sec. 3–5; цитируются).**
- **Thm 7 (feasible anticheckers, $k\ge 3$).** Если $\mathrm{S}^1_2$ доказывает существование p-time функции $f$, которая для каждого $n$ порождает SAT-решатель $B$ размера $\mathrm{poly}(n^k)$ или antichecker против всех схем размера $n^k$, то из "EF не p-bounded" следует $\mathrm{SAT}_n\notin\mathrm{Circuit}[n^k]$ для бесконечно многих $n$.
- **Thm 8 (OWF from $\mathrm{NP}\not\subseteq\mathrm{P/poly}$ + hardness of $\mathrm{E}$).** При средней-сложности $h_0\in\mathrm{E}$ против схем $2^{n/4}$ (см. $tt(h_0,2^{n/4},t(n))$) и $\mathrm{S}^1_2$-доказуемой редукции "OWF $\leftarrow$ $\mathrm{NP}\not\subseteq\mathrm{P/poly}$" (формализуется через $\mathrm{EF}+tt(h_0,2^{n/4},t(n))$), неполиномиальность этой системы влечет $\mathrm{SAT}\notin\mathrm{P/poly}$.
- **Thm 9 (learning from $\neg\exists$OWF + hardness of $\mathrm{E}$).** При тех же hardness-предпосылках и $\mathrm{S}^1_2$-доказуемой редукции "learning $\leftarrow$ $\neg\exists$OWF" (через $\mathrm{RedCorr}$ и аксиомы EF+tt), если $\mathrm{EF}+tt(h_0,\cdot)$ не имеет $2^{a n}$-доказательств для $tt(g_n,n^t)$ (см. шаблон выше), то $\mathrm{SAT}_n\notin\mathrm{Circuit}[n^k]$ (см. Pich–Santhanam, Sec. 5; для равномерного вывода см. Cor. 2).

**Определение (вариант с советом).** Вариант $w_{n,k,u}(f)$ получается из $w_{n,k}(f)$, если схемы $C$ интерпретируются как коды алгоритмов времени $O(n^k)$ с советом длины $u(n)$ (p-time, $u(n)\le n^k$). Пусть $W_{n,k,u}(f)$ — $\forall\Pi^b_1$-формализация "для всех $n>n_0$ формулы $w_{n,k,u}(f)$ — тавтологии". Обозначим через $\mathrm{Time}[n^k]/u(n)$ класс языков, решаемых такими алгоритмами.

**Обозначение.** $\mathrm{EF}+w_{k,u}(f)$ означает EF с аксиомной схемой $\{w_{n,k,u}(f): n\ge n_0\}$ (аналогично определению $\mathrm{EF}+tt(h,s,t)$ выше).

**Следствие (Pich–Santhanam 2023, Cor. 2).**
Пусть $k\ge 1$ и $u$ p-time, $u(n)\le n^k$.

1) Если существует p-time $f$ такое, что для всех больших $n$ $w_{n,k,u}(f)$ — тавтологии, и система $\mathrm{EF}+w_{k,u}(f)$ не p-bounded, то $\mathrm{SAT}\notin\mathrm{Time}[n^{\Omega(k)}]/u(n)$ бесконечно многих $n$.

2) Если $\mathrm{S}^1_2\vdash W_{n,k,u}(f)$ и EF не p-bounded, то то же заключение.

**Определение (Frege, грубо).** Frege‑система — фиксированный конечный набор схем аксиом и правил вывода (например, modus ponens), полный для исчисления высказываний. *Frege‑доказательство* тавтологии $\varphi$ — вывод $\varphi$ из этих схем/правил. Размер обычно измеряют суммарной длиной всех формул вывода. (Разные Frege‑системы полиномиально эквивалентны.)

**Определение (Extended Frege / EF, грубо).** EF — это Frege с *расширениями*: разрешается вводить новую переменную $p$ как сокращение формулы $\psi$ (например, через аксиомы $p\leftrightarrow\psi$) и дальше использовать $p$ в доказательстве. Это даёт «переиспользование подформул» и делает EF одной из самых сильных стандартных пропозициональных систем.

**Примечание.** AC⁰‑Frege существенно слабее EF: нижние оценки для фиксированной глубины не дают нижних оценок для EF, поэтому Pich–Santhanam работают именно с EF‑уровнем.

**Определение (bounded‑depth Frege / AC⁰‑Frege, грубо).** Это Frege‑система с дополнительным ограничением: каждая формула в выводе имеет ограниченную глубину $d$ (как булева формула с AND/OR и отрицаниями на входах). Нижние оценки для fixed $d$ обычно доказываются через switching lemma.

**Определение (Cutting Planes / CP, грубо).** CP‑опровержение строит противоречие из системы линейных неравенств над 0/1‑переменными, полученной из CNF. Правила вывода включают сложение неравенств и деление на целое с округлением (корректно из‑за целочисленности решений). Стандартная форма завершает выводом $-1\ge 0$. Точное определение — в `resources/downloads/buss_cutting_planes_notes.pdf`, Sec. 2.

### 15.8. PHP имеет полиномиальное опровержение в CP (полное доказательство)

Здесь видно «почему» резолюция слаба: PHP экспоненциально трудна для резолюции, но элементарно опровергается в CP за счёт счётного (линейного) аргумента.

Рассмотрим $m=n+1$ голубей и $n$ норок, переменные $x_{i,j}\in\{0,1\}$.

Вместо CNF‑кодировки из Sec. 15 используем эквивалентную (на $\{0,1\}$) систему линейных неравенств:

1) *(голубь где‑то сидит)* для каждого $i\in\{1,\dots,m\}$:
$$\sum_{j=1}^n x_{i,j}\ \ge\ 1.$$

2) *(не вместе)* для каждого $j\in\{1,\dots,n\}$:
$$\sum_{i=1}^m x_{i,j}\ \le\ 1,$$
то есть эквивалентно
$$-\sum_{i=1}^m x_{i,j}\ \ge\ -1.$$

Замечание: попарные CNF‑клаузы $(\neg x_{i,j}\lor\neg x_{i',j})$ на $\{0,1\}$ эквивалентны ограничению $\sum_i x_{i,j}\le 1$ ("не более одной единицы в столбце"): $(\Leftarrow)$ очевидно, а если $\sum_i x_{i,j}\ge 2$, то найдутся $i\ne i'$ с $x_{i,j}=x_{i',j}=1$, и клауза становится ложной.

**Теорема 15.8.** Существует CP‑опровержение $\mathrm{PHP}^{n}_{n+1}$ размера $\mathrm{poly}(n)$.

*Доказательство.* Обозначим $S:=\sum_{i=1}^m\sum_{j=1}^n x_{i,j}$.

Сложим неравенства (1) по всем $i$ (правило сложения CP): получаем
$$S\ \ge\ m\ =\ n+1.$$ 

Сложим неравенства (2') по всем $j$ (в форме с $\ge$):
$$-S\ \ge\ -n.$$ 

Сложив эти два неравенства, получаем $0\ge 1$ (эквивалентно $-1\ge 0$), то есть противоречие. Значит система не имеет 0/1‑решений, и это и есть CP‑опровержение.

*Оценка размера.* Мы используем $O(n)$ сложений, каждое неравенство имеет $O(n)$ мономов, поэтому общий размер вывода $\mathrm{poly}(n)$. $\square$


In [1]:
from itertools import combinations, permutations, product


def php_cnf(num_holes: int, num_pigeons: int) -> tuple[CNF, int]:
    if num_holes <= 0 or num_pigeons <= 0:
        raise ValueError("num_holes and num_pigeons must be positive")

    def var(i: int, j: int) -> int:
        return i * num_holes + j + 1

    cnf: CNF = []
    # Each pigeon is in at least one hole.
    for i in range(num_pigeons):
        cnf.append(tuple(var(i, j) for j in range(num_holes)))

    # No hole contains two pigeons.
    for j in range(num_holes):
        for i1, i2 in combinations(range(num_pigeons), 2):
            cnf.append((-var(i1, j), -var(i2, j)))

    return cnf, num_pigeons * num_holes


def _is_tautological_clause(clause: frozenset[int]) -> bool:
    return any(-lit in clause for lit in clause)


def resolution_refutable(cnf: CNF, *, max_clauses: int = 20_000) -> bool:
    clauses: set[frozenset[int]] = {frozenset(c) for c in cnf}
    clauses = {c for c in clauses if not _is_tautological_clause(c)}

    changed = True
    while changed:
        changed = False
        clause_list = list(clauses)
        for i in range(len(clause_list)):
            c1 = clause_list[i]
            for j in range(i + 1, len(clause_list)):
                c2 = clause_list[j]
                for lit in c1:
                    if -lit not in c2:
                        continue
                    resolvent = (c1 - {lit}) | (c2 - {-lit})
                    if _is_tautological_clause(resolvent):
                        continue
                    if not resolvent:
                        return True
                    if resolvent not in clauses:
                        clauses.add(resolvent)
                        changed = True
                        if len(clauses) > max_clauses:
                            return False

    return False


def check_php_small() -> None:
    for n in range(1, 4):
        cnf, num_vars = php_cnf(n, n + 1)
        assert satisfiable(cnf, num_vars) is False
    print("OK: PHP_{n+1}^n не выполнима для n=1..3 (полный перебор)")

    cnf, _ = php_cnf(2, 3)
    assert resolution_refutable(cnf)
    print("OK: для PHP_3^2 найдено резолюционное опровержение (наивное замыкание)")


check_php_small()


def php_var(num_holes: int, pigeon: int, hole: int) -> int:
    return pigeon * num_holes + hole + 1


def php_unvar(num_holes: int, v: int) -> tuple[int, int]:
    if v <= 0:
        raise ValueError("variable id must be positive")
    v -= 1
    return v // num_holes, v % num_holes


def positive_clause_php(clause: Clause, num_holes: int, num_pigeons: int) -> Clause:
    out: set[int] = set()
    for lit in clause:
        if lit > 0:
            out.add(lit)
            continue
        pigeon, hole = php_unvar(num_holes, -lit)
        for other in range(num_pigeons):
            if other != pigeon:
                out.add(php_var(num_holes, other, hole))
    return tuple(sorted(out))


def critical_assignments_php(num_holes: int, num_pigeons: int) -> list[dict[int, bool]]:
    if num_pigeons != num_holes + 1:
        raise ValueError("expected num_pigeons = num_holes + 1")

    all_vars = [php_var(num_holes, i, j) for i in range(num_pigeons) for j in range(num_holes)]
    holes = list(range(num_holes))
    out: list[dict[int, bool]] = []

    for left_out in range(num_pigeons):
        pigeons = [i for i in range(num_pigeons) if i != left_out]
        for perm in permutations(holes):
            assignment = {v: False for v in all_vars}
            for i, hole in zip(pigeons, perm):
                assignment[php_var(num_holes, i, hole)] = True
            out.append(assignment)

    return out


def check_positive_translation_lemma(max_n: int = 4) -> None:
    for n in range(1, max_n + 1):
        num_holes = n
        num_pigeons = n + 1
        cnf, _ = php_cnf(num_holes, num_pigeons)
        crit = critical_assignments_php(num_holes, num_pigeons)

        for clause in cnf:
            clause_plus = positive_clause_php(clause, num_holes, num_pigeons)
            for a in crit:
                lhs = any(eval_literal(lit, a) for lit in clause)
                rhs = any(a[v] for v in clause_plus)
                assert lhs == rhs

    print("OK: Lemma 15.4 verified on all initial PHP clauses for n=1..4")


check_positive_translation_lemma(4)


def php_inequalities_satisfiable(num_holes: int) -> bool:
    """Brute-force check for the natural inequality encoding of PHP.

    Variables: x_{i,j} in {0,1}, i in [0..n], j in [0..n-1].
    Constraints:
      - for each pigeon i: sum_j x_{i,j} >= 1
      - for each hole j:   sum_i x_{i,j} <= 1
    """
    if num_holes <= 0:
        raise ValueError("num_holes must be positive")

    num_pigeons = num_holes + 1
    num_vars = num_pigeons * num_holes

    for bits in product([0, 1], repeat=num_vars):
        def x(i: int, j: int) -> int:
            return bits[i * num_holes + j]

        if any(sum(x(i, j) for j in range(num_holes)) < 1 for i in range(num_pigeons)):
            continue
        if any(sum(x(i, j) for i in range(num_pigeons)) > 1 for j in range(num_holes)):
            continue
        return True

    return False


for n in range(1, 4):
    assert php_inequalities_satisfiable(n) is False
print("OK: inequality encoding of PHP is unsatisfiable for n=1..3 (brute force)")


NameError: name 'CNF' is not defined

## 16. IP = PSPACE и PCP (цитируется)

Эти теоремы не доказывают $\mathrm{P}\neq\mathrm{NP}$, но важны как:
- флагманские примеры **нерелятивизирующих** методов (через аритметизацию),
- источник центральных следствий (например, hardness of approximation).

### 16.1. Interactive proofs: IP

**Определение.** Язык $L$ принадлежит $\mathrm{IP}$, если существует вероятностный полиномиальный верификатор $V$ и интерактивный протокол с доказывающим $P$ (неограниченным), такой что:
- *(Полнота)* если $x\in L$, то существует стратегия $P$, при которой $V$ принимает с вероятностью $\ge 2/3$;
- *(Звуковость)* если $x\notin L$, то для любой стратегии $P$ верификатор принимает с вероятностью $\le 1/3$.

**Лемма 16.1 (легкая сторона).** $\mathrm{IP}\subseteq\mathrm{PSPACE}$.

*Доказательство.* Рассмотрим дерево всех возможных транскриптов протокола (число раундов и длины сообщений полиномиальны). Листы помечены 0/1 (reject/accept).
В узлах верификатора берём среднее по его случайным битам, в узлах доказывающего — максимум по сообщению. Значение корня равно оптимальной вероятности принятия.
Это значение вычисляется обходом в глубину, храня только текущий транскрипт и счётчики; память $\mathrm{poly}(|x|)$ (время может быть экспоненциальным). $\square$

**Теорема (Shamir, 1992; цитируется).** $\mathrm{PSPACE}\subseteq\mathrm{IP}$, поэтому $\mathrm{IP}=\mathrm{PSPACE}$.

### 16.2. Probabilistically Checkable Proofs: PCP

**Определение.** Класс $\mathrm{PCP}(r(n),q(n))$ состоит из языков, для которых существует вероятностный полиномиальный верификатор, который использует $r(n)$ случайных бит и запрашивает $q(n)$ битов «доказательства» (oracle access), с полнотой/звуковостью как выше.

**Лемма 16.2 (легкая сторона).** $\mathrm{PCP}(O(\log n), O(1))\subseteq\mathrm{NP}$.

*Доказательство.* Пусть $L\in\mathrm{PCP}(r(n),q(n))$ при $r(n)=O(\log n)$ и $q(n)=O(1)$. NP‑верификатор угадывает строку доказательства $\pi$ (полиномиальной длины) и перебирает все $2^{r(|x|)}=\mathrm{poly}(|x|)$ случайные строки, симулируя верификатор $V$ с oracle‑доступом к $\pi$. Принимаем, если доля принятий $\ge 2/3$. $\square$

**Теорема (PCP, Arora–Safra; ALMSS; Dinur; цитируется).** $\mathrm{NP}\subseteq\mathrm{PCP}(O(\log n), O(1))$, поэтому $\mathrm{NP}=\mathrm{PCP}(O(\log n), O(1))$.

**Типовое следствие (формулировка‑шаблон).** Существует константа $\varepsilon>0$, такая что задача отличить выполнимые 3CNF от формул, у которых нельзя удовлетворить более чем $(1-\varepsilon)$ долю клауз, NP‑трудна.

## 17. Источники и опорные ссылки

**Постановка и базовые учебники**
- Clay Mathematics Institute (формулировка P vs NP): resources/downloads/clay_p_vs_np.pdf
- M. Sipser, *Introduction to the Theory of Computation*: resources/downloads/sipser_book.html
- O. Goldreich, *P, NP, and NP‑Completeness* (конспект): resources/downloads/goldreich_np.pdf
- S. Arora, B. Barak, *Computational Complexity: A Modern Approach* (draft PDF): resources/downloads/arora_barak.pdf

**Обзоры (статус и контекст)**
- L. Fortnow (2021), *Fifty Years of P Versus NP and the Possibility of the Impossible* (PDF): resources/downloads/fortnow_pvnp50_2021.pdf
- S. Aaronson (2017), *P = NP* (ECCC TR17-004, PDF): resources/downloads/aaronson_pnp_2017.pdf
- L. Fortnow (2009), *The Status of the P versus NP Problem* (CACM, PDF): resources/downloads/fortnow_cacm_2009.pdf
- D. van Melkebeek (2007), *A Survey of Lower Bounds for Satisfiability and Related Problems* (PDF): resources/downloads/van_melkebeek_2007_survey.pdf

**NP‑полнота**
- S. Cook (1971), *The Complexity of Theorem‑Proving Procedures* (Cook–Levin): resources/downloads/cook_1971.pdf
- R. Karp (1972), *Reducibility Among Combinatorial Problems* (PDF): resources/downloads/karp_1972.pdf

**Барьеры**
- Baker–Gill–Solovay (1975), *Relativizations of the P = ? NP Question* (см. `resources/downloads/jkatz_relativization_2005.pdf`).
- S. Arora, R. Impagliazzo, U. Vazirani (1992), *Relativizing versus Nonrelativizing Techniques: The Role of Local Checkability* (PDF): resources/downloads/arora_impagliazzo_vazirani_1992.pdf
- J. Katz (2005), *Relativizing the P vs. NP Question* (lecture notes, PDF): resources/downloads/jkatz_relativization_2005.pdf
- R. de Haan (2021), *Lecture 5: Relativization and the Baker-Gill-Solovay Theorem* (PDF): resources/downloads/uva_relativization_lecture5_2021.pdf
- Razborov–Rudich (1997), *Natural Proofs* (PDF): resources/downloads/razborov_rudich_1997.pdf
- Aaronson–Wigderson (2008), *Algebrization: A New Barrier in Complexity Theory* (PDF): resources/downloads/aaronson_wigderson_2008.pdf
- L. Chen, Y. Hu, H. Ren (2025), *New Algebrization Barriers to Circuit Lower Bounds via Communication Complexity of Missing-String* (PDF): resources/downloads/chen_hu_ren_2025_algebrization_barriers.pdf

**Bounded arithmetic (для EF / proof complexity)**
- S. Buss (1995), *Bounded Arithmetic and Propositional Proofs, Part I: Bounded Arithmetic* (PDF): resources/downloads/buss_1995_bounded_arithmetic_notes.pdf
- A. Razborov, *Bounded Arithmetic and Lower Bounds in Boolean Complexity* (PDF): resources/downloads/razborov_bobo.pdf
- J. Krajíček (1995), *Bounded Arithmetic, Propositional Logic, and Complexity Theory* (PDF): resources/downloads/krajicek_1995_bounded_arithmetic_book.pdf
- S. Cook, P. Nguyen (2010), *Logical Foundations of Proof Complexity* (PDF): resources/downloads/cook_nguyen_2010_logical_foundations.pdf

**Proof complexity**
- T. Pitassi, I. Tzameret (2016), *Algebraic Proof Complexity: Progress, Frontiers and Challenges* (PDF): resources/downloads/pitassi_tzameret_2016_algebraic_proof_complexity.pdf
- A. Atserias, M. Mahajan, J. Nordström, A. Razborov (2024), *Proof Complexity and Beyond* (Oberwolfach report, PDF): resources/downloads/atserias_etal_2024_proof_complexity_beyond.pdf
- Cook–Reckhow (1979), *The Relative Efficiency of Propositional Proof Systems* (PDF): resources/downloads/cook_reckhow_1979.pdf
- P. Pudlák (1998), *The Lengths of Proofs* (PDF): resources/downloads/pudlak_1998_lengths_of_proofs.pdf
- S. Buss (2002), *Some Remarks on Lengths of Propositional Proofs* (PDF): resources/downloads/buss_2002_proplengths.pdf
- S. Buss (2011), *Towards NP–P via Proof Complexity and Search* (PDF): resources/downloads/buss_2011_np_p_proof_complexity.pdf
- Haken (1985), *The Intractability of Resolution* (см. `resources/downloads/tss_proof_complexity_notes.pdf`).
- S. Buss (1987), *Polynomial Size Proofs of the Propositional Pigeonhole Principle* (PDF): resources/downloads/buss_1987_php_frege.pdf
- P. Beame, R. Impagliazzo, J. Krajíček, T. Pitassi, P. Pudlák, A. Woods (1992), *Exponential Lower Bounds for the Pigeonhole Principle* (PDF): resources/downloads/beame_et_al_1992_php_bounded_depth_frege.pdf
- S. Buss, P. Clote (2002), *Cutting planes, connectivity, and threshold logic* (PDF): resources/downloads/buss_cutting_planes_notes.pdf
- J. Pich, R. Santhanam (2023), *Towards P ≠ NP from Extended Frege lower bounds* (PDF): resources/downloads/pich_santhanam_2023_ef_lower_bounds.pdf
- R. de Wolf, *Pigeonhole and resolution (notes; Haken lower bound)* (PDF): resources/downloads/de_wolf_resolutionlowerbound.pdf
- Ben‑Sasson–Wigderson (2001), *Short Proofs are Narrow—Resolution Made Simple* (PDF): resources/downloads/ben_sasson_wigderson_2001.pdf
- M. Lauria (2015), *Lecture 2: Resolution Lower Bounds via the Pigeonhole Principle* (PDF): resources/downloads/lauria_lecture2_2015.pdf
- University of Toronto (TSS, 2021), *Introduction to Proof Complexity* (notes, PDF): resources/downloads/tss_proof_complexity_notes.pdf

**Неравномерность (P/poly)**
- Karp–Lipton (1980), *Some connections between nonuniform and uniform complexity classes* (см. `resources/downloads/trevisan_lecture05_2008.pdf`).
- L. Trevisan (2008), *Lecture 5: The Karp-Lipton-Sipser Theorem* (notes, PDF): resources/downloads/trevisan_lecture05_2008.pdf

**Схемные нижние оценки и техника**
- Furst–Saxe–Sipser (1984), *Parity, circuits, and the polynomial-time hierarchy* (PDF): resources/downloads/fss_1984.pdf
- J. Håstad (1986), *Almost Optimal Lower Bounds for Small Depth Circuits* (PDF): resources/downloads/hastad_1986.pdf
- R. Smolensky (1987), *Algebraic methods in the theory of lower bounds for Boolean circuit complexity* (PDF): resources/downloads/smolensky_1987.pdf
- A. Razborov (1985), *Lower bounds for the monotone complexity of some Boolean functions* (PDF): resources/downloads/razborov_1985_monotone.pdf
- S. Grewal, V. M. Kumar (2024), *Improved Circuit Lower Bounds and Quantum-Classical Separations* (PDF): resources/downloads/grewal_kumar_2024_gc0.pdf
- R. O’Donnell (курс/лекции; switching lemma и AC⁰‑нижние оценки): resources/downloads/odonnell_course.html
- R. O’Donnell (2009), *Lecture 14: The Switching Lemma* (PDF): resources/downloads/odonnell_course.htmllecture14.pdf

**Алгебраические подходы (GCT)**
- M. Bläser, C. Ikenmeyer (2025), *Introduction to Geometric Complexity Theory* (PDF): resources/downloads/blaser_ikenmeyer_2025_gct_intro.pdf

**PCP**
- S. Arora, S. Safra (1998), *Probabilistic Checking of Proofs: A New Characterization of NP* (PDF): resources/downloads/arora_safra_1998_pcp.pdf
- S. Arora, C. Lund, R. Motwani, M. Sudan, M. Szegedy (1998), *Proof Verification and the Hardness of Approximation Problems* (PDF): resources/downloads/almss_1998_pcp.pdf
- I. Dinur (2007), *The PCP Theorem by Gap Amplification* (PDF): resources/downloads/dinur_2007_pcp.pdf



**Интерактивные доказательства и дерэндомизация**
- A. Shamir (1992), *IP = PSPACE* (PDF): resources/downloads/shamir_1992.pdf
- N. Nisan, A. Wigderson (1994), *Hardness vs. Randomness* (PDF): resources/downloads/nisan_wigderson_1994.pdf


**Примечание.** Термин $\mathrm{Time}[n^k]/u(n)$ фиксирован в Sec. 9; схема $w_{n,k,u}(f)$ — в Sec. 15.7.
(Локальный манифест ссылок/скачивалка: `resources/manifest.tsv`, `resources/download_resources.py`; скачанные PDF: `resources/downloads/`.)
