# Линейные коды

## Терминология

Рассмотрим векторное $n$-мерное пространство $\mathbb{F}^n_q$, где $q$ --- количество элементов. Выберем подпространство размерности $k$ ($n > k$). Полученна конструкция называется линейным блоковым кодом длины $n$, размерности $k$ и арности $q$. При $q = 2$ такой линейный блоковый код называется двоичным. Параметр $R = \frac{k}{n}$ называется скоростью кода.

Отображение $coding = \mathbb{F}^k_q \rightarrow \mathbb{F}^n_q$ называется процессом кодирования, в то время как $decoding = \mathbb{F}^n_q \rightarrow \mathbb{F}^k_q$ описывает процесс декодирования. При кодировании мы вносим избыточную информацию, добавляя проверочные $n - k$ символов. Эти же проверочные символы позволяют учитывать возможные ошибки в кодовых словах.

## Порождающая и проверочная матрица

Рассмотрим два вектора таких, что $w \in \mathbb{F}^k_q $ и $c \in \mathbb{F}^n_q$. Тогда преобразование можно рассматривать как умножение вектора на матрицу, а именно:

$$c = w \cdot \underset{k \times n}{G}$$

Матрица $G$ называется порождающей матрицей. Проверочной же матрицей называется такая матрица $H$, которая удовлетворяет условию:

$$\underset{k \times n}{G} \cdot \underset{n \times (n - k)}{H^T} = 0$$

Слово $c$ является кодовым тогда и только тогда, когда $c \cdot H^T = 0$.

## Нахождение порождающей и проверочной матриц

Пусть у нас существуют матрицы $G'$ и $H'$ такие, что $G' = [I_k | S]$ и ${H'}^T = [-S^T | I_k]$, где $S$ --- некоторая матрица, а $I_k$ --- единичная матрица размерности $k$. Нетрудно показать, что $G' \cdot {H'}^T = 0$.

Тогда путём линейных преобразований можно научиться строить соответствующие матрицы для $G$ и $H$. Для построения $G'$ воспользуемся методом Гаусса. В процессе метода Гаусса мы будем выполнять линейные преобразования над строками (что не поменяет наш код) и перестановку столбцов. Тогда будем считать, что $G' = G \cdot P_G$, где $P_G$ --- матрица перестановки. Аналогично и для $H'$ (в конце единичную матрицу можно переставить в конец). Для неё введём $P_H$ такую, что $H' = H \cdot P_H$.

Зная, что $(G \cdot P_G) \cdot (P_G^{-1} \cdot H^T) = G \cdot H^T = 0 = G' \cdot {H'}^T = (G \cdot P_G) \cdot {H'}^T$, получаем, что $(P_G^{-1} \cdot H^T) = {H'}^T$, откуда следует, что $H = H' \cdot P_G$.

Аналогично зная, что $(G' \cdot P_H) \cdot (P_H^{-1} \cdot {H'}^T) = G' \cdot {H'}^T = 0 = G \cdot H^T = G \cdot (P_H^{-1} \cdot {H'}^T)$, получаем, что $G = G' \cdot P_H$.

In [1]:
from algebra.binary import binary_array

reed_muller_mt = binary_array([
    [1, 1, 1, 1, 1, 1, 1, 1],
    [1, 1, 1, 1, 0, 0, 0, 0],
    [1, 1, 0, 0, 1, 1, 0, 0],
    [1, 0, 1, 0, 1, 0, 1, 0],
])
print(reed_muller_mt)

[[1 1 1 1 1 1 1 1]
 [1 1 1 1 0 0 0 0]
 [1 1 0 0 1 1 0 0]
 [1 0 1 0 1 0 1 0]]


In [2]:
from coding.linear import gen_to_check

h = gen_to_check(g=reed_muller_mt)
print(h)

[[1 1 1 1 0 0 0 0]
 [0 0 1 1 1 1 0 0]
 [1 0 1 0 1 0 1 0]
 [1 0 0 1 1 0 0 1]]


In [3]:
from coding.linear import check_to_gen

g = check_to_gen(h=reed_muller_mt)
print(g)

[[1 1 1 1 0 0 0 0]
 [0 0 1 1 1 1 0 0]
 [1 0 1 0 1 0 1 0]
 [1 0 0 1 1 0 0 1]]


## Минимальное расстояние

Расстояние Хэмминга между векторами $x$ и $y$ --- количество позиций, в которых вектора $x$ и $y$ отличаются: $d_H(x, y) = | \{ i | x_i \neq y_i \} |$.

Пусть у нас есть код $C$. Будем называть минимальным расстоянием $d = \min_{x \in C, y \in C \setminus \{x\}} d_H(x, y)$.

Минимальное расстояние кода говорит о том, насколько вектора из $coding(\mathbb{F}^k_q)$ отличаются в пространстве $\mathbb{F}^n_q$. Если мы допустим $t$ ошибок в полученном кодовом слове, то мы можем отойти от исходного кодового слова на расстояние не большее, чем $t$, и при этом приблизится к другим кодовым словам на расстояние не больше, чем $t$. Если мы хотим, чтобы ошибки были исправлены, то необходимо, чтобы наш код имел расстояние $d \ge 2k + 1$.

Также необходимо рассмотреть такую проблему, как стирания. Если мы преобразуем наш вектор размера $n$ в вектор размера $n-v$, выкинув случайные элементы вектора, то тем самым отойдём от исходного кодового сова на расстояние $v$, но при этом ни к каким другим кодовым словам не приблизимся. Отсюда можно сделать вывод, что код с минимальным расстоянием $d$ исправляет $t$ ошибок и $v$ стираний тогда и только тогда, когда $d \ge 2k + v + 1$.

## Ограничения линейных кодов

Опираясь на различные свойства кодов, можно определить некоторые взаимные ограничения на параметры $n$, $k$, $d$ и $q$. В дальнейшем большими буквами $N$, $K$ и т.д. будем обозначать функции соответствующих параметров, зависящие от прочих параметров.

Введём так же определение числа слов кода как $A_q$. Для линейного кода число слов равно $A_q(k) = q^k$.

### Граница Синглтона

Для любого блокового кода верно:

$$A_q(n, d) \le q^{n - d + 1}$$

In [4]:
from coding.linear.singleton import singleton_bound

max_value = singleton_bound(q=2, n=19, d=3)
print("A₂(19, 3) ≤ " + str(max_value))

A₂(19, 3) ≤ 131072


### Граница Хэмминга

Если для блокового кода верно, что $d = 2t + 1$, то:

$$A_q(n, d) \le \frac{q^n}{\sum_{i = 0}^{t} C_n^i (q - 1)^i}$$

In [5]:
from coding.linear.hamming import hamming_bound

max_value = hamming_bound(q=2, n=19, d=3)
print("A₂(19, 3) ≤ " + str(max_value))

A₂(19, 3) ≤ 26214.4


### Граница Варшамова-Гилберта

Существует блоковый код, удовлетворяющий неравенству:

$$A_q(n, d) \ge \frac{q^n}{\sum_{i=0}^{d-1} C_n^i (q-1)^i}$$

### Граница Варшамова-Гилберта для линейных кодов

Существует линейный блоковый код с числом слов $A_q(n, d) \ge q^k$, где $k$ --- наибольшее целое число, такое что:

$$q^k \le \frac{q^n}{\sum_{i=0}^{d-2} C_{n-1}^i (q-1)^i}$$

In [6]:
from coding.linear.gilbert_varshamov import gilbert_varshamov_bound

max_value = gilbert_varshamov_bound(q=2, n=19, d=3)
print("A₂(19, 3) ≥ " + str(max_value))

A₂(19, 3) ≥ 16384


### Граница Грайсмера

Для двоичного линейного кода верно:

$$N(k, d) \ge d + N\Bigl(k - 1, \Bigl\lceil\frac{d}{2}\Bigr\rceil\Bigr)$$

In [7]:
from coding.linear.griesmer import griesmer_bound

max_value = griesmer_bound(k=14, d=5)
print("N(14, 5) ≥ " + str(max_value))

N(14, 5) ≥ 21
