# Теория кодирования

## Терминология

Пусть у нас есть два пространства слов $\mathbb{W}$ и $\mathbb{C}$ над алфавитом $\mathbb{Q}$. Тогда код это некоторое подпространство слов $\mathcal{C} \subseteq \mathbb{C}$, для которого существует биекция (или хотя бы сюръекция) из $\mathbb{W}$.

В теории кодирования изучается следующая модель:

1. Источник: $w \in \mathbb{W}$
2. Кодирование: $\operatorname{encoding} : \mathbb{W} \rightarrow \mathcal{C}$, $c = \operatorname{encoding}(w)$
3. Модуляция: $\operatorname{modulating} : \mathbb{C} \leftrightarrow \mathbb{X}^*$, $x = \operatorname{modulating}(c)$
4. Передача данных по каналу: $\operatorname{transfer} : \mathbb{X}^* \rightarrow \mathbb{Y}^*$, $y = \operatorname{transfer}(x)$
5. Демодуляция: $\operatorname{demodulating} : \mathbb{Y}^* \leftrightarrow \hat{\mathbb{C}}$, $\hat{c} = \operatorname{demodulating}(y)$
6. Декодирование: $\operatorname{decoding} : \hat{\mathbb{C}} \rightarrow \hat{\mathbb{W}}$, $\hat{w} = \operatorname{decoding}(\hat{c})$

Если $|\mathbb{W}| \le |\mathbb{C}|$, то такую модель изучает теория помехоустойчивого кодирования. Если же $|\mathbb{W}| \ge |\mathbb{C}|$, то такую модель изучает теория сжатия данных. В данном курсе рассматривается только теория помехоустойчивого кодирования.

## Кодирование

Суть кодирования заключается в том, чтобы сопоставить слову $w \in \mathbb{W}$ некоторое слово из $c \in \mathcal{C} \subseteq \mathbb{C}$ таким образом, чтобы результатом декодировании целой группа похожих слов $\mathcal{S}(c) \subset \mathbb{C}$ было $w$. Величина такой $\max_{c \in \mathcal{C}}|\mathcal{S}(c)|$ группы слов характеризует избыточность кода.

### Систематическое и несистематическое кодирование

Систематическим кодированием называется такое кодирование, что $w$ всегда является подпоследовательностью $c$. В противном случае кодирование является несистематическим. При систематическом кодировании избыточные символы отделены от информационных, при несистематическом же избыточность вносится на уровне всего слова.

## Декодирование

Суть декодирования заключается в том, чтобы сопоставить полученному кодовому слову $y \in \mathbb{C}$ некоторое слово $\hat{c} \in \mathcal{C} \subseteq \mathbb{C}$ таким образом, чтобы минимизировать вероятность $P\{\hat{c} \not= c\}$. Понятно, что из $\hat{c} \in \mathcal{C}$ далее легко получить снова $w \in \mathbb{W}$ (или хотя бы $\hat{w} \in \hat{\mathbb{W}}$).

### Посимвольное и поблоковое декодирование

В зависимости от принципа работы декодера, можно различать:

* Посимвольное декодирование $\operatorname{decoding} : \hat{\mathbb{C}} \rightarrow \mathbb{Q}^*$, при котором результат даже не обязан быть из $\mathbb{W}$ (но может и быть обязан)
* Поблоковое декодирование $\operatorname{decoding} : \hat{\mathbb{C}} \rightarrow \mathbb{W}$
* Списочное декодирование $\operatorname{decoding} : \hat{\mathbb{C}} \rightarrow \mathbb{W}^*$, при котором результат это группа ближайших слов из $\mathbb{W}$

### Жёсткое и мягкое декодирование

Введём понятие вероятностного множества $P(\mathbb{A})$ — т.е. вероятности встречи для каждого слова из $\mathbb{A}$. Тогда:

* В демодуляторе различают жёсткое детектирование при $\hat{\mathbb{C}} = \mathbb{C}$ и мягкое детектирование при $\hat{\mathbb{C}} = P(\mathbb{C})$.
* В декодере различают жёсткое декодирование при $\hat{\mathbb{C}} = \mathbb{C}$ и мягкое декодирование при $\hat{\mathbb{C}} = P(\mathbb{C})$.
* В декодере различают декодирование с жёстким выходом при $\hat{\mathbb{W}} = \mathbb{W}$ и декодирование с мягким выходом при $\hat{\mathbb{W}} = P(\mathbb{W})$.

Такие разновидности декодеров позволяют комбинировать их друг с другом.

## Критерии декодирования

### Критерий максимума апостериорной вероятность (критерий идеального наблюдателя)

Естественным критерием качества декодирования является вероятность несовпадения оценки $\hat{x}$ и истинного сообщения $x$. Если $y$ — принятый вектор, то такая вероятность ошибки равна:

$$P_{error} = P \{x \neq \hat{x}\} = \sum_{x \neq \hat{x}} P_{X|Y} \{x|y\} = 1 - P_{X|Y} \{\hat{x}|y\}$$

Очевидно, что минимальная вероятность ошибки достигается при выборе:

$$\hat{x} = \underset{x}{\operatorname{argmax}} P_{X|Y} \{x|y\}$$

### Критерий максимума правдоподобия

$$\hat{x} = \underset{x}{\operatorname{argmax}} P_{Y|X} \{y|x\}$$

В общем случае, данные два критерия не являются эквивалентными. Однако если все сообщения равновероятны (т.е. $\forall x . P_X \{x\} = s$), тогда по теореме Байеса можно вывести, что

$$
\underset{x}{\operatorname{argmax}} P_{Y|X} \{y|x\} =
\underset{x}{\operatorname{argmax}} \frac{P_{X|Y} \{x|y\} P_Y \{y\}}{P_X \{x\}} =
\underset{x}{\operatorname{argmax}} \frac{P_{X|Y} \{x|y\}}{s} =
\underset{x}{\operatorname{argmax}} P_{X|Y} \{x|y\}
$$

При посимвольном декодировании верно для каналов без памяти:

$$
\hat{x} =
\underset{x}{\operatorname{argmax}} P_{Y^n|X^n} \{y|x\} =
\underset{x}{\operatorname{argmax}} P_{Y^n|X^n} \{y_1, y_2, \dots y_n|x_1, x_2, \dots x_n\} =
\underset{x}{\operatorname{argmax}} \prod_{i=1}^{n} P_{Y|X} \{y_i|x_i\}
$$

### Логарифмическое отношение правдоподобия

В случае $\mathbb{X} = \{a, b\}$ часто полезно оценить надёжность оценки для каждого символа через логарифмическое отношение:

$$L = \ln\frac{P \{x_i=a|y\}}{P \{x_i=b|y\}} = \ln\frac{\sum_{x|x_i=a} P_{X|Y} \{x|y\}}{\sum_{x|x_i=b} P_{X|Y} \{x|y\}}$$



### Критерий минимального расстояния

Введём функцию расстояния $d(x,y) : \mathbb{Y} \times \mathbb{Y} \rightarrow \mathbb{D}$, где $\mathbb{D} \subseteq \mathbb{R}_{+}$. Тогда критерием минимального расстояния будет являться:

$$\hat{x} = \underset{x}{\operatorname{argmin}} d(y,x)$$

* В случае двоичного симметричного канала если $p \le \frac{1}{2}$, то критерий минимального расстояния Хэмминга эквивалентен критерию максимума правдоподобия.
* В случае канала с АБГШ критерий минимального Евклидового расстояния эквивалентен критерию максимума правдоподобия: