# Теория кодирования

## Канал передачи информации

Канал передачи данных характеризуется тремя составляющими:

* Входной алфавит $\mathbb{X}$ и случайная величина $X \in \mathbb{X}$
* Выходной алфавит $\mathbb{Y}$ и случайная величина $Y \in \mathbb{Y}$
* Условное распределение $P_{Y^m|X^n} \{y|x\}$, где $x \in \mathbb{X}^n$ и $y \in \mathbb{Y}^m$

## Виды каналов

Если $\mathbb{X}, \mathbb{Y} \in FinSet$, то такой канал называется дискретным. Если $\mathbb{X} \in FinSet, \mathbb{Y} \subseteq \mathbb{R}$, то такой канал называется полунепрерывным. Если $\mathbb{X}, \mathbb{Y} \subseteq \mathbb{R}$, то такой канал называется непрерывным. Дискретный канал называется $q$-ичным, если $|\mathbb{X}| = |\mathbb{Y}| = q$ (при $q = 2$ канал называется двоичным).

В случае дискретных алфавитов распределение $P_{Y|X} \{y|x\}$ задаётся в виде матрицы $\Pi_{Y|X}$ переходных вероятностей. Дискретный канал называется симметричным по входу (выходу), если все строки (столбцы) матрицы переходных вероятностей являются перестановками первой строки (первого столбца). Если канал симметричен как по входу, так и по выходу, то такой канал называется полностью симметричным.

Также можно ввести понятие стирающего канала, если добавить в $\mathbb{Y}$ стирающий элемент $\epsilon$.

Также существуют каналы с памятью, для которых для каждой последующей передачи данных матрица переходных вероятностей меняется. В дальнейшем речь ведётся только о каналах без памяти.

### Двоичный симметричный канал

Двоичный симметричный канал характеризуется:

* $\mathbb{X} = \mathbb{Y} = \mathbb{B}$
* Условное распределение $P_{Y|X}(y,x) = p^{\delta(y, x)} (1 - p)^{1 - \delta(y, x)}$, где $\delta(x, y) = 0$, если $x = y$ и $\delta(x, y) = 1$, если $x \neq y$

Двоичный симметричный канал характеризуется схемой Бернулли. Вероятность наличия ошибок при декодировании, исправляющим $t$ ошибок, составляет:

$$P_{error}(n, t) = \sum_{i = t + 1}^n C_n^i p^i (1-p)^{n-i}$$



### Аддитивный гауссовский канал

Аддитивный гауссовский канал с аддитивным белым гауссовским шумом характеризуется:

* Случайной величиной $Z \sim N(0, \sigma^2)$ (нормальное распределение), отвечающей за шум
* Входным алфавитом $\mathbb{X} \subseteq \mathbb{R}$ и случайной величиной $X \in \mathbb{X}$
* Выходным алфавитом $\mathbb{Y} = \mathbb{R}$ и случайной величиной $Y = X + Z$
* Условное распределение $P_{Y|X} \{y|x\} = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(y-x)^2}{2 \sigma^2}}$

## Декодирование

Задачей декодера является нахождение оценки $\hat{x}$ сообщения, закодированного кодером и подвергнувшегося случайным искажениям в канале (__поблоковое декодирование__), либо оценки каждого отдельного символа $\hat{x_i}$ (__посимвольное декодирование__).

Естественным критерием качества декодирования является вероятность несовпадения оценки $\hat{x}$ и истинного сообщения $x$. Если $y$ — принятый вектор, то такая вероятность ошибки равна:

$$P_{error} = P \{x \neq \hat{x}\} = \sum_{x \neq \hat{x}} P_{X|Y} = 1 - P_{X|Y} \{\hat{x}|y\}$$

### Критерий максимума апостериорной вероятность (критерий идеального наблюдателя)

Очевидно, что минимальная вероятность ошибки достигается при выборе:

$$\hat{x} = \underset{x}{argmax} P_{X|Y} \{x|y\}$$

### Критерий максимума правдоподобия

$$\hat{x} = \underset{x}{argmax} P_{Y|X} \{y|x\}$$

В общем случае, данные два критерия не являются эквивалентными. Однако если все сообщения равновероятны (т.е. $\forall x . P_X \{x\} = s$), тогда по теореме Байеса можно вывести, что

$$
\underset{x}{argmax} P_{Y|X} \{y|x\} =
\underset{x}{argmax} \frac{P_{X|Y} \{x|y\} P_Y \{y\}}{P_X \{x\}} =
\underset{x}{argmax} \frac{P_{X|Y} \{x|y\}}{s} =
\underset{x}{argmax} P_{X|Y} \{x|y\}
$$

При посимвольном декодировании верно для каналов без памяти:

$$
\hat{x} =
\underset{x}{argmax} P_{Y^n|X^n} \{y|x\} =
\underset{x}{argmax} P_{Y^n|X^n} \{y_1, y_2, \dots y_n|x_1, x_2, \dots x_n\} =
\underset{x}{argmax} \prod_{i=1}^{n} P_{Y|X} \{y_i|x_i\}
$$

### Логарифмическое отношение правдоподобия

В случае $\mathbb{X} = \{a, b\}$ часто полезно оценить надёжность оценки для каждого символа через логарифмическое отношение:

$$L = \ln\frac{P \{x_i=a|y\}}{P \{x_i=b|y\}} = \ln\frac{\sum_{x|x_i=a} P_{X|Y} \{x|y\}}{\sum_{x|x_i=b} P_{X|Y} \{x|y\}}$$

#### Логарифмическое отношение правдоподобия в аддитивном гауссовском канале

$$
L =
\ln\frac{P \{x_i=-1|y\}}{P \{x_i=1|y\}} =
\ln\frac{P \{y|x_i=-1\}}{P \{y|x_i=1\}} =
\ln\frac{\frac{1}{\sqrt{2 \pi \sigma^2}} \cdot \exp{-\frac{(y_i + 1)^2}{2\sigma^2}}}{\frac{1}{\sqrt{2 \pi \sigma^2}} \cdot \exp{-\frac{(y_i - 1)^2}{2\sigma^2}}} =
\ln\exp\frac{(y_i - 1)^2-(y_i + 1)^2}{2\sigma^2} =
-\frac{2y_i}{\sigma^2}
$$

### Критерий минимального расстояния

Введём функцию расстояния $d(x,y) : \mathbb{Y} \times \mathbb{Y} \rightarrow \mathbb{D}$, где $\mathbb{D} \subseteq \mathbb{R}_{+}$. Тогда критерием минимального расстояния будет являться:

$$\hat{x} = \underset{x}{argmin} d(y,x)$$

#### Критерий минимального расстояния Хэмминга в двоичном симметричном канале

В случае двоичного симметричного канала если $p \le \frac{1}{2}$, то критерий минимального расстояния Хэмминга эквивалентен критерию максимума правдоподобия:

$$
\underset{x}{argmax}P(y | x) =
\underset{x}{argmax} p^{\delta(y_i, x_i)} (1 - p)^{1 - \delta(y_i, x_i)} =
\underset{x}{argmax} (1-p) \frac{p}{1-p}^{\delta(y_i, x_i)} \sim
\underset{x}{argmin} \sum_{i=1}^{n} \delta(y_i, x_i) =
\underset{x}{argmin} d_H(y, x)
$$

#### Критерий минимального Евклидового расстояния в аддитивном гауссовском канале

В случае канала с АБГШ критерий минимального Евклидового расстояния эквивалентен критерию максимума правдоподобия:

$$
\underset{x}{argmax} P(y | x) =
\underset{x}{argmax} \prod_{i = 0}^{n- 1} \frac{\exp{-\frac{(y_i - x_i)^2}{2\sigma^2}}}{\sqrt{s \pi \sigma^2}} \sim
- \underset{x}{argmax} \sum_{i = 0}^{n - 1} \frac{(y_i)^2}{2\sigma^2} \sim
\underset{x}{argmin} \sum_{i = 0}^{n - 1} (y_i - x_i)^2 \sim
\underset{x}{argmin} d_E(y, x)
$$