# Каналы передачи информации

## Терминология

Канал передачи данных это некоторое динамическое отображение $\mathbb{X}^* \rightarrow \mathbb{Y}^*$, которое характеризуется тремя составляющими:

* Входной алфавит $\mathbb{X}$ и случайная величина $X \in \mathbb{X}$
* Выходной алфавит $\mathbb{Y}$ и случайная величина $Y \in \mathbb{Y}$
* Условное распределение $P_{Y^m|X^n} \{y|x\}$, где $x \in \mathbb{X}^n$ и $y \in \mathbb{Y}^m$

Случай $m=1$ и $n=1$ часто записывают как $P_{Y|X} \{y|x\} = W(y|x)$ (посимвольное распределение).

### Параметр Бхаттачарьи

Для канала с двумя равновероятным значениями $\mathbb{X}$ (обозначим их как $\~0$ и $\~1$) можно вывести следующую формулу:


\begin{equation*}
\begin{gathered}
\sum_{x \in \mathbb{X}} P\{x\}P\{\neg x|x\} =
P\{x=\~0\}P\{y\neq\~0|x=\~0\} + P\{x=\~1\}P\{y\neq\~1|x=\~1\} =\\=
\frac{1}{2} \sum_{y : W(y|\~0)<W(y|\~1)} W(y|\~0) + \frac{1}{2} \sum_{y : W(y|\~1)<W(y|\~0)} W(y|\~1) =
\frac{1}{2} \sum_{y : \frac{W(y|\~1)}{W(y|\~0)} > 1} W(y|\~0) + \frac{1}{2} \sum_{y : \frac{W(y|\~0)}{W(y|\~1)} > 1} W(y|\~1) =\\=
\frac{1}{2} \sum_{y \in \mathbb{Y}} \sum_{x \in \mathbb{X}} W(y|x) \chi\Biggl(\frac{W(y|\neg x)}{W(y|x)}\Biggr) \le
\frac{1}{2} \sum_{y \in \mathbb{Y}} \sum_{x \in \mathbb{X}} W(y|x) \sqrt{\frac{W(y|\neg x)}{W(y|x)}} =
\sum_{y \in \mathbb{Y}} \sqrt{W(y|\~0) W(y|\~1)}
\end{gathered}
\end{equation*}

Здесь $\chi(z) = \operatorname{sgn}(\operatorname{sgn}(z - 1) + 1)$ это индикаторная функция. $\chi(z) \le \sqrt{z}$.

Параметром Бхаттачарьи называется функция $Z_W = \sum_{y \in \mathbb{Y}} \sqrt{W(y|\~0) W(y|\~1)}$. Эта функция задаёт верхнюю границу для оценки ошибки при критерии по максимуму правдоподобия (см. главный конспект).

## Виды каналов

Если $\mathbb{X}, \mathbb{Y} \in FinSet$, то такой канал называется дискретным. Если $\mathbb{X} \in FinSet, \mathbb{Y} \subseteq \mathbb{R}$, то такой канал называется полунепрерывным. Если $\mathbb{X}, \mathbb{Y} \subseteq \mathbb{R}$, то такой канал называется непрерывным. Дискретный канал называется $q$-ичным, если $|\mathbb{X}| = |\mathbb{Y}| = q$ (при $q = 2$ канал называется двоичным).

В случае дискретных алфавитов распределение $P_{Y|X} \{y|x\}$ задаётся в виде матрицы $\Pi_{Y|X}$ переходных вероятностей. Дискретный канал называется симметричным по входу (выходу), если все строки (столбцы) матрицы переходных вероятностей являются перестановками первой строки (первого столбца). Если канал симметричен как по входу, так и по выходу, то такой канал называется полностью симметричным.

Также можно ввести понятие стирающего канала, если добавить в $\mathbb{Y}$ стирающий элемент $\epsilon$.

Также существуют каналы с памятью, для которых для каждой последующей передачи данных матрица переходных вероятностей меняется. В дальнейшем речь ведётся только о каналах без памяти.

### Двоичный симметричный канал

Двоичный симметричный канал характеризуется:

* $\mathbb{X} = \mathbb{Y} = \mathbb{B}$
* Условное распределение $P_{Y|X}\{y|x\} = p^{\delta(y, x)} (1 - p)^{1 - \delta(y, x)} = (1-p) \Bigr(\frac{p}{1-p}\Bigl)^{\delta(y, x)}$, где $\delta(x, y)$ — функция Кронекера

Двоичный симметричный канал характеризуется схемой Бернулли. Вероятность наличия ошибок при декодировании, исправляющим $t$ ошибок, составляет:

$$P_{error}(n, t) = \sum_{i = t + 1}^n C_n^i p^i (1-p)^{n-i}$$

Параметр Бхаттачарьи равен:

$$Z_{BSC} = \sqrt{W(0|0) W(0|1)} + \sqrt{W(1|0) W(1|1)} = (1-p)p + p(1-p) = 2p-2p^2$$



In [1]:
import math

from channel import bsc_probability, bsc_bhattacharyya
from algebraic.binary import Binary

b0 = Binary(0)
b1 = Binary(1)

p = math.sqrt(2) / 4
print("p = " + str(p))
print("Z = " + str(bsc_bhattacharyya(p=p)))
print("P(0|0) = " + str(bsc_probability(x=b0, y=b0, p=p)))
print("P(0|1) = " + str(bsc_probability(x=b1, y=b0, p=p)))

p = 0.3535533905932738
Z = 0.4571067811865475
P(0|0) = 0.6464466094067263
P(0|1) = 0.3535533905932738


### Двоичный стирающий канал

Двоичный стирающий канал характеризуется:

* $\mathbb{X} = \mathbb{B}$
* $\mathbb{Y} = \mathbb{B} \cup \{ \epsilon \}$
* Условное распределение $P_{Y|X}\{y|x\} = p^{\delta(y, \epsilon)} (1 - p)^{\delta(y, x)} 0^{1 - \delta(y, \epsilon) - \delta(y, x)}$

Параметр Бхаттачарьи равен:

$$Z_{BEC} = \sqrt{W(0|0) W(0|1)} + \sqrt{W(1|0) W(1|1)} + \sqrt{W(\epsilon|0) W(\epsilon|1)} = \sqrt{W(\epsilon|0) W(\epsilon|1)} = p$$

In [2]:
from channel import bec_probability, bec_bhattacharyya

eps = 'ϵ'

p = math.sqrt(2) / 4
print("p = " + str(p))
print("Z = " + str(bec_bhattacharyya(p=p)))
print("P(0|0) = " + str(bec_probability(x=b0, y=b0, p=p)))
print("P(1|0) = " + str(bec_probability(x=b0, y=b1, p=p)))
print("P(ϵ|0) = " + str(bec_probability(x=b0, y=eps, p=p)))

p = 0.3535533905932738
Z = 0.3535533905932738
P(0|0) = 0.6464466094067263
P(1|0) = 0
P(ϵ|0) = 0.3535533905932738


### Аддитивный гауссовский канал

Аддитивный гауссовский канал с аддитивным белым гауссовским шумом характеризуется:

* Случайной величиной $Z \sim N(0, \sigma^2)$ (нормальное распределение), отвечающей за шум
* Входным алфавитом $\mathbb{X} \subseteq \mathbb{R}$ и случайной величиной $X \in \mathbb{X}$, обычно $\mathbb{X} = \{-1, 1\}$
* Выходным алфавитом $\mathbb{Y} = \mathbb{R}$ и случайной величиной $Y = X + Z$
* Условное распределение $P_{Y|X} \{y|x\} = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(y-x)^2}{2 \sigma^2}}$

Параметр Бхаттачарьи равен:

$$Z_{AWGNC} = \int_{-\inf}^{+\inf}\sqrt{W(y|-1) W(y|+1)} \:\mathrm{d}y =
\frac{1}{\sqrt{2 \pi \sigma^2}} \int_{-\inf}^{+\inf}e^{-\frac{(y-1)^2+(y+1)^2}{4\sigma^2}} \:\mathrm{d}y =
\frac{e^{-\frac{1}{2\sigma^2}}}{\sqrt{2 \pi \sigma^2}} \int_{-\inf}^{+\inf}e^{-\frac{y}{2\sigma^2}} \:\mathrm{d}y =
e^{-\frac{1}{2\sigma^2}}$$

In [3]:
from channel import awgnc_probability, awgnc_bhattacharyya

sigma = math.sqrt(2) / 4
print("σ = " + str(sigma))
print("Z = " + str(awgnc_bhattacharyya(sigma=sigma)))
print("P(0.175|1) = " + str(awgnc_probability(x=1, y=0.175, sigma=sigma)))
print("P(0.175|-1) = " + str(awgnc_probability(x=-1, y=0.175, sigma=sigma)))

σ = 0.3535533905932738
Z = 0.018315638888734196
P(0.175|1) = 0.07414610337406824
P(0.175|-1) = 0.004508829189592974


## Поляризация

Рассмотрим, например, $2$ параллельных двоичных стирающих канала $\mathfrak{C}_1$ и $\mathfrak{C}_2$ с одинаковыми характеристиками. При передаче информации по обоим каналам вероятность помех равная.

Сделаем трюк. Будем передавать в каналы не просто символы $u_1$ и $u_2$, а $c_1 = u_1 + u_2$ и $c_2 = u_2$. Иными словами, $(c_1 \; c_2) = (u_1 \; u_2) \begin{pmatrix}1 & 0 \\ 1 & 1\end{pmatrix}$.
* $u_1$ можно восстановить только если $y_1$ и $y_2$ получены без стираний, т.е. вероятность ошибки равна $1 - (1 - p)^2 = 2p - p^2 \ge p$
* Зная $u_1$, можно восстановить $u_2$ только если $y_1$ или $y_2$ получены без стираний, т.е. вероятность ошибки равна $p^2 \le p$

Таким образом, можно уже работать не с двумя равновероятными каналами $\mathfrak{C}_1$ и $\mathfrak{C}_2$, а с двумя виртуальными каналами $\mathfrak{U}_1$ и $\mathfrak{U}_2$ с разной вероятностью ошибки. Промасштабируем эту технику: теперь у нас есть $m$ уровней таких трюков, как выше, а количество каналов на каждом уровне равно $n = 2^m$.

Среди виртуальных каналов у половины вероятность ошибки будет стремиться к $0$, а у другой половины к $1$. Посчитаем вероятности ошибок каждого из виртуальных двоичных стирающих каналов:

In [4]:
from channel import bec_polar_probability

print(bec_polar_probability(p=0.3, m=4))

[9.96676707e-01 8.88027273e-01 8.21449816e-01 3.33446204e-01
 7.00296297e-01 2.04799683e-01 1.30727226e-01 4.57679446e-03
 5.29747472e-01 9.87533076e-02 5.82260405e-02 8.73179451e-04
 3.20084615e-02 2.60318541e-04 1.31215695e-04 4.30467210e-09]


Распространим также формулу для вычисления $\vec{c}$ через $\vec{u}$:

$$(c_1 \; c_2 \; \dots \; c_n) = (u_1 \; u_2 \; \dots \; u_n) \begin{pmatrix}1 & 0 \\ 1 & 1\end{pmatrix}^{\otimes m}$$

Символ $\otimes m$ обозначает Кронекеровскую степень. Такая матрица называется матрицей Адамара $A_m$. На практике для достижения лучших показателей используют и другие матрицы размерности $2^m \times 2^m$.

In [5]:
from algebraic.matrix import hadamard_matrix

print(hadamard_matrix(3, positive=Binary(1), negative=Binary(0)))

[[1 0 0 0 0 0 0 0]
 [1 1 0 0 0 0 0 0]
 [1 0 1 0 0 0 0 0]
 [1 1 1 1 0 0 0 0]
 [1 0 0 0 1 0 0 0]
 [1 1 0 0 1 1 0 0]
 [1 0 1 0 1 0 1 0]
 [1 1 1 1 1 1 1 1]]
