Durante la **compressione rimuoviamo tutta la ridondanza nei dati** per ottenere la versione più compressa possibile, mentre durante la **trasmissione dei dati aggiungiamo ridondanza** in modo controllato per contrastare gli errori del canale.

Per ora ci siamo concentrati quindi sulla prima parte del problema che aveva formulato Shannon, ovvero
cercare di comprimere al massimo il messaggio da spedire sul canale. Ora ci concentriamo sul secondo
problema, ovvero **cercare di codificare il canale stesso per aggiungere ridondanza**.

Definiamo il **canale discreto senza memoria** la tupla $<\mathbb{X},\mathbb{Y}, p(Y|X)>$ composta da:
1. L'insieme dei simboli della sorgente $\mathbb{X}$
2. L'insieme dei simboli del ricevente $\mathbb{Y}$
3. $p(Y|X)$ cioè la probabilità di ottenere $y \in Y$ sapendo che è stato ricevuto $x \in X$. Questa probabilità è la matrice di canale, che ci consente di definire il comportamento del canale.

Il fatto di aggiungere la proprietà **senza memoria** indica che <mark>il canale si disinteressa di quello che è stato spedito prima del carattere appena ricevuto e di quello che verrà spedito dopo il carattere appena ricevuto</mark>. Questo significa che se spediamo $x^n$(un messaggio di $n$ simboli) il calcolo della probabilità si semplifica in:
$$
\begin{align}
    p(y^n|x^n) = \prod_{j = 1}^{n} p(y_j | x_j)
\end{align}
$$

Un'altra proprietà da definire sul canale è la sua **capacità** $C$ che è definita come la massima informazione mutua tra $X$ e $Y$ al variare di tutte le distribuzioni di probabilità $p(x)$ che può assumere:
$$
\begin{align}
    C = \max_{p(x)} I(X;Y)
\end{align}
$$
*Sostanzialmente*: **la capacità di canale rappresenta la massima informazione che possiamo trasmettere** quando accediamo al canale.

Ma qual'è **l'upper e il lower bound** della **capacità di canale**? Noi sappiamo che $I(X;Y) \geq 0$ e inoltre possiamo riscrivere l'informazione mutua come
1. $I(X;Y) = H(X) - H(X|Y)$
2. $I(X;Y) = H(Y) - H(Y|X)$
Sapendo che l'**entropia** ha sempre come **upper bound** $\log |X|$ possiamo scrivere l'**upper bound** dell'informazione mutua come
$$
    H(X) - H(X|Y) \leq \log |X| \quad \text{oppure} \quad H(Y) - H(Y|X) \leq \log |Y|
$$
Tra queste due forme dobbiamo scegliere **l'upper bound minore** quindi **la capacità di canale**
$$
    0\leq C \leq \min (\log|X|, \log|Y|) 
$$

### Canale Binario senza rumore
<img src="Media/Noisless-Binary-Channel.png" alt="drawing" style="align: center; width:300px;"/>

E'un canale binario dove **ciò che viene inviato in input è riprodotto esattamente in output**. In questo caso ogni bit trasmesso viene ricevuto senza errori, quindi per ogni utilizzo del canale viene trasmesso $1$ bit. Costruiamo **la matrice di canale**:
$$
p_{(Y\mid X)} =
\begin{array}{c|cc}
    & y_1 = 0 & y_2 = 1 \\ \hline
x_1 = 0 & p(y_1\mid x_1) = 1 & p(y_2\mid x_1) = 0 \\
x_2 = 1 & p(y_1\mid x_2) = 0 & p(y_2\mid x_2) = 1 \\
\end{array}
$$
Se studiamo $I(X;Y) = H(X) - H(X|Y)$ sappiamo che $H(X|Y) = 0$ perchè dal momento che ricevo un simbolo $y \in Y$ so già che $X$ ha trasmesso $x$ quindi la conoscenza di $Y$ non ci da informazioni sulla conoscenza di $X$. Quindi **la capacità di canale diventa**
$$
\begin{align}
    C = \max_{p(x)} H(X) \leq \log_2 2
\end{align}
$$
Ma qual è la probabilità $p(x)$ che rende massima $H(X)$? Ricordando che l'entropia massima si verifica quando **ho eventi equiprobabili** se $p(x) = \frac{1}{2}$ (ho pari probabilità di trasmettere il simbolo $0$ o il simbolo $1$, *Bernoulliana*) allora $H(X) = 1$, quindi la capacità del canale è pari a $1$-bit di informazione ad ogni suo utilizzo.
___

### Canale con rumore e uscite disgiunte
<img src="Media/Canale-Rumoroso-Uscite-Disgiunte.png" alt="drawing" style="align: center; width:300px;"/>

Costruiamo la **matrice di canale**:
$$
p_{(Y\mid X)} =
\begin{array}{c|cc}
    & y_1 = 1 & y_2 = 2 & y_3 = 3 & y_4 = 4 \\ \hline
x_1 = 0  & 0.5 &0.5 &0 &0  \\
x_2 = 1 &0 &0 &0.3 &0.7\\
\end{array}
$$
Il canale non è affetto da rumore perchè dato $Y$ sappiamo già qual'è il valore assunto da $X$ di conseguenza anche in questo caso **la capacità di canale** è pari a $1$-bit.
___

### Macchina da scrivere rumorosa
Costruiamo la matrice di canale come: 
$$
p_{(Y\mid X)} =
\begin{array}{c|ccc}
    & y_0 = 0 & y_1 = 1 & y_2 = 2 \\ \hline
x_0 = 0 &\frac{1}{2}  &\frac{1}{2} &0  \\
x_1 = 1 &0 &\frac{1}{2} &\frac{1}{2}\\
x_2 = 1 &\frac{1}{2} &0 &\frac{1}{2}
\end{array}
$$
Calcoliamo ora la capacità di canale $C$: 
$$
\begin{align}
    I(X;Y) = H(X) - H(Y\mid X) \\
\end{align}
$$
$$
    H(Y\mid X) = p(X = 0) \cdot H(Y\mid X = 0) + p(X = 1) \cdot H(Y\mid X = 1) + p(X = 2) \cdot H(Y\mid X = 2) 
$$
Quindi se calcolo:
$$
\begin{align}
    H(Y \mid X = 0) &= 2\cdot(0.5\cdot\log\frac{1}{0.5}) = 1\\
    H(Y \mid X = 1) &= 1\\
    H(Y \mid X = 2) &= 1
\end{align}
$$
Dato che dobbiamo trovare una distribuzione $p(x)$ che massimizza l'entropia $H(Y)$, sapendo che l'entropia è massima quando gli eventi sono equiprobabili assegno la distribuzione uniforme $p(x) = \frac{1}{3}$ e calcolo 
$$
    C = \max_{p(x)}(H(Y) - 1) = \sum_{i=0}^{2} p(Y = i)\cdot \log \frac{1}{p(Y = i)} = 3\cdot\Big(\frac{1}{3} \log\frac{1}{\frac{1}{3}}\Big) = \log 3 - 1
$$
___

### Canale Binario Simmetrico
<img src="Media/Canale-Binario-Simmetrico.png" alt="drawing" style="align: center; width:300px;"/>

In questo tipo di canale consideriamo $p$ come la probabilità di commettere un'errore, la matrice di canale risulta essere:
$$
p_{(Y\mid X)} =
\begin{array}{c|ccccc}
    & y_1 = 0 & y_2 = 1\\ \hline
x_1 = 0  &1-p &p   \\
x_2 = 1 &p &1-p\\
\end{array}
$$
Calcoliamo la capacità di canale: 
$$
\begin{align}
 I(X;Y) &= H(Y) - H(Y|X)  \quad &(1)\\
 H(Y|X) &= \sum_{i=0}^{1} p(X = i) \cdot H(Y|X = i)   \quad &(2)\\
\end{align}
$$
Se calcoliamo $H(Y| X = i)$ per $i \in \{0,1\}$ otteniamo:
$$
\begin{align}
    H(Y|X = 0) &= p(Y = 0 | X = 0) \cdot \log_2 \frac{1}{p(Y = 0 | X = 0)} + p(Y = 1 | X = 0) \cdot \log_2 \frac{1}{p(Y = 1 | X = 0)} \quad &(1)\\
    \\
    & = (1-p) \cdot \log_2 \frac{1}{(1-p)} + p\cdot \log_2 \frac{1}{p} = H(p) \quad &(2) \\
    \\
    H(Y| X = 1) = H(p)
\end{align}
$$
Dal punto $(2)$ notiamo che questa entropia che abbiamo scritto è pari **all'entropia di una variabile Bernoulliana**. Di conseguenza se ritorniamo a calcolare $H(Y|X) = \sum_{i=0}^{1} p(X = i) \cdot H(Y|X = i)$:
$$
\begin{align}
&\sum_{i=0}^{1} p(X = i) \cdot H(p)\\
&\Big[p(X = 0)+p(X = 1)\Big]\cdot H(p) = H(p)
\end{align}
$$
Quindi $C = \max_{p(x)}\Big(H(Y) - H(p)\Big)$ quindi $H(Y)$ è uguale a:
$$
\begin{align}
&\sum_{i=0}^{1} p(Y = i)\cdot\log_2 \frac{1}{p(Y = i)} \quad &(1)\\
&p(Y = 0)\cdot\log_2 \frac{1}{p(Y = 0)} + p(Y = 1)\cdot\log_2 \frac{1}{p(Y = 1)}\quad &(2)\\
\\
p(Y = 0) &= p(Y = 0| X = 0) p(X = 0) + p(Y = 0| X = 1) p(X = 1) \\
&= \Big[1-p \cdot \frac{1}{2}\Big] + \Big[p \cdot \frac{1}{2}\Big] = \frac{1}{2}\\
\\
p(Y = 1) &= \frac{1}{2}\\
\end{align}
$$
Quindi $C = 1 - H(p)$
___

### Canale Binario a Cancellazione

<img src="Media/Binary-Erasure-Channel.png" alt="drawing" style="align: center; width:300px;"/>

Calcoliamo la capacità di canale introducendo una variabile *Bernoulliana*$Z$ di parametro $\alpha$:
$$
Z = \begin{cases}
    &\alpha \quad &\text{se} \quad Y = e\\
    &1-\alpha \quad &\text{altrimenti}
\end{cases}
$$
Dato che vogliamo calcolare l'informazione mutua per trovare la capacità di canale $I(X;Y) = H(Y) - H(Y|X)$ per la **Chain rule**,ma $H(Y|X)$ è modellata da $Z$ quindi $H(Y|X) = H(Z)$. Per calcolare invece $H(Y)$ sappiamo sempre per la **Chain rule** che:
$$
    H(Y,Z) = H(Y) + H(Z | Y) = H(Z) + H(Y|Z)
$$
Ma quindi se consideriamo $H(Z | Y) = 0$ perchè se riceviamo $Y$ conosciamo già quanto varrà $Z$.
$$
    H(Y) = H(Z) + H(Y|Z) 
$$
Dobbiamo quindi calcolare $H(Y|Z)$
$$
\begin{align}
 H(Y|Z) &= p(Z = 0) \cdot H(Y|Z=0) + p(Z = 1)\cdot H(Y|Z = 1) \\
 &= 1-\alpha \cdot H(Y|Z = 0) + p(Z = 1) \cdot H(Y|Z = 1)
\end{align}
$$
- $H(Y|Z = 1) = 0$
- $H(Y|Z = 0)$ questa entropia è pari a $H(X)$ perchè se $Z = 0$ vuol dire che $Y$ ha ricevuto correttamente o $0,1$ quindi dipende solo da $X$.
Di conseguenza $H(Y|Z) = 1 - \alpha \cdot H(X)$, quindi $H(Y) = H(Z) + H(X)\cdot(1-\alpha)$ e se sostituiamo dentro all'informazione mutua:
$$
    I(X;Y) = H(Z) + H(X)\cdot(1-\alpha) - H(Z) = H(X) \cdot (1 - \alpha)
$$
Ma dato che vogliamo trovare la distribuzione massima per calcolare la capacità di canale
$$
    C = \max_{p(x)} I(X;Y) = (1 - \alpha)\cdot \max_{p(x)} H(X)
$$
Dato che $X = \{0,1\}$ è *Bernoulliana* $H(X)$ è massima quando $p(x) = \frac{1}{2}$ di conseguenza $H(X) = 1$, e quindi **la capacità di canale** è pari a
$$
    C = 1 - \alpha
$$

Ciao come stai? 

$HOOOOOOOOO$

$GUARDA LO SCHERMOOOOOOOOO$ DIOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOo
