Quando un messaggio viene trasmesso, l’inevitabile disturbo di rumore di solito degrada **la qualità della comunicazione**.

Quando è possibile ripetere la trasmissione, è sufficiente rilevare la presenza di un errore. Quando viene rilevato un errore, si ripete semplicemente il messaggio, e potrebbe essere corretto la seconda volta o anche, eventualmente, la terza.

Non è possibile rilevare un errore se ogni simbolo possibile, o ogni insieme di simboli che può essere ricevuto, è un messaggio legittimo. È possibile individuare gli errori solo se esistono alcune restrizioni su ciò che costituisce un messaggio valido.

## Bit di parità
Il primo **codice binario** che ci permette di identificare un singolo errore è il **bit di parità**: è il modo più semplice di codificare un messaggio binario per renderlo rilevabile agli errori e consiste nel contare il numero di $1$ nel messaggio e poi aggiungere un ultimo bit scelto in modo che l’intero messaggio contenga un numero pari di $1$.
$$
    x_n = \sum_{l = 1}^{n-1} x_l
$$
Dove $x_n$ è il bit di parità mentre la somma va a considerare i bit del messaggio che vogliamo spedire.
Ad esempio se abbiamo il messaggio $(x_1,x_2,x_3,x_4) = (0,1,1,1)$ aggiungiamo il **bit di parità** $x_5 = 0 + 1 + 1 + 1  = 1$ quindi il codice di parità sarà composto in questo modo: 
$$
    (x_1,x_2,x_3,x_4,x_5)
$$
Supponendo che la parola di codice venga trasmessa, e il ricevente riceva il vettore $y = (0,0,1,1,1)$ in questo caso rileviamo l'errore, perchè:
$$
    y_n = 0 + 0 + 1 + 1 + 1 = 1 \neq 0
$$
Quindi l'errore è avvenuto nella seconda posizione, e dato che "la parità non torna" dovremmo rispedire il messaggio. 

Ma se il ricevente ottiene il vettore $y = (0,0,1,1,0)$, quindi **due errori** (nella seconda posizione, e nell'ultima), l'errore in questo caso **non viene rilevato**, questo ci permette di vedere che questo codice **può essere rilevato qualsiasi numero dispari di errori** mentre qualsiasi numero pari di errori non può essere rilevato.

Sapendo che la **probabilità di errori in posizioni pari** in un messaggio lungo $n$ è pari a:
$$
     p(\text{probabilità di errori in posizioni pari})= \sum_{l= 0}^{\lfloor \frac{n}{2} \rfloor} \binom{n}{2\cdot l}\cdot p^{2\cdot l}(1-p)^{n-2\cdot l} = \frac{1+(1−2p)^n}{
2} −(1−p)^n
$$
La **probabilità di errori in posizioni dispari** è data da $p(\text{errori in posizioni dispari}) = 1 - \frac{1+(1−2p)^n}{
2} −(1−p)^n =\frac{1 - (1 - 2p)^n}{2}$.

Il **codice  ASCII** è rappresentato da $7$-bit di **dati** e un $1$-bit di parità.
___
## Burst di errori

In alcune situazioni, gli **errori si verificano in burst**(cioè zone di errori definite da un inizio e una fine) anziché in posizioni isolate **nel messaggio ricevuto**, utilizziamo il controllo di parità per gestire questo caso. Supponiamo che **la lunghezza massima** di un Burst di errori che dobbiamo rilevare sia pari a $L$. Per proteggere il dato dal **Burst error**, suddividiamo il messsaggio originale in una sequenza di parole di lunghezza $L$. Vediamo un esempio:

Prendiamo il **messaggio** "Hello NCTU", con $L = 8$, utilizzando la **codifica ASCII** a $7$-bit (quindi senza bit di parità per i singoli simboli)

<img src = "Media/Burst-Error.png" style = "width: 500px">

Dove $n$ è il simbolo **parity-check** che è costruito calcolando il controllo di parità sulle colonne. Se si verifica un **Burst** di lunghezza $5$ significa che:
- Si presenta all'interno di una parola (Ad esempio sul carattere $H$ e quindi colpisce colonne diverse)
- Oppure si presenta tra la fine di una parola e l'inizio di un'altra
Non potrà mai colpire bit sulla stessa colonna ma su righe diverse.

<img src = "Media/Burst-Error-2.png" style = "width: 500px">

Se il **Burst** ha lunghezza $16$ l'errore potrebbe non essere rilevato perchè gli errori sui bit presenti sulla stessa colonna si compensano a vicenda.

<img src = "Media/Burst-Error-3.png" style = "width: 500px"></img>
___
## Codici Pesati

I **codici a somma pesata** richiedono di calcolare la **somma** e **la somma della somma**, due valori che serviranno per fare i controlli lato ricevente.

<img src = "Media/Somma-Pesata.png" style = "width: 500px"></img>

Vediamo il funzionamento attraverso un'esempio, supponiamo di avere $37$-simboli composti da:
1. Da $[0-9]$ numeri decimali
2. $[10-35]$ lettere maiuscole
3. $[36]$ il carattere spazio $\lambda$

E dobbiamo spedire sul canale il messaggio $3B\lambda 8$:
$$
\begin{array}{ccc}
    &\text{messaggio} &\text{somma} &\text{somma della somma}\\ \hline\\
    &3 &3 &3\\
    &B  &3 + 11 = 14 &2\cdot 3 + 11 = 17 \\
    &\lambda &3 + 11 + 36 = 50 &3\cdot 3 + 2\cdot 11 + 36 = 67\\
    &8 &3+11+36+8 = 58 &4\cdot 3 + 3\cdot 11 + 2\cdot 36 + 8 = 125\\ \hline \\
    &\text{"Check Digit"} &?? &58+125 = 183
\end{array}
$$
Il **Check-Digit** viene calcolato in questo modo, se calcoliamo **la somma della somma** ($183$) e facciamo il modulo con il numero totale di simboli ($37$ nel nostro caso) **vogliamo che il modulo sia congruo** a $0$, ma:
$$
    183\mod 37 = 35
$$
Perciò dobbiamo aggiungere $2$ alla codifica del messaggio perchè ($37-35 = 2$) perchè questo ci permette di ottenere come somma della somma $185$ che modulo $37$ è pari a $0$.
$$
\begin{array}{ccc}
    &\text{messaggio} &\text{somma} &\text{somma della somma}\\ \hline\\
    &3 &3 &3\\
    &B  &14 &17 \\
    &\lambda &50 &67\\
    &8 &58 &125\\
    &\text{Check-Digit} = 2 &60 &125+60 = 185\\ \hline \\
\end{array}
$$
Ora andiamo a capire **se il messaggio che abbiamo ricevuto è privo di errori**, semplicemente moltiplico il valore del carattere per la sua posizione all'interno del messaggio:
$$
\begin{array}{cc}
    &\text{messaggio} \cdot \text{posizione} &\text{risultato}\\ \hline\\
    &3\cdot  5  &15\\
    &11 \cdot 4  &44\\
    &36 \cdot 3  &108\\
    &8 \cdot 2   &16\\
    &2 \cdot 1   &2\\ \hline\\
\end{array}
$$
Se calcoliamo la **somma dei risultati** otteniamo $s = 185$ che è congruo a $0$ modulo $37$, questo significa che il messaggio è stato spedito correttamente.

Supponiamo che il messaggio originale $3B\lambda 82$ non venga ricevuto, ma si riceva il messaggio $3B82$:
$$
\begin{array}{cc}
    &\text{messaggio} \cdot \text{posizione} &\text{risultato}\\ \hline\\
    &3\cdot  4  &12\\
    &11 \cdot 3  &33\\
    &8 \cdot 2   &16\\
    &2 \cdot 1   &2\\ \hline\\
\end{array}
$$
$s = 63$ il quale non è congruo a $0$ modulo $37$, quindi il messaggio ricevuto è corrotto.
___
Ora vediamo degli esempi reali di **codici pesati**.
### Codice ISBN
Il codice **ISBN** è un codice di controllo usato per identificare in maniera univoca un libro. Può avere due formati: da $10$ o da $13$ cifre.
Il formato da $10$ cifre utilizza le somme pesate ed è definito da:
1. Country ID
2. Publisher ID
3. Book Number
4. Check Digit

Utilizza un alfabeto composto da $11$-caratteri, $[0-9]$ per i numeri decimali, $[10]$ per identificare il simbolo $X$(se il **Check-Digit** richiesto è $10$).
___
### Codice UPC
Il comune **codice a barre**, per identificare un prodotto. Il **Check-Digit** è calcolato come: 
$$
    \Big(3\cdot\sum_{i \text{ dispari}} x_i + \sum_{i \text{ pari}} x_i \Big) \mod 10
$$
Se questa somma è congrua a $0$ modulo $10$ il nostro **Check-digit** è verificato.
___