In [231]:
import numpy
import scipy

<h1 align="center">üéµ FLAC üéµ</h1>

Pr√©sent√© par Alix ANNERAUD et Haijiao

# ‚úÖ Caract√©ristiques

- **Type de donn√©es**: üéµ
- **Extension du fichier**: `.flac`
- **D√©velopp√© par**: Josh Coalson
- **Premi√®re version**: 20 juillet 2001
- **√âchantillonnage**: variable
- **Compression**: ‚úÖ
- **Perte de donn√©es**: ‚ùå 

# üìà Num√©risation du signal 

```mermaid
flowchart LR
    Signal_analogique[Signal analogique]
    Signal_num√©rique[Signal num√©rique]
    Signal_encod√©[Signal encod√©]

    Signal_analogique -->|Echantillonnage| Signal_num√©rique
    Signal_num√©rique -->|Encodage| Signal_encod√©

    Signal_encod√© -->|D√©codage| Signal_num√©rique
    Signal_num√©rique -->|Reconstruction| Signal_analogique
```

- **Signal analogique**: Signal sonore continu dans le temps (exemple : vinyle).
- **Signal num√©rique**: Signal discret en temps et en amplitude (exemple : fichier WAV).
- **Signal encod√©**: Signal num√©rique compress√© (exemple : fichier FLAC, MP3, AAC, etc.).

# üîÑ Principe d'encodage

## üî™ Division en blocs

Le signal audio est divis√© en blocs contenant chacun un nombre identique d'√©chantillons.


```mermaid
graph TB
    Signal_audio[Signal audio]

    Signal_audio -->Canal_1[Canal 1]
    Signal_audio -->Canal_2[Canal 2]
    Signal_audio -->Canal_...[Canal ...]

    Canal_1 -->Bloc_11[Bloc 1]
    Canal_1 -->Bloc_12[Bloc 2]
    Canal_1 -->Bloc_1...[Bloc ...]

    Canal_2 -->Bloc_21[Bloc 1]
    Canal_2 -->Bloc_22[Bloc 2]
    Canal_2 -->Bloc_2...[Bloc ...]

    Canal_... -->Bloc_...1[Bloc 1]
    Canal_... -->Bloc_...2[Bloc 2]
    Canal_... -->Bloc_......[Bloc ...]
```

## üîç D√©correlation inter-canal (optionnel)

Dans le cas d'un signal st√©r√©o, les canaux gauche et droit sont d√©correl√©s en deux canaux dit "lat√©ral" et "central".

$$
\begin{align*}
    x_\text{central} &= \frac{x_\text{gauche} + x_\text{droite}}{2} \\
    x_\text{lat√©ral} &= x_\text{gauche} - x_\text{droite}
\end{align*}
$$

R√©duit la redondance : si les canaux gauche et droit sont identiques, le canal lat√©ral sera null.

In [245]:
def decorreller(signal):
    signal_central = signal.mean(axis=0)
    signal_lateral = signal[0] - signal[1]

    return (signal_central, signal_lateral)
    
signal = numpy.random.randint(0, 10, (2, 10))
signal_central, signal_lateral = decorreller(signal)

print(f"Signal gauche: {signal[0]}")
print(f"Signal droite: {signal[1]}")
print(f"Signal central: {signal_central}")
print(f"Signal lat√©ral: {signal_lateral}")


Signal gauche: [7 3 2 2 7 0 9 5 4 9]
Signal droite: [8 8 7 0 6 3 7 1 7 7]
Signal central: [7.5 5.5 4.5 1.  6.5 1.5 8.  3.  5.5 8. ]
Signal lat√©ral: [-1 -5 -5  2  1 -3  2  4 -3  2]


## üìê Mod√©lisation

On cherche √† approximer le signal avec une fonction:

$$
x_n = f(x_{n-1}, x_{n-2}, \ldots, x_{n-p}) + e_n
$$

O√π:
- $x_n$ : √©chantillon √† l'instant $n$
- $f$ : fonction de pr√©diction
- $e_n$ : les r√©sidus
- $p$ : ordre de la pr√©diction

Le but √©tant de trouver la fonction $f$ qui minimisent $e_n$ afin de r√©duire la quantit√© d'information √† stocker. Les deux m√©thodes utilis√©s par le FLAC sont:

- Ajustement de polyn√¥mes simples
    - $f(x) = a_0 + a_1 x_{n-1} + a_2 x_{n-2} + \ldots + a_p x_{n-p}$
    - Rapide mais moins efficace
- Codage pr√©dictif lin√©aire
    - $f(x) = \sum_{i=1}^p a_i x_{n-i}$
    - Plus complexe mais plus efficace

### Ajustement de polyn√¥mes simples

$$
\begin{align*}
    a_0 &= \frac{\sum x_n}{N} \\
    a_1 &= \frac{\sum x_n x_{n-1}}{\sum x_{n-1}^2} \\
    a_2 &= \frac{\sum x_n x_{n-2}}{\sum x_{n-2}^2} \\
    &\vdots \\
    a_p &= \frac{\sum x_n x_{n-p}}{\sum x_{n-p}^2}
\end{align*}
$$

### üîÆ Codage pr√©dictif lin√©aire

On peut repr√©senter les r√©sidus $e_n$ comme un processus AR(p) :

$$
    R_i = \sum_{j=1}^{p} a_j R_{i-j}
$$

O√π :
- $R_i$ est la fonction d'autocorr√©lation
- $a_j$ sont les coefficients de pr√©diction
- $p$ est l'ordre de pr√©diction

R√©solu par la m√©thode de **Levinson-Durbin**.

In [233]:
def codage_predictif_lineaire(signal, ordre):
    autocorrelation = numpy.correlate(signal, signal, mode='full')
    autocorrelation = autocorrelation[len(autocorrelation)//2:]
   
    R = scipy.linalg.toeplitz(autocorrelation[:ordre])
    r = autocorrelation[1:ordre+1]
    coefficients = scipy.linalg.solve_toeplitz((R[:, 0], R[0, :]), r)

    return coefficients
    
def prediction_lineaire(signal, ordre):
    prediction = numpy.zeros_like(signal)
    for i in range(ordre, len(signal)):
        prediction[i] = numpy.dot(coefficients, signal[i-ordre:i][::-1])
    
    return prediction

signal = numpy.random.randint(0, 65535, 4000)  # Signal al√©atoire de 10 √©chantillons

coefficients = codage_predictif_lineaire(signal, 10)
predictions = prediction_lineaire(signal, 10)
residus = signal - predictions

print(f'Coefficients: {coefficients}')
print(f'Signal: {signal} (valeurs uniques: {len(numpy.unique(signal))})')
print(f'Pr√©dictions: {predictions}')
print(f'R√©sidus: {residus} (valeurs uniques: {len(numpy.unique(residus))})')

Coefficients: [0.09452747 0.10225915 0.09023658 0.08651685 0.10333994 0.08573053
 0.13947313 0.08106751 0.07917986 0.10597255]
Signal: [50335  9415 64657 ... 59923 41566 44234] (valeurs uniques: 3878)
Pr√©dictions: [    0     0     0 ... 32978 40663 40911]
R√©sidus: [50335  9415 64657 ... 26945   903  3323] (valeurs uniques: 3893)


## üóúÔ∏è Compression

Les r√©sidus sont des nombres entiers tr√®s petits (peu de bits significatifs)

Codage √† longueur variable :

- **Golomb-Rice**
    - Rapide √† encoder et √† d√©coder.
    - Efficace pour les distributions de symboles g√©om√©triques ou exponentielles.
- **Huffman**
    - Plus lent √† encoder et √† d√©coder.
    - Efficace pour les distributions de symboles non uniformes.

### üå≥ Codage d'Huffman

Pour rappel, pour coder des donn√©es:

- Calculer la fr√©quence d'apparition de chaque symbole.
- Cr√©ation d'un arbre binaire o√π les symboles les plus fr√©quents sont les plus proches de la racine.
- On attribue un code binaire √† chaque symbole en parcourant l'arbre.

### üçö Codage de Golomb-Rice

Pour coder un nombre $N$ avec un param√®tre $k$:

1. Calculer le quotient $q$ et le reste $r$ : $N = q \times 2^k + r$.
2. Coder le quotient $q$ en unaire ($q$ fois le bit 1 suivi du bit 0): $q_\text{unaire} = 1^q 0$.
3. Coder le reste $r$ en binaire sur $k$ bits: $r_\text{binaire} = \text{binaire}(r, k)$
4. Combiner les deux parties: $\text{R√©sultat final} = q_\text{unaire} \, r_\text{binaire}$

Le choix optimal de $k$ :

$$
k_\text{optimal} = \frac{\log_2 \left( 2 - \frac{V}{I} \right)}{\log_2 \left( 1 - \frac{V}{I} \right)}
$$

O√π:
- $V$ est la quantit√© de valeurs.
- $I$ est la taille de l'intervalle.

In [234]:
def encoder_golomb_rice(N, k):
    d = 2 ** k
    q = N // d   # Calcul du quotient
    r = N % d    # Calcul du reste
    
    q_unaire = '1' * q + '0'         # Encodage du quotient en unaire
    r_binaire = format(r, f'0{k}b')  # Encodage du reste en binaire
    
    return q_unaire + r_binaire   # Concat√©nation des deux encodages

for i in range(10):
    print(f'{i:2} -> {encoder_golomb_rice(i, 3)}')

 0 -> 0000
 1 -> 0001
 2 -> 0010
 3 -> 0011
 4 -> 0100
 5 -> 0101
 6 -> 0110
 7 -> 0111
 8 -> 10000
 9 -> 10001


# üîÑ Principe de d√©codage du FLAC

Pour d√©coder un fichier FLAC, il faut :

1. Lire les m√©tadonn√©es

2. D√©coder les r√©sidus

3. Appliquer la pr√©diction inverse

4. Reconstruire le signal audio

# üÜö Comparaisons

Nous allons comparer les diff√©rentes caract√©ristiques des formats audio les plus populaires:

- **WAV**: Format audio non compress√©.
- **MP3**: Ancien format audio compress√© avec perte cr√©√© par le Fraunhofer Institute.
- **AAC**: Format audio compress√© avec perte plus r√©cent cr√©√© par Apple.
- **FLAC**

Il y a √©galement d'autres formats audio comme le WMA, OGG, etc. mais nous allons nous concentrer sur les 4 formats cit√©s ci-dessus.

## üóúÔ∏è Efficacit√© de la compression

1. **AAC**: Compression avec perte (environ 75-90 %).
2. **FLAC**: Compression sans perte (environ 30-60 %).
3. **MP3**: Compression avec perte (environ 75-90 %).
4. **WAV**: Pas de compression (0 %).

## üéß Qualit√© audio

1. **WAV** et **FLAC**: Qualit√© audio maximale.
2. **AAC**: Qualit√© audio tr√®s bonne.
3. **MP3**: Qualit√© audio bonne.

## ‚öíÔ∏è Usages

- **WAV**: Anciennement utilis√© par les studios d'enregistrement.
- **FLAC**: Utilis√© par les studios d'enregistrement, audio-philes, etc.
- **AAC**: Utilis√© par Apple sur ses appareils.
- **MP3**: Anciennement utilis√© sur les CD, les baladeurs, etc.

# üëè Fin

Merci pour votre attention ! Cette pr√©sentation est maintenant termin√©e.


# üìö R√©f√©rences

- Wikipedia : 
    - [FLAC](https://en.wikipedia.org/wiki/FLAC)
    - [Golomb-Rice Coding](https://en.wikipedia.org/wiki/Golomb_coding)
    - [Yule-Walker Equations](https://en.wikipedia.org/wiki/Autoregressive_model#Yule-Walker_equations)
    - [Levinson-Durbin Algorithm](https://en.wikipedia.org/wiki/Levinson_recursion)
    - [Audio File Formats](https://en.wikipedia.org/wiki/Audio_file_format)
    - [Comparison of Audio Formats](https://en.wikipedia.org/wiki/Comparison_of_audio_coding_formats)
    - [Audio Coding](https://en.wikipedia.org/wiki/Audio_coding_format)
    - [Audio Compression](https://en.wikipedia.org/wiki/Audio_compression_(data))

- Xiph.org :
    - [FLAC - Official Website](https://xiph.org/flac/)
    - [FLAC - Technical Documentation](https://xiph.org/flac/documentation_format_overview.html)
    - [FLAC - Format Specification](https://xiph.org/flac/format.html)
    - [FLAC - Source Code](https://gitlab.xiph.org/xiph/flac)
