# Codage _Lempel-Ziv-Welch_ & Codage par plage
L'objectif de ce TP est de réaliser le codage *Lempel-Ziv-Welch* et le codage par plage sur : 
1. Du texte.
2. Une image (Codage par plage).
3. Une image (Codage LZW)


Le principe du codage de *Lempel-Ziv-Welch* est de parcourir le message d'entrée à partir du premier caractère. On ajoute le caractère suivant pour former une nouvelle chaîne de caractères. Arrivé à ce stade, on a deux possibilités :  
1. La chaîne de caractères figure sur notre dictionnaire, dans ce cas on ajoute le caractère suivant à la chaîne et on répète le processus avec la nouvelle chaîne ainsi formée ;
2. La chaîne de caractères ne figure pas dans notre dictionnaire, et dans ce cas met à jour notre dictionnaire avec cette chaîne, on récupère l'adresse de la chaîne sans le dernier caractère et on recommence le processus à partir du dernier caractère de cette chaîne.

Vous pouvez consulter le document `lempel_ziv_welch.pdf` pour comprendre le déroulement de l'algorithme sur le mot `"abracadabrant"`.

## 1) LZW sur du Texte
On s'intéresse ici à concevoir l'algorithme `LZW` pour la compression du texte `"abracadabrant"` : 
Vous devez completer la fonction `lemepel_ziv_welch_encode` qui prend en entrée un msg de type `str` et retourne une liste d'entier (code correspondant au message) : 
1. Penser à extraire les charctères sans répétition composant le message
2. Construire un dictionnaire du type : `{'a':1, 'b':2, ...}` 

In [None]:
def lzw_encode(msg: str) -> list[int]:
    ...

In [None]:
message = 'abracadabrant'
compressed = lzw_encode(message)
true_code = [1, 2, 6, 1, 3, 1, 4, 8, 10, 5, 7]
assert compressed == true_code, f"Error ! le résultat doit être {true_code}"

In [None]:
def lzw_decode(compressed: list[int]) -> str:
    ...

In [None]:
decodded = lzw_decode(compressed)
assert decodded == message, f"Error ! Itsn't '{message}' yet !!"

## 2) Codage par plage sur une image
On va réecrire l'algorithme de l'encodage par plage pour la compression cette fois-ci de l'image `penguin.jpg`. Pour ce faire, vous aller procéder ainsi : 
1. Ecrire une fonction `image_to_bytes` qui prend en entrée le chemin de l'image (`str`) et retourne une liste de `bytes`.
2. Compléter la fonction `rle_image_encode` qui prend en entrée `data_bytes` et retourne une autre liste `bytes`.
3. Compléter la fonction `rle_image_decode` qui prend en entrée `compressed_bytes` et retourne une autre liste `bytes`.
4. Compléter la fonction `save_image` qui créee une image à partir d'une liste de `bytes`.

Voici quelques consignes à respecter : 
1. Comparer la taille des `bytes` de l'image (originale) et les donnée compressé !
2. Utiliser un encodage `ASCII` 256 charactères pour l'image.

In [None]:
from PIL import Image
import numpy as np
import os

In [None]:
def images_to_bytes(filename: str) -> list[bytes]:
    """
    Penser à sauvegarder le mode et la taille de l'image
    """
    ...

In [None]:
def rle_image_encode(data_bytes: list[bytes]) -> list[bytes]:
    ...

In [None]:
def rle_image_decode(data_bytes: list[bytes]) -> list[bytes]:
    ...

In [None]:
def save_image(data_bytes: list[bytes]) -> None:
    """
    Penser à restaurer le mode et la taille de l'image
    """
    ...

In [None]:
image_file = "penguin.jpg"
data_bytes = images_to_bytes(image_file)
compressed_bytes = rle_image_encode(data_bytes)
uncomp_bytes = rle_image_decode(compressed_bytes)
save_image(uncomp_bytes)

## 3) Codage `LZW` sur une image
On va réecrire l'algorithme de `LZW` pour la compression de l'image `penguin.jpg`. Pour ce faire, vous aller procéder ainsi : 
1. Ecrire une fonction `image_to_str` qui prend en entrée le chemin de l'image (`str`) et retourne une liste de `str`.
2. Compléter la fonction `lzw_image_encode` qui prend en entrée `str` et retourne une autre liste de `str`.
3. Compléter la fonction `lzw_image_decode` qui prend en entrée `list[str]` et retourne un `str`.

Voici quelques consignes à respecter : 
1. Comparer la taille des donnée originales et compressées !
2. Utiliser un encodage `ASCII` 256 charactères pour l'image.

In [None]:
def images_to_str(filename: str) -> str:
    """
    Penser à sauvegarder le mode et la taille de l'image
    """
    ...

In [None]:
def lzw_image_encode(data: str) -> list[str]:
    ...

In [None]:
def lzw_image_decode(compressed_data: list[str]) -> str:
    ...

In [None]:
image_file = "penguin.jpg"
str_bytes = images_to_str(image_file)
compressed = lzw_image_encode(str_bytes)
uncomp = lzw_image_decode(compressed)

## 4) Sauvegarde en binaire
Dans cette partie, je vous invite à tester les les deux codages précédants sur des images en procédant de la manière suivante :
1. Ouvrir un fichier image et le convertir en `bytes`.
2. Compresser à l'aide des deux algorithmes.
3. Sauvegarder le résultat dans un fichier binaire.
4. Ouvrir le fichier binaire et faite la décompression
5. Retrouver l'image initiale

Je vous recommande de vérifier à l'aide du module `os` de `python` la taille de chaque fichier.

In [None]:
...