*TP réalisé par Rachel Blin dans le cadre du cours d'Alexandrina Rogozan*

# Codage Lempel-Ziv

L'objectif de ce TP est de réaliser le codage Lempel Ziv du message suivant :  
  
"*Il n'existe que deux choses infinies, l'univers et la bêtise humaine... mais pour l'univers, je n'ai pas de certitude absolue.*" (Albert Einstein)

## Simplification de la séquence
​
Afin de rendre la séquence plus simple à encoder, nous allons tout d'abord transformer la phrase de telle sorte à ce qu'elle ne contienne que des caractères présents dans les 26 lettres de l'alphabet en minuscule, sans accents, ainsi que les espaces.
​
Le message à encoder devient donc :  
  
"*il nexiste que deux choses infinies lunivers et la betise humaine mais pour lunivers je nai pas de certitude absolue*"
​
## Initialisation du dictionnaire avec les caractères du message à encoder

La première étape du codage Lempel-Ziv consiste à initialiser le dictionnaire avec tous les caractères présents dans le dictionnaire et leur associer une adresse. Dans ce TP, pour simplifier le codage, on dira que l'adresse est un nombre entier allant de 0 au nombre de caractères différents.

__Exemple__ :  
Pour le message "babececedd" contenant les caractères (a, b, c, d, e) on obtient dictionnaire suivant :    

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |

1) Initialisez le dictionnaire pour le codage de Lempel Ziv de notre message 

In [68]:
m = "il nexiste que deux choses infinies lunivers et la betise humaine mais pour lunivers je nai pas de certitude absolue"

def unique(message):
    """ Helper function that return a list of the unique characters in the input message.
    
    # Argument:
        - message: The input string to be processed.
    
    # Return:
        A list containing all the unique characters in the input string.
    """
    chars = [] 
    for char in message: 
        if char not in chars: 
            chars.append(char) 
    return chars


def init_dict_Lempel_Ziv(chars):
    """
    Initializes the Lempel Ziv dictionary with all the unique characters of the message create an adress for each one of them.
    
    # Argument:
        - chars: A list containing all the unique characters of the message
        
    # Return:
        The Lempel Ziv dictionary.
    """
    dico = {}
    for i in range(len(chars)): 
        dico[chars[i]] = i
    return dico 



print()
print('le dictionnaire Lempel_Ziv est : ',init_dict_Lempel_Ziv(unique(m)))


le dictionnaire Lempel_Ziv est :  {'i': 0, 'l': 1, ' ': 2, 'n': 3, 'e': 4, 'x': 5, 's': 6, 't': 7, 'q': 8, 'u': 9, 'd': 10, 'c': 11, 'h': 12, 'o': 13, 'f': 14, 'v': 15, 'r': 16, 'a': 17, 'b': 18, 'm': 19, 'p': 20, 'j': 21}


## Codage du message par Lempel-Ziv

Le principe du codage de Lempel-Ziv est de parcourir le message d'entrée à partir du premier caractère. On ajoute le caractère suivant pour former une nouvelle chaîne de caractères. Arrivé à ce stade, on a deux possibilités :  
- La chaîne de caractères existe dans ce cas on ajoute le caractère suivant à la chaîne et on répète le processus avec la nouvelle chaîne aini formée ;
- La chaîne de caractères n'existe pas et dans ce cas on ajouter cette chaîne fin du dictionnaire, on récupère l'adresse de la chaîne sans le dernier caractère et on recommence le processus à partir du dernier caractère de cette chaîne.    

__Exemple__ :  
Pour le message "babececedd" contenant les caractères (a, b, c, d, e) on obtient dictionnaire suivant :    

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |

Etapes du codage :  
*Initialisation* : 
chaine = "b"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "ba"  
Existe-t-elle dans le dictionnaire? non  
Nouveau dictionnaire :  


| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          | 

sortie = 1  
nouvelle chaine = "a"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "ab"  
Existe-t-elle dans le dictionnaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 

sortie = 0  
nouvelle chaine = "b"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "be"  
Existe-t-elle dans le dictionnaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |

sortie = 1  
nouvelle chaine = "e"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "ec"  
Existe-t-elle dans le dictionnaire? non  
Nouveau dictionnaire : 

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |
| ec         |          8          |  

sortie = 4  
nouvelle chaine = "c"  
Existe-t-elle dans le dictionaire? oui   
nouvelle chaine = "ce"  
Existe-t-elle dans le dictionnaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |
| ec         |          8          |
| ce         |          9          |

sortie = 2  
nouvelle chaine = "e"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "ec"  
Existe-t-elle dans le dictionaire? oui   
nouvelle chaine = "ece"  
Existe-t-elle dans le dictionaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |
| ec         |          8          |
| ce         |          9          |
| ece         |          10          |

sortie = 8  
nouvelle chaine = "e"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "ed"  
Existe-t-elle dans le dictionaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |
| ec         |          8          |
| ce         |          9          |
| ece         |          10          |
| ed         |          11          |

sortie = 4  
nouvelle chaine = "d"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "dd"  
Existe-t-elle dans le dictionaire? non  
Nouveau dictionnaire :  

| Caractère | adresse |
|-----------|---------------------|
| a         |          0          |
| b         |          1          |
| c         |          2          |
| d         |          3          |
| e         |          4          |
| ba         |          5          |  
| ab         |          6          | 
| be         |          7          |
| ec         |          8          |
| ce         |          9          |
| ece         |          10          |
| ed         |          11          |
| dd         |          12          |

sortie = 3  
nouvelle chaine = "d"  
Existe-t-elle dans le dictionaire? oui  
nouvelle chaine = "d+eol"  
sortie = 3    

Le code Lempel-Ziv pour ce message est donc le suivant :    
1 0 1 4 2 8 4 3 3    

2) Effectuez le codage Lempel-Ziv pour notre message.

In [77]:
def Lempel_Ziv(message, dict_Lempel_Ziv, chars):
    """
    A function to make the Lempel Ziv coding of the message.
    
    # Arguments:
        - message: The message to be encoded
        - dict_Lempel_Ziv: The initial Lempel Ziv dictionary
        - chars: The list of the unique characters of the message
        
    # Return:
       The Lempel Ziv coding of the message 
    
    """
    
    def valeur_chaine(mot_tmp,dict_Lempel_Ziv): 
        res = 0
        for j in mot_tmp : 
            res += dict_Lempel_Ziv[j]
        return res
    
    taille_dic = len(dict_Lempel_Ziv)
    codage = ''
    mot_tmp = ''
    for i in message :
        mot_tmp += i
        if mot_tmp in dict_Lempel_Ziv:
            codage += str(dict_Lempel_Ziv[mot_tmp])
        else :
            dict_Lempel_Ziv[mot_tmp] = taille_dic
            taille_dic += 1

            mot_tmp = i
            codage += str(dict_Lempel_Ziv[mot_tmp])


    return dict_Lempel_Ziv, codage

In [78]:
# On teste notre code avec l'exemple du cours 

s = "babececedd"
chars = unique(s)
dict_Lempel_Ziv = init_dict_Lempel_Ziv(chars)

dict, codage = Lempel_Ziv(s,dict_Lempel_Ziv,chars)

print("Le dictionnaire finale : ",dict)
print()
print("Le message codé est : ",codage)

Le dictionnaire finale :  {'b': 0, 'a': 1, 'e': 2, 'c': 3, 'd': 4, 'ba': 5, 'ab': 6, 'be': 7, 'ec': 8, 'ce': 9, 'ece': 10, 'ed': 11, 'dd': 12}

Le message codé est :  0102328244


In [79]:
# Celui est validée alors on code le message initiale

m = "il nexiste que deux choses infinies lunivers et la betise humaine mais pour lunivers je nai pas de certitude absolue"

chars = unique(m)
dict_Lempel_Ziv = init_dict_Lempel_Ziv(chars)

dict, codage =Lempel_Ziv(m,dict_Lempel_Ziv,chars)

print("Le dictionnaire finale : ",dict)
print()
print("Le message codé est : ",codage)

Le dictionnaire finale :  {'i': 0, 'l': 1, ' ': 2, 'n': 3, 'e': 4, 'x': 5, 's': 6, 't': 7, 'q': 8, 'u': 9, 'd': 10, 'c': 11, 'h': 12, 'o': 13, 'f': 14, 'v': 15, 'r': 16, 'a': 17, 'b': 18, 'm': 19, 'p': 20, 'j': 21, 'il': 22, 'l ': 23, ' n': 24, 'ne': 25, 'ex': 26, 'xi': 27, 'is': 28, 'st': 29, 'te': 30, 'e ': 31, ' q': 32, 'qu': 33, 'ue': 34, 'e d': 35, 'de': 36, 'eu': 37, 'ux': 38, 'x ': 39, ' c': 40, 'ch': 41, 'ho': 42, 'os': 43, 'se': 44, 'es': 45, 's ': 46, ' i': 47, 'in': 48, 'nf': 49, 'fi': 50, 'ini': 51, 'ie': 52, 'es ': 53, ' l': 54, 'lu': 55, 'un': 56, 'ni': 57, 'iv': 58, 've': 59, 'er': 60, 'rs': 61, 's e': 62, 'et': 63, 't ': 64, ' la': 65, 'a ': 66, ' b': 67, 'be': 68, 'eti': 69, 'ise': 70, 'e h': 71, 'hu': 72, 'um': 73, 'ma': 74, 'ai': 75, 'ine': 76, 'e m': 77, 'mai': 78, 'is ': 79, ' p': 80, 'po': 81, 'ou': 82, 'ur': 83, 'r ': 84, ' lu': 85, 'uni': 86, 'ive': 87, 'ers': 88, 's j': 89, 'je': 90, 'e n': 91, 'na': 92, 'ai ': 93, ' pa': 94, 'as': 95, 's d': 96, 'de ': 97, ' c