# COMUNICACIONES DIGITALES
#### Máster en Ingeniería de Telecomunicación
#### Curso 2021/22

## Práctica 1 - Codificación fuente

En esta práctica vamos a ver algunas ideas relacionadas con la codificación de fuente.
Veremos dos casos:
 - Codificador Huffmann
 - Codificador LZW (Lempel–Ziv–Welch)
 

### 1 - GENERACIÓN DEL MENSAJE
Generamos un mensaje que será la entrada a nuestro sistema

In [1]:
import CodFuente
mensaje = "En un lugar de la Mancha, de cuyo nombre no quiero acordarme"
print(f"Mensaje a transmitir: {mensaje}")

Mensaje a transmitir: En un lugar de la Mancha, de cuyo nombre no quiero acordarme


### 2 - CÁLCULOS PREVIOS
Antes de realizar cualquier codificación, calculo el número de bits necesarios para codificar el mensaje tal cual, sin hacer nada, y cuál sería el mínimo teórico según el cálculo de la entropía.

In [2]:
print(f"Tamaño del archivo: {len(mensaje)} bytes")
bytes = CodFuente.entropia(mensaje)*len(mensaje)/8
print(f"Tamaño mínimo teórico: {bytes:.3f} bytes")

Tamaño del archivo: 60 bytes
Tamaño mínimo teórico: 29.113 bytes


### 3 - CODIFICACIÓN HUFFMANN (I)
Comenzamos con la codificación Huffmann. 
En primer lugar calculo el diccionario adaptado al mensaje de entrada, y muestro el resultado. 

In [3]:
diccionario = CodFuente.gen_huffman_dic(mensaje)
codigo = CodFuente.huffman(diccionario)
print("Diccionario generado con probabilidades y códigos para cada carácter")
for k in diccionario:
    print(f"'{k}' - {diccionario[k]:.3f} - {codigo[k]}")

Diccionario generado con probabilidades y códigos para cada carácter
'E' - 0.017 - 011111
'n' - 0.083 - 1100
' ' - 0.183 - 00
'u' - 0.067 - 1010
'l' - 0.033 - 10011
'g' - 0.017 - 100010
'a' - 0.100 - 010
'r' - 0.083 - 1110
'd' - 0.050 - 0110
'e' - 0.083 - 1011
'M' - 0.017 - 100000
'c' - 0.050 - 11111
'h' - 0.017 - 100011
',' - 0.017 - 011110
'y' - 0.017 - 01110
'o' - 0.083 - 1101
'm' - 0.033 - 11110
'b' - 0.017 - 100001
'q' - 0.017 - 100101
'i' - 0.017 - 100100


### 4 - CODIFICACIÓN HUFFMANN (II)
Utilizando el diccionario de antes, codifico el mensaje y calculo su tamaño una vez codificado. 

In [4]:
bits = CodFuente.huffman_cod(mensaje, diccionario)
bytes = len(bits)/8
print("Tamaño del archivo tras la codificación fuente: %.2f" % bytes, "bytes")

Tamaño del archivo tras la codificación fuente: 29.50 bytes


### 5 - CODIFICACIÓN HUFFMANN (III)
Por último, y para comprobar que todo funciona, decodifico el mensaje y compruebo que el resultado coincide con el mensaje original.

In [5]:
salida = CodFuente.huffman_dec(bits, diccionario)
print("".join(salida))

En un lugar de la Mancha, de cuyo nombre no quiero acordarme


### 6 - CODIFICACIÓN LZW (I)
Hacemos lo mismo pero ahora con el codificador LZW

In [6]:
diccionario_lzw = CodFuente.gen_lzw_dic(mensaje)
bits, bitspormuestralzw, codigo = CodFuente.lzw_cod(mensaje, diccionario_lzw)
print("Diccionario LZW completo:")
for k in diccionario_lzw:
    print(f"'{k}' - {diccionario_lzw[k]}")

Diccionario LZW completo:
'E' - 0
'n' - 1
' ' - 2
'u' - 3
'l' - 4
'g' - 5
'a' - 6
'r' - 7
'd' - 8
'e' - 9
'M' - 10
'c' - 11
'h' - 12
',' - 13
'y' - 14
'o' - 15
'm' - 16
'b' - 17
'q' - 18
'i' - 19
'En' - 20
'n ' - 21
' u' - 22
'un' - 23
'n l' - 24
'lu' - 25
'ug' - 26
'ga' - 27
'ar' - 28
'r ' - 29
' d' - 30
'de' - 31
'e ' - 32
' l' - 33
'la' - 34
'a ' - 35
' M' - 36
'Ma' - 37
'an' - 38
'nc' - 39
'ch' - 40
'ha' - 41
'a,' - 42
', ' - 43
' de' - 44
'e c' - 45
'cu' - 46
'uy' - 47
'yo' - 48
'o ' - 49
' n' - 50
'no' - 51
'om' - 52
'mb' - 53
'br' - 54
're' - 55
'e n' - 56
'no ' - 57
' q' - 58
'qu' - 59
'ui' - 60
'ie' - 61
'er' - 62
'ro' - 63
'o a' - 64
'ac' - 65
'co' - 66
'or' - 67
'rd' - 68
'da' - 69
'arm' - 70
'me' - 71


### 7 - CODIFICACIÓN LZW (II)
Saco por pantalla el mensaje codificado, no en binario, sino los códigos correspondientes del diccionario. Calculo también el tamaño del mensaje una vez codificado. 

In [7]:
print(codigo)
print(f"Tamaño del archivo tras la codificación LZW: {len(bits)/8} bytes")

[0, 1, 2, 3, 21, 4, 3, 5, 6, 7, 2, 8, 9, 2, 4, 6, 2, 10, 6, 1, 11, 12, 6, 13, 30, 32, 11, 3, 14, 15, 2, 1, 15, 16, 17, 7, 32, 51, 2, 18, 3, 19, 9, 7, 49, 6, 11, 15, 7, 8, 28, 16, 9]
Tamaño del archivo tras la codificación LZW: 39.75 bytes


### 8 - CODIFICACIÓN LZW (III)
Por último, igual que antes, decodifico y compruebo que todo funciona correctamente. 

In [8]:
salida = CodFuente.lzw_dec(bits, bitspormuestralzw, diccionario_lzw)
print(f"{salida}")

En un lugar de la Mancha, de cuyo nombre no quiero acordarme
