# Códigos


**Dada una codificación $R$, construimos un diccionario para codificar $m2c$ y otro para decodificar $c2m$.**


In [1]:
R = [('a','0'), ('b','11'), ('c','100'), ('d','1010'), ('e','1011')]

#R = [('ab','0'), ('cb','11'), ('cc','100'), ('da','1010'), ('ae','1011')]


# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in m2c.items()])

print(m2c)

print(c2m)


{'a': '0', 'b': '11', 'c': '100', 'd': '1010', 'e': '1011'}
{'0': 'a', '11': 'b', '100': 'c', '1010': 'd', '1011': 'e'}



**Definir una función** `Encode(M, m2c)` **que, dado un mensaje $M$ y un diccionario 
de codificación $m2c$, devuelva el mensaje codificado $C$.**


In [36]:
def Encode(M, m2c):
    C = applyDict(M, m2c)
    return C

#esta funcion es consistente en encode y decode si ningún código es prefijo de otro
def applyDict(A,dict):
    B = ""
    i = 0
    #aquí mantenemos el prefijo que tratamos de sustituir
    prefix = ""
    
    while i<len(A):
        prefix += A[i]
        #print(prefix)
        if prefix in dict:
            B += dict[prefix]
            #vacíamos el prefijo pues ya hemos cambiado el target
            prefix = ""
        i += 1

    #si llegados a este punto el prefijo no se ha vaciado no se ha podido procesar todo el texto
    if prefix != "":
        print("-----------------------------------")
        print("Código no prefijo o se ha encontrado palabra que no es del código: " + prefix)
        print("-----------------------------------")
        return None

    return B

**Definir una función** `Decode(C, m2c)` **que, dado un mensaje codificado $C$ y un diccionario 
de decodificación $c2m$, devuelva el mensaje original.**

In [24]:
def Decode(C,c2m):
    M = applyDict(C,c2m)
    return M

In [38]:
R = [('a','0'), ('b','11'), ('c','100'), ('d','1010'), ('e','1011')]

# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in R])

M='aabacddeae'
C=Encode(M,m2c)
print(M)
print(m2c)
print(C)
print(c2m)
print(Decode(C,c2m)==M)
print(Encode(M,m2c)=='0011010010101010101101011')

aabacddeae
{'a': '0', 'b': '11', 'c': '100', 'd': '1010', 'e': '1011'}
0011010010101010101101011
{'0': 'a', '11': 'b', '100': 'c', '1010': 'd', '1011': 'e'}
True
True


In [39]:
R = [('a','0'), ('b','10'), ('c','110'), ('d','1110'), ('e','1111')]

# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in R])

M='aabacddeaeabc'
C=Encode(M,m2c)
print(M)
print(m2c)
print(C)
print(c2m)
print(Decode(C,c2m)==M)
print(Encode(M,m2c)=='0010011011101110111101111010110')

aabacddeaeabc
{'a': '0', 'b': '10', 'c': '110', 'd': '1110', 'e': '1111'}
0010011011101110111101111010110
{'0': 'a', '10': 'b', '110': 'c', '1110': 'd', '1111': 'e'}
True
True


In [40]:
R = [('ab','0'), ('cb','11'), ('cc','100'), ('da','1010'), ('ae','1011')]

# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in m2c.items()])
M='ababcbccdaae'
C=Encode(M,m2c)
print(M)
print(m2c)
print(C)
print(c2m)
print(Decode(C,c2m)==M)
print(Encode(M,m2c)=='001110010101011')

ababcbccdaae
{'ab': '0', 'cb': '11', 'cc': '100', 'da': '1010', 'ae': '1011'}
001110010101011
{'0': 'ab', '11': 'cb', '100': 'cc', '1010': 'da', '1011': 'ae'}
True
True


In [41]:
#------------------------------------------------------------------------
# Ejemplo 3 (no prefijo)
#------------------------------------------------------------------------
R = [('a','0'), ('b','01'), ('c','011'), ('d','0111'), ('e','1111')]

# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in R])

''' 
6. Codificar y decodificar los mensajes  'ae' y 'be'. 
Comprobar si los mensajes decodificados coinciden con los originales.
'''



M='ae'
C=Encode(M,m2c)
Mr=Decode(C,c2m)
print(M,Mr,M==Mr)

M='be'
C=Encode(M,m2c)
Mr=Decode(C,c2m)
print(M,Mr,M==Mr)



ae ae True
-----------------------------------
Código no prefijo o se ha encontrado palabra que no es del código: 1
-----------------------------------
be None False


# Códigos canónicos


RFC 1951, sección 3.2.2: https://tools.ietf.org/html/rfc1951#page-7




**Definir una función** `CodeCanonico(L)` **que, dada una lista de longitudes $L$ y devuelva un código canónico binario cuyas palabras tengan las longitudes de la lista $L$.**

In [73]:

#código obtenido a partir de el pseudocódigo descrito en el apartado 3.2.2
#encontrado en: https://datatracker.ietf.org/doc/html/rfc1951#page-7
def CodeCanonico(L):
    #1) Count the number of codes for each code length
    bl_count = [0] * (max(L) + 1)
    for length in L:
        bl_count[length] += 1

    #for i in range(0,len(bl_count)):
    #    print("The value of position "+ str(i) + " is " + str(bl_count[i]))
    
    #2) Find the numerical value of the smallest code for each code length
    next_code = [0] * (max(L) + 1)
    code = 0
    for bits in range(1, max(L) + 1):
        code = (code + bl_count[bits - 1]) << 1
        next_code[bits] = code

    #for i in range(0,len(next_code)):
    #    print("The value of position "+ str(i) + " is " + str(next_code[i]))
    
    #3) Assign numerical values to all codes
    code_canonical = []
    for length in L:
        if length != 0:
            #excluimos los primeros 2 elementos pues son "0b"
            bin_num = bin(next_code[length])[2:]
            #se debe rellenar con zeros pues sino se truncan y los necesitamos
            #pues realmente queremos codificar y que tengan la longitud adecuada
            code_canonical.append(bin_num.zfill(length))
            next_code[length] += 1

    
    return code_canonical

In [74]:
L=[ 3, 3, 3, 3, 2, 4, 7,7,7,5,5,5,4]

print(L)
print(CodeCanonico(L))

[3, 3, 3, 3, 2, 4, 7, 7, 7, 5, 5, 5, 4]
['010', '011', '100', '101', '00', '1100', '1111100', '1111101', '1111110', '11100', '11101', '11110', '1101']


In [75]:
L=[7,2,3,3,3,3,26,4,4,4,600]

print(L)
print(CodeCanonico(L))

[7, 2, 3, 3, 3, 3, 26, 4, 4, 4, 600]
['1111000', '00', '010', '011', '100', '101', '11110010000000000000000000', '1100', '1101', '1110', '111100100000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000']


# Ejercicio final

In [92]:
mensaje='111110011011000100011111000100011000010001011010100001101111000000111111001011010100100101100111000111011001100111001010011010110110000111011111110100001111011111011100011111101011011100011111101100111000110001000000111111100110111110111110111111111101000111101110010001110100100100000010101011100110001000001101010001100010111111001001000111011001100101100111100001101100100101111111010000010001011010100010110101111000000111010101101011110010011111110001011001001011101110011010100010100011011001111100101000101101110110010111011000010111010100011111010010010100111001001100100001000101101010001001011101101101010000010111100000001101111000000111011111000110100010001000001011111100000111011100011110110100000011101000100010100010011001001000100010011011111000110000000101001010001110010111110110000100110110101111000000101110101101011011111111011101111010111010010011000000111011100111100001000101000100101100000111110100101000100101100000100010110101000111100001110110000011001010001001101100010001110111001010010100101101101100001100101001110011011101011110000001001101100010001100101101000100100011100001110110100100110001111111101101000100011001011011111011001110010010101100110001101110001111011010010000100000111010011001111010100001101111000000101000110110011100101000101101010001111000011101101100100011101100110010110011110000110110010010111111101011011000010011011000100011110000110110100111000110010010101000101110101000100110110001000110000100110100101101001011000010001111001011101000101111000000110101111001110110000010001011010100011101010111100110110000100010111010111100011010110000100011111000111101000001001110101110011110100100011110101000111000001100010011101001110011000000100010010111110101010011100100010011011000100011000110101110001000110111000111011001100101100111100001101100100101111111010000100010010010010111001101010001101010000000111011011010010110101000010001011010100010111010110010110000010000001010100011101110110111010000110001011110011001110000010001010101101010011100100000111111111110100010011111011010010010011010100010111010100010011011000100011101110010100101001011011011100011111001101100010101000100110110001000110010100010100001100101000100110110001000111011100101001010010110000101100100100010010010101001101010001001011011101001000111101011000000110101000110111000111110011011010111100000010101011010100111001110110000010010000001111100000010100010011000110000001011110011101100001110100100100000001110010100110001100011110100000100000110010010111001000101011011110011010010110000111110101101010001001000110000110010111100000000101010110110101110001011000001001001000100110110101111000000111100110110010010000010000110111100000010011011000100010011011110101001000100101100001001010011100100100010011011000100011000011001011110001110111011001001001110111'
print(mensaje)

1111100110110001000111110001000110000100010110101000011011110000001111110010110101001001011001110001110110011001110010100110101101100001110111111101000011110111110111000111111010110111000111111011001110001100010000001111111001101111101111101111111111010001111011100100011101001001000000101010111001100010000011010100011000101111110010010001110110011001011001111000011011001001011111110100000100010110101000101101011110000001110101011010111100100111111100010110010010111011100110101000101000110110011111001010001011011101100101110110000101110101000111110100100101001110010011001000010001011010100010010111011011010100000101111000000011011110000001110111110001101000100010000010111111000001110111000111101101000000111010001000101000100110010010001000100110111110001100000001010010100011100101111101100001001101101011110000001011101011010110111111110111011110101110100100110000001110111001111000010001010001001011000001111101001010001001011000001000101101010001111000011101100000110010100010011011000100

**Ejemplo**: Símbolos y longitudes de las palabras del código asociadas

In [93]:
Codificacion_para_estudiantes = [(' ', 3), (',', 6), ('-', 9), ('.', 6), ('A', 8), ('D', 9), ('G', 9), ('H', 8), ('I', 8), ('M', 7), ('T', 8), ('W', 9), ('[', 9), (']', 9), ('a', 4), ('b', 7), ('c', 5), ('d', 5), ('e', 3), ('f', 7), ('g', 6), ('h', 5), ('i', 5), ('j', 8), ('k', 6), ('l', 5), ('m', 5), ('n', 4), ('o', 4), ('p', 7), ('q', 9), ('r', 4), ('s', 4), ('t', 4), ('u', 5), ('v', 8), ('w', 6), ('x', 9), ('y', 7)]
print(Codificacion_para_estudiantes)

[(' ', 3), (',', 6), ('-', 9), ('.', 6), ('A', 8), ('D', 9), ('G', 9), ('H', 8), ('I', 8), ('M', 7), ('T', 8), ('W', 9), ('[', 9), (']', 9), ('a', 4), ('b', 7), ('c', 5), ('d', 5), ('e', 3), ('f', 7), ('g', 6), ('h', 5), ('i', 5), ('j', 8), ('k', 6), ('l', 5), ('m', 5), ('n', 4), ('o', 4), ('p', 7), ('q', 9), ('r', 4), ('s', 4), ('t', 4), ('u', 5), ('v', 8), ('w', 6), ('x', 9), ('y', 7)]


**Ejemplo**: Hallo el código

In [94]:
alfabeto=[i[0] for i in Codificacion_para_estudiantes]
longitudes=[i[1] for i in Codificacion_para_estudiantes]

codigoCanonico=CodeCanonico(longitudes)

R=[(i,j) for i,j in zip(alfabeto, codigoCanonico)]

# encoding dictionary
m2c = dict(R)

# decoding dictionary
c2m = dict([(c,m) for m, c in m2c.items()])

print(m2c)
print(c2m)


#mensajeCodificado=Encode(mensaje,m2c)
mensajeDecodificado=Decode(mensaje,c2m)

print(mensaje)
#print(mensajeCodificado)
print(mensajeDecodificado)
print()
#print(mensaje==Decode(mensajeCodificado,c2m))
print(mensaje==Encode(mensajeDecodificado,m2c))

{' ': '000', ',': '110110', '-': '111111000', '.': '110111', 'A': '11110110', 'D': '111111001', 'G': '111111010', 'H': '11110111', 'I': '11111000', 'M': '1110110', 'T': '11111001', 'W': '111111011', '[': '111111100', ']': '111111101', 'a': '0100', 'b': '1110111', 'c': '10100', 'd': '10101', 'e': '001', 'f': '1111000', 'g': '111000', 'h': '10110', 'i': '10111', 'j': '11111010', 'k': '111001', 'l': '11000', 'm': '11001', 'n': '0101', 'o': '0110', 'p': '1111001', 'q': '111111110', 'r': '0111', 's': '1000', 't': '1001', 'u': '11010', 'v': '11111011', 'w': '111010', 'x': '111111111', 'y': '1111010'}
{'000': ' ', '110110': ',', '111111000': '-', '110111': '.', '11110110': 'A', '111111001': 'D', '111111010': 'G', '11110111': 'H', '11111000': 'I', '1110110': 'M', '11111001': 'T', '111111011': 'W', '111111100': '[', '111111101': ']', '0100': 'a', '1110111': 'b', '10100': 'c', '10101': 'd', '001': 'e', '1111000': 'f', '111000': 'g', '10110': 'h', '10111': 'i', '11111010': 'j', '111001': 'k', '11