# Compresión usando Huffman con fuente extendida

### Importe de librerías

In [21]:
from PIL import Image
from collections import Counter
import numpy as np
import heapq

### Archivo logo FI.tif

In [22]:
img = Image.open('logo FI.tif')     # Se abre la imagen
pixels = np.array(img).flatten()    # Conversión de la imagen a vector
pixels = pixels.astype(int)         # Conversión de booleanos a enteros

# Conteo de frecuencias de cada símbolo (0 y 1) en la imagen
freq = Counter(pixels)      # conteo de apariciones de cada símbolo
total = len(pixels)         # total de píxeles en la imagen

# Probabilidad de cada símbolo
prob = {sym: count/total for sym, count in freq.items()}
print("Probabilidades:", prob)


Probabilidades: {1: 0.5146142686465267, 0: 0.4853857313534733}


# Código de Huffman

In [26]:
def calcular_huffman(pixels, n):
    
    # Recorrido del vector de pixeles de n en n
    bloques  = [tuple(pixels[i:i+n]) for i in range(0, len(pixels)-n+1, n)]

    # Frecuencia de cada bloque de longitud n
    freq = Counter(bloques)

    # Total de bloques formados
    total = len(bloques)

    # Probabilidad de cada bloque
    prob = {sym: count/total for sym, count in freq.items()}

    print ("Las probabilidades de cada bloque son: " , prob)
    print(" ")

    # Construcción del árbol de Huffman usando heap 

    # Cada elemento de la lista heap tiene [probabilidad, [símbolo, codigo binario]]
    heap = [[prob, [sym, ""]] for sym, prob in prob.items()]

    # El elemento de menor probabilidad queda en la raiz
    heapq.heapify(heap)


    while len(heap) > 1:

        #Extracción de los dos nodos con menor probabilidad de la heap
        nodo_izq = heapq.heappop(heap)
        nodo_der = heapq.heappop(heap)

        #nodo_izq/der = [probabilidad, [símbolo1, código1], [símbolo2, código2], ...]


        # Asignación de prefijo '0' al código del subárbol izquierdo
        for simbolo_codigo in nodo_izq[1:]:
            #ejemplo: simbolo_codigo = [ (1,0), '10']
            simbolo_codigo[1] = '0' + simbolo_codigo[1]
            #ejemplo: simbolo_codigo = [ (1,0), '010']

        # Asignación de prefijo '1' al código del subárbol derecho
        for simbolo_codigo in nodo_der[1:]:
            simbolo_codigo[1] = '1' + simbolo_codigo[1]

        #Probabilidad total
        probabilidad_total = nodo_izq[0] + nodo_der[0]

        # Combinación de ambos nodos en un nuevo nodo padre
        heapq.heappush(heap, [probabilidad_total] + nodo_izq[1:] + nodo_der[1:])
    
    codigo_huffman = {bloque: codigo for bloque, codigo in heap[0][1:]}

    Largo_promedio = sum(prob[sym] * len(code) for sym, code in codigo_huffman.items())
    Largo_promedio = Largo_promedio / n
    bits_originales = total * n
    bits_comprimidos = sum(freq[sym] * len(codigo_huffman[sym]) for sym in freq)
    tasa_compresion = bits_originales / bits_comprimidos
    
    return Largo_promedio, tasa_compresion, codigo_huffman



### Fuente extendida de orden 2

In [27]:
L2, tasa2, huff2 = calcular_huffman(pixels, 2)
print(f"Orden 2: L={L2:.2f}, tasa={tasa2:.2f}")

Las probabilidades de cada bloque son:  {(1, 1): 0.5042136030039256, (1, 0): 0.011627410820959208, (0, 0): 0.4749850657108722, (0, 1): 0.009173920464243045}
 
Orden 2: L=0.76, tasa=1.32


### Fuente extendida de orden 3

In [28]:
L3, tasa3, huff3 = calcular_huffman(pixels, 3)
print(f"Orden 3: L={L3:.2f}, tasa={tasa3:.2f}")

Las probabilidades de cada bloque son:  {(1, 1, 1): 0.493423579109063, (1, 1, 0): 0.010016641065028161, (0, 0, 0): 0.46542178699436765, (0, 0, 1): 0.009072580645161291, (1, 0, 0): 0.009504608294930876, (0, 1, 1): 0.01238479262672811, (1, 0, 1): 1.6001024065540195e-05, (0, 1, 0): 0.00016001024065540195}
 
Orden 3: L=0.53, tasa=1.88
