In [2]:
import numpy as np
import heapq
import math
import random

In [3]:
# Clase Nodo para representar cada símbolo en el árbol de Huffman
class Nodo:
    def __init__(self, simbolo=None, frecuencia=None):
        self.simbolo = simbolo
        self.frecuencia = frecuencia
        self.izquierda = None
        self.derecha = None

    # Método para comparar nodos según su frecuencia (necesario para la cola de prioridad)
    def __lt__(self, otro):
        return self.frecuencia < otro.frecuencia

In [4]:
# Función para construir el árbol de Huffman
def construir_arbol_huffman(simbolos, frecuencias):
    # Crear una cola de prioridad inicial con nodos para cada símbolo
    cola_prioridad = [Nodo(simbolo, frecuencia) for simbolo, frecuencia in zip(simbolos, frecuencias)]
    heapq.heapify(cola_prioridad)  # Convertir la lista en una cola de prioridad

    # Combinar nodos hasta que quede un único árbol
    while len(cola_prioridad) > 1:
        # Extraer los dos nodos con menor frecuencia
        hijo_izquierdo = heapq.heappop(cola_prioridad)
        hijo_derecho = heapq.heappop(cola_prioridad)
        # Crear un nuevo nodo combinando las frecuencias
        nodo_combinado = Nodo(frecuencia=hijo_izquierdo.frecuencia + hijo_derecho.frecuencia)
        nodo_combinado.izquierda = hijo_izquierdo
        nodo_combinado.derecha = hijo_derecho
        heapq.heappush(cola_prioridad, nodo_combinado)  # Añadir el nuevo nodo a la cola

    # Retornar la raíz del árbol
    return cola_prioridad[0]

In [5]:
# Función para generar los códigos Huffman
def generar_codigos_huffman(nodo, codigo="", codigos_huffman={}):
    if nodo is not None:
        # Si el nodo es una hoja, asignar el código al símbolo
        if nodo.simbolo is not None:
            codigos_huffman[nodo.simbolo] = codigo
        # Recursivamente generar códigos para los hijos izquierdo y derecho
        generar_codigos_huffman(nodo.izquierda, codigo + "0", codigos_huffman)
        generar_codigos_huffman(nodo.derecha, codigo + "1", codigos_huffman)

    return codigos_huffman

In [6]:
# Función para decodificar un mensaje codificado con Huffman usando el árbol de Huffman
def decodificar_huffman(mensaje_codificado, raiz):
    mensaje_decodificado = ""
    nodo_actual = raiz

    for bit in mensaje_codificado:
        # Recorrer el árbol según el bit actual
        if bit == '0':
            nodo_actual = nodo_actual.izquierda
        else:
            nodo_actual = nodo_actual.derecha

        # Si llegamos a un nodo hoja, agregar el símbolo al mensaje decodificado
        if nodo_actual.izquierda is None and nodo_actual.derecha is None:
            mensaje_decodificado += nodo_actual.simbolo
            nodo_actual = raiz  # Reiniciar para el siguiente símbolo

    return mensaje_decodificado

In [7]:
# Función para agregar errores aleatorios al mensaje codificado
def agregar_errores_aleatorios(mensaje_codificado, tasa_error=0.1):
    vector_error = ''.join('1' if random.random() < tasa_error else '0' for _ in mensaje_codificado)
    # Realizar XOR entre el mensaje codificado y el vector de error para alterar bits
    mensaje_alterado = ''.join('1' if mensaje_codificado[i] != vector_error[i] else '0' for i in range(len(mensaje_codificado)))
    return mensaje_alterado, vector_error

In [10]:
# Ejemplo dado
frase = "abcdfeacbdefabcdefadcbefcbbdaef"
frecuencias = [0, 0, 0, 0, 0, 0]
simbolos = ['a', 'b', 'c', 'd', 'e', 'f']


for c in frase:
    for i,c2 in enumerate(simbolos):
        if(c==c2):
            frecuencias[i] += 1


# Construir el árbol de Huffman
cola_prio = construir_arbol_huffman(simbolos, frecuencias)

# Generar los códigos Huffman

codigos_huffman = generar_codigos_huffman(cola_prio, "", {})


# Imprimir los códigos Huffman
print("Códigos Huffman:")
for simbolo, codigo in codigos_huffman.items():
    print(f"Símbolo: {simbolo}, Código: {codigo}")
    



construir_arbol_huffman(simbolos, frecuencias)

Códigos Huffman:
Símbolo: d, Código: 00
Símbolo: b, Código: 01
Símbolo: f, Código: 100
Símbolo: c, Código: 101
Símbolo: a, Código: 110
Símbolo: e, Código: 111


<__main__.Nodo at 0x74365c1ba7b0>

# Códigos Huffman

In [15]:
# Programa en Python para la codificación Huffman

# Ejemplo dado
frase = "abcdfeacbdefabcdefadcbefcbbdaef"
frecuencias = [0, 0, 0, 0, 0, 0]
simbolos = ['a', 'b', 'c', 'd', 'e', 'f']


for c in frase:
    for i,c2 in enumerate(simbolos):
        if(c==c2):
            frecuencias[i] += 1


# Construir el árbol de Huffman
cola_prio = construir_arbol_huffman(simbolos, frecuencias)

# Generar los códigos Huffman

codigos_huffman = generar_codigos_huffman(cola_prio, "", {})



# Imprimir los códigos Huffman
print("Códigos Huffman:")
for simbolo, codigo in codigos_huffman.items():
    print(f"Símbolo: {simbolo}, Código: {codigo}")

# 1. Calcular la entropía de la fuente
# H(X) = -sum(p_i * log2(p_i))
total_caracteres = len(frase)
probabilidades = [f / total_caracteres for f in frecuencias]
entropia = 0
for p in probabilidades:
    if p > 0:
        entropia -= p * math.log2(p)

# 2. Calcular la longitud promedio para la codificación Huffman
# L_h = sum(p_i * longitud_codigo_i)
longitud_huffman = 0
for i in range(len(simbolos)):
    simbolo = simbolos[i]
    prob = probabilidades[i]
    codigo = codigos_huffman[simbolo]
    longitud_huffman += prob * len(codigo)

# 3. Codificación de longitud fija
# Se necesitan n bits tal que 2^n >= número de símbolos
longitud_fija = math.ceil(math.log2(len(simbolos)))

# Comparación y conclusión
print("\nComparación:")
print(f"La longitud promedio de Huffman ({longitud_huffman:.2f}) está más cerca de la entropía ({entropia:.2f}).")
print("La codificación Huffman es más eficiente que la codificación de longitud fija, aproximándose a la longitud mínima teórica dada por la entropía.")

# Codificar la frase
mensaje_codificado = ''.join([codigos_huffman[simbolo] for simbolo in frase])
print("\nMensaje codificado (Huffman):", mensaje_codificado)

# Agregar errores aleatorios al mensaje codificado
tasa_error = 0.1  # 10% de errores
mensaje_alterado, vector_error = agregar_errores_aleatorios(mensaje_codificado, tasa_error)

print("\nMensaje alterado (Huffman):", mensaje_alterado)

# Decodificar el mensaje codificado


# =================================================================
# COMPARACIÓN DEL MENSAJE ORIGINAL VS DECODIFICADO
# =================================================================

# 1. Decodificar el mensaje (usando la raíz del árbol)
mensaje_recuperado = decodificar_huffman(mensaje_alterado, cola_prio)

# 2. Comparación de Longitudes
print(f"Longitud original:  {len(frase)} caracteres")
print(f"Longitud recuperada: {len(mensaje_recuperado)} caracteres")

# 3. Cálculo de errores de símbolo (carácter a carácter)
# Comparamos solo hasta la longitud del mensaje más corto para evitar errores de índice
min_len = min(len(frase), len(mensaje_recuperado))
errores_simbolo = 0

for i in range(min_len):
    if frase[i] != mensaje_recuperado[i]:
        errores_simbolo += 1

# Añadimos la diferencia de longitud como errores adicionales
errores_totales = errores_simbolo + abs(len(frase) - len(mensaje_recuperado))
tasa_error_simbolo = (errores_totales / len(frase)) * 100

# 4. Mostrar resultados de la comparativa
print("\n--- COMPARATIVA DE INTEGRIDAD ---")
print(f"Frase Original:   {frase}")
print(f"Frase Recuperada: {mensaje_recuperado}")
print(f"\nErrores de símbolo detectados: {errores_totales}")
print(f"Tasa de error de símbolo (SER): {tasa_error_simbolo:.2f}%")

Códigos Huffman:
Símbolo: d, Código: 00
Símbolo: b, Código: 01
Símbolo: f, Código: 100
Símbolo: c, Código: 101
Símbolo: a, Código: 110
Símbolo: e, Código: 111

Comparación:
La longitud promedio de Huffman (2.65) está más cerca de la entropía (2.58).
La codificación Huffman es más eficiente que la codificación de longitud fija, aproximándose a la longitud mínima teórica dada por la entropía.

Mensaje codificado (Huffman): 1100110100100111110101010011110011001101001111001100010101111100101010100110111100

Mensaje alterado (Huffman): 1100100100100011110101010011100011001101001110011111010101011100101011100110111100
Longitud original:  31 caracteres
Longitud recuperada: 33 caracteres

--- COMPARATIVA DE INTEGRIDAD ---
Frase Original:   abcdfeacbdefabcdefadcbefcbbdaef
Frase Recuperada: abdffbebbbdedbfafedeacbbabbbabced

Errores de símbolo detectados: 25
Tasa de error de símbolo (SER): 80.65%


In [16]:
#Repetir el apartado anterior considerando el siguiente mensaje "Que es eso eso es queso"

In [20]:

# --- 2. CONFIGURACIÓN DE LOS DATOS ---

frase = "Que es eso eso es queso"
simbolos_unicos = []
for car in frase:
    if car not in simbolos_unicos:
        simbolos_unicos.append(car)

frecuencias = [frase.count(s) for s in simbolos_unicos]

# --- 3. EJECUCIÓN DEL PROCESO ---

# Árbol y Códigos
raiz_arbol = construir_arbol_huffman(simbolos_unicos, frecuencias)
codigos = generar_codigos_huffman(raiz_arbol, "", {})

# Cálculos de Entropía y Longitud
total = len(frase)
entropia = 0
longitud_huffman = 0
for i in range(len(simbolos_unicos)):
    p = frecuencias[i] / total
    entropia -= p * math.log2(p)
    longitud_huffman += p * len(codigos[simbolos_unicos[i]])

longitud_fija = math.ceil(math.log2(len(simbolos_unicos)))

# Codificación, Ruido y Decodificación
mensaje_codificado = "".join([codigos[c] for c in frase])
# Aplicamos un error muy leve para que el "Recuperado" no salga vacío
mensaje_alterado, _ = agregar_errores_aleatorios(mensaje_codificado, tasa_error)
mensaje_recuperado = decodificar_huffman(mensaje_alterado, raiz_arbol)

# --- 4. IMPRESIÓN DE RESULTADOS ---

print(f"Frase Analizada: '{frase}'")
print("-" * 50)
print("CÓDIGOS HUFFMAN GENERADOS:")
for s in sorted(codigos):
    print(f"  Simbolo: '{s}' -> Código: {codigos[s]}")

print("\n--- ANÁLISIS TEÓRICO ---")
print(f"Entropía (H):            {entropia:.4f} bits/símbolo")
print(f"Longitud Media Huffman:  {longitud_huffman:.4f} bits/símbolo")
print(f"Longitud Código Fijo:    {longitud_fija:.1f} bits/símbolo")
print(f"Eficiencia de Huffman:   {(entropia/longitud_huffman)*100:.2f}%")

print("\n--- RESULTADO DEL CANAL ---")
print(f"Original:   {frase}")
print(f"Recuperado: {mensaje_recuperado}")

# Comparación final
min_l = min(len(frase), len(mensaje_recuperado))
correctos = sum(1 for i in range(min_l) if frase[i] == mensaje_recuperado[i])
print(f"\nSímbolos correctos (SER): {correctos} de {len(frase)}")

Frase Analizada: 'Que es eso eso es queso'
--------------------------------------------------
CÓDIGOS HUFFMAN GENERADOS:
  Simbolo: ' ' -> Código: 00
  Simbolo: 'Q' -> Código: 11111
  Simbolo: 'e' -> Código: 10
  Simbolo: 'o' -> Código: 110
  Simbolo: 'q' -> Código: 11110
  Simbolo: 's' -> Código: 01
  Simbolo: 'u' -> Código: 1110

--- ANÁLISIS TEÓRICO ---
Entropía (H):            2.5460 bits/símbolo
Longitud Media Huffman:  2.5652 bits/símbolo
Longitud Código Fijo:    3.0 bits/símbolo
Eficiencia de Huffman:   99.25%

--- RESULTADO DEL CANAL ---
Original:   Que es eso eso es queso
Recuperado: qu  es eso e ous soueq

Símbolos correctos (SER): 13 de 23
