# **Códificación Run-Length Encoding**

https://en.wikipedia.org/wiki/Run-length_encoding

La compresión RLE o Run-length encoding es una forma muy simple de compresión de datos en la que secuencias de datos con el mismo valor consecutivas son almacenadas como un único valor más su recuento. Esto es más útil en datos que contienen muchas de estas "secuencias"; por ejemplo, gráficos sencillos con áreas de color plano, como iconos y logotipos.

Por ejemplo, considera una pantalla que contiene texto en negro sobre un fondo blanco. Habría muchas secuencias de este tipo con píxeles blancos en los márgenes vacíos, y otras secuencias de píxeles negros en la zona del texto. Supongamos una única línea (o scanline), con N representando las zonas en negro y B las de blanco:

> BBBBBBBBBBBBNBBBBBBBBBBBBNNNBBBBBBBBBBBBBBBBBBBBBBBBNBBBBBBBBBBBBBB

Si aplicamos la codificación run-length a esta línea, obtendríamos lo siguiente:

> 12B1N12B3N24B1N14B

Interpretado esto como 12 letras B, 1 letra N , 12 letras B, 3 letras N, etc. El código run-length representa el original de 67 caracteres en tan solo 18. Esto quiere decir que la línea original pesa 67 bytes y la cadena codificada pesa solo 18 bytes. Esta codificación traducida a binario, cuyo principio es el mismo, se utiliza para el almacenamiento de imágenes. Incluso ficheros de datos binarios pueden ser comprimidos utilizando este método. 
* El primer byte contiene un número que representa el número de veces que el carácter está repetido. 
* El segundo byte contiene al propio carácter. 
* En otros casos se codifican en un solo byte: 1 bit (0 o 1) y 7 bits para especificar el número de caracteres consecutivos.

### **1. Fuente de información**

In [191]:
# 1. Fuente de información (leyendo un archivo de texto)

def leer_archivo(nombre_archivo):
    try:
        with open(nombre_archivo, encoding="utf-8") as archivo:
            contenido = archivo.read()
            return contenido
    except FileNotFoundError:
        print(f"El archivo '{nombre_archivo}' no fue encontrado.")
        return ""

nombre_archivo_fuente = "input.txt"
texto_original = leer_archivo(nombre_archivo_fuente)

### **2. Transmisor**

In [192]:
# 2. Transmisor (codificamos con el algoritmo RLE)
def codificacion(texto):
    texto_codificado = []
    conteo = 1

    for i in range(1, len(texto)):
        if texto[i] == texto[i - 1]:
            conteo += 1
        else:
            texto_codificado.append(texto[i - 1] + str(conteo))
            conteo = 1
    
    texto_codificado.append(texto[-1] + str(conteo))
    print( "Texto codificado: ",texto_codificado)

    return "".join(texto_codificado)

### **3. Canal**

In [193]:
# 3. Canal (En el canal se agrega ruido)

### **4. Receptor**

In [194]:
# 4. Receptor (decodificamos usando los datos codificados)
def decodificacion(texto_codificado):
    texto_decodificado = []
    i = 0

    while i < len(texto_codificado):
        char = texto_codificado[i]
        i += 1
        count_str = ""
        while i < len(texto_codificado) and texto_codificado[i].isdigit():
            count_str += texto_codificado[i]
            i += 1
        count = int(count_str)
        texto_decodificado.append(char * count)

    return "".join(texto_decodificado)

### **5. Destino de información**

El algoritmo Run-Length Encoding (RLE) no utiliza un diccionario como los algoritmos de compresión basados en diccionario, como Lempel-Ziv-Welch (LZW). RLE funciona de manera más simple al codificar secuencias repetidas de caracteres y no mantiene un diccionario.

In [195]:
def diccionario(texto):
    conjunto = set(texto)
    print("Diccionario implícito de RLE:")
    for caracter in conjunto:
        print(f"'{caracter}' -> {caracter}")

In [196]:
# 5. Destino de información (Se imprimen las cadenas de texto)
texto_codificado = codificacion(texto_original)
texto_decodificado = decodificacion(texto_codificado)

print()
print("Texto original:\n\n",texto_original)
# print("\n Texto codificado: \n", texto_codificado)s
print("\nTexto decodificado:\n", texto_decodificado)
print()
diccionario(texto_original)

with open("output.txt", "w", encoding="utf-8") as archivo_salida:
    archivo_salida.write(texto_decodificado)
print()
print("Mensaje decodificado guardado en 'output'.")

Texto codificado:  ['$50', '\n1', '$50', '\n1', '$17', '_1', '$16', '_1', '$15', '\n1', '$17', '_2', '$14', '_1', '$16', '\n1', '$18', '_15', '$17', '\n1', '$16', '_19', '$15', '\n1', '$14', '_4', '$3', '_9', '$3', '_4', '$13', '\n1', '$13', '_5', '$3', '_9', '$3', '_5', '$12', '\n1', '$12', '_27', '$11', '\n1', '$12', '_27', '$11', '\n1', '$50', '\n1', '$5', '_4', '$3', '_28', '$3', '_4', '$3', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$4', '_6', '$2', '_28', '$2', '_6', '$2', '\n1', '$5', '_4', '$3', '_28', '$3', '_4', '$3', '\n1', '$12', '_28', '$10', '\n1', '$12', '_28', '$10', '\n1', '$12', '_27', '$11', '\n1', '$17', '_6', '$6', '_5', '$16', '\n1', '$17', '_6', '$6', '_