In [1]:
import zlib
import numpy as np

In [2]:
def leer_archivo(nombre_archivo):
    with open(nombre_archivo, 'r') as f:
        lineas = f.readlines()
    n, m = map(int, lineas[0].split())
    return np.array([list(map(float, linea.strip().split())) for linea in lineas[2:2+n]])


In [3]:
def codificar_alt1_sin_cuantizacion(datos):
    """Alternativa 1 pura sin cuantización"""
    encoded = np.zeros_like(datos)
    encoded[:, 0] = datos[:, 0]
    for i in range(1, datos.shape[1]):
        encoded[:, i] = datos[:, i] - datos[:, i-1]
    return encoded

In [4]:
def codificar_hibrido_sin_cuantizacion(datos):
    """Híbrido sin cuantización, usando floats nativos"""
    corr_matrix = np.corrcoef(datos)
    ref_index = np.argmax(np.mean(corr_matrix, axis=1))
    referencia = datos[ref_index]
    
    # Diferencias espaciales y temporales
    dif_espacial = datos - referencia
    deltas = np.diff(dif_espacial, axis=1, prepend=0)
    return deltas


In [5]:
def comprimir_justo(datos_codificados):
    """Compresión usando representación binaria nativa de floats (64 bits)"""
    return zlib.compress(datos_codificados.tobytes())

In [6]:
filename = "../procesa_archivos_2024/outputdata_m30_fulldates/archivos_articulo/m30_2024_data_fulldates_intensidad.txt"
datos = leer_archivo(filename)

# Codificar
alt1 = codificar_alt1_sin_cuantizacion(datos)
hibrido = codificar_hibrido_sin_cuantizacion(datos)

# Comprimir
c_alt1 = len(comprimir_justo(alt1))
c_hibrido = len(comprimir_justo(hibrido))

# Resultados
print("\n=== COMPARACIÓN JUSTA (sin cuantización) ===")
print(f"Alternativa 1: {c_alt1} bytes")
print(f"Híbrido: {c_hibrido} bytes")
print(f"Diferencia: {c_alt1 - c_hibrido} bytes ({((c_alt1 - c_hibrido)/c_alt1)*100:.1f}% mejor)")


=== COMPARACIÓN JUSTA (sin cuantización) ===
Alternativa 1: 15942248 bytes
Híbrido: 17538460 bytes
Diferencia: -1596212 bytes (-10.0% mejor)


In [None]:
filenameGroups = "../procesa_archivos_2024/outputdata_m30_fulldates/archivos_articulo/m30_2024_ids_estructura_intensidad.txt"
with open(filenameGroups, 'r') as f:
    lineas = f.readlines()
gs = list(map(int, lineas[0].split()))
p = 1
for g in gs:
    idsG = lineas[p].split()
    dataG = []
    for idG in idsG:
        indice = ids.index(idG)
        serie = []
        for x in datos[indice]:
            serie.append(x)
        dataG.append(serie)
    print("Analizando grupo", p, ":", idsG)
    
    # Codificar
    alt1 = codificar_alt1_sin_cuantizacion(dataG)
    hibrido = codificar_hibrido_sin_cuantizacion(dataG)
    
    # Comprimir
    c_alt1 = len(comprimir_justo(alt1))
    c_hibrido = len(comprimir_justo(hibrido))
    
    # Resultados
    print("\n=== COMPARACIÓN JUSTA (sin cuantización) ===")
    print(f"Alternativa 1: {c_alt1} bytes")
    print(f"Híbrido: {c_hibrido} bytes")
    print(f"Diferencia: {c_alt1 - c_hibrido} bytes ({((c_alt1 - c_hibrido)/c_alt1)*100:.1f}% mejor)")
    
    p += 1