In [21]:
import pandas as pd
import os


In [20]:
data = []
current_agent = None
file_path = "raw_data/OFEI1204.txt"

try:
    with open(file_path, "r", encoding="utf-8") as file:
        for line in file:
            line = line.strip()
            if line.startswith("AGENTE:"):
                current_agent = line.split(":")[1].strip()
                print(f"Agente encontrado: {current_agent}")
            
            elif line and current_agent:  
                parts = line.split(",")
                name = parts[0].strip()
                type_record = parts[1].strip()

                # FILTRAR SOLO TIPO "D"
                if type_record == "D":
                    try:
                        values = [float(v.strip()) for v in parts[2:]]
                        data.append(
                            {
                                "agent": current_agent,
                                "name": name,
                                "type": type_record,
                                "values": values
                            }
                        )
                    except ValueError:
                        print(f"Error al procesar valores en línea: {line}")
                
except UnicodeDecodeError:
    print("Error con utf-8, intentando con latin-1...")
    with open(file_path, "r", encoding="latin-1") as file:
        for line in file:
            line = line.strip()
            if line.startswith("AGENTE:"):
                current_agent = line.split(":")[1].strip()
                
            elif line and current_agent:  
                parts = line.split(",")
                name = parts[0].strip()
                type_record = parts[1].strip()
                
                # FILTRAR SOLO TIPO "D"
                if type_record == "D":
                    try:
                        values = [float(v.strip()) for v in parts[2:]]
                        data.append(
                            {
                                "agent": current_agent,
                                "name": name,
                                "type": type_record,
                                "values": values
                            }
                        )
                    except ValueError:
                        print(f"Error al procesar valores en línea: {line}")

# Mostrar un resumen de los datos
print("\nPrimeros 5 registros procesados:")
for entry in data[:5]:
    print(entry)


Agente encontrado: AES CHIVOR
Agente encontrado: AXIA ENERGIA
Agente encontrado: BIOGAS DOÑA JUANA
Agente encontrado: C.T. EL MORRO 2
Agente encontrado: CASCADA
Agente encontrado: CCG ENERGY SAS ESP
Agente encontrado: CEDENAR
Agente encontrado: CELSIA
Agente encontrado: CEMEX ENERGY
Agente encontrado: CETSA(TULUA)
Agente encontrado: CH EL EDEN
Agente encontrado: CHC S.A.S. E.S.P.
Agente encontrado: DICELER
Agente encontrado: EEP(PEREIRA)
Agente encontrado: EEPPM
Agente encontrado: ELECTROHUILA
Agente encontrado: EMEE(POPAYAN)
Agente encontrado: EMGESA S.A.
Agente encontrado: EMSA(META)
Agente encontrado: ENERCO
Agente encontrado: ENERGETICA
Agente encontrado: ENERGIA RIO PIEDRAS
Agente encontrado: ENREVSA E.S.P.
Agente encontrado: EPSA(PACIFICO)
Agente encontrado: ESSA(SANTANDER)
Agente encontrado: GEC S.A. E.S.P.
Agente encontrado: GECELCA S.A. E.S.P
Agente encontrado: GENERADORA LUZMA
Agente encontrado: GENERAMOS ENERGIA
Agente encontrado: GENERPUTUMAYO
Agente encontrado: GENERSA
Age

In [29]:
def read_file(file_path):
    """
    Lee un archivo y devuelve una lista de líneas, manejando la codificación.
    """
    try:
        with open(file_path, "r", encoding="utf-8") as file:
            return file.readlines()
    except UnicodeDecodeError:
        print("Error con utf-8, intentando con latin-1...")
        with open(file_path, "r", encoding="latin-1") as file:
            return file.readlines()
        

def parse_line(line, current_agent):
    """
    Parsea una línea para obtener datos si es un registro válido.
    Devuelve un diccionario con los valores procesados o None.
    """
    line = line.strip()
    if line.startswith("AGENTE:"):
        current_agent = line.split(":")[1].strip()
        return current_agent, None

    elif line and current_agent:
        parts = line.split(",")
        name = parts[0].strip()
        type_record = parts[1].strip()

        if type_record == "D":
            try:
                values = [float(v.strip()) for v in parts[2:]]
                return current_agent, {
                    "agent": current_agent,
                    "name": name,
                    "type": type_record,
                    "values": values
                }
            except ValueError:
                print(f"Error al procesar valores en línea: {line}")
    return current_agent, None


def filter_and_process_data(file_path):
    """
    Lee el archivo, filtra y procesa los registros tipo 'D'.
    Devuelve una lista de diccionarios con los datos.
    """
    lines = read_file(file_path)
    data = []
    current_agent = None

    for line in lines:
        current_agent, record = parse_line(line, current_agent)
        if record:  
            data.append(record)
    return data


In [30]:
def main():
    """
    Función principal para orquestar el procesamiento de datos.
    """
    file_path = "raw_data/OFEI1204.txt"
    if not os.path.exists(file_path):
        print(f"El archivo {file_path} no existe.")
        return

    print("Procesando archivo...")
    data = filter_and_process_data(file_path)

    print("\nPrimeros 5 registros procesados:")
    for entry in data[:5]:
        print(entry)

    # Aquí podríamos agregar lógica para exportar los datos a un archivo CSV/JSON
    print(f"\nSe procesaron {len(data)} registros tipo 'D'.")

# if __name__ == "__main__":
#     main()


In [31]:
main()

Procesando archivo...

Primeros 5 registros procesados:
{'agent': 'AES CHIVOR', 'name': 'CHIVOR1', 'type': 'D', 'values': [125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0]}
{'agent': 'AES CHIVOR', 'name': 'CHIVOR2', 'type': 'D', 'values': [125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0]}
{'agent': 'AES CHIVOR', 'name': 'CHIVOR3', 'type': 'D', 'values': [125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0]}
{'agent': 'AES CHIVOR', 'name': 'CHIVOR4', 'type': 'D', 'values': [125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0, 125.0]}
