In [17]:
import json
import pandas as pd
import os

def procesar_linea_json(linea):
    inicio_json = linea.find('{')
    contenido_json = linea[inicio_json:]
    # Reemplazar caracteres de escape
    contenido_json_limpio = contenido_json.replace('\"', '"')
    return json.loads(contenido_json_limpio)

def procesar_archivo(ruta_archivo):
    datos = []
    with open(ruta_archivo, 'r') as archivo:
        for linea in archivo:
            datos_agente = procesar_linea_json(linea)
            datos.append(datos_agente)
    return datos

def procesar_archivos(directorio):
    datos_totales = []
    for archivo in os.listdir(directorio):
        if archivo.endswith('.log'):
            ruta_completa = os.path.join(directorio, archivo)
            datos_archivo = procesar_archivo(ruta_completa)
            for dato in datos_archivo:
                estado_agente = dato.get('state', '{}')
                # Asegurarse de que estado_agente sea un diccionario
                if isinstance(estado_agente, str):
                    estado_agente = json.loads(estado_agente)
                estado_agente['nombre_agente'] = dato.get('name', 'Desconocido')
                datos_totales.append(estado_agente)
    
    df = pd.DataFrame(datos_totales)
    return df

def calculos(data):
    # Asegurándose de que 'money' es numérico
    data['money'] = pd.to_numeric(data['money'], errors='coerce')
    
    # Calculando el promedio de 'money' agrupado por 'nombre_agente'
    promedio_money_por_agente = data.groupby('nombre_agente')['money'].mean()
    
    # Mostrar el resultado
    print(promedio_money_por_agente)
    
    # Calculando el promedio total y la varianza de 'money'
    promedio_total_money = data['money'].mean()
    varianza_money = data['money'].var()
    
    # Mostrar los resultados
    print(f"Promedio total de 'money': {promedio_total_money}")
    print(f"Varianza de 'money': {varianza_money}")


In [14]:
dfEmotions = procesar_archivos('test01/')
calculos(dfEmotions)

nombre_agente
PeasantFamily_1    1494072.2
PeasantFamily_2    1632230.2
PeasantFamily_3    2021538.2
PeasantFamily_4    1476641.0
PeasantFamily_5    1640211.0
Name: money, dtype: float64
Promedio total de 'money': 1652938.52
Varianza de 'money': 350328578586.76


In [15]:
dfNOEmotions = procesar_archivos('test02/')
calculos(dfNOEmotions)