In [48]:
import json
import pandas as pd
import os

def procesar_linea_json(linea):
    inicio_json = linea.find('{')
    contenido_json = linea[inicio_json:]
    # Reemplazar caracteres de escape
    contenido_json_limpio = contenido_json.replace('\\', '')
    contenido_json_limpio = contenido_json.replace('\"', '"')
    print(contenido_json_limpio)
    return json.loads(contenido_json_limpio)

def procesar_archivo(ruta_archivo):
    datos = []
    with open(ruta_archivo, 'r') as archivo:
        for linea in archivo:
            datos_agente = procesar_linea_json(linea)
            datos.append(datos_agente)
    return datos

def procesar_archivos(directorio):
    datos_totales = []
    for archivo in os.listdir(directorio):
        if archivo.endswith('.log'):
            ruta_completa = os.path.join(directorio, archivo)
            datos_archivo = procesar_archivo(ruta_completa)
            for dato in datos_archivo:
                estado_agente = dato.get('state', '{}')
                # Asegurarse de que estado_agente sea un diccionario
                if isinstance(estado_agente, str):
                    estado_agente = json.loads(estado_agente)
                estado_agente['nombre_agente'] = dato.get('name', 'Desconocido')
                datos_totales.append(estado_agente)
    
    df = pd.DataFrame(datos_totales)
    return df

def calculos(data):
    # Asegurándose de que 'money' es numérico
    data['money'] = pd.to_numeric(data['money'], errors='coerce')
    
    # Calculando el promedio de 'money' agrupado por 'nombre_agente'
    promedio_money_por_agente = data.groupby('nombre_agente')['money'].mean()
    desviacion_estandar_money = data.groupby('nombre_agente')['money'].std()
    coeficiente_variacion_money_por_agente = (desviacion_estandar_money / promedio_money_por_agente) * 100
    
    # Mostrar los resultados agrupados
    print("Promedio por Agente:\n", promedio_money_por_agente)
    print("\nDesviación Estándar por Agente:\n", desviacion_estandar_money)
    print("\nCoeficiente de Variación por Agente (%):\n", coeficiente_variacion_money_por_agente)

    # Calculando el promedio total y la varianza de 'money'
    promedio_total_money = data['money'].mean()
    varianza_money = data['money'].var()
    
    # Mostrar los resultados totales
    print("\nPromedio total de 'money':", promedio_total_money)
    print("Varianza de 'money':", varianza_money)

In [45]:
dfEmotions = procesar_archivos('test01/')
calculos(dfEmotions)

Promedio por Agente:
 nombre_agente
PeasantFamily_1    1494072.2
PeasantFamily_2    1632230.2
PeasantFamily_3    2021538.2
PeasantFamily_4    1476641.0
PeasantFamily_5    1640211.0
Name: money, dtype: float64

Desviación Estándar por Agente:
 nombre_agente
PeasantFamily_1    532380.074178
PeasantFamily_2    641813.130908
PeasantFamily_3    531806.338242
PeasantFamily_4    621693.039082
PeasantFamily_5    704506.052093
Name: money, dtype: float64

Coeficiente de Variación por Agente (%):
 nombre_agente
PeasantFamily_1    35.632821
PeasantFamily_2    39.321239
PeasantFamily_3    26.307014
PeasantFamily_4    42.101841
PeasantFamily_5    42.952160
Name: money, dtype: float64

Promedio total de 'money': 1652938.52
Varianza de 'money': 350328578586.76


In [46]:
dfNOEmotions = procesar_archivos('test02/')
calculos(dfNOEmotions)

Promedio por Agente:
 nombre_agente
PeasantFamily_1    1.522125e+06
PeasantFamily_2    1.453583e+06
PeasantFamily_3    1.510734e+06
PeasantFamily_4    1.307384e+06
PeasantFamily_5    1.628199e+06
Name: money, dtype: float64

Desviación Estándar por Agente:
 nombre_agente
PeasantFamily_1    387226.852233
PeasantFamily_2    453875.633706
PeasantFamily_3    346405.909223
PeasantFamily_4    525983.189700
PeasantFamily_5    424401.237171
Name: money, dtype: float64

Coeficiente de Variación por Agente (%):
 nombre_agente
PeasantFamily_1    25.439880
PeasantFamily_2    31.224602
PeasantFamily_3    22.929636
PeasantFamily_4    40.231734
PeasantFamily_5    26.065690
Name: money, dtype: float64

Promedio total de 'money': 1484405.142857143
Varianza de 'money': 175937383894.00842


In [49]:
dfNOEmotions = procesar_archivos('test03/')
calculos(dfNOEmotions)

IOPub data rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_data_rate_limit`.

Current values:
ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
ServerApp.rate_limit_window=3.0 (secs)



{"taskLog":{"06/04/2022":["DoVitalsTask","IrrigateCropsTask","CheckCropsTask"],"07/01/2022":["SpendFriendsTimeTask","DoVitalsTask","PrepareLandTask","SpendFamilyTimeTask"],"08/12/2022":["SpendFriendsTimeTask","DoVitalsTask","SpendFamilyTimeTask"],"25/03/2022":["SpendFriendsTimeTask","LeisureActivitiesTask","DoVitalsTask","SpendFamilyTimeTask","CheckCropsTask"],"21/04/2022":["DoVitalsTask","PrepareLandTask","CheckCropsTask"],"05/07/2022":["DoVitalsTask","PrepareLandTask","CheckCropsTask"],"05/10/2022":["SpendFriendsTimeTask","DoVitalsTask","HarvestCropsTask","SpendFamilyTimeTask"],"08/09/2022":["SpendFriendsTimeTask","DoVitalsTask","HarvestCropsTask","SpendFamilyTimeTask"],"19/05/2022":["DoVitalsTask","HarvestCropsTask","CheckCropsTask"],"28/05/2022":["DoVitalsTask","IrrigateCropsTask","CheckCropsTask"],"24/06/2022":["DoVitalsTask","HarvestCropsTask","CheckCropsTask"],"11/05/2022":["DoVitalsTask","IrrigateCropsTask","CheckCropsTask"],"31/01/2022":["DoVitalsTask","PrepareLandTask","Check

JSONDecodeError: Expecting ',' delimiter: line 1 column 8195 (char 8194)