# Lectura, concatenación y creación csv de Transaciones

In [1]:
# lee todos los csv del directorio porcesed_csv i los concatena en un único pandas dataframe
# exporta el resultado a un csv creando el directorio Output_concat

import pandas as pd
import os

# Define el directorio donde se encuentran los archivos
directory = 'processed_csv/'

# Lista para almacenar los DataFrames de cada archivo
dfs = []

# Itera sobre cada archivo en el directorio
for filename in os.listdir(directory):
    if filename.endswith('.csv'):
        file_path = os.path.join(directory, filename)
        
        # Intenta leer cada archivo CSV en un DataFrame
        try:
            df = pd.read_csv(file_path, skiprows=1, encoding='utf-8')
            filename_without_extension = filename.split('.')[0]
            df['Filename'] = filename_without_extension
            df.rename(columns={'#Time': 'Time', 'Reserve ETH': 'Reserve_ETH', 'Reserve TOKEN': 'Reserve_Token', 'Filename': 'filename'}, inplace=True)
            columns = ['filename', 'Time', 'Reserve_ETH', 'Reserve_Token']
            df = df[columns]
            dfs.append(df)
        except FileNotFoundError:
            print(f"No se encontró el archivo: {file_path}")
        except Exception as e:
            print(f"Ocurrió un error al leer el archivo {filename}: {e}")

# Concatena todos los DataFrames en uno solo
df = pd.concat(dfs, ignore_index=True)

In [2]:
df

Unnamed: 0,filename,Time,Reserve_ETH,Reserve_Token
0,0x0150102dde85ab026eD16f0c8726250C8e76f514,2024-04-04 09:54:12,3.434080,9.815398e+07
1,0x0150102dde85ab026eD16f0c8726250C8e76f514,2024-04-04 09:54:22,3.434080,9.815398e+07
2,0x0150102dde85ab026eD16f0c8726250C8e76f514,2024-04-04 09:54:32,3.434080,9.815398e+07
3,0x0150102dde85ab026eD16f0c8726250C8e76f514,2024-04-04 09:54:43,3.434080,9.815398e+07
4,0x0150102dde85ab026eD16f0c8726250C8e76f514,2024-04-04 09:54:53,3.467290,9.721664e+07
...,...,...,...,...
23713,0xfE34af1663B7ed0e50FE7830c8E61412F73c65f3,2024-04-04 11:28:28,18.961863,5.332760e+07
23714,0xfE34af1663B7ed0e50FE7830c8E61412F73c65f3,2024-04-04 11:28:38,18.961863,5.332760e+07
23715,0xfE34af1663B7ed0e50FE7830c8E61412F73c65f3,2024-04-04 11:28:49,18.961863,5.332760e+07
23716,0xfE34af1663B7ed0e50FE7830c8E61412F73c65f3,2024-04-04 11:28:59,18.961863,5.332760e+07


In [4]:
import os

# Directorio de destino para el archivo CSV
output_dir = 'Output_concat'

# Comprueba si el directorio existe. Si no, lo crea
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# Ruta completa del archivo de salida
output_file_path = os.path.join(output_dir, 'transact_concat.csv')

# Escribe el DataFrame df_concat al archivo CSV en el directorio especificado
df.to_csv(output_file_path, index=False, encoding='utf-8')

print(f'DataFrame escrito exitosamente a {output_file_path}')


DataFrame escrito exitosamente a Output_concat\transact_concat.csv
