# Lectura, concatenació y escritura de fichero de Tokens

In [1]:
# creació del fitcher productes amb els tokens (pair)

import pandas as pd
import os

# Define el directorio donde se encuentran los archivos
directory = 'processed_csv/'

# Lista para almacenar los diccionarios de datos de cada archivo
data_dicts = []

# Itera sobre cada archivo en el directorio
for filename in os.listdir(directory):
    if filename.endswith('.csv'):
        file_path = os.path.join(directory, filename)
        
        try:
            # Abre el archivo y lee la primera fila
            with open(file_path, 'r', encoding='utf-8') as file:
                first_row = file.readline().strip()
            
            # Si hay un carácter '#' al inicio, lo eliminamos
            if first_row.startswith('#'):
                first_row = first_row[1:]
            
            # Dividimos la fila en pares clave-valor
            pairs = first_row.split(', ')
            
            # Creamos un diccionario a partir de los pares clave-valor
            data_dict = {}
            for pair in pairs:
                key, value = pair.split(': ', 1)  # Split con maxsplit=1
                data_dict[key.strip()] = value.strip()
            
            # Añadimos el diccionario a la lista de diccionarios
            data_dicts.append(data_dict)
            
        except FileNotFoundError:
            print(f"No se encontró el archivo: {file_path}")
        except Exception as e:
            print(f"Ocurrió un error al procesar el archivo {filename}: {e}")

# Convertimos la lista de diccionarios en un DataFrame
tokens_df = pd.DataFrame(data_dicts)

In [2]:
tokens_df

Unnamed: 0,Pair Address,Token,Decimals,Token Address,Reserve ETH,Reserve token,Owner Address,Creator Address,Creation Tx,Time
0,0x0150102dde85ab026eD16f0c8726250C8e76f514,Spider Man,18,0x3A1F9108B428295C2e01fc90a4B6f066614E7B21,3.43408,98153975.12074922,0x0000000000000000000000000000000000000000,0x3196ff697828faeb528bf2f8e5a899e13d32614f,0xf72d623e997e7a37eb7dcd35bdbeddc5040f59ed10ea...,2024-04-04 09:54:11
1,0x02C0449A89F44965725285599aAd9a7Bf3D6fb43,RoseWifHat,18,0xc12E318b3541610B8C18210edE0d673817796DAf,1.0495,285890857.3533273,0x74c7D26B02199d1BBA1350DE2c7b5813956EE938,0x74c7d26b02199d1bba1350de2c7b5813956ee938,0x325148b5e7df6961a2b9ff26307db50cd18292ea6569...,2024-04-04 09:13:00
2,0x06328E3F0CAb1B7d71083334EA43935bFc6946af,coolcat,18,0xe679de652A49F451c56AE48969525E2Fd90e4FC5,10,1000000000.0,0x113084474A6AA93a48aD2c21e2D7f3FC210f92d8,0x113084474a6aa93a48ad2c21e2d7f3fc210f92d8,0x84ad63237f019af69de6f899c9e48bed5d9361bf1f79...,2024-04-04 09:51:38
3,0x0BF6B4cF5fc7c62f636E186452e6F89e817AD982,STARBUCKS,18,0xfada369A4c1ad9D4c25Aa7A1aB66B45Bd17550fE,2.015,5923354443573.123,,0xb3f551070ff794a5b6db09a5b2d266f5eca66aab,0x0644ee606a55be8d1864accf09ccdf59429b3b048a41...,2024-04-04 09:13:13
4,0x0bFf2ee6b0b7E55E2f3E630581DbE4754ABE25fF,Cryptopia,18,0x85AEcbaAaf1FE1E27cdC4c50550e55499fD851cB,2.783029603960396025,3604147931.163491,0x5e6E24fFB8D6e5565188Af98e4c39401d0355bf2,0x5e6e24ffb8d6e5565188af98e4c39401d0355bf2,0x03625f9a6098b729f1d70965a093e468d2301fadc6a7...,2024-04-04 09:14:31
...,...,...,...,...,...,...,...,...,...,...
89,0xf345De38189829370D97183E729C8b5E9598Ca94,Meowhattan Associates,18,0x6F75440e30e8847bae0bcFEF1B1Da59F9958bbfB,1.01,99012841.96560293,,0xb5635a22189afbafc2015ed1d83b9ad20faa9fe8,0xd5e5869a574552332ac9f1c65d28b88c54d3f0049a87...,2024-04-04 10:19:22
90,0xf3E6Fef9f333978CE0F61c3ef53a23aFec38CA89,Trump Zora,18,0xd95E3F689B6194E55d47A94a1cdD77b01273d9a5,9.003,7837395372.271282,0x244399119865dAD865dF635A9C32D1D68e374f77,0x244399119865dad865df635a9c32d1d68e374f77,0xfa4444d15f81c1945c9c1a059fca1e604eaf874d6a05...,2024-04-04 10:19:19
91,0xf7898F34648d8262cA072cb0612D90F9Fd22ba08,Bonk Inu,18,0xA3126f0Fffa650Ec2f14C46d5fc364ce5982bDE1,16,4116000000.0,0x961B13D80449C993C170bE24d9c7cE95C4D01Ac7,0x961b13d80449c993c170be24d9c7ce95c4d01ac7,0x3282a4c34a72933b7778b10cb696c9860561263c3552...,2024-04-04 08:45:48
92,0xf8f97ca85B3408DD5acDb0F8F2A40f14a210308B,Leonidas AI,18,0x4C58e532971705F91AE86b5F4067d777185FB06A,10.225,978059676.3111501,0xfe71f62E152BF9c767673FA8fe65c8Eaac521C5D,0xfe71f62e152bf9c767673fa8fe65c8eaac521c5d,0xc428b4688ef5e9f94ab53738bf707f8fc215434ff9dc...,2024-04-04 09:01:38


In [4]:
import os

# Directorio de destino para el archivo CSV
output_dir = 'Output_concat'

# Comprueba si el directorio existe. Si no, lo crea
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# Ruta completa del archivo de salida
output_file_path = os.path.join(output_dir, 'tokens_concat.csv')

# Escribe el DataFrame df_concat al archivo CSV en el directorio especificado
tokens_df.to_csv(output_file_path, index=False, encoding='utf-8')

print(f'DataFrame escrito exitosamente a {output_file_path}')


DataFrame escrito exitosamente a Output_concat\tokens_concat.csv
