In [1]:
import pandas as pd
from sqlalchemy import create_engine
import json
import ast
from web3 import Web3

print("--- Passo 1: Carregando e Preparando os Dados ---")

# Conecta ao banco de dados e carrega as transações
db_connection_str = 'postgresql://admin:supersecret@localhost:5433/mempool_data'
db_engine = create_engine(db_connection_str)
try:
    df_raw = pd.read_sql("SELECT * FROM transactions", con=db_engine)
    print(f"Sucesso! Carregamos {len(df_raw)} transações da Mainnet.")
except Exception as e:
    print(f"--- ERRO ao carregar dados do banco: {e} ---")
    df_raw = pd.DataFrame()

# Decodifica o inputData para obter a função e os parâmetros
if not df_raw.empty:
    # CORREÇÃO: Usando o ABI completo e correto para as funções de swap da V2
    router_v2_abi_str = '[{"inputs":[{"internalType":"uint256","name":"amountIn","type":"uint256"},{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactTokensForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"nonpayable","type":"function"},{"inputs":[{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactETHForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"payable","type":"function"}]'
    router_abi = json.loads(router_v2_abi_str)
    generic_contract = Web3().eth.contract(abi=router_abi)

    def decode_params(input_data):
        try:
            input_bytes = bytes.fromhex(input_data[2:])
            func_obj, func_params = generic_contract.decode_function_input(input_bytes)
            return pd.Series([func_obj.fn_name, func_params])
        except Exception:
            return pd.Series(['Outra Funcao', None])

    df_raw[['function_name', 'params']] = df_raw['inputData'].apply(decode_params)
    
    # Filtramos apenas os swaps diretos de token para token
    swaps_df = df_raw[df_raw['function_name'] == 'swapExactTokensForTokens'].copy()
    
    # Extraímos as features da coluna de parâmetros
    if not swaps_df.empty:
        swaps_df['path'] = swaps_df['params'].apply(lambda p: p.get('path', []))
        swaps_df['amount_in'] = swaps_df['params'].apply(lambda p: p.get('amountIn', 0))
    
    print(f"\nPreparação concluída. Encontramos {len(swaps_df)} swaps diretos ('swapExactTokensForTokens') para analisar.")
    
    if not swaps_df.empty:
        display(swaps_df[['hash', 'path', 'amount_in']].head())
    
else:
    print("Nenhum dado para analisar.")

--- Passo 1: Carregando e Preparando os Dados ---
Sucesso! Carregamos 11204 transações da Mainnet.

Preparação concluída. Encontramos 0 swaps diretos para analisar.


Unnamed: 0,hash,path
