In [10]:
import pandas as pd
from sqlalchemy import create_engine
from web3 import Web3 # Ainda precisamos para o objeto do contrato
import json

# --------------------------------------------------------------------------
# PASSO 1: Carregar os Dados REAIS e COMPLETOS do seu Banco de Dados
# --------------------------------------------------------------------------
print("--- Passo 1: Carregando dados enriquecidos da Mainnet ---")
db_connection_str = 'postgresql://admin:supersecret@localhost:5433/mempool_data'
db_engine = create_engine(db_connection_str)

try:
    df = pd.read_sql("SELECT * FROM transactions", con=db_engine)
    print(f"Sucesso! Carregamos {len(df)} transações REAIS e enriquecidas.")
    
    if df.empty:
        print("\nAVISO: A tabela está vazia. Deixe o coletor de dados rodar por mais tempo.")
    else:
        # Removemos linhas onde a coleta do inputData pode ter falhado
        df.dropna(subset=['inputData'], inplace=True)
        print(f"Analisando {len(df)} transações com 'inputData' válido.")

except Exception as e:
    print(f"--- ERRO ao carregar dados do banco: {e} ---")
    df = pd.DataFrame()

# --------------------------------------------------------------------------
# PASSO 2: Decodificar o 'inputData' que JÁ TEMOS
# --------------------------------------------------------------------------
if not df.empty:
    print("\n--- Passo 2: Decodificando 'inputData' para criar features ---")
    
    # Usamos um ABI combinado para ter mais chances de decodificar diferentes roteadores
    combined_abi_str = '[{"name":"swapExactTokensForTokens","inputs":[{"type":"address[]","name":"path"}],"type":"function"},{"name":"swapExactETHForTokens","inputs":[{"type":"address[]","name":"path"}],"type":"function"},{"name":"execute","inputs":[{"type":"bytes","name":"commands"},{"type":"bytes[]","name":"inputs"}],"type":"function"}]'
    combined_abi = json.loads(combined_abi_str)
    # Não precisamos de uma conexão web3 aqui, apenas do objeto ABI para decodificação offline
    generic_contract = Web3().eth.contract(abi=combined_abi)

    def decode_input_data(input_data):
        if not isinstance(input_data, str) or len(input_data) <= 10:
            return 'no_input_data'
        try:
            # O input data já está como string "0x...", então só precisamos converter para bytes
            input_bytes = bytes.fromhex(input_data[2:])
            func_obj, func_params = generic_contract.decode_function_input(input_bytes)
            return func_obj.fn_name
        except Exception:
            return 'desconhecido_ou_nao_swap'

    # Criamos a nova coluna com o nome da função decodificada
    df['function_name'] = df['inputData'].apply(decode_input_data)
    
    print("\nEngenharia de Features concluída!")
    print("\n--- Análise Final dos DADOS REAIS ---")
    print("Contagem das funções decodificadas:")
    
    # Mostra a contagem de quais funções encontramos
    display(df['function_name'].value_counts())
else:
    print("\nNenhum dado para analisar.")

--- Passo 1: Carregando dados enriquecidos da Mainnet ---
Sucesso! Carregamos 1023 transações REAIS e enriquecidas.
--- ERRO ao carregar dados do banco: ['inputData'] ---

Nenhum dado para analisar.


In [6]:
from web3 import Web3
import json
from tqdm.auto import tqdm
import pandas as pd
from concurrent.futures import ThreadPoolExecutor, as_completed

# --- GARANTINDO QUE OS DADOS ESTÃO CARREGADOS ---
# Se a variável 'df' não existir, este bloco tentará recarregá-la.
if 'df' not in locals() or df.empty:
    print("DataFrame 'df' não encontrado ou vazio, recarregando do CSV...")
    try:
        # Coloque o nome do seu arquivo CSV aqui
        file_path = 'proxy_transactions.csv' 
        df = pd.read_csv(file_path)
        print(f"Arquivo CSV '{file_path}' carregado com sucesso!")
    except FileNotFoundError:
        print(f"--- ERRO: Arquivo '{file_path}' não foi encontrado! ---")
        df = pd.DataFrame()

# --- CÓDIGO DA CÉLULA 2 (AGORA CORRIGIDO) ---
if not df.empty:
    print("\nConfigurando a conexão com a blockchain...")
    # Não se esqueça de colocar sua URL HTTP da Mainnet
    alchemy_url = "https://eth-mainnet.g.alchemy.com/v2/OPbbmuEc74NysSD6jK28Z" 
    w3 = Web3(Web3.HTTPProvider(alchemy_url))

    # CORREÇÃO: Usando um ABI mais completo e corretamente formatado
    router_abi_str = '[{"inputs":[{"internalType":"uint256","name":"amountIn","type":"uint256"},{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactTokensForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"nonpayable","type":"function"},{"inputs":[{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactETHForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"payable","type":"function"}]'
    router_abi = json.loads(router_abi_str)
    # Criamos um objeto de contrato genérico, o endereço não importa para decodificação
    generic_contract = w3.eth.contract(abi=router_abi)

    # Função para decodificar
    def decode_input_data(input_data):
        if not isinstance(input_data, str) or len(input_data) <= 10:
            return pd.Series(['no_input_data', None])
        try:
            input_bytes = bytes.fromhex(input_data[2:])
            # Tenta decodificar usando o ABI que fornecemos
            func_obj, func_params = generic_contract.decode_function_input(input_bytes)
            return pd.Series([func_obj.fn_name, str(func_params)])
        except Exception:
            # Se não conseguir decodificar com nosso ABI, marca como 'desconhecido'
            return pd.Series(['desconhecido', None])

    print("Decodificando 'inputData' para extrair a função e os parâmetros...")
    df[['function_name', 'decoded_params']] = df['input_data'].apply(decode_input_data)

    print("\nEngenharia de Features concluída!")
    print("\nFunções encontradas nas transações:")
    print(df['function_name'].value_counts())

    display(df[['hash', 'to_address', 'function_name']].head())
else:
    print("A tabela de dados (DataFrame 'df') está vazia. Execute a primeira célula para carregá-la.")


Configurando a conexão com a blockchain...
Decodificando 'inputData' para extrair a função e os parâmetros...


KeyError: 'input_data'