In [2]:
import pandas as pd
from sqlalchemy import create_engine
import json
import ast
from web3 import Web3

print("--- Passo 1: Carregando e Preparando os Dados ---")

# Conecta ao banco de dados e carrega as transações
db_connection_str = 'postgresql://admin:supersecret@localhost:5433/mempool_data'
db_engine = create_engine(db_connection_str)
try:
    df_raw = pd.read_sql("SELECT * FROM transactions", con=db_engine)
    print(f"Sucesso! Carregamos {len(df_raw)} transações da Mainnet.")
except Exception as e:
    print(f"--- ERRO ao carregar dados do banco: {e} ---")
    df_raw = pd.DataFrame()

# Decodifica o inputData para obter a função e os parâmetros
if not df_raw.empty:
    # CORREÇÃO: Usando o ABI completo e correto para as funções de swap da V2
    router_v2_abi_str = '[{"inputs":[{"internalType":"uint256","name":"amountIn","type":"uint256"},{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactTokensForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"nonpayable","type":"function"},{"inputs":[{"internalType":"uint256","name":"amountOutMin","type":"uint256"},{"internalType":"address[]","name":"path","type":"address[]"},{"internalType":"address","name":"to","type":"address"},{"internalType":"uint256","name":"deadline","type":"uint256"}],"name":"swapExactETHForTokens","outputs":[{"internalType":"uint256[]","name":"amounts","type":"uint256[]"}],"stateMutability":"payable","type":"function"}]'
    router_abi = json.loads(router_v2_abi_str)
    generic_contract = Web3().eth.contract(abi=router_abi)

    def decode_params(input_data):
        try:
            input_bytes = bytes.fromhex(input_data[2:])
            func_obj, func_params = generic_contract.decode_function_input(input_bytes)
            return pd.Series([func_obj.fn_name, func_params])
        except Exception:
            return pd.Series(['Outra Funcao', None])

    df_raw[['function_name', 'params']] = df_raw['inputData'].apply(decode_params)
    
    # Filtramos apenas os swaps diretos de token para token
    swaps_df = df_raw[df_raw['function_name'] == 'swapExactTokensForTokens'].copy()
    
    # Extraímos as features da coluna de parâmetros
    if not swaps_df.empty:
        swaps_df['path'] = swaps_df['params'].apply(lambda p: p.get('path', []))
        swaps_df['amount_in'] = swaps_df['params'].apply(lambda p: p.get('amountIn', 0))
    
    print(f"\nPreparação concluída. Encontramos {len(swaps_df)} swaps diretos ('swapExactTokensForTokens') para analisar.")
    
    if not swaps_df.empty:
        display(swaps_df[['hash', 'path', 'amount_in']].head())
    
else:
    print("Nenhum dado para analisar.")

--- Passo 1: Carregando e Preparando os Dados ---
Sucesso! Carregamos 11255 transações da Mainnet.

Preparação concluída. Encontramos 628 swaps diretos ('swapExactTokensForTokens') para analisar.


Unnamed: 0,hash,path,amount_in
48,0x2bac9afa1473520929a5cd758703014f7e4fb20da995...,"[0xf477AC7719e2e659001455cDDA0cc8f3aD10b604, 0...",48466664239760000000000
58,0x8f8f87dcc8fd0eb814d5a9f2e38c926e4a289eea0f70...,"[0x02e7F808990638E9e67E1f00313037EDe2362361, 0...",18714392093986760000000000
61,0x2d85f7b25011faeca2175661d3f7da13ad6769550da5...,"[0xa29C9a740De8194e4016747E9A04a84946ada0a5, 0...",10813060000000000000000
74,0x39298a18e145d0c861d6689edc5d6cf35ad9dafa5952...,"[0xdAC17F958D2ee523a2206206994597C13D831ec7, 0...",693630000
76,0xf3a0900f978fd0a7e3ec0630dc82f32434a8eca3f2b4...,"[0x943Af2ece93118B973c95c2F698EE9D15002e604, 0...",165791800000000000000000


In [4]:
# Só executa se o DataFrame 'swaps_df' da célula anterior foi criado e não está vazio
if 'swaps_df' in locals() and not swaps_df.empty:
    print("\n--- Passo 2: Procurando por Oportunidades de Arbitragem Triangular (em todo o dataset) ---")

    print(f"Analisando todos os {len(swaps_df)} swaps coletados para encontrar ciclos...")

    # Criamos um dicionário para mapear todas as trocas possíveis em todo o dataset
    # A chave é o token de entrada, o valor é uma lista de possíveis tokens de saída
    path_map = {}
    
    for index, row in swaps_df.iterrows():
        path = row['path']
        # Garantimos que o caminho é uma lista e tem pelo menos 2 tokens
        if isinstance(path, list) and len(path) == 2:
            token_a, token_b = path[0], path[1]
            if token_a not in path_map:
                path_map[token_a] = []
            # Adicionamos o token de saída à lista de possibilidades (sem duplicatas)
            if token_b not in path_map[token_a]:
                path_map[token_a].append(token_b)

    # O Algoritmo Caçador de Triângulos
    found_cycles = []
    
    # Iteramos por cada token de início possível (Token A)
    for token_a, connections_b in path_map.items():
        # Iteramos por cada token intermediário possível (Token B)
        for token_b in connections_b:
            # Verificamos se o Token B também tem conexões de saída
            if token_b in path_map:
                # Iteramos por cada token final possível (Token C)
                for token_c in path_map[token_b]:
                    # A condição de ouro: existe um caminho de volta de C para A?
                    if token_c in path_map and token_a in path_map[token_c]:
                        # Evita ciclos triviais como A -> B -> A -> A
                        if token_c != token_a:
                            cycle = f"{token_a} -> {token_b} -> {token_c} -> {token_a}"
                            if cycle not in found_cycles:
                                found_cycles.append(cycle)

    if found_cycles:
        print(f"\nEncontrados {len(found_cycles)} potenciais ciclos de arbitragem triangular para investigar:")
        for opp in found_cycles:
            print(f"  - Ciclo Encontrado: {opp}")
    else:
        print("\nNenhum ciclo triangular (A->B->C->A) encontrado nos dados coletados.")
        
else:
    print("DataFrame de swaps está vazio. Execute a célula anterior primeiro.")


--- Passo 2: Procurando por Oportunidades de Arbitragem Triangular (em todo o dataset) ---
Analisando todos os 628 swaps coletados para encontrar ciclos...

Nenhum ciclo triangular (A->B->C->A) encontrado nos dados coletados.
