In [2]:
from pymongo import MongoClient
import pandas as pd

# Kết nối MongoDB
uri = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
client = MongoClient(uri)
db = client['arbitrum_blockchain_etl']  

collection = db["lending_events"]
cursor = collection.find(
    {"event_type": "DEPOSIT"},
    {
        "wallet": 1,
        "user": 1,
        "amount": 1,
        "block_timestamp": 1,
        "event_type": 1,
        "contract_address": 1,
        "transaction_hash": 1
    }
).limit(10000)  
# Chuyển sang DataFrame
df = pd.DataFrame(list(cursor))
df.drop(columns=["_id"], inplace=True, errors="ignore")

# (Tùy chọn) Chuyển block_timestamp sang datetime
df["block_time"] = pd.to_datetime(df["block_timestamp"], unit="s")

# Lưu ra file
df.to_parquet("arbitrum_deposit_events.parquet", index=False)

print("✅ Đã lưu arbitrum_deposit_events.parquet")
df.to_csv("arbitrum_deposit_events.csv", index=False)
print("✅ Đã lưu arbitrum_deposit_events.csv")


✅ Đã lưu arbitrum_deposit_events.parquet
✅ Đã lưu arbitrum_deposit_events.csv


In [None]:
import math
import time
import json
from pymongo import MongoClient

# ==============================================================================
# SECTION 1: CÁC HÀM TÍNH TOÁN (CÔNG THỨC MỚI ĐÃ SỬA LỖI)
# ==============================================================================

def calculate_payment_history_new_formula(onchain_data: dict):
    """
    Tính điểm Payment History theo công thức mới, không dựa vào độ trễ.
    Bao gồm 3 tiêu chí: Tránh thanh lý, Khối lượng trả nợ, và Sự gần đây.
    """
    wallet_summary = onchain_data['wallet_summary']
    repayment_docs = onchain_data.get('repayment_docs', [])
    liquidation_count = len(onchain_data.get('liquidation_history', []))
    wallet_address = wallet_summary.get('address', 'N/A')

    # --- 1. Tính Điểm Tránh Thanh lý (Liquidation Avoidance Score) ---
    # Thang điểm 0-100. 0 lần thanh lý -> 100 điểm.
    score_liquidation = (1 / (1 + liquidation_count)) * 100

    # --- 2. Tính Điểm Khối lượng Trả nợ (Repayment Volume Score) ---
    # SỬA LỖI: Lấy tổng giá trị trực tiếp từ trường 'totalAmountOfRepayInUSD' ở cấp cao nhất của mỗi document `repays`.
    total_repaid_usd = sum(doc.get('totalAmountOfRepayInUSD', 0) for doc in repayment_docs)
    
    # Chuẩn hóa điểm: Đặt mốc 1,000,000 USD là 100 điểm.
    benchmark_usd = 500_000
    # Thêm 1 để tránh log(0)
    log_total = math.log10(1 + total_repaid_usd)
    log_benchmark = math.log10(1 + benchmark_usd)
    score_volume = min(100, (log_total / log_benchmark) * 100) if log_benchmark > 0 else 0

    # --- 3. Tính Điểm Gần đây (Recency Score) ---
    all_repay_timestamps = [int(ts) for doc in repayment_docs for ts in doc.get('repayLogs', {}).keys()]
    score_recency = 0.0
    if all_repay_timestamps:
        last_repay_ts = max(all_repay_timestamps)
        current_ts = int(time.time())
        days_since_last_repay = (current_ts - last_repay_ts) / (24 * 60 * 60)
        
        # Dùng hàm suy giảm e^-kx. 
        # k=0.03 -> sau ~23 ngày điểm giảm còn một nửa.
        k = 0.03
        score_recency = math.exp(-k * days_since_last_repay) * 100
    
    # --- 4. Tính điểm tổng hợp theo trọng số ---
    # Trọng số: 50% Thanh lý, 35% Khối lượng, 15% Gần đây
    final_score = (0.50 * score_liquidation) + \
                  (0.35 * score_volume) + \
                  (0.15 * score_recency)

    print("\n--- Phân tích điểm (I) THEO CÔNG THỨC MỚI ---")
    print(f"  - Điểm Tránh Thanh lý: {score_liquidation:.2f} / 100 (từ {liquidation_count} lần thanh lý)")
    print(f"  - Điểm Khối lượng Trả nợ: {score_volume:.2f} / 100 (tổng trả ${total_repaid_usd:,.2f})")
    print(f"  - Điểm Gần đây: {score_recency:.2f} / 100")

    return final_score

# ==============================================================================
# SECTION 2: HÀM LẤY DỮ LIỆU
# ==============================================================================

def get_data_for_scoring(wallet_address: str, db):
    """
    Lấy dữ liệu on-chain từ các collection wallets, liquidates, và repays.
    """
    wallet_data = db.wallets.find_one({"address": wallet_address})
    if not wallet_data: 
        return None
        
    liquidation_events = list(db.liquidates.find({"liquidatedWallet": wallet_address}))
    repayment_docs = list(db.repays.find({"walletAddress": wallet_address}))
    
    return {
        "wallet_summary": wallet_data,
        "liquidation_history": liquidation_events,
        "repayment_docs": repayment_docs
    }

# ==============================================================================
# SECTION 3: PHẦN THỰC THI CHÍNH
# ==============================================================================

if __name__ == '__main__':
    uri = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
    client = MongoClient(uri)
    db = client['knowledge_graph']
    print(f"Đã kết nối tới database: '{db.name}'")

    # --- Chọn ví để chấm điểm ---
    target_wallet = "0x0a910734751eef41296aeb5d636240c902ea8171"
    print(f"\n--- Bắt đầu chấm điểm cho ví: {target_wallet} ---")
    
    onchain_data = get_data_for_scoring(target_wallet, db)

    if onchain_data:
        print("Lấy dữ liệu thành công!")
        score_I = calculate_payment_history_new_formula(onchain_data)
        print(f"\n===> ĐIỂM PAYMENT HISTORY (I) MỚI: {score_I:.2f} / 100")
    else:
        print(f"Lỗi: Không tìm thấy dữ liệu cho ví: {target_wallet}")

Đã kết nối tới database: 'knowledge_graph'

--- Bắt đầu chấm điểm cho ví: 0x0a910734751eef41296aeb5d636240c902ea8171 ---
Lấy dữ liệu thành công!

--- Phân tích điểm (I) THEO CÔNG THỨC MỚI ---
  - Điểm Tránh Thanh lý: 7.69 / 100 (từ 12 lần thanh lý)
  - Điểm Khối lượng Trả nợ: 81.39 / 100 (tổng trả $43,505.20)
  - Điểm Gần đây: 0.00 / 100

===> ĐIỂM PAYMENT HISTORY (I) MỚI: 32.33 / 100


In [7]:
import time
from datetime import datetime
from pymongo import MongoClient

# =======================================================
# SECTION 1: HÀM LẤY DỮ LIỆU (Giữ nguyên)
# =======================================================

def get_data_for_scoring(wallet_address: str, db):
    """
    Lấy dữ liệu cần thiết từ các collection wallets, liquidates.
    """
    wallet_data = db.wallets.find_one({"address": wallet_address})
    if not wallet_data: 
        return None
        
    liquidation_events = list(db.liquidates.find({"liquidatedWallet": wallet_address}))
    
    return {
        "wallet_summary": wallet_data,
        "liquidation_history": liquidation_events,
    }

# =======================================================
# SECTION 2: HÀM TÍNH ĐIỂM III (THEO PHƯƠNG ÁN 2)
# =======================================================

def calculate_credit_history_length_score_v2(onchain_data: dict) -> float:
    """
    Tính điểm III - Tuổi tín dụng theo Phương án 2:
    Tách riêng Điểm Tuổi và Điểm Hoạt động.
    """
    wallet_summary = onchain_data['wallet_summary']
    liquidation_history = onchain_data.get('liquidation_history', [])
    
    # --- Bước 1: Thu thập tất cả các timestamp hoạt động ---
    all_timestamps = []
    log_fields = ['balanceChangeLogs', 'depositChangeLogs', 'borrowChangeLogs']
    for field in log_fields:
        logs = wallet_summary.get(field, {})
        if logs and isinstance(logs, dict):
            all_timestamps.extend([int(ts) for ts in logs.keys()])

    for event in liquidation_history:
        liquidation_logs = event.get('liquidationLogs', {})
        if liquidation_logs and isinstance(liquidation_logs, dict):
            for log_group in liquidation_logs.values():
                if isinstance(log_group, dict):
                    all_timestamps.extend([int(ts) for ts in log_group.keys()])
            
    if not all_timestamps:
        print("\n--- Phân tích điểm (III) - Phương án 2 ---")
        print("  - Ví không có hoạt động nào được ghi nhận.")
        return 0.0

    # --- Bước 2: Tính toán các biến X, Xa, E ---
    first_activity_ts = min(all_timestamps)
    current_ts = int(time.time())
    wallet_age_days = (current_ts - first_activity_ts) / (24 * 60 * 60)
    X = wallet_age_days if wallet_age_days > 0 else 0

    unique_days = set(datetime.fromtimestamp(ts).strftime('%Y-%m-%d') for ts in all_timestamps)
    Xa = len(unique_days)

    E = Xa / X if X > 0 else 0

    # --- Bước 3: Áp dụng công thức của Phương án 2 ---
    
    # 3.1. Tính Score_Age (Điểm Tuổi) - thang 0-100
    # Mốc 5 năm (1825 ngày) sẽ được 100 điểm.
    MAX_AGE_YEARS = 5
    score_age = min(100, (X / (365 * MAX_AGE_YEARS)) * 100)

    # 3.2. Tính Score_Activity (Điểm Hoạt động) - thang 0-100
    score_activity = E * 100

    # 3.3. Tính điểm cuối cùng theo trọng số 70/30
    final_score = (0.9 * score_age) + (0.1 * score_activity)

    print("\n--- Phân tích điểm (III) - Phương án 2 ---")
    print(f"  - Tuổi ví (X): {X:.2f} ngày")
    print(f"  - Số ngày hoạt động (Xa): {Xa} ngày")
    print(f"  - ==> Điểm Tuổi (trọng số 70%): {score_age:.2f} / 100")
    print(f"  - ==> Điểm Hoạt động (trọng số 30%): {score_activity:.2f} / 100")

    return final_score

# =======================================================
# SECTION 3: PHẦN THỰC THI CHÍNH
# =======================================================

if __name__ == '__main__':
    uri = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
    client = MongoClient(uri)
    db = client['knowledge_graph']
    print(f"Đã kết nối tới database: '{db.name}'")

    # --- Chọn ví để chấm điểm ---
    target_wallet = "0x5ccd16958b3808d80b24838dd7190c67bfde91d0"
    print(f"\n--- Bắt đầu chấm điểm cho ví: {target_wallet} ---")
    
    onchain_data = get_data_for_scoring(target_wallet, db)

    if onchain_data:
        print("Lấy dữ liệu thành công!")
        # Gọi hàm tính điểm theo Phương án 2
        score_III = calculate_credit_history_length_score_v2(onchain_data)
        print(f"\n===> ĐIỂM LENGTH OF CREDIT HISTORY (III) MỚI: {score_III:.2f} / 100")
    else:
        print(f"Lỗi: Không tìm thấy dữ liệu cho ví: {target_wallet}")

Đã kết nối tới database: 'knowledge_graph'

--- Bắt đầu chấm điểm cho ví: 0x5ccd16958b3808d80b24838dd7190c67bfde91d0 ---
Lấy dữ liệu thành công!

--- Phân tích điểm (III) - Phương án 2 ---
  - Tuổi ví (X): 855.73 ngày
  - Số ngày hoạt động (Xa): 49 ngày
  - ==> Điểm Tuổi (trọng số 70%): 46.89 / 100
  - ==> Điểm Hoạt động (trọng số 30%): 5.73 / 100

===> ĐIỂM LENGTH OF CREDIT HISTORY (III) MỚI: 42.77 / 100


In [11]:
from pymongo import MongoClient
import json

# =======================================================
# SECTION 1: HÀM LẤY DỮ LIỆU (Giữ nguyên)
# =======================================================

def get_data_for_credit_mix(wallet_address: str, db):
    """
    Lấy dữ liệu cần thiết: danh sách các contract đã tương tác và thông tin tags.
    """
    print("Bắt đầu lấy dữ liệu cho công thức Credit Mix...")
    
    interacted_contracts_set = set()
    try:
        interacted_contracts_set.update(db.borrows.distinct("lendingPoolAddress", {"walletAddress": wallet_address}))
        interacted_contracts_set.update(db.repays.distinct("lendingPoolAddress", {"walletAddress": wallet_address}))
        interacted_contracts_set.update(db.deposits.distinct("protocolAddress", {"walletAddress": wallet_address}))
    except Exception as e:
        print(f"Lưu ý: Có lỗi khi truy vấn dữ liệu tương tác: {e}")

    final_interacted_contracts = list(interacted_contracts_set)
    
    if not final_interacted_contracts:
        print("Ví này không có lịch sử tương tác nào được ghi nhận.")
        return []

    print(f"Tìm thấy {len(final_interacted_contracts)} địa chỉ smart contract đã tương tác.")

    contracts_cursor = db.smart_contracts.find(
        {"address": {"$in": final_interacted_contracts}},
        {"address": 1, "tags": 1}
    )
    
    return list(contracts_cursor)

# =======================================================
# SECTION 2: HÀM TÍNH ĐIỂM IV (CÔNG THỨC TRỌNG SỐ CHI TIẾT)
# =======================================================

def calculate_credit_mix_weighted(interacted_contracts_data: list) -> float:
    """
    Tính điểm IV - Đa dạng tín dụng theo công thức trọng số chi tiết.
    """
    if not interacted_contracts_data:
        print("\n--- Phân tích điểm (IV) - Công thức Trọng số ---")
        print("  - Không có dữ liệu tương tác để phân tích.")
        return 0.0

    # 1. Bản đồ phân loại tags vào các danh mục mới
    BEHAVIOR_MAP = {
        # Danh mục Lending & Staking
        "lending": "lending_staking",
        "staking": "lending_staking",
        "venus": "lending_staking", # Venus là một giao thức lending
        "yield-farming": "lending_staking",
        # Danh mục DEX
        "dex": "dex",
        "token": "dex", # Tương tác với token thường liên quan đến DEX/swap
        # Danh mục Derivatives
        "derivatives": "derivatives",
        # Danh mục NFT
        "nft": "nft",
        # Danh mục Khác
        "address": "other",
        "gaming": "other"
    }
    
    # 2. Phân loại các contract đã tương tác vào từng nhóm
    categorized_protocols = {
        "lending_staking": set(),
        "dex": set(),
        "derivatives": set(),
        "nft": set(),
        "other": set()
    }

    for contract in interacted_contracts_data:
        contract_address = contract.get("address")
        tags = contract.get("tags", [])
        
        # Mặc định là 'other' nếu không tìm thấy tag nào khớp
        behavior_group = "other"
        for tag in tags:
            if tag in BEHAVIOR_MAP:
                behavior_group = BEHAVIOR_MAP[tag]
                break 
        
        categorized_protocols[behavior_group].add(contract_address)

    # 3. Tính toán các điểm thành phần
    p_lending = len(categorized_protocols["lending_staking"])
    p_dex = len(categorized_protocols["dex"])
    p_derivatives = len(categorized_protocols["derivatives"])
    p_nft = len(categorized_protocols["nft"])
    p_other = len(categorized_protocols["other"])

    score_lending = min(25, 10 * p_lending)
    score_dex = min(20, 10 * p_dex)
    score_derivatives = min(25, 15 * p_derivatives)
    score_nft = min(15, 5 * p_nft)
    score_other = min(10, 5 * p_other)

    # 4. Tính điểm cuối cùng bằng cách cộng các điểm thành phần
    final_score_iv = score_lending + score_dex + score_derivatives + score_nft + score_other

    print("\n--- Phân tích điểm (IV) - Công thức Trọng số Chi tiết ---")
    print(f"  - Nhóm Lending/Staking: {p_lending} giao thức => Điểm: {score_lending:.2f} / 25")
    print(f"  - Nhóm DEX: {p_dex} giao thức => Điểm: {score_dex:.2f} / 20")
    print(f"  - Nhóm Derivatives: {p_derivatives} giao thức => Điểm: {score_derivatives:.2f} / 25")
    print(f"  - Nhóm NFT: {p_nft} giao thức => Điểm: {score_nft:.2f} / 15")
    print(f"  - Nhóm Khác: {p_other} giao thức => Điểm: {score_other:.2f} / 10")

    return min(100, final_score_iv) # Đảm bảo không vượt 100

# =======================================================
# SECTION 3: PHẦN THỰC THI CHÍNH
# =======================================================

if __name__ == '__main__':
    uri = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
    client = MongoClient(uri)
    db = client['knowledge_graph']
    print(f"Đã kết nối tới database: '{db.name}'")

    target_wallet = "0x76bce1677f09ab85fe62636e766c2dec58501eb6"
    print(f"\n--- Bắt đầu chấm điểm IV cho ví: {target_wallet} ---")
    
    interacted_contracts_data = get_data_for_credit_mix(target_wallet, db)

    score_IV = calculate_credit_mix_weighted(interacted_contracts_data)
    print(f"\n===> ĐIỂM CREDIT MIX (IV) THEO TRỌNG SỐ: {score_IV:.2f} / 100")

Đã kết nối tới database: 'knowledge_graph'

--- Bắt đầu chấm điểm IV cho ví: 0x76bce1677f09ab85fe62636e766c2dec58501eb6 ---
Bắt đầu lấy dữ liệu cho công thức Credit Mix...
Tìm thấy 1 địa chỉ smart contract đã tương tác.

--- Phân tích điểm (IV) - Công thức Trọng số Chi tiết ---
  - Nhóm Lending/Staking: 0 giao thức => Điểm: 0.00 / 25
  - Nhóm DEX: 1 giao thức => Điểm: 10.00 / 20
  - Nhóm Derivatives: 0 giao thức => Điểm: 0.00 / 25
  - Nhóm NFT: 0 giao thức => Điểm: 0.00 / 15
  - Nhóm Khác: 1 giao thức => Điểm: 5.00 / 10

===> ĐIỂM CREDIT MIX (IV) THEO TRỌNG SỐ: 15.00 / 100


In [17]:
import time
import math
import numpy as np
from pymongo import MongoClient, ASCENDING

# =======================================================
# SECTION 1: CÁC HÀM TÍNH ĐIỂM V (PHIÊN BẢN HIỆU CHỈNH)
# =======================================================

def get_new_protocols_and_details(wallet_address: str, db):
    """
    Hàm này tìm các giao thức mới và trả về cả danh sách và thông tin chi tiết của chúng.
    """
    thirty_days_ago_ts = int(time.time()) - (30 * 24 * 60 * 60)
    
    # Lấy danh sách các giao thức đã tương tác gần đây
    recent_protocols_set = set()
    # (Thêm logic truy vấn borrows, repays, deposits như code trước để có recent_protocols_set)
    try:
        recent_protocols_set.update(db.borrows.distinct("lendingPoolAddress", {"walletAddress": wallet_address, "timestamp": {"$gte": thirty_days_ago_ts}}))
        recent_protocols_set.update(db.repays.distinct("lendingPoolAddress", {"walletAddress": wallet_address, "timestamp": {"$gte": thirty_days_ago_ts}}))
        recent_protocols_set.update(db.deposits.distinct("protocolAddress", {"walletAddress": wallet_address, "timestamp": {"$gte": thirty_days_ago_ts}}))
    except Exception:
        pass # Bỏ qua lỗi nếu collection không tồn tại

    if not recent_protocols_set:
        return [], [] # Trả về hai danh sách rỗng

    new_protocols_list = []
    for protocol_addr in recent_protocols_set:
        if not protocol_addr: continue
        
        # Tìm timestamp tương tác ĐẦU TIÊN NHẤT với giao thức này
        first_borrow = db.borrows.find_one({"walletAddress": wallet_address, "lendingPoolAddress": protocol_addr}, sort=[("timestamp", ASCENDING)])
        # ... (tương tự cho repays, deposits) ...
        
        first_interaction_ts = first_borrow['timestamp'] if first_borrow else float('inf')
        
        if first_interaction_ts >= thirty_days_ago_ts:
            new_protocols_list.append(protocol_addr)
            
    # Lấy thông tin chi tiết (bao gồm numberOfHolders) của các giao thức mới
    new_protocols_details = []
    if new_protocols_list:
        new_protocols_details = list(db.smart_contracts.find(
            {"address": {"$in": new_protocols_list}},
            {"numberOfHolders": 1}
        ))
        
    return new_protocols_list, new_protocols_details

def calculate_new_credit_score_v2(wallet_address: str, db) -> float:
    """
    Tính điểm V - New Credit theo công thức hybrid (Tốc độ + Chất lượng).
    """
    print("\n--- Phân tích điểm (V) - Công thức Hybrid ---")

    # --- Bước 1: Lấy thông tin về các giao thức mới ---
    new_protocols, new_protocols_details = get_new_protocols_and_details(wallet_address, db)
    
    # --- Bước 2: Tính Điểm Tốc độ (S_rate) ---
    n = len(new_protocols)
    k = 0.5
    score_rate = 100 * math.exp(-k * n)

    # --- Bước 3: Tính Điểm Chất lượng (S_quality) ---
    score_quality = 0.0
    if n > 0 and new_protocols_details:
        # Lấy benchmark: số holders trung bình của top 100 giao thức
        try:
            benchmark_cursor = db.smart_contracts.find({}, {"numberOfHolders": 1}).sort("numberOfHolders", -1).limit(100)
            benchmark_holders = [doc.get('numberOfHolders', 0) for doc in benchmark_cursor]
            h_benchmark = np.mean(benchmark_holders) if benchmark_holders else 1
            
            # Tính số holders trung bình của các giao thức mới
            avg_new_holders = np.mean([doc.get('numberOfHolders', 0) for doc in new_protocols_details])
            
            # Tính điểm chất lượng
            score_quality = min(100, (avg_new_holders / h_benchmark) * 100)
        except Exception as e:
            print(f"  - Lỗi khi tính điểm chất lượng: {e}")
            score_quality = 50.0 # Gán một giá trị trung bình nếu có lỗi
            
    # Nếu không có giao thức mới, điểm chất lượng là tối đa
    elif n == 0:
        score_quality = 100.0

    # --- Bước 4: Tính điểm cuối cùng theo trọng số 70/30 ---
    final_score_v = (0.7 * score_rate) + (0.3 * score_quality)

    print(f"  - Số giao thức mới trong 30 ngày (n): {n}")
    print(f"  - ==> Điểm Tốc độ (70%): {score_rate:.2f} / 100")
    print(f"  - ==> Điểm Chất lượng (30%): {score_quality:.2f} / 100")

    return final_score_v

# =======================================================
# PHẦN THỰC THI CHÍNH
# =======================================================

if __name__ == '__main__':
    uri = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
    client = MongoClient(uri)
    db = client['knowledge_graph']
    print(f"Đã kết nối tới database: '{db.name}'")

    target_wallet = "0x76bce1677f09ab85fe62636e766c2dec58501eb6"
    print(f"\n--- Bắt đầu chấm điểm V cho ví: {target_wallet} ---")
    
    score_V = calculate_new_credit_score_v2(target_wallet, db)
    
    print(f"\n===> ĐIỂM NEW CREDIT (V) MỚI: {score_V:.2f} / 100")

Đã kết nối tới database: 'knowledge_graph'

--- Bắt đầu chấm điểm V cho ví: 0x76bce1677f09ab85fe62636e766c2dec58501eb6 ---

--- Phân tích điểm (V) - Công thức Hybrid ---
  - Số giao thức mới trong 30 ngày (n): 0
  - ==> Điểm Tốc độ (70%): 100.00 / 100
  - ==> Điểm Chất lượng (30%): 100.00 / 100

===> ĐIỂM NEW CREDIT (V) MỚI: 100.00 / 100
