In [5]:
from pymongo import MongoClient
from datetime import datetime, timezone
import os
import numpy as np
from dotenv import load_dotenv
load_dotenv() 
# --- CONFIG ---
MONGO_URI = os.getenv("MONGO_URI")

DB_NAME = "knowledge_graph"
wallet_address = "0xc574ee32e5dadac41a2d03f8b6498661d6dac3a2"

# --- KẾT NỐI DB ---
client = MongoClient(MONGO_URI)
db = client[DB_NAME]

# --- LẤY BORROW TẤT CẢ LENDING POOL ---
borrow_cursor = db["borrows"].aggregate([
    {"$match": {"walletAddress": wallet_address}},
    {"$group": {"_id": None, "total": {"$sum": "$totalAmountOfBorrowInUSD"}}}
])
borrow_result = next(borrow_cursor, {})
borrow_amount = borrow_result.get("total", 0)
print(f"📊 Tổng dư nợ tối đa trên tất cả lending pool (USD): {borrow_amount:.4f}")

# --- LẤY REPAY TẤT CẢ LENDING POOL ---
repay_cursor = db["repays"].aggregate([
    {"$match": {"walletAddress": wallet_address}},
    {"$group": {"_id": None, "total": {"$sum": "$totalAmountOfRepayInUSD"}}}
])
repay_result = next(repay_cursor, {})
repay_amount = repay_result.get("total", 0)
print(f"📊 Tổng số tiền đã trả trên tất cả lending pool (USD): {repay_amount:.4f}")

# --- TÍNH NỢ HIỆN TẠI ---
current_debt = max(borrow_amount - repay_amount, 0)

# --- TÍNH TRUNG BÌNH TÀI SẢN 3 NGÀY ---
wallet_docs = list(db["wallets"].find({
    "address": wallet_address
}))
multichain_wallet_docs = list(db["multichain_wallets"].find({
    "address": wallet_address
}))

now_ts = datetime.now(timezone.utc).timestamp()
three_days_ago = now_ts - 3 * 86400

# Tổng tài sản trung bình
total_avg_balance_all_chains = 0
multi_total_avg_balance_all_chains = 0

# Xử lý ví thường
for i, doc in enumerate(wallet_docs):
    balance_logs = doc.get("balanceChangeLogs", {})
    recent_values = []

    for ts, value in balance_logs.items():
        try:
            ts_int = int(ts)
            if ts_int >= three_days_ago:
                recent_values.append((ts_int, float(value)))
        except:
            continue

    recent_values.sort(reverse=True)
    latest_3 = [val for _, val in recent_values[:3]]
    avg_balance = sum(latest_3) / 3 if latest_3 else 0
    print(f"📄 Wallet thường {i+1}: Trung bình 3 ngày = {avg_balance:.6f}")
    total_avg_balance_all_chains += avg_balance

# Xử lý ví multichain
for i, doc in enumerate(multichain_wallet_docs):
    balance_logs = doc.get("balanceChangeLogs", {})
    recent_values = []

    for ts, value in balance_logs.items():
        try:
            ts_int = int(ts)
            if ts_int >= three_days_ago:
                recent_values.append((ts_int, float(value)))
        except:
            continue

    recent_values.sort(reverse=True)
    latest_3 = [val for _, val in recent_values[:3]]
    avg_balance = sum(latest_3) / 3 if latest_3 else 0
    print(f"📄 Wallet multichain {i+1}: Trung bình 3 ngày = {avg_balance:.6f}")
    multi_total_avg_balance_all_chains += avg_balance

# Tổng tài sản trung bình
total_assets = total_avg_balance_all_chains + multi_total_avg_balance_all_chains
print(f"\n💰 Tài sản trung bình (USD) 3 ngày gần nhất: {total_assets:.6f}")

# --- TÍNH TỶ LỆ NỢ TRÊN TÀI SẢN ---
U = current_debt / (total_assets + 1e-6)
D = 0 if U > 1 else 100 * (1 - U)

# --- IN KẾT QUẢ ---
print("\n📊 PHÂN TÍCH AMOUNTS OWED")
print(f"→ Tổng dư nợ tối đa (USD): {current_debt:.4f}")
print(f"→ Tài sản trung bình 3 ngày gần nhất (USD): {total_assets:.4f}")
print(f"→ Tỷ lệ nợ trên tài sản (U): {U:.6f}")
print(f"🎯 Điểm II - AMOUNTS OWED (D): {D:.6f}")


📊 Tổng dư nợ tối đa trên tất cả lending pool (USD): 104031.8580
📊 Tổng số tiền đã trả trên tất cả lending pool (USD): 84436.8220
📄 Wallet thường 1: Trung bình 3 ngày = 0.793431
📄 Wallet thường 2: Trung bình 3 ngày = 75.943920
📄 Wallet thường 3: Trung bình 3 ngày = 10.459278
📄 Wallet thường 4: Trung bình 3 ngày = 0.000000
📄 Wallet thường 5: Trung bình 3 ngày = 0.000000
📄 Wallet thường 6: Trung bình 3 ngày = 0.000000
📄 Wallet thường 7: Trung bình 3 ngày = 0.000000
📄 Wallet multichain 1: Trung bình 3 ngày = 63.248837

💰 Tài sản trung bình (USD) 3 ngày gần nhất: 150.445466

📊 PHÂN TÍCH AMOUNTS OWED
→ Tổng dư nợ tối đa (USD): 19595.0360
→ Tài sản trung bình 3 ngày gần nhất (USD): 150.4455
→ Tỷ lệ nợ trên tài sản (U): 130.246769
🎯 Điểm II - AMOUNTS OWED (D): 0.000000


In [8]:
project_id = "mfinance"

# 1. Lấy project
project = db["projects"].find_one({ "_id": project_id })

# 2. Lấy social
social = db["projects_social_media"].find_one({ "projectId": project_id })

# 3. Lấy danh sách smart contract liên quan
contracts = list(db["smart_contracts"].find({ "project": project_id }))

# 4. In thông tin
print("🔹 Project:", project["name"])
print("🔹 Website:", social.get("website"))
print("🔹 Smart contracts:")
for sc in contracts:
    print(f"  - Address: {sc['address']} on chain {sc['chainId']}")


OperationFailure: not authorized on knowledge_graph to execute command { find: "projects_social_media", filter: { projectId: "mfinance" }, limit: 1, singleBatch: true, lsid: { id: UUID("c0435d30-6c8b-4034-a86c-e3f581138419") }, $clusterTime: { clusterTime: Timestamp(1749889368, 182), signature: { hash: BinData(0, 64BC4FBF1BB42E8662835F3A682743715300D252), keyId: 7460821783331997426 } }, $db: "knowledge_graph" }, full error: {'ok': 0.0, 'errmsg': 'not authorized on knowledge_graph to execute command { find: "projects_social_media", filter: { projectId: "mfinance" }, limit: 1, singleBatch: true, lsid: { id: UUID("c0435d30-6c8b-4034-a86c-e3f581138419") }, $clusterTime: { clusterTime: Timestamp(1749889368, 182), signature: { hash: BinData(0, 64BC4FBF1BB42E8662835F3A682743715300D252), keyId: 7460821783331997426 } }, $db: "knowledge_graph" }', 'code': 13, 'codeName': 'Unauthorized', '$clusterTime': {'clusterTime': Timestamp(1749889368, 235), 'signature': {'hash': b"d\xbcO\xbf\x1b\xb4.\x86b\x83_:h'CqS\x00\xd2R", 'keyId': 7460821783331997426}}, 'operationTime': Timestamp(1749889368, 235)}

In [10]:
from pymongo import MongoClient
import json
from tqdm import tqdm  # Tiến trình hiển thị đẹp

# --- CONFIG ---
MONGO_URI = "mongodb://dsReader:ds_reader_ndFwBkv3LsZYjtUS@178.128.85.210:27017,104.248.148.66:27017,103.253.146.224:27017/"
DB_NAME = "knowledge_graph"
COLLECTION_NAME = "wallets"
OUTPUT_FILE = "wallet_addresses.json"
LIMIT = 10_000

# --- KẾT NỐI ---
print("🔌 Kết nối MongoDB...")
client = MongoClient(MONGO_URI)
db = client[DB_NAME]
collection = db[COLLECTION_NAME]

# --- TRUY VẤN VÀ LẤY ĐỊA CHỈ ---
print(f"📦 Truy vấn tối đa {LIMIT} địa chỉ từ collection '{COLLECTION_NAME}'...")
cursor = collection.find({}, {"_id": 0, "address": 1}).limit(LIMIT)

addresses = []
for doc in tqdm(cursor, total=LIMIT, desc="📤 Đang xử lý"):
    if "address" in doc:
        addresses.append(doc)

# --- GHI FILE JSON ---
print(f"💾 Ghi dữ liệu vào file: {OUTPUT_FILE}")
with open(OUTPUT_FILE, "w") as f:
    json.dump(addresses, f, indent=2)

print(f"✅ Đã lưu {len(addresses)} địa chỉ vào '{OUTPUT_FILE}'")


🔌 Kết nối MongoDB...
📦 Truy vấn tối đa 10000 địa chỉ từ collection 'wallets'...


📤 Đang xử lý: 100%|██████████| 10000/10000 [00:01<00:00, 9747.43it/s]

💾 Ghi dữ liệu vào file: wallet_addresses.json
✅ Đã lưu 10000 địa chỉ vào 'wallet_addresses.json'





In [11]:
from datasets import load_dataset

ds = load_dataset("spectrallabs/credit-scoring-training-dataset")

README.md:   0%|          | 0.00/1.81k [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


(…)6443279fF7C0AB5544_training_data.parquet:   0%|          | 0.00/112M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/442961 [00:00<?, ? examples/s]