In [1]:
from dotenv import load_dotenv
import os, requests

load_dotenv()  # đọc các biến GEMINI_API_KEY, GEMINI_MODEL,…

API_KEY    = os.getenv("GEMINI_API_KEY")
MODEL_ID   = os.getenv("GEMINI_MODEL", "gemini-1.5-pro")
PROMPT     = os.getenv(
    "GEMINI_PROMPT",
    "Bạn là một trợ lý hữu ích. Hãy trả lời đầy đủ và chi tiết. Đừng lặp lại câu trả lời nếu không cần thiết."
)
MAX_TOKENS = int(os.getenv("GEMINI_MAX_TOKENS", "256"))
TEMP       = float(os.getenv("GEMINI_TEMPERATURE", "0.7"))

# Kiểm tra
print("API Key   :", "✓" if API_KEY else "✗")
print("Model     :", MODEL_ID)
print("MaxTokens :", MAX_TOKENS)
print("Temperature:", TEMP)

API Key   : ✓
Model     : gemini-1.5-pro
MaxTokens : 256
Temperature: 0.7


In [4]:
import time
import requests

last_call_time = 0

# Danh sách model ưu tiên
MODEL_FALLBACKS = [
    "gemini-1.5-pro",
    "gemini-2.0",
    "gemini-2.0-flash",
    "gemini-1.5-flash"
]

def call_gemini(prompt: str) -> str:
    global last_call_time

    if not API_KEY:
        raise ValueError("Please set GEMINI_API_KEY in .env")

    for model in MODEL_FALLBACKS:
        now = time.time()
        # Giới hạn tốc độ: tối thiểu 0.5 giây giữa 2 lần gọi
        if now - last_call_time < 0.5:
            time.sleep(0.5 - (now - last_call_time))
        last_call_time = time.time()

        print(f"\n;-; Đang thử model: {model}")

        # Xác định version
        if model.startswith("gemini-2.0") or model.startswith("gemini-1.5"):
            version = "v1"
        else:
            version = "v1beta"  # cho exp cũ (nếu thêm sau)
        endpoint = ":generateContent"

        payload = {
            "contents": [{"parts": [{"text": prompt}]}],
            "generationConfig": {
                "maxOutputTokens": MAX_TOKENS,
                "temperature": TEMP
            }
        }

        url = f"https://generativelanguage.googleapis.com/{version}/models/{model}{endpoint}?key={API_KEY}"
        print(f"[DEBUG] Gọi URL: {url}")

        # --- Retry loop ---
        for attempt in range(3):
            resp = requests.post(
                url,
                json=payload,
                headers={"Content-Type": "application/json"},
                timeout=30
            )

            if resp.status_code == 429:
                print(f"[429] Hết quota hoặc quá tải ở {model}. Thử lại sau...")
                break  # thoát retry → thử model kế tiếp

            if resp.status_code == 404:
                print(f"[404] Model {model} không tồn tại. Bỏ qua.")
                break

            try:
                resp.raise_for_status()
                data = resp.json()
                cand = data.get("candidates", [{}])[0]
                out = cand.get("output", "") or cand.get("content", "")
                if isinstance(out, str):
                    return out
                parts = out.get("parts", [])
                return "".join([p.get("text", "") for p in parts])
            except Exception as e:
                print(f"[ERROR] Model {model} gặp lỗi: {e}")
                break

    raise RuntimeError("❌ Tất cả model đều hết quota hoặc lỗi.")


In [5]:
# Cell 4: Test lại call_gemini
test_prompt = "Tóm tắt chương 1 của tài liệu PDF cho tôi."
print("-.- Prompt:", test_prompt)
print("\n`v` Gemini trả lời:\n", call_gemini(test_prompt))

-.- Prompt: Tóm tắt chương 1 của tài liệu PDF cho tôi.

;-; Đang thử model: gemini-1.5-pro
[DEBUG] Gọi URL: https://generativelanguage.googleapis.com/v1/models/gemini-1.5-pro:generateContent?key=AIzaSyDYR-CMmT8QYLH2eMvxoUfRzN03Vp-uQhA
[429] Hết quota hoặc quá tải ở gemini-1.5-pro. Thử lại sau...

;-; Đang thử model: gemini-2.0
[DEBUG] Gọi URL: https://generativelanguage.googleapis.com/v1/models/gemini-2.0:generateContent?key=AIzaSyDYR-CMmT8QYLH2eMvxoUfRzN03Vp-uQhA
[404] Model gemini-2.0 không tồn tại. Bỏ qua.

;-; Đang thử model: gemini-2.0-flash
[DEBUG] Gọi URL: https://generativelanguage.googleapis.com/v1/models/gemini-2.0-flash:generateContent?key=AIzaSyDYR-CMmT8QYLH2eMvxoUfRzN03Vp-uQhA

`v` Gemini trả lời:
 Để tôi tóm tắt chương 1 của tài liệu PDF cho bạn, tôi cần bạn cung cấp cho tôi nội dung của chương đó. Bạn có thể:

*   **Sao chép và dán nội dung chương 1 vào đây.**
*   **Tải tài liệu PDF lên một dịch vụ chia sẻ tệp và cung cấp liên kết cho tôi.**

Khi tôi có nội dung của chươ