## GitHub Models 基本程式碼範例
此範例展示了如何呼叫 OpenAI 的 Chat Completion API。並利用 GitHub 的 AI 模型推論端點以及透過 GitHub Token 呼叫執行。

### 前置作業
#### 📌 申請 GitHub API Token
**1.建立 GitHub Personal Access Token (PAT)：**
- 前往 [GitHub Settings](https://github.com/settings/personal-access-tokens)
- 進入 Developer settings > Personal access tokens > Fine-grained tokens

![](https://cdn-images-1.medium.com/max/800/1*JhvMmQ5v3PbQzYl04plAaQ.png)
    
- 點選 「Generate new token」，並選擇 Public Repositories (read-only) 權限
- 生成 Token 並妥善保存

![](https://cdn-images-1.medium.com/max/800/1*JcZ2NVNRj4-ViXmIOYo6uQ.png)

#### 📌 設定 Colab Secrets
為了安全起見，不建議直接在程式碼中明碼顯示 Token，而是應該使用 Colab Secrets 來存取（如果是本機開發建議使用dotenv管理環境變數）。

在 Google Colab 左側選單點擊「🔑 Secrets」
- 點擊 「+ Add new secret」
- Name 欄位輸入 GITHUB_TOKEN
- Value 欄位貼上剛剛在 GitHub 生成的 Token
- 點擊「access✓」按鈕允許 Colab 有權限存取金鑰

![](https://cdn-images-1.medium.com/max/800/1*k4y8ac_Gyewrjf-n1PvL0w.png)

## 👨🏻‍💻 在 Google Colab 執行 API 測試
這個範例程式會自動讀取 GitHub Token，透過 GitHub Models API 呼叫 GPT-4o 來測試 LLM 模型的回應能力。程式首先從 Google Colab 的 Secrets 取得 GITHUB_TOKEN，並使用 OpenAI 客戶端 來連接 GitHub Models 伺服器。

In [None]:
import os
from openai import OpenAI
from google.colab import userdata

# 驗證模型需要使用 GitHub 的 Personal Access Token (PAT)。
# 你可以在 GitHub 設定中產生 PAT，詳見官方文件：
# https://docs.github.com/en/authentication/keeping-your-account-and-data-secure/managing-your-personal-access-tokens
client = OpenAI(
    base_url="https://models.inference.ai.azure.com",  # 設定 API 伺服器的基礎 URL
    api_key=userdata.get('GITHUB_TOKEN'),  # 從 Google Colab 的使用者資料中取得 GitHub Token
)

接著，程式發送一個 聊天請求 (chat completion request)，其中包含 System Prompt，設定 AI 為繁體中文問答助手，並讓使用者詢問「法國的首都？」。最後，AI 會根據模型參數 (如 Temperature、Max Tokens、Top P) 生成回應，並將結果輸出。

In [None]:
# 發送聊天請求
response = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": "你現在是個問答小幫手，並使用繁體中文回答問題。",  # 設定系統角色，引導 AI 以繁體中文回答
        },
        {
            "role": "user",
            "content": "請問法國的首都？",  # 使用者的提問
        }
    ],
    model="gpt-4o",  # 指定使用的 AI 模型為 GPT-4o
    temperature=1,  # 設定溫度值，影響回答的隨機性（1 代表較具變化性）
    max_tokens=4096,  # 設定回應的最大 Token 數（字數限制）
    top_p=1  # 設定 Top-p（核取樣），用於控制回應的多樣性
)

# 印出 AI 的回應內容
print(response.choices[0].message.content)

這個範例展示了如何使用 Colab + GitHub Models API 來快速測試 LLM 模型的對話能力。你也可以試試看將 model 替換成其他模型，例如嘗試近日熱門的 DeepSeek-R1。