In [None]:
import requests

def chat_with_ollama(prompt: str):
    url = "http://localhost:11434/api/generate"
    payload = {
        "model": "gemma3:1b",
        "prompt": prompt,
        "stream": False,
        "options": { #參考說明1
            "temperature": 0.7,
            "top_p": 0.9,
            "top_k": 50,
        },
        "max_tokens": 100,
        "format": "json",
    }

    response = requests.post(url, json=payload)
    result = response.json()
    print("💬 AI 回應：")
    # Print the whole result for debugging
    print(result)
    # Try to print the 'response' key if it exists, otherwise print possible keys
    if "response" in result:
        print(result["response"])
    elif "message" in result:
        print(result["message"])
    elif "content" in result:
        print(result["content"])
    else:
        print("No expected key found in response. Available keys:", result.keys())

#範例輸入
chat_with_ollama("請用簡單的方式解釋什麼是Python的函式？")

模型生成文字時的常見超參數有三個：temperature、top_p、top_k，它們主要用來控制生成文本的多樣性與隨機性。

### temperature (溫度)
- 用來調整模型詞概率分布的「平滑度」。
- 溫度越低（接近0），模型更傾向選擇機率最高的詞，產出較保守、穩定、重複性高的文字。
- 溫度越高（通常>1），模型更容易選擇低機率詞，產出更有創意和多樣性的文字，但品質可能不穩定。
- 範例：temperature=0.1時常產生相似句子，temperature=1.0則多樣性大幅提升。

### top_k
- 模型只從前k個最高機率的詞中選擇下一個詞。
- k值越小，範圍越窄，生成內容越集中和可預測。
- k值越大，模型能考慮更多詞，增加多樣性，但可能導致產出較不連貫或奇怪的詞。
- 範例：top_k=5時只考慮5個詞，top_k=50則考慮更多詞。

### top_p (又稱Nucleus sampling)
- 不是限制詞數，而是選擇累積機率總和達p的詞集合。
- p越小，候選詞集合越小（更集中），p越大則包含更多詞。
- 在top_p下，候選詞數目會根據機率分佈動態調整，較靈活。
- 範例：top_p=0.9表示從機率累積達90%的詞中選擇。

這三個超參數通常配合使用，可以透過調整來控制生成內容的風格和品質。例如：

```python
temperature = 0.7
top_k = 40
top_p = 0.9
```

這是一組常見的參數配置，使文本既不過於死板，也不會太過散亂，有適度的創造性和連貫性[7][4][10].

來源
[1] 淺談LLM 大型語言模型的Temperature、Top-P 和Top-K 參數分享 https://blog.miniasp.com/post/2024/05/21/LLM-Temperature-Top-P-Nucleus-Sampling-Top-K
[2] 大模型加载的参数介绍及推荐表，temperature、top_k、top_p https://blog.csdn.net/a1920993165/article/details/134691021
[3] NLP / LLMs中的Temperature 是什么? 原创 - CSDN博客 https://blog.csdn.net/deephub/article/details/129682591
[4] 大模型生成策略参数详解：Top-K、Top-P 和Temperature 原创 https://blog.csdn.net/qq_35971258/article/details/143753893
[5] LLM 超參數設定 https://learnprompting.org/zh-tw/docs/intermediate/configuration_hyperparameters
[6] LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature https://www.cnblogs.com/deali/p/llm-2.html
[7] AI大语言模型的温度、top_k等超参数怎么理解 - CSDN博客 https://blog.csdn.net/weixin_41736460/article/details/139558975
[8] 大模型基础概念之Top-k、Top-p 等参数 - tinywell http://tinywell.com/2024/05/15/llm-params/
[9] 庶民語言說OpenAI裡面Temperature 跟Top_p 參數( ... https://vocus.cc/article/665ee3e9fd89780001ad34ed
[10] LLM 中的溫度、Top P、Top K 是什麼？（從概念到代碼） https://www.toolify.ai/tw/ai-news-tw/llm-%E4%B8%AD%E7%9A%84%E6%BA%AB%E5%BA%A6top-ptop-k-%E6%98%AF%E4%BB%80%E9%BA%BC%E5%BE%9E%E6%A6%82%E5%BF%B5%E5%88%B0%E4%BB%A3%E7%A2%BC-968155


In [1]:
import requests

def chat_with_ollama(prompt: str):
    url = "http://localhost:11434/api/generate"
    payload = {
        "model": "gpt-oss:20b",
        "prompt": prompt,
        "stream": False,
        # 移除 format: "json" 參數，讓模型正常回應
        "options": {
            "temperature": 0.7,
            "top_p": 0.9,
            "top_k": 50,
        }
    }

    response = requests.post(url, json=payload)
    result = response.json()
    print("💬 AI 回應：")
    print(result)
    
    if "response" in result:
        print(f"\n📝 回答內容：\n{result['response']}")
    else:
        print("❌ 沒有找到回應內容")
        print("可用的欄位:", list(result.keys()))

#範例輸入
chat_with_ollama("請用簡單的方式解釋什麼是Python的函式？")

💬 AI 回應：
{'model': 'gpt-oss:20b', 'created_at': '2025-09-13T07:47:58.38402Z', 'response': '**Python 的函式（Function）是什麼？**\n\n簡單來說，函式就是「一段可以重複使用的程式碼」：\n\n| 什麼 | 作用 |\n|------|------|\n| **定義** | 用 `def` 把程式碼包起來，給它一個名字。 |\n| **呼叫** | 之後只要寫這個名字就能執行那段程式碼。 |\n| **參數** | 可以把資料（如數字、字串）送進去，讓函式用它來做事。 |\n| **回傳** | 函式執行完後可以把結果送回來，供其他程式碼使用。 |\n\n---\n\n### 範例\n\n```python\n# 1. 定義一個函式\ndef greet(name):\n    # 這是函式內部的程式碼\n    print(f"Hello, {name}!")\n\n# 2. 呼叫函式\ngreet("Alice")   # 輸出: Hello, Alice!\ngreet("Bob")     # 輸出: Hello, Bob!\n```\n\n- `def greet(name):` → 定義名為 `greet` 的函式，`name` 是它的參數。\n- `print(f"Hello, {name}!")` → 這段程式碼會在呼叫時執行。\n- `greet("Alice")` → 呼叫函式，傳入 `"Alice"` 作為參數。\n\n---\n\n### 為什麼要用函式？\n\n| 好處 | 例子 |\n|------|------|\n| **重複使用** | 同一段程式碼多次使用，寫一次就好。 |\n| **簡化程式** | 把複雜的邏輯拆成小塊，程式更易讀。 |\n| **模組化** | 方便測試、維護和分享。 |\n\n---\n\n### 小結\n\n- **函式**：一個「程式碼盒子」，可以把資料進去（參數），執行某件事，然後把結果送回來（回傳）。\n- **定義**：使用 `def` + 函式名稱 + 參數列表 + 兩個冒號 `:`\n- **呼叫**：直接寫函式名稱 + 括號 + 參數\n\n這樣你就可以開始用 Python 製作自己的

In [None]:
# 比較兩個模型的回應
import requests

def test_model(model_name, prompt):
    print(f"\n🤖 測試模型: {model_name}")
    print("=" * 50)
    
    url = "http://localhost:11434/api/generate"
    payload = {
        "model": model_name,
        "prompt": prompt,
        "stream": False,
        "options": {
            "temperature": 0.7,
            "top_p": 0.9,
            "top_k": 50,
        }
    }
    
    try:
        response = requests.post(url, json=payload)
        result = response.json()
        
        if "response" in result and result["response"].strip():
            print(f"✅ {model_name} 回應正常")
            print(f"📝 回答: {result['response'][:200]}...")
        else:
            print(f"❌ {model_name} 回應異常")
            print(f"🔍 完整回應: {result}")
            
    except Exception as e:
        print(f"❌ {model_name} 發生錯誤: {e}")

# 測試兩個模型
prompt = "請用簡單的方式解釋什麼是Python的函式？"
test_model("gemma3:1b", prompt)
test_model("gpt-oss:20b", prompt)
