In [4]:
import requests
import json

ollama_api_url = 'http://localhost:11434/api/chat'

def stream_ollama_response(model, prompt):
    # 為 /api/chat 端點準備請求的 payload
    payload = {
        "model": model,
        "messages": [
            {
                "role": "user",
                "content": prompt
            }
        ],
        "stream": True
    }

    try:
        with requests.post(ollama_api_url, json=payload, stream=True) as response:
            # 檢查請求是否成功
            response.raise_for_status()
            
            # 逐行迭代回應內容
            for line in response.iter_lines():
                if line:
                    try:
                        # 每一行都是一個獨立的 JSON 物件
                        json_data = json.loads(line.decode('utf-8'))
                        
                        # 從 'message' 物件中提取 'content'
                        content_chunk = json_data.get('message', {}).get('content', '')
                        
                        # 使用 yield 回傳每一塊內容
                        yield content_chunk
                        
                        # 最後一個 JSON 物件會有一個 'done' 欄位為 true
                        if json_data.get('done'):
                            break
                    except json.JSONDecodeError:
                        print(f"\n[警告] 無法解析的 JSON 行: {line}")
                        
    except requests.exceptions.RequestException as e:
        print(f"\n[錯誤] 請求失敗: {e}")

# --- 如何使用 ---

model_to_use = "gemma3:4b"
user_prompt = "中國迅速侵蝕美國全球 AI 競賽領導地位這件事，請提供詳細的分析。"

print(f"--- 正在從 {model_to_use} 接收串流式應答 ---")

# for 迴圈會自動處理 generator，並在收到每個區塊時立即印出
full_response = ""
for chunk in stream_ollama_response(model_to_use, user_prompt):
    print(chunk, end='', flush=True)
    full_response += chunk

print("\n\n--- 串流結束 ---")
# print("\n完整的回應:\n", full_response) # 您也可以在最後檢視完整回應


--- 正在從 gemma3:4b 接收串流式應答 ---
中國迅速侵蝕美國在全球 AI 競賽領導地位，是一個複雜且多層面的現象，涉及經濟、政治、技術和戰略等多個方面。以下是一個詳細的分析，分為幾個主要方面：

**1. 政策支持與集中資源:**

* **中央政府的優先級:** 中國政府將AI視為國家戰略發展的關鍵，並投入了前所未有的資源。習近平主席更是明確將AI定位為“第三次工業革命”，並在2017年發布了《新一代人工智能發展規劃》，將AI列為國家戰略發展重點，並建立了由李飛負責的中央AI戰略體系。
* **集中資源的模式:** 與美國分散的投資相比，中國政府在AI領域進行了集中且高效的投資。這包括巨額的資金投入、人才招募、基礎設施建設和數據收集。
* **五個關鍵領域的重點發展:** 中國政府將AI發展重點放在以下五個關鍵領域：AI基礎技術、智能交通、智能製造、智能醫療和智能能源。
* **戰略目標明確:** 中國的目標不僅僅是提升技術水平，更重要的是在特定領域（例如自動駕駛、智能製造）中實現產業領先。

**2. 數據的優勢:**

* **龐大的數據資源:** 中國擁有全球最大的網路用戶群，這意味著有大量的數據可用於訓練AI模型。 數據是AI發展的燃料，中國憑藉其龐大的數據量，在早期AI發展中獲得了顯著優勢。
* **數據收集的自由度:** 相較於美國，中國政府對數據收集和使用有更大的自由度，這使得企業更容易獲得數據資源。
* **數據治理的挑戰:**  雖然數據優勢顯著，但中國也面臨數據治理和隱私保護方面的挑戰，這可能會影響長期AI發展。

**3.  技術進步與創新:**

* **早期先發優勢:** 在早期，中國在某些AI領域（例如人臉識別、語音識別）方面取得了顯著的技術突破，並在商業上迅速應用。
* **大規模訓練的領先:**  中國在更大規模的AI模型訓練方面表現出色，並快速發展了相關技術。
* **算法創新:**  雖然在算法創新方面與美國並非完全對等，但在特定應用場景下的算法優化方面，中國企業表現出色。
* **AI+應用:**  中國企業迅速將AI技術應用於各個行業，例如製造、金融、農業等，形成了一系列“AI+”應用案例。

**4.  人才招募:**

* **“去海外招聘”策略:**  中國政府推行“去海外招聘”政策，吸引了大量海外AI

In [6]:
import requests
import json

ollama_api_url = 'http://localhost:1234/ollama/chat'

def stream_ollama_response(model, prompt):
    # 為 /api/chat 端點準備請求的 payload
    payload = {
        "model": model,
        "prompt": prompt
    }

    try:
        with requests.post(ollama_api_url, json=payload, stream=True) as response:
            response.raise_for_status()

            for line in response.iter_lines():
                if line:
                    try:
                        json_data = json.loads(line.decode('utf-8'))
                        
                        # 從 'message' 物件中提取 'content'
                        content_chunk = json_data.get('message', {}).get('content', '')
                        
                        # 使用 yield 回傳每一塊內容
                        yield content_chunk
                        
                        # 最後一個 JSON 物件會有一個 'done' 欄位為 true
                        if json_data.get('done'):
                            break
                    except json.JSONDecodeError:
                        print(f"\n[警告] 無法解析的 JSON 行: {line}")
                        
    except requests.exceptions.RequestException as e:
        print(f"\n[錯誤] 請求失敗: {e}")

# --- 如何使用 ---

model_to_use = "gemma3:4b"
user_prompt = "解釋with requests.post(ollama_api_url, json=payload, stream=True) as response: with怎麼用？"

print(f"--- 正在從 {model_to_use} 接收串流式應答 ---")

# for 迴圈會自動處理 generator，並在收到每個區塊時立即印出
full_response = ""
for chunk in stream_ollama_response(model_to_use, user_prompt):
    print(chunk, end='', flush=True)
    full_response += chunk

print("\n\n--- 串流結束 ---")
# print("\n完整的回應:\n", full_response) # 您也可以在最後檢視完整回應


--- 正在從 gemma3:4b 接收串流式應答 ---
這個程式碼片段使用了 Python 的 `requests` 函式庫，通過 `requests.post()` 方法發送 POST 請求，並且使用了 `stream=True` 參數，同時使用了 `with` 語句來管理資源（回應物件）。讓我們分解一下這個程式碼的每一部分：

**1. `requests.post(ollama_api_url, json=payload, stream=True)`**

* **`requests.post()`**:  這是 `requests` 函式庫的一個方法，用於發送 HTTP POST 請求。  這意味著你正在向一個指定的 URL 發送數據，並期望伺服器對該數據做出回應。
* **`ollama_api_url`**: 這是目標伺服器的 URL。  `requests.post()` 方法會將這個 URL 作為請求的目的地。  `ollama_api_url` 應該是一個字符串，包含 API 的網址。
* **`json=payload`**:  這部分告訴 `requests` 函式庫將 `payload` 變數（通常是一個字典）作為 JSON 格式的數據發送。 `requests` 會自動將這個字典轉換為 JSON 字符串，並將其包含在 POST 請求的請求體（body）中。  這是向 API 傳輸結構化數據的標準方式。
* **`stream=True`**:  這是關鍵的部分。  當 `stream=True` 時，`requests` 函式庫不會立即下載整個回應的內容。  相反，它會將回應作為一個流（stream）返回。  這有幾個優點：
    * **節省資源:**  特別是在處理大文件或大型數據流時，不下載整個內容可以節省大量的記憶體和時間。
    * **增量處理:**  允許你逐步處理回應數據，例如，逐行讀取大型輸出流。
    * **避免BufferOverflow:**  避免了將整個回應內容一次性讀取到記憶體中，從而降低了緩衝溢位的風險。

**2. `with ... as response:`**

* **`with` 語句**:  這是一種語句，用於管理資源，確保在程式碼塊執行完畢後，資源（例如文件、網路連接、檔案等）會被