這份 Notebook 示範 OpenAI API 的使用


### Google Colab Tips

* 用 Shift+Enter 可以執行程式區塊 (或是滑鼠點前面的執行符號)
* 如果要修改存檔，需要先點 “檔案" -> "在雲端硬碟中儲存副本"，複製到你自己的目錄下，才可以儲存


## 設定 OpenAI API Key 變數

請點開左側欄的Key符號，就可以設定 Secret。請設定 openai_api_key

若你還沒有註冊 OpenAI 拿到 key，可以先用這組:

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

* 限課程期間使用，課程結束之後就 expire 掉囉
* 後續課程會需要進到 OpenAI 後台看 Trace Log，建議稍後有空可以換成自己的 OpenAI API key，請至 https://platform.openai.com/ 註冊申請


In [None]:
from google.colab import userdata
openai_api_key = userdata.get('openai_api_key')

In [None]:
import requests
import json
from pprint import pp

In [None]:
payload = { "model": "gpt-4.1-nano", "temperature": 0, # 可以改改看 溫度
            "messages": [ { "role": "user", "content": "你好，最近過得如何?"} ] } # 可以改改看 content
headers = { "Authorization": f'Bearer {openai_api_key}', "Content-Type": "application/json" }

response = requests.post('https://api.openai.com/v1/chat/completions', headers = headers, data = json.dumps(payload) )

obj = json.loads(response.text)

pp(obj)

{'id': 'chatcmpl-BhukNbgeYMoY7scWSSxskMste6SHm',
 'object': 'chat.completion',
 'created': 1749805939,
 'model': 'gpt-4.1-nano-2025-04-14',
 'choices': [{'index': 0,
              'message': {'role': 'assistant',
                          'content': '你好！我一直在這裡準備幫助你，感覺很好。你最近怎麼樣？有什麼想聊的或需要幫忙的嗎？',
                          'refusal': None,
                          'annotations': []},
              'logprobs': None,
              'finish_reason': 'stop'}],
 'usage': {'prompt_tokens': 14,
           'completion_tokens': 40,
           'total_tokens': 54,
           'prompt_tokens_details': {'cached_tokens': 0, 'audio_tokens': 0},
           'completion_tokens_details': {'reasoning_tokens': 0,
                                         'audio_tokens': 0,
                                         'accepted_prediction_tokens': 0,
                                         'rejected_prediction_tokens': 0}},
 'service_tier': 'default',
 'system_fingerprint': 'fp_38343a2f8f'}


## 使用 OpenAI Python SDK

https://github.com/openai/openai-python

In [None]:
!pip install openai



In [None]:
from openai import OpenAI

client = OpenAI( api_key= openai_api_key)

completion = client.chat.completions.create(
    model="gpt-4.1-nano",
    messages=[
        {
            "role": "user",
            "content": "你好，最近過得如何?",
        },
    ],
)

print(completion)

ChatCompletion(id='chatcmpl-BhukwcWGseJFJuG1XfkUz0RnG49oN', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='你好！我一直都在這裡，隨時準備幫助你。你最近怎麼樣？有什麼需要幫忙的嗎？', refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))], created=1749805974, model='gpt-4.1-nano-2025-04-14', object='chat.completion', service_tier='default', system_fingerprint='fp_38343a2f8f', usage=CompletionUsage(completion_tokens=36, prompt_tokens=14, total_tokens=50, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))


In [None]:
print(completion.choices[0].message.content)

你好！我一直都在這裡，隨時準備幫助你。你最近怎麼樣？有什麼需要幫忙的嗎？


## 使用 System Message

In [None]:
# 這是 completion 風格(蠻多教材仍這樣寫，包括 ChatGPT Prompt Engineering for Developers 課程)
user_message = """請分類以下文字是 neutral, negative 或 positive
文字: 我覺得這個披薩實在太好吃啦
情緒:
"""

messages = [
    {
        "role": "user",
        "content": user_message
    }
]

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
print(completion.choices[0].message.content)

positive


In [None]:
# 可改成使用 system prompt 的風格: 把不變的整體指示放在 system message
# user prompt 放變動的用戶輸入
user_message = """
文字: 我覺得這個披薩實在太好吃啦
"""

messages = [
    {
        "role": "system", # developer
        "content": "請分類以下文字是 neutral, negative 或 positive"
    },
    {
        "role": "user",
        "content": user_message
    }
]

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
print(completion.choices[0].message.content)

positive


### why?

1. Model Spec 的指揮鏈

OpenAI 在 2024/5/8 發表了一份 Model Spec文件，說明了他們理想中的模型應該有什麼行為: https://cdn.openai.com/spec/model-spec-2024-05-08.html

v2 版(2025/2/12): https://model-spec.openai.com/2025-02-12.html

其中有個 Follow the chain of command 目標:

* https://cdn.openai.com/spec/model-spec-2024-05-08.html#follow-the-chain-of-command
* (v2) https://model-spec.openai.com/2025-02-12.html#chain_of_command

Platform > Developer > User > Tool
也就是 system prompt 的優先權會繼續提升

請參考我的解說: https://www.facebook.com/ihower/posts/10161131309838971

另外 system role 有改名 developer role

https://www.facebook.com/ihower/posts/10161977780628971

2. prompt caching

https://platform.openai.com/docs/guides/prompt-caching

cache 是從 prompt 前面符合有算有效，因此不會變動的 prompt 要放前面

## 連續對話多 messages 的場景示範

* 模型是 Stateless 無狀態的
* 每次你都得把所有對話歷史傳給 LLM API

In [None]:
# 第一輪問答
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"},
  ]

completion1 = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
response1 = completion1.choices[0].message.content
print(response1)

2013年的世界棒球經典賽冠軍是多明尼加共和國。


接著要繼續對話時，你得把 AI 回覆的訊息，放在 role: assistant 裡面一起傳給 OpenAI。因為 API 是無狀態的(Stateless)

In [None]:
# 延續同一個對話的 第二輪問答
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"}, # 這是第一輪的 user 問句
      {"role": "assistant", "content": response1 }, # 這是第一輪的 AI 回覆
      {"role": "user", "content": "那2017年呢?"} # 這是第二輪的 user 問句
]

completion2 = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
response2 = completion2.choices[0].message.content
print(response2)

2017年世界棒球經典賽冠軍是美國。


In [None]:
# 延續同一個對話的 第三輪問答
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"}, # 這是第一輪的 user 問句
      {"role": "assistant", "content": response1 }, # 這是第一輪的 AI 回覆
      {"role": "user", "content": "那2017年呢?"}, # 這是第二輪的 user 問句
      {"role": "assistant", "content": response2 }, # 這是第二輪的 AI 回覆
      {"role": "user", "content": "美國隊贏過幾次冠軍?"}, # 這是第三輪的 user 問句
]

completion3 = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
response3 = completion3.choices[0].message.content
print(response3)

截止到2023年， 美國棒球隊一共贏得過兩次世界棒球經典賽冠軍，分別是在2017年和2009年。


### 模型的幻覺現象 Hallucination

比較聰明的模型，幻覺現象會比較少

In [None]:
# 如果 第二輪問答時 是問 2018 年
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"},
      {"role": "assistant", "content": "2013年的世界棒球經典賽冠軍是多明尼加共和國。"},
      {"role": "user", "content": "那2018年呢?"}
]

completion4 = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
response4 = completion4.choices[0].message.content
print(response4)

2017年（因為第一屆是2006年，之後每四年一次，2017年通常是指2017年，但你可能想問的是2017年的賽事），2017年的世界棒球經典賽冠軍是美國。  

但如果你指的是2018年，請注意，世界棒球經典賽一般每四年一次，最近的比賽時間是2017年和2023年。  

因此，2017年世界棒球經典賽的冠軍是美國。  

如有需要，請更明確你的年份或比賽名稱。


In [None]:
# 換一種問法 減少幻覺現象
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"},
      {"role": "assistant", "content": "2013年的世界棒球經典賽冠軍是多明尼加共和國。"},
      {"role": "user", "content": "那2018年呢? 如果沒舉辦，請回答沒舉辦"} # 要告訴模型可以回答不知道
]

completion5 = client.chat.completions.create(model="gpt-4.1-nano", messages=messages)
response5 = completion5.choices[0].message.content
print(response5)

2018年沒有舉辦世界棒球經典賽。


In [None]:
# 用比較聰明的模型，會比較少幻覺
messages=[
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "誰贏得2013年的世界棒球經典賽冠軍?"},
      {"role": "assistant", "content": "2013年的世界棒球經典賽冠軍是多明尼加共和國。"},
      {"role": "user", "content": "那2018年呢?"}
]

completion5 = client.chat.completions.create(model="gpt-4.1-mini", messages=messages)
response5 = completion5.choices[0].message.content
print(response5)

2017年（由於世界棒球經典賽最新一次於2017年舉行）的冠軍是美國隊。下一屆原定於2021年舉行，但因故延後。2018年並沒有舉辦世界棒球經典賽。


## Few-shot prompting

In [None]:
# 出處: https://www.promptingguide.ai/zh/techniques/fewshot
prompt = f"""
請判斷情緒:

input: 這太棒了！
output: Positive

input: 這太糟糕了！
output: Negative

input: 哇，那部電影太棒了！
output: Positive

input: 多麼可怕的節目
output:
"""

completion = client.chat.completions.create(model="gpt-4.1-mini", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

Negative


*在一些較難描述明確指示的任務中，蠻適合用* few-shot 的方式讓模型自己學，例如文字風格、特定的輸出結構(某種schema)

In [None]:
# 沒給範例
prompt = f"""
晶晶體是一種流行於臺灣以中文為基底，夾雜英語不成句的單字或片語的表達方式。特指所使用的英文字多為過於簡單、沒有替換必要者，進而產生有意炫耀雙語能力卻弄巧成拙的效果。

原文: 每位員工都要參加每週電話會議，沒有例外
晶晶體:
"""

completion = client.chat.completions.create(model="gpt-4.1-mini", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

Every 員工 must join weekly 電話 meeting, no exception.


In [None]:
# 給範例讓模型學風格，可以學得更好
prompt = f"""
晶晶體是一種流行於臺灣以中文為基底，夾雜英語不成句的單字或片語的表達方式。特指所使用的英文字多為過於簡單、沒有替換必要者，進而產生有意炫耀雙語能力卻弄巧成拙的效果。
例如:

原文: 我很忙，因為我很有事要做
晶晶體: 我是很busy，因為我很多things要do

原文: 天氣總算放晴，沒有下雨、太陽很大、有點熱、讓我想到以前還是學生時，喜歡在這樣的天氣，吃一球冰淇淋，真的會讓人很高興
晶晶體: 天氣總算放晴，沒有rain、太陽很big、有點hot、讓我想到以前還是student時，喜歡在這樣的天氣，吃一球ice cream，真的會讓人很happy

原文: 每位員工都要參加每週電話會議，沒有例外
晶晶體:
"""

completion = client.chat.completions.create(model="gpt-4.1-mini", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

每位employee都要join每週phone meeting，沒有exception。


## Chain-of-Thought (CoT) Prompting

* 給模型思考時間
* 示範如何拆解步驟，好讓模型對一個問題進行更長的思考時間 (也就是，有更多的輸出)

出處 CoT Paper: https://arxiv.org/abs/2201.11903


### 一個簡單的思考題目

Q: 我去市場買了10個蘋果。我給了鄰居2個蘋果，又給修理工2個蘋果。之後，我又去買了5個蘋果，然後吃了1個。我還剩下多少個蘋果？

In [None]:
# 出處: https://promptingguide.azurewebsites.net/techniques/cot
prompt = """
我去市場買了10個蘋果。我給了鄰居2個蘋果，又給修理工2個蘋果。之後，我又去買了5個蘋果，然後吃了1個。我還剩下多少個蘋果？
"""

completion = client.chat.completions.create(model="gpt-3.5-turbo", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

我還剩下12個蘋果。原本買了10個，再去買了5個，總共15個蘋果。然後給了鄰居2個，給了修理工2個，吃了1個，共計剩下10個蘋果。


❌❌ 比較早期的模型 GPT-3.5 很可能會算錯!!

## Few-shot CoT

如何增強推理能力呢? 我們可以給一個推理範例，也就是 Chain of Thought (CoT) 思考過程:

In [None]:
prompt = """
Q: 我去市場買了6個香蕉，給了朋友3個香蕉，我還剩下多少個?
A:
  1. 我一開始有6個
  2. 給了朋友3個，所以剩下 6-3=3個香蕉
  3. 最後剩下3個香蕉

Q: 我去市場買了10個蘋果。我給了鄰居2個蘋果，又給修理工2個蘋果。之後，我又去買了5個蘋果，然後吃了1個。我還剩下多少個蘋果？
A:
"""

completion = client.chat.completions.create(model="gpt-3.5-turbo", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

1. 我一開始有10個蘋果
2. 給了鄰居2個蘋果，剩下 10-2=8個蘋果
3. 又給了修理工2個蘋果，剩下 8-2=6個蘋果
4. 再買了5個蘋果，總共有 6+5=11個蘋果
5. 吃了1個蘋果，最後剩下 11-1=10個蘋果

所以我最後還剩下10個蘋果。


## Zero-shot CoT (讓模型自己想步驟)

標準咒語是 Let's think step by step
可讓模型自己展開步驟

In [None]:
prompt = """
我去市場買了10個蘋果。我給了鄰居2個蘋果，又給修理工2個蘋果。之後，我又去買了5個蘋果，然後吃了1個。我還剩下多少個蘋果？
Let's think step by step
"""

completion = client.chat.completions.create(model="gpt-3.5-turbo", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

1. 起初我買了10個蘋果
2. 給了鄰居2個蘋果，剩下8個蘋果
3. 又給了修理工2個蘋果，剩下6個蘋果
4. 再買了5個蘋果，總共有11個蘋果
5. 吃了1個蘋果，剩下10個蘋果

所以我還剩下10個蘋果。


這題如果用後來新的模型 GPT-4o 之後用 zero-shot 就可以答對，因為聰明的模型可能可以自己觸發 CoT 技能。不一定需要你明確寫 think step by step

In [None]:
prompt = """
我去市場買了10個蘋果。我給了鄰居2個蘋果，又給修理工2個蘋果。之後，我又去買了5個蘋果，然後吃了1個。我還剩下多少個蘋果？
Let's think step by step
"""

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

好的，讓我們一步一步來計算。

1. 起初，你去市場買了10個蘋果。
   現在蘋果數量是：10個

2. 你給了鄰居2個蘋果。
   剩下：10 - 2 = 8個

3. 你又給了修理工2個蘋果。
   剩下：8 - 2 = 6個

4. 你又買了5個蘋果。
   現在：6 + 5 = 11個

5. 你吃了1個蘋果。
   剩下：11 - 1 = 10個

所以，你現在剩下 **10個蘋果**。




### 回頭看一下投影片總結比較 Few-shot 和 CoT，然後接下來重點是:

## CoT 需要輸出過程，不能省略

我們需要了解一下 LLM 的運作原理 (見投影片 Why 需要給模型思考時間)

In [None]:
prompt = """
請用以下計算數學計算，假設 x = 100

Step 1: x 加 1
Step 2: x 加 10
Step 3: x 減 1
Step 4: x 乘 2
Step 5: x 減 20

最後的答案 x 是多少?

"""

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

我們從 x = 100 開始，依序進行以下計算：

Step 1: x 加 1  
100 + 1 = 101

Step 2: x 加 10  
101 + 10 = 111

Step 3: x 減 1  
111 - 1 = 110

Step 4: x 乘 2  
110 × 2 = 220

Step 5: x 減 20  
220 - 20 = 200

因此，最後的答案是 **200**。


### 若叫模型不要輸出步驟會怎麼樣?

In [None]:
prompt = """
請用以下計算數學計算，假設 x = 100

Step 1: x 加 1
Step 2: x 加 10
Step 3: x 減 1
Step 4: x 乘 2
Step 5: x 減 20

請在內心思考，不要輸出過程，只要回答最後 x 是多少?

"""

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

最後 x 的值是 202


❌❌❌ 算錯了，變笨了!

## 如果調換順序，先給答案再解釋會怎樣?

In [None]:
prompt = """
請用以下計算數學計算，假設 x = 100

Step 1: x 加 1
Step 2: x 加 10
Step 3: x 減 1
Step 4: x 乘 2
Step 5: x 減 20

請直接回答最後答案，然後再解釋說明是如何算出來的

"""

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

最後答案是 180。

解釋如下：
1. 原始值 x = 100
2. 第一步：x 加 1 → 100 + 1 = 101
3. 第二步：x 加 10 → 101 + 10 = 111
4. 第三步：x 減 1 → 111 - 1 = 110
5. 第四步：x 乘 2 → 110 × 2 = 220
6. 第五步：x 減 20 → 220 - 20 = 200

（經過重複計算後，正確的最後答案是 200。）

抱歉之前的計算中有誤，最終答案應該是 **200**。


😓😓😓 一開始直接給錯誤數字，但後面有推理過程又算對.... orz

結論: CoT 需要先輸出推理過程!

### 目前最新的推理模型 例如 o3

就是用強化學習技術，特別用力訓練過的模型的 CoT 能力，讓模型一定會輸出 推理過程在最前面!

## 如何做 結構化輸出 (JSON 輸出) ?

In [None]:
prompt = "請隨機產生三個 user 資料，請用 JSON 格式回傳"

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }])
response = completion.choices[0].message.content
print(response)

```json
[
  {
    "user_id": 1023,
    "name": "Alice Chen",
    "email": "alice.chen@example.com",
    "age": 29,
    "signup_date": "2023-07-15"
  },
  {
    "user_id": 2048,
    "name": "Michael Lee",
    "email": "michael.lee@example.com",
    "age": 34,
    "signup_date": "2023-09-10"
  },
  {
    "user_id": 3097,
    "name": "Sophia Wang",
    "email": "sophia.wang@example.com",
    "age": 24,
    "signup_date": "2023-08-22"
  }
]
```


# API 的 Structured Outputs 功能

文件: https://platform.openai.com/docs/guides/structured-outputs/introduction

中文介紹: https://ywctech.net/ml-ai/openai-structued-output-json-schema/

In [None]:
response_format={
  "type": "json_schema",
  "json_schema": {
    "name": "user_data_response",
    "schema": {
      "type": "object",
      "properties": {
        "name": {
          "type": "string",
          "description": "請用台灣常見姓名"
        },
        "age": {
          "type": "integer",
          "description": "年紀"
        },
        "bio": {
          "type": "string",
          "description": "請用台灣繁體中文"
        },
        "avatar_url": {
          "type": "string",
          "description": "個人圖像，請用真實可以連結的圖片"
        },
        "isSubscriber": {
          "type": "boolean",
          "description": "是否訂閱"
        }
      },
      "required": [
        "name",
        "age",
        "bio",
        "avatar_url",
        "isSubscriber"
      ],
      "additionalProperties": False
    },
    "strict": True
  }
}

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }], response_format=response_format)
response = completion.choices[0].message.content
print(response)

{"name":"李美玲","age":29,"bio":"熱愛旅遊與攝影，喜歡探索新事物，善於交流。","avatar_url":"https://example.com/avatar1.jpg","isSubscriber":true}


## 使用 Pydantic (Python 限定工具) 定義 schema 更方便

In [None]:
from typing import List
from pydantic import Field, BaseModel, ConfigDict

class User(BaseModel):
  model_config = ConfigDict(extra="forbid")  # 對應 additionalProperties: False

  name: str = Field(description="請用台灣常見姓名")
  age: int = Field(description="年紀")
  bio: str = Field(description="請用台灣繁體中文")
  avatar_url: str = Field(description="個人圖像，請用真實可以連結的圖片")
  isSubscriber: bool = Field(description="是否訂閱")



In [None]:
User.model_json_schema()

{'additionalProperties': False,
 'properties': {'name': {'description': '請用台灣常見姓名',
   'title': 'Name',
   'type': 'string'},
  'age': {'description': '年紀', 'title': 'Age', 'type': 'integer'},
  'bio': {'description': '請用台灣繁體中文', 'title': 'Bio', 'type': 'string'},
  'avatar_url': {'description': '個人圖像，請用真實可以連結的圖片',
   'title': 'Avatar Url',
   'type': 'string'},
  'isSubscriber': {'description': '是否訂閱',
   'title': 'Issubscriber',
   'type': 'boolean'}},
 'required': ['name', 'age', 'bio', 'avatar_url', 'isSubscriber'],
 'title': 'User',
 'type': 'object'}

In [None]:
class Users(BaseModel):
  model_config = ConfigDict(extra="forbid")  # 對應 additionalProperties: False

  users: list[User]

In [None]:
Users.model_json_schema()

{'$defs': {'User': {'additionalProperties': False,
   'properties': {'name': {'description': '請用台灣常見姓名',
     'title': 'Name',
     'type': 'string'},
    'age': {'description': '年紀', 'title': 'Age', 'type': 'integer'},
    'bio': {'description': '請用台灣繁體中文', 'title': 'Bio', 'type': 'string'},
    'avatar_url': {'description': '個人圖像，請用真實可以連結的圖片',
     'title': 'Avatar Url',
     'type': 'string'},
    'isSubscriber': {'description': '是否訂閱',
     'title': 'Issubscriber',
     'type': 'boolean'}},
   'required': ['name', 'age', 'bio', 'avatar_url', 'isSubscriber'],
   'title': 'User',
   'type': 'object'}},
 'additionalProperties': False,
 'properties': {'users': {'items': {'$ref': '#/$defs/User'},
   'title': 'Users',
   'type': 'array'}},
 'required': ['users'],
 'title': 'Users',
 'type': 'object'}

In [None]:
response_format={
    "type": "json_schema",
    "json_schema": {
        "name": "users",
        "schema":  Users.model_json_schema(),
        "strict": True
    }
}

completion = client.chat.completions.create(model="gpt-4.1-nano", messages=[{ "role": "user", "content": prompt }], response_format=response_format)
response = completion.choices[0].message.content
print(response)

{"users":[{"name":"李小明","age":28,"bio":"熱愛科技與攝影，喜歡 exploring new places.","avatar_url":"https://example.com/avatar1.jpg","isSubscriber":true},{"name":"陳麗華","age":35,"bio":"喜歡閱讀和烹飪，熱衷於家庭生活分享。","avatar_url":"https://example.com/avatar2.jpg","isSubscriber":false},{"name":"王文杰","age":42,"bio":"運動愛好者，喜歡跑步與登山，追求健康生活。","avatar_url":"https://example.com/avatar3.jpg","isSubscriber":true}]}


## OpenAI SDK 直接也可以吃 Pydantic ! 超方便!

In [None]:
completion = client.beta.chat.completions.parse(
    model="gpt-4.1-nano",
    messages=[
        {"role": "user", "content": "請隨機產生多個 user 資料"},
    ],
    response_format=Users
)

parsed_result = completion.choices[0].message.parsed

In [None]:
parsed_result

Users(users=[User(name='王小明', age=28, bio='喜歡運動和旅遊的年輕人', avatar_url='https://example.com/avatars/user1.jpg', isSubscriber=True), User(name='陳美麗', age=34, bio='熱愛烹飪與閱讀的生活愛好者', avatar_url='https://example.com/avatars/user2.jpg', isSubscriber=False), User(name='李志強', age=45, bio='科技行業專業人士，平時喜歡打高爾夫', avatar_url='https://example.com/avatars/user3.jpg', isSubscriber=True), User(name='林佳麗', age=30, bio='社會工作者，熱心公益事業', avatar_url='https://example.com/avatars/user4.jpg', isSubscriber=False), User(name='蔡明杰', age=27, bio='喜愛音樂和電影的年輕創作人', avatar_url='https://example.com/avatars/user5.jpg', isSubscriber=True)])

In [None]:
parsed_result.users[0]

User(name='王小明', age=28, bio='喜歡運動和旅遊的年輕人', avatar_url='https://example.com/avatars/user1.jpg', isSubscriber=True)

## 應用範例: 直接解讀 PDF 檔案轉 結構化資料

https://platform.openai.com/docs/guides/pdf-files?api-mode=chat

In [None]:
!wget https://ihower.tw/data/tsmc-2024-q4.pdf

--2025-06-13 06:27:20--  https://ihower.tw/data/tsmc-2024-q4.pdf
Resolving ihower.tw (ihower.tw)... 104.21.32.1, 104.21.112.1, 104.21.80.1, ...
Connecting to ihower.tw (ihower.tw)|104.21.32.1|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 711381 (695K) [application/pdf]
Saving to: ‘tsmc-2024-q4.pdf’


2025-06-13 06:27:21 (18.0 MB/s) - ‘tsmc-2024-q4.pdf’ saved [711381/711381]



In [None]:
import base64

with open("tsmc-2024-q4.pdf", "rb") as f:
    data = f.read()

base64_string = base64.b64encode(data).decode("utf-8")

In [None]:
base64_string

'JVBERi0xLjcNCiW1tbW1DQoxIDAgb2JqDQo8PC9UeXBlL0NhdGFsb2cvUGFnZXMgMiAwIFIvTGFuZyh6aCkgL1N0cnVjdFRyZWVSb290IDQwNSAwIFIvT3V0bGluZXMgMzkwIDAgUi9NYXJrSW5mbzw8L01hcmtlZCB0cnVlPj4vTWV0YWRhdGEgMTE2NSAwIFIvVmlld2VyUHJlZmVyZW5jZXMgMTE2NiAwIFI+Pg0KZW5kb2JqDQoyIDAgb2JqDQo8PC9UeXBlL1BhZ2VzL0NvdW50IDE0L0tpZHNbIDMgMCBSIDI5IDAgUiAzNiAwIFIgNDAgMCBSIDUwIDAgUiAyNjAgMCBSIDI2OCAwIFIgMzE5IDAgUiAzNjggMCBSIDM3MyAwIFIgMzc2IDAgUiAzODMgMCBSIDM4NSAwIFIgMzg3IDAgUl0gPj4NCmVuZG9iag0KMyAwIG9iag0KPDwvVHlwZS9QYWdlL1BhcmVudCAyIDAgUi9SZXNvdXJjZXM8PC9FeHRHU3RhdGU8PC9HUzUgNSAwIFIvR1M5IDkgMCBSL0dTMTIgMTIgMCBSPj4vWE9iamVjdDw8L0ltYWdlNiA2IDAgUi9JbWFnZTEwIDEwIDAgUi9JbWFnZTE1IDE1IDAgUi9JbWFnZTE2IDE2IDAgUi9JbWFnZTE4IDE4IDAgUi9JbWFnZTIwIDIwIDAgUj4+L0ZvbnQ8PC9GMSA3IDAgUi9GMiAxMyAwIFIvRjMgMjIgMCBSL0Y0IDI3IDAgUj4+L1Byb2NTZXRbL1BERi9UZXh0L0ltYWdlQi9JbWFnZUMvSW1hZ2VJXSA+Pi9NZWRpYUJveFsgMCAwIDk2MCA1NDBdIC9Db250ZW50cyA0IDAgUi9Hcm91cDw8L1R5cGUvR3JvdXAvUy9UcmFuc3BhcmVuY3kvQ1MvRGV2aWNlUkdCPj4vVGFicy9TL1N0cnVjdFBhcmVudHMgMD4+DQplbmRvYmoNCjQ

In [None]:
from pydantic import BaseModel

class FinancialReport(BaseModel):
    quarter: str  # 4Q24
    revenue_usd_billion: float  # 營業收入淨額(美金十億元)
    revenue_twd: float  # 營業收入淨額
    gross_margin_percentage: float  # 營業毛利率
    operating_expenses: float  # 營業費用
    operating_margin_percentage: float  # 營業淨利率
    non_operating_income: float  # 營業外收入及支出
    net_income_attributable_to_parent: float  # 歸屬予母公司業主之本期淨利
    net_profit_margin_percentage: float  # 純益率
    earnings_per_share_twd: float  # 每股盈餘(新台幣元)
    return_on_equity_percentage: float  # 股東權益報酬率
    wafer_shipments_thousand_pieces: int  # 晶圓出貨量(千片十二吋約當晶圓)
    average_exchange_rate_usd_twd: float  # 平均匯率(美元/新台幣)

In [None]:
messages = [
    { "role": "user", "content": [
                {
                    "type": "file",
                    "file": {
                        "filename": "tsmc-2024-q4.pdf",
                        "file_data": f"data:application/pdf;base64,{base64_string}",
                    }
                },
                { "type": "text", "text": "請截取出 2024 Q4 的財報數據" }
            ] }
]

result = client.beta.chat.completions.parse(model="gpt-4.1-mini",
                                        messages=messages,
                                        response_format=FinancialReport)

In [None]:
parsed_result = result.choices[0].message.parsed
parsed_result

FinancialReport(quarter='2024 Q4', revenue_usd_billion=26.88, revenue_twd=868.46, gross_margin_percentage=59.0, operating_expenses=86.34, operating_margin_percentage=49.0, non_operating_income=23.09, net_income_attributable_to_parent=374.68, net_profit_margin_percentage=43.1, earnings_per_share_twd=14.45, return_on_equity_percentage=36.2, wafer_shipments_thousand_pieces=3418, average_exchange_rate_usd_twd=32.3)

In [None]:
parsed_result.revenue_usd_billion

26.88

In [None]:
parsed_result.model_dump()

{'quarter': '2024 Q4',
 'revenue_usd_billion': 26.88,
 'revenue_twd': 868.46,
 'gross_margin_percentage': 59.0,
 'operating_expenses': 86.34,
 'operating_margin_percentage': 49.0,
 'non_operating_income': 23.09,
 'net_income_attributable_to_parent': 374.68,
 'net_profit_margin_percentage': 43.1,
 'earnings_per_share_twd': 14.45,
 'return_on_equity_percentage': 36.2,
 'wafer_shipments_thousand_pieces': 3418,
 'average_exchange_rate_usd_twd': 32.3}

## 如何做評估?

https://github.com/ihower/ihower-llm-workshop/blob/main/eval_braintrust_2_category.py


## 使用 Braintrust 做監控

請去 https://www.braintrust.dev/ 註冊 -> 新增 Org -> 新增 Project -> Settings -> 取得 API key

放到側欄 secret 命名為 braintrust_api_key

In [None]:
!pip install braintrust autoevals

Collecting braintrust
  Downloading braintrust-0.1.4-py3-none-any.whl.metadata (2.4 kB)
Collecting autoevals
  Downloading autoevals-0.0.129-py3-none-any.whl.metadata (17 kB)
Collecting chevron (from braintrust)
  Downloading chevron-0.14.0-py3-none-any.whl.metadata (4.9 kB)
Collecting exceptiongroup>=1.2.0 (from braintrust)
  Downloading exceptiongroup-1.3.0-py3-none-any.whl.metadata (6.7 kB)
Collecting python-dotenv (from braintrust)
  Downloading python_dotenv-1.1.0-py3-none-any.whl.metadata (24 kB)
Collecting sseclient-py (from braintrust)
  Downloading sseclient_py-1.8.0-py2.py3-none-any.whl.metadata (2.0 kB)
Collecting polyleven (from autoevals)
  Downloading polyleven-0.9.0-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (4.3 kB)
Collecting braintrust_core==0.0.59 (from autoevals)
  Downloading braintrust_core-0.0.59-py3-none-any.whl.metadata (669 bytes)
Downloading braintrust-0.1.4-py3-none-any.whl (151 kB)
[2K   [90m

In [None]:
braintrust_api_key = userdata.get('braintrust_api_key')

from braintrust import init_logger, traced, wrap_openai
from openai import OpenAI

logger = init_logger(project="Course-202506", api_key=braintrust_api_key)

openai_client = OpenAI(api_key=openai_api_key)

client = wrap_openai( openai_client )

監控工具例如 braintrust, langsmith 等等，都有支援 openai sdk

1. 會提供 wrap_openai 方法，可以自動監控所有發給 OpenAI API 的請求
2. 會再提供一個 Python 的裝飾器(Decorator)，讓你加到需要監控的 function 前面

## Prompt Chaining: 工具串接

三個步驟:

1. 從用戶問題中，用 prompt1 來提取出 外部工具的參數
2. 執行外部工具，拿到結果
3. 用 (prompt2 + 結果) 轉成自然語言回給用戶

### Step 1: 從用戶問題中，用 prompt1 來提取出 外部工具的參數

In [None]:
from typing import List
from pydantic import Field, BaseModel

class QueryResult(BaseModel):
    date: str = Field(description="Date in yyyymmdd format. Leave empty if not parsable")
    stock_code: str = Field(description="Taiwan stock code as a 4-digit number. Leave empty if not parsable")

In [None]:
query = "請問2025年4月10號的台積電，股價表現如何?"

completion1 = client.beta.chat.completions.parse(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Extract from user queries"},
        {"role": "user", "content": query},
    ],
    response_format=QueryResult
)

parsed_result = completion1.choices[0].message.parsed
parsed_result

QueryResult(date='20250410', stock_code='2330')

### Step 2: 執行工具，拿到結果

API 參考自 https://medium.com/%E5%B7%A5%E7%A8%8B%E9%9A%A8%E5%AF%AB%E7%AD%86%E8%A8%98/5%E7%A8%AE%E6%8A%93%E5%8F%96%E5%8F%B0%E8%82%A1%E6%AD%B7%E5%8F%B2%E8%82%A1%E5%83%B9%E7%9A%84%E6%96%B9%E6%B3%95-766bf2ed9d6

In [None]:
import requests
import json

date = parsed_result.date
stock_code = parsed_result.stock_code
url = 'https://www.twse.com.tw/exchangeReport/STOCK_DAY?response=json&date=%s&stockNo=%s' % (date,stock_code)

html = requests.get(url)
context = json.loads(html.text)
context

{'stat': 'OK',
 'date': '20250410',
 'title': '114年04月 2330 台積電           各日成交資訊',
 'fields': ['日期', '成交股數', '成交金額', '開盤價', '最高價', '最低價', '收盤價', '漲跌價差', '成交筆數'],
 'data': [['114/04/01',
   '33,673,400',
   '31,491,275,577',
   '929.00',
   '946.00',
   '925.00',
   '944.00',
   '+34.00',
   '73,772'],
  ['114/04/02',
   '28,201,820',
   '26,641,223,575',
   '949.00',
   '952.00',
   '938.00',
   '942.00',
   '-2.00',
   '61,150'],
  ['114/04/07',
   '37,652,704',
   '32,012,146,992',
   '848.00',
   '848.00',
   '848.00',
   '848.00',
   '-94.00',
   '219,438'],
  ['114/04/08',
   '136,580,582',
   '111,279,830,476',
   '797.00',
   '843.00',
   '797.00',
   '816.00',
   '-32.00',
   '425,666'],
  ['114/04/09',
   '122,044,966',
   '97,865,587,721',
   '809.00',
   '826.00',
   '780.00',
   '785.00',
   '-31.00',
   '518,687'],
  ['114/04/10',
   '28,397,160',
   '24,506,749,080',
   '863.00',
   '863.00',
   '863.00',
   '863.00',
   '+78.00',
   '32,126'],
  ['114/04/11',
   '81,264,

### Step 3: 用 (prompt2 + 結果) 轉成自然語言回給用戶

In [None]:
messages = [
    {"role": "user", "content": f"""
Based on the provided context, please answer the following question in Traditional Chinese (Taiwan):

Question: <question>{query}</question>

Context: <context>{context}</context>

Instructions:
1. Carefully verify that your answer is supported by the given context.
2. If the question cannot be answered from the provided context, respond with: "抱歉，在提供的資料中找不到相關資訊，無法回答您的問題。"
3. Do not include information that is not present in the context.
4. Ensure your response is written in Traditional Chinese as used in Taiwan.
"""}
]

completion2 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)


result = completion2.choices[0].message.content
result

'台積電在2025年4月10號的股價表現為收盤價863.00元，相較於前一天上漲了78.00元。'

In [None]:
@traced
def ask_stock_price(query):

  # Step 1:
  completion1 = client.beta.chat.completions.parse(
      model="gpt-4o-mini",
      messages=[
          {"role": "system", "content": "Extract from user queries"},
          {"role": "user", "content": query},
      ],
      response_format=QueryResult
  )

  parsed_result = completion1.choices[0].message.parsed

  # Step 2:

  if parsed_result.date == "" or parsed_result.stock_code == "":
    return "抱歉，請提供明確的日期和股票名稱或代號。"

  date = parsed_result.date
  stock_code = parsed_result.stock_code
  url = 'https://www.twse.com.tw/exchangeReport/STOCK_DAY?response=json&date=%s&stockNo=%s' % (date,stock_code)

  html = requests.get(url)
  context = json.loads(html.text)

  # Step 3:
  messages = [
      {"role": "user", "content": f"""
  Based on the provided context, please answer the following question in Traditional Chinese (Taiwan):

  Question: <question>{query}</question>

  Context: <context>{context}</context>

  Instructions:
  1. Carefully verify that your answer is supported by the given context.
  2. If the question cannot be answered from the provided context, respond with: "抱歉，在提供的資料中找不到相關資訊，無法回答您的問題。"
  3. Do not include information that is not present in the context.
  4. Ensure your response is written in Traditional Chinese as used in Taiwan.
  """}
  ]

  completion2 = client.chat.completions.create(
      model="gpt-4o-mini",
      messages=messages
  )


  result = completion2.choices[0].message.content
  return result

In [None]:
ask_stock_price("請問 2330 股價表現如何?")

'抱歉，請提供明確的日期和股票名稱或代號。'

In [None]:
ask_stock_price("請問2025年的4月10號 聯發科 股價表現如何?")

'根據提供的資料，聯發科在2025年4月10日的股價表現如下：\n\n- 開盤價：1,300.00\n- 最高價：1,300.00\n- 最低價：1,300.00\n- 收盤價：1,300.00\n- 漲跌價差：+115.00\n\n因此，聯發科在2025年4月10日的股價維持在1,300.00，並且上漲了115.00。'

## Prompt Chaining : Query 檢測


<img src="https://www.anthropic.com/_next/image?url=https%3A%2F%2Fwww-cdn.anthropic.com%2Fimages%2F4zrzovbb%2Fwebsite%2F7418719e3dab222dccb379b8879e1dc08ad34c78-2401x1000.png&w=3840&q=75">

用便宜的模型當第一關，沒問題再進到第二關用厲害的模型

新聞: https://www.ithome.com.tw/news/166191


In [None]:
from typing import List, Optional
from pydantic import Field, BaseModel, ConfigDict

class RewriteQuery(BaseModel):
  answer: bool = Field(description="Determine if the question is about Taipei MRT")
  refuse_response: str = Field(description="If answer is false, provide a polite and humorous rejection message. 請用台灣繁體中文回覆. If answer is true, leave this empty")

@traced
def ask(user_query):
  print("使用 gpt-4.1-nano 檢查....")
  completion1 = client.beta.chat.completions.parse(
    model="gpt-4.1-nano",
    messages = [
      {"role": "system", "content": "Determine if the user's question is related to Taipei MRT"},
      {"role": "user", "content": user_query}
    ],
    response_format=RewriteQuery
  )

  parsed_result = completion1.choices[0].message.parsed

  if parsed_result.answer:
    print("使用 gpt-4.1 正式回答....")
    completion2 = client.chat.completions.create(
      model="gpt-4.1",
      messages = [
         {"role": "system", "content": "You are an assistant that provides helpful information about the Taipei MRT system. 請用台灣繁體中文回覆."},
         {"role": "user", "content": user_query}
      ]
    )
    return completion2.choices[0].message.content
  else:
    return parsed_result.refuse_response



In [None]:
ask("明天的天氣預報是什麼？")

使用 gpt-4.1-nano 檢查....


'抱歉，我專注於台北捷運的相關問題，這個問題不在我的範疇內。'

In [None]:
ask("如何搭捷運從台北車站到台北101？")

使用 gpt-4.1-nano 檢查....
使用 gpt-4.1 正式回答....


'你好！從台北車站到台北101，你可以搭乘台北捷運板南線（藍線）或淡水信義線（紅線），以下提供兩種常見的搭乘方式：\n\n**方式一：轉乘淡水信義線（紅線）**\n1. 在台北車站搭乘淡水信義線（紅線）往象山方向的列車。\n2. 直接搭到「台北101/世貿站」（R03），下車即可。\n3. 出站後即可到達台北101。\n\n**方式二：板南線＋轉車**\n1. 在台北車站搭乘板南線（藍線）往南港展覽館方向的列車。\n2. 在「國父紀念館站」下車（約4站），出站後步行約10分鐘抵達台北101。\n\n**建議路線**  \n推薦第一種方式（淡水信義線），因為更直接方便，無需轉車，車程約10分鐘。\n\n如需查詢最新時刻或出入口資訊，可以參考台北捷運官方網站或台北捷運APP。祝你旅途愉快！'

# Self-Reflection 反思

自我反思 Self-Reflection，或叫做 Evaluator-optimizer

反思次數可以是固定的，或是在 Evaluator 的 prompt 裡面動態讓 LLM 決定是否 Accepted 了。

<img src="https://www.anthropic.com/_next/image?url=https%3A%2F%2Fwww-cdn.anthropic.com%2Fimages%2F4zrzovbb%2Fwebsite%2F14f51e6406ccb29e695da48b17017e899a6119c7-2401x1000.png&w=3840&q=75">

In [None]:
@traced
def article_generate(user_messages):
  messages = [
      {
          "role": "system",
          "content": """You are an essay assistant tasked with writing excellent 5-paragraph essays.
  Generate the best essay possible for the user's request.
  If the user provides critique, respond with a revised version of your previous attempts."""
      } ] + user_messages

  completion1 = client.chat.completions.create( messages = messages, model="gpt-4.1-mini", temperature=0.5)
  ai_response = completion1.choices[0].message.content

  return ai_response

In [None]:
@traced
def article_critique(user_messages):
  messages = [
      {
          "role": "system",
          "content": """ "You are a teacher grading an essay submission. Generate critique and recommendations for the submission."
              " Provide detailed recommendations, including requests for length, depth, style, etc."""
      }] + user_messages

  completion2 = client.chat.completions.create( messages = messages, model="gpt-4.1-mini", temperature=0.5)
  ai_response = completion2.choices[0].message.content

  return ai_response

In [None]:
@traced
def generate_article_reflective(query):
  thread_messages = [{ "role": "user", "content": query }]

  generate_response = article_generate(thread_messages)

  print("======================== 初版")
  print(generate_response)

  # 迴圈 批評 -> 產生 兩次
  for i in range(2):
      print(f"======================== 第 {i+1} 次迭代")
      thread_messages += [ { "role": "user", "content": generate_response } ]
      critique_response = article_critique(thread_messages)
      print(f"--------批評:\n{critique_response}")
      thread_messages += [ { "role": "user", "content": critique_response } ]
      generate_response = article_generate(thread_messages)
      ## pp(thread_messages)
      print(f"--------重寫:\n{generate_response}")

  return generate_response

In [None]:
generate_article_reflective("產生一篇關於新竹市旅遊的文章")

新竹市旅遊指南：科技與文化的完美結合

新竹市，位於台灣北部，是一座融合現代科技與豐富文化的城市。作為台灣著名的科技重鎮，新竹不僅擁有先進的科學園區，還保留了許多歷史古蹟和自然美景，成為旅遊者探索多元風貌的理想目的地。

首先，新竹市以其科技產業聞名，尤其是新竹科學園區，吸引了大量科技人才與企業進駐。遊客可以參觀科學園區周邊的科技博物館，了解台灣半導體產業的發展歷程，感受創新科技帶來的魅力。此外，新竹市區的交通便利，方便旅客輕鬆前往各大景點。

其次，新竹擁有豐富的文化資產，例如城隍廟和北門等歷史建築。城隍廟是當地重要的宗教場所，廟宇建築精美，常舉辦傳統祭典，讓遊客體驗台灣民俗文化。北門則是新竹早期的城牆遺跡，見證了城市的歷史變遷，遊客在此可拍攝到充滿古意的照片。

此外，新竹的自然景觀同樣令人流連忘返。十八尖山是市區內著名的登山步道，適合喜愛戶外活動的旅客，登頂後可俯瞰整個新竹市景。海邊的南寮漁港則提供新鮮海產與美麗海景，是品嘗在地美食與放鬆心情的好去處。

總結來說，新竹市以其獨特的科技氛圍、深厚的文化底蘊及優美的自然風光，成為台灣北部不可錯過的旅遊勝地。無論是喜愛科技、歷史還是自然的旅客，都能在新竹找到屬於自己的樂趣，體驗一場豐富多彩的旅行。
--------批評:
這篇關於新竹市旅遊的文章整體結構清晰，內容涵蓋了科技、文化與自然三大面向，展現出新竹市多元且豐富的旅遊資源。文章語言流暢，用詞得當，能夠讓讀者快速了解新竹市的特色與吸引力。不過，為了提升文章的深度與吸引力，以下是一些具體的改進建議：

1. **增加文章長度與細節描述**  
   目前文章約有400字左右，對於旅遊指南而言稍顯簡短。建議將文章擴展至600至800字，加入更多具體景點介紹與遊玩建議，例如：  
   - 科技博物館的具體展覽內容或互動體驗  
   - 城隍廟的歷史背景與祭典時間  
   - 十八尖山登山步道的難易度、路線特色  
   - 南寮漁港推薦的海鮮料理或當地特色小吃

2. **強化旅遊實用資訊**  
   增加交通方式、開放時間、門票價格等實用資訊，讓讀者更方便規劃行程。例如：如何從台北搭乘大眾運輸前往新竹，或是科學園區是否有開放參觀的特定時間。

3. **加入旅遊體驗或建議**  
   可以加入作者或旅客的親身體驗描述，讓文章更具感染力。或提供旅遊小貼士，如

'感謝您詳盡且具建設性的回饋！根據您的建議，我將進一步豐富文化背景與美食介紹，補充旅遊小貼士與安全環保提醒，並融入更生動的描寫，讓文章更具深度與實用性。以下是修訂後的版本：\n\n---\n\n**新竹市旅遊指南：科技與文化的完美結合**\n\n位於台灣北部的新竹市，素有「風城」美譽，這裡不僅是台灣科技產業的核心重鎮，更蘊藏豐富的歷史文化與自然美景。新竹成功地將現代創新與傳統韻味融合，成為旅客探索多元風貌的理想目的地。無論你是科技迷、文化愛好者，或是自然探索者，新竹都能滿足你的期待，帶來一場難忘的旅程。\n\n首先，作為全球半導體產業重鎮的新竹科學園區，吸引了眾多科技人才與企業進駐。園區附近的「新竹市立影像博物館」與「台灣半導體博物館」則是了解科技發展的絕佳場所。館內不僅展示晶片製造的精密過程，還設有互動體驗區，讓遊客親手操作模擬設備，感受科技的魅力與創新精神。博物館週二至週日開放，免費入場，距離新竹火車站約15分鐘公車車程，交通便利。建議安排半天時間細細品味這裡的科技故事。\n\n文化方面，新竹城隍廟是城市的靈魂象徵，始建於清朝咸豐年間，廟宇結構融合閩南與客家建築風格，雕梁畫棟精緻華美。每年農曆六月舉行的城隍爺誕辰祭典，是地方最盛大的宗教活動，融合傳統戲曲、舞龍舞獅、繞境等熱鬧表演，吸引大量信眾與遊客參與，氛圍熱烈且充滿民俗風情。除了城隍廟，北門古城遺址也是歷史愛好者必訪之地。北門見證了新竹從清代到日治時期的城市變遷，附近設有詳盡的解說牌與步道，適合漫步拍照，感受歲月的痕跡。\n\n在自然景觀方面，十八尖山是市區內最受歡迎的登山路線，全長約3公里，路況平緩，適合親子及初學者。沿途林蔭蔽日，鳥語花香，清晨登頂時分，常有晨霧繚繞，遠眺新竹市區與蔚藍海岸，景致如畫。建議攜帶登山鞋、防曬用品及充足水分，避開正午高溫。若想享受海風與在地美食，南寮漁港是不二之選。這裡海鮮新鮮多樣，鹽酥蝦、烤魷魚、海鮮粥等小吃香氣四溢，令人垂涎。漁港旁的海濱公園與自行車道，是散步與騎行的好去處，夕陽西下時分，海天一色，美不勝收。\n\n新竹的飲食文化同樣豐富多元。除了海鮮，當地著名的米粉與貢丸更是不可錯過的美味。城隍廟夜市附近有多家老字號米粉店，湯頭鮮美、口感Q彈；貢丸則以彈牙多汁著稱，是新竹代表性小吃。建議旅客安排一餐夜市美食之旅，深入體驗新竹地道風味。\n\n交通方面，從台北搭乘台鐵或高鐵

## 案例: 長文產生器，拆解多個子主題，分開搜尋回答後，最後整合在一起


根據用戶輸入的主題生成一篇全面綜述文章，流程是

1. 根據用戶輸入的主題，拆解成多個子主題
2. 針對每個子主題，進行網路搜尋出參考資料，然後生成獨立的子文章
3. 將所有子文章整合並潤飾成一篇連貫的長文。

其中步驟 (2) 是平行執行

和上一個摘要的 Parallelization 的差異在於，這裏的第一步 Orchestrator 會用 AI 來拆解出不固定的子任務。

<img src="https://www.anthropic.com/_next/image?url=https%3A%2F%2Fwww-cdn.anthropic.com%2Fimages%2F4zrzovbb%2Fwebsite%2F8985fc683fae4780fb34eab1365ab78c7e51bc8e-2401x1000.png&w=3840&q=75">


In [None]:
!pip install tavily-python

Collecting tavily-python
  Downloading tavily_python-0.7.5-py3-none-any.whl.metadata (7.5 kB)
Downloading tavily_python-0.7.5-py3-none-any.whl (15 kB)
Installing collected packages: tavily-python
Successfully installed tavily-python-0.7.5


In [None]:
import asyncio
from datetime import datetime
from tavily import TavilyClient

tavily_client = TavilyClient(api_key= userdata.get('tavily_api_key') )

In [None]:
from openai import AsyncOpenAI

logger = init_logger(project="Course-202504", api_key=braintrust_api_key)
async_client = wrap_openai(AsyncOpenAI(api_key=openai_api_key))

In [None]:
from typing import List
from pydantic import Field, BaseModel

class Subject(BaseModel):
    title: str = Field(description="The title of the subject or subtopic")
    search_query: str = Field(description="""Transform natural language into optimized search queries by identifying core information needs, removing conversational elements, and including key terms and entities.""")

class OutlineResult(BaseModel):
    main_title: str = Field(description="The main title of the article")
    subjects: list[Subject] = Field(description="List of subjects or subtopics to cover in the article")


@traced
async def generate_outline(subject):
    current_date = datetime.now().strftime("%A, %B %d, %Y")

    completion1 = await async_client.beta.chat.completions.parse(
        model="gpt-4o-mini",
        messages=[
            {"role": "system", "content": f"""Based on the subject topic, break it down into multiple 3~6 sub-subjects,
and write a search query for each sub-subject. Today's date is {current_date}."""},
            {"role": "user", "content": subject},
        ],
        response_format=OutlineResult
    )

    parsed_result = completion1.choices[0].message.parsed
    return parsed_result

In [None]:
@traced
def web_search(query):
  response = tavily_client.search(query)
  return str(response)

@traced
async def async_generate_article(subject, keywords):
    search_result = web_search(keywords)

    # Step 3: Generate the final answer
    messages = [
        {"role": "system", "content": f"""Write an detailed article based on the subject topic and search results. The output should be in Traditional Chinese (Taiwan).""" },
        {"role": "user", "content": f"""SUBJECT TOPIC: <subject_topic>{subject}</subject_topic>
SEARCH RESULTS: <search_result>{search_result}</search_result>
""" }
                ]

    completion2 = await async_client.chat.completions.create(messages=messages, model="gpt-4.1-mini")
    response = completion2.choices[0].message.content
    return response

In [None]:
@traced
async def generate_article_e2e(user_query):
    current_date = datetime.now().strftime("%A, %B %d, %Y")

    # Step 1: 拆解出子主題
    outline_result = await generate_outline(user_query)

    # Step 2: 平行呼叫 async_generate_article: 搜尋並撰寫子文章
    tasks = [async_generate_article(x.title, x.search_query) for x in outline_result.subjects]
    results = await asyncio.gather(*tasks)

    # Step 3: 所有子文章合併在一起，寫一篇長文
    sub_articles = "".join( f"<sub_article>{item}</sub_article>" for item in results)

    messages = [
        {
          "role": "system",
          "content": f"""
            Refine and combine the following sub-articles into a comprehensive long article.
            Title: {outline_result.main_title}
            Today's date is {current_date}.
            The output should be in Traditional Chinese (Taiwan)."""
        },
        {
          "role": "user",
          "content": sub_articles
        }
    ]

    completion = await async_client.chat.completions.create(messages=messages, model="gpt-4.1") # 最後這個綜合最重要，可以用較好的模型
    final_article = completion.choices[0].message.content

    return final_article

In [None]:
result = await generate_article_e2e("台積電 2025 年最新發展趨勢")
print(result)

# 台積電 2025 年最新發展趨勢

隨著2025年已至，全球半導體市場正處於劇烈變動與創新爆發的關鍵時刻。台灣積體電路製造股份有限公司（台積電，TSMC）身為全球晶圓代工領頭羊，無論在技術創新、擴產佈局、財務表現亦或永續發展方面皆展現出強大的競爭力與前瞻視野。在AI、HPC（高效能運算）、5G、車用電子及物聯網等強勁需求帶動下，台積電如何布局未來？本文將全方位剖析台積電2025年最新發展趨勢，為讀者呈現半導體產業龍頭的關鍵未來。

---

## 一、技術創新：驅動AI與高效運算浪潮

技術研發與創新，始終是台積電屹立不搖的關鍵。近年來AI技術的躍進與應用爆發，直接推動了更多高階晶片的需求。2023年台積電於新竹舉辦的2025技術論壇，聚焦於AI創新與先進製程演進，亞太業務處長萬睿洋強調：「AI為第四次工業革命核心，台積電積極導入高效能運算解決方案，站穩產業生態鏈的制高點。」

台積電2025年技術佈局重點包括3奈米與2奈米以下製程的量產、3D堆疊與進階晶圓級封裝（如CoWoS）等。以2奈米製程為例，2025年初率先進入量產，領先三星、英特爾等主要競爭對手約一年，奠定技術溢價與市場主導權。而如CoWoS等高階封裝技術更是AI運算時代不可或缺的「關鍵裝備」，為NVIDIA、AMD、雲端運算巨頭所倚賴。

台積電亦積極跨界應用技術，論壇展示的實體AI人形機器人就是一例，凸顯半導體科技在多元智慧領域的潛力。此外，3D Fabric™等領先封裝能力，也大幅提升產品效能、能耗比與設計彈性，鞏固AI、高效能運算、車電與行動應用等多重市場。

---

## 二、積極擴產，打造全球晶圓生產基地

為應對AI、高效能運算、行動裝置、車用電子等多元市場激增需求，台積電2025年啟動公司史上最大規模全球擴廠計畫，投資驚人的350億美元，年度資本支出創新高，目標在全球佈局十座新產能基地：

**1. 台灣本土七座新廠**
- 以新竹、台中、高雄為三大科技重鎮，規劃如晶圓20廠、21廠、25廠等，主攻2奈米及更先進製程，同步強化本土封裝產能。

**2. 美國亞利桑那三座超級廠**
- 配合當地產業政策與供應鏈自主化，三大新廠於2025年陸續投產，生產4奈米、3奈米及未來2奈米晶片，服務美國本土及盟國需求。
- 不過，美國廠成本較台灣高，產能也需循序擴充。

**3. 日本熊本廠加速鏈

## Function Calling

## Step 1

定義工具函式

In [None]:
def web_search(keyword):
  response = tavily_client.search(keyword)
  return str(response["results"])

In [None]:
web_search("ihower")

'[{\'title\': \'ihower { blogging } - \\u200d\', \'url\': \'https://ihower.tw/blog/\', \'content\': \'各位 AI 開發者大家好 👋 我是 ihower，近期也是新模型齊發，包括 Authropic 首個推理模型 Sonnet 3.7、Elon Musk 的 Grok 3、OpenAI 釋出可能是參數量最大又最昂貴的 GPT-4.5，連 GPT-5 路線 都預告了。 🔝 AI 大神免費教你生活用 AI，入門實例解析互動技巧、工具使用、檔案處理，帶你快速掌握LLM應用！ 大神 Andrej Karpathy (前 OpenAI 共同創辦人、特斯拉人工智慧總監) 又錄了一個免費又親切的兩小時入門影片，分享他如何使用 ChatGPT，包括推理模型介紹、各種搭配的工具介紹、多模態模型介紹等等。 影片適合一般初學者特別是 AI 小白，這裡感恩 Fox 大大翻譯繁體中文字幕。 🧠 恩尼格瑪評估 EnigmaEval 在人類的最後考試之後，Scale AI 又發了一個超猛的 EnigmaEval 恩尼格瑪評估 🧩 (命名想來出自二戰時的恩尼格瑪密碼機) 這是一個來自全球謎題作家和遊戲大師的原創複雜問題，解謎需要創造性的問題解決能力，以及在數學、邏輯推理、文化知識、語言操作等多個領域中綜合資訊的能力。 共有 1184 個多模態謎題非常艱難，一群人需要花上幾個小時甚至幾天的時間才能解答。 目前所有頂級模型在 Hard set 上的得分為 0%，在 Normal set 上的得分小於 10%。總分最高分是 o1 的 5.65%，然後是 Gemini 2.0 Flash Thinking 1.1%，其他模型都在 1% 以下了…. 各位 AI 開發者大家好 👋 我是 ihower，這次過年好忙，又是 DeepSeek R1 又是 OpenAI o3-mini，真是春捲啊 🌯🌯🌯 🔝 AI 大神免費深入淺出全面講解大型語言模型、訓練、心理學到實際應用 大神 Andrej Karpathy (前 OpenAI 共同創辦人、特斯拉人工智慧總監) 寫的這個 LLM 模型訓練的比喻(出處 tweet)太讚了，這裡翻譯分享給大家: 讓大型語言模型 (LLMs) 去上學: 當你打開任何一本教科書時，你會看

In [None]:
from datetime import datetime

# 取得今天的日期
today = datetime.now().strftime("%Y/%m/%d")

messages = [
    {"role": "system", "content": "You are an agent. You MUST plan and output your thought extensively before each function call. "},
    {"role": "user", "content": f"今天 {today} 台北天氣如何?"}
]

tools = [
    {
        "type": "function",
        "function": {
            "name": "web_search",
            "description": "搜尋最新的資訊",
            "parameters": { # 這是一個 json schema 格式
                "type": "object",
                "properties": {
                    "keyword": {
                        "type": "string",
                        "description": "搜尋關鍵字",
                    }
                },
                "required": ["keyword"],
                "additionalProperties": False
            },
            "strict": True
        },
    }
]



completion = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
    tools=tools
)

In [None]:
response = completion.choices[0].message
response

ChatCompletionMessage(content='使用者想知道2025年6月13日台北的天氣狀況。這是一個未來的日期，無法直接查詢當天的氣象資料，但我可以搜尋相關的長期天氣預報或者氣候趨勢來提供相關資訊。現在我會搜尋「2025年6月13日 台北 天氣預報」來獲取可能的長期預報或相關資訊。', refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='call_SvJzbB0CF5mXQGfS5aIc57uQ', function=Function(arguments='{"keyword":"2025年6月13日 台北 天氣預報"}', name='web_search'), type='function')])

## Step 2

解析回傳，拿到工具的參數

In [None]:
completion.choices[0].message.tool_calls

[ChatCompletionMessageToolCall(id='call_SvJzbB0CF5mXQGfS5aIc57uQ', function=Function(arguments='{"keyword":"2025年6月13日 台北 天氣預報"}', name='web_search'), type='function')]

In [None]:
completion.choices[0].message.tool_calls[0]

ChatCompletionMessageToolCall(id='call_SvJzbB0CF5mXQGfS5aIc57uQ', function=Function(arguments='{"keyword":"2025年6月13日 台北 天氣預報"}', name='web_search'), type='function')

In [None]:
completion.choices[0].message.tool_calls[0].function.arguments

'{"keyword":"2025年6月13日 台北 天氣預報"}'

In [None]:
function_args = json.loads( completion.choices[0].message.tool_calls[0].function.arguments )
pp(function_args)

{'keyword': '2025年6月13日 台北 天氣預報'}


## Step 3

實際呼叫 get_current_weather 方法，得到工具結果

In [None]:
# 要把 AI 的回覆加到對話歷史紀錄
messages.append(response)

# 函數名稱與函數物件的對應
available_functions = {
  "web_search": web_search,
}

for tool_call in response.tool_calls:
  # GPT 要我執行的函數名稱
  function_name = tool_call.function.name

  # 這是函數物件
  fuction_to_call = available_functions[function_name]

  # 擷取出函式的參數
  function_args = json.loads(tool_call.function.arguments)

  # 實際呼叫函數
  function_response = fuction_to_call(**function_args)

  # 將函數的回傳結果，也塞回對話紀錄，角色是 tool
  messages.append(
      {
          "tool_call_id": tool_call.id,
          "role": "tool",
          "name": function_name,
          "content": function_response, # 注意: 這個必須是字串 str type，因此在 web_search function 最後 return 時轉成 str 了
      }
  )

  pp(function_response)

("[{'title': '天氣預報 台北市 - Meteocast.net', 'url': "
 "'https://cn.meteocast.net/forecast/tw/taipei/', 'content': '星期五, 2025年6月13日 "
 '在 台北市 這樣的天氣會: 在晚上 的空氣溫度下降到+25...+27°C, 露點: +23,39°C; 溫度，風速和濕度比: 非常潮濕，非常不舒服 ; '
 "雨，預計的 ，它建議採取保護傘, 輕風風吹從北部在7-11 公里每小时 的速度, 陰雲密布的天空', 'score': 0.9638924, "
 "'raw_content': None}, {'title': '2025年六月台北市, Taiwan每日天氣預報 - WeatherTAB', "
 "'url': 'https://www.weathertab.com/zh-hant/c/06/taiwan/taipei/taipei/', "
 "'content': '台北市, Taiwan 六月 2025 每日天氣預報 – 提前規劃 Image 1: WeatherTAB長期天氣預測 °F "
 '°C 問題解答 台灣 Taiwan 台北市 六月 25 每日天氣預報 台灣 Taiwan 台北市 六月 \\\'25; "2025年六月台北市, '
 'Taiwan每日天氣預報") 2025年六月台北市, Taiwan每日天氣預報 我們2025年六月台北市, '
 'Taiwan每日天氣預報，由專門的動態長程模型開發，提供準確的每日溫度和降雨預測。這個模型與標準統計或氣候學方法不同，是50多年專注私人研究的成果，提供更清晰、更準確的氣象洞察。 '
 '六月 2025 六月 2025七月 點擊任一日期以取得詳細氣象預報。 七月 六月 2025 摘要 下雨預測 平均下水量  下雨頻率 7 至 9 天  '
 '氣溫預測 氣溫預測 正常  平均最高氣溫 85 至 95 °F 25 至 35 °C 平均最低氣溫 70 至 80 °F 20 至 30 °C '
 '天氣預測解說 WeatherTAB協助您在下雨機率最低的日子策劃活動。  低下雨/降雪機率。 過度日- 風險期的開始或結束 中等下雨/降雪機率。 '
 '高下雨/降雪機率。 %下雨/降雪機率預

## Step 4

 再次呼叫 OpenAI API，此時 messages 裡面有三個訊息: user, assistant 和 function 結果:

In [None]:
messages

[{'role': 'system',
  'content': 'You are an agent. You MUST plan and output your thought extensively before each function call. '},
 {'role': 'user', 'content': '今天 2025/06/13 台北天氣如何?'},
 ChatCompletionMessage(content='使用者想知道2025年6月13日台北的天氣狀況。這是一個未來的日期，無法直接查詢當天的氣象資料，但我可以搜尋相關的長期天氣預報或者氣候趨勢來提供相關資訊。現在我會搜尋「2025年6月13日 台北 天氣預報」來獲取可能的長期預報或相關資訊。', refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='call_SvJzbB0CF5mXQGfS5aIc57uQ', function=Function(arguments='{"keyword":"2025年6月13日 台北 天氣預報"}', name='web_search'), type='function')]),
 {'tool_call_id': 'call_SvJzbB0CF5mXQGfS5aIc57uQ',
  'role': 'tool',
  'name': 'web_search',
  'content': '[{\'title\': \'天氣預報 台北市 - Meteocast.net\', \'url\': \'https://cn.meteocast.net/forecast/tw/taipei/\', \'content\': \'星期五, 2025年6月13日 在 台北市 這樣的天氣會: 在晚上 的空氣溫度下降到+25...+27°C, 露點: +23,39°C; 溫度，風速和濕度比: 非常潮濕，非常不舒服 ; 雨，預計的 ，它建議採取保護傘, 輕風風吹從北部在7-11 公里每小时 的速度, 陰雲密布的天空\', \'score\': 0.9638924, \'raw

In [None]:
completion2 = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
    tools=tools
)

In [None]:
completion2.choices[0].message.content

'2025年6月13日台北天氣預報如下：\n- 夜晚氣溫大約在25至27°C，露點約23.39°C\n- 天氣非常潮濕且不舒服\n- 預計會有雨，建議攜帶雨具\n- 風速輕微，從北方吹來，風速約7-11公里/小時\n- 天空陰雲密布\n\n總體來說，當天台北的天氣是陰雨且潮濕的，出門記得帶傘並注意防潮。需要我幫你查詢當天的詳細時段天氣嗎？'

## 換一個問題試看看

如果問題沒有需要呼叫 function 呢?

In [None]:
messages.append( {"role": "user", "content": "寫一首關於天氣的詩"} )

completion3 = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
    tools=tools
)

completion3.choices[0].message.content

'思考：使用天氣作為主題，需描寫自然的變化與心境的呼應，詩句要有韻律感和畫面感。\n\n創作詩歌，融合風、雨、晴、陰的元素，以及人與自然的互動，情感抒發與對未來天氣的期待。\n\n開始創作。\n\n---\n\n風吹過青山翠谷間，  \n細雨輕落潤花顏。  \n晴空萬里映碧天，  \n陰雲低垂藏夢眠。\n\n天氣變幻如人心，  \n忽晴忽雨寄盼尋。  \n晴日暖陽催花開，  \n風雨洗盡世間塵。\n\n---\n\n完成。'

## Function Calling 原理: 作用等同於 Router prompt + 工具參數擷取


In [None]:
def ask_using_router_prompt(query):
  prompt = f"""
Given the user question. Your task is to determine
if the user's input requires using a tool.

* If a tool is needed, return the name and parameter of the tool in JSON format.
* If no tool is required, provide an answer to the user's question.

The tools available are:

web_search: 任何需要最新資訊的問題
calculator: 任何有關數學計算的問題

Question: {query}
"""

  messages = [{"role": "user", "content": prompt }]

  completion = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages
  )

  return completion.choices[0].message.content


In [None]:
ask_using_router_prompt("今天台北天氣如何?")

'{"name":"web_search","parameter":"台北 天氣 今日"}'

In [None]:
ask_using_router_prompt("你好")

'你好！有什麼我可以幫忙的嗎？'

## 包成一個完整的 function

In [None]:
available_tools = {
  "web_search": web_search,
}

def run_full_turn(messages, model="gpt-4.1-mini", temperature=0, tools=None, tool_choice=None, parallel_tool_calls=True):
  print(f"💬 呼叫 API: {messages}")

  completion = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
    temperature=temperature,
    tools=tools,
    tool_choice=tool_choice,
    parallel_tool_calls=parallel_tool_calls
  )

  response = completion.choices[0].message

  if response.tool_calls: # 或用 response 裡面的 finish_reason 判斷也行

    messages.append(response)

    # ------ 呼叫函數，這裡改成執行多 tool_calls (可以改成平行處理，目前用簡單的迴圈)
    for tool_call in response.tool_calls:
      function_name = tool_call.function.name
      function_args = json.loads(tool_call.function.arguments)
      function_to_call = available_tools[function_name]

      print(f"   ⚙️ 呼叫函式 {function_name} 參數 {function_args}")
      function_response = function_to_call(**function_args)
      messages.append(
          {
              "tool_call_id": tool_call.id, # 多了 toll_call_id
              "role": "tool",
              "name": function_name,
              "content": str(function_response), # 一定要是字串
          }
      )

    # 進行遞迴呼叫
    return run_full_turn(messages, model=model, temperature=temperature, tools=tools,tool_choice=tool_choice,parallel_tool_calls=parallel_tool_calls)

  else:
    return response.content

In [None]:
messages = [{"role": "user", "content": "今天台北、新竹、高雄、台中分別的天氣如何?"}]

tools = [
    {
        "type": "function",
        "function": {
            "name": "web_search",
            "description": "搜尋最新的資訊",
            "parameters": {
                "type": "object",
                "properties": {
                    "keyword": {
                        "type": "string",
                        "description": "搜尋關鍵字",
                    }
                },
                "required": ["keyword"],
            },
        },
    }
]

response = run_full_turn(messages, tools=tools)
print("------")
pp(response)

💬 呼叫 API: [{'role': 'user', 'content': '今天台北、新竹、高雄、台中分別的天氣如何?'}]
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '台北 天氣'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '新竹 天氣'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '高雄 天氣'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '台中 天氣'}
------
('今天台北、新竹、高雄、台中天氣狀況如下：\n'
 '\n'
 '台北：\n'
 '- 天氣多雲，有時有小雨，氣溫約在19°C到22°C之間，降雨機率約70%。\n'
 '\n'
 '新竹：\n'
 '- 氣溫約20.3°C，風向為西南風，風速約36.7 km/h，濕度約90%，有82%機率下雨。\n'
 '\n'
 '高雄：\n'
 '- 天氣多雲，氣溫約27.95°C，風向西南風，風速約15.8 km/h，濕度約69%，有30%機率下雨。\n'
 '\n'
 '台中：\n'
 '- 天氣多雲，氣溫約21°C到30°C之間，降雨機率約70%，風向偏南風，風速約6到7英里/小時。\n'
 '\n'
 '請根據天氣狀況適時調整穿著及出行計劃。')


### 換一題試試

In [None]:
import numexpr
def calculate(expr):
   """計算機"""
   ans = numexpr.evaluate(expr)
   return str(ans)

In [None]:
# 在 run_full_turn 裡面有用到一個 function name 和 function 的 對照表，需要重新定義:
available_tools = {
  "web_search": web_search,
  "calculate": calculate
}

In [None]:
messages = [
  {"role": "system", "content": "作為營養師，您的任務是使用 web_search 查詢個別食材每100克的熱量，然後用 calculate 計算總熱量。"},
  {"role": "user", "content": "一頓午餐共有雞胸肉為150克，糙米為200克，蔬菜為100克。"}
]

tools = [
    {
        "type": "function",
        "function": {
            "name": "calculate",
            "description": "計算機",
            "parameters": {
                "type": "object",
                "properties": {
                    "expr": {
                        "type": "string",
                        "description": "a math expression that can be executed using Python's numexpr library.",
                    }
                },
                "required": ["expr"],
            },
        },
    },
    {
        "type": "function",
        "function": {
            "name": "web_search",
            "description": "搜尋最新的資訊",
            "parameters": {
                "type": "object",
                "properties": {
                    "keyword": {
                        "type": "string",
                        "description": "搜尋關鍵字",
                    }
                },
                "required": ["keyword"],
            },
        },
    }
]

response = run_full_turn(messages, tools=tools)
print("-----")
pp(response)

💬 呼叫 API: [{'role': 'user', 'content': '作為營養師，您的任務是使用 web_search 查詢個別食材每100克的熱量，然後用 calculate 計算總熱量。'}, {'role': 'user', 'content': '一頓午餐共有雞胸肉為150克，糙米為200克，蔬菜為100克。'}]
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '雞胸肉 每100克 熱量'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '糙米 每100克 熱量'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '蔬菜 每100克 熱量'}
   ⚙️ 呼叫函式 calculate 參數 {'expr': '150*164/100'}
   ⚙️ 呼叫函式 calculate 參數 {'expr': '200*142/100'}
   ⚙️ 呼叫函式 calculate 參數 {'expr': '100*30'}
   ⚙️ 呼叫函式 calculate 參數 {'expr': '246+284+30'}
-----
('雞胸肉每100克熱量約164大卡，150克的雞胸肉熱量為246大卡。\n'
 '糙米每100克熱量約142大卡，200克的糙米熱量為284大卡。\n'
 '蔬菜每100克熱量約30大卡。\n'
 '\n'
 '總熱量為 246 + 284 + 30 = 560 大卡。')


## 進一步包裝成 Agent 框架寫法

例如這些 Agent 框架:

* https://github.com/openai/swarm
* https://github.com/openai/openai-agents-python
* https://github.com/google/adk-python
* https://ai.pydantic.dev/
* https://docs.phidata.com/introduction

In [None]:
from pydantic import BaseModel

class Agent(BaseModel):
    name: str = "Agent"
    model: str = "gpt-4.1-mini"
    instructions: str = "You are a helpful Agent" # system prompt
    tools: list = []


輔助的 function 反射方法: 根據 function 定義，可以回傳 json schema

包括 function 內的註解會變成 description

In [None]:
import inspect

def function_to_schema(func) -> dict:
    type_map = {
        str: "string",
        int: "integer",
        float: "number",
        bool: "boolean",
        list: "array",
        dict: "object",
        type(None): "null",
    }

    try:
        signature = inspect.signature(func)
    except ValueError as e:
        raise ValueError(
            f"Failed to get signature for function {func.__name__}: {str(e)}"
        )

    parameters = {}
    for param in signature.parameters.values():
        try:
            param_type = type_map.get(param.annotation, "string")
        except KeyError as e:
            raise KeyError(
                f"Unknown type annotation {param.annotation} for parameter {param.name}: {str(e)}"
            )
        parameters[param.name] = {"type": param_type}

    required = [
        param.name
        for param in signature.parameters.values()
        if param.default == inspect._empty
    ]

    return {
        "type": "function",
        "function": {
            "name": func.__name__,
            "description": (func.__doc__ or "").strip(),
            "parameters": {
                "type": "object",
                "properties": parameters,
                "required": required,
            },
        },
    }


In [None]:
function_to_schema( web_search )

{'type': 'function',
 'function': {'name': 'web_search',
  'description': '',
  'parameters': {'type': 'object',
   'properties': {'keyword': {'type': 'string'}},
   'required': ['keyword']}}}

In [None]:
def run_full_turn_v2(agent, user_messages):

  tool_schemas = [function_to_schema(tool) for tool in agent.tools] # 直接從 function 定義，反射出 json schema
  available_tools = {tool.__name__: tool for tool in agent.tools}

  messages = [{"role": "system", "content": agent.instructions}] + user_messages # 從 agent class 中，取得 system prompt
  print(f"💬 呼叫 API: {messages}")

  completion = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
    temperature=0,
    tools=tools
  )

  response = completion.choices[0].message

  if response.tool_calls:
    user_messages.append(response)

    for tool_call in response.tool_calls:
      function_name = tool_call.function.name
      function_args = json.loads(tool_call.function.arguments)
      function_to_call = available_tools[function_name]

      print(f"   ⚙️ 呼叫函式 {function_name} 參數 {function_args}")
      function_response = function_to_call(**function_args)
      user_messages.append(
          {
              "tool_call_id": tool_call.id, # 多了 toll_call_id
              "role": "tool",
              "name": function_name,
              "content": str(function_response),
          }
      )

    return run_full_turn_v2(agent, user_messages)

  else:
    return response.content


In [None]:
assistant = Agent(
    name="Nutritionist Assistant",
    instructions="作為營養師，您的任務是使用 web_search 查詢個別食材每100克的熱量，然後用 calculate 計算總熱量。", # system prompt
    tools = [web_search, calculate]
)

result = run_full_turn_v2(assistant, [{"role": "user", "content": "一頓午餐共有雞胸肉為150克，糙米為200克，蔬菜為100克"}])

💬 呼叫 API: [{'role': 'system', 'content': '作為營養師，您的任務是使用 web_search 查詢個別食材每100克的熱量，然後用 calculate 計算總熱量。'}, {'role': 'user', 'content': '一頓午餐共有雞胸肉為150克，糙米為200克，蔬菜為100克'}]
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '雞胸肉 每100克 熱量'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '糙米 每100克 熱量'}
   ⚙️ 呼叫函式 web_search 參數 {'keyword': '蔬菜 每100克 熱量'}
   ⚙️ 呼叫函式 calculate 參數 {'expr': '150*164 + 200*142 + 100*30'}


In [None]:
print(result)

雞胸肉每100克熱量約164大卡，150克的雞胸肉熱量為 150*164 = 24600大卡。
糙米每100克熱量約142大卡，200克的糙米熱量為 200*142 = 28400大卡。
蔬菜每100克熱量約30大卡，100克的蔬菜熱量為 100*30 = 3000大卡。

總熱量為 24600 + 28400 + 3000 = 56000 大卡。
