# Groq 免費體驗 Llama API
本範例將帶你體驗 **Groq** 所提供的免費 LLM API、Whisper 語音轉文字，以及多模態模型的使用方法。  
同時也會示範如何使用 **OpenAI 兼容** 的寫法來調用 Groq API，方便你將現有的 OpenAI 程式碼「無痛轉移」到 Groq。

## 目錄
1. [環境準備](#環境準備)
2. [設定 API Key](#設定-api-key)
3. [測試 LLM（文字生成）](#測試-llm文字生成)
   1. [llama3-8b-8192：基礎範例](#31-llama3-8b-8192基礎範例)
   2. [llama3-8b-8192：開啟 stream](#32-llama3-8b-8192開啟-stream)
   3. [deepseek-r1-distill-llama-70b：展示思維鏈](#33-deepseek-r1-distill-llama-70b展示思維鏈)
4. [多模態用法：文字與影像混合輸入](#多模態-llm文字與影像混合輸入)
5. [Whisper（語音轉文字）](#whisper語音轉文字)
6. [OpenAI 兼容 API 寫法](#openai-兼容-api-寫法)

<a name="環境準備"></a>
## 1. 環境準備 
安裝套件：

In [None]:
!pip install groq -q

<a name="設定-api-key"></a>
## 2. 設定 API Key
登入[Groq](https://console.groq.com/login)，點選「API Keys」選項後，再按下「Create API Key」按鈕，輸入你喜歡的名稱並按下「Submit」，即可獲得專屬的 API Key。請注意，API Key 僅會在建立後的視窗中顯示，關閉後便無法再次查閱，因此建議妥善保存。
接著將 `api_key` 請替換成 **你的 Groq API Key**。

In [2]:
# 設定 Groq API Key
api_key = "你的API_KEY"

<a name="測試-llm文字生成"></a>
## 3. 測試 LLM（文字生成）

本節將示範如何使用 **Groq** 的 LLM 進行文字生成。以下分為三個範例：

1. **3.1** 使用 `llama3-8b-8192` 基礎範例  
2. **3.2** 使用 `llama3-8b-8192` 並 **開啟 stream**（流式輸出）  
3. **3.3** 使用 `deepseek-r1-distill-llama-70b` 並展示「思維鏈」結果

<a name="31-llama3-8b-8192基礎範例"></a>
### 3.1 llama3-8b-8192：基礎範例

In [4]:
from groq import Groq

# 建立 Groq 客戶端
client = Groq(api_key=api_key)
model_name = "llama3-8b-8192"  # 指定使用 llama3-8b-8192 模型

messages = [
    {
        "role": "system",
        "content": "你現在是個問答小幫手，並使用繁體中文回答問題。",
    },
    {
        "role": "user",
        "content": "台灣有什麼美食？",
    }
]

response = client.chat.completions.create(
    model=model_name,
    messages=messages,
    temperature=0.9,
    max_completion_tokens=512,
    top_p=0.2,
    stream=False
)

print("=== llama3-8b-8192 (基礎) 回應 ===")
print(response.choices[0].message.content)

=== llama3-8b-8192 (基礎) 回應 ===
台灣的美食真的很多！以下是一些台灣最受歡迎的美食：

1. Beef Noodle Soup (): 一道經典的台灣美食，使用嫩牛肉、麵條和豐富的湯頭。
2. Oyster Omelet (): 一道鹹香的美食，使用蠔肉和麵粉製作的蛋餅。
3. Stinky Tofu (): 一道聞名的台灣美食，使用發酵的豆腐製作，具有強烈的臭味。
4. Bubble Tea (): 一道流行的台灣飲料，使用茶葉和珍珠製作的奶茶。
5. Shaved Ice (): 一道涼涼的美食，使用刨冰和多種 toppings製作的雪糕。
6. Fried Chicken Cutlet (): 一道 crispy 的美食，使用雞肉和麵粉製作的雞排。
7. Congee (): 一道暖暖的美食，使用米飯和水製作的粥。
8. Taro Ball (): 一道甜甜的美食，使用芋頭和麵粉製作的芋頭球。
9. Salted Crispy Chicken (): 一道鹹鹹的美食，使用雞肉和鹽製作的鹹雞。
10. Ah-Gei (): 一道經典的台灣美食，使用豆腐和麵粉製作的豆腐餅。

這些美食只是一些台灣的代表性美食，台灣的美食真的很多，還有很多其他的美食等待你去嘗試！


<a name="32-llama3-8b-8192開啟-stream"></a>
### 3.2 llama3-8b-8192：開啟 stream


In [7]:
from groq import Groq

# 建立 Groq 客戶端
client = Groq(api_key=api_key)
model_name = "llama3-8b-8192"  # 指定使用 llama3-8b-8192 模型

stream_response = client.chat.completions.create(
    model=model_name,
    messages=messages,
    temperature=0.7,
    max_completion_tokens=512,
    top_p=0.9,
    stream=True  # 開啟流式輸出
)

print("=== llama3-8b-8192 (stream) 回應 ===")
response_text = ""
for chunk in stream_response:
    if chunk.choices[0].delta.content:
        text_piece = chunk.choices[0].delta.content
        response_text += text_piece
        print(text_piece, end="", flush=True)

# print("\n---\n最終回應：", response_text)

=== llama3-8b-8192 (stream) 回應 ===
台灣有很多美食！以下是一些台灣最受歡迎的美食：

1. Beef Noodle Soup ():一道台灣最著名的菜式，使用牛肉和麵條做成的浸泡湯。
2. Oyster Omelet ():一個台灣最受歡迎的街頭小食，使用生蚝和麵條做成的蛋餅。
3. Stinky Tofu ():一個台灣最知名的小食，使用發酵的豆腐做成的臭豆腐。
4. Bubble Tea ():一個台灣發明的飲料，使用茶葉和珍珠做成的飲料。
5. Shaved Ice ():一個台灣最受歡迎的甜食，使用刨冰和甜品做成的冰淇淋。
6. Fried Chicken Cutlet ():一個台灣最受歡迎的炸雞，使用雞肉和麵粉做成的炸雞。
7. Congee ():一個台灣最受歡迎的早餐菜式，使用粥和肉菜做成的粥。
8. Taro Ball ():一個台灣最受歡迎的甜食，使用芋頭和麵粉做成的芋頭球。
9. Ah-Gei Wontons ():一個台灣最受歡迎的湯麵，使用軟軟的湯麵和肉菜做成的湯麵。
10. Mango Shaved Ice ():一個台灣最受歡迎的甜食，使用刨冰和芒果做成的芒果冰淇淋。

這些只是台灣美食的一部分，台灣還有很多其他的美食等待您發掘！

<a name="33-deepseek-r1-distill-llama-70b展示思維鏈"></a>
### 3.3 使用 deepseek-r1-distill-llama-70b：展示思維鏈


In [10]:
from groq import Groq

# 建立 Groq 客戶端
client = Groq(api_key=api_key)
model_name = "deepseek-r1-distill-llama-70b"

messages = [
    {
        "role": "system",
        "content": "你現在是個問答小幫手，並使用繁體中文回答問題。",
    },
    {
        "role": "user",
        "content": "世界上最高的山是什麼？",
    }
]

response_text = ""
completion = client.chat.completions.create(
    model=model_name,
    messages=messages,
    temperature=0.7,
    max_completion_tokens=4096,
    top_p=0.9,
    stream=True,  # 也可用 stream=True 來即時顯示
    reasoning_format="raw"  # 允許顯示 <think> 區塊
)

for chunk in completion:
    print(chunk.choices[0].delta.content or "", end="")
    if chunk.choices[0].delta.content:
        response_text += chunk.choices[0].delta.content

# print("=== deepseek-r1-distill-llama-70b 回應 ===")
# print(response_text)

<think>
嗯，今天有人問我世界上最高的山是什麼，我得好好想想。首先，我好像在哪裡聽過，應該是珠穆朗瑪峰吧？或者是不是聖母峰？好像兩個名字都是指同一座山。珠穆朗瑪峰在喜馬拉雅山脈，那邊是不是有很多高山？我好像在地理課上學過，喜馬拉雅山脈是世界上最高的山脈，珠穆朗瑪峰就是其中最高的。

可是，我是不是把名字搞混了？聖母峰是不是另一個名字？好像是翻譯的問題，英文叫Mount Everest，中文翻譯成聖母峰，而藏文或者其他語言可能叫珠穆朗瑪峰。所以兩者都是指同一座山。

那這座山有多高呢？我記得海拔高度大約是8848米，對吧？可能最近有重新測量過，數字可能有所變化，但大致上是這個數字。喜馬拉雅山脈是由於板塊運動形成的，所以那邊的山還在慢慢長高，每年大概幾毫米的高度增加。

我還記得珠穆朗瑪峰的位置，是在尼泊爾和中國西藏的邊界上。所以登山的路線有兩邊，一邊是從尼泊爾這邊，一邊是從西藏這邊。從尼泊爾那邊登山可能比較常見，因為那邊有基地營，很多登山者會從那邊出發。

登山的季節是春季，五月份左右，天氣比較穩定，風比較小，但即使如此，登頂還是非常危險的。有很多人嘗試登頂，但也有不少人失敗或者遇到危險。

我好像還看過一些紀錄片，珠穆朗瑪峰上面環境非常惡劣，低溫，低氧，風速很高。登山者需要進行高山適應，否則可能會得高山症，頭痛、嘔吐，甚至更嚴重的症狀。

還有，珠穆朗瑪峰上面有很多垃圾，登山者留下的，現在有很多清理的行動，試圖保持山脈的清潔。這也是個大問題，因為每年有很多人去登山，留下的垃圾和人體廢物需要處理。

另外，我好像聽說過珠穆朗瑪峰的高度可能會因為地震或者板塊運動而有所變化。比如，2015年尼泊爾大地震可能影響了山峰的高度，但後來又測量過，高度差不多恢復了。

還有，珠穆朗瑪峰的名字在不同的語言裡有不同的叫法，比如在尼泊爾語裡叫Sagarmatha，意思是“天空的眉毛”或者“天空的頭飾”。而在藏語裡，珠穆朗瑪峰的意思是“世界之母”或者“最高的山峰”。

登山技術方面，珠穆朗瑪峰需要很高的登山技術和體力，尤其是最後的部分，需要用冰斧和繩索。很多人會雇佣嚮導，或者加入登山隊，才能有機會成功登頂。

我還記得第一位登頂的人是誰，應該是希拉里爵士和夏帕從尼泊爾那邊登上去了，1953年左右。後來有更多人登上了山峰，但每次登山都充滿挑戰。

所以，總結一下，世界上最高的山是珠穆

<a name="多模態-llm文字與影像混合輸入"></a>

## 4. 多模態 LLM（文字與影像混合輸入）
目前 Groq 提供 Llama3.2-90B-Vision-Preview，支援文字與影像的混合輸入。



In [12]:
import base64

# 讀取本機圖片並轉為 Base64
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode("utf-8")

# 圖片路徑
image_path = "test.jpg"
base64_image = encode_image(image_path)

In [14]:
from groq import Groq

# 建立 Groq 客戶端
client = Groq(api_key=api_key)
model_name = "llama-3.2-90b-vision-preview"

completion = client.chat.completions.create(
    model=model_name,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "你是一個專業的台灣釣魚專家，知道台灣附近的海域有哪些魚種。這張圖片裡有什麼?"
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"
                    }
                }
            ]
        }
    ],
    temperature=1,
    max_completion_tokens=1024,
    top_p=1,
    stream=False,
    stop=None,
)

print(completion.choices[0].message.content)

根據圖片的外形與形狀，這種海魚很可能是長身的鰆魚。還有些例子是可能是花鱸與長身的鯧鱗魚。也有一種魚叫做黃線魨，與花鱸一樣都有明亮的條紋。所有這幾種魚可以找到於台灣水域。



黃線魨與花鱸有最明亮和美麗的條紋，可以輕易辨認。黃線魨有濃飽和的黃色條紋和紅色的眼睛（且稍白、黃或灰色）。花鱸有黑色與黃色條紋，以及紅色或藍灰色的眼睛。兩種魚都有一個與魨科魚類最著名紅鱗牛魨相似的背鰭胸鰭，然而背鰭、尾鰭略微不同，尾鰭有黑色的條紋或花紋。花鱸與黃線魨的眼睛顯得更大。黃邊龍鯛與兩者眼神略微一致的大小，同樣有大量圖案和條紋。當這些魚還年輕時，背部有條帶，紅色條紋，或有條紋，深紅色和紫色條紋與圖案。對比同類魨科魚種，紅鱗牛魨有與魨魚和蛤蜊有關的和明顯不同與紅鱗魨魚一起相映成趣的皮膚變化，頗有美麗的條纹。與花鱸比較相似的一種魚是長身鯆類。然而長身鯆目眼的配色與美麗條紋相差甚遠，與長身鯆類鳍部上的厚皮相比，與生理上的皮膚之變換差了許多。長身鯆類鱗片粗糙。當比同類魚一起比較時，這是一種相差甚遠的魚種，不難區別。還有一些其他與長身鯆類或鰆魚（比較清晰的魚種）之間的圖案是，紅鱗牛魨與花鱸有明亮的紅色或黃色與更明亮的色澤。背部相當平直的花鱸與長身花鱸與紅鱗牛魨相較之下，長身花鱸是明亮金色的，與花鱸不完全為明亮。花鱸頂部與兩側邊有明亮的色澤。在圖中花鱸魚尾略微凸起，長身花鱸是平和弧線，兩者分量都可以深，然而長身花鱸也可以具有白色和黑色條紋，與圖中的黃線魨相近。魚種中沒有明亮金色或者色澤與紅色條紋相似的魚。


<a name="whisper語音轉文字"></a>

## 5. Whisper（語音轉文字）

In [3]:
from groq import Groq

# 建立 Groq 客戶端
client = Groq(api_key=api_key)
filename = "疫情記者會.wav"

with open(filename, "rb") as file:
    transcription = client.audio.transcriptions.create(
      file=(filename, file.read()),
      model="whisper-large-v3",
      language="zh",
      response_format="verbose_json",
    )
    
print("=== 轉錄內容 ===")
print(transcription.text)
print("\n=== 轉錄資訊 ===")
print(f"任務類型: {transcription.task}")
print(f"語言: {transcription.language}")
print(f"音訊時長: {transcription.duration} 秒")

print("\n=== 分段內容 ===")
for segment in transcription.segments:
    print(f"[{segment['start']:.2f}s - {segment['end']:.2f}s] {segment['text']}")

=== 轉錄內容 ===
部長好 帶來金周刊提問中研院院士郭培恩建議台灣的健保資料庫資訊完整可以從資料庫事先找出高風險族群出現症狀前提早判斷他們染疫後要使用哪一種口服藥然後再搭配物流將藥物送到患者家中不用到藥局排隊請問指揮中心會不會採用這樣子的建議謝謝那你們還有一些開藥的法律上的問題那我们会研究

=== 轉錄資訊 ===
任務類型: transcribe
語言: Chinese
音訊時長: 31.61 秒

=== 分段內容 ===
[0.00s - 3.70s] 部長好 帶來金周刊提問
[3.70s - 8.30s] 中研院院士郭培恩建議台灣的健保資料庫資訊完整
[8.30s - 12.08s] 可以從資料庫事先找出高風險族群出現症狀前
[12.08s - 15.38s] 提早判斷他們染疫後要使用哪一種口服藥
[15.38s - 18.90s] 然後再搭配物流將藥物送到患者家中
[18.90s - 20.26s] 不用到藥局排隊
[20.26s - 23.12s] 請問指揮中心會不會採用這樣子的建議
[23.12s - 23.52s] 謝謝
[23.52s - 28.24s] 那你們還有一些開藥的法律上的問題
[28.24s - 30.36s] 那我们会研究


In [57]:
from datetime import timedelta

# 轉換為 SRT 字幕檔
srt_entries = []
for segment in transcription.segments:
    start_time = str(timedelta(seconds=segment["start"])).replace(".", ",")[:12]
    end_time = str(timedelta(seconds=segment["end"])).replace(".", ",")[:12]
    srt_entries.append(f"{segment['id'] + 1}\n{start_time} --> {end_time}\n{segment['text']}\n")

# 生成 SRT 字串
srt_content = "\n".join(srt_entries)

# 儲存 SRT 檔案
srt_file_path = "transcription.srt"
with open(srt_file_path, "w", encoding="utf-8") as f:
    f.write(srt_content)

<a name="openai-兼容-api-寫法"></a>

## 6. OpenAI 兼容 API 寫法
Groq API 兼容 OpenAI API，可直接替換 api_base 來適配 OpenAI 既有程式碼。

當出現以下錯誤訊息時，請安裝指定版本 httpx。

> TypeError: Client.__init__() got an unexpected keyword argument 'proxies'


```
pip install httpx==0.27.2
```

In [17]:
import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.groq.com/openai/v1",  # 設定 API 伺服器的基礎 URL
    api_key=api_key,
)

In [19]:
model_name = "llama3-8b-8192"  # 指定使用 llama3-8b-8192 模型
# 發送聊天請求
response = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": "你現在是個問答小幫手，並使用繁體中文回答問題。",  # 設定系統角色，引導 AI 以繁體中文回答
        },
        {
            "role": "user",
            "content": "請問法國的首都？",  # 使用者的提問
        }
    ],
    model=model_name,  # 指定使用的 AI 模型
    temperature=1,  # 設定溫度值，影響回答的隨機性
    max_tokens=512,  # 設定回應的最大 Token 數（字數限制）
    top_p=1  # 設定 Top-p，用於控制回應的多樣性
)

# 印出 AI 的回應內容
print(response.choices[0].message.content)

法國的首都是巴黎（Paris）！


<a name="結語"></a>

## 7. 結語

透過本教材，你已學習如何：

- **呼叫 Groq API** 進行 **文字生成**
- **使用 Streaming 模式** 進行即時輸出
- **測試思維鏈（CoT）模型**
- **使用多模態模型處理文字 + 影像**
- **進行語音轉文字**
- **使用 OpenAI 兼容 API**

**Groq** 提供 **免費** 且 **高速** 的推理能力，適合 **AI 開發者** 進行各種測試。你可以嘗試不同的應用場景，如 **AI 助手、Chatbot、語音轉錄、影像問答** 等，探索更多可能性！






