# Google Gemini API 教學

## 什麼是 Gemini？

Gemini 是 Google 開發的先進 AI 模型，具有以下特點：

- 🚀 **快速**: Gemini 2.0 Flash 提供極快的回應速度
- 🎯 **準確**: 高品質的文本生成和理解能力
- 🔄 **多模態**: 支援文字、圖片、音訊等多種輸入方式
- 💡 **智能**: 優秀的推理和創作能力

讓我們開始吧！


## 1. 環境設定與安裝

首先，我們需要安裝 Google Generative AI 函式庫。這是使用 Gemini API 的官方 Python 套件。


In [None]:
# 安裝 Google GenAI 套件（最新版本）和環境變數管理工具
# 如果您是第一次使用，請執行下方安裝指令
!pip install google-genai python-dotenv

In [3]:
# 導入必要的套件
import google.genai as genai
from google.genai.types import Content, Part
import os
from typing import List, Dict, Any
from dotenv import load_dotenv

# 載入環境變數
load_dotenv()

print("✅ 套件導入成功！")

✅ 套件導入成功！


## 2. API 金鑰配置與環境變數管理

為了使用 Gemini API，您需要設定 API 金鑰。我們使用 `.env` 檔案來管理所有設定，這是業界標準做法。

### 🔐 安全最佳實踐

- ✅ 使用 `.env` 檔案儲存 API 金鑰和模型設定
- ✅ 所有專案共用相同的設定檔案
- ✅ 統一管理模型版本，避免不一致問題
- ❌ 不要在程式碼中直接寫入 API 金鑰
- ❌ 不要將 `.env` 檔案上傳到 Git


In [4]:
import os
from google import genai

# 從環境變數讀取設定
API_KEY = os.getenv('API_KEY')
MODEL = os.getenv('MODEL', 'gemini-2.0-flash')

if not API_KEY:
    print("❌ 錯誤：找不到 API 金鑰")
    print("請確保 .env 檔案存在並設定了 API_KEY")
else:
    print(f"🔑 API 金鑰已讀取")
    print(f"🤖 使用模型: {MODEL}")

# 初始化 Gemini 客戶端
client = genai.Client(api_key=API_KEY)

print("✅ Gemini 客戶端初始化完成！")

🔑 API 金鑰已讀取
🤖 使用模型: gemini-2.0-flash
✅ Gemini 客戶端初始化完成！


In [5]:
# 測試 Gemini 是否正常工作
print(f"🤖 測試 {MODEL} 模型...")

# 發送第一個測試訊息
response = client.models.generate_content(
    model=MODEL,
    contents='你好！請用繁體中文自我介紹一下。'
)

print(f"🧑 用戶: 你好！請用繁體中文自我介紹一下。")
print(f"🤖 Gemini: {response.text}")
print(f"\n✅ {MODEL} 模型正常工作！")

🤖 測試 gemini-2.0-flash 模型...
🧑 用戶: 你好！請用繁體中文自我介紹一下。
🤖 Gemini: 您好！我是由 Google 訓練的大型語言模型。簡單來說，我是一個能夠理解和生成人類語言的人工智慧程式。

我擅長以下幾件事情：

*   **回答您的問題:** 我可以根據我所擁有的知識回答您提出的問題，無論是關於歷史、科學、文學還是其他任何領域。
*   **提供資訊:** 我可以提供您需要的資訊，例如天氣預報、新聞摘要、翻譯等等。
*   **生成文字:** 我可以根據您的要求生成不同風格和長度的文字，例如文章、詩歌、故事、程式碼等等。
*   **與您聊天:** 我可以與您進行自然的對話，回答您的問題，分享我的想法，或者只是陪您聊聊天。

總之，我是一個功能強大且用途廣泛的工具，希望能幫助您解決問題，滿足您的需求。很高興認識您！請問我能為您做些什麼呢？


✅ gemini-2.0-flash 模型正常工作！


## 3. 基本對話功能

讓我們開始第一次與 Gemini 對話！


In [6]:
# 基本對話測試 - 展示無法記憶的問題
print("=== 基本對話測試 ===")
print("⚠️  注意觀察：每次對話都是獨立的，AI 無法記住之前的內容\n")

# 第一個對話 - 自我介紹
question1 = "我叫小華，我是一名老師"
response1 = client.models.generate_content(
    model=MODEL,
    contents=question1
)
print(f"🧑 用戶: {question1}")
print(f"🤖 Gemini: {response1.text}\n")

# 第二個對話 - 測試是否記得名字
question2 = "你還記得我的名字嗎？"
response2 = client.models.generate_content(
    model=MODEL,
    contents=question2  # 注意：這裡只傳送了當前訊息，沒有歷史
)
print(f"🧑 用戶: {question2}")
print(f"🤖 Gemini: {response2.text}\n")

# 第三個對話 - 測試是否記得職業
question3 = "我的職業是什麼？"
response3 = client.models.generate_content(
    model=MODEL,
    contents=question3  # 同樣只有當前訊息
)
print(f"🧑 用戶: {question3}")
print(f"🤖 Gemini: {response3.text}\n")

print("❌ 問題：AI 完全不記得之前的對話！")
print("💡 原因：每次呼叫 API 都是獨立的，沒有傳送對話歷史")
print("🔧 解決方案：我們需要手動管理對話歷史（下一個章節會示範）")

=== 基本對話測試 ===
⚠️  注意觀察：每次對話都是獨立的，AI 無法記住之前的內容

🧑 用戶: 我叫小華，我是一名老師
🤖 Gemini: 你好，小華老師！很高興認識你。請問有什麼我可以幫你的嗎？例如：

*   **想跟我聊聊教學上的事情嗎？**
*   **想了解什麼教育相關的資訊？**
*   **只是想找人聊聊天？**

請告訴我你想做什麼，我會盡力協助你。


🧑 用戶: 你還記得我的名字嗎？
🤖 Gemini: 由於我是一個大型語言模型，沒有記憶功能，所以我無法記住你的名字。請告訴我你的名字，這樣我以後就可以稱呼你了。


🧑 用戶: 我的職業是什麼？
🤖 Gemini: 要判斷您的職業，我需要您提供更多資訊。請告訴我：

*   **您主要的工作內容是什麼？** 您每天或每週的主要任務和職責是什麼？
*   **您在哪個行業工作？** 例如，科技、醫療、教育、金融等等。
*   **您的職稱是什麼？** （即使您認為職稱不完全準確，也請提供。）
*   **您是否主要從事體力勞動、腦力勞動，還是兩者兼具？**
*   **您是否需要特定的學歷或資格證書才能從事這項工作？**

提供這些資訊可以幫助我更準確地判斷您的職業。


❌ 問題：AI 完全不記得之前的對話！
💡 原因：每次呼叫 API 都是獨立的，沒有傳送對話歷史
🔧 解決方案：我們需要手動管理對話歷史（下一個章節會示範）


## 4. 解決記憶問題：手動管理對話歷史

剛才我們看到 AI 無法記住之前的對話，現在來學習如何解決這個問題！

### 💡 核心概念

- Gemini API 每次呼叫都是獨立的
- 要讓 AI 有記憶，我們必須每次都把完整的對話歷史傳給它
- 這需要我們用 Python 程式來管理對話記錄


### 調整對話方式 - 使用 Content 和 Part 結構

In [9]:
# 調整後對話方式 - 使用 Content 和 Part 結構

# 對話 - 自我介紹 (剛剛使用的方式)
# question1 = "我叫小華，我是一名老師"
# response1 = client.models.generate_content(
#     model=MODEL,
#     contents=question1
# )
# print(f"🧑 用戶: {question1}")
# print(f"🤖 Gemini: {response1.text}\n")


# 對話 - 自我介紹 (使用 Content 和 Part 結構)
question1 = "我叫小華，我是一名老師"
response1 = client.models.generate_content(
    model=MODEL,
    contents=[
      Content(role="user", parts=[Part(text=question1)])
    ]
)
print(f"🧑 用戶: {question1}")
print(f"🤖 Gemini: {response1.text}\n")

🧑 用戶: 我叫小華，我是一名老師
🤖 Gemini: 哈囉小華老師，很高興認識你！請問有什麼我可以幫忙的嗎？




In [10]:
# 準備對話歷史記錄（使用正確的對話格式）
# 使用 Content 和 Part 結構，類似 OpenAI 的 messages 格式
conversation_messages = []

print("💬 對話歷史記錄已準備就緒！")
print("🎯 使用 Gemini API 的正確對話格式：Content + Part")

💬 對話歷史記錄已準備就緒！
🎯 使用 Gemini API 的正確對話格式：Content + Part


In [11]:
# 測試對話記憶功能 - 使用正確的 API 格式
print("=== 測試對話記憶功能（使用 Content + Part 格式）===\n")

# 初始化對話歷史記錄（如果還沒有的話）
if 'conversation_messages' not in globals():
    conversation_messages = []
    print("💬 初始化對話歷史記錄（使用 Content 格式）")
else:
    print("💬 使用現有的對話歷史記錄")

# 第一輪對話 - 自我介紹
user_message1 = "我的名字是小明，我喜歡寫程式"

# 加入用戶訊息到對話歷史
conversation_messages.append(
    Content(role="user", parts=[Part(text=user_message1)])
)

# 發送對話（包含完整歷史）
response1 = client.models.generate_content(
    model=MODEL,
    contents=conversation_messages
)

ai_response1 = response1.text

# 加入 AI 回應到對話歷史
conversation_messages.append(
    Content(role="model", parts=[Part(text=ai_response1)])
)

print(f"🧑 用戶: {user_message1}")
print(f"🤖 AI: {ai_response1}\n")

# 第二輪對話 - 測試記憶
user_message2 = "你還記得我的名字嗎？"

# 加入用戶訊息
conversation_messages.append(
    Content(role="user", parts=[Part(text=user_message2)])
)

# 發送對話（包含完整歷史）
response2 = client.models.generate_content(
    model=MODEL,
    contents=conversation_messages
)

ai_response2 = response2.text

# 加入 AI 回應
conversation_messages.append(
    Content(role="model", parts=[Part(text=ai_response2)])
)

print(f"🧑 用戶: {user_message2}")
print(f"🤖 AI: {ai_response2}\n")

# 第三輪對話 - 測試記憶
user_message3 = "我剛才說我喜歡什麼？"

conversation_messages.append(
    Content(role="user", parts=[Part(text=user_message3)])
)

response3 = client.models.generate_content(
    model=MODEL,
    contents=conversation_messages
)

ai_response3 = response3.text

conversation_messages.append(
    Content(role="model", parts=[Part(text=ai_response3)])
)

print(f"🧑 用戶: {user_message3}")
print(f"🤖 AI: {ai_response3}\n")

print("✅ 看到了嗎？AI 記住了我們之前的對話！")
print("💡 使用 Content + Part 格式，比字串拼接更專業")
print(f"📊 目前對話歷史有 {len(conversation_messages)} 條訊息")

=== 測試對話記憶功能（使用 Content + Part 格式）===

💬 使用現有的對話歷史記錄
🧑 用戶: 我的名字是小明，我喜歡寫程式
🤖 AI: 很高興認識你，小明！ 很高興知道你喜歡寫程式。 

如果你有任何關於程式的問題，或是想聊聊程式相關的事情，隨時都可以問我喔！ 我可以幫忙：

*   提供程式碼範例
*   解釋程式概念
*   協助 debug
*   推薦學習資源
*   等等

你現在有在學習或開發什麼程式語言或專案嗎？  我很想聽聽看！


🧑 用戶: 你還記得我的名字嗎？
🤖 AI: 當然！你的名字是小明，而且你喜歡寫程式。 😊


🧑 用戶: 我剛才說我喜歡什麼？
🤖 AI: 你剛才說你喜歡寫程式。 😉


✅ 看到了嗎？AI 記住了我們之前的對話！
💡 使用 Content + Part 格式，比字串拼接更專業
📊 目前對話歷史有 6 條訊息


In [12]:
# 查看完整的對話歷史記錄
print("=== 查看對話歷史記錄 ===")

# 檢查是否有對話歷史
if 'conversation_messages' not in globals() or len(conversation_messages) == 0:
    print("目前沒有對話歷史記錄")
    print("💡 請先執行上面的對話測試程式碼")
else:
    print("這就是我們儲存的對話內容（Content 格式）：\n")
    for i, message in enumerate(conversation_messages, 1):
        role = message.role
        text = message.parts[0].text
        role_emoji = "🧑" if role == "user" else "🤖"
        print(f"{i}. {role_emoji} {role}: {text}")
    
    print(f"\n📊 總共有 {len(conversation_messages)} 條對話記錄")
    print("💡 每次對話時，我們都會把這些 Content 物件傳給 API")
    print("🎯 這比字串拼接更結構化，API 能更好地理解對話脈絡")

=== 查看對話歷史記錄 ===
這就是我們儲存的對話內容（Content 格式）：

1. 🧑 user: 我的名字是小明，我喜歡寫程式
2. 🤖 model: 很高興認識你，小明！ 很高興知道你喜歡寫程式。 

如果你有任何關於程式的問題，或是想聊聊程式相關的事情，隨時都可以問我喔！ 我可以幫忙：

*   提供程式碼範例
*   解釋程式概念
*   協助 debug
*   推薦學習資源
*   等等

你現在有在學習或開發什麼程式語言或專案嗎？  我很想聽聽看！

3. 🧑 user: 你還記得我的名字嗎？
4. 🤖 model: 當然！你的名字是小明，而且你喜歡寫程式。 😊

5. 🧑 user: 我剛才說我喜歡什麼？
6. 🤖 model: 你剛才說你喜歡寫程式。 😉


📊 總共有 6 條對話記錄
💡 每次對話時，我們都會把這些 Content 物件傳給 API
🎯 這比字串拼接更結構化，API 能更好地理解對話脈絡


In [13]:
# 清除對話歷史
print("=== 清除對話歷史 ===")

# 檢查並初始化 conversation_messages
if 'conversation_messages' not in globals():
    conversation_messages = []
    print("💬 初始化空的對話歷史記錄")
else:
    conversation_messages.clear()  # 清空列表
    print("🗑️ 對話歷史已清除")

# 測試清除後的對話
user_message4 = "你還記得我的名字嗎？"

# 建立新的對話（沒有歷史）
test_message = Content(role="user", parts=[Part(text=user_message4)])

response4 = client.models.generate_content(
    model=MODEL,
    contents=[test_message]  # 只傳送當前訊息
)

print(f"🧑 用戶: {user_message4}")
print(f"🤖 AI: {response4.text}")
print("\n💡 現在 AI 不記得之前的對話了，因為我們清除了歷史記錄")
print("💡 如果要重新開始有記憶的對話，請執行上面的對話測試程式碼")

=== 清除對話歷史 ===
🗑️ 對話歷史已清除
🧑 用戶: 你還記得我的名字嗎？
🤖 AI: 由於我是個大型語言模型，我沒有記憶功能，所以我不記得你的名字。 請告訴我你的名字，我就能記住了。


💡 現在 AI 不記得之前的對話了，因為我們清除了歷史記錄
💡 如果要重新開始有記憶的對話，請執行上面的對話測試程式碼


## 🎯 第一課重點總結

### 我們學會了什麼？

1. **安裝和設定 AI API**
   - 安裝 `google-genai` 和 `python-dotenv` 套件
   - 設定 `.env` 檔案管理敏感資訊
   - 從環境變數讀取 API 金鑰和模型設定
   - 初始化客戶端

2. **基本對話功能**
   - 使用 `client.models.generate_content()` 發送訊息
   - 動態指定模型（可隨時更換）
   - 取得 AI 回應

3. **實現對話記憶（正確格式）**
   - 使用 `Content` 和 `Part` 結構儲存對話
   - 比字串拼接更專業和結構化
   - 支援多模態擴展