# Chapter 11: 推導式與生成器 - 詳解範例

## 📝 Worked Examples（詳解範例）

**學習時數**：40 分鐘  
**範例數量**：5 個實用案例

---

## 本檔案架構

每個範例都包含：
1. **問題描述**：清楚說明要解決的問題
2. **需求分析**：拆解問題的關鍵步驟
3. **傳統解法**：使用迴圈的實作
4. **推導式解法**：使用推導式的實作
5. **測試驗證**：確認結果正確
6. **重點說明**：解釋關鍵概念

---

### 範例清單
1. 成績及格篩選器（列表推導式 + 條件）
2. 學生成績字典建立（zip + 字典推導式）
3. 矩陣轉置（巢狀列表推導式）
4. 單字出現次數統計（字典推導式）
5. 大型數據處理（生成器 vs 列表）

---

## 範例 1：成績及格篩選器

### 問題描述
學校有一個學生成績列表，需要篩選出所有及格（>=60分）的成績，並將這些成績加 5 分作為平時分獎勵。

### 需求分析
1. 輸入：學生成績列表
2. 篩選：只保留 >= 60 分的成績
3. 轉換：每個成績 + 5 分
4. 輸出：獎勵後的及格成績列表

In [None]:
# 測試資料
scores = [85, 42, 73, 55, 90, 68, 47, 81, 64]
print("原始成績：", scores)

### 解法 1：傳統迴圈

In [None]:
# 傳統迴圈實作
passing_scores_loop = []
for score in scores:
    if score >= 60:  # 篩選及格成績
        passing_scores_loop.append(score + 5)  # 加 5 分

print("傳統迴圈結果：", passing_scores_loop)

### 解法 2：列表推導式

In [None]:
# 列表推導式實作
passing_scores_comp = [score + 5 for score in scores if score >= 60]

print("推導式結果：  ", passing_scores_comp)

### 測試驗證

In [None]:
# 驗證結果相同
print("結果相同：", passing_scores_loop == passing_scores_comp)

# 詳細對照
print("\n原始成績 → 及格成績（+5分）：")
for original, boosted in zip([s for s in scores if s >= 60], passing_scores_comp):
    print(f"  {original} → {boosted}")

### 重點說明

1. **語法結構**：`[expression for item in iterable if condition]`
   - `score + 5`：表達式（對元素做什麼）
   - `for score in scores`：迭代來源
   - `if score >= 60`：篩選條件

2. **執行順序**：
   - 從 `scores` 取出每個 `score`
   - 檢查 `score >= 60`
   - 如果通過，計算 `score + 5` 並加入結果

3. **優勢**：
   - 1 行 vs 4 行程式碼
   - 語義清晰（「取出及格成績，每個加 5」）
   - 效能更好（內部優化）

---

## 範例 2：學生成績字典建立

### 問題描述
有兩個列表：學生姓名列表和成績列表。需要建立一個字典，將姓名與成績對應起來，但只保留及格（>=60分）的學生。

### 需求分析
1. 輸入：姓名列表、成績列表
2. 配對：使用 `zip()` 將姓名與成績配對
3. 篩選：只保留及格的學生
4. 輸出：{姓名: 成績} 字典

In [None]:
# 測試資料
names = ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Frank']
scores = [85, 42, 73, 55, 90, 68]

print("學生姓名：", names)
print("學生成績：", scores)

### 解法 1：傳統迴圈

In [None]:
# 傳統迴圈實作
student_dict_loop = {}
for name, score in zip(names, scores):
    if score >= 60:  # 只保留及格學生
        student_dict_loop[name] = score

print("傳統迴圈結果：", student_dict_loop)

### 解法 2：字典推導式

In [None]:
# 字典推導式實作
student_dict_comp = {name: score for name, score in zip(names, scores) if score >= 60}

print("推導式結果：  ", student_dict_comp)

### 測試驗證

In [None]:
# 驗證結果相同
print("結果相同：", student_dict_loop == student_dict_comp)

# 詳細輸出
print("\n及格學生名單：")
for name, score in student_dict_comp.items():
    print(f"  {name}: {score}分")

print(f"\n總共 {len(student_dict_comp)} 位學生及格")

### 進階應用：成績等級字典

In [None]:
# 使用條件表達式建立成績等級字典
def get_grade(score):
    if score >= 90:
        return 'A'
    elif score >= 80:
        return 'B'
    elif score >= 70:
        return 'C'
    elif score >= 60:
        return 'D'
    else:
        return 'F'

# 字典推導式 + 函數呼叫
grade_dict = {name: get_grade(score) for name, score in zip(names, scores)}

print("成績等級：", grade_dict)

### 重點說明

1. **字典推導式語法**：`{key: value for item in iterable if condition}`
   - 必須同時提供 key 和 value（用冒號分隔）
   - 可以使用 `zip()` 同時迭代多個列表

2. **`zip()` 函數**：
   - 將多個可迭代物件配對
   - `zip(names, scores)` → `[('Alice', 85), ('Bob', 42), ...]`

3. **實用技巧**：
   - 推導式中可以呼叫函數（如 `get_grade(score)`）
   - 適合快速建立映射關係

---

## 範例 3：矩陣轉置

### 問題描述
給定一個 3x4 的矩陣（二維列表），需要將其轉置為 4x3 矩陣。

### 需求分析
1. 輸入：3x4 矩陣（3 列 4 行）
2. 轉置：第 i 列第 j 行 → 第 j 列第 i 行
3. 輸出：4x3 矩陣（4 列 3 行）

**範例**：
```
原始矩陣：          轉置矩陣：
[1, 2, 3, 4]       [1, 5, 9]
[5, 6, 7, 8]  →    [2, 6, 10]
[9, 10, 11, 12]    [3, 7, 11]
                   [4, 8, 12]
```

In [None]:
# 測試資料
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
]

print("原始矩陣（3x4）：")
for row in matrix:
    print(row)

### 解法 1：傳統迴圈

In [None]:
# 傳統迴圈實作
transposed_loop = []
for j in range(4):  # 新矩陣有 4 列
    new_row = []
    for i in range(3):  # 每列有 3 個元素
        new_row.append(matrix[i][j])
    transposed_loop.append(new_row)

print("\n傳統迴圈結果（4x3）：")
for row in transposed_loop:
    print(row)

### 解法 2：巢狀列表推導式

In [None]:
# 巢狀列表推導式實作
transposed_comp = [[matrix[i][j] for i in range(3)] for j in range(4)]

print("推導式結果（4x3）：")
for row in transposed_comp:
    print(row)

### 解法 3：使用 `zip()` 的優雅解法

In [None]:
# 使用 zip() + * 解包（最 Pythonic 的方式）
transposed_zip = [list(row) for row in zip(*matrix)]

print("zip() 解法結果（4x3）：")
for row in transposed_zip:
    print(row)

### 測試驗證

In [None]:
# 驗證所有解法結果相同
print("所有解法結果相同：", transposed_loop == transposed_comp == transposed_zip)

# 驗證矩陣維度
print(f"\n原始矩陣維度：{len(matrix)} x {len(matrix[0])}")
print(f"轉置矩陣維度：{len(transposed_comp)} x {len(transposed_comp[0])}")

### 重點說明

1. **巢狀推導式的順序**：
   ```python
   [[matrix[i][j] for i in range(3)] for j in range(4)]
   #  ↑ 內層（生成每一列）    ↑ 外層（生成多列）
   ```
   - 外層 `for j in range(4)`：生成 4 個元素（4 列）
   - 內層 `for i in range(3)`：每個元素是一個包含 3 個元素的列表

2. **`zip(*matrix)` 解法**：
   - `*matrix` 解包：`zip([1,2,3,4], [5,6,7,8], [9,10,11,12])`
   - `zip()` 配對：`[(1,5,9), (2,6,10), (3,7,11), (4,8,12)]`
   - 最優雅的矩陣轉置方式！

3. **可讀性權衡**：
   - 簡單矩陣：使用 `zip(*matrix)` 最優雅
   - 需要複雜處理：使用傳統迴圈更清晰

---

## 範例 4：單字出現次數統計

### 問題描述
給定一段文字，統計每個單字出現的次數，但只保留出現次數大於 1 的單字。

### 需求分析
1. 輸入：一段英文文字
2. 分割：將文字切分為單字列表
3. 統計：計算每個單字出現次數
4. 篩選：只保留出現次數 > 1 的單字
5. 輸出：{單字: 次數} 字典

In [None]:
# 測試資料
text = "python is great python is simple python is powerful simple is good"
words = text.split()

print("原始文字：", text)
print("單字列表：", words)

### 解法 1：傳統迴圈

In [None]:
# 步驟 1：統計所有單字次數
word_count_all = {}
for word in words:
    if word in word_count_all:
        word_count_all[word] += 1
    else:
        word_count_all[word] = 1

print("所有單字次數：", word_count_all)

# 步驟 2：篩選出現次數 > 1 的單字
word_count_loop = {}
for word, count in word_count_all.items():
    if count > 1:
        word_count_loop[word] = count

print("出現多次的單字：", word_count_loop)

### 解法 2：字典推導式

In [None]:
# 使用字典推導式篩選
word_count_comp = {word: count for word, count in word_count_all.items() if count > 1}

print("推導式結果：", word_count_comp)

### 解法 3：集合推導式 + 字典推導式（完整一行）

In [None]:
# 完全使用推導式（進階技巧）
word_count_advanced = {word: words.count(word) for word in set(words) if words.count(word) > 1}

print("進階推導式結果：", word_count_advanced)

### 解法 4：使用 `collections.Counter`（最佳實踐）

In [None]:
from collections import Counter

# 使用 Counter + 字典推導式
word_count_counter = Counter(words)
word_count_final = {word: count for word, count in word_count_counter.items() if count > 1}

print("Counter 結果：", word_count_final)

### 測試驗證

In [None]:
# 驗證所有解法結果相同
print("所有解法結果相同：", word_count_loop == word_count_comp == word_count_advanced == word_count_final)

# 按出現次數排序顯示
print("\n按出現次數排序：")
for word, count in sorted(word_count_final.items(), key=lambda x: x[1], reverse=True):
    print(f"  {word}: {count} 次")

### 重點說明

1. **字典推導式的篩選**：
   ```python
   {word: count for word, count in dict.items() if count > 1}
   ```
   - 使用 `.items()` 取得鍵值對
   - `if` 條件篩選符合條件的項目

2. **效能考量**：
   - `words.count(word)`：每次都掃描整個列表，O(n) × O(n) = O(n²)
   - `Counter(words)`：只掃描一次，O(n)
   - 結論：**使用 `Counter` 是最佳實踐**

3. **可讀性 vs 效能**：
   - ✓ 推薦：`Counter` + 字典推導式（清晰 + 高效）
   - ⚠️ 不推薦：`{word: words.count(word) for word in set(words)}`（效能差）

---

## 範例 5：大型數據處理（生成器 vs 列表）

### 問題描述
處理一個大型數字序列（100 萬個數字），找出所有完全平方數（如 1, 4, 9, 16, ...），並計算它們的總和。

### 需求分析
1. 輸入：0 到 1,000,000 的數字
2. 篩選：找出完全平方數
3. 計算：求總和
4. 比較：列表推導式 vs 生成器表達式

In [None]:
import math

# 判斷是否為完全平方數的函數
def is_perfect_square(n):
    """檢查 n 是否為完全平方數"""
    if n < 0:
        return False
    root = int(math.sqrt(n))
    return root * root == n

# 測試函數
test_numbers = [1, 2, 4, 9, 10, 16, 25]
print("完全平方數測試：")
for num in test_numbers:
    print(f"  {num}: {is_perfect_square(num)}")

### 解法 1：列表推導式

In [None]:
import time
import sys

# 使用列表推導式
start_time = time.time()
perfect_squares_list = [n for n in range(1000000) if is_perfect_square(n)]
total_list = sum(perfect_squares_list)
list_time = time.time() - start_time

print(f"列表推導式：")
print(f"  找到 {len(perfect_squares_list)} 個完全平方數")
print(f"  總和：{total_list}")
print(f"  執行時間：{list_time:.4f} 秒")
print(f"  記憶體使用：{sys.getsizeof(perfect_squares_list):,} bytes")

### 解法 2：生成器表達式

In [None]:
# 使用生成器表達式
start_time = time.time()
perfect_squares_gen = (n for n in range(1000000) if is_perfect_square(n))
total_gen = sum(perfect_squares_gen)
gen_time = time.time() - start_time

# 重新建立生成器以查看記憶體使用（因為已被耗盡）
perfect_squares_gen_2 = (n for n in range(1000000) if is_perfect_square(n))

print(f"\n生成器表達式：")
print(f"  總和：{total_gen}")
print(f"  執行時間：{gen_time:.4f} 秒")
print(f"  記憶體使用：{sys.getsizeof(perfect_squares_gen_2):,} bytes")

### 效能比較

In [None]:
# 比較結果
print("\n效能比較：")
print(f"  總和相同：{total_list == total_gen}")
print(f"  時間差異：生成器比列表快 {abs(list_time - gen_time):.4f} 秒")

# 記憶體比較
list_memory = sys.getsizeof(perfect_squares_list)
gen_memory = sys.getsizeof(perfect_squares_gen_2)
memory_saved = (list_memory - gen_memory) / list_memory * 100

print(f"\n記憶體使用：")
print(f"  列表：{list_memory:,} bytes")
print(f"  生成器：{gen_memory:,} bytes")
print(f"  節省：{memory_saved:.2f}%")

### 視覺化比較

In [None]:
# 簡單的視覺化比較
print("\n視覺化記憶體使用：")
print(f"列表推導式：{'█' * 50}")
print(f"生成器表達式：█")

print("\n前 20 個完全平方數：")
print(perfect_squares_list[:20])

### 重點說明

1. **生成器的優勢**：
   - **記憶體效率**：不預先建立所有元素，節省 99%+ 記憶體
   - **惰性求值**：需要時才計算，適合大型資料
   - **流式處理**：可以處理無限序列

2. **何時使用生成器**：
   - ✓ 只需迭代一次（如 `sum()`, `max()`, `min()`）
   - ✓ 資料量非常大
   - ✓ 不需要索引存取

3. **何時使用列表**：
   - ✓ 需要多次迭代
   - ✓ 需要索引存取（`lst[i]`）
   - ✓ 需要切片操作（`lst[start:end]`）
   - ✓ 資料量不大

4. **最佳實踐**：
   ```python
   # 只需計算總和 → 使用生成器
   total = sum(n for n in range(1000000) if is_perfect_square(n))
   
   # 需要多次使用 → 使用列表
   squares = [n for n in range(1000) if is_perfect_square(n)]
   total = sum(squares)
   avg = sum(squares) / len(squares)
   ```

---

## 📝 本章總結

### 五個範例回顧

| 範例 | 主題 | 關鍵技巧 |
|:-----|:-----|:---------|
| 1 | 成績篩選 | 列表推導式 + 條件篩選 |
| 2 | 字典建立 | 字典推導式 + `zip()` |
| 3 | 矩陣轉置 | 巢狀推導式 + `zip(*matrix)` |
| 4 | 單字統計 | 字典推導式 + `Counter` |
| 5 | 大型資料 | 生成器 vs 列表的記憶體效率 |

### 核心概念

1. **推導式的本質**：簡潔地表達「從集合 A 轉換/篩選為集合 B」
2. **可讀性優先**：當推導式讓程式碼更難理解時，使用傳統迴圈
3. **效能考量**：生成器適合大型資料、一次性迭代

---

## ✅ 自我檢核

完成這些範例後，你應該能夠：
- [ ] 使用列表推導式進行資料篩選與轉換
- [ ] 使用字典推導式建立映射關係
- [ ] 理解巢狀推導式的執行順序
- [ ] 選擇適當的推導式類型解決問題
- [ ] 評估生成器與列表的使用時機

---

**下一步**：
- `03-practice.ipynb` - 課堂練習
- `04-exercises.ipynb` - 課後習題