# Chapter 11: 推導式與生成器 | Comprehensions and Generators

## 📖 講義內容（Lecture Notes）

**學習時數**：90 分鐘  
**難度等級**：⭐⭐⭐⭐☆

---

## 本講義架構

### Part I: 理論基礎
- 推導式的起源與動機
- Pythonic 程式設計哲學
- 推導式的語法結構

### Part II: 實作演練（11 個範例）
- 列表推導式（5 個範例）
- 字典推導式（2 個範例）
- 集合推導式（1 個範例）
- 生成器表達式（2 個範例）
- 綜合應用（1 個範例）

### Part III: 本章總結
- 知識回顧
- 常見誤區
- 自我檢核
- 延伸閱讀

---

# Part I: 理論基礎

## 1. 為什麼需要推導式？

### 傳統迴圈的問題

假設我們要建立一個包含 0-9 平方數的列表：

In [None]:
# 傳統迴圈寫法
squares = []
for i in range(10):
    squares.append(i ** 2)

print(squares)

**問題分析**：
1. 需要 4 行程式碼
2. 需要先初始化空列表
3. 語義不夠直觀（「建立列表」的意圖不明顯）

### 推導式的優勢

In [None]:
# 列表推導式寫法
squares = [i ** 2 for i in range(10)]

print(squares)

**優勢**：
1. ✅ 只需 1 行程式碼
2. ✅ 語義清晰（「建立一個列表，包含每個 i 的平方」）
3. ✅ 執行效率更高（內部優化）
4. ✅ 符合 Pythonic 風格

---

## 2. Pythonic 程式設計哲學

推導式體現了 **The Zen of Python** 的核心理念：

In [None]:
import this  # 執行這行可以看到 The Zen of Python

**與推導式相關的原則**：
- "Beautiful is better than ugly." - 推導式更簡潔優雅
- "Simple is better than complex." - 單行表達清晰意圖
- "Readability counts." - 可讀性很重要（但別濫用）

---

## 3. 推導式的語法結構

### 列表推導式（List Comprehension）

```python
# 基本語法
[expression for item in iterable]

# 加入條件篩選
[expression for item in iterable if condition]

# 加入條件表達式
[expr1 if condition else expr2 for item in iterable]

# 巢狀推導式
[expression for item1 in iterable1 for item2 in iterable2]
```

### 字典推導式（Dict Comprehension）

```python
# 基本語法（注意：需要 key: value）
{key: value for item in iterable}

# 加入條件篩選
{key: value for item in iterable if condition}
```

### 集合推導式（Set Comprehension）

```python
# 基本語法（自動去重）
{expression for item in iterable}
```

### 生成器表達式（Generator Expression）

```python
# 基本語法（使用圓括號，惰性求值）
(expression for item in iterable)
```

---

# Part II: 實作演練

## 列表推導式（List Comprehension）

### 範例 1：基本列表推導式 - 平方數

In [None]:
# 建立 1-10 的平方數列表

# 傳統迴圈
squares_loop = []
for i in range(1, 11):
    squares_loop.append(i ** 2)

# 列表推導式
squares_comp = [i ** 2 for i in range(1, 11)]

print("傳統迴圈：", squares_loop)
print("推導式：  ", squares_comp)
print("結果相同：", squares_loop == squares_comp)

**重點**：
- 推導式的閱讀順序：「對於 range(1, 11) 中的每個 i，計算 i ** 2」
- 結果完全相同，但推導式更簡潔

---

### 範例 2：條件篩選 - 偶數過濾

In [None]:
# 只保留 0-19 中的偶數

# 傳統迴圈
evens_loop = []
for i in range(20):
    if i % 2 == 0:
        evens_loop.append(i)

# 列表推導式（條件篩選）
evens_comp = [i for i in range(20) if i % 2 == 0]

print("傳統迴圈：", evens_loop)
print("推導式：  ", evens_comp)
print("結果相同：", evens_loop == evens_comp)

**重點**：
- `if` 條件放在最後，用於**篩選**元素
- 只有滿足條件的元素才會被加入列表
- 閱讀順序：「對於 range(20) 中的每個 i，如果 i 是偶數，則保留 i」

---

### 範例 3：條件表達式 - if-else

In [None]:
# 偶數保留原值，奇數改為 0

# 傳統迴圈
numbers_loop = []
for i in range(10):
    if i % 2 == 0:
        numbers_loop.append(i)
    else:
        numbers_loop.append(0)

# 列表推導式（條件表達式）
numbers_comp = [i if i % 2 == 0 else 0 for i in range(10)]

print("傳統迴圈：", numbers_loop)
print("推導式：  ", numbers_comp)
print("結果相同：", numbers_loop == numbers_comp)

**重點**：
- `if-else` 放在**最前面**，用於**改變元素的值**
- 這是三元運算子（ternary operator）的應用
- 語法：`value_if_true if condition else value_if_false`

**對比**：
```python
# 篩選條件（if 在後）- 選擇哪些元素
[i for i in range(10) if i % 2 == 0]  # [0, 2, 4, 6, 8]

# 條件表達式（if-else 在前）- 改變元素的值
[i if i % 2 == 0 else 0 for i in range(10)]  # [0, 0, 2, 0, 4, 0, 6, 0, 8, 0]
```

---

### 範例 4：字串處理 - 大寫轉換

In [None]:
# 將水果名稱轉換為大寫
fruits = ['apple', 'banana', 'cherry', 'date']

# 傳統迴圈
upper_fruits_loop = []
for fruit in fruits:
    upper_fruits_loop.append(fruit.upper())

# 列表推導式
upper_fruits_comp = [fruit.upper() for fruit in fruits]

print("原始列表：", fruits)
print("大寫列表：", upper_fruits_comp)

In [None]:
# 只保留長度大於 5 的水果名稱
long_fruits = [fruit for fruit in fruits if len(fruit) > 5]
print("長名稱水果：", long_fruits)

**重點**：
- 可以對每個元素呼叫方法（如 `.upper()`）
- 可以使用內建函數（如 `len()`）進行條件判斷

---

### 範例 5：巢狀列表推導式 - 九九乘法表

In [None]:
# 建立 3x3 的九九乘法表

# 傳統迴圈
multiplication_table_loop = []
for i in range(1, 4):
    row = []
    for j in range(1, 4):
        row.append(i * j)
    multiplication_table_loop.append(row)

# 巢狀列表推導式
multiplication_table_comp = [[i * j for j in range(1, 4)] for i in range(1, 4)]

print("傳統迴圈：")
for row in multiplication_table_loop:
    print(row)

print("\n巢狀推導式：")
for row in multiplication_table_comp:
    print(row)

**重點**：
- 巢狀推導式的順序：**外層在前，內層在後**
- `[[i * j for j in range(1, 4)] for i in range(1, 4)]`
  - 外層 `for i in range(1, 4)` 產生 3 個元素
  - 每個元素是內層 `[i * j for j in range(1, 4)]` 的結果

**可讀性警告**：
- ⚠️ 巢狀推導式容易降低可讀性
- 建議：超過 2 層請使用傳統迴圈

---

## 字典推導式（Dict Comprehension）

### 範例 6：建立平方數字典

In [None]:
# 建立數字與其平方的對應字典

# 傳統迴圈
square_dict_loop = {}
for i in range(1, 6):
    square_dict_loop[i] = i ** 2

# 字典推導式
square_dict_comp = {i: i ** 2 for i in range(1, 6)}

print("傳統迴圈：", square_dict_loop)
print("推導式：  ", square_dict_comp)

**重點**：
- 字典推導式的語法：`{key: value for item in iterable}`
- 必須同時提供 **key** 和 **value**（用冒號分隔）
- 如果省略冒號，會變成集合推導式

---

### 範例 7：字典的鍵值互換

In [None]:
# 將學生姓名與成績的對應關係互換
student_scores = {'Alice': 85, 'Bob': 92, 'Charlie': 78}

# 傳統迴圈
score_students_loop = {}
for name, score in student_scores.items():
    score_students_loop[score] = name

# 字典推導式
score_students_comp = {score: name for name, score in student_scores.items()}

print("原始字典：", student_scores)
print("鍵值互換：", score_students_comp)

In [None]:
# 只保留及格（>=60）的學生
passing_students = {name: score for name, score in student_scores.items() if score >= 60}
print("及格學生：", passing_students)

**重點**：
- 使用 `.items()` 同時取得鍵和值
- 可以自由決定哪個作為 key、哪個作為 value
- 同樣可以使用條件篩選

---

## 集合推導式（Set Comprehension）

### 範例 8：去除重複的平方數

In [None]:
# 計算 -5 到 5 的平方數（會有重複）
numbers = range(-5, 6)

# 使用列表推導式（有重複）
squares_list = [i ** 2 for i in numbers]
print("列表（有重複）：", squares_list)

# 使用集合推導式（自動去重）
squares_set = {i ** 2 for i in numbers}
print("集合（自動去重）：", squares_set)
print("排序後：", sorted(squares_set))

**重點**：
- 集合推導式使用 **大括號 `{}`**
- 沒有冒號（有冒號就是字典推導式）
- 自動去除重複元素（集合的特性）
- 結果是**無序**的（Python 3.7+ 字典有序，但集合仍無序）

---

## 生成器表達式（Generator Expression）

### 範例 9：記憶體效率比較

In [None]:
import sys

# 列表推導式（立即建立所有元素）
list_comp = [i ** 2 for i in range(1000000)]
print(f"列表推導式記憶體使用：{sys.getsizeof(list_comp):,} bytes")

# 生成器表達式（惰性求值）
gen_exp = (i ** 2 for i in range(1000000))
print(f"生成器表達式記憶體使用：{sys.getsizeof(gen_exp):,} bytes")

print(f"\n記憶體節省：{(sys.getsizeof(list_comp) - sys.getsizeof(gen_exp)) / sys.getsizeof(list_comp) * 100:.2f}%")

**重點**：
- 生成器表達式使用 **圓括號 `()`**
- **惰性求值**（Lazy Evaluation）：需要時才計算值
- 記憶體使用極小（不預先建立所有元素）
- 適合處理大型資料集

---

### 範例 10：生成器只能迭代一次

In [None]:
# 生成器表達式
gen = (i ** 2 for i in range(5))

print("第一次迭代：", list(gen))
print("第二次迭代：", list(gen))  # 空列表！

# 列表推導式（可以多次迭代）
lst = [i ** 2 for i in range(5)]
print("\n第一次迭代：", list(lst))
print("第二次迭代：", list(lst))  # 仍然有資料

**重點**：
- 生成器是**一次性**的（exhausted after one iteration）
- 迭代完畢後，生成器會被耗盡
- 列表可以重複迭代（因為資料已經存在記憶體中）

**使用時機**：
- 需要多次迭代 → 使用列表推導式
- 只迭代一次 + 資料量大 → 使用生成器表達式

---

## 綜合應用

### 範例 11：效能對比 - 推導式 vs 傳統迴圈

In [None]:
import time

# 測試建立 100 萬個平方數的時間

# 傳統迴圈
start = time.time()
squares_loop = []
for i in range(1000000):
    squares_loop.append(i ** 2)
loop_time = time.time() - start

# 列表推導式
start = time.time()
squares_comp = [i ** 2 for i in range(1000000)]
comp_time = time.time() - start

print(f"傳統迴圈：{loop_time:.4f} 秒")
print(f"列表推導式：{comp_time:.4f} 秒")
print(f"\n推導式快了：{(loop_time - comp_time) / loop_time * 100:.2f}%")

**重點**：
- 推導式通常比傳統迴圈快 20-30%
- 原因：內部優化、減少函數呼叫（`append`）
- 但可讀性永遠優先於效能！

---

# Part III: 本章總結

## 📊 知識回顧

### 四種推導式比較

| 類型 | 語法 | 結果類型 | 特點 |
|:-----|:-----|:---------|:-----|
| 列表推導式 | `[expr for item in iterable]` | `list` | 最常用 |
| 字典推導式 | `{k: v for item in iterable}` | `dict` | 需要鍵值對 |
| 集合推導式 | `{expr for item in iterable}` | `set` | 自動去重 |
| 生成器表達式 | `(expr for item in iterable)` | `generator` | 惰性求值 |

### 條件的兩種用法

```python
# 1. 篩選條件（if 在後）- 選擇哪些元素
[x for x in range(10) if x % 2 == 0]

# 2. 條件表達式（if-else 在前）- 改變元素的值
[x if x % 2 == 0 else 0 for x in range(10)]
```

---

## ⚠️ 常見誤區

### 誤區 1：語法順序錯誤

In [None]:
# ✗ 錯誤：for 在前
# [for i in range(10) i**2]  # SyntaxError

# ✓ 正確：表達式在前
result = [i**2 for i in range(10)]
print(result)

### 誤區 2：字典推導式忘記冒號

In [None]:
# ✗ 錯誤：這是集合推導式，不是字典
wrong_dict = {i**2 for i in range(5)}
print("集合：", wrong_dict, type(wrong_dict))

# ✓ 正確：字典需要 key: value
correct_dict = {i: i**2 for i in range(5)}
print("字典：", correct_dict, type(correct_dict))

### 誤區 3：濫用巢狀推導式

In [None]:
# ⚠️ 不好：過於複雜，難以閱讀
bad_example = [[i*j for j in range(3) if j > 0] for i in range(3) if i % 2 == 0]

# ✓ 更好：使用傳統迴圈，清晰易懂
good_example = []
for i in range(3):
    if i % 2 == 0:
        row = []
        for j in range(3):
            if j > 0:
                row.append(i * j)
        good_example.append(row)

print("推導式：", bad_example)
print("傳統迴圈：", good_example)

---

## ✅ 自我檢核

完成本講義後，你應該能夠：

### 基礎能力
- [ ] 寫出基本的列表推導式
- [ ] 使用條件篩選元素
- [ ] 區分推導式與傳統迴圈的差異

### 進階能力
- [ ] 實作字典推導式
- [ ] 使用條件表達式（if-else）
- [ ] 實作巢狀推導式

### 應用能力
- [ ] 選擇最適合的推導式類型
- [ ] 使用生成器表達式處理大型資料
- [ ] 評估推導式的可讀性

---

## 📚 延伸閱讀

### 官方文件
- [PEP 202 - List Comprehensions](https://www.python.org/dev/peps/pep-0202/)
- [PEP 274 - Dict Comprehensions](https://www.python.org/dev/peps/pep-0274/)
- [Python Tutorial - Data Structures](https://docs.python.org/3/tutorial/datastructures.html#list-comprehensions)

### 進階主題
- 生成器函數（`yield`）
- `map()`, `filter()`, `reduce()` 函數
- `itertools` 模組
- 函數式編程（Functional Programming）

---

## 💡 學習建議

1. **多練習**：將之前寫的迴圈改寫為推導式
2. **平衡性**：推導式是工具，不是目的
3. **可讀性優先**：當推導式讓程式碼更難理解時，使用傳統迴圈
4. **效能意識**：理解生成器的記憶體優勢

> "Simple is better than complex." - The Zen of Python

---

**恭喜你完成本講義！** 🎉  
接下來請前往：
- `02-worked-examples.ipynb` - 詳解範例
- `03-practice.ipynb` - 課堂練習