# 第 11 章：列表推導式與生成器

本章節詳細說明 Python 的推導式（Comprehension）語法和生成器（Generator），這些是 Python 最具特色且強大的功能之一。

---

## 11.1 列表推導式（List Comprehension）

列表推導式是一種簡潔、可讀性高的語法，用於建立列表。

### 基本語法

```python
# 基本結構
[表達式 for 項目 in 可迭代物件]
```

In [None]:
# 傳統 for 迴圈
squares = []
for x in range(5):
    squares.append(x ** 2)
print(f"傳統方式：{squares}")

# 列表推導式
squares = [x ** 2 for x in range(5)]
print(f"推導式：{squares}")

**JavaScript 對照**：
```javascript
const squares = [...Array(5).keys()].map(x => x ** 2);
// 或
const squares = Array.from({length: 5}, (_, x) => x ** 2);
```

### 對應 JavaScript 的 map()

In [None]:
numbers = [1, 2, 3, 4, 5]

# JavaScript: numbers.map(x => x * 2)
# Python 列表推導式
doubled = [x * 2 for x in numbers]
print(f"doubled: {doubled}")

# Python map()（較不推薦）
doubled_map = list(map(lambda x: x * 2, numbers))
print(f"map(): {doubled_map}")

In [None]:
# 更多範例
names = ["alice", "bob", "charlie"]

# 轉大寫
upper_names = [name.upper() for name in names]
print(f"大寫：{upper_names}")

# 取得長度
lengths = [len(name) for name in names]
print(f"長度：{lengths}")

# 鏈式呼叫
words = ["  hello  ", "  world  "]
cleaned_upper = [w.strip().upper() for w in words]
print(f"清理並轉大寫：{cleaned_upper}")

### 帶條件的推導式（filter）

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# JavaScript: numbers.filter(x => x % 2 === 0)
# Python 列表推導式
evens = [x for x in numbers if x % 2 == 0]
print(f"偶數：{evens}")

# 結構：[表達式 for 項目 in 可迭代物件 if 條件]

In [None]:
# 過濾空值和空白字串
words = ["apple", "", "banana", "  ", "cherry", None]

valid_words = [w for w in words if w and w.strip()]
print(f"有效單字：{valid_words}")

# 過濾並轉換
positive_squares = [x ** 2 for x in range(-5, 6) if x > 0]
print(f"正數的平方：{positive_squares}")

### 結合 map 和 filter

In [None]:
# JavaScript:
# numbers.filter(x => x > 0).map(x => x ** 2)

numbers = range(-10, 11)

# Python：結合過濾和轉換
result = [x ** 2 for x in numbers if x > 0]
print(f"正數的平方：{result}")

In [None]:
# 更複雜的範例
students = [
    {"name": "Alice", "score": 85},
    {"name": "Bob", "score": 45},
    {"name": "Charlie", "score": 92},
    {"name": "David", "score": 58},
]

# 取得及格學生的名字
passed = [s["name"] for s in students if s["score"] >= 60]
print(f"及格學生：{passed}")

# 取得及格學生的名字和分數
passed_info = [
    f"{s['name']}: {s['score']}"
    for s in students
    if s["score"] >= 60
]
print(f"及格學生資訊：{passed_info}")

### 條件表達式（三元運算）

In [None]:
numbers = [1, 2, 3, 4, 5]

# 對每個元素套用條件轉換
# [真值 if 條件 else 假值 for 項目 in 可迭代物件]
labels = ["偶數" if x % 2 == 0 else "奇數" for x in numbers]
print(f"標籤：{labels}")

In [None]:
# 注意位置差異！
# if 在 for 後面：過濾（只有符合條件的才會進入結果）
# if-else 在 for 前面：轉換（每個元素都會有結果）

# 過濾：只取偶數
filtered = [x for x in range(10) if x % 2 == 0]
print(f"過濾（if 在後）：{filtered}")

# 轉換：偶數保持，奇數變負
transformed = [x if x % 2 == 0 else -x for x in range(5)]
print(f"轉換（if-else 在前）：{transformed}")

In [None]:
# 實際應用：資料清理
data = [1, None, 2, "", 3, 0, 4]

# 過濾空字串，將 None 轉為 0
cleaned = [x if x is not None else 0 for x in data if x != ""]
print(f"清理後：{cleaned}")

### 巢狀迴圈

In [None]:
# 雙重迴圈 - 傳統寫法
pairs = []
for x in range(3):
    for y in range(3):
        pairs.append((x, y))
print(f"傳統：{pairs}")

# 列表推導式
pairs = [(x, y) for x in range(3) for y in range(3)]
print(f"推導式：{pairs}")

In [None]:
# 矩陣扁平化
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

# 傳統寫法
flat = []
for row in matrix:
    for num in row:
        flat.append(num)
print(f"傳統：{flat}")

# 列表推導式
flat = [num for row in matrix for num in row]
print(f"推導式：{flat}")

# JavaScript 對照：matrix.flat()

### 巢狀推導式（建立多維結構）

In [None]:
# 建立 3x3 零矩陣
matrix = [[0 for _ in range(3)] for _ in range(3)]
print(f"零矩陣：{matrix}")

# 建立乘法表（部分）
multiplication_table = [
    [i * j for j in range(1, 5)]
    for i in range(1, 5)
]
print("\n乘法表：")
for row in multiplication_table:
    print(row)

In [None]:
# 矩陣轉置
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

transposed = [[row[i] for row in matrix] for i in range(len(matrix[0]))]

print("原矩陣：")
for row in matrix:
    print(row)

print("\n轉置後：")
for row in transposed:
    print(row)

### 推導式 vs map/filter

In [None]:
numbers = [1, 2, 3, 4, 5]

# 推導式（推薦）
result1 = [x ** 2 for x in numbers if x % 2 == 0]

# map + filter
result2 = list(map(lambda x: x ** 2, filter(lambda x: x % 2 == 0, numbers)))

print(f"推導式：{result1}")
print(f"map+filter：{result2}")

# 推導式優點：
# 1. 可讀性更高
# 2. 通常效能更好
# 3. 不需要 lambda
# 4. 可以直接處理多重迴圈

---

## 11.2 字典推導式（Dict Comprehension）

### 基本語法

```python
# 基本結構
{鍵: 值 for 項目 in 可迭代物件}
```

In [None]:
# 從列表建立字典
names = ["alice", "bob", "charlie"]
name_lengths = {name: len(name) for name in names}
print(f"名字長度：{name_lengths}")

# 從兩個列表建立字典
keys = ["a", "b", "c"]
values = [1, 2, 3]
my_dict = {k: v for k, v in zip(keys, values)}
print(f"組合字典：{my_dict}")

# JavaScript 對照：
# const obj = Object.fromEntries(keys.map((k, i) => [k, values[i]]));

### 帶條件的字典推導式

In [None]:
# 過濾
numbers = {"a": 1, "b": 2, "c": 3, "d": 4, "e": 5}
evens = {k: v for k, v in numbers.items() if v % 2 == 0}
print(f"偶數：{evens}")

# 轉換鍵
original = {"name": "Alice", "age": 30}
upper_keys = {k.upper(): v for k, v in original.items()}
print(f"大寫鍵：{upper_keys}")

# 轉換值
prices = {"apple": 100, "banana": 50, "cherry": 200}
discounted = {k: v * 0.8 for k, v in prices.items()}
print(f"打折後：{discounted}")

### 實際應用範例

In [None]:
# 反轉字典
original = {"a": 1, "b": 2, "c": 3}
reversed_dict = {v: k for k, v in original.items()}
print(f"反轉：{reversed_dict}")

# 計算單字長度
words = ["apple", "banana", "cherry"]
word_lengths = {word: len(word) for word in words}
print(f"單字長度：{word_lengths}")

In [None]:
# 篩選字典
config = {
    "debug": True,
    "host": "localhost",
    "port": 8080,
    "secret": "password123",
    "api_key": "abc123"
}

# 排除敏感資訊
safe_config = {
    k: v for k, v in config.items()
    if k not in ["secret", "api_key"]
}
print(f"安全設定：{safe_config}")

# 只保留字串值
string_values = {k: v for k, v in config.items() if isinstance(v, str)}
print(f"字串值：{string_values}")

### 巢狀字典推導式

In [None]:
# 建立巢狀字典（乘法表）
matrix_dict = {
    i: {j: i * j for j in range(1, 4)}
    for i in range(1, 4)
}
print("巢狀字典：")
for k, v in matrix_dict.items():
    print(f"  {k}: {v}")

In [None]:
# 扁平化巢狀字典
nested = {"a": {"x": 1, "y": 2}, "b": {"x": 3, "y": 4}}

flattened = {
    f"{outer}_{inner}": value
    for outer, inner_dict in nested.items()
    for inner, value in inner_dict.items()
}
print(f"扁平化：{flattened}")

---

## 11.3 集合推導式（Set Comprehension）

In [None]:
# 基本結構
# {表達式 for 項目 in 可迭代物件}

# 建立集合（自動去除重複）
numbers = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
unique_squares = {x ** 2 for x in numbers}
print(f"唯一平方數：{unique_squares}")

In [None]:
# 從字串取得唯一字元
text = "hello world"
unique_chars = {char for char in text if char != " "}
print(f"唯一字元：{unique_chars}")

# 帶條件的集合推導式
numbers = range(-5, 6)
positive_evens = {x for x in numbers if x > 0 and x % 2 == 0}
print(f"正偶數：{positive_evens}")

---

## 11.4 生成器表達式（Generator Expression）

生成器表達式使用小括號，產生的是生成器物件而非列表。

### 基本語法

In [None]:
import sys

# 列表推導式：立即產生所有元素
squares_list = [x ** 2 for x in range(10000)]

# 生成器表達式：惰性求值，一次產生一個元素
squares_gen = (x ** 2 for x in range(10000))

print(f"列表類型：{type(squares_list)}")
print(f"生成器類型：{type(squares_gen)}")

# 記憶體使用差異
print(f"\n列表大小：{sys.getsizeof(squares_list):,} bytes")
print(f"生成器大小：{sys.getsizeof(squares_gen):,} bytes")

### 使用生成器

In [None]:
# 建立生成器
gen = (x ** 2 for x in range(5))

# 逐一取得值
print(f"第 1 個：{next(gen)}")
print(f"第 2 個：{next(gen)}")
print(f"第 3 個：{next(gen)}")

# 使用 for 迴圈取得剩餘值
print("剩餘值：")
for value in gen:
    print(f"  {value}")

In [None]:
# 注意：生成器只能迭代一次
gen = (x for x in range(3))

print(f"第一次 list(gen)：{list(gen)}")
print(f"第二次 list(gen)：{list(gen)}")  # 空的！已經耗盡

### 生成器與內建函式

In [None]:
# 很多內建函式接受生成器
numbers = range(1, 101)

# sum - 不需要先建立列表
total = sum(x ** 2 for x in numbers)
print(f"1-100 平方和：{total}")

# max / min
max_square = max(x ** 2 for x in range(-10, 11))
print(f"最大平方：{max_square}")

# any / all
has_even = any(x % 2 == 0 for x in [1, 3, 5, 7, 8])
print(f"有偶數：{has_even}")

all_positive = all(x > 0 for x in [1, 2, 3, 4, 5])
print(f"全部正數：{all_positive}")

In [None]:
# join（需要字串生成器）
result = ", ".join(str(x) for x in range(5))
print(f"join 結果：{result}")

# 注意：傳給函式時可以省略外層括號
# sum(x ** 2 for x in range(10)) 不需要 sum((x ** 2 for x in range(10)))

### 何時使用生成器表達式

| 使用列表推導式 | 使用生成器表達式 |
|--------------|----------------|
| 需要多次遍歷結果 | 只需要遍歷一次 |
| 需要索引存取 | 資料量很大 |
| 結果集較小 | 作為函式參數 |

---

## 11.5 生成器函式（Generator Function）

使用 `yield` 關鍵字定義的函式。

### 基本語法

In [None]:
# 生成器函式
def count_up_to(n):
    """產生 1 到 n 的數字"""
    i = 1
    while i <= n:
        yield i  # 暫停並回傳值
        i += 1

# 呼叫生成器函式會回傳生成器物件
counter = count_up_to(5)
print(f"類型：{type(counter)}")

# 使用 next() 取得值
print(f"next(): {next(counter)}")
print(f"next(): {next(counter)}")

# 使用 for 迴圈
print("for 迴圈：")
for num in count_up_to(5):
    print(f"  {num}")

### yield vs return

In [None]:
# return：結束函式，回傳一個值（一次性）
def get_squares_list(n):
    result = []
    for i in range(n):
        result.append(i ** 2)
    return result  # 一次回傳所有值

# yield：暫停函式，回傳一個值，下次呼叫從暫停處繼續
def get_squares_generator(n):
    for i in range(n):
        yield i ** 2  # 每次回傳一個值

# 使用
squares_list = get_squares_list(5)      # 立即計算所有值
squares_gen = get_squares_generator(5)  # 惰性計算

print(f"list 結果：{squares_list}")
print(f"generator 結果：{list(squares_gen)}")

### 生成器的狀態

In [None]:
def stateful_generator():
    print("開始")
    yield 1
    print("繼續")
    yield 2
    print("再繼續")
    yield 3
    print("結束")

gen = stateful_generator()

print(f"=== 第一次 next() ===")
print(f"值：{next(gen)}")

print(f"\n=== 第二次 next() ===")
print(f"值：{next(gen)}")

print(f"\n=== 第三次 next() ===")
print(f"值：{next(gen)}")

### 無限生成器

In [None]:
def infinite_counter(start=0):
    """無限計數器"""
    n = start
    while True:
        yield n
        n += 1

# 使用（需要手動停止）
counter = infinite_counter()
for i, num in enumerate(counter):
    print(num, end=" ")
    if i >= 9:
        break
print()

In [None]:
# 費氏數列生成器
def fibonacci():
    """無限費氏數列"""
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b

# 取前 10 個費氏數
fib = fibonacci()
first_10 = [next(fib) for _ in range(10)]
print(f"前 10 個費氏數：{first_10}")

### yield from（委派生成器）

In [None]:
# 將生成任務委派給另一個生成器
def chain(*iterables):
    """串接多個可迭代物件"""
    for iterable in iterables:
        yield from iterable

# 使用
result = list(chain([1, 2], [3, 4], [5, 6]))
print(f"chain 結果：{result}")

In [None]:
# 遞迴扁平化
def flatten(nested):
    """遞迴扁平化巢狀列表"""
    for item in nested:
        if isinstance(item, list):
            yield from flatten(item)
        else:
            yield item

nested = [1, [2, 3, [4, 5]], 6, [7, [8, 9]]]
print(f"扁平化：{list(flatten(nested))}")

### 生成器的方法

In [None]:
def echo_generator():
    """可以接收值的生成器"""
    while True:
        received = yield
        print(f"收到：{received}")

gen = echo_generator()
next(gen)  # 啟動生成器（執行到第一個 yield）
gen.send("Hello")
gen.send("World")
gen.close()  # 關閉生成器

---

## 11.6 實際應用範例

### 讀取大檔案

In [None]:
def read_lines(filename):
    """逐行讀取檔案（生成器）"""
    with open(filename) as f:
        for line in f:
            yield line.strip()

# 這樣不會一次載入整個檔案到記憶體
# for line in read_lines("huge_file.txt"):
#     process(line)

print("逐行讀取範例（適用於大檔案）")

### 資料管道

In [None]:
def read_data(source):
    """讀取資料"""
    for item in source:
        yield item

def filter_valid(data):
    """過濾有效資料"""
    for item in data:
        if item.get("valid"):
            yield item

def transform(data):
    """轉換資料"""
    for item in data:
        yield {
            "id": item["id"],
            "value": item["value"] * 2
        }

# 建立管道
source = [
    {"id": 1, "value": 10, "valid": True},
    {"id": 2, "value": 20, "valid": False},
    {"id": 3, "value": 30, "valid": True},
]

# 連接管道
pipeline = transform(filter_valid(read_data(source)))

# 執行管道
print("資料管道結果：")
for item in pipeline:
    print(f"  {item}")

### 滑動視窗

In [None]:
from collections import deque

def sliding_window(iterable, size):
    """產生滑動視窗"""
    iterator = iter(iterable)
    window = deque(maxlen=size)

    # 填滿第一個視窗
    for _ in range(size):
        window.append(next(iterator))
    yield tuple(window)

    # 滑動
    for item in iterator:
        window.append(item)
        yield tuple(window)

# 使用
data = [1, 2, 3, 4, 5, 6, 7]
print("滑動視窗 (size=3)：")
for window in sliding_window(data, 3):
    print(f"  {window}")

In [None]:
# 計算移動平均
def moving_average(iterable, size):
    """計算移動平均"""
    for window in sliding_window(iterable, size):
        yield sum(window) / len(window)

data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
averages = list(moving_average(data, 3))
print(f"移動平均：{averages}")

### 批次處理

In [None]:
def batch(iterable, size):
    """將可迭代物件分成批次"""
    batch_list = []
    for item in iterable:
        batch_list.append(item)
        if len(batch_list) == size:
            yield batch_list
            batch_list = []
    if batch_list:  # 最後一批（可能不滿）
        yield batch_list

# 使用
items = range(10)
print("批次處理 (size=3)：")
for b in batch(items, 3):
    print(f"  {b}")

---

## 11.7 效能比較

In [None]:
import sys
import time

n = 100000

# 記憶體比較
print("=== 記憶體比較 ===")

# 列表：佔用大量記憶體
list_comp = [x ** 2 for x in range(n)]
print(f"列表：{sys.getsizeof(list_comp):,} bytes")

# 生成器：只佔用少量記憶體
gen_exp = (x ** 2 for x in range(n))
print(f"生成器：{sys.getsizeof(gen_exp):,} bytes")

In [None]:
import time

n = 1000000

print("=== 速度比較（計算總和）===")

# 列表推導式
start = time.time()
result = sum([x ** 2 for x in range(n)])
print(f"列表推導式：{time.time() - start:.4f} 秒")

# 生成器表達式
start = time.time()
result = sum(x ** 2 for x in range(n))
print(f"生成器表達式：{time.time() - start:.4f} 秒")

print("\n選擇指南：")
print("• 小資料集 + 需要多次存取 → 列表推導式")
print("• 大資料集 + 只遍歷一次 → 生成器")
print("• 作為函式參數 → 生成器")
print("• 需要索引存取 → 列表推導式")

---

## 練習題

### 練習 1：列表推導式

將以下 JavaScript 程式碼轉換為 Python 列表推導式：

```javascript
// 1. 取得偶數的平方
const squares = [1,2,3,4,5,6,7,8,9,10]
    .filter(x => x % 2 === 0)
    .map(x => x ** 2);

// 2. 扁平化二維陣列
const flat = [[1,2],[3,4],[5,6]].flat();

// 3. 取得物件陣列中特定屬性
const names = [{name: 'Alice'}, {name: 'Bob'}]
    .map(x => x.name);
```

In [None]:
# 練習 1：你的程式碼

# 1. 取得偶數的平方
# squares = ???

# 2. 扁平化二維陣列
# flat = ???

# 3. 取得物件陣列中特定屬性
# names = ???

In [None]:
# 練習 1：參考解答

# 1. 取得偶數的平方
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
squares = [x ** 2 for x in numbers if x % 2 == 0]
print(f"1. 偶數的平方：{squares}")

# 2. 扁平化二維陣列
nested = [[1, 2], [3, 4], [5, 6]]
flat = [x for row in nested for x in row]
print(f"2. 扁平化：{flat}")

# 3. 取得物件陣列中特定屬性
people = [{"name": "Alice"}, {"name": "Bob"}]
names = [p["name"] for p in people]
print(f"3. 名字：{names}")

### 練習 2：生成器

寫一個生成器函式，產生質數：

In [None]:
# 練習 2：你的程式碼
def primes():
    """
    無限質數生成器

    使用範例：
    >>> gen = primes()
    >>> [next(gen) for _ in range(10)]
    [2, 3, 5, 7, 11, 13, 17, 19, 23, 29]
    """
    # 你的程式碼
    pass

In [None]:
# 練習 2：參考解答
def primes():
    """無限質數生成器"""
    def is_prime(n):
        if n < 2:
            return False
        if n == 2:
            return True
        if n % 2 == 0:
            return False
        for i in range(3, int(n ** 0.5) + 1, 2):
            if n % i == 0:
                return False
        return True
    
    n = 2
    while True:
        if is_prime(n):
            yield n
        n += 1

# 測試
gen = primes()
first_10 = [next(gen) for _ in range(10)]
print(f"前 10 個質數：{first_10}")

### 練習 3：資料處理管道

使用生成器建立資料處理管道，處理日誌資料：

In [None]:
# 練習 3：你的程式碼
# 模擬日誌資料
logs = [
    "192.168.1.1 - GET /index.html",
    "192.168.1.2 - GET /about.html",
    "192.168.1.1 - POST /login",
    "192.168.1.3 - GET /index.html",
    "192.168.1.2 - GET /contact.html",
    "192.168.1.1 - GET /dashboard",
]

# 寫生成器來：
# 1. 解析日誌（提取 IP 和 URL）
# 2. 過濾只要 GET 請求
# 3. 計算每個 IP 的請求次數

In [None]:
# 練習 3：參考解答
from collections import Counter

# 模擬日誌資料
logs = [
    "192.168.1.1 - GET /index.html",
    "192.168.1.2 - GET /about.html",
    "192.168.1.1 - POST /login",
    "192.168.1.3 - GET /index.html",
    "192.168.1.2 - GET /contact.html",
    "192.168.1.1 - GET /dashboard",
]

def parse_logs(logs):
    """解析日誌"""
    for log in logs:
        parts = log.split(" - ")
        ip = parts[0]
        method, url = parts[1].split(" ")
        yield {"ip": ip, "method": method, "url": url}

def filter_get(parsed):
    """過濾 GET 請求"""
    for entry in parsed:
        if entry["method"] == "GET":
            yield entry

def extract_ips(entries):
    """提取 IP"""
    for entry in entries:
        yield entry["ip"]

# 建立管道
pipeline = extract_ips(filter_get(parse_logs(logs)))

# 計算每個 IP 的請求次數
ip_counts = Counter(pipeline)

print("GET 請求的 IP 統計：")
for ip, count in ip_counts.most_common():
    print(f"  {ip}: {count} 次")

---

## 小結

### 推導式語法對照

| 類型 | 語法 | 結果 |
|------|------|------|
| 列表推導式 | `[x for x in iterable]` | `list` |
| 字典推導式 | `{k: v for k, v in iterable}` | `dict` |
| 集合推導式 | `{x for x in iterable}` | `set` |
| 生成器表達式 | `(x for x in iterable)` | `generator` |

### JavaScript 對照

| JavaScript | Python |
|------------|--------|
| `arr.map(x => f(x))` | `[f(x) for x in arr]` |
| `arr.filter(x => cond)` | `[x for x in arr if cond]` |
| `arr.map().filter()` | `[f(x) for x in arr if cond]` |
| `arr.flat()` | `[x for sub in arr for x in sub]` |
| `arr.reduce()` | `functools.reduce()` 或迴圈 |

### 生成器 vs 列表

| 特性 | 列表 | 生成器 |
|------|------|--------|
| 記憶體 | 一次性載入 | 惰性求值 |
| 遍歷次數 | 多次 | 一次 |
| 索引存取 | 支援 | 不支援 |
| 長度 | `len()` | 不支援 |
| 適用場景 | 小資料集 | 大資料集 |

### 最佳實踐

1. **優先使用推導式**而非 `map()`/`filter()`
2. **保持推導式簡單**，過於複雜時改用迴圈
3. **大資料集使用生成器**節省記憶體
4. **作為函式參數時使用生成器**
5. **避免巢狀超過兩層**的推導式

### 推導式條件位置速記

```python
# 過濾（filter）：if 在 for 後面
[x for x in items if condition]

# 轉換（map with condition）：if-else 在 for 前面
[a if condition else b for x in items]

# 結合（filter + map）
[transform(x) for x in items if condition]
```