# Chapter 10: 集合資料 - 習題解答 | Solutions

本檔案提供 `04-exercises.ipynb` 中所有 15 題的完整解答。

每題包含:
- 完整程式碼
- 執行結果
- 解題思路說明

---

## Part I: 基礎題解答 | Basic Solutions (1-6)

### 習題 1 解答: 集合創建與特性

In [None]:
# 創建集合
numbers = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4}

print("集合內容:", numbers)
print("集合長度:", len(numbers))
print("\n說明: 集合自動去除重複元素,只保留唯一值")
print("原本有 10 個元素 (包含重複),集合只保留 4 個唯一值: 1, 2, 3, 4")

**解題思路**:
- 集合的唯一性特性會自動去除重複元素
- 最終只保留 {1, 2, 3, 4}
- 長度為 4

### 習題 2 解答: 字串去重

In [None]:
text = "programming"

# 使用集合去重
unique_letters = set(text)
print("唯一字母 (集合):", unique_letters)

# 轉換為排序後的列表
sorted_letters = sorted(unique_letters)
print("唯一字母 (排序):", sorted_letters)

# 統計資訊
print(f"\n原字串長度: {len(text)}")
print(f"唯一字母數: {len(unique_letters)}")

**解題思路**:
- `set(text)` 將字串轉為集合,自動去重
- `sorted()` 對集合排序,返回列表
- "programming" 包含字母: a, g, i, m, n, o, p, r

### 習題 3 解答: 集合基本操作

In [None]:
# 創建空集合
numbers = set()
print("初始:", numbers)

# 1. 新增元素
numbers.add(10)
numbers.add(20)
numbers.add(30)
print("步驟 1 (add):", numbers)

# 2. 使用 update()
numbers.update([40, 50, 60])
print("步驟 2 (update):", numbers)

# 3. 移除 20
numbers.remove(20)
print("步驟 3 (remove 20):", numbers)

# 4. discard 70
numbers.discard(70)  # 不存在,不報錯
print("步驟 4 (discard 70):", numbers)

print("\n最終集合:", numbers)

**解題思路**:
- `add()`: 一次新增一個元素
- `update()`: 新增多個元素
- `remove()`: 刪除存在的元素
- `discard()`: 安全刪除 (元素不存在也不報錯)

### 習題 4 解答: 列表去重保序

In [None]:
numbers = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]

# 方法 1: 使用字典 (Python 3.7+)
unique_v1 = list(dict.fromkeys(numbers))
print("方法 1 (字典):", unique_v1)

# 方法 2: 手動去重
seen = set()
unique_v2 = []
for num in numbers:
    if num not in seen:
        seen.add(num)
        unique_v2.append(num)
print("方法 2 (手動):", unique_v2)

# 驗證結果
print("\n預期: [3, 1, 4, 5, 9, 2, 6]")
print("結果相同:", unique_v1 == unique_v2 == [3, 1, 4, 5, 9, 2, 6])

**解題思路**:
- 不能直接用 `set()`,因為會失去順序
- 方法 1: `dict.fromkeys()` 利用字典的有序性 (3.7+)
- 方法 2: 使用 `seen` 集合追蹤已見過的元素

### 習題 5 解答: 成員檢查效能比較

In [None]:
import time

# 創建列表和集合
test_list = list(range(10000))
test_set = set(range(10000))

# 列表檢查
start = time.time()
result = 9999 in test_list
list_time = time.time() - start

# 集合檢查
start = time.time()
result = 9999 in test_set
set_time = time.time() - start

print(f"列表檢查時間: {list_time:.8f} 秒")
print(f"集合檢查時間: {set_time:.8f} 秒")
print(f"\n集合快了約 {list_time/set_time:.0f} 倍")
print("\n原理:")
print("- 列表: O(n) 需要逐一檢查")
print("- 集合: O(1) 使用雜湊表直接定位")

**解題思路**:
- 列表的 `in` 是線性搜尋 O(n)
- 集合的 `in` 是雜湊查詢 O(1)
- 資料量越大,差異越明顯

### 習題 6 解答: 集合推導式基礎

In [None]:
# 1. 3 的倍數
multiples_of_3 = {x for x in range(1, 21) if x % 3 == 0}
print("3 的倍數:", sorted(multiples_of_3))

# 2. 質數
def is_prime(n):
    """判斷是否為質數"""
    if n < 2:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True

primes = {x for x in range(1, 51) if is_prime(x)}
print("質數:", sorted(primes))

# 驗證
print(f"\n1-20 中有 {len(multiples_of_3)} 個 3 的倍數")
print(f"1-50 中有 {len(primes)} 個質數")

**解題思路**:
- 集合推導式: `{expression for item in iterable if condition}`
- 3 的倍數: 檢查 `x % 3 == 0`
- 質數: 需要先定義判斷函數

---

## Part II: 中階題解答 | Intermediate Solutions (7-12)

### 習題 7 解答: 學生課程分析

In [None]:
python_students = {"Alice", "Bob", "Charlie", "David", "Eve"}
java_students = {"Bob", "David", "Frank", "Grace"}
web_students = {"Alice", "Charlie", "Frank", "Henry"}

# 1. 至少選修一門課 (聯集)
all_students = python_students | java_students | web_students
print("至少選修一門課:", sorted(all_students))

# 2. 同時選修 Python 和 Java (交集)
both_py_java = python_students & java_students
print("同時選修 Python 和 Java:", sorted(both_py_java))

# 3. 只選修 Python (差集)
only_python = python_students - java_students - web_students
print("只選修 Python:", sorted(only_python))

# 4. Python 或 Java 但不同時 (對稱差集)
py_or_java_not_both = python_students ^ java_students
print("Python 或 Java 但不同時:", sorted(py_or_java_not_both))

# 統計
print(f"\n總學生數: {len(all_students)}")
print(f"Python: {len(python_students)} 人")
print(f"Java: {len(java_students)} 人")
print(f"Web: {len(web_students)} 人")

**解題思路**:
- 聯集 `|`: 所有選課學生
- 交集 `&`: 共同學生
- 差集 `-`: 獨有學生
- 對稱差集 `^`: 不共同的學生

### 習題 8 解答: IP 白名單檢查

In [None]:
whitelist = {"192.168.1.1", "192.168.1.2", "192.168.1.3"}
requests = ["192.168.1.1", "192.168.1.5", "192.168.1.2", "10.0.0.1"]

# 將請求轉為集合
request_set = set(requests)

# 1. 允許的請求
allowed = request_set & whitelist
print("允許的 IP:", sorted(allowed))

# 2. 拒絕的請求
denied = request_set - whitelist
print("拒絕的 IP:", sorted(denied))

# 3. 允許率
total_requests = len(requests)
allowed_count = sum(1 for ip in requests if ip in whitelist)
allow_rate = allowed_count / total_requests * 100

print(f"\n總請求數: {total_requests}")
print(f"允許: {allowed_count} 個")
print(f"拒絕: {total_requests - allowed_count} 個")
print(f"允許率: {allow_rate:.1f}%")

**解題思路**:
- 交集找出允許的 IP
- 差集找出拒絕的 IP
- 計算允許率: 允許數 / 總數 × 100%

### 習題 9 解答: 文字分析 - 獨特詞彙

In [None]:
text1 = "the quick brown fox jumps over the lazy dog"
text2 = "the lazy cat sleeps under the warm sun"

# 轉換為集合
words1 = set(text1.split())
words2 = set(text2.split())

# 1. 共同詞彙
common = words1 & words2
print("共同詞彙:", sorted(common))

# 2. 只在 text1
only_text1 = words1 - words2
print("只在 text1:", sorted(only_text1))

# 3. 只在 text2
only_text2 = words2 - words1
print("只在 text2:", sorted(only_text2))

# 4. 總詞彙數
all_words = words1 | words2
print(f"\n總詞彙數: {len(all_words)}")
print("所有詞彙:", sorted(all_words))

**解題思路**:
- 使用 `split()` 將文字分割為詞彙列表
- 轉換為集合進行運算
- 交集找共同詞,差集找獨有詞,聯集找所有詞

### 習題 10 解答: 數字分類

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 18, 20]

# 1. 2 的倍數
multiples_of_2 = {x for x in numbers if x % 2 == 0}
print("2 的倍數:", sorted(multiples_of_2))

# 2. 3 的倍數
multiples_of_3 = {x for x in numbers if x % 3 == 0}
print("3 的倍數:", sorted(multiples_of_3))

# 3. 同時是 2 和 3 的倍數 (6 的倍數)
multiples_of_6 = multiples_of_2 & multiples_of_3
print("6 的倍數:", sorted(multiples_of_6))

# 4. 是 2 或 3 的倍數
multiples_of_2_or_3 = multiples_of_2 | multiples_of_3
print("2 或 3 的倍數:", sorted(multiples_of_2_or_3))

# 驗證
print(f"\n2 的倍數: {len(multiples_of_2)} 個")
print(f"3 的倍數: {len(multiples_of_3)} 個")
print(f"6 的倍數: {len(multiples_of_6)} 個")
print(f"2 或 3 的倍數: {len(multiples_of_2_or_3)} 個")

**解題思路**:
- 使用集合推導式篩選倍數
- 交集找同時是 2 和 3 的倍數
- 聯集找是 2 或 3 的倍數

### 習題 11 解答: 重複 Email 檢測

In [None]:
emails = [
    "user1@example.com", "user2@example.com", "user3@example.com",
    "user1@example.com", "user4@example.com", "user2@example.com",
    "user5@example.com", "user1@example.com"
]

# 1. 找出重複的 email
seen = set()
duplicates = set()

for email in emails:
    if email in seen:
        duplicates.add(email)
    else:
        seen.add(email)

print("重複的 email:", sorted(duplicates))

# 2. 統計每個 email 出現次數
counts = {}
for email in emails:
    counts[email] = counts.get(email, 0) + 1

print("\nEmail 出現次數:")
for email, count in sorted(counts.items()):
    status = "⚠" if count > 1 else "✓"
    print(f"  {status} {email}: {count} 次")

# 3. 去重後的列表
unique_emails = list(dict.fromkeys(emails))  # 保持順序
print(f"\n去重後的 email ({len(unique_emails)} 個):")
for email in unique_emails:
    print(f"  - {email}")

**解題思路**:
- 使用兩個集合 (seen, duplicates) 追蹤重複
- 使用字典統計出現次數
- `dict.fromkeys()` 保序去重

### 習題 12 解答: 子集與超集檢查

In [None]:
A = {1, 2, 3}
B = {1, 2, 3, 4, 5}
C = {1, 2}
D = {6, 7, 8}

print("集合:")
print(f"A = {A}")
print(f"B = {B}")
print(f"C = {C}")
print(f"D = {D}")

# 1. A 是否是 B 的子集
is_subset = A.issubset(B)
# 或: is_subset = A <= B
print(f"\n1. A 是 B 的子集? {is_subset}")

# 2. B 是否是 A 的超集
is_superset = B.issuperset(A)
# 或: is_superset = B >= A
print(f"2. B 是 A 的超集? {is_superset}")

# 3. C 是否是 A 的子集
c_subset_a = C.issubset(A)
print(f"3. C 是 A 的子集? {c_subset_a}")

# 4. A 和 D 是否互斥
is_disjoint = A.isdisjoint(D)
print(f"4. A 和 D 互斥 (無共同元素)? {is_disjoint}")

# 驗證
print("\n驗證:")
print(f"A ∩ D = {A & D} (空集合表示互斥)")

**解題思路**:
- `issubset()` 或 `<=`: 檢查是否為子集
- `issuperset()` 或 `>=`: 檢查是否為超集
- `isdisjoint()`: 檢查是否互斥 (無共同元素)

---

## Part III: 挑戰題解答 | Challenge Solutions (13-15)

### 習題 13 解答: 好友推薦系統

In [None]:
friends = {
    "Alice": {"Bob", "Charlie", "David"},
    "Bob": {"Alice", "Charlie", "Eve"},
    "Charlie": {"Alice", "Bob", "Frank"},
    "David": {"Alice", "Eve"},
    "Eve": {"Bob", "David", "Frank"},
    "Frank": {"Charlie", "Eve"}
}

def recommend_friends(user, friends_dict):
    """
    推薦可能認識的人 (好友的好友)
    
    規則: 
    - 推薦「好友的好友」
    - 排除自己
    - 排除已經是好友的人
    """
    if user not in friends_dict:
        return set()
    
    # 使用者的好友
    user_friends = friends_dict[user]
    
    # 好友的好友 (聯集)
    friends_of_friends = set()
    for friend in user_friends:
        if friend in friends_dict:
            friends_of_friends |= friends_dict[friend]
    
    # 排除自己和已經是好友的人
    recommendations = friends_of_friends - user_friends - {user}
    
    return recommendations

# 測試
user = "Alice"
recommendations = recommend_friends(user, friends)

print(f"{user} 的好友: {friends[user]}")
print(f"推薦給 {user}: {recommendations}")

# 詳細說明
print(f"\n推薦理由:")
for person in sorted(recommendations):
    mutual = [f for f in friends[user] if person in friends.get(f, set())]
    print(f"  - {person}: 透過 {', '.join(mutual)} 認識")

# 測試其他人
print("\n其他推薦:")
for person in ["Bob", "David"]:
    rec = recommend_friends(person, friends)
    print(f"{person}: {rec}")

**解題思路**:
1. 取得使用者的所有好友
2. 聯集所有「好友的好友」
3. 排除使用者自己和已經是好友的人
4. 使用差集運算: `friends_of_friends - user_friends - {user}`

### 習題 14 解答: Anagram 檢查

In [None]:
def are_anagrams(word1, word2):
    """
    檢查兩個字串是否為 anagram
    
    Anagram: 使用相同字母但順序不同的詞
    """
    # 轉小寫並移除空格
    clean1 = word1.lower().replace(" ", "")
    clean2 = word2.lower().replace(" ", "")
    
    # 方法 1: 比較字母集合和長度
    # (集合相同且長度相同,表示每個字母出現次數也相同)
    if set(clean1) != set(clean2):
        return False
    
    if len(clean1) != len(clean2):
        return False
    
    # 方法 2: 比較排序後的字串
    return sorted(clean1) == sorted(clean2)

# 測試案例
test_cases = [
    ("Listen", "Silent", True),
    ("Hello", "World", False),
    ("The Eyes", "They See", True),
    ("abc", "cba", True),
    ("aab", "abb", False),
]

print("Anagram 檢查:")
print("="*50)
for word1, word2, expected in test_cases:
    result = are_anagrams(word1, word2)
    status = "✓" if result == expected else "✗"
    print(f"{status} '{word1}' vs '{word2}': {result}")

# 額外測試
print("\n更多範例:")
pairs = [
    ("Dormitory", "Dirty Room"),
    ("Conversation", "Voices Rant On"),
    ("Astronomer", "Moon Starer"),
]

for w1, w2 in pairs:
    result = are_anagrams(w1, w2)
    print(f"  '{w1}' vs '{w2}': {result}")

**解題思路**:
1. 清理字串: 轉小寫、移除空格
2. 檢查字母集合是否相同
3. 檢查長度是否相同
4. 更嚴謹的方法: 比較排序後的字串

### 習題 15 解答: 技能配對系統

In [None]:
# 求職者技能
candidates = {
    "Alice": {"Python", "SQL", "Git", "Docker"},
    "Bob": {"Java", "SQL", "Spring", "Git"},
    "Charlie": {"Python", "Django", "PostgreSQL", "Docker"},
    "David": {"JavaScript", "React", "Node.js", "MongoDB"}
}

# 工作需求
job_requirements = {
    "Backend Developer": {"Python", "SQL", "Docker"},
    "Full Stack Developer": {"JavaScript", "React", "Node.js", "MongoDB"},
    "DevOps Engineer": {"Docker", "Kubernetes", "CI/CD", "Git"}
}

def match_candidates(candidates, job_requirements):
    """
    配對候選人與職位
    
    返回:
    - 合適候選人: 擁有所有必需技能
    - 匹配度: 擁有技能 / 需求技能
    - 最佳匹配: 匹配度最高的配對
    """
    results = {}
    
    for job, required_skills in job_requirements.items():
        print(f"\n職位: {job}")
        print(f"需求技能: {required_skills}")
        print("="*50)
        
        qualified = []
        match_scores = []
        
        for name, skills in candidates.items():
            # 計算匹配度
            matched_skills = required_skills & skills
            match_rate = len(matched_skills) / len(required_skills)
            
            # 是否完全符合
            is_qualified = required_skills <= skills  # 子集檢查
            
            if is_qualified:
                qualified.append(name)
            
            match_scores.append((name, match_rate, matched_skills))
            
            # 顯示詳細資訊
            status = "✓ 合格" if is_qualified else "✗ 不合格"
            print(f"{status} {name}: {match_rate*100:.0f}% ({len(matched_skills)}/{len(required_skills)})")
            print(f"  擁有技能: {skills}")
            print(f"  符合: {matched_skills}")
            if not is_qualified:
                missing = required_skills - skills
                print(f"  缺少: {missing}")
        
        results[job] = {
            "qualified": qualified,
            "scores": sorted(match_scores, key=lambda x: x[1], reverse=True)
        }
    
    # 最佳匹配
    print("\n" + "="*50)
    print("最佳匹配推薦:")
    print("="*50)
    for job, data in results.items():
        if data["qualified"]:
            best = data["scores"][0]
            print(f"\n{job}:")
            print(f"  最佳候選人: {best[0]} (匹配度 {best[1]*100:.0f}%)")
            print(f"  所有合格候選人: {', '.join(data['qualified'])}")
        else:
            print(f"\n{job}: 無完全合格的候選人")
            best = data["scores"][0]
            print(f"  最接近: {best[0]} (匹配度 {best[1]*100:.0f}%)")
    
    return results

# 執行配對
results = match_candidates(candidates, job_requirements)

**解題思路**:
1. 使用交集 `&` 找出符合的技能
2. 使用子集 `<=` 檢查是否完全符合
3. 使用差集 `-` 找出缺少的技能
4. 計算匹配度: `len(matched) / len(required)`
5. 排序找出最佳匹配

---

## 總結 | Summary

這 15 題涵蓋了集合的所有核心概念:

**基礎題 (1-6)**:
- 集合特性與創建
- 基本操作 (add, remove, discard)
- 去重與效能
- 集合推導式

**中階題 (7-12)**:
- 四種集合運算 (聯集、交集、差集、對稱差集)
- 集合關係 (子集、超集、互斥)
- 實際應用 (白名單、文字分析、數字分類)

**挑戰題 (13-15)**:
- 好友推薦 (複雜集合運算)
- Anagram 檢查 (字串處理 + 集合)
- 技能配對 (綜合應用)

**核心技巧**:
1. 理解集合的數學意義
2. 選擇適當的運算符號或方法
3. 結合多種運算解決複雜問題
4. 注意集合的效能優勢