# Chapter 8: Worked Examples - 詳解範例

本檔案提供 5 個完整的解題範例，展示元組與字串的實務應用。
每個範例包含：
1. 問題描述
2. 思路分析
3. 完整程式碼
4. 執行結果
5. 延伸思考

---

## 範例 1：座標點處理系統

### 問題描述
設計一個座標點處理系統，能夠：
1. 儲存 2D 座標點（使用元組）
2. 計算兩點之間的距離
3. 計算多個點的中心點
4. 找出距離原點最遠/最近的點

### 思路分析
- 使用元組 `(x, y)` 表示座標點（不可變，適合表示位置）
- 距離公式：$\sqrt{(x_2-x_1)^2 + (y_2-y_1)^2}$
- 中心點：所有點的 x 平均值和 y 平均值
- 使用元組解包簡化程式碼

In [None]:
import math

def distance(p1, p2):
    """計算兩點之間的距離"""
    x1, y1 = p1  # 元組解包
    x2, y2 = p2
    return math.sqrt((x2 - x1)**2 + (y2 - y1)**2)

def center_point(points):
    """計算多個點的中心點"""
    if not points:
        return None
    
    # 分別計算所有 x 和 y 的平均值
    x_sum = sum(x for x, y in points)  # 元組解包
    y_sum = sum(y for x, y in points)
    count = len(points)
    
    return (x_sum / count, y_sum / count)

def find_extremes(points, origin=(0, 0)):
    """找出距離原點最遠和最近的點"""
    if not points:
        return None, None
    
    distances = [(p, distance(origin, p)) for p in points]
    
    # 找最遠和最近
    farthest = max(distances, key=lambda item: item[1])
    nearest = min(distances, key=lambda item: item[1])
    
    return nearest, farthest

# 測試程式
print("=== 座標點處理系統 ===")

# 定義一些座標點
points = [
    (0, 0),
    (3, 4),
    (6, 8),
    (-2, 1),
    (5, -3)
]

print("\n座標點列表：")
for i, point in enumerate(points, 1):
    print(f"  點 {i}: {point}")

# 計算兩點距離
p1, p2 = points[0], points[1]
dist = distance(p1, p2)
print(f"\n點 {p1} 到點 {p2} 的距離：{dist:.2f}")

# 計算中心點
center = center_point(points)
print(f"\n所有點的中心點：({center[0]:.2f}, {center[1]:.2f})")

# 找出極值
nearest, farthest = find_extremes(points)
print(f"\n距離原點最近的點：{nearest[0]}, 距離 {nearest[1]:.2f}")
print(f"距離原點最遠的點：{farthest[0]}, 距離 {farthest[1]:.2f}")

### 延伸思考
1. 如何擴展到 3D 座標點 `(x, y, z)`？
2. 如何判斷三個點是否在同一條直線上？
3. 能否用元組儲存極座標 `(r, θ)`？

---

## 範例 2：文字資料清理工具

### 問題描述
開發一個文字清理工具，處理使用者輸入的髒資料：
1. 去除前後空白
2. 統一大小寫
3. 移除多餘空白（多個空白變一個）
4. 移除特殊字元
5. 標準化標點符號

### 思路分析
- 使用字串方法鏈式呼叫
- `strip()` 去除前後空白
- `split()` + `join()` 處理多餘空白
- 字元過濾處理特殊字元

In [None]:
def clean_text(text, lowercase=True, remove_special=True):
    """清理文字資料"""
    # 1. 去除前後空白
    text = text.strip()
    
    # 2. 統一小寫（可選）
    if lowercase:
        text = text.lower()
    
    # 3. 移除多餘空白
    text = ' '.join(text.split())
    
    # 4. 移除特殊字元（可選，保留字母、數字、空白）
    if remove_special:
        allowed = set('abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789 ')
        text = ''.join(c for c in text if c in allowed)
    
    return text

def standardize_punctuation(text):
    """標準化標點符號"""
    # 全形轉半形
    replacements = {
        '，': ',',
        '。': '.',
        '！': '!',
        '？': '?',
        '：': ':',
        '；': ';',
        '「': '"',
        '」': '"',
    }
    
    for old, new in replacements.items():
        text = text.replace(old, new)
    
    return text

def batch_clean(texts):
    """批次清理文字"""
    return [clean_text(text) for text in texts]

# 測試程式
print("=== 文字清理工具 ===")

# 測試單一文字清理
dirty_text = "  Hello,   WORLD!  This  is   a  TEST.  "
clean = clean_text(dirty_text)
print(f"\n原始：'{dirty_text}'")
print(f"清理：'{clean}'")

# 測試保留大小寫
clean2 = clean_text(dirty_text, lowercase=False)
print(f"\n保留大小寫：'{clean2}'")

# 測試標點符號標準化
chinese_text = "你好，世界！這是一個測試。"
standardized = standardize_punctuation(chinese_text)
print(f"\n原始：{chinese_text}")
print(f"標準化：{standardized}")

# 測試批次清理
dirty_texts = [
    "  python  ",
    "  JAVA   programming  ",
    "   web    development  "
]
cleaned_texts = batch_clean(dirty_texts)
print("\n批次清理結果：")
for original, cleaned in zip(dirty_texts, cleaned_texts):
    print(f"  '{original}' → '{cleaned}'")

# 測試特殊字元移除
special_text = "Hello@#$World123!??"
clean3 = clean_text(special_text, remove_special=True)
print(f"\n含特殊字元：'{special_text}'")
print(f"移除後：'{clean3}'")

### 延伸思考
1. 如何處理 HTML 標籤？
2. 如何保留某些特殊字元（如 @、#）？
3. 如何處理 emoji 表情符號？

---

## 範例 3：CSV 資料解析器

### 問題描述
解析 CSV 格式的使用者資料：
1. 分割 CSV 行為欄位
2. 清理欄位資料（去空白）
3. 型態轉換（字串 → 數字）
4. 資料驗證
5. 生成報表

### 思路分析
- 使用 `split(',')` 分割欄位
- 使用 `strip()` 清理空白
- 使用元組解包取得欄位
- 進行資料驗證

In [None]:
def parse_csv_line(line):
    """解析 CSV 行"""
    # 分割並清理每個欄位
    fields = [field.strip() for field in line.split(',')]
    return fields

def parse_user_data(csv_line):
    """解析使用者資料"""
    fields = parse_csv_line(csv_line)
    
    # 確保有足夠欄位
    if len(fields) < 4:
        return None, "欄位數量不足"
    
    # 元組解包取得欄位
    name, age_str, email, city = fields[:4]
    
    # 驗證與轉換
    errors = []
    
    # 驗證姓名
    if not name or not name.replace(' ', '').isalpha():
        errors.append("姓名無效")
    
    # 驗證年齡
    try:
        age = int(age_str)
        if age < 0 or age > 150:
            errors.append("年齡超出範圍")
    except ValueError:
        errors.append("年齡必須是數字")
        age = None
    
    # 驗證 Email
    if '@' not in email or '.' not in email:
        errors.append("Email 格式錯誤")
    
    # 驗證城市
    if not city:
        errors.append("城市不能為空")
    
    if errors:
        return None, '; '.join(errors)
    
    # 返回解析結果（元組）
    return (name, age, email, city), None

def generate_report(users):
    """生成使用者報表"""
    if not users:
        return "無資料"
    
    total = len(users)
    avg_age = sum(age for _, age, _, _ in users) / total
    cities = {city for _, _, _, city in users}
    
    report = f"""使用者統計報表
{'='*40}
總人數：{total}
平均年齡：{avg_age:.1f} 歲
城市數量：{len(cities)}
城市列表：{', '.join(sorted(cities))}
    """
    return report

# 測試程式
print("=== CSV 資料解析器 ===")

# 測試資料（CSV 格式）
csv_data = [
    "Alice, 25, alice@example.com, Taipei",
    "Bob, 30, bob@example.com, Kaohsiung",
    "Charlie, 28, charlie@example.com, Taipei",
    "David, ABC, david@example.com, Taichung",  # 錯誤：年齡
    "Eve, 22, eve.example.com, Tainan",  # 錯誤：Email
]

valid_users = []
errors = []

print("\n解析結果：")
for i, line in enumerate(csv_data, 1):
    user, error = parse_user_data(line)
    
    if user:
        valid_users.append(user)
        name, age, email, city = user
        print(f"✓ 行 {i}: {name}, {age} 歲, {city}")
    else:
        errors.append((i, line, error))
        print(f"✗ 行 {i}: {error}")

# 顯示錯誤詳情
if errors:
    print("\n錯誤詳情：")
    for line_num, line, error in errors:
        print(f"  行 {line_num}: {line}")
        print(f"    → {error}")

# 生成報表
print("\n" + generate_report(valid_users))

### 延伸思考
1. 如何處理欄位中包含逗號的情況（如地址）？
2. 如何支援不同的分隔符（tab、分號）？
3. 如何匯出為 CSV 格式？

---

## 範例 4：密碼驗證器

### 問題描述
實作一個密碼強度驗證器：
1. 檢查長度（至少 8 字元）
2. 包含大寫字母
3. 包含小寫字母
4. 包含數字
5. 包含特殊字元
6. 計算密碼強度分數

### 思路分析
- 使用字串方法判斷字元類型
- 使用 `any()` 檢查是否存在某類字元
- 根據條件累計強度分數

In [None]:
def validate_password(password):
    """驗證密碼並返回詳細資訊"""
    results = {
        'valid': True,
        'strength': 0,
        'checks': {},
        'feedback': []
    }
    
    # 1. 長度檢查
    length_ok = len(password) >= 8
    results['checks']['length'] = length_ok
    if length_ok:
        results['strength'] += 1
    else:
        results['feedback'].append("密碼至少需要 8 個字元")
        results['valid'] = False
    
    # 2. 大寫字母檢查
    has_upper = any(c.isupper() for c in password)
    results['checks']['uppercase'] = has_upper
    if has_upper:
        results['strength'] += 1
    else:
        results['feedback'].append("需要至少一個大寫字母")
    
    # 3. 小寫字母檢查
    has_lower = any(c.islower() for c in password)
    results['checks']['lowercase'] = has_lower
    if has_lower:
        results['strength'] += 1
    else:
        results['feedback'].append("需要至少一個小寫字母")
    
    # 4. 數字檢查
    has_digit = any(c.isdigit() for c in password)
    results['checks']['digit'] = has_digit
    if has_digit:
        results['strength'] += 1
    else:
        results['feedback'].append("需要至少一個數字")
    
    # 5. 特殊字元檢查
    special_chars = "!@#$%^&*()_+-=[]{}|;:',.<>?/"
    has_special = any(c in special_chars for c in password)
    results['checks']['special'] = has_special
    if has_special:
        results['strength'] += 2  # 特殊字元加 2 分
    else:
        results['feedback'].append("建議加入特殊字元以提高安全性")
    
    # 6. 額外檢查：連續字元
    has_consecutive = any(
        password[i:i+3].isdigit() or 
        password[i:i+3].lower() in 'abcdefghijklmnopqrstuvwxyz'
        for i in range(len(password) - 2)
    )
    if has_consecutive:
        results['strength'] -= 1
        results['feedback'].append("避免使用連續字元（如 abc、123）")
    
    # 7. 長度加分
    if len(password) >= 12:
        results['strength'] += 1
    if len(password) >= 16:
        results['strength'] += 1
    
    return results

def get_strength_label(score):
    """根據分數返回強度標籤"""
    if score >= 7:
        return "非常強 💪"
    elif score >= 5:
        return "強 👍"
    elif score >= 3:
        return "中等 👌"
    elif score >= 1:
        return "弱 ⚠️"
    else:
        return "極弱 ❌"

def print_password_report(password):
    """顯示密碼驗證報告"""
    results = validate_password(password)
    
    print(f"\n密碼：{'*' * len(password)}")
    print(f"強度分數：{results['strength']} / 8")
    print(f"強度等級：{get_strength_label(results['strength'])}")
    print(f"是否有效：{'✓' if results['valid'] else '✗'}")
    
    print("\n檢查項目：")
    checks = results['checks']
    print(f"  長度 (≥8): {'✓' if checks.get('length') else '✗'}")
    print(f"  大寫字母: {'✓' if checks.get('uppercase') else '✗'}")
    print(f"  小寫字母: {'✓' if checks.get('lowercase') else '✗'}")
    print(f"  數字: {'✓' if checks.get('digit') else '✗'}")
    print(f"  特殊字元: {'✓' if checks.get('special') else '✗'}")
    
    if results['feedback']:
        print("\n建議：")
        for tip in results['feedback']:
            print(f"  • {tip}")

# 測試程式
print("=== 密碼驗證器 ===")

test_passwords = [
    "abc",           # 極弱
    "password",      # 弱
    "Password123",   # 中等
    "P@ssw0rd",      # 強
    "P@ssw0rd!2024", # 非常強
]

for pwd in test_passwords:
    print_password_report(pwd)
    print("-" * 50)

### 延伸思考
1. 如何檢查密碼是否為常見弱密碼（如 password123）？
2. 如何檢查密碼是否包含使用者名稱？
3. 如何實作密碼強度即時回饋（如網頁表單）？

---

## 範例 5：簡易文字分析器

### 問題描述
開發一個文字分析工具，能夠：
1. 統計字數、句數、段落數
2. 計算平均字數
3. 找出最常見的詞彙
4. 計算字元頻率
5. 分析閱讀時間

### 思路分析
- 使用 `split()` 分割單字
- 使用字典統計詞頻
- 使用字串方法處理標點符號

In [None]:
import string
from collections import Counter

def analyze_text(text):
    """分析文字內容"""
    results = {}
    
    # 基本統計
    results['char_count'] = len(text)
    results['char_count_no_space'] = len(text.replace(' ', ''))
    
    # 段落數（以雙換行分隔）
    paragraphs = [p.strip() for p in text.split('\n\n') if p.strip()]
    results['paragraph_count'] = len(paragraphs)
    
    # 句數（簡化：以 .!? 結尾）
    sentence_enders = '.!?'
    results['sentence_count'] = sum(text.count(c) for c in sentence_enders)
    
    # 移除標點符號並分割單字
    translator = str.maketrans('', '', string.punctuation)
    clean_text = text.translate(translator)
    words = clean_text.lower().split()
    
    results['word_count'] = len(words)
    results['unique_words'] = len(set(words))
    
    # 平均值
    if results['sentence_count'] > 0:
        results['avg_words_per_sentence'] = results['word_count'] / results['sentence_count']
    else:
        results['avg_words_per_sentence'] = 0
    
    if results['word_count'] > 0:
        results['avg_word_length'] = sum(len(w) for w in words) / len(words)
    else:
        results['avg_word_length'] = 0
    
    # 詞頻統計（前 5 名）
    word_freq = Counter(words)
    results['top_words'] = word_freq.most_common(5)
    
    # 字元頻率（英文字母）
    letters = [c.lower() for c in text if c.isalpha()]
    letter_freq = Counter(letters)
    results['top_letters'] = letter_freq.most_common(5)
    
    # 閱讀時間估算（平均 200 字/分鐘）
    results['reading_time'] = results['word_count'] / 200
    
    return results

def print_analysis(text):
    """顯示分析結果"""
    results = analyze_text(text)
    
    print("文字分析報告")
    print("=" * 50)
    
    print("\n基本統計：")
    print(f"  總字元數：{results['char_count']:,}")
    print(f"  字元數（不含空白）：{results['char_count_no_space']:,}")
    print(f"  段落數：{results['paragraph_count']}")
    print(f"  句數：{results['sentence_count']}")
    print(f"  總字數：{results['word_count']:,}")
    print(f"  不重複字數：{results['unique_words']:,}")
    
    print("\n平均值：")
    print(f"  每句平均字數：{results['avg_words_per_sentence']:.1f}")
    print(f"  平均字長：{results['avg_word_length']:.1f} 字元")
    
    print("\n最常見的單字：")
    for word, count in results['top_words']:
        print(f"  {word}: {count} 次")
    
    print("\n最常見的字母：")
    for letter, count in results['top_letters']:
        print(f"  {letter}: {count} 次")
    
    print(f"\n預估閱讀時間：{results['reading_time']:.1f} 分鐘")
    print("=" * 50)

# 測試程式
print("=== 文字分析器 ===")

sample_text = """
Python is a high-level programming language. It is widely used for web development, 
data analysis, artificial intelligence, and scientific computing.

Python's syntax is clear and readable. This makes it an excellent choice for beginners. 
Many companies use Python for their projects. Python has a large and active community.

Learning Python opens many opportunities. You can build web applications, analyze data, 
or create machine learning models. Python is versatile and powerful!
"""

print_analysis(sample_text)

# 測試中文文字
chinese_text = """
Python 是一種高階程式語言。它被廣泛用於網頁開發、資料分析、人工智慧和科學計算。

Python 的語法清晰易讀。這使它成為初學者的絕佳選擇。許多公司使用 Python 開發專案。
"""

print("\n" + "=" * 50)
print("中文文字分析：")
print("=" * 50)
print_analysis(chinese_text)

### 延伸思考
1. 如何支援中文分詞（需要外部套件如 jieba）？
2. 如何分析文字的情感（正面/負面）？
3. 如何計算文字的可讀性分數（Flesch Reading Ease）？
4. 如何找出關鍵字（TF-IDF）？

---

## 總結

這 5 個範例展示了元組與字串在實務中的應用：

1. **範例 1**：元組用於儲存座標、多回傳值
2. **範例 2**：字串清理與標準化
3. **範例 3**：CSV 資料解析與驗證
4. **範例 4**：密碼驗證與安全性檢查
5. **範例 5**：文字分析與統計

**關鍵技巧**：
- 元組解包簡化程式碼
- 字串方法鏈式呼叫
- `split()` + `join()` 處理文字
- 字串驗證與清理
- 詞頻統計與分析

繼續練習 `03-practice.ipynb` 和 `04-exercises.ipynb` 以鞏固這些技能！