# Milestone 04: 文字處理工具箱 - 起始程式碼

## 🎯 開發指南

本檔案提供完整的程式碼框架，包含：
- 所有函式的函式簽名與文件字串
- 實作提示與 TODO 標記
- 測試程式碼範例
- 段階式開發建議

### 📋 開發檢核表
完成一個模組後，請勾選對應項目：
- [ ] 模組 1: 文字統計 (statistics)
- [ ] 模組 2: 文字搜尋 (search)
- [ ] 模組 3: 文字轉換 (transform)
- [ ] 模組 4: 文字格式化 (format)
- [ ] 模組 5: 文字分析 (analysis)
- [ ] 模組 6: 遞迴處理 (recursive) [進階]
- [ ] 模組 7: 函式式程式設計 (functional) [進階]
- [ ] 系統整合與測試

---

## 📦 模組 1: 文字統計模組 (Statistics)

### 💡 Ch12 重點：函式設計基礎
- 單一職責原則：每個函式只做一件事
- 清楚的參數與回傳值
- 完整的文件字串

In [None]:
def count_characters(text):
    """
    統計文字字元數量（含空格與標點）
    
    參數:
        text (str): 要統計的文字
    
    回傳:
        dict: 包含各種字元統計資訊
    """
    # TODO: 實作字元統計邏輯
    # 提示：使用 str.isalpha(), str.isdigit(), str.isspace()
    
    if not text:  # 邊界條件處理
        return {
            'total_chars': 0,
            'alphabetic': 0,
            'numeric': 0,
            'whitespace': 0,
            'punctuation': 0
        }
    
    # TODO: 初始化計數器
    total_chars = len(text)
    alphabetic = 0
    numeric = 0
    whitespace = 0
    
    # TODO: 迴圈統計每個字元
    for char in text:
        # TODO: 判斷字元類型並累計
        pass
    
    # TODO: 計算標點符號數量
    punctuation = 0  # total_chars - alphabetic - numeric - whitespace
    
    return {
        'total_chars': total_chars,
        'alphabetic': alphabetic,
        'numeric': numeric,
        'whitespace': whitespace,
        'punctuation': punctuation
    }

def count_words(text):
    """
    統計詞彙數量與詞頻
    
    參數:
        text (str): 要分析的文字
    
    回傳:
        dict: 詞彙統計結果
    """
    # TODO: 實作詞彙統計邏輯
    # 提示：使用 str.split(), str.lower(), dict.get()
    
    if not text.strip():  # 邊界條件
        return {
            'total_words': 0,
            'unique_words': 0,
            'word_frequency': {},
            'average_word_length': 0.0
        }
    
    # TODO: 分割文字為詞彙列表
    words = []  # text.lower().split()
    
    # TODO: 清理詞彙（移除標點符號）
    clean_words = []
    for word in words:
        # TODO: 移除標點符號，只保留字母數字
        clean_word = ''.join(c for c in word if c.isalnum())
        if clean_word:  # 非空詞彙
            clean_words.append(clean_word)
    
    # TODO: 計算詞頻
    word_frequency = {}
    for word in clean_words:
        # TODO: 使用 dict.get() 方法累計詞頻
        pass
    
    # TODO: 計算平均詞長
    total_word_length = 0  # sum(len(word) for word in clean_words)
    average_word_length = 0.0  # total_word_length / len(clean_words) if clean_words else 0
    
    return {
        'total_words': len(clean_words),
        'unique_words': len(word_frequency),
        'word_frequency': word_frequency,
        'average_word_length': average_word_length
    }

def count_lines(text):
    """
    統計行數相關資訊
    
    參數:
        text (str): 要分析的文字
    
    回傳:
        dict: 行數統計結果
    """
    # TODO: 實作行數統計邏輯
    # 提示：使用 str.splitlines(), str.strip()
    
    if not text:
        return {
            'total_lines': 0,
            'non_empty_lines': 0,
            'empty_lines': 0,
            'average_line_length': 0.0
        }
    
    # TODO: 分割為行列表
    lines = []  # text.splitlines()
    
    # TODO: 統計非空行與空行
    non_empty_lines = 0
    total_line_length = 0
    
    for line in lines:
        # TODO: 判斷是否為非空行
        pass
    
    empty_lines = len(lines) - non_empty_lines
    average_line_length = total_line_length / len(lines) if lines else 0.0
    
    return {
        'total_lines': len(lines),
        'non_empty_lines': non_empty_lines,
        'empty_lines': empty_lines,
        'average_line_length': average_line_length
    }

def analyze_text_statistics(text):
    """
    綜合文字統計分析（整合上述所有函式）
    展示 Ch12 函式組合概念
    
    參數:
        text (str): 要分析的文字
    
    回傳:
        dict: 完整統計報告
    """
    # TODO: 呼叫上述三個函式並整合結果
    # 這展示了 Ch12 函式組合的概念
    
    return {
        'characters': count_characters(text),
        'words': count_words(text),
        'lines': count_lines(text)
    }

# 測試統計模組
def test_statistics_module():
    """測試統計模組的基本功能"""
    test_text = "Hello, World! 123\nPython is great."
    
    print("🧪 測試統計模組")
    print("測試文字:", repr(test_text))
    
    # 測試字元統計
    char_stats = count_characters(test_text)
    print("\n字元統計:", char_stats)
    
    # 測試詞彙統計
    word_stats = count_words(test_text)
    print("詞彙統計:", word_stats)
    
    # 測試行數統計
    line_stats = count_lines(test_text)
    print("行數統計:", line_stats)
    
    # 測試綜合統計
    full_stats = analyze_text_statistics(test_text)
    print("\n完整統計:", full_stats)

# 取消註解來測試
# test_statistics_module()

## 🔍 模組 2: 文字搜尋模組 (Search)

### 💡 Ch14 重點：高階函式與 Lambda
- 使用 map 函式處理多個關鍵字
- 使用 filter 函式過濾結果
- Lambda 函式的實際應用

In [None]:
def find_keyword(text, keyword, case_sensitive=False):
    """
    在文字中搜尋關鍵字
    
    參數:
        text (str): 要搜尋的文字
        keyword (str): 關鍵字
        case_sensitive (bool): 是否區分大小寫
    
    回傳:
        dict: 搜尋結果
    """
    # TODO: 實作關鍵字搜尋邏輯
    
    if not text or not keyword:
        return {
            'keyword': keyword,
            'count': 0,
            'positions': [],
            'line_numbers': [],
            'context_lines': []
        }
    
    # TODO: 處理大小寫敏感性
    search_text = text if case_sensitive else text.lower()
    search_keyword = keyword if case_sensitive else keyword.lower()
    
    # TODO: 找出所有出現位置
    positions = []
    start = 0
    while True:
        # TODO: 使用 str.find() 方法找下一個位置
        pos = search_text.find(search_keyword, start)
        if pos == -1:
            break
        positions.append(pos)
        start = pos + 1
    
    # TODO: 找出關鍵字所在的行號與行內容
    lines = text.splitlines()
    line_numbers = []
    context_lines = []
    
    for i, line in enumerate(lines, 1):
        # TODO: 檢查行中是否包含關鍵字
        check_line = line if case_sensitive else line.lower()
        if search_keyword in check_line:
            line_numbers.append(i)
            context_lines.append(line)
    
    return {
        'keyword': keyword,
        'count': len(positions),
        'positions': positions,
        'line_numbers': line_numbers,
        'context_lines': context_lines
    }

def find_multiple_keywords(text, keywords, case_sensitive=False):
    """
    同時搜尋多個關鍵字
    展示 Ch14 map 函式應用
    
    參數:
        text (str): 要搜尋的文字
        keywords (list): 關鍵字列表
        case_sensitive (bool): 是否區分大小寫
    
    回傳:
        dict: {keyword: search_result} 的字典
    """
    # TODO: 使用 map 函式對每個關鍵字進行搜尋
    # 這是 Ch14 高階函式的重點應用
    
    if not keywords:
        return {}
    
    # TODO: 建立搜尋函式
    def search_single_keyword(keyword):
        return find_keyword(text, keyword, case_sensitive)
    
    # TODO: 使用 map 函式批次搜尋
    search_results = list(map(search_single_keyword, keywords))
    
    # TODO: 將結果轉換為字典格式
    result_dict = {}
    for result in search_results:
        result_dict[result['keyword']] = result
    
    return result_dict

def search_in_lines(text, pattern, filter_func=None):
    """
    按行搜尋並支援自訂過濾條件
    展示 Ch14 filter 函式與 Lambda 應用
    
    參數:
        text (str): 要搜尋的文字
        pattern (str): 搜尋模式
        filter_func (callable): 自訂過濾函式
    
    回傳:
        list: 符合條件的行列表
    """
    # TODO: 實作按行搜尋邏輯
    
    if not text or not pattern:
        return []
    
    lines = text.splitlines()
    matching_lines = []
    
    for i, line in enumerate(lines, 1):
        # TODO: 檢查行中是否包含模式
        if pattern.lower() in line.lower():
            line_info = {
                'line_number': i,
                'content': line,
                'match_count': line.lower().count(pattern.lower())
            }
            matching_lines.append(line_info)
    
    # TODO: 如果有過濾函式，使用 filter 函式過濾結果
    if filter_func:
        # 這展示了 Ch14 filter 函式的應用
        matching_lines = list(filter(lambda line_info: filter_func(line_info['content']), matching_lines))
    
    return matching_lines

# 測試搜尋模組
def test_search_module():
    """測試搜尋模組的功能"""
    test_text = """Python is awesome!
I love Python programming.
Python makes coding fun.
Java is also good."""
    
    print("🔍 測試搜尋模組")
    
    # 測試單一關鍵字搜尋
    result = find_keyword(test_text, "Python")
    print("\n搜尋 'Python':", result)
    
    # 測試多關鍵字搜尋（Ch14 map 應用）
    keywords = ["Python", "Java", "programming"]
    multi_results = find_multiple_keywords(test_text, keywords)
    print("\n多關鍵字搜尋:", multi_results)
    
    # 測試行搜尋與過濾（Ch14 filter + Lambda 應用）
    line_results = search_in_lines(test_text, "Python", lambda line: len(line) > 15)
    print("\n行搜尋（長度>15）:", line_results)

# 取消註解來測試
# test_search_module()

## 🔄 模組 3: 文字轉換模組 (Transform)

### 💡 Ch13 重點：作用域與閉包
- 建立客製化轉換器（閉包應用）
- 內嵌函式與外層變數存取
- 狀態保存與配置

In [None]:
def transform_case(text, mode='lower'):
    """
    轉換文字大小寫
    
    參數:
        text (str): 要轉換的文字
        mode (str): 轉換模式 ('lower', 'upper', 'title', 'capitalize')
    
    回傳:
        str: 轉換後的文字
    """
    # TODO: 實作大小寫轉換邏輯
    
    if not text:
        return text
    
    # TODO: 根據模式選擇轉換方式
    if mode == 'lower':
        return text.lower()
    elif mode == 'upper':
        return text.upper()
    elif mode == 'title':
        return text.title()
    elif mode == 'capitalize':
        return text.capitalize()
    else:
        # TODO: 處理無效模式
        raise ValueError(f"無效的轉換模式: {mode}")

def replace_text_advanced(text, replacements, use_regex=False):
    """
    進階文字替換功能
    
    參數:
        text (str): 原始文字
        replacements (dict): 替換規則 {old: new}
        use_regex (bool): 是否使用正規表達式
    
    回傳:
        str: 替換後的文字
    """
    # TODO: 實作進階替換邏輯
    
    if not text or not replacements:
        return text
    
    result = text
    
    if use_regex:
        # TODO: 使用正規表達式替換（進階功能）
        import re
        for pattern, replacement in replacements.items():
            result = re.sub(pattern, replacement, result)
    else:
        # TODO: 使用簡單字串替換
        for old, new in replacements.items():
            result = result.replace(old, new)
    
    return result

def create_text_transformer(config):
    """
    建立客製化文字轉換器（展示 Ch13 閉包概念）
    
    參數:
        config (dict): 轉換設定
    
    回傳:
        function: 轉換函式（閉包）
    """
    # TODO: 實作閉包轉換器
    # 這是 Ch13 閉包概念的重點展示
    
    # 外層函式變數（閉包環境）
    case_mode = config.get('case_mode', 'none')
    remove_punctuation = config.get('remove_punctuation', False)
    replace_numbers = config.get('replace_numbers', False)
    custom_replacements = config.get('custom_replacements', {})
    
    def transformer(text):
        """
        內層函式 - 具有外層作用域存取權
        這展示了 Ch13 的閉包概念
        """
        if not text:
            return text
        
        result = text
        
        # TODO: 應用大小寫轉換（使用外層變數）
        if case_mode != 'none':
            result = transform_case(result, case_mode)
        
        # TODO: 移除標點符號
        if remove_punctuation:
            # 只保留字母、數字和空格
            result = ''.join(c for c in result if c.isalnum() or c.isspace())
        
        # TODO: 替換數字
        if replace_numbers:
            result = ''.join(c if not c.isdigit() else '#' for c in result)
        
        # TODO: 應用自訂替換規則
        if custom_replacements:
            result = replace_text_advanced(result, custom_replacements)
        
        return result
    
    # 返回內層函式（閉包）
    return transformer

def batch_transform_texts(text_list, transform_func):
    """
    批次處理文字列表（展示 Ch14 map 函式）
    
    參數:
        text_list (list): 文字列表
        transform_func (callable): 轉換函式
    
    回傳:
        list: 轉換後的文字列表
    """
    # TODO: 使用 map 函式批次轉換
    # 這展示了 Ch14 map 函式的應用
    
    if not text_list or not transform_func:
        return text_list
    
    # TODO: 使用 map 函式
    return list(map(transform_func, text_list))

# 測試轉換模組
def test_transform_module():
    """測試轉換模組的功能"""
    test_texts = ["Hello, World!", "Python123 is GREAT!", "Test... 456"]
    
    print("🔄 測試轉換模組")
    
    # 測試基本大小寫轉換
    print("\n大小寫轉換:")
    for mode in ['lower', 'upper', 'title']:
        result = transform_case(test_texts[0], mode)
        print(f"  {mode}: {result}")
    
    # 測試進階替換
    replacements = {'Hello': 'Hi', 'World': 'Python'}
    result = replace_text_advanced(test_texts[0], replacements)
    print(f"\n進階替換: {result}")
    
    # 測試閉包轉換器（Ch13 重點）
    config = {
        'case_mode': 'lower',
        'remove_punctuation': True,
        'replace_numbers': True
    }
    transformer = create_text_transformer(config)
    transformed = transformer("Hello, World! 123")
    print(f"\n閉包轉換器: {transformed}")
    
    # 測試批次轉換（Ch14 map 應用）
    batch_results = batch_transform_texts(test_texts, lambda x: x.upper())
    print(f"\n批次轉換: {batch_results}")

# 取消註解來測試
# test_transform_module()

## 📐 模組 4: 文字格式化模組 (Format)

### 💡 Ch12 重點：函式設計與參數處理
- 預設參數的使用
- 彈性的函式介面設計
- 字串格式化技巧

In [None]:
def align_text(text, width=80, alignment='left'):
    """
    文字對齊處理
    
    參數:
        text (str): 要對齊的文字
        width (int): 對齊寬度
        alignment (str): 對齊方式 ('left', 'right', 'center')
    
    回傳:
        str: 對齊後的文字
    """
    # TODO: 實作文字對齊邏輯
    
    if not text:
        return ' ' * width
    
    # TODO: 處理多行文字
    lines = text.splitlines()
    aligned_lines = []
    
    for line in lines:
        # TODO: 根據對齊方式處理每一行
        if alignment == 'left':
            aligned_line = line.ljust(width)
        elif alignment == 'right':
            aligned_line = line.rjust(width)
        elif alignment == 'center':
            aligned_line = line.center(width)
        else:
            raise ValueError(f"無效的對齊方式: {alignment}")
        
        aligned_lines.append(aligned_line)
    
    return '\n'.join(aligned_lines)

def indent_lines(text, indent_size=4, indent_char=' '):
    """
    為文字行添加縮排
    
    參數:
        text (str): 要縮排的文字
        indent_size (int): 縮排大小
        indent_char (str): 縮排字元
    
    回傳:
        str: 縮排後的文字
    """
    # TODO: 實作縮排邏輯
    
    if not text:
        return text
    
    # TODO: 建立縮排字串
    indent = indent_char * indent_size
    
    # TODO: 為每一行添加縮排
    lines = text.splitlines()
    indented_lines = []
    
    for line in lines:
        # TODO: 空行是否縮排？（設計決策）
        if line.strip():  # 非空行才縮排
            indented_lines.append(indent + line)
        else:
            indented_lines.append(line)  # 保持空行
    
    return '\n'.join(indented_lines)

def create_columns(text_list, columns=2, separator='  |  '):
    """
    將文字列表格式化為多欄顯示
    
    參數:
        text_list (list): 文字列表
        columns (int): 欄數
        separator (str): 欄分隔符
    
    回傳:
        str: 格式化後的多欄文字
    """
    # TODO: 實作多欄格式化邏輯
    
    if not text_list or columns <= 0:
        return ''
    
    # TODO: 計算每欄的最大寬度
    max_width = max(len(str(item)) for item in text_list) if text_list else 0
    
    # TODO: 分組處理
    rows = []
    for i in range(0, len(text_list), columns):
        # TODO: 取得當前行的元素
        row_items = text_list[i:i + columns]
        
        # TODO: 格式化每個元素
        formatted_items = []
        for item in row_items:
            formatted_items.append(str(item).ljust(max_width))
        
        # TODO: 用分隔符連接
        row_text = separator.join(formatted_items)
        rows.append(row_text)
    
    return '\n'.join(rows)

def format_table(data, headers=None, align='left'):
    """
    格式化資料為表格
    
    參數:
        data (list): 資料列表，每個元素為一行資料
        headers (list): 表頭列表
        align (str): 對齊方式
    
    回傳:
        str: 格式化的表格字串
    """
    # TODO: 實作表格格式化邏輯
    
    if not data:
        return ''
    
    # TODO: 準備完整資料（包含表頭）
    all_rows = []
    if headers:
        all_rows.append(headers)
    all_rows.extend(data)
    
    # TODO: 計算每欄的最大寬度
    if not all_rows:
        return ''
    
    num_cols = len(all_rows[0]) if all_rows else 0
    col_widths = [0] * num_cols
    
    for row in all_rows:
        for i, cell in enumerate(row):
            if i < len(col_widths):
                col_widths[i] = max(col_widths[i], len(str(cell)))
    
    # TODO: 格式化每一行
    formatted_rows = []
    for i, row in enumerate(all_rows):
        formatted_cells = []
        for j, cell in enumerate(row):
            if j < len(col_widths):
                # TODO: 根據對齊方式格式化
                if align == 'left':
                    formatted_cell = str(cell).ljust(col_widths[j])
                elif align == 'right':
                    formatted_cell = str(cell).rjust(col_widths[j])
                else:  # center
                    formatted_cell = str(cell).center(col_widths[j])
                formatted_cells.append(formatted_cell)
        
        row_text = ' | '.join(formatted_cells)
        formatted_rows.append(row_text)
        
        # TODO: 在表頭後加分隔線
        if i == 0 and headers:
            separator_line = '-' * len(row_text)
            formatted_rows.append(separator_line)
    
    return '\n'.join(formatted_rows)

# 測試格式化模組
def test_format_module():
    """測試格式化模組的功能"""
    print("📐 測試格式化模組")
    
    # 測試文字對齊
    test_text = "Hello\nWorld"
    print("\n文字對齊 (center, width=10):")
    aligned = align_text(test_text, width=10, alignment='center')
    print(repr(aligned))
    
    # 測試縮排
    print("\n縮排 (4 spaces):")
    indented = indent_lines(test_text, indent_size=4)
    print(repr(indented))
    
    # 測試多欄顯示
    items = ['Apple', 'Banana', 'Cherry', 'Date', 'Elderberry']
    print("\n多欄顯示 (2 columns):")
    columns = create_columns(items, columns=2)
    print(columns)
    
    # 測試表格格式化
    headers = ['Name', 'Age', 'City']
    data = [['Alice', '25', 'New York'], ['Bob', '30', 'London']]
    print("\n表格格式化:")
    table = format_table(data, headers)
    print(table)

# 取消註解來測試
# test_format_module()

## 🔬 模組 5: 文字分析模組 (Analysis)

### 💡 Ch12 重點：複雜邏輯的函式分解
- 將複雜分析分解為小函式
- 演算法的模組化實作
- 資料結構的有效運用

In [None]:
def analyze_sentences(text):
    """
    句子分析
    
    參數:
        text (str): 要分析的文字
    
    回傳:
        dict: 句子分析結果
    """
    # TODO: 實作句子分析邏輯
    
    if not text.strip():
        return {
            'sentence_count': 0,
            'sentences': [],
            'average_sentence_length': 0.0,
            'longest_sentence': '',
            'shortest_sentence': ''
        }
    
    # TODO: 分割句子（簡化版，以 .!? 為分隔）
    import re
    sentences = re.split(r'[.!?]+', text)
    
    # TODO: 清理句子（移除空白句子）
    clean_sentences = []
    for sentence in sentences:
        clean_sentence = sentence.strip()
        if clean_sentence:
            clean_sentences.append(clean_sentence)
    
    if not clean_sentences:
        return {
            'sentence_count': 0,
            'sentences': [],
            'average_sentence_length': 0.0,
            'longest_sentence': '',
            'shortest_sentence': ''
        }
    
    # TODO: 計算句子長度統計
    sentence_lengths = [len(sentence) for sentence in clean_sentences]
    average_length = sum(sentence_lengths) / len(sentence_lengths)
    
    # TODO: 找出最長和最短句子
    longest_sentence = max(clean_sentences, key=len)
    shortest_sentence = min(clean_sentences, key=len)
    
    return {
        'sentence_count': len(clean_sentences),
        'sentences': clean_sentences,
        'average_sentence_length': average_length,
        'longest_sentence': longest_sentence,
        'shortest_sentence': shortest_sentence
    }

def detect_duplicates(text, min_length=5):
    """
    檢測重複片段
    
    參數:
        text (str): 要檢測的文字
        min_length (int): 最小重複長度
    
    回傳:
        list: 重複片段列表
    """
    # TODO: 實作重複片段檢測邏輯
    
    if not text or min_length <= 0:
        return []
    
    # TODO: 產生所有可能的子字串
    fragments = {}
    text_length = len(text)
    
    for i in range(text_length):
        for j in range(i + min_length, text_length + 1):
            fragment = text[i:j]
            
            # TODO: 統計片段出現次數
            if fragment in fragments:
                fragments[fragment]['count'] += 1
                fragments[fragment]['positions'].append(i)
            else:
                fragments[fragment] = {
                    'count': 1,
                    'positions': [i]
                }
    
    # TODO: 過濾出真正的重複片段
    duplicates = []
    for fragment, info in fragments.items():
        if info['count'] > 1:
            duplicates.append({
                'fragment': fragment,
                'count': info['count'],
                'positions': info['positions']
            })
    
    # TODO: 按重複次數排序
    duplicates.sort(key=lambda x: x['count'], reverse=True)
    
    return duplicates

def calculate_readability_score(text):
    """
    計算文字可讀性分數（簡化版）
    
    參數:
        text (str): 要分析的文字
    
    回傳:
        dict: 可讀性分析結果
    """
    # TODO: 實作可讀性分析邏輯
    
    if not text.strip():
        return {
            'avg_sentence_length': 0.0,
            'avg_word_length': 0.0,
            'complexity_score': 0.0,
            'difficulty_level': 'Easy'
        }
    
    # TODO: 使用已有的分析函式
    sentence_analysis = analyze_sentences(text)
    word_analysis = count_words(text)  # 需要從模組 1 匯入
    
    # TODO: 計算平均句長和詞長
    avg_sentence_length = sentence_analysis['average_sentence_length']
    avg_word_length = word_analysis['average_word_length']
    
    # TODO: 計算複雜度分數（簡化公式）
    # 複雜度 = (平均句長 × 0.4) + (平均詞長 × 0.6) × 10
    complexity_score = (avg_sentence_length * 0.4 + avg_word_length * 0.6) * 10
    
    # TODO: 判定難度等級
    if complexity_score < 30:
        difficulty_level = 'Easy'
    elif complexity_score < 60:
        difficulty_level = 'Medium'
    else:
        difficulty_level = 'Hard'
    
    return {
        'avg_sentence_length': avg_sentence_length,
        'avg_word_length': avg_word_length,
        'complexity_score': complexity_score,
        'difficulty_level': difficulty_level
    }

# 測試分析模組
def test_analysis_module():
    """測試分析模組的功能"""
    test_text = """Hello world! This is a test. 
    Python is great. Python makes programming fun!
    Programming is an art. Art is beautiful."""
    
    print("🔬 測試分析模組")
    
    # 測試句子分析
    sentence_result = analyze_sentences(test_text)
    print("\n句子分析:", sentence_result)
    
    # 測試重複檢測
    duplicate_result = detect_duplicates(test_text, min_length=3)
    print("\n重複檢測:", duplicate_result[:3])  # 只顯示前3個
    
    # 測試可讀性分析
    readability_result = calculate_readability_score(test_text)
    print("\n可讀性分析:", readability_result)

# 取消註解來測試
# test_analysis_module()

## 🔄 模組 6: 遞迴檔案處理 (Recursive) [進階]

### 💡 Ch15 重點：遞迴思維
- 遞迴三要素：基本情況、遞迴情況、狀態改變
- 遞迴在實際問題中的應用
- 避免無限遞迴的防護機制

In [None]:
def search_files_recursive(directory, pattern, file_extension='.txt', max_depth=5):
    """
    遞迴搜尋目錄中的文字檔案
    展示 Ch15 遞迴思維的核心概念
    
    參數:
        directory (str): 搜尋目錄路徑
        pattern (str): 搜尋模式
        file_extension (str): 檔案副檔名
        max_depth (int): 最大搜尋深度
    
    回傳:
        list: 搜尋結果列表
    """
    import os
    
    def _recursive_search(current_dir, current_depth):
        """
        內部遞迴函式
        展示 Ch15 遞迴的三要素
        """
        results = []
        
        # TODO: 基本情況 (Base Case) - Ch15 重點
        if current_depth >= max_depth:
            return results
        
        try:
            items = os.listdir(current_dir)
        except (PermissionError, FileNotFoundError):
            return results
        
        for item in items:
            item_path = os.path.join(current_dir, item)
            
            if os.path.isfile(item_path) and item.endswith(file_extension):
                # TODO: 處理檔案
                try:
                    with open(item_path, 'r', encoding='utf-8') as f:
                        content = f.read()
                        if pattern in content:
                            results.append({
                                'file_path': item_path,
                                'matches': content.count(pattern),
                                'depth': current_depth,
                                'file_size': len(content)
                            })
                except (UnicodeDecodeError, PermissionError):
                    continue
            
            elif os.path.isdir(item_path):
                # TODO: 遞迴情況 (Recursive Case) - Ch15 重點
                # 狀態改變：深度遞增
                sub_results = _recursive_search(item_path, current_depth + 1)
                results.extend(sub_results)
        
        return results
    
    # TODO: 開始遞迴搜尋
    return _recursive_search(directory, 0)

def count_pattern_recursive(text, pattern):
    """
    遞迴計算模式出現次數
    展示 Ch15 遞迴思維（教學目的）
    
    參數:
        text (str): 要搜尋的文字
        pattern (str): 搜尋模式
    
    回傳:
        int: 模式出現次數
    
    注意: 這是展示遞迴思維的練習，實際應用中直接使用 text.count() 更高效
    """
    # TODO: 實作遞迴計數邏輯
    # 展示 Ch15 遞迴的三要素
    
    # 基本情況 1: 文字或模式為空
    if not text or not pattern:
        return 0
    
    # 基本情況 2: 文字長度小於模式長度
    if len(text) < len(pattern):
        return 0
    
    # TODO: 檢查文字開頭是否匹配模式
    if text.startswith(pattern):
        # 遞迴情況 1: 找到匹配，繼續搜尋剩餘部分
        return 1 + count_pattern_recursive(text[len(pattern):], pattern)
    else:
        # 遞迴情況 2: 沒找到匹配，搜尋下一個字元開始的子字串
        return count_pattern_recursive(text[1:], pattern)

def parse_nested_structure(text, open_tag='[', close_tag=']'):
    """
    遞迴解析巢狀結構（如括號匹配）
    展示 Ch15 遞迴在複雜資料結構處理中的應用
    
    參數:
        text (str): 要解析的文字
        open_tag (str): 開始標記
        close_tag (str): 結束標記
    
    回傳:
        dict: 解析結果
    """
    # TODO: 實作巢狀結構解析
    # 這是遞迴的進階應用
    
    def _parse_recursive(text, pos, depth):
        """
        內部遞迴解析函式
        """
        structure = []
        current_text = ''
        max_depth_seen = depth
        
        i = pos
        while i < len(text):
            char = text[i]
            
            if char == open_tag:
                # TODO: 遇到開始標記，遞迴處理內部結構
                if current_text:
                    structure.append(current_text)
                    current_text = ''
                
                # 遞迴解析內部結構
                inner_structure, next_pos, inner_max_depth = _parse_recursive(text, i + 1, depth + 1)
                structure.append(inner_structure)
                max_depth_seen = max(max_depth_seen, inner_max_depth)
                i = next_pos
                
            elif char == close_tag:
                # TODO: 遇到結束標記，結束當前層級
                if current_text:
                    structure.append(current_text)
                return structure, i + 1, max_depth_seen
            
            else:
                # TODO: 普通字元，累積到當前文字
                current_text += char
                i += 1
        
        # TODO: 處理文字結尾
        if current_text:
            structure.append(current_text)
        
        return structure, len(text), max_depth_seen
    
    # TODO: 檢查結構是否平衡
    open_count = text.count(open_tag)
    close_count = text.count(close_tag)
    is_balanced = (open_count == close_count)
    
    # TODO: 開始解析
    structure, _, max_depth = _parse_recursive(text, 0, 0)
    
    return {
        'is_balanced': is_balanced,
        'max_depth': max_depth,
        'structure': structure
    }

# 測試遞迴模組
def test_recursive_module():
    """測試遞迴模組的功能"""
    print("🔄 測試遞迴模組 (Ch15 重點)")
    
    # 測試遞迴計數
    test_text = "Python is great. Python rocks. Python!"
    count = count_pattern_recursive(test_text, "Python")
    print(f"\n遞迴計數 'Python': {count}")
    
    # 測試巢狀結構解析
    nested_text = "[A[B[C]D]E]"
    parsed = parse_nested_structure(nested_text)
    print(f"\n巢狀結構解析: {parsed}")
    
    # 測試檔案搜尋（注意：需要實際目錄）
    print("\n檔案搜尋功能已實作，需要指定實際目錄路徑進行測試")

# 取消註解來測試
# test_recursive_module()

## 🧩 模組 7: 函式式程式設計 (Functional) [進階]

### 💡 Ch14 重點：高階函式進階應用
- 函式組合與流水線設計
- reduce 函式的實際應用
- 高階函式工廠的建立

In [None]:
def create_text_pipeline(*operations):
    """
    建立文字處理流水線（展示函式組合）
    展示 Ch14 函式組合的進階概念
    
    參數:
        *operations: 可變數量的處理函式
    
    回傳:
        function: 組合後的處理函式
    """
    # TODO: 實作函式組合邏輯
    # 這展示了 Ch14 函式式程式設計的核心概念
    
    def pipeline(text):
        """
        流水線處理函式
        依序套用所有操作
        """
        result = text
        
        # TODO: 依序套用所有操作
        for operation in operations:
            result = operation(result)
        
        return result
    
    return pipeline

def apply_text_filters(text_list, *filters):
    """
    依序套用多個過濾器（展示 filter 函式連鎖）
    展示 Ch14 filter 函式的進階應用
    
    參數:
        text_list (list): 文字列表
        *filters: 可變數量的過濾函式
    
    回傳:
        list: 過濾後的文字列表
    """
    # TODO: 實作過濾器連鎖邏輯
    
    result = text_list
    
    # TODO: 依序套用所有過濾器
    for filter_func in filters:
        result = list(filter(filter_func, result))
    
    return result

def reduce_text_analysis(text_list, analysis_func):
    """
    使用 reduce 進行文字分析聚合
    展示 Ch14 reduce 函式的實際應用
    
    參數:
        text_list (list): 文字列表
        analysis_func (callable): 分析函式
    
    回傳:
        dict: 聚合分析結果
    """
    # TODO: 實作 reduce 聚合邏輯
    from functools import reduce
    
    if not text_list:
        return {}
    
    # TODO: 使用 reduce 函式聚合分析結果
    def combine_analysis(acc, text):
        """
        組合分析結果的函式
        """
        return analysis_func(acc, text)
    
    # TODO: 從空字典開始聚合
    initial_value = {}
    result = reduce(combine_analysis, text_list, initial_value)
    
    return result

def create_custom_filters():
    """
    建立常用的 Lambda 過濾器集合
    展示 Ch14 高階函式工廠的概念
    
    回傳:
        dict: 過濾器字典
    """
    # TODO: 建立過濾器工廠
    # 這展示了 Ch14 高階函式返回函式的概念
    
    filters = {
        # 基本過濾器
        'non_empty': lambda text: text.strip() != '',
        
        # 高階過濾器工廠（返回函式的函式）
        'min_length': lambda min_len: lambda text: len(text) >= min_len,
        
        'max_length': lambda max_len: lambda text: len(text) <= max_len,
        
        'contains_keyword': lambda keyword: lambda text: keyword.lower() in text.lower(),
        
        'starts_with': lambda prefix: lambda text: text.lower().startswith(prefix.lower()),
        
        'ends_with': lambda suffix: lambda text: text.lower().endswith(suffix.lower()),
        
        # 複雜過濾器
        'word_count_range': lambda min_words, max_words: (
            lambda text: min_words <= len(text.split()) <= max_words
        ),
        
        'contains_any': lambda keywords: (
            lambda text: any(keyword.lower() in text.lower() for keyword in keywords)
        ),
        
        'contains_all': lambda keywords: (
            lambda text: all(keyword.lower() in text.lower() for keyword in keywords)
        )
    }
    
    return filters

# 進階功能：函式組合器
def compose_functions(*functions):
    """
    函式組合器 - 進階函式式程式設計概念
    
    參數:
        *functions: 要組合的函式列表
    
    回傳:
        function: 組合後的函式
    """
    # TODO: 實作函式組合器
    from functools import reduce
    
    def compose_two(f, g):
        """組合兩個函式"""
        return lambda x: f(g(x))
    
    # TODO: 使用 reduce 組合多個函式
    return reduce(compose_two, functions, lambda x: x)

# 測試函式式程式設計模組
def test_functional_module():
    """測試函式式程式設計模組的功能"""
    print("🧩 測試函式式程式設計模組 (Ch14 進階)")
    
    # 測試文字處理流水線
    pipeline = create_text_pipeline(
        lambda x: x.lower(),
        lambda x: x.replace(' ', '_'),
        lambda x: x.strip()
    )
    result = pipeline("  Hello World  ")
    print(f"\n流水線處理: '{result}'")
    
    # 測試過濾器連鎖
    texts = ["hello", "", "world", "python", "hi"]
    filtered = apply_text_filters(
        texts,
        lambda x: x != "",      # 移除空字串
        lambda x: len(x) > 4    # 保留長度 > 4 的詞
    )
    print(f"\n過濾器連鎖: {filtered}")
    
    # 測試自訂過濾器工廠
    filters = create_custom_filters()
    
    # 建立長度過濾器
    min_5_filter = filters['min_length'](5)
    print(f"\n長度過濾器測試: min_5_filter('hello') = {min_5_filter('hello')}")
    
    # 建立關鍵字過濾器
    python_filter = filters['contains_keyword']('python')
    print(f"關鍵字過濾器測試: python_filter('I love Python') = {python_filter('I love Python')}")
    
    # 測試 reduce 聚合
    def word_count_aggregator(acc, text):
        word_count = len(text.split())
        return {
            'total_texts': acc.get('total_texts', 0) + 1,
            'total_words': acc.get('total_words', 0) + word_count,
            'max_words': max(acc.get('max_words', 0), word_count)
        }
    
    aggregate_result = reduce_text_analysis(
        ["Hello world", "Python is great", "Programming"],
        word_count_aggregator
    )
    print(f"\nReduce 聚合結果: {aggregate_result}")

# 取消註解來測試
# test_functional_module()

## 🔧 系統整合與主程式

### 💡 綜合應用：整合所有模組
- 展示 Ch12 模組化設計的威力
- 建立完整的系統架構
- 提供使用者友善的介面

In [None]:
def create_text_toolkit():
    """
    建立文字處理工具箱主介面
    展示 Ch12 模組化設計的完整應用
    
    回傳:
        dict: 工具箱字典，包含所有模組功能
    """
    # TODO: 建立完整的工具箱字典
    # 這展示了 Ch12 模組化設計的概念
    
    toolkit = {
        'statistics': {
            'count_characters': count_characters,
            'count_words': count_words,
            'count_lines': count_lines,
            'analyze_text_statistics': analyze_text_statistics
        },
        'search': {
            'find_keyword': find_keyword,
            'find_multiple_keywords': find_multiple_keywords,
            'search_in_lines': search_in_lines
        },
        'transform': {
            'transform_case': transform_case,
            'replace_text_advanced': replace_text_advanced,
            'create_text_transformer': create_text_transformer,
            'batch_transform_texts': batch_transform_texts
        },
        'format': {
            'align_text': align_text,
            'indent_lines': indent_lines,
            'create_columns': create_columns,
            'format_table': format_table
        },
        'analysis': {
            'analyze_sentences': analyze_sentences,
            'detect_duplicates': detect_duplicates,
            'calculate_readability_score': calculate_readability_score
        },
        # 進階模組（選做）
        'recursive': {
            'search_files_recursive': search_files_recursive,
            'count_pattern_recursive': count_pattern_recursive,
            'parse_nested_structure': parse_nested_structure
        },
        'functional': {
            'create_text_pipeline': create_text_pipeline,
            'apply_text_filters': apply_text_filters,
            'reduce_text_analysis': reduce_text_analysis,
            'create_custom_filters': create_custom_filters
        }
    }
    
    return toolkit

def interactive_menu():
    """
    互動式選單系統
    """
    toolkit = create_text_toolkit()
    
    while True:
        print("\n" + "="*60)
        print("🔧 文字處理工具箱 v1.0")
        print("="*60)
        print("1. 文字統計分析")
        print("2. 文字搜尋功能")
        print("3. 文字轉換工具")
        print("4. 文字格式化")
        print("5. 文字深度分析")
        print("6. 遞迴檔案處理 (進階)")
        print("7. 函式式處理 (進階)")
        print("8. 執行完整測試")
        print("0. 結束程式")
        
        choice = input("\n請選擇功能 (0-8): ")
        
        if choice == "0":
            print("\n感謝使用文字處理工具箱！")
            break
        elif choice in ["1", "2", "3", "4", "5", "6", "7"]:
            handle_menu_choice(choice, toolkit)
        elif choice == "8":
            run_complete_test()
        else:
            print("❌ 無效選擇，請重新輸入！")

def handle_menu_choice(choice, toolkit):
    """
    處理選單選擇
    
    參數:
        choice (str): 使用者選擇
        toolkit (dict): 工具箱物件
    """
    # TODO: 實作選單處理邏輯
    # 這裡可以根據選擇呼叫對應的測試函式
    
    menu_map = {
        "1": test_statistics_module,
        "2": test_search_module,
        "3": test_transform_module,
        "4": test_format_module,
        "5": test_analysis_module,
        "6": test_recursive_module,
        "7": test_functional_module
    }
    
    if choice in menu_map:
        print(f"\n{'='*40}")
        menu_map[choice]()
        input("\n按 Enter 繼續...")

def run_complete_test():
    """
    執行完整的工具箱測試
    """
    print("\n🧪 開始完整測試...")
    
    # TODO: 運行所有測試
    test_modules = [
        ("統計模組", test_statistics_module),
        ("搜尋模組", test_search_module),
        ("轉換模組", test_transform_module),
        ("格式化模組", test_format_module),
        ("分析模組", test_analysis_module),
        ("遞迴模組", test_recursive_module),
        ("函式式模組", test_functional_module)
    ]
    
    passed_tests = 0
    total_tests = len(test_modules)
    
    for module_name, test_func in test_modules:
        try:
            print(f"\n{'='*50}")
            print(f"測試 {module_name}...")
            test_func()
            print(f"✅ {module_name} 測試通過")
            passed_tests += 1
        except Exception as e:
            print(f"❌ {module_name} 測試失敗: {e}")
    
    print(f"\n🎉 測試完成: {passed_tests}/{total_tests} 個模組通過測試")
    
    if passed_tests == total_tests:
        print("🏆 恭喜！所有模組都正常運作！")
    else:
        print("⚠️ 部分模組需要檢查，請檢視錯誤訊息並修正")

# 主程式入口
def main():
    """
    主程式入口點
    """
    print("🚀 歡迎使用 Milestone 04: 文字處理工具箱")
    print("這個專案展示了 Ch12-15 的核心概念：")
    print("  • Ch12: 函式設計基礎與模組化")
    print("  • Ch13: 作用域與閉包應用")
    print("  • Ch14: 高階函式與 Lambda")
    print("  • Ch15: 遞迴思維與應用")
    
    try:
        interactive_menu()
    except KeyboardInterrupt:
        print("\n\n程式已中斷，再見！")
    except Exception as e:
        print(f"\n❌ 程式發生錯誤: {e}")
        print("請檢查程式碼並修正錯誤。")

# 取消註解來執行主程式
# if __name__ == "__main__":
#     main()

## 📝 開發提示與注意事項

### 🔍 除錯技巧
1. **逐步實作**: 完成一個函式就立即測試
2. **使用 print()**: 在關鍵位置輸出中間結果
3. **邊界測試**: 測試空字串、None、極端值
4. **例外處理**: 使用 try-except 捕捉可能的錯誤

### 📚 章節重點回顧
- **Ch12**: 注重函式的單一職責與清楚介面
- **Ch13**: 善用閉包保存狀態與配置
- **Ch14**: 熟練運用 map/filter/reduce 與 Lambda
- **Ch15**: 確保遞迴有明確的終止條件

### 🏆 完成檢核
在提交作業前，請確認：
- [ ] 所有 TODO 都已完成
- [ ] 所有測試都能通過
- [ ] 程式碼有適當的註解
- [ ] 函式都有完整的文件字串
- [ ] 展示了各章節的核心概念

---

**🎯 開發目標**: 不只是完成功能，更要展示對 Ch12-15 概念的深度理解！

**💪 加油！記住：優秀的程式設計師不只寫出能運行的程式碼，更寫出清晰、可維護、可擴展的程式碼！**