# Ch23: 檔案輸入輸出基礎 - 習題解答

本檔案提供 **04-exercises.ipynb** 的完整解答。

## 使用說明
1. ⚠️ **先自行完成習題**，不要直接看解答
2. ✅ 完成後，對照本檔案檢查答案
3. 📝 理解不同解法的優缺點
4. 💡 學習更簡潔或更高效的寫法

---

## 🟢 基礎題解答 (1-6)

### 習題 1 解答：建立並寫入檔案

**解題思路**:
1. 使用 `with open()` 語句確保檔案正確關閉
2. 使用 `'w'` 模式寫入（會覆蓋現有內容）
3. 指定 `encoding='utf-8'` 支援中英文

In [None]:
# 習題 1 參考解答
with open('greeting.txt', 'w', encoding='utf-8') as f:
    f.write('Hello, World!\n')
    f.write('Welcome to Python File I/O\n')

print("檔案建立完成")

**知識點回顧**:
- ✅ `with` 語句自動管理資源（離開區塊時自動關閉檔案）
- ✅ `'w'` 模式會覆蓋現有檔案，若檔案不存在則建立
- ✅ 每行結尾需手動加上 `\n`

**其他解法**:
```python
# 方法 2: 使用多行字串
content = """Hello, World!
Welcome to Python File I/O
"""
with open('greeting.txt', 'w', encoding='utf-8') as f:
    f.write(content)
```

---

### 習題 2 解答：讀取並顯示檔案內容

**解題思路**:
1. 使用 `'r'` 模式開啟檔案
2. 使用 `read()` 讀取全部內容
3. 直接 print 輸出

In [None]:
# 習題 2 參考解答
with open('greeting.txt', 'r', encoding='utf-8') as f:
    content = f.read()
    print(content)

**知識點回顧**:
- ✅ `read()` 讀取整個檔案內容（包含換行符號）
- ✅ `'r'` 是預設模式，可以省略
- ✅ print 會自動顯示換行

**其他解法**:
```python
# 方法 2: 去除結尾多餘空白
with open('greeting.txt', 'r', encoding='utf-8') as f:
    print(f.read().rstrip())
```

---

### 習題 3 解答：統計檔案行數

**解題思路**:
1. 使用 `readlines()` 取得所有行的列表
2. 使用 `len()` 計算列表長度

In [None]:
# 習題 3 參考解答
with open('greeting.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()
    line_count = len(lines)
    print(f"檔案共有 {line_count} 行")

**知識點回顧**:
- ✅ `readlines()` 返回列表，每個元素是一行（包含 `\n`）
- ✅ `len()` 計算列表長度

**其他解法**:
```python
# 方法 2: 逐行計數（記憶體效率更高）
with open('greeting.txt', 'r', encoding='utf-8') as f:
    line_count = sum(1 for line in f)
    print(f"檔案共有 {line_count} 行")
```

---

### 習題 4 解答：附加時間戳記到日誌檔

**解題思路**:
1. 使用 `datetime.now()` 取得當前時間
2. 使用 `strftime()` 格式化時間
3. 使用 `'a'` 模式附加到檔案

In [None]:
# 習題 4 參考解答
from datetime import datetime

def log_message(message):
    """將訊息附加到日誌檔"""
    timestamp = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    log_entry = f"[{timestamp}] {message}\n"
    
    with open('log.txt', 'a', encoding='utf-8') as f:
        f.write(log_entry)

# 測試
log_message('使用者登入成功')
log_message('執行資料備份')
log_message('系統關閉')

# 驗證
with open('log.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ `strftime()` 格式化時間：`%Y-%m-%d %H:%M:%S`
- ✅ `'a'` 模式附加內容，不會覆蓋現有內容
- ✅ f-string 格式化字串

**常見錯誤**:
- ❌ 忘記加上換行符號 `\n`
- ❌ 使用 `'w'` 模式會覆蓋之前的日誌

---

### 習題 5 解答：讀取檔案前 N 行

**解題思路**:
1. 開啟檔案並迭代
2. 使用計數器或切片取前 n 行
3. 返回列表

In [None]:
# 習題 5 參考解答
def read_n_lines(filename, n):
    """讀取檔案前 n 行"""
    with open(filename, 'r', encoding='utf-8') as f:
        lines = []
        for i, line in enumerate(f):
            if i >= n:
                break
            lines.append(line.rstrip('\n'))
        return lines

# 測試
lines = read_n_lines('log.txt', 2)
for line in lines:
    print(line)

**知識點回顧**:
- ✅ `enumerate()` 同時取得索引和值
- ✅ `rstrip('\n')` 去除行尾換行符號
- ✅ 提前 `break` 避免讀取整個檔案（效率考量）

**其他解法**:
```python
# 方法 2: 使用列表切片（簡潔但讀取所有行）
def read_n_lines(filename, n):
    with open(filename, 'r', encoding='utf-8') as f:
        return [line.rstrip('\n') for line in f.readlines()[:n]]
```

---

### 習題 6 解答：反轉檔案內容（行順序）

**解題思路**:
1. 讀取所有行到列表
2. 使用 `reversed()` 或 `[::-1]` 反轉
3. 寫入新檔案

In [None]:
# 習題 6 參考解答
with open('greeting.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()

with open('greeting_reversed.txt', 'w', encoding='utf-8') as f:
    f.writelines(reversed(lines))

# 驗證
with open('greeting_reversed.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ `reversed()` 返回反轉的迭代器
- ✅ `writelines()` 寫入多行（列表或迭代器）
- ✅ 不需手動加 `\n`，因為原本就有

**其他解法**:
```python
# 方法 2: 使用切片反轉
with open('greeting.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()

with open('greeting_reversed.txt', 'w', encoding='utf-8') as f:
    f.writelines(lines[::-1])
```

---

## 🟡 進階題解答 (7-12)

### 習題 7 解答：單字計數器

**解題思路**:
1. 讀取檔案所有內容
2. 使用 `split()` 分割單字
3. 使用字典統計次數
4. 寫入結果到新檔案

In [None]:
# 習題 7 參考解答
# 讀取檔案並統計單字
word_count = {}

with open('text.txt', 'r', encoding='utf-8') as f:
    for line in f:
        words = line.split()
        for word in words:
            # 移除標點符號並轉小寫（可選）
            word = word.strip('.,!?')
            if word:
                word_count[word] = word_count.get(word, 0) + 1

# 寫入結果
with open('word_count.txt', 'w', encoding='utf-8') as f:
    for word, count in word_count.items():
        f.write(f"{word}: {count}\n")

# 驗證
with open('word_count.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ `split()` 以空白分割字串
- ✅ `dict.get(key, default)` 取值，不存在時返回預設值
- ✅ 字典累加模式：`count[key] = count.get(key, 0) + 1`

**其他解法**:
```python
# 方法 2: 使用 Counter
from collections import Counter

with open('text.txt', 'r', encoding='utf-8') as f:
    words = f.read().split()
    word_count = Counter(words)

with open('word_count.txt', 'w', encoding='utf-8') as f:
    for word, count in word_count.items():
        f.write(f"{word}: {count}\n")
```

---

### 習題 8 解答：檔案合併器

**解題思路**:
1. 迭代檔案列表
2. 讀取每個檔案內容
3. 寫入時加上分隔線和檔名

In [None]:
# 習題 8 參考解答
def merge_files(file_list, output_file):
    """合併多個檔案"""
    with open(output_file, 'w', encoding='utf-8') as outfile:
        for i, filename in enumerate(file_list):
            # 寫入分隔線（第一個檔案前不加空行）
            if i > 0:
                outfile.write('\n')
            
            outfile.write(f"--- {filename} ---\n")
            
            # 讀取並寫入檔案內容
            try:
                with open(filename, 'r', encoding='utf-8') as infile:
                    outfile.write(infile.read())
            except FileNotFoundError:
                outfile.write(f"[錯誤：檔案 {filename} 不存在]\n")

# 測試
merge_files(['file1.txt', 'file2.txt', 'file3.txt'], 'merged.txt')

# 驗證
with open('merged.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ 巢狀 `with` 語句：外層寫入，內層讀取
- ✅ `enumerate()` 判斷是否為第一個元素
- ✅ 異常處理：捕捉檔案不存在錯誤

**最佳實務**:
- 處理檔案不存在的情況
- 格式化輸出便於閱讀

---

### 習題 9 解答：檔案分割器

**解題思路**:
1. 讀取所有行
2. 使用切片分組
3. 寫入不同的檔案

In [None]:
# 習題 9 參考解答
def split_file(filename, lines_per_file):
    """分割檔案"""
    # 讀取所有行
    with open(filename, 'r', encoding='utf-8') as f:
        lines = f.readlines()
    
    # 計算需要幾個檔案
    import math
    num_files = math.ceil(len(lines) / lines_per_file)
    
    # 分割並寫入
    base_name = filename.rsplit('.', 1)[0]  # 去除副檔名
    
    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file
        part_lines = lines[start:end]
        
        part_filename = f"{base_name}_part{i+1}.txt"
        with open(part_filename, 'w', encoding='utf-8') as f:
            f.writelines(part_lines)
        
        print(f"已建立：{part_filename} ({len(part_lines)} 行)")

# 測試
split_file('large.txt', 3)

**知識點回顧**:
- ✅ `math.ceil()` 無條件進位
- ✅ `rsplit('.', 1)` 從右側分割，只分割一次
- ✅ 列表切片 `[start:end]`
- ✅ f-string 格式化檔名

**常見錯誤**:
- ❌ 忘記處理最後一個檔案可能不足 n 行的情況
- ❌ 檔名編號從 0 開始（應從 1 開始較直觀）

---

### 習題 10 解答：行號生成器

**解題思路**:
1. 逐行讀取
2. 使用 `enumerate()` 取得行號
3. 格式化後寫入

In [None]:
# 習題 10 參考解答
def add_line_numbers(input_file, output_file):
    """為每行加上行號"""
    with open(input_file, 'r', encoding='utf-8') as infile:
        with open(output_file, 'w', encoding='utf-8') as outfile:
            for i, line in enumerate(infile, start=1):
                # 去除原有換行，加上行號後再加回換行
                numbered_line = f"{i}: {line.rstrip()}\n"
                outfile.write(numbered_line)

# 測試
add_line_numbers('greeting.txt', 'greeting_numbered.txt')

# 驗證
with open('greeting_numbered.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ `enumerate(iterable, start=1)` 從 1 開始編號
- ✅ `rstrip()` 去除行尾空白（包含換行）
- ✅ 巢狀 `with` 語句同時開啟兩個檔案

**其他解法**:
```python
# 方法 2: 使用 readlines()
def add_line_numbers(input_file, output_file):
    with open(input_file, 'r', encoding='utf-8') as f:
        lines = f.readlines()
    
    with open(output_file, 'w', encoding='utf-8') as f:
        for i, line in enumerate(lines, start=1):
            f.write(f"{i}: {line}")
```

---

### 習題 11 解答：重複行移除器

**解題思路**:
1. 使用集合記錄已見過的行
2. 遇到重複行時跳過
3. 保持原有順序

In [None]:
# 習題 11 參考解答
def remove_duplicates(input_file, output_file):
    """移除重複行"""
    seen = set()
    
    with open(input_file, 'r', encoding='utf-8') as infile:
        with open(output_file, 'w', encoding='utf-8') as outfile:
            for line in infile:
                # 使用 strip 的版本作為鍵（避免空白差異）
                key = line.strip()
                if key not in seen:
                    seen.add(key)
                    outfile.write(line)

# 測試
remove_duplicates('duplicates.txt', 'unique.txt')

# 驗證
with open('unique.txt', 'r', encoding='utf-8') as f:
    print(f.read())

**知識點回顧**:
- ✅ 集合 `set()` 用於快速查找
- ✅ `strip()` 去除空白後作為鍵，避免空白差異
- ✅ 保持原有順序（Python 3.7+ 字典有序）

**其他解法**:
```python
# 方法 2: 使用字典保持順序（更明確）
def remove_duplicates(input_file, output_file):
    unique_lines = {}
    with open(input_file, 'r', encoding='utf-8') as f:
        for line in f:
            unique_lines[line.strip()] = line
    
    with open(output_file, 'w', encoding='utf-8') as f:
        f.writelines(unique_lines.values())
```

---

### 習題 12 解答：檔案編碼轉換

**解題思路**:
1. 用原編碼讀取內容
2. 用新編碼寫入
3. 處理可能的編碼錯誤

In [None]:
# 習題 12 參考解答
def convert_encoding(input_file, output_file, from_enc='big5', to_enc='utf-8'):
    """轉換檔案編碼"""
    try:
        # 用原編碼讀取
        with open(input_file, 'r', encoding=from_enc) as f:
            content = f.read()
        
        # 用新編碼寫入
        with open(output_file, 'w', encoding=to_enc) as f:
            f.write(content)
        
        print(f"轉換成功：{input_file} ({from_enc}) → {output_file} ({to_enc})")
        
    except UnicodeDecodeError as e:
        print(f"編碼錯誤：無法用 {from_enc} 解碼 {input_file}")
        print(f"錯誤訊息：{e}")
    except FileNotFoundError:
        print(f"檔案不存在：{input_file}")

# 測試
convert_encoding('big5_file.txt', 'utf8_file.txt')

**知識點回顧**:
- ✅ 編碼轉換：先解碼（讀取）再編碼（寫入）
- ✅ 捕捉 `UnicodeDecodeError` 處理編碼錯誤
- ✅ 提供友善的錯誤訊息

**常見編碼**:
- `utf-8`: 國際通用，支援所有字元
- `big5`: 繁體中文（台灣常用）
- `gbk`: 簡體中文
- `cp950`: Windows Big5

---

## 🔴 挑戰題解答 (13-18)

### 習題 13 解答：簡易文字編輯器

**解題思路**:
1. 使用類別封裝檔案操作
2. 提供讀取、寫入、附加、替換行功能
3. 替換行需要讀取所有行，修改後寫回

In [None]:
# 習題 13 參考解答
class TextEditor:
    """簡易文字編輯器"""
    
    def read(self, filename):
        """讀取檔案"""
        try:
            with open(filename, 'r', encoding='utf-8') as f:
                return f.read()
        except FileNotFoundError:
            return f"錯誤：檔案 {filename} 不存在"
    
    def write(self, filename, content):
        """寫入檔案"""
        with open(filename, 'w', encoding='utf-8') as f:
            f.write(content)
        return f"已寫入 {filename}"
    
    def append(self, filename, content):
        """附加內容"""
        with open(filename, 'a', encoding='utf-8') as f:
            f.write(content)
        return f"已附加至 {filename}"
    
    def replace_line(self, filename, line_num, new_content):
        """替換指定行（行號從 1 開始）"""
        try:
            # 讀取所有行
            with open(filename, 'r', encoding='utf-8') as f:
                lines = f.readlines()
            
            # 檢查行號是否有效
            if line_num < 1 or line_num > len(lines):
                return f"錯誤：行號 {line_num} 超出範圍（共 {len(lines)} 行）"
            
            # 替換指定行（索引從 0 開始）
            lines[line_num - 1] = new_content
            
            # 寫回檔案
            with open(filename, 'w', encoding='utf-8') as f:
                f.writelines(lines)
            
            return f"已替換第 {line_num} 行"
        
        except FileNotFoundError:
            return f"錯誤：檔案 {filename} 不存在"

# 測試
editor = TextEditor()
print(editor.write('test.txt', 'Line 1\nLine 2\nLine 3\n'))
print(editor.read('test.txt'))
print(editor.replace_line('test.txt', 2, 'Modified Line 2\n'))
print(editor.read('test.txt'))

**知識點回顧**:
- ✅ 類別封裝相關功能
- ✅ 行號轉索引：`line_num - 1`
- ✅ 邊界檢查：防止索引超出範圍
- ✅ 異常處理：檔案不存在

**最佳實務**:
- 提供友善的錯誤訊息
- 返回操作結果
- 檢查輸入有效性

---

### 習題 14 解答：日誌檔分析器

**解題思路**:
1. 逐行讀取日誌
2. 使用正規表達式或字串方法提取等級
3. 統計各等級數量

In [None]:
# 習題 14 參考解答
def analyze_log(filename):
    """分析日誌檔"""
    log_levels = {'INFO': 0, 'WARNING': 0, 'ERROR': 0}
    
    with open(filename, 'r', encoding='utf-8') as f:
        for line in f:
            # 提取日誌等級
            if 'INFO:' in line:
                log_levels['INFO'] += 1
            elif 'WARNING:' in line:
                log_levels['WARNING'] += 1
            elif 'ERROR:' in line:
                log_levels['ERROR'] += 1
    
    # 輸出統計結果
    print("日誌分析結果：")
    for level, count in log_levels.items():
        print(f"{level}: {count} 筆")
    print(f"總計: {sum(log_levels.values())} 筆")

# 測試
analyze_log('system.log')

**知識點回顧**:
- ✅ 字典初始化預設值
- ✅ `in` 運算子檢查子字串
- ✅ `sum(dict.values())` 計算總和

**其他解法（使用正規表達式）**:
```python
import re

def analyze_log(filename):
    log_levels = {}
    pattern = r'\] (\w+):'
    
    with open(filename, 'r', encoding='utf-8') as f:
        for line in f:
            match = re.search(pattern, line)
            if match:
                level = match.group(1)
                log_levels[level] = log_levels.get(level, 0) + 1
    
    for level, count in log_levels.items():
        print(f"{level}: {count} 筆")
```

---

## 總結

通過這 18 題習題，你已經掌握了：

### 核心技能
- ✅ 檔案的讀寫操作（read, write, append）
- ✅ with 語句的正確使用
- ✅ 編碼處理（UTF-8, Big5）
- ✅ 異常處理（FileNotFoundError, UnicodeDecodeError）

### 進階技巧
- ✅ 逐行處理大檔案
- ✅ 檔案合併與分割
- ✅ 文字分析與統計
- ✅ 資料去重與過濾

### 實戰應用
- ✅ 日誌系統
- ✅ 文字編輯器
- ✅ 設定檔管理
- ✅ 檔案比較工具
- ✅ 備份系統

### 下一步
1. 完成 Ch23 自我測驗
2. 學習 Ch24: JSON 與資料序列化
3. 學習 Ch25: CSV 檔案處理
4. 挑戰 Milestone 7: Todo App 專案