# 06. 元组、文件及其它（Tuples, Files & More）

元组常用于不可变记录与解包；文件读写推荐 pathlib + with；JSON/CSV 是常见数据交换格式。

> 约定：Python 3.8；示例尽量只用标准库；代码块可直接运行。


## 前置知识

- 第 05 节：列表与字典


## 知识点地图

- 1. 元组：不可变记录与 dict key
- 2. 解包：x, y = point；星号解包
- 3. pathlib：用 Path 拼路径、读写文本
- 4. with open：确保文件关闭
- 5. JSON：dumps/loads 与 ensure_ascii
- 6. CSV（了解）：DictWriter/DictReader


## 自检清单（学完打勾）

- [ ] 掌握元组解包与星号解包
- [ ] 理解元组的典型用途（记录、dict key）
- [ ] 掌握 pathlib 的读写文本与路径拼接
- [ ] 掌握 with 打开文件，确保关闭
- [ ] 会读写 JSON，了解 CSV 的基本处理


## 知识点 1：元组：不可变记录与 dict key

元组不可变，常用于表示一条记录或作为 dict key。


In [2]:
point = (10, 20)
d = {point: 'P1'}
print(d[(10, 20)])


P1


## 知识点 2：解包：x, y = point；星号解包

星号解包可接住中间/尾部的一段，适合不定长数据。


In [None]:
point = (10, 20)
x, y = point
print(x, y)

a, *mid, b = [1, 2, 3, 4, 5]
print(a, mid, b)


## 知识点 3：pathlib：用 Path 拼路径、读写文本

Path 更安全、更可读：base/'file.txt'。


In [3]:
from pathlib import Path
ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())
p = ART / 'demo.txt'
p.write_text('hello\nworld\n', encoding='utf-8')
print(p.read_text(encoding='utf-8'))


artifacts dir: F:\Projects\new\interview\notebooks\_nb_artifacts
hello
world



## 知识点 4：with open：确保文件关闭

with 会在退出时自动关闭文件（即使发生异常）。


In [None]:
from pathlib import Path
ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())
path = ART / 'demo2.txt'
path.write_text('line1\nline2\n', encoding='utf-8')
with path.open('r', encoding='utf-8') as f:
    for line in f:
        print(line.strip())


## 知识点 5：JSON：dumps/loads 与 ensure_ascii

写中文 JSON 推荐 ensure_ascii=False；读取用 loads。


In [None]:
from pathlib import Path
ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())
import json

data = {'name': '中文', 'scores': [100, 98]}
text = json.dumps(data, ensure_ascii=False, indent=2)
(ART / 'data.json').write_text(text, encoding='utf-8')
loaded = json.loads((ART / 'data.json').read_text(encoding='utf-8'))
print(loaded)


## 知识点 6：CSV（了解）：DictWriter/DictReader

csv 常用于表格数据交换；注意 newline 与编码。


In [None]:
from pathlib import Path
ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())
import csv
rows = [
    {'id': '1', 'name': 'Ada'},
    {'id': '2', 'name': 'Bob'},
]

csv_path = ART / 'users.csv'
with csv_path.open('w', encoding='utf-8', newline='') as f:
    w = csv.DictWriter(f, fieldnames=['id', 'name'])
    w.writeheader()
    w.writerows(rows)

with csv_path.open('r', encoding='utf-8', newline='') as f:
    r = csv.DictReader(f)
    print(list(r))


## 常见坑

- 不要忘记编码（推荐 utf-8）
- JSON 不能直接序列化 set（需要转 list）


## 综合小案例：实现 read_lines(path)：返回去掉换行的行列表

用 pathlib + with 读取文件，对每行 rstrip('\n')。


In [None]:
from pathlib import Path
ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())

def read_lines(path):
    path = Path(path)
    with path.open('r', encoding='utf-8') as f:
        return [line.rstrip('\n') for line in f]

p = ART / 'lines.txt'
p.write_text('a\n b\n', encoding='utf-8')
print(read_lines(p))


## 自测题（不写代码也能回答）

- 为什么推荐 pathlib？
- with 保证了什么？
- JSON 为什么不能直接保存 set？


## 练习题（建议写代码）

- 实现 write_json(path, obj)：写入 JSON（utf-8，indent=2）。
- 实现 parse_csv_users(path)：读取 users.csv 返回 dict 列表。
