# 04. 字符串（Strings）

字符串是不可变序列：切片、split/join、格式化、编码/解码是高频必备。

> 约定：Python 3.8；示例尽量只用标准库；代码块可直接运行。


## 前置知识

- 第 01 节：不可变对象
- 第 02 节：数字（格式化会用到）


## 知识点地图

- 1. 字面量与转义：单/双/三引号与原始字符串
- 2. 索引与切片：s[a:b] 与 s[::step]
- 3. 常用方法：strip/split/join/replace
- 4. 查找与判断：in/startswith/endswith/find
- 5. 格式化：f-string 首选
- 6. 编码与 bytes：encode/decode
- 7. 性能坑：循环拼接字符串


## 自检清单（学完打勾）

- [ ] 掌握索引/切片（左闭右开、步长）
- [ ] 掌握常用方法：strip/split/join/replace/find
- [ ] 掌握格式化：f-string 与 format
- [ ] 理解 str 与 bytes 的区别，会正确 encode/decode
- [ ] 知道性能坑：循环拼接应使用 join


## 知识点 1：字面量与转义：单/双/三引号与原始字符串

- 单/双引号：最常用
- 三引号：多行字符串（也常用于 docstring）
- 原始字符串 r''：常用于正则、Windows 路径

（下面演示用换行符构造多行字符串；三引号写法在 markdown 中已介绍。）



In [None]:
s1 = "hello world"
s2 = r"c:\new\test.txt"
s3 = "multi\n line"
print(s1)
print(s2)
print(s3)


hello
 world
c:\new\test.txt
multi
 line


## 知识点 2：索引与切片：s[a:b] 与 s[::step]

切片左闭右开；s[::-1] 可反转字符串（演示用）。


In [4]:
s = 'Python'
print(s[0], s[-1])
print(s[1:4])
print(s[:2], s[2:])
print(s[::2])
print(s[::-1])


P n
yth
Py thon
Pto
nohtyP


## 知识点 3：常用方法：strip/split/join/replace

join 用于把很多段字符串合并为一个字符串（更高效）。


In [None]:
text = '  a,b,c  '
parts = text.strip().split(',')
print(parts)
print('|'.join(parts))
print('hello'.replace('l', 'L'))


## 知识点 4：查找与判断：in/startswith/endswith/find/index

find 找不到返回 -1；index 找不到会抛异常。


In [5]:
s = 'hello world'
print('world' in s)
print(s.startswith('he'), s.endswith('ld'))
print(s.find('world'), s.find('missing'))


True
True True
6 -1


## 知识点 5：格式化：f-string 首选

f-string 可读性强，支持对齐/精度控制等格式规格。
### !s / !r / !a（转换标志）
- !s：str(x)
- !r：repr(x)（调试最常用）
- !a：ascii(x)（把非 ASCII 字符转义成 \u...）
### =（自解释表达式，调试神器）
### :format_spec 格式化迷你语言
- f"|{x:>6}|"   # 右对齐
- f"|{x:<6}|"   # 左对齐
- f"|{x:^6}|"   # 居中
- f"|{x:*^6}|"  # 用 * 填充并居中
### 浮点精度、小数位
- f"{v:.2f}"    # 12.35
- f"{v:10.2f}"  # 宽度 10，小数 2 位
### 整数进制与前缀
- f"{n:b}"   # '11111111'
- f"{n:#x}"  # '0xff'   # 加前缀
- f"{n:08b}" # '11111111' (宽度 8，补 0)
### 千分位分隔
- f"{num:,}"  # '12,345,678'

In [6]:
name = 'Ada'
score = 93.456
print(f'name={name}, score={score:.2f}')
print(f'{name:>10} | {score:8.2f}')


name=Ada, score=93.46
       Ada |    93.46


## 知识点 6：编码与 bytes：encode/decode

str 是文本，bytes 是字节序列；两者不能混用，必须显式转换。


In [7]:
cn = '中文'
b = cn.encode('utf-8')
print(b)
print(b.decode('utf-8'))


b'\xe4\xb8\xad\xe6\x96\x87'
中文


## 知识点 7：性能坑：循环拼接字符串

循环里 s += piece 会频繁创建新对象；推荐收集后 ''.join。


In [None]:
parts = [str(i) for i in range(5)]
print(''.join(parts))


## 常见坑

- 混用 str 与 bytes 会 TypeError（记得 encode/decode）
- 大量拼接用 join 而不是循环 +


## 综合小案例：解析 key=value;key=value

把 host=127.0.0.1;port=8080;debug=true 解析为 dict。


In [None]:
line = 'host=127.0.0.1;port=8080;debug=true'
items = [kv.split('=', 1) for kv in line.split(';')]
config = {k.strip(): v.strip() for k, v in items}
print(config)


## 自测题（不写代码也能回答）

- 为什么字符串是不可变的？
- find 与 index 的区别是什么？
- join 为什么比循环 + 更高效？


## 练习题（建议写代码）

- 实现 normalize_space(s)：把多个空格合并成一个空格，并 strip 首尾空格。
- 实现 safe_split(line, sep=',')：忽略空项与首尾空格。
