# 容器

## 序列（Sequence）

### 序列是什么

序列就是“有顺序的一串数据”，比如列表、元组、字符串，都可以按位置取值、切片、拼接。

In [4]:
seq = [10, 20, 30, 40, 50]

print(seq[0])      # 第一个元素
print(seq[-1])     # 最后一个元素
print(seq[1:4])    # 从索引 1 到 3 的切片
print(len(seq))    # 序列长度
print(30 in seq)   # 成员检查

10
50
[20, 30, 40]
5
True


有了“序列”这个统一概念，你可以用同一套操作去处理列表、元组、字符串等各种有序数据。

### 序列的常见操作

这些操作几乎对所有序列都通用（列表、元组、字符串等）：

In [2]:
a = [1, 2, 3, 4]
b = [5, 6]

print(a[0])      # 索引
print(a[1:3])    # 切片
print(a + b)     # 相加
print(b * 3)     # 乘法
print(2 in a)    # 成员检查
print(max(a), min(a), len(a))   # 最大值、最小值 和长度

1
[2, 3]
[1, 2, 3, 4, 5, 6]
[5, 6, 5, 6, 5, 6]
True
4 1 4


掌握这几招后，换一种序列类型，只要“试一下”通常就能直接用起来。

## 列表（List）

列表是“最常用的可变序列”，适合存一串可以随时增删改的数据。

### 创建列表

In [5]:
nums = [100, 200, 300, 400, 500]
mixed = [1, "hello", True]

print(nums)
print(mixed)


[100, 200, 300, 400, 500]
[1, 'hello', True]


列表可以同时装不同类型的数据，是日常“打包一堆东西”的首选容器。

### 通过索引和切片访问元素

In [6]:
nums = [100, 200, 300, 400, 500]

print(nums[1])      # 正向索引
print(nums[-2])     # 反向索引
print(nums[2:4])    # 切片：索引 2 到 3
print(nums[::-1])   # 反转

200
400
[300, 400]
[500, 400, 300, 200, 100]


通过索引和切片，你可以精准地拿到列表里“第几个”或“一段”数据。

### 添加元素：append / insert

In [7]:
nums = [100, 200, 300, 400, 500]

nums.append(600)       # 末尾追加
nums.insert(2, 700)    # 在索引 2 插入

print(nums)

[100, 200, 700, 300, 400, 500, 600]


这种“拼接 + 重复”的方式能快速构造出你想要的数据结构做测试或初始化。

### 修改列表中的元素（索引 / 切片）

In [8]:
nums = [100, 200, 300, 400, 500]

nums[0] = -1               # 改一个
nums[2:4] = ["a", "b", "c"]  # 改一段

print(nums)

[-1, 200, 'a', 'b', 'c', 500]


列表是可变的，所以你可以直接在原地改内容，而不用重新创建新列表。

### 成员检查、长度、最大值、最小值、加和

In [9]:
nums = [100, 200, 300, 400, 500]

print(100 in nums)
print(len(nums))
print(max(nums), min(nums), sum(nums))

True
5
500 100 1500


这些内置函数让你用一行就能做完“在不在”“有多少”“多大多小”“总共多少”这类常见统计。

### 遍历列表：元素 / 下标 / enumerate

In [10]:
nums = [100, 200, 300, 400, 500]

for x in nums:
    print("值:", x)

for i in range(len(nums)):
    print("下标:", i, "值:", nums[i])

for i, val in enumerate(nums):
    print("下标:", i, "值:", val)

值: 100
值: 200
值: 300
值: 400
值: 500
下标: 0 值: 100
下标: 1 值: 200
下标: 2 值: 300
下标: 3 值: 400
下标: 4 值: 500
下标: 0 值: 100
下标: 1 值: 200
下标: 2 值: 300
下标: 3 值: 400
下标: 4 值: 500


不同遍历方式适合不同场景：只要值就直接 for，既要下标又要值时用 range 或 enumerate 更方便。

### 删除元素：del / pop / remove

In [11]:
nums = [100, 200, 300, 400, 500]

del nums[2]          # 按下标删
print(nums)

popped = nums.pop()  # 删末尾并拿到
print(popped, nums)

nums.remove(200)     # 按值删第一次出现的
print(nums)

[100, 200, 400, 500]
500 [100, 200, 400]
[100, 400]


删除操作配合添加操作，可以让列表在程序运行中“动态变化”。

### 嵌套列表

In [12]:
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

for row in matrix:
    print(row)


[1, 2, 3]
[4, 5, 6]
[7, 8, 9]


嵌套列表非常适合表示二维数据，比如表格、棋盘、像素等。

### 列表推导式

In [13]:
# 基础用法：0~4 的平方
squares = [x ** 2 for x in range(5)]
print(squares)

# 带条件：只保留偶数的平方
even_squares = [x ** 2 for x in range(10) if x % 2 == 0]
print(even_squares)


[0, 1, 4, 9, 16]
[0, 4, 16, 36, 64]


列表推导式让“循环 + 生成新列表”的代码变得非常短，却仍然一眼能看懂。

### zip() 将多个列表按位置配对

In [14]:
ids = [1, 2, 3]
names = ["Alice", "Bob", "Charlie"]

pairs = list(zip(ids, names))
print(pairs)

[(1, 'Alice'), (2, 'Bob'), (3, 'Charlie')]


zip 可以把“多列数据”打包在一起，用起来很像把表格里的每一行组合成一个个小元组。

### 列表常用方法

In [15]:
nums = [3, 1, 2]

nums.append(4)          # 末尾追加
nums.extend([5, 6])     # 拼接另一个可迭代对象
nums.insert(0, 0)       # 在开头插入 0
nums.remove(3)          # 删除第一次出现的 3
last = nums.pop()       # 弹出最后一个元素
nums.sort()             # 排序（默认从小到大）
nums.reverse()          # 反转顺序
print(nums, last)

[5, 4, 2, 1, 0] 6


记住这几个常用方法就够应付大多数日常列表操作了，不需要背方法大全，想不起时用 `dir(list_obj)` 或查文档就行。

## 字符串（String）

字符串就是“一串有顺序的文本”，本质上是一个不可变的字符序列。

### 创建和访问字符串

In [16]:
s = "hello world"

print(s[0])       # 第一个字符
print(s[-1])      # 最后一个字符
print(s[4:-3])    # 从索引 4 到倒数第 4（不含）

h
d
o wo


你可以像操作列表一样按位置访问字符串中的字符，只是字符串不能原地修改。

### 字符串相加和乘法

In [17]:
s1 = "hello "
s2 = "world"

print(s1 + s2)
print(s1 * 3)


hello world
hello hello hello 


用加号和乘号可以快速拼接、重复字符串，适合简单的文本组合。

### 成员检查：子串是否存在

In [18]:
s = "hello world"

print("lo" in s)
print("hi" in s)

True
False


用 `in` 检查子串是否出现过，是最自然的“搜索小段文本”的方式。

### 原始字符串

In [19]:
print("hello\nworld")
print(r"hello\nworld")

hello
world
hello\nworld


原始字符串在写正则表达式、Windows 路径这类包含很多反斜杠的内容时非常省心。

### 字符串常用方法

In [20]:
s = "  hello, world, hello!  "

print(s.replace("hello", "hi"))     # 替换
print(s.split(","))                 # 按逗号拆分
print("-".join(["2025", "11", "11"]))  # 用 - 连接
print(s.strip())                    # 去掉两端空白
print(s.upper())                    # 全部大写
print(s.lower())                    # 全部小写
print(s.find("world"))              # 找子串位置，找不到返回 -1
print(s.startswith("  he"))         # 是否以某段开头
print(s.endswith("!  "))            # 是否以某段结尾

  hi, world, hi!  
['  hello', ' world', ' hello!  ']
2025-11-11
hello, world, hello!
  HELLO, WORLD, HELLO!  
  hello, world, hello!  
9
True
True


掌握这些方法可以应对大部分文本清洗和格式处理场景，剩下的用到再查即可。

## 元组（Tuple）

元组和列表很像，但**不可变**，更适合表示“一组固定的、不会变的数据”。

### 创建元组

In [21]:
t1 = (100, 200, 300, 400, 500)
t2 = (100,)              # 只有一个元素时要加逗号
print(t1, t2)

(100, 200, 300, 400, 500) (100,)


元组一旦创建就不能改内容，用来表示“一个固定的坐标、一条记录”等很合适。

### 访问元组

和列表几乎一样

In [22]:
t = (100, 200, 300, 400, 500)

print(t[2])
print(t[-1])
print(t[1:4])

300
500
(200, 300, 400)


你可以像访问列表一样访问元组，只是不能对元组做赋值修改。

### 元组相加、乘法、成员检查等

In [23]:
t1 = (100, 200, 300)
t2 = ("a", "b", "c")

print(t1 + t2)
print(t1 * 2)
print(300 in t1)
print(len(t1), max(t1), min(t1), sum(t1))

(100, 200, 300, 'a', 'b', 'c')
(100, 200, 300, 100, 200, 300)
True
3 300 100 600


当你需要“像列表那样用起来很方便，但又不希望内容被误改”时，用元组会更安全。

### 元组的“不可变”

In [24]:
t1 = (100, 200, 300)
print(id(t1), t1)

t1 = t1 + (1, 2, 3)
print(id(t1), t1)

t2 = (100, [1, 2, 3])
t2[1].append(4)
print(t2)

4369679360 (100, 200, 300)
4367294784 (100, 200, 300, 1, 2, 3)
(100, [1, 2, 3, 4])


元组本身不可变指的是“指向的对象不能改”，但如果里面装的是列表这种可变对象，列表本身还是可以改的。

## 集合（Set）

集合是一组**无序且不重复**的元素，适合做“去重”和各种数学意义上的集合运算。

### 创建集合

In [25]:
set1 = {1, 2, 3}
set2 = set([1, 2, 2, 3])
empty = set()

print(set1)
print(set2)
print(empty)


{1, 2, 3}
{1, 2, 3}
set()


集合自动帮你去重，是“只关心有没有，不关心有几次和顺序”的场景的好帮手。

### 添加和删除元素

In [26]:
s = {1, 2, 3}

s.add(4)          # 添加元素
s.discard(2)      # 删除元素（不存在也不报错）
print(s)

{1, 3, 4}


集合提供简单的增删操作，让你轻松维护一个“当前有哪些”的元素集合。

### 成员检查、长度、max/min/sum

In [27]:
s = {1, 2, 3, 4, 5}

print(2 in s)
print(len(s))
print(max(s), min(s), sum(s))

True
5
5 1 15


集合的成员检查非常快，所以在需要频繁判断“某个东西在不在”时很适合用 set。

### 集合运算：交集、并集、差集

In [28]:
a = {1, 2, 3, 4}
b = {3, 4, 5}

print(a & b)   # 交集：两个集合都有的
print(a | b)   # 并集：两个集合所有的
print(a - b)   # 差集：只在 a 不在 b 的

{3, 4}
{1, 2, 3, 4, 5}
{1, 2}


这些运算可以让你非常自然地处理“共有的”“只在左边的”“所有的”这种集合逻辑。

## 字典（Dictionary）

字典就是“键值对”的集合，可以理解成“用 key 查 value 的小型数据库”。

### 创建字典

In [29]:
d1 = {}
d2 = dict()
d3 = {"name": "Alice", "age": 18}
d4 = dict(name="Bob", age=20)
d5 = dict([("name", "Tom"), ("age", 22)])

print(d1, d2)
print(d3)
print(d4)
print(d5)

{} {}
{'name': 'Alice', 'age': 18}
{'name': 'Bob', 'age': 20}
{'name': 'Tom', 'age': 22}


字典适合存“有名字的字段”，比如配置、用户信息、统计结果等。

### 访问字典元素

In [30]:
person = {"name": "Alice", "age": 18, "gender": "female"}

print(person["name"])
print(person.get("age"))
print(person.get("address"))           # 不存在：返回 None
print(person.get("address", "earth"))  # 不存在：返回默认值

Alice
18
None
earth


用 `[]` 访问时 key 不存在会报错，而 `get` 可以安全地给个默认值，非常适合“不确定有没有”的场景。

### 添加和修改字典元素

In [31]:
person = {"name": "Alice", "age": 18}

person["address"] = "earth"  # 新增
person["name"] = "Bob"       # 修改

print(person)

{'name': 'Bob', 'age': 18, 'address': 'earth'}


对某个 key 赋值，无论是新 key 还是旧 key，代码看起来都一样，既简单又统一。

### 成员检查、长度

In [32]:
person = {"name": "Alice", "age": 18}

print("name" in person)
print("Alice" in person)
print(len(person))

True
False
2


字典的 `in` 只检查 key 是否存在，长度则是键值对的数量。

### 遍历字典

In [33]:
info = {"name": "Tom", "age": 17}

# 所有 key
for k in info.keys():
    print("key:", k)

print("-" * 20)

# 所有 value
for v in info.values():
    print("value:", v)

print("-" * 20)

# key 和 value 一起
for k, v in info.items():
    print(k, "=>", v)

key: name
key: age
--------------------
value: Tom
value: 17
--------------------
name => Tom
age => 17


遍历 keys、values 或成对的 items，可以让你方便地对整张“表”做处理。

In [None]:
### 删除字典元素与常用方法

In [34]:
person = {"name": "Tom", "age": 17, "city": "Shanghai"}

age = person.pop("age")      # 删除并取出
del person["name"]           # 删除指定 key
person.clear()               # 清空字典
print(age, person)

17 {}


常用的字典方法里，记住 `get`、`pop`、`update`、`keys` / `values` / `items` 就能覆盖大部分需求，其他的用到再查即可。

## 容器对比：列表、元组、集合、字典

下面是一个“只记关键区别”的小对比表：

| 容器类型     | 是否可变 | 是否允许重复          | 是否有序（Python 3.7+ 插入顺序） | 典型定义方式                | 主要用途示例                    |
| -------- | ---- | --------------- | ---------------------- | --------------------- | ------------------------- |
| 列表 List  | 可变   | 允许              | 有序                     | `[1, 2, 3]`           | 一串可增删改的数据                 |
| 元组 Tuple | 不可变  | 允许              | 有序                     | `(1, 2, 3)`           | 固定长度的记录，例如坐标 `(x, y)`     |
| 集合 Set   | 可变   | 不允许（会自动去重）      | 无序                     | `{1, 2, 3}` / `set()` | 去重、集合运算、快速成员检查            |
| 字典 Dict  | 可变   | key 不重复，value 可 | key 按插入顺序保存            | `{"a": 1, "b": 2}`    | “key -> value”的映射，如配置、用户表 |

你大致可以这样记：

* **列表/元组**：关心顺序和“第几个”；
* **集合**：关心“有没有”、做交集并集；
* **字典**：通过“名字（key）”来查“值（value）”。