In [2]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# 组合数据类型
## 列表（list）

### 运算符

In [31]:
# + 与 +=：拼接两个list
l1 = [22, 34, 58, 90]
l2 = [58, 90, 100, 110]

# + 不修改原对象而是返回新对象，且只支持 list 与 list 相加
l1 + l2  # 返回新对象
l1

# += 修改原对象（但不改变其id），而且会自动将其他组合数据类型转换为list再相加
l1 += l2  # 直接作用于原l1，相当于l1.extend(l2)
l1

[22, 34, 58, 90, 58, 90, 100, 110]

[22, 34, 58, 90]

[22, 34, 58, 90, 58, 90, 100, 110]

In [37]:
# * 与 *=：将一个list重复n次
l1 = [22, 34, 58, 90]

l1 * 3  # 将l1重复3次并作为一个新的list返回
l1

l1 *= 3  # 直接在l1上重复3次，修改l1
l1

[22, 34, 58, 90, 22, 34, 58, 90, 22, 34, 58, 90]

[22, 34, 58, 90]

[22, 34, 58, 90, 22, 34, 58, 90, 22, 34, 58, 90]

### list 类型自带方法
| 方法 | 输入参数 | 是否修改原对象 | 是否有返回值 |
|-------|---------|--------------|------------|
| `append(x)` | `x` (添加的元素) | ✅ | ❌ (`None`) |
| `extend(iterable)` | `iterable` (可迭代对象) | ✅ | ❌ (`None`) |
| `insert(i, x)` | `i` (索引), `x` (元素) | ✅ | ❌ (`None`) |
| `remove(x)` | `x` (要删除的元素的值) | ✅ | ❌ (`None`) |
| `clear()` | 无 | ✅ | ❌ (`None`) |
|`sort(key=None, reverse=False)` | `key` (排序函数), `reverse` (是否降序) | ✅ | ❌ (`None`) |
| `reverse()` | 无 | ✅ | ❌ (`None`) |
|`pop(i=-1)` | `i` (索引，默认为最后一个) | ✅ | ✅ (被删除的元素) |
| `index(x, start=0, end=len(lst))` | `x` (元素), `start` (起始索引), `end` (结束索引) | ❌ | ✅ (元素索引) |
| `count(x)` | `x` (计数的元素) | ❌ | ✅ (出现次数) |
| `copy()` | 无 | ❌ | ✅ (列表副本) |

#### 添加

In [7]:
# 末尾添加元素
l = [22, 34, 58, 90]
l.append(100)
l

[22, 34, 58, 90, 100]

In [9]:
# 指定位置添加元素（加到指定索引所在的位置，原来在这个索引上的以及之后的元素统一后移）
l = [22, 34, 58, 90]
index = 2
l.insert(index, 100)
l

[22, 34, 100, 58, 90]

#### 连接

In [4]:
# 末尾续上另一个组合类型（直接修改原序列）
l1 = [22, 34, 58, 90]
l2 = [100, 110, 120]
l3 = (130, 140, 150)

l1 + l2  # 直接用+运算符是返回一个新序列，不修改l1
l1

l1.extend(l2)  # 用extend是直接修改l1
l1

l1 += l2  # extend与+=运算符作用类似
l1

l1.extend(l3)  # 此外extend可以自动转换其他组合类型
l1

l1 += l3  # 同理+=也可以
l1

l1 + l3  # 而+运算符不能，会报TypeError

[22, 34, 58, 90, 100, 110, 120]

[22, 34, 58, 90]

[22, 34, 58, 90, 100, 110, 120]

[22, 34, 58, 90, 100, 110, 120, 100, 110, 120]

[22, 34, 58, 90, 100, 110, 120, 100, 110, 120, 130, 140, 150]

[22, 34, 58, 90, 100, 110, 120, 100, 110, 120, 130, 140, 150, 130, 140, 150]

TypeError: can only concatenate list (not "tuple") to list

#### 删除

In [11]:
# 弹出元素：返回指定位置的元素的值并删除该元素（默认为最后一个）
l = [22, 34, 58, 90]
l.pop()  # 相当于l.pop(-1)
l

l.pop(0)
l

90

[22, 34, 58]

22

[34, 58]

In [3]:
# 删除列表中第一个匹配项
l = [22, 34, 58, 90, 'hello', 'world', 58]
l.remove(58)
l

l.remove(11)  # 没有该元素则会报ValueError

[22, 34, 90, 'hello', 'world', 58]

ValueError: list.remove(x): x not in list

#### 查找与统计

In [14]:
# 找到列表中第一个匹配项所在的索引
l = [22, 34, 58, 90, 'hello', 'world']
l.index(58)  # 默认寻找整个序列

start = 3
end = 5
l.index(58, start, end)  # 可指定查找序列中的哪个范围，找不到则返回 ValueError

2

ValueError: 58 is not in list

In [20]:
# 统计匹配项出现的次数
l = list("Hello, world!")
l
l.count("l")

['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd', '!']

3

#### 顺序改变

In [21]:
l = [22, 34, 58, 90, 'hello', 'world']
# 直接反转整个列表（不比较大小，单纯反转）
l.reverse()
l

['world', 'hello', 90, 58, 34, 22]

In [22]:
l = [22, 34, 58, 90, 1, 3]
# 列表排序
l.sort(reverse=False) # 升序
l
l.sort(reverse=True)  # 降序 
l

[1, 3, 22, 34, 58, 90]

[90, 58, 34, 22, 3, 1]

In [23]:
# 若列表中存在一系列可迭代元素，则可指定key参数，指定排序要依据可迭代元素的中的哪个
l = [(2, 2), (3, 4), (4, 1), (1, 3)]
l.sort(key=lambda x:x[1], reverse=False)  # 选取第二个元素作为排序依据
l

[(4, 1), (2, 2), (1, 3), (3, 4)]

#### 其他

In [24]:
# 清空列表
l = [22, 34, 58, 90]
l.clear()
l

[]

In [25]:
# 复制列表（而不是仅创建一个引用）
l1 = [22, 34, 58, 90]
l2 = l1
l2 is l1

l3 = l1.copy()
l3 is l1

True

False

## 元组（tuple）
元组不可修改，无论是元素值还是元组的长度都不能修改，任何对于元组的修改只能以创建一个新的元组来完成
### tuple的创建

In [38]:
# 当只有一个值时，必须要在其后加逗号才能让Python将其视为一个元组，这与List不同
(1)
(1,)
[1]
[1,]

1

(1,)

[1]

[1]

### 运算符

In [44]:
# 用于list的运算符仍然适用，但因为tuple不可变的性质，+= 和 *= 并不是修改原元组，而是创建了一个新元组并赋值给原元组的引用标识，所以id会改变
t1 = (1, 2, 3)
t2 = (4, 5, 6)

id(t1)
t1 += t2
t1
id(t1)
t1 *= 3
t1
id(t1)

2149364345448

(1, 2, 3, 4, 5, 6)

2149347265032

(1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6)

2149346051656

In [45]:
# 与之相比较，list的 += 并没有改变原list的id
l1 = [1, 2, 3]
l2 = [4, 5, 6]

id(l1)
l1 += l2
id(l1)

2149364858120

2149364858120

In [5]:
# list 的 += 可以自动将其他组合数据类型转换为 list 再合并，而 tuple 的 += 不行
a = [1, 2]
b = (3, 4)

a += b  # list += tuple，正常运行并返回list
a

b += a  # tuple += list，报错

[1, 2, 3, 4]

TypeError: can only concatenate tuple (not "list") to tuple

### 元组的方法

| 方法 | 输入参数 | 是否修改原对象 | 是否有返回值 |
|-------|---------|--------------|------------|
| `index(x, start=0, end=len(tpl))` | `x` (元素), `start`, `end` (索引范围) | ❌ | ✅ (索引) |
| `count(x)` | `x` (计数的元素) | ❌ | ✅ (出现次数) |

## 集合
集合是无序不重复序列，因为集合要求不重复，所以包含的元素必须是可哈希的元素（不可变元素）

集合不可通过运算符（+、+=）来相加
| 方法 | 输入参数 | 是否修改原对象 | 是否有返回值 |
|-------|---------|--------------|------------|
| `add(x)` | `x` (添加的元素) | ✅ | ❌ (`None`) |
| `remove(x)` | `x` (删除的元素，不存在时报错) | ✅ | ❌ (`None`) |
| `discard(x)` | `x` (删除的元素，不存在不报错) | ✅ | ❌ (`None`) |
| `clear()` | 无 | ✅ | ❌ (`None`) |
| `update(iterable)` | `iterable` (可迭代对象) | ✅ | ❌ (`None`) |
| `intersection_update(*others)` | `*others` (多个集合) | ✅ | ❌ (`None`) |
| `difference_update(*others)` | `*others` (多个集合) | ✅ | ❌ (`None`) |
| `symmetric_difference_update(other)` | `other` (另一个集合) | ✅ | ❌ (`None`) |
| `union(*others)` | `*others` (多个集合) | ❌ | ✅ (新集合) |
| `intersection(*others)` | `*others` (多个集合) | ❌ | ✅ (新集合) |
| `difference(*others)` | `*others` (多个集合) | ❌ | ✅ (新集合) |
| `symmetric_difference(other)` | `other` (另一个集合) | ❌ | ✅ (新集合) |
| `issubset(other)` | `other` (另一个集合) | ❌ | ✅ (`True/False`) |
| `issuperset(other)` | `other` (另一个集合) | ❌ | ✅ (`True/False`) |
| `isdisjoint(other)` | `other` (另一个集合) | ❌ | ✅ (`True/False`) |
| `pop()` | 无 | ✅ | ✅ (被删除的元素) |
| `copy()` | 无 | ❌ | ✅ (集合副本) |

### 集合的创建

In [47]:
# 空集合必须由set()创建，{}会创建一个空字典
type(set())
type({})

set

dict

In [51]:
# 非空集合可以直接由大括号创建，也可用set()从其他组合数据类型创建
{1, 2, 3, 4, 4, 4}
set((1, 2, 3, 4, 4, 4))

{1, 2, 3, 4}

{1, 2, 3, 4}

### 集合的运算

In [68]:
a = set("abcdefg")
b = set("aecth")

In [58]:
# 交集
a & b
a.intersection(b)

{'a', 'c', 'e'}

{'a', 'c', 'e'}

In [69]:
# 判断无交集
a.isdisjoint(b)  # 无交集时为True

False

In [59]:
# 差集
a - b
a.difference(b)

{'b', 'd', 'f', 'g'}

{'b', 'd', 'f', 'g'}

In [60]:
# 并集
a | b
a.union(b)

{'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 't'}

{'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 't'}

In [61]:
# 对称差集（非共有元素）
a ^ b  # 等同于 (a-b)|(b-a)
a.symmetric_difference(b)

{'b', 'd', 'f', 'g', 'h', 't'}

{'b', 'd', 'f', 'g', 'h', 't'}

In [64]:
# 子集
a = {1, 2}
b = {1, 2, 3}

a <= b  # 子集
b.issubset(b)  # 子集
b < b  # 真子集


True

True

False

In [None]:
# 超集
a = {1, 2}
b = {1, 2, 3}

b >= a  # 超集
b.issuperset(b)  # 超集
b > b  # 真超集

### 集合的操作

In [70]:
# 添加一个元素
a = {1, 2}
a.add(3)
a

{1, 2, 3}

In [72]:
# 扩充一个组合数据类型
a = {1, 2}
b = {3, 4, 5}
c = [2, 3, 6]

a.update(b)
a

a.update(c)
a

{1, 2, 3, 4, 5}

{1, 2, 3, 4, 5, 6}

In [73]:
# 清空集合
a.clear()
a

set()

In [75]:
a = {1, 2}
# 删除一个指定元素
a.remove(2)
a

a.remove(0)   # 如果元素不存在则会发生错误

{1}

KeyError: 0

In [76]:
a.discard(0)  # 如果元素不存在不会发生错误

In [80]:
a = set("HelloWorld")
a
a.pop()  # 随机弹出一个元素
a

{'H', 'W', 'd', 'e', 'l', 'o', 'r'}

'e'

{'H', 'W', 'd', 'l', 'o', 'r'}

## 字典

字典的键必须为不可变数据类型，且不能重复
| 方法 | 输入参数 | 是否修改原对象 | 是否有返回值 |
|-------|---------|--------------|------------|
| `get(key, default=None)` | `key` (键), `default` (默认值) | ❌ | ✅ (值) |
| `setdefault(key, default=None)` | `key` (键), `default` (不存在时的默认值) | ✅ | ✅ (值) |
| `keys()` | 无 | ❌ | ✅ (键视图) |
| `values()` | 无 | ❌ | ✅ (值视图) |
| `items()` | 无 | ❌ | ✅ (键值对视图) |
| `pop(key, default)` | `key` (键), `default` (默认值) | ✅ | ✅ (被删除的值) |
| `popitem()` | 无 | ✅ | ✅ (被删除的键值对) |
| `update([other_dict])` | `other_dict` (字典或可迭代键值对) | ✅ | ❌ (`None`) |
| `clear()` | 无 | ✅ | ❌ (`None`) |
| `copy()` | 无 | ❌ | ✅ (字典副本) |

### 字典创建

In [6]:
{'name':10, 'age':10, "sex":10}

keys = {'name', 'age', 'sex'}
dict.fromkeys(keys)  # 以keys为键，值全为None
dict.fromkeys(keys, 10)  # 以keys为键，值全为10

{'age': 10, 'name': 10, 'sex': 10}

{'age': None, 'name': None, 'sex': None}

{'age': 10, 'name': 10, 'sex': 10}

### 访问字典数据

In [88]:
d = {'age': 10, 'name': "bob", 'sex': "male"}

# 以下都并不是返回list类型
d.keys()
d.values()
d.items()

type(d.keys())

dict_keys(['age', 'sex', 'name'])

dict_values([10, 'male', 'bob'])

dict_items([('age', 10), ('sex', 'male'), ('name', 'bob')])

dict_keys

In [95]:
# 字典作为一个组合数据类型，参与运算或转换时都只暴露其keys的部分
'age' in d
'bob' in d
list(d)
tuple(d)
max(d)  # 并不是values参与比较，而是keys
min(d)

True

False

['age', 'sex', 'name']

('age', 'sex', 'name')

'sex'

'age'

In [10]:
# 若想真正对values取min、max，则可用以下代码
prices = {
    'A':123,
    'B':450.1,
    'C':12,
    'E':444,
}

# 利用list排序
prices_sorted = list(prices.items())
prices_sorted.sort(key= lambda x:x[1], reverse=True)
prices_sorted[0]

# 利用zip倒转键值顺序后用max比较第一项
max(zip(prices.values(), prices.keys()))

('B', 450.1)

(450.1, 'B')

In [94]:
# 但 str 例外，因为调用的是dict类型的__str__方法，该方法将dict转换为类json的可读字符串
str(d)

"{'age': 10, 'sex': 'male', 'name': 'bob'}"

In [89]:
d['age']  # 直接获取key对应的value，若不存在会报错
d.get('age', 20)  # 获取键值，若不存在则用默认值

10

10

### 增删修改操作

In [86]:
d['age'] = 20  # 直接修改键值，若不存在则创建该键
d

d.setdefault('id', 114514)  # 若键存在则不修改，键不存在则创建并赋值，同时返回值（与get类似，但get不会创建新键值对）
d

{'age': 20, 'name': 'bob', 'sex': 'male'}

114514

{'age': 20, 'id': 114514, 'name': 'bob', 'sex': 'male'}

In [100]:
# dict 不能直接通过相加来合并
d1 = {'age': 10, 'sex': 'male', 'name': 'bob'}
d2 = {'id' : 1, 'sex': 'female'}
d1 + d2

TypeError: unsupported operand type(s) for +: 'dict' and 'dict'

In [101]:
# 而是通过update来合并（d1中已有的d2中的key其value会更新为d2的）
d1.update(d2)
d1

{'age': 10, 'id': 1, 'name': 'bob', 'sex': 'female'}

In [102]:
d1.pop('id')  # 删除某key，并返回其值
d1.pop('idd')  # 若没有该key，则报错

1

KeyError: 'idd'

In [103]:
d1.pop('idd', 11)  # 但pop方法可以指定默认值，这种情况下不会报错

11

In [104]:
d1
d1.popitem()  # 删除并返回最后一个键值对
d1

{'age': 10, 'name': 'bob', 'sex': 'female'}

('age', 10)

{'name': 'bob', 'sex': 'female'}