# 序列类型

Python 中有 3 种基本序列类型：list，tuple，range 对象。

按照序列是否可以修改，可将序列分为可变序列类型、不可变序列类型。

不可变序列类型
- 大多都实现了对 [hash()](https://docs.python.org/zh-cn/3/library/functions.html#hash) 内置函数的支持
- 允许被用作 [dict](https://docs.python.org/zh-cn/3/library/stdtypes.html#dict) 键，以及存储在 [set](https://docs.python.org/zh-cn/3/library/stdtypes.html#set) 和 [frozenset](https://docs.python.org/zh-cn/3/library/stdtypes.html#frozenset) 中
    - 例外，包含不可哈希值的不可变序列

可变序列类型
- 不支持 [hash()](https://docs.python.org/zh-cn/3/library/functions.html#hash) 内置函数

运算|结果|注释
-|-|-
`s[i] = x`|将 s 的第 i 项替换为 x|
`s[i:j] = t`|将 s 从 i 到 j 的切片替换为可迭代对象 t 的内容|
`del s[i:j]`|等同于 `s[i:j] = []`|
`s[i:j:k] = t`|将 `s[i:j:k]` 的元素替换为 t 的元素|t 必须与替换的切片具有相同长度
`del s[i:j:k]`|将 `s[i:j:k]` 的元素替换为 t 的元素
`s.append(x)`|将 x 添加到序列的末尾，等同于 `s[len(s):len(s)] = [x]`|
`s.clear()`|从 s 中移除所有项，等同于 `del s[:]`
`s.copy()`|创建 s 的浅拷贝，等同于 `s[:]`
`s.extend(t)` 或 `s += t`|用 t 的内容扩展 s ，基本上等同于 `s[len(s):len(s)] = t`|
`s *= n`|使用 s 的内容重复 n 次来对其进行更新|n 为整数，n ≤ 0 时将清空序列，**多次引用**
`s.insert(i, x)`|在由 i 给出的索引位置将 x 插入 s ，等同于 `s[i:i] = [x]`|
`s.pop([i])`|提取在 i 位置上的项，并将其从 s 中移除|可选参数 i 默认为 -1 ，移除并返回最后一项
`s.remove(x)`|	
删除 s 中第一个 `s[i]` 等于 x 的项|找不到 x 时引发 ValueError 异常
`s.reverse()`|将列表中的元素逆序|原地操作

## 通用序列类型

大多数序列类型都支持以下操作（包括可变序列类型和不可变序列类型）
- 优先级升序
- s 和 t 是相同类型的序列
- n，i，j，k 是整数
- x 是任何满足 s 所规定的类型和值限制的任意对象
- `in` 和 `not in` 具有与比较操作符相同的优先级
- `+`（拼接）和 `*`（重复）具有与对应数值运算相同的优先级

运算|结果
-|-
`x in s`|如果 s 中的某项等于 x 则结果为 `True`，否则为 `False`
`x not in s`|如果 s 中的某项等于 x 则结果为 `False`，否则为 `True`
`s + t`|s 与 t 拼接
`s * n` 或 `n * s`|s 与自身进行 n 次拼接
`s[i]`|s 的第 i 项，起始为 0
`s[i:j]`|s 从 i 到 j 的切片
`s[i:j:k]`|s 从 i 到 j 步长为 k 的切片
`len(s)`|s 的长度
`min(s)`|s 的最小项
`max(s)`|s 的最大项
`s.index(x[, i[, j]])`|x 在 s 中首次出现项的索引号（索引号在 i 或其后且在 j 之前）
`s.count(x)`|x 在 s 中出现的总次数

`in` 和 `not in` 可用于子序列检测
- [str](https://docs.python.org/zh-cn/3/library/stdtypes.html#str)
- [bytes](https://docs.python.org/zh-cn/3/library/stdtypes.html#bytes)
- [bytearray](https://docs.python.org/zh-cn/3/library/stdtypes.html#bytearray)

In [1]:
"gg" in "eggs"

True

使用 `*` 与自身进行拼接时，小于 0 的值会被当作 0 来处理
- 序列中的项被**多次引用**，而不是拷贝

In [2]:
lists = [[]] * 3
lists

[[], [], []]

In [3]:
lists[0].append(3)
lists

[[3], [3], [3]]

In [4]:
# 创建非引用
lists = [[] for i in range(3)]
lists[0].append(3)
lists[1].append(5)
lists[2].append(7)
lists

[[3], [5], [7]]

切片时，索引为负值是相对于末尾的
- 被替换为 `len(s) + i`
- -0 仍然是 0

In [5]:
lst = [1, 2, 3, 4]
lst[-0]

1

In [6]:
lst[-3:-1]

[2, 3]

拼接不可变序列总是会生成新的对象
- 某些序列（例如 range）仅支持遵循特定模式的项序列，不支持拼接和重复

In [7]:
"hello, " + "python"

'hello, python'

未找到索引时引发 ValueError 异常

In [8]:
"massive".index("q")

ValueError: substring not found

不是所有序列都支持 `s.index(x, i, j)`
- 允许高效搜索子序列，返回相对于序列开头的索引

In [10]:
"massive".index("s", 3, 5)

3

相同类型的序列支持比较
- tuple 和 list 通过对应元素的字典顺序进行比较

In [11]:
lst1 = ['abcd', 'bacd', 'cabd', 'dabc']
lst2 = ['abcd', 'bacd', 'cabd', 'dabc']
lst1 == lst2

True

In [12]:
tup1 = ('abcd', 'bacd', 'cabd', 'dabc')
tup2 = ('abc', 'bacd', 'cabd', 'dabc')
tup1 == tup2

False

## 列表 list

可变序列

实现了所有通用序列操作和可变序列操作

## 创建列表

In [13]:
# 空列表
[]

[]

In [14]:
# 方括号，逗号分隔
[1, 2, 3]

[1, 2, 3]

In [15]:
# 列表推导式
[x for x in range(5)]

[0, 1, 2, 3, 4]

In [16]:
# 类型构造器
list("abc")

['a', 'b', 'c']

### 排序

`list.sort()`：原地操作

`sorted()`：创建副本

In [17]:
lst = list("djaskfhaiusfgh")
lst

['d', 'j', 'a', 's', 'k', 'f', 'h', 'a', 'i', 'u', 's', 'f', 'g', 'h']

In [18]:
# 返回排序之后的拷贝
sorted(lst)

['a', 'a', 'd', 'f', 'f', 'g', 'h', 'h', 'i', 'j', 'k', 's', 's', 'u']

In [19]:
lst

['d', 'j', 'a', 's', 'k', 'f', 'h', 'a', 'i', 'u', 's', 'f', 'g', 'h']

In [20]:
# 原地操作，对列表排序
lst.sort()
lst

['a', 'a', 'd', 'f', 'f', 'g', 'h', 'h', 'i', 'j', 'k', 's', 's', 'u']

## 元组 tuple

不可变序列

实现了所有通用序列操作

### 创建元组

In [21]:
# 空元组
()

()

In [22]:
# 逗号后缀
1,

(1,)

In [23]:
(1,)

(1,)

In [24]:
# 逗号分隔
1, 2, 3

(1, 2, 3)

In [25]:
(1, 2, 3)

(1, 2, 3)

In [26]:
# 类型构造器
tuple("abcd")

('a', 'b', 'c', 'd')

## range 对象

不可变的数字序列
- 通常用在 for 循环中指定循环次数

实现了所有通用序列操作，除了拼接和重复

### 构造器

参数必须为整数，默认起始值（start）为 0 ，步长（step）为 1

In [27]:
range(10)

range(0, 10)

In [28]:
# [0, 10)
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [29]:
list(range(1, 11))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [30]:
list(range(0, 30, 5))

[0, 5, 10, 15, 20, 25]

In [31]:
list(range(0, 10, 3))

[0, 3, 6, 9]

In [32]:
range(0, -10, -1)

range(0, -10, -1)

In [33]:
# (-10, 0]
list(range(0, -10, -1))

[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]

In [34]:
# [0, ) --> 空列表
list(range(0))

[]

In [35]:
# [1, 0) --> 空列表
list(range(1, 0))

[]

range 对象支持检测、元素索引查找、切片等操作

In [36]:
r = range(0, 20, 2)
r

range(0, 20, 2)

In [37]:
11 in r

False

In [38]:
10 in r

True

In [39]:
# 查找索引
r.index(10)

5

In [40]:
r[5]

10

In [41]:
# 切片
r[:5]

range(0, 10, 2)

In [42]:
r[-1]

18

`==` 和 `!=` 根据 range 对象标识的值序列进行比较

In [43]:
range(0, 2) == range(2)

True

# 文本序列类型

[str](https://docs.python.org/zh-cn/3/library/stdtypes.html#str) 对象，也称为字符串
- 由 Unicode 组成的**不可变序列**

不存在单独的字符类型，一个字符就是一个长度为 1 的字符串而已
- `s[0] == s[0:1]`

字符串实现了所有的通用序列操作

### 创建字符串字面值

In [44]:
# 单引号中允许包含双引号
'Hello "Here"'

'Hello "Here"'

In [45]:
# 双引号中允许包含单引号
"Hi 'There'"

"Hi 'There'"

In [46]:
# 跨行
'''
Crossick
'''

'\nCrossick\n'

In [47]:
"""
Crossick
"""

'\nCrossick\n'

In [48]:
# 类构造器
str(123)

'123'

空格分隔的字符串字面值被隐式转为单个字符串字面值

In [49]:
# 相当于 "spam eggs"
("spam " "eggs")

'spam eggs'

### 附加方法

In [50]:
# 返回原字符串的副本，其首个字符大写，其余为小写
"abcd".capitalize()

'Abcd'

In [51]:
# 返回原字符串消除大小写的副本
"AbCd".casefold()

'abcd'

In [52]:
# 返回长度为 6 的字符串，原字符串在其正中间的位置
"abcd".center(6)

' abcd '

In [53]:
# 返回子字符串的（非重叠）出现次数
"abcd".count("a")

1

In [54]:
# 返回 ascii 编码的字符串
"abcd".encode(encoding="ascii")

b'abcd'

In [55]:
# 判断字符串后缀
"abcd".endswith("g")

False

In [56]:
# 制表符由一个或多个空格替换
'01\t012\t0123\t01234'.expandtabs()

'01      012     0123    01234'

In [57]:
# 返回子字符串在字符串中的起始索引
"abcd".find("bc")

1

In [58]:
# 字符串格式化操作
class Default(dict):        # <-- 适用于 dict 子类
    def __missing__(self, key):
        return key

'{name} was born in {country}'.format_map(Default(name='Guido'))

'Guido was born in country'

In [61]:
# 类似于 find()，未找到时引发 ValueError 异常
"abcd".index("cb")

ValueError: substring not found

In [None]:
# 判断所有字符都是字母或数字
"abcd".isalnum()

In [None]:
# 判断所有字符都是字母
"abcd".isalpha()

In [None]:
# 判断所有字符都是 ASCII
"abcd".isascii()

In [62]:
# 判断所有字符都是十进制字符
"1010".isdecimal()

True

In [63]:
# 判断所有字符都是数字
"123".isdigit()

True

In [64]:
# 判断字符串是否是有效的标识符
from keyword import iskeyword
'hello'.isidentifier(), iskeyword('hello')

(True, False)

In [65]:
'def'.isidentifier(), iskeyword('def')

(True, True)

In [66]:
# 判断所有字符都是小写
"abcd".islower()

True

In [67]:
# 判断所有字符都是数值字符
"a1".isnumeric()

False

In [68]:
# 判断所有字符都是可打印字符
"\n".isprintable()

False

In [69]:
# 判断所有字符都是空白字符
" ".isspace()

True

In [70]:
# 判断字符是标题字符串
"Crossick".istitle()

True

In [71]:
# 判断所有字符都是大写
"NIJISANJI".isupper()

True

In [72]:
# 返回拼接的字符串
"|".join("abcabc")

'a|b|c|a|b|c'

In [73]:
# 返回长度为 4 的字符串，左对齐
"abc".ljust(4)

'abc '

In [74]:
# 返回原字符串全转换为小写的副本
"Abc".lower()

'abc'

In [75]:
# 移除前导字符
'   spacious   '.lstrip()

'spacious   '

In [76]:
# 移除前导字符
'www.example.com'.lstrip('cmowz.')

'example.com'

In [77]:
# static str.maketrans(x[, y[, z]])

In [78]:
# 在 a 首次出现的位置进行拆分
"123a123a".partition("a")

('123', 'a', '123a')

In [79]:
# 将 a 替换为 4
"123a123a".replace("a", "4")

'12341234'

In [80]:
# 返回从右开始找到的 a 的索引
"abcabc".rfind("a")

3

In [81]:
# 类似于 find()，未找到时引发 ValueError 异常
"abcabc".rindex("a")

3

In [82]:
# 返回长度为 4 的字符串，右对齐
"abc".rjust(4)

' abc'

In [83]:
# 从右往左，在 a 首次出现的位置进行拆分
"123a123a".rpartition("a")

('123a123', 'a', '')

In [84]:
# 根据 a 对字符串进行拆分
"123a123a".rsplit("a")

['123', '123', '']

In [85]:
# 移除“后导”字符
'   spacious   '.rstrip()

'   spacious'

In [86]:
# 移除“后导”字符
'mississippi'.rstrip('ipz')

'mississ'

In [87]:
# 根据 , 拆分字符串
'1,2,3'.split(',')

['1', '2', '3']

In [88]:
# 之拆分 1 次
'1,2,3'.split(',', maxsplit=1)

['1', '2,3']

In [89]:
# 拆分后存在空字符串
'1,2,,3,'.split(',')

['1', '2', '', '3', '']

In [90]:
# 默认按照空格拆分
'1 2 3'.split()

['1', '2', '3']

In [91]:
'1 2 3'.split(maxsplit=1)

['1', '2 3']

In [92]:
'   1   2   3   '.split()

['1', '2', '3']

表示符|描述
-|-
`\n`|换行
`\r`|回车
`\r\n`|回车 + 换行
`\v` 或 `\x0b`|行制表符
`\f` 或 `\x0c`|换表单
`\x1c`|文件分隔符
`\x1d`|组分隔符
`\x1e`|记录分隔符
`\x85`|下一行（C1 控制码）
`\u2028`|行分隔符
`\u2029`|段分隔符

In [93]:
# 根据换行符拆分
'ab c\n\nde fg\rkl\r\n'.splitlines()

['ab c', '', 'de fg', 'kl']

In [94]:
# 根据换行符拆分，保留换行符
'ab c\n\nde fg\rkl\r\n'.splitlines(keepends=True)

['ab c\n', '\n', 'de fg\r', 'kl\r\n']

不同于 `split()` ，当给定分隔字符串时，对空字符串分分割将返回一个空列表
- 末尾的换行不会增加额外的行

In [95]:
"".splitlines()

[]

In [96]:
"One line\n".splitlines()

['One line']

In [97]:
''.split('\n')

['']

In [98]:
'Two lines\n'.split('\n')

['Two lines', '']

In [99]:
# 判断字符串以 ab 开始
"abcdabcd".startswith("ab")

True

In [100]:
# 移除左右空格符
'   spacious   '.strip()

'spacious'

In [101]:
'www.example.com'.strip('cmowz.')

'example'

In [102]:
comment_string = '#....... Section 3.2.1 Issue #32 .......'
comment_string.strip('.#! ')

'Section 3.2.1 Issue #32'

In [103]:
# 返回大小写交换的字符串
"AbCd".swapcase()

'aBcD'

In [104]:
# 返回转换为标题的字符串
'Hello world'.title()

'Hello World'

In [105]:
# 每个单词第一个字母为大写，其余字母为小写
"they're bill's friends from the UK".title()

"They'Re Bill'S Friends From The Uk"

In [106]:
# 针对撇号特别处理
import re
def titlecase(s):
    return re.sub(r"[A-Za-z]+('[A-Za-z]+)?",
                  lambda mo: mo.group(0).capitalize(),
                  s)

titlecase("they're bill's friends.")

"They're Bill's Friends."

In [107]:
# str.translate(table)

In [108]:
# 返回转换为大写的字符串
"abcd".upper()

'ABCD'

In [109]:
# 左边填充 0 使得宽度为 5
"42".zfill(5)

'00042'

In [110]:
"-42".zfill(5)    # 负值

'-0042'

# 集合类型

set 对象是由具有唯一性的可哈希对象组成的无序多项集
- 去重
- 集合类运算

不支持索引、切片等序列类型操作。

内置集合类型
- [set](https://docs.python.org/zh-cn/3/library/stdtypes.html#set) 类型：可变的，没有哈希值
- [forzenset](https://docs.python.org/zh-cn/3/library/stdtypes.html#frozenset) 类型：不可变的

set 和 frozenset
- 构造器作用方式相同
- 都支持集合与集合的比较
    - 相等，真子集，真超集

### 创建集合

In [111]:
# 类构造器
set()

set()

In [112]:
frozenset()

frozenset()

In [113]:
# 空的花括号创建的是字典
type({})

dict

In [114]:
s = {'sky', 'tme'}
type(s)

set

### 附加操作

In [115]:
# 返回集合 s 中的元素数量
len(s)

2

In [116]:
# 检测 x 是否为 s 中的成员
'sky' in s

True

In [117]:
# 交集为空返回 True
other = {'sky', 'tme', 'crossick'}
s.isdisjoint(other)

False

In [118]:
# 子集
s.issubset(other)

True

In [119]:
s <= other    # 子集

True

In [120]:
s < other    # 真子集

True

In [121]:
# 超集
s.issuperset(other)

False

In [122]:
s >= other    # 超集

False

In [123]:
s > other    # 真超集

False

In [124]:
# 并集，相当于 s.union(other)
s | other

{'crossick', 'sky', 'tme'}

In [125]:
# 交集，相当于 s.intersection(other)
s & other

{'sky', 'tme'}

In [126]:
# 差集，相当于 s.difference(other)
s - other

set()

In [127]:
# 对称差，相当于 s.symmetric_difference(other)
s ^ other

{'crossick'}

In [128]:
# 返回集合的浅拷贝
s.copy()

{'sky', 'tme'}

### 可用于 set 而不可用于 frozenset 的操作

In [129]:
# 并集
s |= other
s

{'crossick', 'sky', 'tme'}

In [130]:
# 交集
s &= other
s

{'crossick', 'sky', 'tme'}

In [131]:
# 差集
s -= other
s

set()

In [132]:
# 对称差
s ^= other
s

{'crossick', 'sky', 'tme'}

In [133]:
# 添加元素
s.add("Crossick")
s

{'Crossick', 'crossick', 'sky', 'tme'}

In [134]:
# 移除元素
s.remove("Crossick")
s

{'crossick', 'sky', 'tme'}

In [135]:
# 如果在集合中，则移除元素
s.discard("Crossick")
s

{'crossick', 'sky', 'tme'}

In [136]:
# 移除并返回任意一个元素
s.pop()

'sky'

In [137]:
# 移除所有元素
s.clear()
s

set()

# 映射类型

映射属于可变对象

有且仅有一种标准映射类型：字典
- 可哈希的值都可以作为字典的键
- 数字类型的数值相等，则指向同一项
    - `1` 和 `1.0`

### 创建字典

In [138]:
# 空字典
{}

{}

In [139]:
# 键:值，逗号分隔
d = {"sky":"nurse", "tme":"queen"}
d

{'sky': 'nurse', 'tme': 'queen'}

In [140]:
# 类构造器
dict()

{}

In [141]:
a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

True

### 字典支持的操作

In [142]:
d = {"sky":"nurse", "tme":"queen"}

In [143]:
# 返回字典的所有键的列表
list(d)

['sky', 'tme']

In [144]:
# 返回字典中的项数
len(d)

2

In [145]:
# 返回键为 sky 的项
d["sky"]

'nurse'

In [146]:
# 将键为 crossick 的值设置为 kawaii
d["crossick"] = "kawaii"
d

{'sky': 'nurse', 'tme': 'queen', 'crossick': 'kawaii'}

In [147]:
# 删除键为 crossick 的项
del d["crossick"]
d

{'sky': 'nurse', 'tme': 'queen'}

In [148]:
# 判断键是否存在于字典中
"tme" in d

True

In [149]:
"crossick" not in d

True

In [150]:
# 返回以字典的键为元素的迭代器
iter(d)

<dict_keyiterator at 0x2049ec029f0>

In [151]:
# 返回字典的浅拷贝
d.copy()

{'sky': 'nurse', 'tme': 'queen'}

In [152]:
# 如果键为 sky 的项存在于字典则返回，否则返回默认值 nurse
d.get("sky", "nurse")

'nurse'

In [153]:
# 返回字典项组成的新视图
d.items()

dict_items([('sky', 'nurse'), ('tme', 'queen')])

In [154]:
# 返回字典键组成的一个新视图
d.keys()

dict_keys(['sky', 'tme'])

In [155]:
# 如果键为 tme 的项存在于字典则移除并返回，否则返回 where is tme?
d.pop("tme", "where is tme?")

'queen'

In [156]:
# 从字典中移除并返回一个键值对，LIFO
d.popitem()

('sky', 'nurse')

In [157]:
# 相当于 reversed(d.keys())
reversed(d)

<dict_reversekeyiterator at 0x2049ec0d2c0>

In [158]:
# 如果字典存在键 tme 则返回，否则插入键值为 tme:queen 的项
d.setdefault("tme", "queen")

'queen'

In [159]:
# 更新键值对
d.update({"crossick":"kawaii"})

In [160]:
# 返回字典值组成的一个新视图
d.values()

dict_values(['queen', 'kawaii'])

In [161]:
d = {'a': 1}
d.values() == d.values()

False

In [162]:
# 移除字典中的所有元素
d.clear()
d

{}

字典会保留插入时的顺序
- 对键的更新不会影响顺序
- 删除并再次添加的键将被插入到末尾

In [163]:
d = {"one": 1, "two": 2, "three": 3, "four": 4}
d

{'one': 1, 'two': 2, 'three': 3, 'four': 4}

In [164]:
list(d)

['one', 'two', 'three', 'four']

In [165]:
list(d.values())

[1, 2, 3, 4]

In [166]:
d["one"] = 42
d

{'one': 42, 'two': 2, 'three': 3, 'four': 4}

In [167]:
del d["two"]
d["two"] = None
d

{'one': 42, 'three': 3, 'four': 4, 'two': None}

字典和字典视图都是可逆的

In [168]:
d = {"one": 1, "two": 2, "three": 3, "four": 4}
d

{'one': 1, 'two': 2, 'three': 3, 'four': 4}

In [169]:
list(reversed(d))

['four', 'three', 'two', 'one']

In [170]:
list(reversed(d.values()))

[4, 3, 2, 1]

In [171]:
list(reversed(d.items()))

[('four', 4), ('three', 3), ('two', 2), ('one', 1)]

## 字典视图对象

- 由 `dict.keys()`, `dict.values()` 和 `dict.items()` 返回
- 提供字典条目的动态视图
    - 字典改变时，视图也会改变
- 字典视图可以被迭代以产生与其对应的数据，并支持成员检测

In [172]:
dishes = {'eggs': 2, 'sausage': 1, 'bacon': 1, 'spam': 500}
keys = dishes.keys()
values = dishes.values()

In [173]:
# iteration
n = 0
for val in values:
    n += val
print(n)

504


In [174]:
# keys and values are iterated over in the same order (insertion order)
list(keys)

['eggs', 'sausage', 'bacon', 'spam']

In [175]:
list(values)

[2, 1, 1, 500]

In [176]:
# view objects are dynamic and reflect dict changes
del dishes['eggs']
del dishes['sausage']
list(keys)

['bacon', 'spam']

In [177]:
# set operations
keys & {'eggs', 'bacon', 'salad'}    # 交集

{'bacon'}

In [178]:
keys ^ {'sausage', 'juice'}    # 并集

{'bacon', 'juice', 'sausage', 'spam'}

# 参阅

- [Python 标准库 -- 内置类型](https://docs.python.org/zh-cn/3/library/stdtypes.html)