## 列表的对象方法

修改列表，默认返回 `None`
- `list.insert(i, x)`
- `list.remove(x)`
- `list.sort(key=None, reverse=False)`
    - 自定义排序 [sorted](https://docs.python.org/zh-cn/3/library/functions.html#sorted)

关于比较
- 整数不能与字符串比较
- `None` 不能与其他类型比较
- 没有定义顺序的不能比较
    - `3+4j < 5+7j`

In [1]:
fruits = ['orange', 'apple', 'pear', 'banana', 'kiwi', 'apple', 'banana']

# 返回元素在列表中出现的次数
fruits.count('apple')

2

In [2]:
# 在给定位置插入一个元素（默认插入列表头部）
# fruits.insert(len(fruits), x) == fruits.append(x)
fruits.insert(0, 'berry')
fruits

['berry', 'orange', 'apple', 'pear', 'banana', 'kiwi', 'apple', 'banana']

In [3]:
# 使用可迭代对象中的所有元素来扩展列表
# 相当于 fruits[len(fruits):] = ['tangerine', 'cherry']
fruits.extend(['tangerine', 'cherry'])
fruits

['berry',
 'orange',
 'apple',
 'pear',
 'banana',
 'kiwi',
 'apple',
 'banana',
 'tangerine',
 'cherry']

In [4]:
# 返回列表中的元素的索引，没有则抛出 ValueError 异常
# https://docs.python.org/zh-cn/3/library/exceptions.html#ValueError
fruits.index('banana')

4

In [5]:
# 返回列表中的元素的索引，从第 4 个索引（第五个元素）开始检索
fruits.index('banana', 4)

4

In [6]:
# 翻转列表中的元素
fruits.reverse()
fruits

['cherry',
 'tangerine',
 'banana',
 'apple',
 'kiwi',
 'banana',
 'pear',
 'apple',
 'orange',
 'berry']

In [7]:
# 在列表的末尾添加一个元素
# 相当于 fruits[len(fruits):] = ['grape']
fruits.append('grape')
fruits

['cherry',
 'tangerine',
 'banana',
 'apple',
 'kiwi',
 'banana',
 'pear',
 'apple',
 'orange',
 'berry',
 'grape']

In [8]:
# 对列表中的元素进行排序
fruits.sort()
fruits

['apple',
 'apple',
 'banana',
 'banana',
 'berry',
 'cherry',
 'grape',
 'kiwi',
 'orange',
 'pear',
 'tangerine']

In [9]:
# 删除列表中给定位置的元素并返回它（默认最后一个元素）
fruits.pop()

'tangerine'

In [10]:
# 返回列表浅拷贝
# 相当于 fruits_left = fruits[:]
fruits_left = fruits.copy()
fruits_left

['apple',
 'apple',
 'banana',
 'banana',
 'berry',
 'cherry',
 'grape',
 'kiwi',
 'orange',
 'pear']

In [11]:
# 移除列表中所有元素
# 相当于 del fruits[:]
fruits.clear()
fruits

[]

### 列表作为栈（stack）

后进先出
- 添加元素 append()
- 取出元素 pop()

In [12]:
# 栈
stack = [3, 4, 5]

# 添加元素至栈顶
stack.append(6)
stack.append(7)
stack

[3, 4, 5, 6, 7]

In [13]:
# 删除栈顶元素
stack.pop()

7

In [14]:
stack

[3, 4, 5, 6]

In [15]:
stack.pop()
stack.pop()
stack

[3, 4]

### 列表作为队列（queue）

先进先出

- 末尾添加元素快
- 开头插入或弹出元素慢
    - 所有元素都必须移动一位

队列可使用 [collections.deque](https://docs.python.org/zh-cn/3/library/collections.html#collections.deque) 实现
- 可快速地从两端添加或弹出元素

In [16]:
from collections import deque
queue = deque(["Eric", "John", "Michael"])
queue.append("Terry")           # Terry arrives
queue.append("Graham")          # Graham arrives
queue.popleft()                 # The first to arrive now leaves

'Eric'

In [17]:
queue.popleft()                 # The second to arrive now leaves

'John'

In [18]:
queue                           # Remaining queue in order of arrival

deque(['Michael', 'Terry', 'Graham'])

### 列表推导式

把某种操作应用于序列或可迭代对象的每个元素上，然后使用其结果创建列表

通过满足某些特定条件元素来创建子序列

In [19]:
squares = []
for x in range(10):    # for 循环之后 x 仍然存在
    squares.append(x**2)

squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [20]:
x

9

In [21]:
# 计算平方列表
squares = list(map(lambda x: x**2, range(10)))

squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [22]:
# 等价
[x**2 for x in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

列表推导式结构
- 一对方括号包含以下内容：
    - 一个表达式
    - 后面跟一个 for 子句
    - 然后是零个或多个 for 或 if 子句

In [23]:
# 将两个列表中不相等的元素组合起来
[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [24]:
# 等价
# for 和 if 的顺序相同
combs = []
for x in [1,2,3]:
    for y in [3,1,4]:
        if x != y:
            combs.append((x, y))

combs

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

In [25]:
vec = [-4, -2, 0, 2, 4]

# 乘以 2
[x*2 for x in vec]

[-8, -4, 0, 4, 8]

In [26]:
# 过滤负数
[x for x in vec if x >= 0]

[0, 2, 4]

In [27]:
# 调用函数
[abs(x) for x in vec]

[4, 2, 0, 2, 4]

In [28]:
# 调用方法
freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
[weapon.strip() for weapon in freshfruit]

['banana', 'loganberry', 'passion fruit']

In [29]:
# 包含元组的列表
[(x, x**2) for x in range(6)]

[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]

In [30]:
# 元组必须带括号
[x, x**2 for x in range(6)]

SyntaxError: invalid syntax (<ipython-input-30-80dd59f96fc0>, line 2)

In [31]:
# 降维 flatten
vec = [[1,2,3], [4,5,6], [7,8,9]]
[num for elem in vec for num in elem]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [32]:
# 复杂表达式和嵌套函数
from math import pi
[str(round(pi, i)) for i in range(1, 6)]

['3.1', '3.14', '3.142', '3.1416', '3.14159']

### 嵌套列表推导式

列表推导式的初始表达式可以是任何表达式
- 包括另一个列表推导式

[解包参数列表](https://docs.python.org/zh-cn/3/tutorial/controlflow.html#unpacking-argument-lists)

In [33]:
# 3x4 矩阵
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

In [34]:
# 交换行和列
[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [35]:
# 等价
transposed = []
for i in range(4):
    transposed.append([row[i] for row in matrix])

transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [36]:
# 等价
transposed = []
for i in range(4):
    # the following 3 lines implement the nested listcomp
    transposed_row = []
    for row in matrix:
        transposed_row.append(row[i])
    transposed.append(transposed_row)

transposed

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

In [37]:
# 使用 zip() 函数
list(zip(*matrix))

[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]

## [del](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#the-del-statement) 语句

In [38]:
a = [-1, 1, 66.25, 333, 333, 1234.5]

# 按照给定的索引删除列表元素
del a[0]
a

[1, 66.25, 333, 333, 1234.5]

In [39]:
# 从列表中移除切片
del a[2:4]
a

[1, 66.25, 1234.5]

In [40]:
# 清空整个列表
del a[:]
a

[]

In [41]:
# 删除整个变量
del a

In [42]:
# 再引用报错，直到另一个值被赋给它
a

NameError: name 'a' is not defined

## 元组

序列数据类型
- 列表
- 字符串
- 元组

[序列类型](https://docs.python.org/zh-cn/3/library/stdtypes.html#sequence-types-list-tuple-range)

一个元组由几个被逗号隔开的值组成
- 输出时被圆括号包围
- 不可变（[immutable](https://docs.python.org/zh-cn/3/glossary.html#term-immutable)）
- 通常包含不同种类的元素
- 通过解包或索引访问
- [namedtuples](https://docs.python.org/zh-cn/3/library/collections.html#collections.namedtuple) 可以通过属性访问

列表是可变的（[mutable](https://docs.python.org/zh-cn/3/glossary.html#term-mutable)），一般包含同种类型的元素，通过迭代访问

In [43]:
t = 12345, 54321, 'hello!'
t

(12345, 54321, 'hello!')

In [44]:
# 嵌套 nested
u = t, (1, 2, 3, 4, 5)
u

((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

In [45]:
# 不可变
t[0] = 88888

TypeError: 'tuple' object does not support item assignment

In [46]:
# 可以包含可变对象
v = ([1, 2, 3], [3, 2, 1])
v

([1, 2, 3], [3, 2, 1])

构造 0 个或 1 个元素的元组
- 空元组可以直接由一对空圆括号创建
- 含有一个元素的元组可以通过在这个元素后添加逗号创建

In [47]:
empty = ()
len(empty)

0

In [48]:
singleton = 'hello',
len(singleton)

1

序列解包
- 解包操作的等号右侧可以是任何序列
- 要求左侧的变量数和右侧序列里所含的元素数相同

多重赋值本质上是元组打包和序列解包的组合

In [49]:
# 元组打包
t = 12345, 54321, 'hello!'

# 允许逆操作
x, y, z = t

## 集合

由不重复元素组成的无序的集

用法
- 成员检测
- 消除重复元素
- 支持 联合、交集、差集、对称差分 等数学运算

创建集合
- 使用花括号包括元素
- [set()](https://docs.python.org/zh-cn/3/library/stdtypes.html#set)

创建空集合只能使用 `set()` 而不能使用 `{}`
- `{}` 创建空字典

In [50]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)                      # show that duplicates have been removed

{'banana', 'apple', 'pear', 'orange'}


In [51]:
# 元素是否在集合中
'orange' in basket

True

In [52]:
# 自动消除重复元素
a = set('abracadabra')
b = set('alacazam')
a                                  # unique letters in a

{'a', 'b', 'c', 'd', 'r'}

In [53]:
# 差
a - b

{'b', 'd', 'r'}

In [54]:
# 并
a | b

{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'}

In [55]:
# 交
a & b

{'a', 'c'}

In [56]:
# 对称差
a ^ b

{'b', 'd', 'l', 'm', 'r', 'z'}

In [57]:
# 集合推导式
a = {x for x in 'abracadabra' if x not in 'abc'}
a

{'d', 'r'}

## 字典

[映射类型 --- dict](https://docs.python.org/zh-cn/3/library/stdtypes.html#typesmapping)

联合内存/联合数组

以关键字为索引
- 关键字可以是任意不可变类型，通常是字符串或数字
    - 如果一个元组只包含字符串、数字或元组，那么这个元组也可以作为关键字

`键:值` 对集合
- 键必须是唯一的

初始化字典
- `{}` 创建空字典
- 花括号里放置一些逗号分隔的键值对
- [dict()](https://docs.python.org/zh-cn/3/library/stdtypes.html#dict) 构造函数
    - 直接从键值对序列创建字典

使用关键字存储和解析值
- 用 `del` 删除一个键值对
- 对已经存在的关键字赋值 --> 替换
- 用一个不存在的键取值 --> 报错

返回字典中所有键的列表
- 按插入次序排列：`list(d)`
- 其他排序：`sorted(d)`

检查对否存在特定的键
- `in` 关键字

In [58]:
tel = {'jack': 4098, 'sape': 4139}

# 添加新的键值对
tel['guido'] = 4127
tel

{'jack': 4098, 'sape': 4139, 'guido': 4127}

In [59]:
# 使用键取出值
tel['jack']

4098

In [60]:
# 删除一个键值对
del tel['sape']
# 添加新的键值对
tel['irv'] = 4127
tel

{'jack': 4098, 'guido': 4127, 'irv': 4127}

In [61]:
# 返回键的列表
list(tel)

['jack', 'guido', 'irv']

In [62]:
# 按字典序排序
sorted(tel)

['guido', 'irv', 'jack']

In [63]:
'guido' in tel

True

In [64]:
'jack' not in tel

False

In [65]:
# 直接从键值对序列里创建字典
dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [66]:
# 字典推导式
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

In [67]:
# 直接通过关键字参数来指定键值对
dict(sape=4139, guido=4127, jack=4098)

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [68]:
# 同时取出关键字和对应的值
knights = {'gallahad': 'the pure', 'robin': 'the brave'}
for k, v in knights.items():
    print(k, v)

gallahad the pure
robin the brave


## 循环技巧

在序列中循环
- 使用 [enumerate()](https://docs.python.org/zh-cn/3/library/functions.html#enumerate) 将索引位置和值同时取出

同时在两个或更多序列中循环
- 使用 [zip()](https://docs.python.org/zh-cn/3/library/functions.html#zip) 函数将其内元素一一匹配

逆向循环序列
- 先正向定位，然后调用 [reversed()](https://docs.python.org/zh-cn/3/library/functions.html#reversed) 函数

按指定顺序循环
- 使用 [sorted()](https://docs.python.org/zh-cn/3/library/functions.html#sorted) 函数
    - 在不改变原序列的基础上，返回新的排序后的序列

循环时修改列表内容
- 创建新列表，简单且安全

In [69]:
# 在序列中循环
for i, v in enumerate(['tic', 'tac', 'toe']):
    print(i, v)

0 tic
1 tac
2 toe


In [70]:
# 同时在两个序列中循环
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
    print('What is your {0}?  It is {1}.'.format(q, a))

What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.


In [71]:
# 逆向循环
for i in reversed(range(1, 10, 2)):
    print(i)

9
7
5
3
1


In [72]:
# 指定顺序
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
    print(f)

apple
banana
orange
pear


In [73]:
# 循环时修改，创建新列表
import math
raw_data = [56.2, float('NaN'), 51.7, 55.3, 52.5, float('NaN'), 47.8]
filtered_data = []
for value in raw_data:
    if not math.isnan(value):
        filtered_data.append(value)

filtered_data

[56.2, 51.7, 55.3, 52.5, 47.8]

## 条件控制

`while` 和 `if` 条件句中可以使用任意操作，不仅仅是比较操作。

比较操作符 `in` / `not in`
- 校验一个值是否在（或不在）一个序列里

操作符 `is` 和 `is not`
- 比较两个对象是不是同一个对象
- 通常用于可变对象

比较操作可以传递
- 例如 `a < b == c` 会校验是否 `a` 小于 `b` 并且 `b` 等于 `c`

比较操作可以通过布尔运算符 `and` 和 `or` 来组合

比较操作（或其他任何布尔运算）的结果都可以用 `not` 来取反

操作符优先级
- 布尔运算符 < 比较操作符 < 数值运算符
- `or` < `and` < `not`
     - `A and not B or C` 等价于 `(A and (not B)) or C`

布尔运算符 `and` 和 `or` 也被称为 *短路* 运算符
- 它们的参数从左至右解析，一旦可以确定结果解析就会停止
- 例如，如果 `A` 和 `C` 为真而 `B` 为假，那么 `A and B and C` 不会解析 `C`
- 当用作普通值而非布尔值时，短路操作符的返回值通常是最后一个变量

在表达式内部赋值必须显式地使用 [海象运算符](https://docs.python.org/zh-cn/3/faq/design.html#why-can-t-i-use-an-assignment-in-an-expression) `:=` 来完成
- 避免想要在表达式中写 `==` 时却写成了 `=`

In [74]:
# 把比较操作或者逻辑表达式的结果赋值给一个变量
string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
non_null = string1 or string2 or string3
non_null    # 第一个非空元素

'Trondheim'

## 比较序列和其他类型

序列对象通常可以与相同序列类型的其他对象比较

字典式顺序
- 首先比较开头的两个对应元素，如果两者不相等则比较结果就由此确定；
- 如果两者相等则比较之后的两个元素，以此类推，直到有一个序列被耗尽

如果要比较的两个元素本身又是相同类型的序列
- 递归地执行字典式顺序比较

如果两个序列中所有的对应元素都相等
- 则两个序列也将被视为相等

如果一个序列是另一个的初始子序列
- 则较短的序列就被视为较小（较少）

对于字符串来说，字典式顺序是使用 Unicode 码对单个字符排序

对不同类型对象来说，只要比较对象提供了合适的比较方法，就可以使用 `<` 和 `>` 来比较
- 混合数值类型是通过他们的数值进行比较的，所以 0 等于 0.0
- 否则，解释器将抛出一个 [TypeError](https://docs.python.org/zh-cn/3/library/exceptions.html#TypeError) 异常

```
(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
'ABC' < 'C' < 'Pascal' < 'Python'
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)
```