# 第四讲：Python 基础：语句、函数

**2023-03-31 v2.1**

**2022-09-26 v2.0**

**2022-04-04 v1.0**

**yeh@czust.edu.cn**

In [1]:
import io
import uuid
from pathlib import Path
from IPython.display import IFrame

TEMPLATE_MERMAIDJS='''<html>
    <body>
        <script src="https://cdn.jsdelivr.net/npm/mermaid/dist/mermaid.min.js"></script>
        <script>
            mermaid.initialize({{ startOnLoad: true }});
        </script>
        <div class="mermaid">
            {src}
        </div>
    </body>
</html>
'''

def js_ui(data, template, out_fn=None, out_path='./graph',
          width='100%', height='100%', **kwargs):
    '''生成一个包含模板化javascript包的IFrame'''
    
    if not out_fn:
        out_fn = Path(f'{uuid.uuid4()}.html')
    
    out_path = Path(out_path)
    filepath = out_path / out_fn
    filepath.parent.mkdir(parents=True, exist_ok=True)
    
    with io.open(filepath, 'wt', encoding='utf8') as outfile:
        outfile.write(template.format(**data))
    
    return IFrame(src=filepath, width=width, height=height)

## 语句概述

总体来看，Python 的语句用缩进方式表示代码块 (block)，缩进在 Python 中是强制的，而且对语法有意义

同一段代码中的缩进量应该保持一致，不要混用“空格”或“制表符”

> 在程序设计语言中，大体有两种表示语句块的风格样式
>
> - 定界符流派：
>   - 关键字定界符：ALGOL、BASIC、Pascal、shell 脚本
>   - 括号定界符：Lisp、C/C++、Java、C#、JavaScript、Rust、Dart
> - 缩进流派：occam、Haskell、Python、Go

一条 Python **语句** (statement) 包含零或多个表达式

表达式描述了在数据上进行的计算或操作

In [2]:
stmt = '''
flowchart TB
subgraph a[语句]
subgraph b[表达式语句]
字面量
运算符
标识符
end
subgraph c[非表达式语句]
赋值
声明
end
end
'''

js_ui({'src': stmt}, TEMPLATE_MERMAIDJS, height=500)

运算、函数或表达式修改其局部环境之外的一些状态变量值，就称为有**副作用** (side effect)

语句通常有副作用，比如打印输出、计算取值，或改变下一条执行语句

## 结构化流程

### 序列：顺序结构

按代码顺序依次执行的控制结构

### 选择：条件结构

满足指定条件时执行的控制结构

通常有几种不同的用例：

1. `if...`仅当条件为真时执行，当条件为假时跳过

2. `if...else...`当条件为真时执行真分支的语句，当条件为假时执行假分支的语句

3. `if <另一个条件结构> else <另一个条件结构>`嵌套其他条件结构

   a. `if...else-if...else...`通过嵌套条件结构可以组成多分支

### 迭代：循环结构

满足指定条件时多次执行的控制结构

循环结构根据布尔条件的不同，其内部代码块可以执行零次到多次 (**包括无限次**)

循环结构主要用于迭代 (interation)，即重复执行某些操作，是计算机的基本算法之一

常见的几种用例：

1. 使用条件控制循环结构
   - “当...”型：while
   - “直到...”型：until  (Python 没有此类原生的结构表示)
2. 使用变量控制循环结构
   - 计数型：for  (Python 没有此类原生的结构表示)
   - 成员型：foreach

### 子程序：函数

在需要的地方执行其他地方定义的语句

子程序可以封装操作细节，被封装的细节通常由若干条语句组成代码块

在结构化编程理论中，有如下概念

- 函数 (function)：带返回值的子程序
- 过程 (procedure)：不带返回值的子程序

在面向对象编程理论中，类或对象中的子程序又叫方法 (method)

### ~~跳转~~

**无条件**转移到其他地方的控制结构

在程序设计的早期年代，`goto` 大量使用，代码混乱难读

> unmaintainable spaghetti code

在 CPU 低级指令的意义考虑，跳转指令是分支的实现方法之一 (另两个是调用和返回)，但是在高级语言中，并不需要跳转

> **结构化程序Böhm-Jacopini定理**
>
> 任何含 `goto` 的程序都可以转为只用序列、选择和迭代结构的程序，代价是引入更多的局部变量

现代高级语言中，一般不建议滥用 `goto`，而是应该明智使用

## Python的语句

### Python的顺序结构

一般来说，Python 从上到下顺序执行语句，逐个评估表达式的值，然后对这些值进行一些操作

In [3]:
# 顺序结构

a = 3

In [4]:
id(a)

4371097968

In [5]:
b = a + 1 # 执行赋值之前会首先代入已经绑定值的a

In [6]:
a + 1

4

如果在顺序评估时遇到错误，Python 会中断程序执行

In [7]:
# 错误

a = 3
b = c + 1 # c是一个未知的标识符，因此执行到本行会出错

NameError: name 'c' is not defined

### Python的条件结构

Python 的条件结构涉及代码块，因此要注意语法

- 冒号(`:`)引出满足条件后需要执行的语句
- 缩进指示满足条件后需要执行的语句

#### 单个 `if` 结构

最简单的情况 (对应[上文](#选择：条件结构)的第 1 种) 是只有一个 `if` 的条件结构

代码块仅在满足特定条件 (即布尔表达式值为 `True`) 时才执行

In [8]:
# 简单 if

age = 20
if age > 18:
    print('你可以查看本网站的内容')

你可以查看本网站的内容


#### `if...else` 结构

对应[上文](#选择：条件结构)的第 2 种情况，除了给出满足条件 (即布尔表达式值为 `True`) 后需要执行的语句，还要给出不满足条件 (即布尔表达式值为 `False`) 后需要执行的语句

In [None]:
# if...else

age = 17
if age > 18:
    print('你可以查看本网站的内容')
else:
    print('小朋友，这里没什么好康的')

#### 嵌套的条件结构

条件结构可以嵌套，因为条件语句也是代码块

这种结构通常可以类比于决策树 (decision tree)

In [None]:
tree = '''
graph TB
a([是正式舞会吗])
b([是家庭聚会吗])
c([要举行派对吗])
d([有朋自远方来吗])
b1[穿宴会礼服]
c1[穿半正式服装]
d1[穿派对服装]
e1[穿舒适便服]
e2[穿居家服]
a --> |是|b1
a --> |否|b --> |是|c1
b --> |否|c --> |是|d1
c --> |否|d --> |是|e1
d --> |否|e2
'''

js_ui({'src': tree}, TEMPLATE_MERMAIDJS, height=700)

In [None]:
event = 'family_dinner'
if event == 'formal_dance':
    wear = 'formal dress'
else:
    if event == 'family_dinner':
        wear = 'semi-formal clothes'
    else:
        if event == 'party':
            wear = 'party clothes'
        else:
            if event == 'friend_visit':
                wear = 'casual clothes'
            else:
                wear = 'pajamas'

print(wear)

#### 多分支结构

如果嵌套的多个条件构成一组多分支条件，Python 提供关键字 `elif` 来简化代码排版，例如上一例可以改写成

In [None]:
event = 'family_dinner'
if event == 'formal_dance':
    wear = 'formal dress'
elif event == 'family_dinner':
    wear = 'semi-formal clothes'
elif event == 'party':
    wear = 'party clothes'
elif event == 'friend_visit':
    wear = 'casual clothes'
else:
    wear = 'pajamas'

print(wear)

这种多分支结构对应 C 语言中的 `switch...case...` 语法

> 在 Python 3.10 以后，[正式支持模式匹配](https://peps.python.org/pep-0636/)，`match` 语句接受一个表达式并将其值与作为一个或多个 `case` 块给出的连续模式进行比较。在表面上类似于 C、Java 或 JavaScript (以及许多其他语言) 中的 `switch` 语句，但功能更强大。上例代码可以改写为 `match` 和 `case` 配合的形式

In [None]:
event = ''
# match是新语法，低于v3.10的Python不支持
match event:
    case 'formal_dance':
        wear = 'formal dress'
    case 'family_dinner':
        wear = 'semi-formal clothes'
    case 'party':
        wear = 'party clothes'
    case 'friend_visit':
        wear = 'casual clothes'
    case _:        
        wear = 'pajamas'

print(wear)

#### 条件表达式

关键字 `if` 和 `else` 还能用于表达式，构成 Python 的条件表达式

```python
条件表达式真时的值 if <条件表达式> [else 条件表达式假时的值]
```

In [None]:
# 条件表达式

import random
random.random()

In [None]:
# 设定阈值
threshold = .5
# 构建表达式
result = '正面' if random.random() >= threshold else '反面'
print(result)

显然，条件表达式可以嵌套，但是过多的嵌套可能导致代码不易读懂 

### Python的循环结构

Python 提供两个关键字用以表示循环结构：`while` 和 `for`

> 两种循环都可以在末尾配 `else` 语句，处理循环结束之后的收尾工作，也都可以在循环体内用 `break` 或 `continue` 语句，分别表示**打断当前循环**或**继续下次迭代**

#### `while` 结构

`while` 循环用于重复执行一个语句块，直到满足给定条件。然后，再次检查表达式，如果仍然为 `True`，则再次执行主体。一直持续到表达式变为 `False` 为止

In [None]:
# “当”循环可以直接用关键字

prod = 1
n = 1
# 计算 1*2*3*4*5
while n < 6:
    prod *= n
    n += 1
print(prod)

Python 没有提供“直到”型循环的关键字，但可以结合条件语句和提前退出循环的关键字 `break` 来实现

In [None]:
# “直到”循环的Python实现

prod = 1
n = 1
# 始终为真，无限循环
while True:
    prod *= n
    n += 1
    # 满足条件时退出循环
    if n > 5:
        break
print(prod)

#### `for` 结构

Python 的 `for` 结构用于迭代列表、元组、字典或集合的容器，从而对容器中的每个项执行一组语句

Python 的 `for` 循环相当于其他编程语言的 foreach 类的循环操作，它针对容器中的每个项/成员进行迭代，而不是 C 语言常用的计数迭代

In [None]:
# for循环

prod = 1
# 沿用前面的例子，计数迭代
for n in range(1, 6):
    prod *= n
print(prod)

In [None]:
a = [1, 2, 3]
1 in a

注意，在 Python 中，`for` 循环以 `for...in` 的形式出现

In [None]:
for i in range(5):
    print(i)

它相当于 C 语言的

```c
for (int i = 0; i < 5; i++) {
    printf("%d\n", i);
}
```

下面是一个更加 **Pythonic** 的例子

In [None]:
dishes = ['粽子', '汤圆', '豆花', '凉粉']
for dish in dishes:
    print(f'今天早餐吃了{dish}')

通常，Python 的 `for` 循环更强调成员的实际语义，注意标识符命名，例如上例的

```python
for dish in dishes
```

如果实在不想为命名标识符烦心，可以用 `_` 当作循环变量

作为对比，给出不够 **Pythonic** 的写法

In [None]:
dishes = ['粽子', '汤圆', '豆花', '凉粉']
# 请避免在Python中这样遍历一个可迭代对象，除非你需要它的索引
for i in range(len(dishes)):
    print(f'今天早餐吃了{dishes[i]}')

#### 推导表达式

推导表达式用一种相对简短的语法来表示对容器类型的迭代过程

- 列表推导式(list comprehension)
- 集合推导式(set comprehension)
- 字典推导式(dict comprehension)

列表推导式从一个可迭代对象中创建一个新列表

In [None]:
# 用循环语句生成新的列表

sweets = ['蛋挞', '甜白酒', '榴莲酥', '枣糕', '甜甜圈']

new_list = []
for item in sweets:
    new_list.append(item[-1])

print(new_list)

改写成列表推导式

In [None]:
# 用列表推导式生成新的列表

sweets = ['蛋挞', '甜白酒', '榴莲酥', '枣糕', '甜甜圈']

new_list = [item[-1] for item in sweets]

print(new_list)

注意，推导表达式可以配合条件表达式使用，作为过滤器/筛选器 (filter)

>  **语法**
>

```python
[表达式 `for` 对象中的元素 `in` 可迭代对象 `if` 条件表达式]
```

In [None]:
# 用带条件的列表推导式生成新的列表

sweets = ['蛋挞', '甜白酒', '榴莲酥', '枣糕', '甜甜圈']

new_list = [item[-1] for item in sweets if '甜' not in item]

# 打印不含有"甜"字的甜食
print(new_list)

显然，推导表达式可以**嵌套**迭代，代价是**可能丧失易读性**

In [None]:
# 列表推导式可以使用多个迭代

matrix = [
    [1, 2], 
    [3, 4], 
    [5, 6]
]

# 二维矩阵拉平为一维向量
flatten = [element for row in matrix for element in row]
# 打印拉平之后的向量
print(flatten)

In [None]:
# 矩阵的转置
transposed = [[row[i] for row in matrix] for i in range(len(matrix[0]))]
# 打印转置之后的矩阵
print(transposed)

类似地，集合也可以用推导表达式生成

In [None]:
# “列表”是可迭代对象，本例演示从列表生成集合

sweets = ['蛋挞', '榴莲酥', '枣糕', '甜甜圈']
len_set = {len(item) for item in sweets}
print(len_set)

类似地，字典也可以用推导表达式生成

In [None]:
# “范围”是可迭代对象，本例演示从范围生成字典

squares = {x: x ** 2 for x in range(10)}
# 打印平方表
print(squares)

## Python的函数

函数是供其他语句调用的预先定义的语句块，它**可以有**数据的输入，也**可以有**输出，输入数据称为参数，输出数据称为返回值

- Parameter 一般翻译为形式参数，或叫**型参**，用于函数定义时的变量命名
- Argument 一般翻译为实际参数，或叫**值参**，用于函数调用时的变量命名

### `def` 语句

模版

```python
# Python 函数定义
def func_name(param1, param2):
    if condition:
        return
    result = do_something()
    return result

# Python 函数调用
func_name(arg1, arg2)
```

从上面的模板可以看到，定义函数签名需要关键字 `def`，随后是函数名加圆括号，括号内给出**零或多个形式参数**

函数签名之后加冒号引出函数体，换行后通过缩进对齐本函数的函数体

Python 函数可以有多个出口，出口通过关键字 `return` 给出，如上例模版中 `return` 出现了两次

函数**可以有返回值**，如模版中的 `result` 在函数的最后被返回；也可以没有返回值，如模版中第一次出现的 `return` 后面没有任何变量，相当于返回了 `None`

调用函数只需写出函数名，随后是圆括号，括号内按照函数签名**传入对应的实际参数**

In [None]:
# 实际的例子

# 定义一个打招呼的函数
def greeting(name):
    '''
        给 name : str 打招呼
        dddd
    '''
    
    print(f'Hello, {name:>10}')
    
    return

# 调用这个函数
greeting('John')

In [None]:
greeting.__doc__

In [None]:
a_doc = '''
        给 name : str 打招呼
        dddd
    '''

In [None]:
print(a_doc)

In [None]:
a_str = '\t给 name : str 打招呼\n\tdddd\t'

In [None]:
print(a_str)

In [None]:
greeting()

In [None]:
"Hello " + "EEE"

函数可以没有形式参数或函数体

In [None]:
def do_nothing():
    pass

函数可以有不确定个数的形式参数

In [None]:
def work_with_unknown(*args):
    pass

# 不确定个数的形式参数必须声明在确定个数的形式参数之后
def work_with_known_and_unknown(known, *args):
    pass

举例，用不确定个数的形式参数改写阶乘算法

In [None]:
def multiply_all(*nums):
    prod = 1
    for n in nums:
        prod *= n
    return prod

# 仔细看，传入的实际参数相当于元组
multiply_all(1, 2, 3, 4, 5, 6)

函数的形式参数及其对应的取值 (实际参数) 的关系可以类比于**键值对**

In [None]:
def spam(eggs, cheese):
    pass

spam(eggs=1, cheese=2)

函数被调用时，实际参数引入被调用函数的局部符号表中

参数传递采用**按值调用**的方式，值总是一个对象的引用而不是对象的值

函数可设置参数的默认取值

In [None]:
# 注意顺序
def greeting(message, name='John', surname='Smith'):
    print(f'{message}, {name} {surname}!')
    
greeting('Hello')
greeting('Hello', 'William')
greeting('Hello', 'William', 'Shakespeare')

函数可传入不确定个数的键值对参数

In [None]:
def greeting(message, name='John', surname='Smith', **kwargs):
    print(f'{message}, {name} {surname}!')
    for k, v in kwargs.items():
        print(f'{k}: {v}')
    
greeting('Hello', 'William', time='today', location='starbucks')

### 参数界隔符号

Python 函数定义中的参数列表实际上包括三种类型

- **位置参数**：用于强制安排参数顺序或传入任意长度的序列解包参数的情况
- 位置或键值对参数
- **键值对参数**：用于参数顺序不重要但参数名称有意义的情况

因此，可以用解包方法传入实际参数

In [None]:
# 序列解包作为函数实际参数

def multiply_all(*numbers):
    prod = 1
    for number in numbers:
        prod *= number
    return prod

numbers = [1, 2, 3, 4, 5]
multiply_all(*numbers)

In [None]:
# 字典解包作为函数实际参数

def greeting(message, name='John', surname='Smith', **kwargs):
    
    print(f'{message}, {name} {surname}!')
    for k, v in kwargs.items():
        print(f'{k}: {v}')

states = {'time': '20210928 09:35:06', 'loc': '#1 Building', 'with': '🐕🐕'}
greeting('Hello', **states)

可以在定义时用 `/` 和 `*` 符号分隔这位置、位置或键值对、键值对这三类参数，减少函数传参的歧义

函数签名的模板

```python
def func(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
```

In [None]:
# 举例

def add_and_power(x, y, /, n=None, *, output=False):
    power = n if n is not None else 1
    result = (x + y) ** power
    if output:
        print(f'{power:8}')
        print(f'(x + y)  = {result}')
    return result

# 注意n有默认值None，可以不在调用时写出
# 但是output是仅键值对参数，必须在调用时写出完整的键值对
add_and_power(1, 2, output=True)

Python 函数返回值可以是多个值，它们用`,`分隔，**实际上是返回了一个元组**

In [None]:
# 返回多个值的例子

def get_one_more(n):
    one = 1
    return n, one

me, you = get_one_more(4)
print(me)
print(you)

### 副作用

Python函数的传参模式是对象引用，形式参数标识符绑定到实际参数标识符所引用的对象之上

- 若形式参数绑定到一个可变对象的，则函数对这个对象的修改产生副作用

- 若形式参数绑定到一个不可变对象的，则函数不能对这个对象产生修改，不过可以修改之后重新绑定到别的对象之上

In [None]:
# 如果指向一个可变对象，例如列表
a_list = []
def append_list(r, a=1):
    r.append(a)
    return r

print(append_list(a_list))
print(append_list(a_list, 2))
print(append_list(append_list(a_list)))

In [None]:
# 如果指向一个不可变对象，例如字符串
a_str = ''
def append_str(r, a='a'):
    nr = r + a
    return nr

print(append_str(a_str))
print(append_str(a_str, 'b'))
print(append_str(append_str(a_str)))

### 递归

定义一个在函数体内调用自身的函数，就是递归函数

In [None]:
# 递归函数的例子

def recursive_sum(n):
    if n < 1:
        return n
    return n + recursive_sum(n - 1)

recursive_sum(100)

递归 (recursion) 和迭代 (iteration) 都是以**递推式**为依据设计算法

- 递归强调从大规模问题化简到较小规模的问题
- 迭代强调从小规模问题增长到较大规模的问题

### lambda 表达式

函数最好是能避免副作用

lambda 表达式是**匿名函数**在 Python 语言中的实现，它要求

- 函数体只能是一个**表达式**
- 可以有多个输入参数
- 返回一个函数的定义而不是值
- 上下文感知

语法模版

```python
lambda params: expr
```

In [None]:
# 仅仅是lambda表达式
lambda x, y: x * 2

In [None]:
# 绑定lambda表达式到一个标识符，这样就不再匿名了
double = lambda x: x * 2
# 具名调用
double(3)

In [None]:
# 其实仅仅是lambda表达式也能直接用作函数调用
(lambda x: x * 2)(3)

lambda 表达式的作用

- ~~解决程序员“起名难”的问题~~
- 进一步抽象了“运算”，构造**高阶函数** (higher-order function)
- 构造闭包和柯里化

lambda 表达式与 $\lambda$-演算的关系

| 功能 | $\lambda$-演算| Python语法 | 解释 |
|--|--|--|--|
| 变量 | $x$ | `x` | $x$是一个符号，表示输入值  |
| 抽象 | $(\lambda x.M)$  | `lambds x: x * 2`    | $M$是一个表达式，可能包含变量$x$，定义了抽象的运算 |
| 应用 | $(\lambda x.M N)$ | `(lambds x: x * 2)(3)` | 作用于另一个表达式$N$，可以替换符号$x$  |

Python 中的函数是一等公民，享受与变量一样的待遇，试着把函数用作参数

>  `list.sort()` 和 `sorted()` 都有一个名叫 `key` 的参数，用来指定对列表元素比较时调用的函数

In [None]:
# 传一个lambda表达式来指定排序方法
sweets = ['蛋挞', '榴莲酥', '枣糕', '甜甜圈']

# 默认排序
print(sorted(sweets))

In [None]:
# 指定字符编码
print(sorted(sweets, key=lambda sweet: sweet.encode('gbk')))

下面是抽象了四则运算的例子

In [None]:
def operate_on(a, b, op):
    return op(a, b)

print(operate_on(32, 2, lambda x, y: x + y))
print(operate_on(32, 2, lambda x, y: x - y))
print(operate_on(32, 2, lambda x, y: x * y))
print(operate_on(32, 2, lambda x, y: x // y))

### 高阶函数

高阶函数以函数为参数，或者返回一个函数，实际上就是数学上的泛函 (functional)

经典应用场景

- 映射操作 `map(函数, 输入)`
- 过滤操作 `filter(函数, 输入)`
- 归约操作 `reduce(函数, 输入)`

图解 map、filter 和 reduce

| 输入列表       | 操作类型     | 高阶函数伪代码                  | 操作的结果     |
| -------------- | :----------- | :------------------------------ | -------------- |
| `[🌽, 🍇, 🐓, 🦐]` | 映射(map)    | `map(process, [🌽, 🍇, 🐓, 🦐])`    | `[🍿, 🍷, 🍗, 🍤]` |
| `[🍿, 🍷, 🍗, 🍤]` | 过滤(filter) | `filter(is_meat, [🍿, 🍷, 🍗, 🍤])` | `[🍗, 🍤]`       |
| `[🍗, 🍤]`       | 归约(reduce) | `reduce(digest, [🍗, 🍤])`        | `💩`            |

映射的例子

In [None]:
# map()函数和推导式的关系

sweets = ['蛋挞', '榴莲酥', '枣糕', '甜甜圈']

new_list_1 = list(map(lambda i: i[-1], sweets))
new_list_2 = [item[-1] for item in sweets]

print(new_list_1)
print(new_list_2)

多个列表也可以映射

In [None]:
list_1 = [1, 2, 3, 4]
list_2 = [2, 3, 5, 7, 11]

# 注意结果列表的长度
list(map(lambda x, y: x * y, list_1, list_2))

输入列表也可以是函数的列表

In [None]:
pow_one = lambda x: x
pow_two = lambda x: x * x
pow_three = lambda x: x * x * x

funcs = [pow_three, pow_two, pow_one]

# 注意本例lambda表达式中的变量i是自由变量
[list(map(lambda x: x(i), funcs)) for i in range(5)]

过滤的例子

In [None]:
# 用range()生成从0到5的可迭代对象
# 再用一个lambda表达式对其检测是否能被2整除
# 最外围的list()只是将过滤结果转为一个普通的列表
list(filter(lambda x: x % 2, range(5)))
# 实际上相当于列表推导式的版本，后者反而更加Pythonic
[i for i in range(5) if i % 2]

归约的例子

In [None]:
import functools

# 用一个lambda表达式设置归约的计算方法
# 注意归约的结果不再是一个列表
lst = [1, 2, 3]
a = functools.reduce(lambda x, y: 2 * x + 3 * y, lst)
print(a)

# 实际上相当于一组累加的循环语句，下面的丑陋写法仅供对比参考
a = (lambda x=lst[0]: [x := 2 * x + 3 * i for i in lst[1:]])()[-1]

In [None]:
reduce = '''
graph LR
l1[1]
l2[2]
l3[3]
d2((2))
d3((6))
l1 --> |*2|d2
l2 --> |*3|d3
d4((8))
d2 & d3 --> o1([+]) --> d4
d5((16))
d6((9))
d4 --> |*2|d5
l3 --> |*3|d6
d7((25))
d5 & d6 --> o2([+]) --> d7
'''

js_ui({'src': reduce}, TEMPLATE_MERMAIDJS, height=500)

### 迭代器和生成器

迭代器 (iterator) 是一种实现了迭代器协议的对象，这种对象包含方法 `__iter__()` 和 `__next__()`

生成器 (generator) 是一种迭代器，但一次只能产生一个返回值，可以通过使用 `for` 循环或将它们传递给任何迭代函数或迭代结构来使用

可迭代对象可以用作迭代器，每次访问其中的一个成员

In [None]:
sweets = ['蛋挞', '榴莲酥', '枣糕', '甜甜圈']

sweet_iter = iter(sweets)

print(next(sweet_iter))
print(next(sweet_iter))
print(next(sweet_iter))

生成器可以用**函数**或**表达式**实现

通过**函数**实现生成器用到 `yield` 语句

In [None]:
# 在函数体实现一个循环
def gen_func():
    for i in range(5):
        yield 2 * i # 注意不是用return关键字返回值

for item in gen_func():
    print(item)

生成器的特性是**延迟计算**，适合计算大型集合，尤其是涉及循环本身，同时又不想为所有结果分配内存的场合

对比用生成器和一般函数实现的斐波那契数列

In [None]:
def fibon1(n):
    a = b = 1
    for i in range(n):
        yield a
        a, b = b, a + b

n = 1000
for num in fibon1(n):
    print(num)

In [None]:
# 下面这个版本可能导致系统资源耗尽
def fibon2(n):
    a = b = 1
    result = []
    for i in range(n):
        result.append(a)
        a, b = b, a + b
    return result

for num in fibon2(n):
    print(num)

通过**表达式**也能制作生成器

生成器表达式的定义将循环放在圆括号中，语法与推导式相同

In [None]:
# 定义一个生成器表达式
gen = (x for x in range(5))

print(next(gen))
print(next(gen))

生成器表达式往往可以与其他表达式配合使用，例如与 lambda 表达式

In [None]:
# 注意func现在是一个函数
func = lambda n: (x for x in range(n))

# 这里可看出，我们定义的func相当于Python的内置函数range()
for i in func(10):
    print(i)

## Python的各种声明语句

Python 没有变量声明，但有其他类型的声明语句，通常涉及程序的控制和诊断

### `break` 打断和 `continue` 继续

只能直接嵌套于 `for` 或 `while` 循环结构中

- `break` 中断最近一次的循环
- `continue` 继续最近一次的循环的下一个循环

In [None]:
# break 和 continue 例子

for i in range(100):
    if i > 8:
        break
    if i % 2 == 0:
        continue
    print(i)

### `return` 返回和 `yield` 产生

`return` 指示从函数中返回，只能用在函数定义中，不能用在表达式中

`yield` 仅能用于生成器函数，一个函数若用 `yield` 替代 `return` 返回值，则函数转变为生成器函数

详见[生成器](#迭代器和生成器)

### `import` 导入模块

在当前的上下文环境中，导入外部模块，成为本地命名空间的一部分，常见用法是

- `import 模块名`
- `from 模块名 import 模块中定义的公开的名称`

> 非公开名称无法导入

多个模块或模块中的内容，可以用逗号 (`,`) 分隔

要导入模块中的所有公开名称，可以用通配符 (`*`) 表示

- `from 模块名 import *`

In [None]:
from math import gcd

primes = [2, 3, 5, 7, 11, 13, 17, 19]
print(gcd(*primes))

### `assert ` 条件断言

**断言** (assertion) 是在开发过程中记录、调试和测试代码的便捷工具，使代码更加高效、健壮和可靠

断言的主要作用是在程序中出现错误时触发警报，意味着确保这个条件仍然成立，否则抛出错误

`assert ` 语句由关键字、要测试的 `assert` 表达式或条件和可选的消息组成，条件应该始终为真

- 如果断言条件为真，什么都不会发生，程序继续正常执行
- 如果断言条件为假，则 `assert` 引发 `AssertionError`

In [None]:
number = 42
assert number == 42, f'回答生命、宇宙和一切的终极问题应该是42，但你给的是{number}'

In [None]:
number = 18
assert number == 42, f'回答生命、宇宙和一切的终极问题应该是42，但你给的是{number}'

断言用来测试代码健全度，常用的断言包括

- 测试比较运算
- 测试容器的成员
- 测试数据类型

注意，在生产环境中应该**禁用断言**

>  若要不带断言运行代码，使用 `-O` 标签，例如
>
>  ```shell
>  python -O my_script.py
>  ```


### `raise` 引发异常

Python 把程序出错分为错误 (error) 和异常 (exception)

- 错误一般是指语法错误，在解释器翻译字节码时就能捕捉到
- 异常一般是指运行时错误，只有在程序执行时才能发现

异常多数由于代码逻辑引起，例如

- `SyntaxError`：句法错误，检查出错点附近的源代码句法
- `IndentationError`：缩进错误，通常是源代码缩进没有统一
- `NameError`：名称错误，通常是没有定义这个变量
- `AttributeError`：属性错误，通常是对象没有定义这个属性
- `TypeError`：类型错误，通常是无法自动转换类型时
- `ValueError`：值错误，通常是取到错误的值
- `IndexError`：索引错误，通常是引用序列元素时越界
- `KeyError`：键错误，通常是引用字典的键不存在
- `ModuleNotFoundError`：模块未找到错误，通常是没有安装这个模块
- `FileNotFoundError`：文件未找到，通常是由于文件路径出现问题

使用 `raise` 关键字可以手动引发异常，例如

In [None]:
raise ValueError

这种写法没有意义，因此通常要配合异常处理代码块来使用

此外，`assert` 语句其实等价于带有条件结构的引发 `AssertionError` 异常，例如前面的例子

In [None]:
if __debug__:
    if not number == 42:
        raise AssertionError

## 课后作业

**截止日期：2023-04-07 00:00**

### 1. 多维数组求和

编写 Python 代码，对数值类型多维数组的成员求和，要求 $n$ 维数组 ($n>0$) 的求和结果是 $n-1$ 维数组

> 由于标量是 0 维，所以不用求和

可以用嵌套的列表表示多维数组

例如

- `[1, 2, 3.5] `的求和结果应该输出 `6.5`
- `[[1, 2, 3.5], [-2, 2.5, 3.1]] `的求和结果应该输出 `[6.5, 3.6]`

注意，使用数值计算、数据分析等第三方模块/库，不得分

[comment]: 答案写在这里



### 2. 打印杨辉三角

在代数学中，杨辉三角可以表示二项展开式的系数，即

$$(x+y)^n=\sum_{k=0}^n C_n^k x^{n-k}y^k$$

中的系数$C_n^k$的三角排列，其中

$$C_n^k=\frac{n!}{k!(n-k)!}$$

这个序列的前 6 行如下

$$
\begin{split}
&1 \qquad&(x + y)^0 &= 1 \\
&1\quad 1 \qquad&(x + y)^1 &= 1x + 1y \\
&1\quad 2\quad 1\qquad&(x + y)^2 &= 1x^2 + 2xy + 1y^2 \\
&1\quad 3\quad 3\quad 1\qquad&(x + y)^3 &= 1x^3 + 3x^2y + 3xy^2 + 1y^3 \\
&1\quad 4\quad 6\quad 4\quad 1\qquad&(x + y)^4 &= 1x^4 + 4x^3y + 6x^2y^2 + 4xy^3 + 1y^4 \\
&1\quad 5\quad 10\quad 10\quad 5\quad 1\qquad&(x + y)^5 &= 1x^5 + 5x^4y + 10x^3y^2 + 10x^2y^3 + 5xy^4 + 1y^5 \\
\end{split}
$$

作业要求生成前 $n$ 行的杨辉三角序列并打印输出

思路提示：

1. 每一行的项可以表示成上一行的邻项相加的递推公式
2. 推导过程有两种选择
   - 从第一行开始作**迭代**
   - 从最后一行开始作**递归**
3. 每一行可以表示成列表，多行则表示成列表的列表`[[1], [1, 1], [1, 2, 1], [1, 3, 3, 1], [1, 4, 6, 4, 1], [1, 5, 10, 10, 5, 1]]` (类比：不等长二维数组)

允许使用本章提到的任何Python编程技巧实现