# 复习
- 字符串
- 迭代、循环

# Quiz
下面程序的结果是什么？

```python
sum = 0.0
for i in range(0, 10):
    sum += 0.1
print(sum)

print(0.3 * 3)
```

参考[Floating Point Arithmetic: Issues and Limitations](https://docs.python.org/3/tutorial/floatingpoint.html)。

# 函数（function）

> 程序是由一系列定义和操作组成的。

操作一般是通过函数完成的。Python提供了很多内建（built-in）函数，我们也可以自行定义并调用函数。

```python
def add(a, b):
    return a + b
```

几个关键概念：

- 函数名
- 参数（parameter）
- 返回值

## 抽象

思考：对于简单的`1 + 2`，你知道在CPU计算它时电路是如何运作的吗？

> 在解决复杂问题的过程中，**抽象**是简化问题的关键步骤。函数是定义抽象的一种常用的方式。

### 抽象无处不在

比如`print("hello world")`，我们实际上不需要关心它是如何将该字符串载入内存，又是如何从内存读取该数据并在终端显示，我们只需要“用”它即可。

----

前面提到如何计算一个整数的整数立方根。我们可以进一步将它定义成函数：

```python
def has_cube_root(x):
    cube_root = 0
    while True:
        if cube_root**3 >= abs(x):
            break
        cube_root += 1
    if cube_root**3 == abs(x):
        return True
    else:
        return False
```

> It is a good practice to define functions with returning values. (pure function)

## 类型提示

Python是动态类型的语言，属于鸭子类型（duck typing）系统。对于大型项目，推荐使用类型提示（type hint）或类型注解（type annotation），方便方便`pyright`和`mypy`等工具进行类型检查，从而在运行前就能发现潜在的错误。

> If it walks like a duck and it quacks like a duck, then it must be a duck.

In [1]:
def add(a: int, b: int) -> int:
    """这个函数用于加法运算"""
    return a + b

result = add(1, 3)

## 练习
我们设计新的程序来解决上面问题。主要思路如下：

- 直接计算该整数的立方根（是浮点数）
- 如果该浮点数是整数，那么说明找到了其整数立方根，否则就没有。

> Don't reinvent wheels.

## 函数是一等公民
函数可以嵌套（nesting）：

```python
def create_adder(x):
   def _adder(y):
       return x + y
   return _adder

add2 = create_adder(2)
add100 = create_adder(100)
```

函数也可以作为参数和返回值。

# 模块（module）

模块是第三方专门为了解决某些特定问题而编写的工具。Python本身自带了一些常用的模块，例如，`math`模块中具有较为复杂的求解正弦、余弦和平方根等运算，这些模块不需要安装，但是在使用前需要导入。

模块使得Python具备高度的**可扩展性**，并体现了**封装性**。

## 引入模块

- 引入整个模块

```python
import math

math.sqrt(2)
math.log(10) # 使用自然对数
math.e
math.pi
math.sin(math.pi / 2) # 参数是弧度
math.sin(math.pi * 30 / 180) 
```

- 引入模块中某个类/函数

```python
from math import sqrt

sqrt(2)
```

- 对模块进行取别名

```python
# 这是第三方包，需要单独安装：pip install numpy
from numpy as np
```

> 引入整个包对程序的性能并没有显著影响。参考[Is it more efficient to use "import <module>" or "from <module> import <func>"?](https://stackoverflow.com/questions/346723/is-it-more-efficient-to-use-import-module-or-from-module-import-func)。

### 练习
- 定义一个函数，接收三个参数，分别表示一元二次方程的$ax^2 + bx + c = 0$中的`a`、`b`和`c`，并假设$a$不为0，返回方程的其中一个实数根。

  $$x_{1,2} = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$$

- 思考：如何同时返回两个根？

```python
def min_max(a, b, c):
    return min(a, b, c), max(a, b, c)
```

## 使用模块案例
前面提到了计算立方根的两个方法，那么哪种方法更快呢？在理论分析之前，我们可以使用Python中的`timeit`进行计时。参考[timeit](https://docs.python.org/3/library/timeit.html)。

```python
import timeit
# 默认运行100万次
timeit.timeit(setup='from __main__ import has_cube_root', stmt='has_cube_root(3000)')
```

# 函数（续）
## 关键词参数和默认参数

```python
def print_time(year, month, day, isUS):
    if isUS:
        print(f"{month}-{day}-{year}")
    else:
        print(f"{year}-{month}-{day}")
```

传统的编程语言一般仅支持**位置参数**（positional arguments），而Python也支持**关键字参数**（keyword argument，命名参数）。它可以极大地提高代码的可读性：

```python
print_time(2008, 8, 8, False)
print_time(year=2008, month=8, day=8, isUS=False)
print_time(isUS=True, year=2008, month=8, day=8)
# 如果混合了位置参数和关键字参数，那么位置参数必须在前面。
print_time(2008, month=8, day=8, isUS=False)
```

### 默认参数
```python
def print_time(year, month, day, isUS=True):
    if isUS:
        print(f"{month}-{day}-{year}")
    else:
        print(f"{year}-{month}-{day}")
```

Python还支持默认参数（default argument）；**默认参数必须在参数列表的最后面**。

```python
print_time(2008, 8, 8, False)
print_time(2008, 8, 8)
print_time(year=2008, month=8, day=8, isUS=True)
print_time(year=2008, month=8, day=8)
```

### 思考探索
请查阅资料，理解下面函数定义的含义:

```python
def query_users(limit, offset, *, min_followers_count, include_profile):
    pass
```

```python
# Python 3.8引入的
def query_users(limit, offset, /, min_followers_count, include_profile):
    pass
```

## 作用域（scope）

测试下面代码的运行结果：

```python
i = 8
def foo():
    print(i)
    i = 9
    print(i)
foo()
print(i)
```

```python
i = 8
def foo():
    i = 9
    # print(j)
    j = 6
    print(i)
foo()
print(i)
# print(j)
```

作用域可以理解成命名空间（name space）。前面提到，变量就是一个名字而已。因此，关键问题就是“如何找到对应的名字”？

> 与其他编程语言不同的是，`if`、`while`和`for`并没有引入新的作用域。

### 访问变量的基本规则

> 在符号表（symbol table）搜索名字是（也只能）**向外**（局部 → 全局 → 内建）进行的。

因此，函数内部的局部（local）作用域对外不可见。换言之，全局（global）作用域的代码无法访问局部作用域。

```python
def foo():
    x = 1
    def bar():
        print(x)
    bar()
foo()    
```

### 练习

下面的代码正确吗？

```python
def foo():
    print(x)
    def bar():
        x = 1
    bar()
foo()    
```

----

```python
x = 42

def foo():
    x += 42
```

> Internally, Python assumes that any name directly assigned within a function is local to that function. Therefore, the local name, number , shadows its global sibling. In this sense, global variables behave as read-only names. You can access their values, but you can't modify them. 参考[Using and Creating Global Variables in Your Python Functions](https://realpython.com/python-use-global-variable-in-function/)。

### global和nonlocal

尽管`global`和`nonlocal`等关键词能够实现修改，但是一般不推荐使用，因为这会破坏程序的封装性，使得代码变得不可读。

```python
x = 42
def foo():
    global x
    x += 42
```

----

```python
def outer_function():
    x = 10

    def inner_function():
        nonlocal x
        x = 20
        print("Inner function:", x)

    inner_function()
    print("Outer function:", x)


outer_function()
```

## 参数传递（argument passing）

```python
def foo(x):
    x += 1
x = 5
foo(x)
print(x)
```

> Call by `object reference`

![call by object reference](../images/call-by-object-ref.png)

### 不可变对象（immutable objects）
整数、字符串、元组等都是不可变对象。

### 查看内存地址

```python
def foo(x):
    print("inner x: ", id(x))
    x += 1
    print("inner x+1: ", id(x))


x = 5
print("outter x: ", id(x))
foo(x)
```

### 练习
分析下面程序的结果：

```python
def f(x):
    def g():
        x = "abc"
        print("x = ", x)

    def h():
        z = x
        print("z = ", z)

    x = x + 1
    print("x = ", x)
    h()
    g()
    print("x = ", x)
    return g


x = 3
z = f(x)
print("x = ", x)
print("z = ", z)
print(z())
```

## 再谈命名
习惯上，使用`lowercase_with_underscores`的规范对函数进行命名（也称**snake_case**）。更具体的，PEP8有如下约定：

- 对于普通变量，使用蛇形命名法，比如 `max_value`；
- 对于常量，采用全大写字母，使用下划线连接，比如 `MAX_VALUE`；
- 如果变量标记为“仅内部使用”，为其增加下划线前缀，比如 `_local_var`；
- 当名字与 Python 关键字冲突时，在变量末尾追加下划线，比如 `class_`。

### 描述性要强
```python
def process(email):
    full_domain = email.split('@')[-1]
    domain = full_domain.split('.')[0]
    return domain

process('zpchen@swufe.edu.cn')
```

类似`process`, `compute`等作为方法名不够好。类似的，`tmp`，`data`等作为变量名也不够贴切。

### 练习
- 理解下面函数的作用，然后为函数重新取名：

```python
def compute(x):
    for i in range(2, x):
        if x % i == 0:
            return False
    return True
```

- 上面的代码可以改写成下面的形式：

```python
import math

def compute2(x):
    for i in range(2, int(math.sqrt(x)) + 1):
        if x % i == 0:
            return False
    return True
```

请使用`timeit`比较两者在`x`为10007时的运行效率，为缩短总的运行时间，建议将运行次数设置为1000。