# 函数

* 任务分解和分工
* 代码复用
* 结构化程序设计

函数类型

* 内置函数
* 标准库函数
* 第三方库函数
* 自定义函数

## 函数声明与调用

函数必须声明之后才能使用。

In [1]:
def my_max(a, b):
    '''the prob of either event occurs'''
    return a + b - a * b
my_max(0.4, 0.5)

0.7

In [2]:
def my_min(a, b):
    '''
    return the prob of both events occur.
    parameters: a, b = the prob of event A, B, respectively
    '''
    return a*b
my_min(0.3, 0.6)

0.18

函数体的第一部分，由三个引号括起来的字符串为函数的docstring，用于函数的帮助文档。

In [3]:
my_max.__doc__

'the prob of either event occurs'

In [4]:
help(my_min)

Help on function my_min in module __main__:

my_min(a, b)
    return the prob of both events occur.
    parameters: a, b = the prob of event A, B, respectively



In [5]:
def do_nothing_return_nothing():
    pass

In [6]:
do_nothing_return_nothing()

函数声明和调用注意事项：

* 先声明后使用
* 调用函数时，必须将参数放在函数名后的小括号内，不论是否有参数
* 若调用时传递给函数的参数与函数定义不符，则会导致错误。

## 参数传递

函数定义时声明了一组参数，调用时需要将实际数值恰当的传递给函数，函数才能得到预期结果。

### 形式参数与实际参数

* 形式参数：函数定义时声明的参数名称。

* 实际参数：函数调用时传递的实际参数。

In [7]:
def odds(a, b):
    return (a + 0.5) / (b + 0.5)

注意观察下面在调用函数时，传递给a和b的参数值分别是什么？

In [8]:
odds(2,4),odds(4,2)

(0.5555555555555556, 1.8)

### 参数传递方式

* 位置参数：不指定对应的形式参数名称，默认按位置顺序将实参传递给形式参数。

* 命名参数：按名称传递实际参数，也称为关键字参数。此时，实参传递顺序可以与形参声明顺序不同。

In [9]:
def follower(a, b, c):
    return a - b - c

如果采用命名参数来传递参数，调用时参数顺序是任意的。观察下面两个表达式的结果是一致的。

In [10]:
follower(a = 21, b = 15, c = 3), follower(b = 15, a = 21, c = 3)

(3, 3)

这两种调用方式与下面的位置参数传递方式是一致的。

In [11]:
follower(21, 15, 3)

3

下面的代码看起来也很像是命名参数传递，但结果为什么就不一样呢？

In [12]:
a, b, c = 21, 15, 3
follower(a, b, c), follower(b, a, c)

(3, -9)

注意：使用命名参数时，必须使用 key = value 的形式。函数的形式参数是怎么命名的，我们可以查看函数签名。

<h4> 位置和命名参数混合传递</h4>

**当位置参数与命名参数同时存在时，位置参数必须在最前面。**

In [13]:
def follower(a, b, c):
    return a - b - c
print(follower(10, 5, c = 2)) 
print(follower(10, c = 3, b = 2))
# print(follower(a = 3, 10, c = 2))  #error

3
5


<h4>可选参数与参数默认值</h4>

可以在定义函数时声明某些参数为可选参数并为其赋默认值。  
冷知识：  
`print(x,y,sep='sf',end='csd')`  
其中sep是分隔符(默认空格)，end是结束符(默认换行)

In [14]:
def my_join(a, b, sep = ''):
    return a + sep + b
my_join('1','2'), my_join('3', '4', '+')

('12', '3+4')

<h4> 可变数量参数</h4>

* 使用元组收集所有的位置参数，声明 \*prmt

* 使用字典收集所有的关键字（命名）参数，声明 \*\*prmt2

In [15]:
def my_add(a, b, *val, **optional):
    my_sum = a + b
    for v in val:
        my_sum += v
    for k in optional:
        my_sum += optional[k]
    return my_sum

In [16]:
my_add(1, 2, 3, 4, 5, c = -1, d= -2)

12

* \*prmt参数和\*\*prtmt2参数必须在形参列表的最后位置
* \*\*prtmt2参数必须在\*prmt参数的后面
* 含有一个\*的参数只能有一个
* 含有两个\*的参数只能有一个

为啥？ 解释

In [17]:
#def a_func(a, b, **c, *d):  #  error
#    pass
#def b_func(a, b, *c, *d):  #  error
#   pass

## 函数返回值


函数使用 return 语句返回值，并结束函数返回调用函数的程序。

return语句可以出现在函数任何位置，一旦执行，函数其他的语句将不再执行。

In [18]:
def harmonic_sum(n):
    s = 0
    for i in range(1,n):
        s += 1/i
    return s
harmonic_sum(5)

2.083333333333333

### return语句的几种情形

* 函数中有若干return语句，只有一个执行了
* 函数中有若干return语句，直到函数结束都没有执行

In [2]:
def is_even(a):
    if a%2 == 0:
        return True

下面的调用返回值是多少呢？

In [5]:
is_even(3)

下面的函数中有多个return语句，分析一下函数的返回值。

In [21]:
def is_prime(n):
    if n < 2: return False
    k = int(n ** 0.5) + 1
    for i in range(2, k):
        if n % i == 0: return False
    return True

In [22]:
is_prime(31)

True

In [23]:
for i in range(100):
    if is_prime(i): print(i, end = ' ')

2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 

函数返回值为None的情况小结：

* 函数无return语句
* return语句未执行
* return后无返回值表达式

### 函数对象引用作为返回值

函数在Python中也是对象，可以赋值给其他变量，也可以作为参数传递给其他对象。当然，既然函数是对象，也可以作为其他函数的返回值。

In [24]:
f = sum; g = max
type(f), type(g)

(builtin_function_or_method, builtin_function_or_method)

In [25]:
f([123, 456, 789]), g([123, 456, 789])

(1368, 789)

以下定义一个函数，它可以根据传入的函数不同，执行不同的操作。

In [26]:
def aggr(f,numbers):
    return f(numbers)
numbers = [2, 7, 1, 8, 2, 8]
aggr(f,numbers), aggr(g, numbers)

(28, 8)

下面的列子演示了如何将函数对象作为值返回。

In [27]:
def choose_your_command(s):
    if s == 1:
        return sum
    elif s == 2:
        return min
    else:
        return max
choose_your_command(3)([2, 3, 5])

5

## 变量作用域


* 局部变量，在函数和类中声明的变量，只能在声明的函数和类中访问。
* 全局变量，在函数和类之外声明的变量，全局可见。

比较下面两段代码。

In [28]:
v1, v2 = 3.1, 4.2
def func():
    v2 = v1 + 6
    print(v1, v2)
func()
print(v1,v2)

3.1 9.1
3.1 4.2


In [29]:
v1, v2 = 3.1, 4.2
def func():
    v1 = 5
    v2 = v1 + 6
    print(v1, v2)
func()
print(v1,v2)

5 11
3.1 4.2


* 凡是在函数内定义的变量，只能在函数内访问。
* 在函数内可以访问函数外的全局变量。
* 当函数内定义的变量与函数外的变量同名时，局部变量优先被访问。
* 函数内无法修改全局变量。

注意：**当函数中试图修改全局变量时，实际上函数会创建一个局部变量，该变量会在函数运行结束时销毁。**

In [30]:
i, s = 3, 6
def get_k(k):
    if k < s:
        k = s
    i = k + 5
    print(i, s)
    return k
get_k(4)
print(i, s)

11 6
3 6


### global语句

如果希望在函数中修改全局变量，需要使用global语句声明。

In [31]:
n = 5
def arrive():
    global n
    n += 1
arrive()
print(n)

6


## 匿名函数

匿名函数使用lambda语句生成，是一种特殊的函数定义方式。

* 匿名函数定义方法

lambda关键字之后紧跟形参(列表)，冒号后为函数返回值。

In [32]:
get_initial = lambda x : x[0]
get_initial('Jack')

'J'

<h4> 匿名函数的应用场合 </h4>  

* 需要函数对象作为参数;   
* 函数比较简单;  
* 函数仅仅使用一次。  

In [33]:
heads = map(get_initial, ['Jack', 'Alice', 'Mike', 'Tom'])
list(heads)

['J', 'A', 'M', 'T']

In [34]:
tails = map(lambda x:x[-1], ['Jack', 'Alice', 'Mike', 'Tom'])
list(tails)

['k', 'e', 'e', 'm']

匿名函数在数据分析实践中大量使用，很多的数据处理函数需要一个函数作为参数。注意练习一些常用操作的匿名函数写法。如筛选函数。

In [35]:
f = lambda x: x > 0
list(filter(f, [1, -1, 2, -2, 3, -3]))

[1, 2, 3]

## 函数式编程

函数式编程着眼于数据上的一系列操作，每个操作完成从原始数据到结果的映射，即函数。通过对原始数据应用一系列函数达到运算结果。

### 函数式编程工具

map(), filter(), reduce(), 匿名函数  
**reduce()**  
原型：`reduce (func, seq[], init())`  
func是一个二元函数，先对seq中前两个元素求解，再将结果与第三个元素求解，逐渐迭代至seq结束。还可以指定init，在指定了的情况下，首先将init与seq中第一个元素进行运算。  
e.g. reduce(lambda x, y: x * y, range(1, n),2)  
返回值为n-1的阶乘的两倍

In [36]:
def add_2(n):
    return n//10 + n%10
a = map(add_2, range(10,20))
list(a)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [37]:
def is_even(n):
    return n%2 == 0
b = filter(is_even, [23, 32, 12, 21, 35, 53])
list(b)

[32, 12]

In [38]:
def bigger(x,y):
    return x if x>y else y
from functools import reduce
c = reduce(bigger, [23, 32, 12, 21, 35, 53])
c

53

### 函数作为参数传递

注意到以上代码有一个共同特点，函数作为参数。类似的还有如sorted函数。

In [39]:
k = list('abcde'); v = [3, 1, 4, 1, 5]
d = dict(zip(k,v))
sorted(d, key = lambda x:d[x])

['b', 'd', 'a', 'c', 'e']

## 递归函数

Python允许在函数中调用函数本身，即递归调用。

递归调用与数学归纳法相对应，代码可以比较简洁。

In [40]:
def fibo(n):
    if n <= 2: return 1
    return fibo(n-1) + fibo(n-2)

In [41]:
fibo(10)

55

如非必要，尽量避免使用递归函数。