# 函数基础（function）

![函数](assets/Function_machine2.png)

## 定义函数

### 语法

定义函数的语法为：
```
def function_name(arguments):
    statement(s)
```                  

语法要素主要有：
- 关键词`def`
- 函数名与参数
- 冒号`:`与缩进
- 函数体语句

容易忘的语法错误：
- 忘记冒号
- 缩进不一致

需要注意的是，当定义一个函数时，缩进的语句块并没有执行。也就是说只要函数体语句没有语法错误，Python解释器并不会抛出任何异常。

In [22]:
def funcname():
    x = 1 / 0      # ZeroDivisionError
    unknown_var    # NameError

不过，当开始调用函数时，就会开始执行代码块，就会引发错误。

In [23]:
funcname()

ZeroDivisionError: division by zero

函数必须先定义，然后才能调用。与定义变量一样，如果调用未定义函数，会引发`NameError`异常。

In [24]:
unknown_function()

NameError: name 'unknown_function' is not defined

### 爱如潮水

> 台湾蔡省长:“用爱发电”

> 老王：“用爱编程”


尽管程序员整日面对着电脑，不善言辞，但同样也是爱如潮水且炽热。那么程序员的爱会如何编程呢？

In [25]:
# 我爱你十国语言版
def loveyou():
    print('我爱你')    
    print('I Love You')
    print('私は爱する')             # 日本：
    print('나는 너를 사랑한다')     # 韩国
    print('Я люблю вас')   # 俄罗斯
    print("Je t'aime")              # 法国
    print('Ich liebe dich')         # 德国
    print('∑ας αγαπώ')       # 希腊
    print('Te amo')                 # 西班牙
    print('Ik houd van u')          # 荷兰

In [26]:
# 用不同语言爱着你
loveyou()

我爱你
I Love You
私は爱する
나는 너를 사랑한다
Я люблю вас
Je t'aime
Ich liebe dich
∑ας αγαπώ
Te amo
Ik houd van u


In [29]:
# 如果加上一个期限，我希望是一万年。
for _ in range(3):
    loveyou()

我爱你
I Love You
私は爱する
나는 너를 사랑한다
Я люблю вас
Je t'aime
Ich liebe dich
∑ας αγαπώ
Te amo
Ik houd van u
我爱你
I Love You
私は爱する
나는 너를 사랑한다
Я люблю вас
Je t'aime
Ich liebe dich
∑ας αγαπώ
Te amo
Ik houd van u
我爱你
I Love You
私は爱する
나는 너를 사랑한다
Я люблю вас
Je t'aime
Ich liebe dich
∑ας αγαπώ
Te amo
Ik houd van u


### 自省

> 吾每遇对象必自省，用变量而知其类乎？用其值而知属性乎？用其法而知方法乎？

使用内置函数`type()`查看对象的类型

In [31]:
print(type(loveyou))

<class 'function'>


使用内置函数`id()`查看对象内存地址

In [32]:
id(loveyou)

139713977464352

使用内置函数`callable()`检查对象是否可以调用

In [33]:
callable(loveyou)

True

使用内置函数`help()`

In [34]:
help(loveyou)

Help on function loveyou in module __main__:

loveyou()
    # 我爱你十国语言版



使用自省功能?或??

In [35]:
loveyou?

In [36]:
loveyou??

使用`dir()`函数列出对象的属性和方法

In [37]:
dir(loveyou)

['__annotations__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

可以查看一下`loveyou`对象的一些属性

In [38]:
print(loveyou.__name__)
print(loveyou.__doc__)
print(loveyou.__code__)
print(str(loveyou))
print(repr(loveyou))

loveyou
None
<code object loveyou at 0x7f11b1ff8030, file "<ipython-input-25-5e5f128488c8>", line 2>
<function loveyou at 0x7f11b1ff3620>
<function loveyou at 0x7f11b1ff3620>


使用魔术命令`%timeit`了解运行状况

In [None]:
%timeit loveyou()

### 文档字符串

在函数体中，第一行语句可以是可选字符串文本，用来存放函数的说明文档，称为文档字符串（docstring）。

In [40]:
def loveyou2():
    """用十国语言说我爱你
    
    语言包括：中国、美国、日本、韩国、俄罗斯
              法国、德国、希腊、西班牙、荷兰
    """
    print('我爱你')    
    print('I Love You')
    print('私は爱する')             # 日本：
    print('나는 너를 사랑한다')     # 韩国
    print('Я люблю вас')   # 俄罗斯
    print("Je t'aime")              # 法国
    print('Ich liebe dich')         # 德国
    print('∑ας αγαπώ')       # 希腊
    print('Te amo')                 # 西班牙
    print('Ik houd van u')          # 荷兰

函数对象的属性`__doc__`存放了文档字符串的内容。

In [41]:
print(loveyou2.__doc__)

用十国语言说我爱你
    
    语言包括：中国、美国、日本、韩国、俄罗斯
              法国、德国、希腊、西班牙、荷兰
    


In [42]:
help(loveyou2)

Help on function loveyou2 in module __main__:

loveyou2()
    用十国语言说我爱你
    
    语言包括：中国、美国、日本、韩国、俄罗斯
              法国、德国、希腊、西班牙、荷兰



### 参数传递

在定义函数时，名字后面圆括号所包括的是函数参数，也称为形式参数。在调用函数时，会传入实际参数来代替形式参数。

Python函数的参数传入总是“传值调用”，即在函数体内实际是实参的拷贝值。不过，在Python中所有变量都是对象的引用，也就是说函数体内的参数引用的对象是同一个。

In [44]:
def pass_parameter(arg):
    """the parameter passed"""
    print('formal parameter: ', type(arg), id(arg), arg)

In [45]:
var = '老王'
print('real parameter: ', type(var), id(var), var)
pass_parameter(var)
print('after function call: ', type(var), id(var), var)

real parameter:  <class 'str'> 139714212690472 老王
formal parameter:  <class 'str'> 139714212690472 老王
after function call:  <class 'str'> 139714212690472 老王


> 每个对象都有三个特性：类型、身份标识、值。

根据其值是否可改变，对象分为：不可变对象（immutable）与可变对象（mutable）。

在函数体内可能会对传入的对象进行处理操作，对不可变对象或可变对象引起的结果会有所不同。

对于不可变对象，当发生更改操作时，引用对象发生了变化，并不影响实参。

In [46]:
def change_parameter(obj):
    """change the immutable object passed"""
    print('formal Parameter: ', type(obj), id(obj), obj)
    obj = '老李'
    print('formal Parameter: ', type(obj), id(obj), obj)    

In [47]:
var = '老王'
print('real parameter: ', type(var), id(var), var)
change_parameter(var)
print('after function call: ', type(var), id(var), var)

real parameter:  <class 'str'> 139713977062656 老王
formal Parameter:  <class 'str'> 139713977062656 老王
formal Parameter:  <class 'str'> 139713977064152 老李
after function call:  <class 'str'> 139713977062656 老王


对于可变对象，如果在函数体内更改了可变对象的值，那么实参的值也就发生了变化。

In [49]:
def change_parameter2(obj):
    """change the mutable object passed"""
    print('formal Parameter: ', type(obj), id(obj), obj)
    obj.append(2)
    print('formal Parameter: ', type(obj), id(obj), obj)    

In [50]:
var = ['老王']
print('real parameter: ', type(var), id(var), var)
change_parameter2(var)
print('after function call: ', type(var), id(var), var)

real parameter:  <class 'list'> 139713977281416 ['老王']
formal Parameter:  <class 'list'> 139713977281416 ['老王']
formal Parameter:  <class 'list'> 139713977281416 ['老王', 2]
after function call:  <class 'list'> 139713977281416 ['老王', 2]


### `return`语句

使用`return`语句退出函数，同时向调用者返回一个表达式。

In [51]:
def add(value1, value2):
    """return a sum"""
    return value1 + value2

In [52]:
result = add(3, 5)
print(result, type(result))

8 <class 'int'>


如果`return`语句不指定参数，则返回一个空对象`None`。

In [53]:
def add2(value1, value2):
    """return a None"""
    result = value1 + value2
    return 

In [54]:
result = add2(3, 5)
print(result, type(result))

None <class 'NoneType'>


如果在函数体最后没有`return`语句，缺省还是返回空对象`None`

In [55]:
def add3(value1, value2):
    """no return statement"""
    result = value1 + value2

In [56]:
result = add3(3, 5)
print(result, type(result))

None <class 'NoneType'>


## 函数参数

> 吃饭是为了活着，活着不是为了吃饭

假如人活80岁，一生吃饭次数大约为86400次，恰好是1天的总秒数。要吃饭的就得点菜，想想一辈子要为吃饭费86400次脑子，就有些头痛。还好大家是学编程的，那我们就用点菜来讲解函数。

In [57]:
dayoflife = 80 * 360
mealtimes = dayoflife * 3
print(mealtimes)

86400


### 位置参数

现在假定三菜分别是肉、鱼、蔬菜类。我们可以创建如下函数：

In [58]:
def order(meat, fish, vegetable, soup):
    """Order meal include meat, fish, vegetable and soup"""
    print('meat: {0}'.format(meat))
    print('fish: {0}'.format(fish))
    print('vegetable: {0}'.format(vegetable))
    print('soup: {0}'.format(soup))

In [59]:
meat, fish, vegetable, soup = '小炒肉', '清蒸鱼', '蔬菜拼盘', '鸡蛋汤'
order(meat, fish, vegetable, soup)

meat: 小炒肉
fish: 清蒸鱼
vegetable: 蔬菜拼盘
soup: 鸡蛋汤


位置参数是必须传入的参数，在调用函数时数目和声明的要一样。否则就会引发`TypeError`错误。

In [60]:
order(meat, fish, vegetable)

TypeError: order() missing 1 required positional argument: 'soup'

In [61]:
beverage = 'beer'
order(meat, fish, vegetable, soup, beverage)

TypeError: order() takes 4 positional arguments but 5 were given

位置参数还有一个弊端就是，必须清楚每个参数的含义。在调用函数时，位置次序必须一致，否则就会表错情会错意，得到完全不同的结果。这也是位置参数名字的由来。

In [62]:
order(fish, meat, soup, vegetable)

meat: 清蒸鱼
fish: 小炒肉
vegetable: 鸡蛋汤
soup: 蔬菜拼盘


### 关键字参数

为了避免位置参数的弊端，Python函数可以通过关键字参数(`keyword=value`)的形式来调用。每个关键字参数会有一个缺省值。这非常有用。例如，在大多情况下，我们都会点蔬菜拼盘和鸡蛋汤，如果每次调用函数都得输入该值，实在是有些麻烦。那么通过关键字参数可以轻松实现。

In [63]:
def order2(meat, fish, vegetable='蔬菜拼盘', soup='鸡蛋汤'):
    """Order meal include meat, fish, vegetable and soup"""
    print('meat: {0}'.format(meat))
    print('fish: {0}'.format(fish))
    print('vegetable: {0}'.format(vegetable))
    print('soup: {0}'.format(soup))

关键字参数必须放在位置参数后面，否则就会引发语法错误

In [64]:
def wrongorder2(meat, vegetable='蔬菜拼盘', fish, soup='鸡蛋汤'):
    """Order meal include meat, fish, vegetable and soup"""
    print('meat: {0}'.format(meat))
    print('fish: {0}'.format(fish))
    print('vegetable: {0}'.format(vegetable))
    print('soup: {0}'.format(soup))

SyntaxError: non-default argument follows default argument (<ipython-input-64-9e6287152fc0>, line 1)

函数定义完后，可以通过多种方法调用

只给出位置参数

In [65]:
meat, fish = '鱼香肉丝', '剁椒鱼头'
order2(meat, fish)

meat: 鱼香肉丝
fish: 剁椒鱼头
vegetable: 蔬菜拼盘
soup: 鸡蛋汤


给出一些可选参数

In [66]:
meat, fish, vegetable = '红烧肉', '鱼头汤', '炒菠菜'
order2(meat, fish, vegetable)

meat: 红烧肉
fish: 鱼头汤
vegetable: 炒菠菜
soup: 鸡蛋汤


给出全部参数

In [67]:
meat, fish, vegetable, soup = '红烧肉', '鱼头汤', '炒生菜', '酒酿圆子'
order2(meat, fish, vegetable)

meat: 红烧肉
fish: 鱼头汤
vegetable: 炒生菜
soup: 鸡蛋汤


从示例可知，传递位置参数时数目和次序需要保持一致；关键字参数是可选的，不一定需要输入，但位置参数方法来传递关键字参数，次序仍然要保持一致。

不过在函数调用时，要传递关键字参数，通常使用`keyword=value`的方式来传递，如此则顺序并不重要。

In [68]:
meat, fish, vegetable, soup = '红烧肉', '鱼头汤', '炒生菜', '酒酿圆子'
order2(meat, fish, soup=soup, vegetable=vegetable)

meat: 红烧肉
fish: 鱼头汤
vegetable: 炒生菜
soup: 酒酿圆子


注意，关键字参数也不能重复输入，否则会语法错误。

In [69]:
meat, fish, vegetable, soup = '红烧肉', '鱼头汤', '炒生菜', '酒酿圆子'
soup2 = '罗宋汤'
order2(meat, fish, soup=soup, vegetable=vegetable, soup=soup2)

SyntaxError: keyword argument repeated (<ipython-input-69-8bc5e050bc01>, line 3)

为了充分利用关键字参数的优点，点菜函数可以定义为

In [70]:
def order3(meat='红烧肉', fish='剁椒鱼头', vegetable='蔬菜拼盘', soup='鸡蛋汤'):
    """Order meal include meat, fish, vegetable and soup"""
    print('meat: {0}'.format(meat))
    print('fish: {0}'.format(fish))
    print('vegetable: {0}'.format(vegetable))
    print('soup: {0}'.format(soup))

In [71]:
order3()

meat: 红烧肉
fish: 剁椒鱼头
vegetable: 蔬菜拼盘
soup: 鸡蛋汤


### 不定参数（`*args`）

在有些情况，函数的位置参数不定。也就是说，事先不知道用户会传递多少个位置参数。在此场景可以使用关键字`*args`。这个有些类似C语言函数中的不定参数，例如：
```C
printf(string, ...)
```

仍然以点菜为例，随着经济发展，有些人想腐败一些，就把点菜函数改了。需求更改为必须有一个荤菜，其它不限，可多可少。

In [72]:
def order4(meat, *args):
    """Order meal include meat, ..."""
    print('meat: {0}'.format(meat))
    for i, arg in enumerate(args):
        print('menu {0}: {1}'.format(i+1, arg))

In [75]:
meat= '红烧肉'
order4(meat)

order4(meat, '鲍鱼', '鱼翅', '鱼肚', '海参')

meat: 红烧肉
meat: 红烧肉
menu 1: 鲍鱼
menu 2: 鱼翅
menu 3: 鱼肚
menu 4: 海参


有了不定参数，想吃啥就吃啥。不过，不要公款。

### 不定关键字参数（`**kwargs`）

`**kwargs`将不定长度的键值对，作为参数传递给一个函数。

In [78]:
def order5(meat, **kwargs):
    """Order meal include meat, ..."""
    print('meat: {0}'.format(meat))
    for key, value in kwargs.items():
        print('menu {0}: {1}'.format(key, value))

In [79]:
meat= '红烧肉'
order5(meat, seafood='鲍鱼', fish='剁椒鱼头', vegetable='炒菠菜', soup='鸡蛋汤')

meat: 红烧肉
menu seafood: 鲍鱼
menu fish: 剁椒鱼头
menu vegetable: 炒菠菜
menu soup: 鸡蛋汤


### 多参数混搭

如果需要混合使用位置参数、关键字参数、不定位置参数、不定关键字参数，其顺序应该是：
```
some_func(fargs, *args, fkeyvalues, **kwargs)
```

编写如下函数，打印各参数

In [80]:
def print_args(arg1, *args, keyword1="123", **kwargs):
    """print args"""
    print(type(arg1), arg1)
    print(type(args), args)
    print(type(keyword1), keyword1)
    print(type(kwargs), kwargs)    

In [81]:
print_args('arg1', 'args0', 'args1', kwargs0='kwargs0', kwargs1='kwargs1')

<class 'str'> arg1
<class 'tuple'> ('args0', 'args1')
<class 'str'> 123
<class 'dict'> {'kwargs0': 'kwargs0', 'kwargs1': 'kwargs1'}


从示例可知，不定参数是元组类型，不定关键字参数是字典类型

最后，我们重新实现点菜函数。

In [2]:
def order6(meat, *args, staple_food='米饭', soup='鸡蛋汤', **kwargs):
    """Order meal include meat, soup and the other"""
    print('免费菜')
    print('\t荤菜: {0}'.format(meat))
    print('\t主食: {0}'.format(staple_food))
    print('\t汤: {0}'.format(soup))
    if len(args) + len(kwargs) > 0:
        print('付费菜')
        for i, arg in enumerate(args):
            print('\t荤菜{0}: {1}'.format(i+1, arg))        
        for key, value in kwargs.items():
            print('\t{0}: {1}'.format(key, value))

In [3]:
order6('红烧肉')

免费菜
	荤菜: 红烧肉
	主食: 米饭
	汤: 鸡蛋汤


In [4]:
order6('红烧肉', '大虾', drink='茅台')

免费菜
	荤菜: 红烧肉
	主食: 米饭
	汤: 鸡蛋汤
付费菜
	荤菜1: 大虾
	drink: 茅台


介绍自省模块`inspect`中的两个函数`signature()`与'getfullargspec()'，可以得到函数对象的参数信息。

In [11]:
import inspect

print(inspect.getfullargspec(order6))

print(inspect.signature(order6))

FullArgSpec(args=['meat'], varargs='args', varkw='kwargs', defaults=None, kwonlyargs=['staple_food', 'soup'], kwonlydefaults={'staple_food': '米饭', 'soup': '鸡蛋汤'}, annotations={})
(meat, *args, staple_food='米饭', soup='鸡蛋汤', **kwargs)


## 递归函数

在定义一个函数时，常常会调用一些系统函数；函数定义后，又会在其它地方调用这个函数。而递归函数则是在函数体内再调用自身，与知名的衔尾蛇（蛇吞尾）有点相像。

衔尾蛇图像最早出现于埃及，象征着永恒、轮回、无穷大、循环。

![蛇吞尾](assets/Uroborus.jpg)

递归（recursion）有无穷尽循环的意思。下面定义一个最简单的递归函数

In [15]:
def recursion():
    print('recursion...')
    return recursion()

然后调用这个递归函数。显而易见，除了不停地打印递归信息外，并没有干什么正事。然而，最终这个程序会引起`RecursionError`异常。Python在每次调用函数时，都会分配一些内存，在太多的函数调用后发生，空间不够，引起递归异常，显示错误信息为“最大递归深度超出”。

In [49]:
recursion()

recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion


recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion
recursion


RecursionError: maximum recursion depth exceeded in comparison

我们称上述递归为无限递归（infinite recursion）。那么，要编写有用的递归函数，就要避免出现无限递归，也就是说递归要有办法停下来。

用经典的递归函数案例来介绍Python的递归函数。求解阶乘的算法是，已知正整数`n`，计算乘积$n\times(n-1)\times(n-2)\times\cdots\times1$。首先用常规方法实现阶乘：

In [50]:
def factorial(n):
    """return the factorial of a number"""
    result = n
    for i in range(1, n):
        result *= i
    return result

In [51]:
factorial(5)

120

然后用递归的方法实现。根据阶乘的定义可知，`n`的阶乘等于`n`乘以`n-1`的阶乘，`n-1`的阶乘又等于`n-1`乘以`n-2`的阶乘，如此循环下去。如果该递归函数是无限循环的话，那么就会失败。幸运的是，当整数`n`循环到整数`1`的时候，其结果为1，可以退出循环。

In [52]:
def factorial2(n):
    """return a factorial of a number n with recursion"""
    if n == 1:
        print('recursion {} finished'.format(n))
        return 1
    else:
        print('recursion {}'.format(n))
        return n * factorial2(n-1)

In [53]:
factorial2(5)

recursion 5
recursion 4
recursion 3
recursion 2
recursion 1 finished


120

递归函数基本上都可以用循环来替代，甚至使用循环效率更高效。那为什么还使用递归函数呢？使用递归函数，代码可读性更高，但前提是理解了递归函数的定义。

## Lambda函数

要定义一个函数，就得给函数起个名字。函数命名最基本原则是要望文生义，要想出一个长期好用的函数名，犹如给新生儿起名，并非一件轻而易举的事情。在一个团队，因此而争吵也在所难免。

在有些场景，只需传入一个简单函数，并不需要显式地定义函数。Python提供了Lambda函数，又称为匿名函数。顾名思义，就是可以快捷简单地创建函数，而又不用为函数命名大费周章。

Lambda函数的语法如下：
```
lambda arguments: expression
```
基本要素是：
- 关键词`lambda`，而不是`def`
- 参数是可选，如果多个参数，参数使用逗号分隔；
- 表达式


`lambda`函数的应用场景是快捷创建一个简单函数，故而也有一些限制。例如，不能包含分支（条件表达式例外）与循环，以及`return`或`yield`语句。否则就会引起语法错误。

In [54]:
lambda x: return x if x > 0 else abs(x) 

SyntaxError: invalid syntax (<ipython-input-54-23a9a0ee2b92>, line 1)

### 自省

lambda表达式的结果是创建一个匿名函数，可以使用自省的方法来查看对象。

In [55]:
f = lambda x: x if x > 0 else abs(x) 

In [56]:
print(type(f))
print(f)

<class 'function'>
<function <lambda> at 0x7f46c37d2c80>


匿名函数也是函数，调用匿名函数会计算表达式并返回其结果。

In [57]:
print(f(3.1314), f(-3.1314))

3.1314 3.1314


## 函数定义常见问题

### 关键字参数的默认值

关键字参数的默认值如果使用可变对象，可能会有一些意想不到的问题。