# 函数进阶

## 函数是基本类型

在 `Python` 中，函数是一种基本类型的对象，这意味着

- 可以将函数作为参数传给另一个函数
- 将函数作为字典的值储存
- 将函数作为另一个函数的返回值

In [1]:
def square(x):
    """Square of x."""
    return x*x

def cube(x):
    """Cube of x."""
    return x*x*x

作为字典的值：

In [5]:
funcs = {
    'square': square,
    'cube': cube,}

x = 2
print(square(x))
print(cube(x))

for func in sorted(funcs):
    print(func, funcs[func](x))

4
8
cube 8
square 4


## 函数参数

### 引用传递

`Python` 中的函数传递方式是 `call by reference` 即引用传递，例如，对于这样的用法：

    x = [10, 11, 12]
    f(x)

传递给函数 `f` 的是一个指向 `x` 所包含内容的引用，如果我们修改了这个引用所指向内容的值（例如 `x[0]=999`），那么外面的 `x` 的值也会被改变。不过如果我们在函数中赋给 `x` 一个新的值（例如另一个列表），那么在函数外面的 `x` 的值不会改变：

In [6]:
def mod_f(x):
    x[0] = 999
    return x

x = [1, 2, 3]

print(x)
print(mod_f(x))
print(x)

[1, 2, 3]
[999, 2, 3]
[999, 2, 3]


In [7]:
def no_mod_f(x):
    x = [4, 5, 6]
    return x

x = [1,2,3]

print(x)
print(no_mod_f(x))
print(x)

[1, 2, 3]
[4, 5, 6]
[1, 2, 3]


上面两种不同的原因在【python基本编程】章节有具体介绍。

### 默认参数是可变的！

函数可以传递默认参数，默认参数的绑定发生在函数定义的时候，以后每次调用默认参数时都会使用同一个引用。

这样的机制会导致这种情况的发生：

In [10]:
def f(x = []):
    x.append(1)
    return x

理论上说，我们希望调用 `f()` 时返回的是 `[1]`， 但事实上：

In [11]:
print(f())
print(f())
print(f())
print(f(x = [9,9,9]))
print(f())
print(f())

[1]
[1, 1]
[1, 1, 1]
[9, 9, 9, 1]
[1, 1, 1, 1]
[1, 1, 1, 1, 1]


而我们希望看到的应该是这样：

In [12]:
def f(x = None):
    if x is None:
        x = []
    x.append(1)
    return x

print(f())
print(f())
print(f())
print(f(x = [9,9,9]))
print(f())
print(f())

[1]
[1]
[1]
[9, 9, 9, 1]
[1]
[1]


## 高阶函数

以函数作为参数，或者返回一个函数的函数是高阶函数，常用的例子有 `map` 和 `filter` 函数：

`map(f, sq)` 函数将 `f` 作用到 `sq` 的每个元素上去，并返回结果组成的列表，相当于：
```python
[f(s) for s in sq]
```

注：python3中返回的不是列表，是一个迭代器，所以需要在外面加一层`list()`才会得到列表。

In [17]:
list(map(square, range(5)))

[0, 1, 4, 9, 16]

`filter(f, sq)` 函数的作用相当于，对于 `sq` 的每个元素 `s`，返回所有 `f(s)` 为 `True` 的 `s` 组成的列表，相当于：
```python
[s for s in sq if f(s)]
```

In [19]:
def is_even(x):
    return x % 2 == 0

list(filter(is_even, range(5)))

[0, 2, 4]

一起使用：

In [21]:
list(map(square, filter(is_even, range(5))))

[0, 4, 16]

`reduce(f, sq)` 函数接受一个二元操作函数 `f(x,y)`，并对于序列 `sq` 每次合并两个元素：

In [23]:
from functools import reduce
def my_add(x, y):
    return x + y

reduce(my_add, [1,2,3,4,5])

15

传入加法函数，相当于对序列求和。

返回一个函数：

In [24]:
def make_logger(target):
    def logger(data):
        with open(target, 'a') as f:
            f.write(data + '\n')
    return logger

foo_logger = make_logger('foo.txt')
foo_logger('Hello')
foo_logger('World')

In [30]:
import os
os.remove('foo.txt')

## 匿名函数

在使用 `map`， `filter`，`reduce` 等函数的时候，为了方便，对一些简单的函数，我们通常使用匿名函数的方式进行处理，其基本形式是：

    lambda <variables>: <expression>

例如，我们可以将这个：

In [32]:
print(list(map(square, range(5))))

[0, 1, 4, 9, 16]


用匿名函数替换为：

In [33]:
print(list(map(lambda x: x * x, range(5))))

[0, 1, 4, 9, 16]


匿名函数虽然写起来比较方便（省去了定义函数的烦恼），但是有时候会比较难于阅读：

In [34]:
s1 = reduce(lambda x, y: x+y, map(lambda x: x**2, range(1,10)))
print(s1)

285


当然，更简单地，我们可以写成这样：

In [35]:
s2 = sum(x**2 for x in range(1, 10))
print(s2)

285


# 作用域

在函数中，`Python` 从命名空间中寻找变量的顺序如下：

- `local function scope`：局部
- `enclosing scope`：嵌套
- `global scope`：全局
- `builtin scope`：内建

例子：

## local 作用域

In [1]:
def foo(a,b):
    c = 1
    d = a + b + c

这里所有的变量都在 `local` 作用域。

## global 作用域与关键词

In [2]:
c = 1
def foo(a,b):
    d = a + b + c

这里的 `c` 就在 `global` 作用域。

使用 `global` 关键词可以在 `local` 作用域中修改 `global` 作用域的值。

In [4]:
x = 15

def print_newx():
    global x
    x = 18

print(x)
print_newx()
print(x)

15
18


其作用是将 `x` 指向 `global` 中的 `x`。

如果不加关键词，那么 `local` 作用域的 `x` 不会影响 `global` 作用域中的值：

In [5]:
x = 15

def print_newx():
    x = 18
    
print_newx()

print(x)

15


## built-in 作用域

In [7]:
def list_length(a):
    return len(a)

a = [1,2,3]
print( list_length(a))

3


这里函数 `len` 就是在 `built-in` 作用域中：

In [10]:
import builtins
builtins.len

<function len>

## 词法作用域

对于嵌套函数：

In [12]:
def outer():
    a = 1
    def inner():
        print ("a =", a)
    inner()
    
outer()

a = 1


如果里面的函数没有找到变量，那么会向外一层寻找变量，如果再找不到，则到 `global` 作用域。

返回的是函数时的情况：

In [13]:
def outer():
    a = 1
    def inner():
        return a
    return inner
    
func = outer()

print ('a (1):', func())

a (1): 1


func() 函数中调用的 `a` 要从它定义的地方开始寻找，而不是在 `func` 所在的作用域寻找。

# 递归

递归是指函数在执行的过程中调用了本身，一般用于分治法，不过在 `Python` 中这样的用法十分地小，所以一般不怎么使用：

Fibocacci 数列：

In [39]:
def fib1(n):
    """Fib with recursion."""

    # base case
    if n==0 or n==1:
        return 1
    # recurssive caae
    else:
        return fib1(n-1) + fib1(n-2)

print([fib1(i) for i in range(10)])

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]


一个更高效的非递归版本：

In [40]:
def fib2(n):
    """Fib without recursion."""
    a, b = 0, 1
    for i in range(1, n+1):
        a, b = b, a+b
    return b

print([fib2(i) for i in range(10)])

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]


速度比较：

In [41]:
%timeit fib1(20)
%timeit fib2(20)

4.42 ms ± 132 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
1.76 µs ± 75.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


对于第一个递归函数来说，调用 `fib(n+2)` 的时候计算 `fib(n+1), fib(n)`，调用 `fib(n+1)` 的时候也计算了一次 `fib(n)`，这样造成了重复计算。

使用缓存机制的递归版本，这里利用了默认参数可变的性质，构造了一个缓存：

In [42]:
def fib3(n, cache={0: 1, 1: 1}):
    """Fib with recursion and caching."""

    try:
        return cache[n]
    except KeyError:
        cache[n] = fib3(n-1) + fib3(n-2)
        return cache[n]

print ([fib3(i) for i in range(10)])

%timeit fib1(20)
%timeit fib2(20)
%timeit fib3(20)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
4.38 ms ± 69.5 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
1.74 µs ± 58.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
170 ns ± 6.95 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


# 迭代器

## 简介

迭代器对象可以在 `for` 循环中使用：

In [43]:
x = [2, 4, 6]

for n in x:
    print(n)

2
4
6


其好处是不需要对下标进行迭代，但是有些情况下，我们既希望获得下标，也希望获得对应的值，那么可以将迭代器传给 `enumerate` 函数，这样每次迭代都会返回一组 `(index, value)` 组成的元组：

In [44]:
x = [2, 4, 6]

for i, n in enumerate(x):
    print ('pos', i, 'is', n)

pos 0 is 2
pos 1 is 4
pos 2 is 6


迭代器对象必须实现 `__iter__` 方法：

In [45]:
x = [2, 4, 6]
i = x.__iter__()
print (i)

<list_iterator object at 0x000000000DCDCA20>


`__iter__()` 返回的对象支持 `next` 方法(`Python2`)，`__next__()`方法(`Python3`)。返回迭代器中的下一个元素：

In [50]:
print(i.__next__())

2


当下一个元素不存在时，会 `raise` 一个 `StopIteration` 错误：

In [51]:
print(i.__next__())
print(i.__next__())
print(i.__next__())

4
6


StopIteration: 

In [53]:
# 很多标准库函数返回的是迭代器：
r = reversed(x)
print (r)
#调用它的 next() 方法：
print(r.__next__())

<list_reverseiterator object at 0x0000000006A9EEB8>
6


字典对象的 `items` 方法返回的都是迭代器：
https://stackoverflow.com/questions/13998492/when-should-iteritems-be-used-instead-of-items

In [63]:
x = {'a':1, 'b':2, 'c':3}
i = x.items()
print (i)

dict_items([('a', 1), ('b', 2), ('c', 3)])


迭代器的 `__iter__` 方法返回它本身：

In [69]:
print(i.__iter__())

<dict_keyiterator object at 0x00000000069B2598>


## 自定义迭代器

自定义一个 list 的取反迭代器：

In [72]:
class ReverseListIterator(object):
    
    def __init__(self, list):
        self.list = list
        self.index = len(list)
        
    def __iter__(self):
        return self
    
    def next(self):
        self.index -= 1
        if self.index >= 0:
            return self.list[self.index]
        else:
            raise StopIteration

In [80]:
x = [1,2,3]
y = ReverseListIterator(x)
y.next()

3

这里我们实现 [Collatz 猜想](http://baike.baidu.com/view/736196.htm)：

- 奇数 n：返回 3n + 1
- 偶数 n：返回 n / 2

直到 n 为 1 为止：

In [81]:
class Collatz(object):
    
    def __init__(self, start):
        self.value = start
        
    def __iter__(self):
        return self
    
    def next(self):
        if self.value == 1:
            raise StopIteration
        elif self.value % 2 == 0:
            self.value = self.value / 2
        else:
            self.value = 3 * self.value + 1
        return self.value

In [89]:
for i in range(7,1,-1):
    print(Collatz(i).next())

22
3.0
16
2.0
10
1.0


还没完全弄明白，之后填坑

# with 语句和上下文管理器

```python
# create/aquire some resource
...
try:
    # do something with the resource
    ...
finally:
    # destroy/release the resource
    ...
```

处理文件，线程，数据库，网络编程等等资源的时候，我们经常需要使用上面这样的代码形式，以确保资源的正常使用和释放。

好在`Python` 提供了 `with` 语句帮我们自动进行这样的处理，例如之前在打开文件时我们使用： 

In [1]:
with open('my_file', 'w') as fp:
    # do stuff with fp
    data = fp.write("Hello world")

这等效于下面的代码，但是要更简便：

In [2]:
fp = open('my_file', 'w')
try:
    # do stuff with f
    data = fp.write("Hello world")
finally:
    fp.close()

## 上下文管理器

其基本用法如下：
```
with <expression>:
    <block>
```

`<expression>` 执行的结果应当返回一个实现了上下文管理器的对象，即实现这样两个方法，`__enter__` 和 `__exit__`：

In [3]:
print (fp.__enter__)
print (fp.__exit__)

<built-in method __enter__ of _io.TextIOWrapper object at 0x000000000567B558>
<built-in method __exit__ of _io.TextIOWrapper object at 0x000000000567B558>


`__enter__` 方法在 `<block>` 执行前执行，而 `__exit__` 在 `<block>` 执行结束后执行：

比如可以这样定义一个简单的上下文管理器：

In [4]:
class ContextManager(object):
    
    def __enter__(self):
        print ("Entering")
    
    def __exit__(self, exc_type, exc_value, traceback):
        print ("Exiting")

使用 `with` 语句执行：

In [5]:
with ContextManager():
    print ("  Inside the with statement")

Entering
  Inside the with statement
Exiting


即使 `<block>` 中执行的内容出错，`__exit__` 也会被执行：

In [6]:
with ContextManager():
    print (1/0)

Entering
Exiting


ZeroDivisionError: division by zero

## `__`enter`__` 的返回值

如果在 `__enter__` 方法下添加了返回值，那么我们可以使用 `as` 把这个返回值传给某个参数：

In [7]:
class ContextManager(object):
    
    def __enter__(self):
        print ("Entering")
        return "my value"
    
    def __exit__(self, exc_type, exc_value, traceback):
        print ("Exiting")

将 `__enter__` 返回的值传给 `value` 变量：

In [8]:
with ContextManager() as value:
    print (value)

Entering
my value
Exiting


一个通常的做法是将 `__enter__` 的返回值设为这个上下文管理器对象本身，文件对象就是这样做的：

In [9]:
fp = open('my_file', 'r')
print (fp.__enter__())
fp.close()

<_io.TextIOWrapper name='my_file' mode='r' encoding='cp936'>


In [10]:
import os
os.remove('my_file')

实现方法非常简单：

In [12]:
class ContextManager(object):
    
    def __enter__(self):
        print ("Entering")
        return self
    
    def __exit__(self, exc_type, exc_value, traceback):
        print ("Exiting")

In [13]:
with ContextManager() as value:
    print (value)

Entering
<__main__.ContextManager object at 0x00000000056D7F98>
Exiting


## 错误处理

上下文管理器对象将错误处理交给 `__exit__` 进行，可以将错误类型，错误值和 `traceback` 等内容作为参数传递给 `__exit__` 函数：

In [14]:
class ContextManager(object):
    
    def __enter__(self):
        print ("Entering")
    
    def __exit__(self, exc_type, exc_value, traceback):
        print ("Exiting")
        if exc_type is not None:
            print ("  Exception:", exc_value)

如果没有错误，这些值都将是 `None`, 当有错误发生的时候：

In [15]:
with ContextManager():
    print( 1/0)

Entering
Exiting
  Exception: division by zero


ZeroDivisionError: division by zero

在这个例子中，我们只是简单的显示了错误的值，并没有对错误进行处理，所以错误被向上抛出了，如果不想让错误抛出，只需要将 `__exit__` 的返回值设为 `True`： 

In [16]:
class ContextManager(object):
    
    def __enter__(self):
        print ("Entering")
    
    def __exit__(self, exc_type, exc_value, traceback):
        print ("Exiting")
        if exc_type is not None:
            print ("  Exception:", exc_value)
            return True

In [17]:
with ContextManager():
    print( 1/0)

Entering
Exiting
  Exception: division by zero


在这种情况下，错误就不会被向上抛出。

# 修饰符及其使用

## 函数是一种对象

在 `Python` 中，函数是也是一种对象。

In [29]:
def foo(x):
    return x+1
    
print(type(foo))

<class 'function'>


In [30]:
# 查看函数拥有的方法：
dir(foo)

['__annotations__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

在这些方法中，`__call__` 是最重要的一种方法： 

In [31]:
foo.__call__(42)

43

相当于

In [32]:
foo(42)

43

因为函数是对象，所以函数可以作为参数传入另一个函数：

In [33]:
def  bar(f,x):
    x += 1
    return f(x)

In [34]:
bar(foo,1)

3

## 修饰符

修饰符是这样的一种函数，它接受一个函数作为输入，通常输出也是一个函数：

In [35]:
def dec(f):
    print ('I am decorating function', id(f))
    return f

将 `len` 函数作为参数传入这个修饰符函数：

In [36]:
declen = dec(foo)

I am decorating function 99603728


使用这个新生成的函数：

In [37]:
declen(10)

11

上面的例子中，我们仅仅返回了**函数的本身**，也可以利用这个函数**生成一个新的函数**，看一个新的例子：

In [14]:
def loud(f):
    def new_f(*arg1,**kw):
        print('calling with',arg1,kw)
        s = f(*arg1,**kw)
        print('return value is',s)
    return new_f

In [38]:
l = loud(foo)

In [41]:
l(12)

calling with (12,) {}
return value is 13


## 用 @ 来使用修饰符

```python
@dec
def foo(x):
    return x+1
```
`@`的含义是将`dec(foo)`这个复合函数简记为`foo`，但该函数的实际对应已经是`dec(f)`这个函数`return`的结果。

In [73]:
def foo(x):
    return x+1
    
def dec(f):
    print ('I am decorating function', id(f))
    def new_f1(x):
        print('it is a test')
        return f(x)
    return new_f1
    
foo = dec(foo)

I am decorating function 101874408


In [74]:
foo(4)

it is a test


5

可以修改为

In [75]:
@dec
def foo(x):
    return x+1

I am decorating function 99093224


In [76]:
foo(4)

it is a test


5

In [77]:
foo.__name__

'new_f1'

解释：

```python
@dec
def foo(x):
    return x+1
```

执行的过程等价于：

`dec(foo) = new_f1`

顺带打印出来了` print ('I am decorating function', id(f))`。

使用装饰器 `@dec`的意思是简记`foo=dec(foo)`

所以执行完上面的代码后，`foo`实际对应的函数为 `new_f1`，通过`foo.__name__`为`new_f1`也能看出来。

## 例子

定义两个修饰器函数，一个将原来的函数值加一，另一个乘二：

In [82]:
def plus_one(f):
    def f1(x):
        return f(x) + 1
    return f1

def times_two(f):
    def f2(x):
        return f(x) * 2
    return f2

In [83]:
@plus_one
@times_two
def goo(x):
    return int(x)

In [84]:
goo('2')

5

记$f_1 = f+ 1;f_2=f*2$，以上执行过程对应的数学表达为：

$$plus\_one(time\_two(goo)) \\
= plus\_one(f_2) \\
= f_1(f_2) \\
= f_1(f*2) \\
= f*2+1$$

本质上是一个复合函数。

## 修饰器工厂

我们可以定义返回修饰器的函数，作用在于产生一个可以接受参数的修饰器，例如我们想将 `loud` 输出的内容写入一个文件去，可以这样做：

In [85]:
def super_loud(filename):
    fp = open(filename, 'w')
    def loud(f):
        def new_func(*args, **kw):
            fp.write('calling with' + str(args) + str(kw))
            # 确保内容被写入
            fp.flush()
            fp.close()
            rtn = f(*args, **kw)
            return rtn
        return new_func
    return loud

可以这样使用这个修饰器工厂：

In [87]:
@super_loud('test.txt')
def foo(x):
    return x+10

调用 `foo` 就会在文件中写入内容：

In [88]:
foo(14)

24

查看文件内容：

In [89]:
with open('test.txt') as fp:
    print (fp.read())

calling with(14,){}


In [91]:
import os
os.remove('test.txt')

## @classmethod 修饰符

在 `Python` 标准库中，有很多自带的修饰符，例如 `classmethod` 将一个对象方法转换了类方法： 

In [105]:
class Foo(object):
    @classmethod
    def bar(ss,x,y):
        print( 'the input is {} and {}'.format(x,y))
        
    def __init__(self):
        pass

类方法可以通过 `类名.方法` 来调用：

In [106]:
Foo.bar(12,13)

the input is 12 and 13


将函数方法中的`ss`代替为`self`

## Numpy 的 @vectorize 修饰符

`numpy` 的 `vectorize` 函数将一个函数转换为 `ufunc`，事实上它也是一个修饰符。

ufunc函数: ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。NumPy内置的许多ufunc函数都是在C语言级别实现的，因此它们的计算速度非常快。

In [107]:
from numpy import vectorize, arange

@vectorize
def f(x):
    if x <= 0:
        return x
    else:
        return 0

f(arange(-10.0,10.0))

array([-10.,  -9.,  -8.,  -7.,  -6.,  -5.,  -4.,  -3.,  -2.,  -1.,   0.,
         0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.])

等价于

In [112]:
def f(x):
    if x <= 0:
        return x
    else:
        return 0
v1 = vectorize(f)

In [113]:
v1(arange(-10,10))

array([-10,  -9,  -8,  -7,  -6,  -5,  -4,  -3,  -2,  -1,   0,   0,   0,
         0,   0,   0,   0,   0,   0,   0])

## 注册一个函数

来看这样的一个例子，定义一个类：

In [125]:
class Registry(object):
    def __init__(self):
        self._data = {}
    def register(self, f, name=None):
        if name == None:
            name = f.__name__
        self._data[name] = f

`register` 方法接受一个函数，将这个函数名作为属性注册到对象中。

产生该类的一个对象：

In [121]:
registry = Registry()

使用该对象的 `register` 方法作为修饰符：

In [122]:
@registry.register
def greeting():
    print ("hello world")

这样这个函数就被注册到 `registry` 这个对象中去了：

In [123]:
registry._data

{'greeting': <function __main__.greeting>}

## 其他

* `@wraps`:在自定义修饰符方法的时候,为了避免出现不必要的麻烦，尽量使用 `wraps` 来修饰修饰符;

* `Class 修饰符`: 与函数修饰符类似，类修饰符是这样一类函数，接受一个类作为参数，通常返回一个新的类。

In [126]:
def logging_call(f):
    def wrapper(*a, **kw):
        print ('calling {}'.format(f.__name__))
        return f(*a, **kw)
    return wrapper

@logging_call
def square(x):
    '''
    square function.
    '''
    return x ** 2

print (square.__doc__, square.__name__)

None wrapper


我们使用修饰符之后，`square` 的 `metadata` 完全丢失了，返回的函数名与函数的 `docstring` 都不对。

一个解决的方法是从 `functools` 模块导入 `wraps` 修饰符来修饰我们的修饰符：

In [127]:
import functools

def logging_call(f):
    @functools.wraps(f)
    def wrapper(*a, **kw):
        print ('calling {}'.format(f.__name__))
        return f(*a, **kw)
    return wrapper

@logging_call
def square(x):
    '''
    square function.
    '''
    return x ** 2

print (square.__doc__, square.__name__)


    square function.
     square
