# Lesson8 递归函数与常用Python高级特性上

## 课程内容
同学，你好！欢迎来到第八课。

在上一次课中，我们学习了函数的相关知识，包括

- 函数的调用
- 自定义函数
- 函数的参数
- 匿名函数
- 变量作用域

今天这节课，我们将来学习函数的一种高级应用——递归函数和一些常用的Python高级功能相关内容， 包括：

- 递归函数
- 生成式
- 迭代器
- 生成器

## 递归

在数学和计算机科学中，`递归(Recursion)`一种迭代解决问题的方法。其特点是将复杂的问题分解为多次结构相同的问题进行解决。

在Python中，`递归(Recursion)函数`是指在函数的定义中使用函数自身的方法。相比循环迭代，递归函数具有定义清晰，实现简单的优势。

但是由于递归是一个相对抽象的概念，它的实现并不是一个直观的过程。因此递归对于开发初学者们来说是一个相对复杂的知识点。为了使你对递归函数有一个清晰的认识，我们以经典的“阶乘”问题为案例来演示使用递归函数解决问题。

> 课堂案例：阶乘  
> 求输入整数的阶乘。计算某个数的阶乘指的是用这个数依次去乘包括 1 在内的所有比它小的数，这次计算最终的积即为阶乘的结果。在阶乘中，输入数字必须是一个正整数。

In [1]:
# 使用for循环实现阶乘
def for_factorial(number):
    # 过滤不符合条件的情况
    if not (isinstance(number, int) and number > 0):
        return
    # 循环计算
    result = 1
    for n in range(number, 0, -1):
        result *= n
    return result

if __name__ == "__main__":
    print for_factorial(5)

120


设计递归的思路的突破口在于找到迭代问题的结构相同性，并将其抽象为一个函数，并以此函数本身作为进入迭代下一层的入口。

在阶乘问题中，我们可以发现每一次迭代，当前数字都要和一个比它自己更小的一个数字的阶乘结果相乘。因此进入迭代下一层的入口则可以写为以下形式：

In [10]:
# 使用递归实现阶乘的尝试
def recursive_factorial(number):
    # Fixme: 这个函数是错误的，因为它缺少停止计算的条件
    
    # 如果将阶乘看成一个不断重复的计算，那么任何一个number的阶乘结果都应当是其本身与number-1的阶乘相乘的结果
    return number * recursive_factorial(number - 1)
    
if __name__ == "__main__":
    # 过滤不符合条件的情况
    input_number = 6
    if isinstance(input_number, int) and input_number > 0:
        print recursive_factorial(input_number)

> 为了保证可以在有限计算次数内完成运算得到结果，递归函数必须具备以下两个基本要素:   
> - **边界条件**：确定递归到何时终止，也称为递归出口。   
> - **递归模式**：大问题是如何分解为小问题的，也称为递归体。 

In [7]:
# 使用递归实现阶乘的尝试
def recursive_factorial(number):
    # 当number等于1时，停止递归
    if number == 1:
        return number
    # 如果将阶乘看成一个不断重复的计算，那么任何一个number的阶乘结果都应当是其本身与number-1的阶乘相乘的结果
    return number * recursive_factorial(number - 1)
    
if __name__ == "__main__":
    input_number = 6
    if isinstance(input_number, int) and input_number > 0:
        print recursive_factorial(input_number)

720


实现一个递归函数，需要遵循以下几个步骤：

1. 初始化算法。递归程序通常需要一个开始时使用的种子值（seed value）。要完成此任务，可以向函数传递参数，或者提供一个入口函数， 这个函数是非递归的，但可以为递归计算设置种子值。
2. 检查要处理的当前值是否已经与基线条件相匹配。如果匹配，则进行处理并返回值。
3. 使用更小的或更简单的子问题（或多个子问题）来重新定义答案。
4. 对子问题运行算法。
5. 将结果合并入答案的表达式。
6. 返回结果。

> 课堂案例： 有限位数的裴波那契数列  
裴波那契数列又称黄金分割数列，其数学表达式表示为:  
    $ F[n]=F[n-1]+F[n-2](n>=3,F[1]=1,F[2]=1) $


In [9]:
def recursion_fibonacci(n):
    if n in (1, 2):
        return 1
    else:
        return recursion_fibonacci(n - 1) + recursion_fibonacci(n - 2)

if __name__ == "__main__":
    print recursion_fibonacci(6)

8


> 课堂案例：文件夹遍历

In [8]:
import os


def walk_folders(folder_path):
    sub_file_list = []
    # 遍历文件夹下所有子文件
    for sub_file_name in os.listdir(folder_path):
        # 获取路径
        sub_path = os.path.join(folder_path, sub_file_name)
        if os.path.isfile(sub_path):
            # 如果子文件是文件类型的，添加到子文件列表
            sub_file = {"type": "file", "name": sub_file_name}
            sub_file_list.append(sub_file)
        else:
            # 如果子文件是文件夹类型的，递归求取子文件列表，添加到子文件列表
            sub_folder = {"type": "folder", "name": sub_file_name, "sub_files": walk_folders(sub_path)}
            sub_file_list.append(sub_folder)
    return sub_file_list


if __name__ == "__main__":
    from pprint import pprint
    pprint(walk_folders("/home/nbuser/library"))

[{'name': 'Lesson5 \xe4\xbd\xbf\xe7\x94\xa8Python\xe6\x93\x8d\xe4\xbd\x9c\xe6\x96\x87\xe4\xbb\xb6.ipynb',
  'type': 'file'},
 {'name': 'Lesson9 \xe5\xb8\xb8\xe7\x94\xa8Python\xe9\xab\x98\xe7\xba\xa7\xe7\x89\xb9\xe6\x80\xa7\xe4\xb8\x8b.ipynb',
  'type': 'file'},
 {'name': 'README.md', 'type': 'file'},
 {'name': '.library.json', 'type': 'file'},
 {'name': 'Lesson3 Python\xe5\xbc\x80\xe5\x8f\x91\xe5\x88\x9d\xe4\xbd\x93\xe9\xaa\x8c.ipynb',
  'type': 'file'},
 {'name': 'Lesson10 \xe6\xa8\xa1\xe5\x9d\x97\xe4\xb8\x8e\xe5\x8c\x85.ipynb',
  'type': 'file'},
 {'name': 'Lesson6 \xe5\xb8\xb8\xe7\x94\xa8\xe6\x95\xb0\xe6\x8d\xae\xe7\xbb\x93\xe6\x9e\x84.ipynb',
  'type': 'file'},
 {'name': '.gitignore', 'type': 'file'},
 {'name': '.ipynb_checkpoints',
  'sub_files': [{'name': 'Lesson7 \xe5\x88\x9d\xe8\xaf\x86\xe5\x87\xbd\xe6\x95\xb0-checkpoint.ipynb',
                 'type': 'file'},
                {'name': 'Lesson6 \xe5\xb8\xb8\xe7\x94\xa8\xe6\x95\xb0\xe6\x8d\xae\xe7\xbb\x93\xe6\x9e\x84-checkpoint

> 课外作业：根据输入级数画分形三角的乌龟 

## 生成式

在开发工作中，我们经常会遇到需要按一定规则生成列表或者字典的需求。为了解决这些问题，Python内置了简单却强大的生成式功能。你可以在一行代码内遍历、过滤各种可迭代的数据机构体，并按照自己的需要生成新的数据结构体。

生成式也叫解析式或者推导式，是一种以循环迭代和条件判断来控制元素内容的一种用于产生数据结构的表达式。

### 列表生成式

列表生成式的一般语法为

```python
[item for item in a_iterable if a_condition]
```

生成1-10中每个数字的平方组成的列表：

In [13]:
[i ** 2 for i in range(1, 11)]

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

生成1-10中每个偶数的平方组成的列表：

In [14]:
[i ** 2 for i in range(1, 11) if i % 2 == 0]

[4, 16, 36, 64, 100]

列表生成式的每个元素可以为任意类型的对象。下例中，每个元素都是一个字典。

In [19]:
[{"value": i, "type": type(i)} for i in ["hello", 123, 3.14, range(10)]]

[{'type': str, 'value': 'hello'},
 {'type': int, 'value': 123},
 {'type': float, 'value': 3.14},
 {'type': list, 'value': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}]

### 嵌套的生成式

并列使用多个`for...in`循环语句，实现循环嵌套：

In [16]:
[i+j for i in "123" for j in "abc"]

['1a', '1b', '1c', '2a', '2b', '2c', '3a', '3b', '3c']

> 注意：因为循环嵌套逻辑较为复杂，建议不要使用超过两层的循环嵌套。

### 字典生成式

同列表生成式一样，字典也可以使用类似的生成式生成。

不同于列表生成式，字典生成式需要使用大括号包围，并且需要以配对的键值作为元素，键值之间以冒号隔开。字典生成式的语法规则为：

```python
{key: value for key in a_iterable if a_condition}
```

In [21]:
{i: type(i) for i in ["hello", 123, 3.14]}

{3.14: float, 123: int, 'hello': str}

> 注意：在构建字典时，unhashable的对象不可作为字典的key

In [23]:
{i: type(i) for i in ["hello", 123, 3.14, range(3)]}    # range(3)的值是一个列表，列表不能作为字典的key

TypeError: unhashable type: 'list'

### 集合生成式

同样的，集合也可以使用相似的生成式生成。

In [24]:
a_set = {i for i in range(10) if i % 2 == 0}
print a_set
print type(a_set)

set([0, 8, 2, 4, 6])
<type 'set'>


> 思考一下： 元组可以使用生成式生成吗？如果可以，如何生成？如果不可以，为什么？

## 迭代器

在Python中，可迭代的对象类型有很多。

In [42]:
for i in [1, 2, 3, 4]:
    print i

1
2
3
4


In [43]:
for c in "python":
    print c

p
y
t
h
o
n


In [44]:
for k in {"x": 1, "y": 2}:
    print k

y
x


In [45]:
for line in open("/home/nbuser/library/examples/test_file"):
    print line

first line

second line


Python中的列表、字符串、字典、元组、文件对象等等各种对象都可以和`for...in`循环配合使用，这些对象被统称为`可迭代对象(iterable object)`。

### 迭代器协议

Python内建的`iter`函数可以将一个可迭代的对象转化为一个迭代器对象。迭代器对象是一种具备了`next`方法可以自我迭代的对象，它符合了Python的迭代器协议。

> 迭代器协议指：对象需要提供next()方法，它要么返回迭代中的下一项，要么就引起一个StopIteration异常，以终止迭代。

In [46]:
x = iter([1, 2, 3])

In [51]:
print x, type(x)

<listiterator object at 0x7fcd6da6e410> <type 'listiterator'>


### next方法

每当我们调用迭代器的next方法时，该方法会将迭代器的下一个元素返回回来，直到最后一个。当元素已为迭代器的最后一位时，调用next将会触发`StopIteration`异常。

In [47]:
x.next()

1

In [48]:
x.next()

2

In [49]:
x.next()

3

In [50]:
x.next()

StopIteration: 

### xrange

在第4课中，我们介绍过一个自动生成数字列表的函数`range`。当使用range函数生成较大的数字列表时，我们同样会遇到内存消耗过大的问题。为了解决这个问题，Python提供了一个按相同规则构建数字生成器的函数`xrange`。

严格地说，xrange不是生成器，但它具备了和生成器类似的特性。

In [28]:
a_list = range(10)
print a_list
print type(a_list)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<type 'list'>


In [29]:
a_xrange = xrange(10)
print a_xrange
print type(a_xrange)

xrange(10)
<type 'xrange'>


迭代遍历上例中的`a_list`和`a_xrange`的运行效果是一样的

In [30]:
for i in a_list:
    print i

0
1
2
3
4
5
6
7
8
9


In [31]:
for i in a_xrange:
    print i

0
1
2
3
4
5
6
7
8
9


和列表一样，xrange对象也可以使用索引取值,并且同样具备求取长度等方法。

In [33]:
a_xrange[3]

3

In [35]:
len(a_xrange)

10

虽然xrange对象具备列表的各种性质，但不具备任何列表的方法。

In [36]:
dir(a_xrange)

['__class__',
 '__delattr__',
 '__doc__',
 '__format__',
 '__getattribute__',
 '__getitem__',
 '__hash__',
 '__init__',
 '__iter__',
 '__len__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

## 生成器

在上文案例中我们可以看到，借助列表生成式可以轻松地创建出一个列表。但是，受到内存限制，列表容量肯定是有限的。为了节约资源，或者创建出一个允许按需无限生成值的数据结构，Python提供了`生成器(Generator)`类型对象。

生成器是一类特殊的迭代器，它简化了迭代器的创建。同时实现了延迟操作的功能，也就是在需要的时候才产生结果，不是立即产生结果。

使用生成器对象，我们可以在代码运行的过程中不断根据需要推算出后续的元素。这样我们就不必创建完整的list，从而节省大量的空间。

> 注意：生成器是一种单迭代器对象，即生成器只能被遍历一次。

下面我们来介绍两种常用的自定义生成器的方法——`生成器表达式`和`生成器函数`。

### 生成器表达式

如列表生成式一样，Python提供了一种语法类似的生成器。

和列表表示不同，生成器表达式使用圆括号来包围自身。

In [25]:
my_generator = (i for i in range(10) if i % 2 == 1)
print my_generator, type(my_generator)

<generator object <genexpr> at 0x7fcd6d6b3e10> <type 'generator'>


In [26]:
my_generator.next()

1

In [27]:
my_generator.next()

3

### 生成器函数

生成器函数是一种可以返回一个生成器的函数，其特点是在函数体中存在`yield`语句。在生成器函数中，我们需要使用`yield`关键字来实现持续返回序列元素，而非return。

#### yield

在生成器函数中，每次执行到yield语句时，该函数都会生成一个新值，并暂停函数代码的运行。

In [52]:
def yrange(n):
    i = 0
    while i < n:
        yield i
        i += 1

In [53]:
y = yrange(10)

In [54]:
y.next()

0

In [55]:
y.next()

1

In [56]:
y.next()

2

当下一次调用next的时候，代码将会接着yield语句之后继续运行，并在再次遇到yield语句时生成新值。

In [57]:
def foo():
    print "begin"
    for i in range(3):
        print "before yield", i
        yield i
        print "after yield", i
    print "end"

In [58]:
f = foo()
f.next()

begin
before yield 0


0

In [59]:
f.next()

after yield 0
before yield 1


1

In [60]:
f.next()

after yield 1
before yield 2


2

> 在生成器函数中使用`return`关键字可用于结束生成器求值。因此在生成器函数中的`return`关键字后不能返回任何内容。

In [63]:
def generator_example():
    i = 0
    while True:
        if i % 2 == 1:
            yield i
        elif i > 5:
            return 
        i += 1

In [64]:
x = generator_example()

In [65]:
print x.next()

1


In [66]:
print x.next()

3


In [67]:
print x.next()

5


In [68]:
print x.next()

StopIteration: 

In [62]:
# 在生成器函数中使用return，并在return后返回内容将触发语法错误
def test_generator():
    i = 0
    while True:
        if i % 2 == 1:
            yield i
        elif i > 5:
            return 8    # return后填入内容
        i += 1

SyntaxError: 'return' with argument inside generator (<ipython-input-62-48e5bfeb1b20>, line 8)

> 课堂案例：无限位数的裴波拉契数列

### 本课结语

在本节课中，我们已经学习了以下几个内容：

- 递归函数
- 生成式
- 迭代器
- 生成器

如果你还没有熟练地掌握这些知识，我建议你通过以下几种方式提高自己：

- 反复地阅读这一节课的内容；
- 依据本课知识，举一反三地进行更多的练习；
- 到互联网上浏览和补充相关的知识，完善和巩固知识体系；
- 在我们的课堂群中和我们进行更多的交流。

如果你觉得本课内容对你有帮助，欢迎到我们的[课程](https://ke.qq.com/course/328764?tuin=2a5bd9a8)中进行评价，给予我们一个珍贵的好评。