### <center>2018 Winter CS101.04</center>

# <center>递归</center>

##### <center>by tanzhuxiaqiu@huawei.com</center>

## 今日议程

1. 实例演示
2. 分析递归算法
3. 递归的缺点
4. 递归的类型

## 实例演示

### 阶乘函数

- n的阶乘可以代表n个元素全排列的个数

\begin{equation}
{n!} =
  \begin{cases}
    1       & \quad n=0\\
    n\times(n-1)\times(n-2)...3\times2\times1  & \quad n\geq1
  \end{cases}
\end{equation}

In [1]:
def factorial(n):
    if n == 0:
        return 1
    return n * factorial(n-1)

$$ 5! = 5\times4\times3\times2\times1 = 120 $$

In [2]:
factorial(5)

120

In [3]:
from IPython.display import Image
from IPython.core.display import HTML 
Image(url= 'http://faculty.cs.niu.edu/~freedman/241/241notes/recur.gif')

> Python中，每当函数被调用时，会创建一个活动记录表(Activition Record)的结构来存储信息，每条记录包含了函数调用时的参数，局部变量和函数体中当前执行的信息；  
> 如果函数在执行过程中出现嵌套调用，那调用前的状态会被挂起，执行的代码位置被储存到活动记录中，当被调用函数返回时会在记录的位置继续执行。

### 二分查找

1. 在n个元素的有序序列data中搜索目标值**target**
2. 定义初始位置**low=0**和**high=n-1**，令**mid=(low+high)//2**
3. 考虑三种情况：
    - 如果目标值**target**等于**data[mid]**的数值，则查找成功并返回；
    - 如果目标值**target**小于**data[mid]**的数值，则继续在data的前半部分，即**data[low:mid-1]**处继续搜索；
    - 如果目标值**target**大于**data[mid]**的数值，则继续在data的后半部分，即**data[mid+1:high]**处继续搜索；
4. 持续搜索，直到**low>high**时，说明整个范围内找不到目标值target，终止搜索。

![](./img/4-1.png)

In [5]:
def binary_search(data, target, low, high):
    if low > high:
        return False
    else:
        mid = (low + high) // 2
        if target == data[mid]:
            return True
        elif target < data[mid]:
            return binary_search(data, target, low, mid-1)
        else:
            return binary_search(data, target, mid+1, high)

In [6]:
d = [2, 5, 8, 12, 16, 23, 38, 56, 72, 91]
binary_search(d, 23, 0, len(d)-1)

True

## 分析递归算法

#### 阶乘
* O(n)

#### 二分查找
* O(log n)

## 递归的缺点

#### 低效

- 例如求fibonacci数

In [25]:
def fib(n):
    if n <= 1:
        return n
    return fib(n-1) + fib(n-2)
    
fib(6)

8

![](./img/4-2.svg)

In [26]:
cache = {}    
def fib(n):
    if n not in cache.keys():
        cache[n] = _fib(n)
    return cache[n]

def _fib(n):
    if n < 2:
        return n
    else:
        return fib(n-1) + fib(n-2)

fib(8)

21

#### 栈溢出

- 无限递归

In [31]:
def infi(n):
    return infi(n)
infi(1)

RecursionError: maximum recursion depth exceeded

In [30]:
import sys
sys.getrecursionlimit()

3000

In [32]:
sys.setrecursionlimit(10000)

## 递归的类型

- 线性递归(Linear Recursion)
- 二路递归(Binary Recursion)
- 多重递归(Multiple Recursion)

### 线性递归

递归函数主体每次至多执行一个新的递归调用

In [34]:
def reverse(S, start, stop):
    """Reverse elements in implicit slice S[start:stop]
    """
    if start < stop - 1:
        S[start], S[stop-1] = S[stop-1], S[start]
        reverse(S, start+1, stop-1)

In [35]:
data = [4, 3, 5, 2, 8, 9, 5]
reverse(data, 0, len(data))
data

[5, 9, 8, 2, 5, 3, 4]

### 二路递归

递归函数每次会执行两个递归调用

In [53]:
def binary_sum(S, start, stop):
    """Return the sum of the numbers in implicit silce S[start:stop]
    """
    if start >= stop:
        return 0
    elif start == stop-1:
        return S[start]
    else:
        mid = (start + stop) // 2
        return binary_sum(S, start, mid) + binary_sum(S, mid, stop)

In [55]:
print(binary_sum([1, 2, 3, 4, 5], 0, 5))

15


![](./img/4-3.svg)

### 多重递归

递归函数可能会执行多余两次的递归

- 递归地统计磁盘空间使用情况（课后作业02）



# Any Questions?

## 课后作业 Assignment-02

1) 用递归的方式实现一个函数 **digit_sum(n)** ，可以求出输入的整数n的每位数字之和，比如n=1234，digit_sum(1234)=1+2+3+4=10。


2)现代操作系统的磁盘目录结构可以表示成类似下图的树形结构：

![](./img/4-4.svg)

根据以下提出的伪代码，用Python实现一个递归函数DiskUsage(path)，实现统计path目录和其所有子目录占用磁盘空间大小的功能。

```Python
Algorithm DiskUsage(path):
    Input: A string designating a path to a file-system entry
    Output: The cumulative disk space used by that entry and any nested entries
    total = size(path)
    if path is a directory then
        for each child entry in path do
            total = total + DiskUsage(child)
    return total
```

Tips：实现过程中可能需要用到Python标注库os下的几个函数

- os.path.getsize(path)
- os.path.isdir(path)
- os.path.listdir(path)
- os.path.join(path, filename)

具体的使用方法可以自行查阅[Python文档](https://docs.python.org/3/library/os.path.html#module-os.path)。