# 🕮 6: 抽象

🖊本章将介绍如何将语句组合成函数，这让你能够告诉计算机如何完成任务，且只需说一次，无需反复向计算机。

本章内容如下：

+ 6.1 [懒惰是一种美德](#6.1-懒惰是一种美德)
+ 6.2 [抽象和结构](#6.2-抽象和结构)
+ 6.3 [自定义函数](#6.3-自定义函数)
+ 6.4 [参数魔法](#6.4-参数魔法)
+ 6.5 [作用域](#6.5-作用域)
+ 6.6 [递归](#6.6-递归)

### 6.1 懒惰是一种美德

（引入“抽象”的直观表述，略）

### 6.2 抽象和结构

+ 抽象是**程序能够被人理解的关键所在**

### 6.3 自定义函数

+ 函数执行特定的操作，并且在一般情况下会返回一个值
    + 调用一般形式： `<函数名>（<参数列表>）`
+ 一般而言，要判断某个对象是否可调用，可使用内置函数`callable`

In [4]:
import math
x = 1
y = math.sqrt
print(callable(x))
callable(y)

False


True

+ **函数定义**语句：`def`
    + 一般格式：`def <函数名>(<参数列表>):  <操作>  return <返回值>`

#### 6.3.1 给函数编写文档

+ 以`#`开头的**注释**
+ 添加**独立字符串**
    - 位置：
        + `def`语句的后面
        + 模块和类的开头（第7章，第10章）
    - 放在函数开头的字符串被称为**文档字符串(docstring)**，将作为函数的一部分存储起来
+ 内置函数`help`可用来获取有关函数的信息，其中包括函数的文档字符串（第10章有更多相关内容）

In [5]:
import math as m
print(m.sqrt.__doc__)# 使用__doc__属性来访问这个函数的文档字符串。__doc__是一种“魔法属性”，详细在第9章介绍

def square(num):
    'Calculates the square of the number x.'
    return num * num

print('square:', square.__doc__)

sqrt(x)

Return the square root of x.
square: Calculates the square of the number x.


In [6]:
import math as m
help(m.sqrt)

Help on built-in function sqrt in module math:

sqrt(...)
    sqrt(x)
    
    Return the square root of x.



#### 6.3.2 其实并不是函数的函数

+ 第一个“函数”指function，是数学意义上的函数，一定会有返回值；后一个“函数”是python意义上的“函数”
+ python意义上的函数意味着这个函数不一定要有**返回值**
+ **无返回值**的函数不包含`return`语句，或者包含`return`语句，但没有跟在后面的返回值

In [7]:
def test():
    print('This is printed')
    return
    print('This is not')

x = test()
print(x)

This is printed
None


**注意**：不要让这种默认行为带来麻烦。如果你在if之类的语句中返回值，务必确保其他分支也返回值，以免在调用者期望函数返回一个序列时（举个例子），不小心返回了None。

### 6.4 参数魔法

#### 6.4.1 值从哪里来

+ 编写函数的职责：确保它在提供的参数正确时完成任务，在参数不对时以**显而易见**的方式失败。（为此通常用断言或异常。异常将在第8章详细介绍）
    - 在`def`语句中，位于*函数名后面*的变量通常称为**形参**，而*调用函数时*提供的值称为**实参**（本书称为“值”）

#### 6.4.2 我能修改参数吗

+ 在函数内部给参数**赋值**对外部没有任何影响
+ 参数存储在**局部作用域**
+ *能否通过**赋值**操作对外部变量，是根据该类变量本身的赋值操作的情况而定的*
    + *对于不变量，如元组和字符串，它们在进行赋值操作时，本身就相当于指向一处新的内存空间*
    + *对于变量，如列表，它们在进行赋值操作时，类似于做指针的赋值操作，只是让一个新的指针指向了原地址空间*
+ 对于可变的数据结构参数，需在函数作用域内建立参数的**副本**来避免函数的操作影响外部变量

In [8]:
def del_list(ll):
    print(ll , "deleted")
    del ll
    
x = 'test string'
y = x

del_list(x)
print(x)
print(y)

del x
print(y)

test string deleted
test string
test string
test string


In [28]:
#####以下两段代码等价（不考虑作用域）#######
#代码段1#
def try_to_change(n):
    n = 'Mr. Gumby'

name = 'Mrs. Entity'
try_to_change(name)
print(name)

#代码段2#
name = 'Mrs. Entity'
n = name
n = 'Mr. Gumby'
print(name)

Mrs. Entity
Mrs. Entity


In [9]:
#####当参数是可变数据结构时#######

def change(n):
    n[0] = 'Mr. Gumby'

names = ['Mrs. Entity', 'Mrs. Thing']
change(names)
print(names)

def change_n(n):
    nn = n[:]
    nn[0] = 'Mr. Gumby'
    
names = ['Mrs. Entity', 'Mrs. Thing']
change_n(names)
print(names)
change(names[:])
print(names)

['Mr. Gumby', 'Mrs. Thing']
['Mrs. Entity', 'Mrs. Thing']
['Mrs. Entity', 'Mrs. Thing']


+ **模块化编程**
    - 对于可变的参数，充分利用函数对其进行修改，这时函数可以不返回
    - 对于不可变的参数，只能通过返回值的方法对外部参数进行改变

In [10]:
storage = {}
storage['first'] = {}
storage['middle'] = {}
storage['last'] = {}

me = 'Magnus Lie Hetland'
storage['first']['Magnus'] = [me]
storage['middle']['Lie'] = [me]
storage['last']['Hetland'] = [me]

#添加新成员的时候很繁琐

my_sister = 'Anne Lie Hetland'
storage['first'].setdefault('Anne', []).append(my_sister)
storage['middle'].setdefault('Lie', []).append(my_sister)
storage['last'].setdefault('Hetland', []).append(my_sister)

#使用函数使得代码变得清晰

def init(data):
    data['first'] = {}
    data['middle'] = {}
    data['last'] = {}
    
def lookup(data, lable, name):
    return data[lable].get(name)

def store(data, full_name):
    '''(1) 将参数data和full_name提供给这个函数。这些参数被设置为从外部获得的值。
(2) 通过拆分full_name创建一个名为names的列表。
(3) 如果names的长度为2（只有名字和姓），就将中间名设置为空字符串。
(4) 将'first'、'middle'和'last'存储在元组labels中（也可使用列表，这里使用元组只是为
了省略方括号）。
(5) 使用函数zip将标签和对应的名字合并，以便对每个标签-名字对执行如下操作：
 获取属于该标签和名字的列表；
 将full_name附加到该列表末尾或插入一个新列表。'''
    names = full_name.split()
    if len(names) == 2: names.insert(1, '')
        
    labels = 'first', 'middle', 'last'
    for label, name in zip(labels, names):
        people = lookup(data, label, name)
        if people:
            people.append(full_name)
        else:
            data[label][name] = [full_name]

            
MyNames = {}
init(MyNames)
store(MyNames, 'Magnus Lie Hetland')
lookup(MyNames, 'middle', 'Lie')


#这种程序非常适合使用面向对象编程，这将在下一章介绍。

['Magnus Lie Hetland']

#### 6.4.3 关键字参数和默认值

+ 上文提及的参数都是**位置参数**
+ 使用**名称**而非序位指定的参数称为**关键字参数**。关键字参数与顺序无关
+ 关键字参数可以指定默认值
+ 关键字参数和位置参数并存时，**必须先指定所有的位置参数**
    - 注意：通常不应结合使用位置参数和关键字参数，除非你知道这样做的后果。一般而言，除非必不可少的参数很少，而带默认值的可选参数很多，否则不应结合使用关键字参数和位置参数

In [12]:
#def hello_4(name, greeting='Hello', punctuation='!'):
#def hello_4(greeting='Hello',name, punctuation='!'):
#def hello_4(name, greeting='Hello',punctuation='!', test):
    print('{}, {}{}'.format(greeting, name, punctuation))
#    print(test)

hello_4('Mars')

SyntaxError: non-default argument follows default argument (<ipython-input-12-f3426dff15fe>, line 2)

#### 6.4.3 收集参数

+ 与[序列解包](../Python_Ch_5.ipynb#5.2.1-序列解包)类似，在参数名前加`*`便可收集参数
+ 与赋值时一样，带星号的参数数也可放在其他位置（而不是最后），但不同的是，在这种情况下你需要做些额外的工作：**使用名称来指定后续参数**
+ `*`不会收集关键字参数，`**`才能**收集关键字参数**，此时得到的是**字典**而不是元组

In [14]:
def print_params(*params):
    print(params)

print_params([1, 2, 3])
print_params(1, 2, 3)

def print_params_2(title, *params):
    print(title)
    print(params)
    
print_params_2('Params:', 1, 2, 3)
print_params_2('Nothing:',)

def in_the_middle(x, *y, z):
    print(x, y, z)

in_the_middle(1, 2, 3, 4, 5, z=7)
#in_the_middle(1, 2, 3, 4, 5, 7)

def print_params_3(**params):
    print(params)
    
print_params_3(x = 1, y = 2, z = 3)

#def print_params_4(x, y, z=3, *pospar, **keypar):
def print_params_4(x, y, *pospar, z=3, **keypar):
    print(x, y, z)
    print(pospar)
    print(keypar)

print_params_4(1, 2, 4, 5, 6, r = 7, s = 8, t = 9)

#使用这个方法改进姓名存储示例：
def store(data, *full_names):
    for full_name in full_names:
        names = full_name.split()
        if len(names) == 2: names.insert(1, '')
        labels = 'first', 'middle', 'last'
        for label, name in zip(labels, names):
            people = lookup(data, label, name)
            if people:
                people.append(full_name)
            else:
                data[label][name] = [full_name]
                
d = {}
init(d)
store(d, 'Luke Skywalker', 'Anakin Skywalker')
lookup(d, 'last', 'Skywalker')

([1, 2, 3],)
(1, 2, 3)
Params:
(1, 2, 3)
Nothing:
()
1 (2, 3, 4, 5) 7
{'x': 1, 'y': 2, 'z': 3}
1 2 3
(4, 5, 6)
{'r': 7, 's': 8, 't': 9}


['Luke Skywalker', 'Anakin Skywalker']

#### 6.4.5 分配参数

+ 在调用时使用`*`或`**`实现
+ 在定义和调用时同时使用，则相当于传递数据（元组或字典）本身
+ 使用拆分运算符来传递参数在调用超类的构造函数时特别有用（第9章）

In [18]:
def hello_3(name, greeting = 'Hi', punc = '!'):
    print('{}, {} {}'.format(greeting, name, punc))

params = {'name': 'Sir Robin', 'greeting': 'Well met'}
hello_3(**params)
hello_3(name = 'Sir Robin', greeting = 'Well met')

Well met, Sir Robin !
Well met, Sir Robin !


### 6.5 作用域

+ 变量可视为**指向值的名称**
+ 这类似于字典。实际上可以调用内置函数`vars()`返回查看这个不可见的字典
    - 不建议修改`vars()`返回的字典的值，这样做的结果是不确定的
+ 这个“字典”被称为**命名空间**或**作用域**
+ 除全局作用域外，**每个函数调用都将创建一个命名空间**
+ **谨慎使用全局变量**

In [19]:
def change(n_t):
    n_t[0] = 'Mr. Gumby'

name = ['test']
change(name)
print(name)
#print(n_t)

#如果只是想读取这种变量的值（不重新关联它），通常不会有问题：
def combine(parameter): print(parameter + external)
    
external = 'berry'
combine('Shrub')

['Mr. Gumby']
Shrubberry


+ 如果有一个局部变量或参数与你要访问的全局变量同名，就无法直接访问全局变量，因为它被局部变量**遮住**了
+ 如果需要，可使用函数globals来访问全局变量。这个函数类似于vars，返回一个包含全局变量的**字典**
+ locals返回一个包含局部变量的字典。

+ **重新关联**全局变量（使其指向新值）是另一码事
+ 在函数内部赋值时，默认是局部变量
+ 使用`global`关键字定义全局变量

In [20]:
def change(n_t):
    n_t[0] = 'Mr. Gumby'
    global test_1
    test_1 = 'Hello'

change(['I'])
print(test_1)
#print(n_t)

Hello


+ **作用域嵌套**
    + 嵌套通常用于使用一个函数来创建另一个函数

In [81]:
def multiplier(factor):
    def multiplyByFactor(number):
        return number * factor
    return multiplyByFactor

   + 在这里，一个函数位于另一个函数中，且外面的函数返回里面的函数。也就是返回一个函数，而不是调用它
   + 返回的函数能够访问其定义所在的作用域。换而言之，它携带着自己所在的环境（和相关的局部变量）

In [21]:
def multiplier(factor):
    def multiplyByFactor(number):
        return number * factor
    return multiplyByFactor

double = multiplier(2)
print(double(5))
print(multiplier(2)(5))

def multiplier_1(factor):
    def multiplyByFactor(number):
        nonlocal factor
        factor = 10
        return number * factor
    return multiplyByFactor
print(multiplier_1(2)(5))

10
10
50


   + 像`multiplyByFactor`这样存储其所在作用域的函数称为**闭包**
   + 可以使用`nonlocal`关键字给**外部作用域**内的变量赋值

### 6.6 递归

+ 递归式函数定义：
    - `def recursion(): return recursion()`
    + 基线条件（针对最小问题）：满足这种条件时函数将直接返回一个值
    + 递归条件：包含一个或多个调用，这些调用旨在解决**问题的一部分**

#### 6.6.1 阶乘和幂

In [22]:
def factorial(n):
    if n == 1:
        return 1
    else:
        return n * factorial(n - 1)

print(factorial(5))

def power(x, n):
    if n == 1:
        return x
    else:
        return x * power(x, n - 1)

print(power(2, 3))

120
8


#### 6.6.2 二分查找

In [23]:
def search(sequence, number, lower = 0, upper = None):
    if upper is None: upper = len(sequence) - 1
    if lower == upper:
        assert number == sequence[upper]
        return upper
    else:
        middle = (lower + upper) // 2
        if number > sequence[middle]:
            return search(sequence, number, middle + 1, upper)
        else:
            return search(sequence, number, lower, middle)

seq = [34, 67, 8, 123, 4, 100, 95]
seq.sort()
print(search(seq, 34))

2


#### 函数式编程
+ Python提供了一些有助于进行这种函数式编程的函数：`map`、`filter`和`reduce`
+ python中的`lambda`表达式

In [24]:
#可使用map将序列的所有元素传递给函数
print(list(map(str, range(10)))) # 与[str(i) for i in range(10)]等价

#可使用filter根据布尔函数的返回值来对元素进行过滤
def func(x):
    return x.isalnum()

seq = ["foo", "x41", "?!", "***"]
print(list(filter(func, seq)))

print(list(x for x in seq if x.isalnum()))#与上述的filter等价

#lambda表达式创建内嵌的简单函数，主要供map，filter和reduce使用
print(list(filter(lambda x: x.isalnum(), seq)))

#reduce：reduce使用指定的函数（可使用lamda定义）将序列的前两个元素合二为一，再将结果与第3个元素合二为一，递推直到处理完整个队列得到一个结果
numbers = [72, 101, 108, 108, 111, 44, 32, 119, 111, 114, 108, 100, 33]
from functools import reduce
reduce(lambda x, y: x + y, numbers)

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['foo', 'x41']
['foo', 'x41']
['foo', 'x41']


1161

# 🞂 つづく