截止目前，我们已介绍了数字、赋值语句、输入/输出语句、比较操作、循环结构。Python的这个子集的功能有多强大？

答：从理论上讲，**它是图灵完备的**。这意味着如果一个问题是可以通过计算求解的，那么它就能使用你已经看到的那些语句来求解。

并不是说你应该只使用这些语句。此时，我们已介绍了许多语言机制，但是代码一直是单个指令序列，所有合并在一起。比如，在上一章里看到的代码，

In [1]:
x = 25
epsilon = 0.01
numGuesses = 0
low = 0.0
high = max(1.0, x)
ans = (low + high)/2.0

while abs(ans**2 -x)>= epsilon:
    numGuesses += 1
    if ans**2 < x:
        low = ans
    else:
        high = ans
    ans = (low + high)/2.0
    
print('numGuesses =', numGuesses)
print(ans,'is close to square root of', x)

numGuesses = 13
5.00030517578125 is close to square root of 25


虽然这是一个可读性强的代码，但是它缺少通用性。它仅对变量x和epsilon代表的值生效。这意味着如果我们想重新使用它，我们需要拷贝代码，可能要编辑变量名，把它粘贴到我们想使用它的地方。由于这个原因，我们不能轻易地在其他更复杂的计算中使用这个计算。

而且，如果想计算立方根，而不是平方根，我们不得不重新编辑代码。如果我们想要一个既计算平方根，又计算立方根的程序，该程序包含了大段的几乎一模一样的代码，更容易出错，且更难维护代码。

想象一下，比如在原来的平方根代码里有错误，当测试时发现了。很容易出现：在一个地方修正了，但其他也需要修正的相似代码处忘记修正了。

Python提供了若干个使推广和重用代码变得相对容易的语言特征。函数是其中最重要的。

## 4.1 函数和作用域

我们已经使用了一些内置函数，比如`max`和`abs`。对程序员来说，可以定义并使用自己的函数，就像它们是内置的一样，是朝方便性迈出的一个质的飞跃。

### 4.1.1 函数定义

在Python中，每个函数定义都有如下形式：
```
def name of function (list of formal parameters):
    body of function
```

比如，定义函数`maxVal`为：

In [5]:
def maxVal(x, y):
    if x > y:
        return x
    else:
        return y

其中，
- `def`是一个保留字，告诉Python这是一个函数定义。
- 函数名只是一个用来引用函数的名字而已。
- 跟在函数名之后的括号内的名字序列是函数的**形式参数**。

  当使用函数时，形式参数被绑定为**函数调用**中的**实际参数**(跟赋值语句一样)。比如，`maxVal(3,4)`将x绑定到3，将y绑定到4。
- 函数体可以是任意的Python代码。注意，return语句只能在函数体中使用。

一个函数调用就是一个表达式。跟所有表达式一样，函数调用有一个值。那个值是由被调用函数返回的值。比如，表达式`maxVal(3,4)*maxVal(3,2)`的值是12，因为第一个函数调用返回`int 4`，第二个函数调用返回`int 3`。注意，`return`语句的执行结束了该函数的调用。

总结一下，当一个函数被调用时：
1. 对组成实际参数的表达式求值，将函数的形式参数绑定到这些结果值上。
   
   比如，当对调用求值式，调用`maxVal(3+4,z)`将形式参数绑定到7，形式参数y绑定到变量z表示的任何值。
2. 执行点从当前调用点移动到函数体的第一条语句。

3. 执行函数体中的代码直到碰到一条`return`语句(这种情况下，跟在`return`后的表达式的值就是函数调用的值)或者再也没有语句要执行了(这种情况下，函数返回`None`)。

   如果`return`后没有表达式，那么调用的值就是`None`。
4. 调用的值就是返回的值。
5. 执行点切回到跟在调用后的代码处。

参数提供了lamda抽象，允许程序员编写操作没有具体对象的代码，但是函数调用者选择的任何对象都被用作实际参数。

随堂联系：编写一个函数`isIn`，它的形式参数为两个字符串，如果任意一个字符串包含另一个，就返回true，其余情形都是false。

In [8]:
def isIn(a, b):
    if a in b or b in a:
        return True
    else:
        return False

print(isIn('ab', 'dabcd'))

print(isIn('dabcd', 'bc'))

print(isIn('ab', 'bc'))

True
True
False


### 4.1.2 关键字参数和默认值

在Python中，形式参数绑定到实际参数有两种方式：

- 按位置绑定

  第一个形式参数绑定到第一个实际参数，第二个形式参数绑定到第二个实际参数，以此类推。
- 根据关键词参数绑定

  使用形式参数名将形式参数绑定到实际参数。

考虑如下函数定义：

In [1]:
def printName(firstName, lastName, reverse):
    if reverse:
        print(lastName+','+firstName)
    else:
        print(firstName+','+lastName)

解释：函数名`printName`假设`firstName`和`lastName`是字符串，`reverse`是布尔型。如果`reverse==True`，那么它输出`lastName, firstName`，否则它输出`firstName, lastName`。

如下每个调用都是等价的：

In [3]:
printName('Olga','Puchmajerova',False)
printName('Olga','Puchmajerova',reverse=False)
printName('Olga', lastName = 'Puchmajerova', reverse=False)
printName(lastName = 'Puchmajerova', firstName = 'Olga', reverse=False)

Olga,Puchmajerova
Olga,Puchmajerova
Olga,Puchmajerova
Olga,Puchmajerova


注意：虽然关键词参数出现在实际参数列表中的顺序是任意的，但是**在关键词参数后跟一个非关键词参数是非法的**。因此，下面的语句会输出一条错误消息：

In [4]:
printName('Olga', lastName = 'Puchmajerova', False)

SyntaxError: positional argument follows keyword argument (3590324403.py, line 1)

关键词参数通常跟默认参数值一起使用。比如，如下代码：

In [5]:
def printName(firstName, lastName, reverse = False):
    if reverse:
        print(lastName+','+firstName)
    else:
        print(firstName+','+lastName)

默认值允许程序员使用比指定参数少的参数来调用一个函数。比如：

In [6]:
printName('Olga','Puchmajerova')
printName('Olga','Puchmajerova',True)
printName('Olga', 'Puchmajerova', reverse=True)

Olga,Puchmajerova
Puchmajerova,Olga
Puchmajerova,Olga


`printName`的后两次调用从语法上是等价的。

### 4.1.3 作用域

让我们看一个小例子：

In [7]:
def f(x):
    y = 1
    x = x + y
    print('x =', x)
    return x

x = 3
y = 2
z = f(x)

print('z =', z)
print('x =', x)
print('y =', y)

x = 4
z = 4
x = 3
y = 2


这里发生了什么？
- 在调用函数f时，形式参数x被局部绑定到实际参数x的值。注意：虽然实际参数和形式参数有相同的名字，但是它们是不是相同的变量。每个函数定义了一个新的名字空间，也叫作用域。形式参数x和局部变量y只存在于f定义的作用域内。在函数体内的赋值语句将局部名字x绑定到对象4。在f内的赋值对在函数f作用域外部存在名字x和y的绑定没有影响。

可以这么来理解：
- 在最高层，即shell层，有一个符号表记录了在这一层定义的所有名字，及其当前的绑定。
- 当一个函数被调用时，一个新的叫栈帧的符号表被创建了。这张表记录了在函数内的所有名字(包括了形式参数)，及其当前的绑定。如果在一个函数体内调用了一个函数，则会创建一个新的栈帧。
- 当函数调用完成，它的栈帧就销毁了。

在Python中，可通过看程序文本来确定一个名字的作用域，即静态作用域。

图4.2里展示了一个说明Python作用域规则的示例。

In [8]:
def f(x):
    def g():
        x = 'abc'
        print('x =', x)
    def h():
        z = x
        print('z =', z)
    
    x = x + 1
    print('x =', x)
    h()
    g()
    print('x =', x)
    return g

x = 3
z = f(x)

print('x =', x)
print('z =', z)

z()   

x = 4
z = 4
x = abc
x = 4
x = 3
z = <function f.<locals>.g at 0x7ff3c3e745e0>
x = abc


图4.3里描述了跟代码关联的栈帧历史。

- 第一列包含了在函数体外的名字的集合，即变量x、z和函数名f。第一条赋值语句将x绑定到对象3。
- 赋值语句z=f(x)先通过带着x被绑定的值调用函数f来对表达式f(x)求值。当进入f时，创建了一个栈帧，请看第2列。在栈帧里的变量是x(是形式参数，不是调用的参数)、g、h。变量g和h被绑定到函数类型的对象。这些函数的性质由在f内的定义给出。
- 当在f内调用h时，又创建了一个栈帧，看第3列。这个栈帧里只包含了局部变量z。为什么它不包含变量x？只有当一个名字是一个形式参数或者一个绑定到函数体内部的一个对象时，这个名字才被加入到跟该函数相关的作用域里。在h的函数体里，x之出现在一条赋值语句的右边。在h函数体里的没有绑定给一个对象的变量x的出现会引起解释器去搜索该函数被定义的作用域关联关联的栈帧，即f的作用域关联的栈帧。如果发现了，就使用它被绑定的值。如果没发现，则输出错误消息。
- 当h返回时，跟h关联的栈帧就消失了，看第四列。注意，我们永远不会从栈的中间移除帧，只移除最近被添加的帧。正是由于它具有后进先出的性质，我们才引用它为栈。
- 接下来，调用g，包含g的局部变量x的栈帧就被创建了。当g返回了，那个帧就被弹出了，看第六列。当f返回了，包含跟f关联的名字的栈帧被弹出了，使我们回到最初的栈帧，看第7列。
- 注意，当f返回了，即使变量g不存在了，那个名字曾经绑定的函数类型的对象还存在。这是因为函数是对象，可像其他类型的对象一样被返回。所以z可被绑定到由f返回的值，函数调用z()可被用来调用在f内部的名字g曾经被绑定的函数，即使名字g在f的作用域外是未知的。

对名字引用的出现顺序是无关紧要的。如果一个对象被绑定给在函数体内任意位置的名字，则它被看做是那个函数的局部名。比如：

In [9]:
def f():
    print(x)
    
def g():
    print(x)
    x = 1
    
x = 3
f()
x = 3
g()

3


UnboundLocalError: local variable 'x' referenced before assignment

这是因为跟在`print`语句后的赋值语句导致`x`成为`g`的局部变量。因为`x`是`g`的局部变量，所以当`print`语句被执行时，它没有值。

还迷惑吗？大部分人都要花费一点时间来理解作用域规则。别让它困扰你。现在，开始使用函数。大部分时候，你会发现，你只想使用函数的局部变量，作用域规则的微妙细节将是不相关的。

## 4.2 规范

图4.4定义了`findRoot`函数，它推广了用来寻找平方根的二分搜索法。它还包含了一个`testFindRoot`方法，可用来测试`findRoot`是否像预期那样工作。

In [13]:
def findRoot(x, power, epsilon):
    """
    假设x和epsilon为int或者float，power是int，epsilon>0，且power>=1
    
    返回float型y满足y**power在x的epsilon范围内。如果这样的float不存在，返回None
    """
    if x <= 0 and power%2 == 0:
        return None
    
    low = min(-1.0,x)
    high = max(1.0, x)
    ans = (high+low)/2
    
    while abs(ans**power-x)>=epsilon:
        if ans**power < x:
            low = ans
        else:
            high = ans
        
        ans = (high+low)/2
    
    return ans

def testFindRoot():
    epsilon = 0.0001
    
    for x in [0.25, -0.25, 2, -2, 8 , -8]:
        for power in range(1,4):
            print('Testing x =', str(x), 'and power =', power)
            result = findRoot(x, power, epsilon)
            if result == None:
                print('  No root')
            else:
                print('  ', result**power, '~=', x)
                
testFindRoot()

Testing x = 0.25 and power = 1
   0.25 ~= 0.25
Testing x = 0.25 and power = 2
   0.25 ~= 0.25
Testing x = 0.25 and power = 3
   0.24990749079734087 ~= 0.25
Testing x = -0.25 and power = 1
   -0.25 ~= -0.25
Testing x = -0.25 and power = 2
  No root
Testing x = -0.25 and power = 3
   -0.24990749079734087 ~= -0.25
Testing x = 2 and power = 1
   1.999908447265625 ~= 2
Testing x = 2 and power = 2
   2.0000906325876713 ~= 2
Testing x = 2 and power = 3
   2.000059155646067 ~= 2
Testing x = -2 and power = 1
   -1.999908447265625 ~= -2
Testing x = -2 and power = 2
  No root
Testing x = -2 and power = 3
   -2.000059155646067 ~= -2
Testing x = 8 and power = 1
   7.999931335449219 ~= 8
Testing x = 8 and power = 2
   7.99999568007479 ~= 8
Testing x = 8 and power = 3
   8.000068664747232 ~= 8
Testing x = -8 and power = 1
   -7.999931335449219 ~= -8
Testing x = -8 and power = 2
  No root
Testing x = -8 and power = 3
   -8.000068664747232 ~= -8


`testFindRoot`函数几乎跟`findRoot`一样长。对于没经验的程序员来说，编写诸如这样的测试函数似乎是浪费时间。但是，有经验的程序员知道：在编写测试代码方面的投资经常会得到巨大的回报。在调试过程中，它肯定比在shell中反复键入测试用例要好。它也强迫我们思考哪些测试可能最有启发性。

在三重引号标志间的文本叫做Python中的**文档字符串**。根据约定，Python程序员使用文档字符串来提供对函数的说明。这些文档字符串可通过使用内置函数help来访问。比如，如果我们在shell中键入`help(abs)`，则系统将展示：

In [14]:
help(abs)

Help on built-in function abs in module builtins:

abs(x, /)
    Return the absolute value of the argument.



如果图4.4的代码被加载进一个IDE，则`help(findRoot)`会展示：

In [15]:
help(findRoot)

Help on function findRoot in module __main__:

findRoot(x, power, epsilon)
    假设x和epsilon为int或者float，power是int，epsilon>0，且power>=1
    
    返回float型y满足y**power在x的epsilon范围内。如果这样的float不存在，返回None



一个函数的规范定义了函数的实现者跟使用者之间的约定。通常认为这类约定包含两个部分：
- 假设

  假设描述了函数的使用者必须要满足的条件。通常，它们描述关于实际参数的约束。常见的是指定每个参数可接受的类型的取值范围。比如，`findRoot`文档字符串的前两行描述了其使用者必须要满足的假设。
  
- 保证

  保证描述了函数必须要满足的条件，基于它按照满足假设的方式来调用。比如，`findRoot`文档字符串的后两行描述了函数的实现必须要满足的保证。

函数是一种创建计算元素的方式，我们可将其视为原语。正如我们有内置的函数`max`和`abs`一样，我们希望有等价的可以寻找平方根以及其他复杂操作的内置函数。函数通过提供分解和抽象等来促进这一点。

- 分解就是创建结构。它允许我们将一个程序分解成合理的、自我包含的部分，且这些部分可以在不同的背景下被重复使用。

- 抽象就是隐藏细节。它允许我们使用一块代码就像它是一个黑匣子一样。抽象的本质是保留跟某个上下文相关的信息，忘记那些不相关的信息。在编程中有效抽象的关键就是找个一个既符合抽象构建者又符合抽象使用者的相关性的概念。这才是编程的艺术。

抽象就是忘记。

假设你被要求制作一门包含25节课的计算机科学入门课程。一种方法是招募25位教授，让他们每人准备一小时自己喜欢的话题的讲座。虽然你可能会得到25个精彩的小时，但整件事很可能感觉像是皮兰德罗的《寻找作者的六个角色》的戏剧化。如果每位教授都是单独工作，他们就不知道如何将自己课上的材料与其他课上涉及的材料联系起来。

无论如何，你需要让每个人都知道其他人在做什么，而不是产生太多没人愿意参与的工作。这就是**抽象**的由来。你可以写25个说明，每个说明学生在每节课应该学习什么材料，但不给出任何关于这些材料应该如何教授的细节。你得到的东西可能在教学上不是很好，但至少是有意义的。

这是组织使用程序员团队来完成工作的方式。给定一个模块的规范，程序员可以致力于实现该模块，而不必过分担心团队中的其他程序员正在做什么。此外，其他程序员可以使用该规范开始编写使用该模块的代码，而不必过分担心该模块将如何实现。

`findRoot`的规范是对满足规范的所有可能实现的一种抽象。`findRoot`的客户端可以假设该实现满足规范，但是他们不应该做更多的假设。例如，客户端可以假设调用`findRoot(4.0, 2,0.01)`返回一些平方在3.99和4.01之间的值。返回的值可以是正的或负的，即使4.0是一个完全平方，返回的值也可能不是2.0或-2.0。