<a href="https://colab.research.google.com/github/allenwoods/sicp-jupyter/blob/master/Chapter%201.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1.1 引言

> 来源：[1.1   Introduction](http://www-inst.eecs.berkeley.edu/~cs61a/sp12/book/functions.html#introduction)

> 译者：[飞龙](https://github.com/wizardforcel)

> 协议：[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/)



计算机科学是一个极其宽泛的学科。全球的分布式系统、人工智能、机器人、图形、安全、科学计算，计算机体系结构和许多新兴的二级领域，每年都会由于新技术和新发现而扩展。计算机科学的快速发展广泛影响了人类生活。商业、通信、科学、艺术、休闲和政治都被计算机领域彻底改造。

计算机科学的巨大生产力可能只是因为它构建在一系列优雅且强大的基础概念上。所有计算都以表达信息、指定处理它所需的逻辑、以及设计管理逻辑复杂性的抽象作为开始。对这些基础的掌握需要我们精确理解计算机如何解释程序以及执行计算过程。

这些基础概念在伯克利长期教授，使用由Harold Abelson、Gerald Jay Sussman和Julie Sussman创作的经典教科书《计算机科学的构造与解释》（SICP）。这个讲义大量借鉴了这本书，原作者慷慨地使它可用于改编和复用。

我们的智力之旅一旦出发就不能回头了，我们也永远都不应该对此有所期待。


> 我们将要学习计算过程的概念。计算过程是计算机中的抽象事物。在演化中，过程操纵着叫做数据的其它事物。过程的演化由叫做程序的一系列规则主导。人们创造程序来主导过程。实际上，我们使用我们的咒语来凭空创造出计算机的灵魂。

> 我们用于创造过程的程序就像巫师的魔法。它们由一些古怪且深奥的编程语言中的符号表达式所组成，这些语言指定了我们想让过程执行的任务。

> 在一台工作正确的计算机上，计算过程准确且严谨地执行程序。所以，就像巫师的学徒那样，程序员新手必须学会理解和预测他们的魔法产生的结果。

> --Abelson & Sussman, SICP (1993)



## 1.1.1 在Python中编程

> 语言并不是你学到的东西，而是你参与的东西。

> --[Arika Okrent](http://arikaokrent.com/)

为了定义计算过程，我们需要一种编程语言，最好是一种许多人和大量计算机都能懂的语言。这门课中，我们将会使用[Python](http://docs.python.org/py3k/)语言。

Python是一种广泛使用的编程语言，并且在许多职业中都有它的爱好者：Web程序员、游戏工程师、科学家、学者，甚至新编程语言的设计师。当你学习Python时，你就加入到了一个数百万人的开发者社群。开发者社群是一个极其重要的组织：成员可以互相帮助来解决问题，分享他们的代码和经验，以及一起开发软件和工具。投入的成员经常由于他们的贡献而出名，并且收到广泛的尊重。也许有一天你会被提名为Python开发者精英。

Python语言自身就是一个[大型志愿者社群](http://www.python.org/psf/members/)的产物，并且为其贡献者的[多元化](http://python.org/community/diversity/)而自豪。这种语言在20世纪80年代末由[Guido van Rossum](http://en.wikipedia.org/wiki/Guido_van_Rossum)设计并首次实现。他的[Python3教程](http://docs.python.org/py3k/tutorial/appetite.html)的第一章解释了为什么Python在当今众多语言之中如此流行。

Python适用于作为教学语言，因为纵观它的历史，Python的开发者强调了Python代码对人类的解释性，并在[Python之禅](http://www.python.org/dev/peps/pep-0020/)中美观、简约和可读的原则下进一步加强。Python尤其适用于课堂，因为它宽泛的特性支持大量的不同编程风格，我们将要探索它们。在Python中编程没有单一的解法，但是有一些习俗在开发者社群之间流传，它们可以使现有程序的阅读、理解，以及扩展变得容易。所以，Python的灵活性和易学性的组合可以让学生们探索许多编程范式，之后将它们新学到的知识用于数千个[正在开发的项目](http://pypi.python.org/pypi)中。

这些讲义通过使用抽象设计的技巧和严谨的计算模型，来快速介绍Python的特性。此外，这些讲义提供了Python编程的实践简介，包含一些高级语言特性和展示示例。通过这门课，学习Python将会变成自然而然的事情。

然而，Python是一门生态丰富的语言，带有大量特性和用法。我们讲到基本的计算机科学概念时，会刻意慢慢地介绍他们。对于有经验的学生，他们打算一口气学完语言的所有细节，我们推荐他们阅读Mark Pilgrim的书[Dive Into Python 3](http://diveintopython3.ep.io/)，它在网上可以免费阅读。这本书的主题跟这门课极其不同，但是这本书包含了许多关于使用Python的宝贵的实用信息。事先告知：不像这些讲义，Dive Into Python 3需要一些编程经验。

开始在Python中编程的最佳方法就是直接和解释器交互。这一章会描述如何安装Python3，使用解释器开始交互式会话，以及开始编程。


## 1.1.2 安装Python3

就像所有伟大的软件一样，Python具有许多版本。这门课会使用Python3最新的稳定版本（本书编写时是3.2）。许多计算机都已经安装了Python的旧版本，但是它们可能不满足这门课。你应该可以在这门课上使用任何能安装Python3的计算机。不要担心，Python是免费的。

Dive Into Python 3拥有一个为所有主流平台准备的详细的[安装指南](http://diveintopython3.ep.io/installing-python.html)。这个指南多次提到了Python3.1，但是你最好安装3.2（虽然它们的差异在这门课中非常微小）。EECS学院的所有教学机都已经安装了Python3.2。



## 1.1.3 交互式会话

在Python交互式会话中，你可以在提示符`>>>`之后键入一些Python代码。Python解释器读取并求出你输入的东西，并执行你的各种命令。

有几种开始交互式会话的途径，并且具有不同的特性。把它们尝试一遍来找出你最喜欢的方式。它们全部都在背后使用了相同的解释器（CPython）。

+ 最简单且最普遍的方式就是运行Python3应用。在终端提示符后（Mac/Unix/Linux）键入`python3`，或者在Windows上打开Python3应用。（译者注：Windows上设置完Python的环境变量之后，就可以在`cmd`或PowerShell中执行相同操作了。）

+ 有一个更加用户友好的应用叫做Idle3（`idle3`），可用于学习这门语言。Idie会高亮你的代码（叫做语法高亮），弹出使用提示，并且标记一些错误的来源。Idle总是由Python自带，所以你已经安装它了。

+ Emacs编辑器可以在它的某个缓冲区中运行交互式会话。虽然它学习起来有些挑战，Emacs是个强大且多功能的编辑器，适用于任何语言。请阅读61A的Emacs教程来开始。许多程序员投入大量时间来学习Emacs，之后他们就不再切换编辑器了。

在所有情况中，如果你看见了Python提示符`>>>`，你就成功开启了交互式会话。这些讲义使用提示符来展示示例，同时带有一些输入。

In [1]:
2+2

4


控制：每个会话都保留了你的历史输入。为了访问这些历史，需要按下`<Control>-P`（上一个）和`<Control>-N`（下一个）。`<Control>-D`会退出会话，这会清除所有历史。

## 1.1.4 第一个例子
> 想像会把不知名的事物用一种形式呈现出来，诗人的笔再使它们具有如实的形象，空虚的无物也会有了居处和名字。
> --威廉·莎士比亚，《仲夏夜之梦》

为了介绍Python，我们会从一个使用多个语言特性的例子开始。下一节中，我们会从零开始，一步一步构建整个语言。你可以将这章视为即将到来的特性的预览。

Python拥有常见编程功能的内建支持，例如文本操作、显示图形以及互联网通信。导入语句

In [0]:
 from urllib.request import urlopen

为访问互联网上的数据加载功能。特别是，它提供了叫做`urlopen`的函数，可以访问到统一资源定位器（URL）处的内容，它是互联网上的某个位置。

**语句和表达式：**Python代码包含语句和表达式。广泛地说，计算机程序包含的语句

1.  计算某个值

2.  或执行某个操作

语句通常用于描述操作。当Python解释器执行语句时，它执行相应操作。另一方面，表达式通常描述产生值的运算。当Python求解表达式时，就会计算出它的值。这一章介绍了几种表达式和语句。

赋值语句

In [0]:
shakespeare = urlopen('http://inst.eecs.berkeley.edu/~cs61a/fa11/shakespeare.txt')

将名称`shakespeare`和后面的表达式的值关联起来。这个表达式在URL上调用`urlopen`函数，URL包含了莎士比亚的37个剧本的完整文本，在单个文本文件中。

**函数：**函数封装了操作数据的逻辑。Web地址是一块数据，莎士比亚的剧本文本是另一块数据。前者产生后者的过程可能有些复杂，但是我们可以只通过一个表达式来调用它们，因为复杂性都塞进函数里了。函数是这一章的主要话题。

另一个赋值语句

In [0]:
words = set(shakespeare.read().decode().split())

将名称`words`关联到出现在莎士比亚剧本中的所有去重词汇的集合，总计33,721个。这个命令链调用了`read`、`decode`和`split`，每个都操作衔接的计算实体：从URL读取的数据、解码为文本的数据、以及分割为单词的文本。所有这些单词都放在`set`中。

**对象：**集合是一种对象，它支持取交和测试成员的操作。对象整合了数据和操作数据的逻辑，并以一种隐藏其复杂性的方式。对象是第二章的主要话题。

表达式

In [5]:
{w for w in words if len(w) >= 5 and w[::-1] in words}

{'madam', 'stink', 'leets', 'rever', 'drawer', 'stops', 'sessa',

'repaid', 'speed', 'redder', 'devil', 'minim', 'spots', 'asses',

'refer', 'lived', 'keels', 'diaper', 'sleek', 'steel', 'leper',

'level', 'deeps', 'repel', 'reward', 'knits'}

{'asses',
 'deeps',
 'devil',
 'diaper',
 'drawer',
 'keels',
 'knits',
 'leets',
 'leper',
 'level',
 'lived',
 'madam',
 'minim',
 'redder',
 'refer',
 'repaid',
 'repel',
 'rever',
 'reward',
 'sessa',
 'sleek',
 'speed',
 'spots',
 'steel',
 'stink',
 'stops'}

是一个复合表达式，求出正序或倒序出现的“莎士比亚词汇”集合。神秘的记号`w[::-1]`遍历单词中的每个字符，然而`-1`表明倒序遍历（`::`表示第一个和最后一个单词都使用默认值）。当你在交互式会话中输入表达式时，Python会在随后打印出它的值，就像上面那样。

**解释器：**复合表达式的求解需要可预测的过程来精确执行解释器的代码。执行这个过程，并求解复合表达式和语句的程序就叫解释器。解释器的设计与实现是第三章的主要话题。

与其它计算机程序相比，编程语言的解释器通常比较独特。Python在意图上并没有按照莎士比亚或者回文来设计，但是它极大的灵活性让我们用极少的代码处理大量文本。

最后，我们会发现，所有这些核心概念都是紧密相关的：函数是对象，对象是函数，解释器是二者的实例。然而，对这些概念，以及它们在代码组织中的作用的清晰理解，是掌握编程艺术的关键。

## 1.1.5 实践指南

Python正在等待你的命令。你应当探索这门语言，即使你可能不知道完整的词汇和结构。但是，要为错误做好准备。虽然计算机极其迅速和灵活，它们也十分古板。在[斯坦福的导论课](http://www.stanford.edu/class/cs101/code-introduction.html)中，计算机的本性描述为

> 计算机的基本等式是：`计算机 = 强大 + 笨拙`

> 计算机非常强大，能够迅速搜索大量数据。计算机每秒可以执行数十亿次操作，其中每个操作都非常简单。

> 计算机也非常笨拙和脆弱。它们所做的操作十分古板、简单和机械化。计算机缺少任何类似真实洞察力的事情...它并不像电影中的HAL 9000。如果不出意外，你不应被计算机吓到，就像它拥有某种大脑一样。它在背后非常机械化。

> 程序是一个人使用他的真实洞察力来构建出的一些实用的东西，它由这些简单的小操作所组成。

> —Francisco Cai & Nick Parlante, 斯坦福 CS101

在你实验Python解释器的时候，你会马上意识到计算机的古板：即使最小的拼写和格式修改都会导致非预期的输出和错误。

学习解释错误和诊断非预期错误的原因叫做调试（debugging）。它的一些指导原则是：

1.  逐步测试：每个写好的程序都由小型的组件模块组成，这些组件可以独立测试。尽快测试你写好的任何东西来及早捕获错误，并且从你的组件中获得自信。

2.  隔离错误：复杂程序的输出、表达式、或语句中的错误，通常可以归于特定的组件模块。当尝试诊断问题时，在你能够尝试修正错误之前，一定要将它跟踪到最小的代码片段。

3.  检查假设：解释器将你的指令执行为文字 -- 不多也不少。当一些代码不匹配程序员所相信的（或所假设的）行为，它们的输出就会是非预期的。了解你的假设，之后专注于验证你的假设是否整理来调试。

4.  询问他人：你并不是一个人！如果你不理解某个错误信息，可以询问朋友、导师或者搜索引擎。如果你隔离了一个错误，但是不知道如何改正，可以让其它人来看一看。在小组问题解决中，会分享一大堆有价值的编程知识。

逐步测试、模块化设计、明确假设和团队作业是贯穿这门课的主题。但愿它们也能够一直伴随你的计算机科学生涯。

# 1.2 编程元素

编程语言是操作计算机来执行任务的手段，它也在我们组织关于过程的想法中，作为一种框架。程序用于在编程社群的成员之间交流这些想法。所以，程序必须为人类阅读而编写，并且仅仅碰巧可以让机器执行。
当我们描述一种语言时，我们应该特别注意这种语言的手段，来将简单的想法组合为更复杂的想法。每个强大的语言都拥有用于完成下列任务的机制：
基本的表达式和语句，它们由语言提供，表示最简单的构建代码块。
组合的手段，复杂的元素由简单的元素通过它来构建，以及
抽象的手段，复杂的元素可以通过它来命名，以及作为整体来操作。
在编程中，我们处理两种元素：函数和数据。（不久之后我们就会探索它们并不是真的非常不同。）不正式地说，数据是我们想要操作的东西，函数描述了操作数据的规则。所以，任何强大的编程语言都应该能描述基本数据和基本函数，并且应该拥有组合和抽象二者的方式。

## 1.2.1 表达式

在实验 Python 解释器之后，我们现在必须重新开始，按照顺序一步步地探索 Python 语言。如果示例看上去很简单，要有耐心 -- 更刺激的东西还在后面。
我们以基本表达式作为开始。一种基本表达式就是数值。更精确地说，是你键入的，由 10 进制数字表示的数值组成的表达式。

In [6]:
42

42

表达式表示的数值也许会和算数运算符组合，来形成复合表达式，解释器会求出它：

In [7]:
-1 - -1

0

In [8]:
1/2 + 1/4 + 1/8 + 1/16 + 1/32 + 1/64 + 1/128

0.9921875

这些算术表达式使用了中缀符号，其中运算符（例如+、-、*、/）出现在操作数（数值）中间。Python包含许多方法来形成复合表达式。我们不会尝试立即将它们列举出来，而是在进行中介绍新的表达式形式，以及它们支持的语言特性。

## 1.2.2 调用表达式

最重要的复合表达式就是调用表达式，它在一些参数上调用函数。回忆代数中，函数的数学概念是一些输入值到输出值的映射。例如，max函数将它的输入映射到单个输出，输出是输入中的最大值。Python 中的函数不仅仅是输入输出的映射，它表述了计算过程。但是，Python 表示函数的方式和数学中相同。

In [9]:
max(7.5, 9.5)

9.5

调用表达式拥有子表达式：运算符在圆括号之前，圆括号包含逗号分隔的操作数。运算符必须是个函数，操作数可以是任何值。这里它们都是数值。当求解这个调用表达式时，我们说max函数以参数 7.5 和 9.5 调用，并且返回 9.5。
调用表达式中的参数的顺序极其重要。例如，函数pow计算第一个参数的第二个参数次方。

In [10]:
pow(100, 2)

10000

In [11]:
pow(2, 100)

1267650600228229401496703205376

函数符号比中缀符号的数学惯例有很多优点。首先，函数可以接受任何数量的参数：

In [12]:
 max(1, -2, 3, -4)

3

不会产生任何歧义，因为函数的名称永远在参数前面。
其次，函数符号可以以直接的方式扩展为嵌套表达式，其中元素本身是复合表达式。在嵌套的调用表达式中，不像嵌套的中缀表达式，嵌套结构在圆括号中非常明显。

（理论上）这种嵌套没有任何限制，并且 Python 解释器可以解释任何复杂的表达式。然而，人们可能会被多级嵌套搞晕。你作为程序员的一个重要作用就是构造你自己、你的同伴以及其它在未来可能会阅读你代码的人可以解释的表达式。
最后，数学符号在形式上多种多样：星号表示乘法，上标表示乘方，横杠表示除法，屋顶和侧壁表示开方。这些符号中一些非常难以打出来。但是，所有这些复杂事物可以通过调用表达式的符号来统一。虽然 Python 通过中缀符号（比如+和-）支持常见的数学运算符，任何运算符都可以表示为带有名字的函数。

## 1.2.3 导入库函数

Python 定义了大量的函数，包括上一节提到的运算符函数，但是通常不能使用它们的名字，这样做是为了避免混乱。反之，它将已知的函数和其它东西组织在模块中，这些模块组成了 Python 库。需要导入它们来使用这些元素。例如，math模块提供了大量的常用数学函数：

In [14]:
 from math import sqrt, exp

 sqrt(256)
16.0
 exp(1)
2.718281828459045

2.718281828459045

operator模块提供了中缀运算符对应的函数：

In [0]:
 from operator import add, sub, mul
 add(14, 28)
42
 sub(100, mul(7, add(8, 4)))
16

import语句标明了模块名称（例如operator或math），之后列出被导入模块的具名属性（例如sqrt和exp）。
Python 3 库文档列出了定义在每个模块中的函数，例如数学模块。然而，这个文档为了解整个语言的开发者编写。到现在为止，你可能发现使用函数做实验会比阅读文档告诉你更多它的行为。当你更熟悉 Python 语言和词汇时，这个文档就变成了一份有价值的参考来源。

## 1.2.4 名称和环境

编程语言的要素之一是它提供的手段，用于使用名称来引用计算对象。如果一个值被给予了名称，我们就说这个名称绑定到了值上面。
在 Python 中，我们可以使用赋值语句来建立新的绑定，它包含=左边的名称和右边的值。

In [0]:
 radius = 10
 radius
10
 2 * radius
20

In [0]:
from math import sqrt, exp

名称也可以通过import语句绑定：

In [0]:
 from math import pi
 pi * 71 / 223
1.0002380197528042

我们也可以在一个语句中将多个值赋给多个名称，其中名称和表达式由逗号分隔：

In [0]:
 area, circumference = pi * radius * radius, 2 * pi * radius
 area
314.1592653589793
 circumference
62.83185307179586

=符号在 Python（以及许多其它语言）中叫做赋值运算符。赋值是 Python 中的最简单的抽象手段，因为它使我们可以使用最简单的名称来引用复合操作的结果，例如上面计算的area。这样，复杂的程序可以由复杂性递增的计算对象一步一步构建，
将名称绑定到值上，以及随后通过名称来检索这些值的可能，意味着解释器必须维护某种内存来跟踪这些名称和值的绑定。这些内存叫做环境。
名称也可以绑定到函数。例如，名称max绑定到了我们曾经用过的max函数上。函数不像数值，不易于渲染成文本，所以 Python 使用识别描述来代替，当我们打印函数时：

In [0]:
 max
<built-in function max>

我们可以使用赋值运算符来给现有函数起新的名字：

In [0]:
 f = max
 f
<built-in function max>

In [0]:
 f(3, 4)
4

成功的赋值语句可以将名称绑定到新的值：

In [0]:
 f = 2
 f
2

在 Python 中，通过赋值绑定的名称通常叫做变量名称，因为它们在执行程序期间可以绑定到许多不同的值上面。

## 1.2.5 嵌套表达式的求解

我们这章的目标之一是隔离程序化思考相关的问题。作为一个例子，考虑嵌套表达式的求解，解释器自己会遵循一个过程：
为了求出调用表达式，Python 会执行下列事情：
求出运算符和操作数子表达式，之后
在值为操作数子表达式的参数上调用值为运算符子表达式的函数。
这个简单的过程大体上展示了一些过程上的重点。第一步表明为了完成调用表达式的求值过程，我们首先必须求出其它表达式。所以，求值过程本质上是递归的，也就是说，它会调用其自身作为步骤之一。
例如，求出

In [0]:
 mul(add(2, mul(4, 6)), add(3, 5))
208

需要应用四次求值过程。如果我们将每个需要求解的表达式抽出来，我们可以可视化这一过程的层次结构：

这个示例叫做表达式树。在计算机科学中，树从顶端向下生长。每一点上的对象叫做节点。这里它们是表达式和它们的值。
求出根节点，也就是整个表达式，需要首先求出枝干节点，也就是子表达式。叶子节点（也就是没有子节点的节点）的表达式表示函数或数值。内部节点分为两部分：表示我们想要应用的求值规则的调用表达式，以及表达式的结果。观察这棵树中的求值，我们可以想象操作数的值向上流动，从叶子节点开始，在更高的层上融合。
接下来，观察第一步的重复应用，这会将我们带到需要求值的地方，并不是调用表达式，而是基本表达式，例如数字（比如2），以及名称（比如add），我们需要规定下列事物来谨慎对待基本的东西：
数字求值为它标明的数值，
名称求值为当前环境中这个名称所关联的值
要注意环境的关键作用是决定表达式中符号的含义。Python 中，在不指定任何环境信息，来提供名称x（以及名称add）的含义的情况下，谈到这样一个表达式的值没有意义：

In [0]:
 add(x, 1)

环境提供了求值所发生的上下文，它在我们理解程序执行中起到重要作用。
这个求值过程并不符合所有 Python 代码的求解，仅仅是调用表达式、数字和名称。例如，它并不能处理赋值语句。

In [0]:
 x = 3

的执行并不返回任何值，也不求解任何参数上的函数，因为赋值的目的是将一个名称绑定到一个值上。通常，语句不会被求值，而是被执行，它们不产生值，但是会改变一些东西。每种语句或表达式都有自己的求值或执行过程，我们会在涉及时逐步介绍。
注：当我们说“数字求值为数值”的时候，我们的实际意思是 Python 解释器将数字求解为数值。Python 的解释器使编程语言具有了这个意义。假设解释器是一个固定的程序，行为总是一致，我们就可以说数字（以及表达式）自己在 Python 程序的上下文中会求解为值。

## 1.2.6 函数图解
当我们继续构建求值的形式模型时，我们会发现解释器内部状态的图解有助于我们跟踪求值过程的发展。这些图解的必要部分是函数的表示。
**纯函数：**具有一些输入（参数）以及返回一些输出（调用结果）的函数。内建函数

In [0]:
 abs(-2)
2


abs是纯函数。纯函数具有一个特性，调用它们时除了返回一个值之外没有其它效果。
**非纯函数：**除了返回一个值之外，调用非纯函数会产生副作用，这会改变解释器或计算机的一些状态。一个普遍的副作用就是在返回值之外生成额外的输出，例如使用print函数：

In [0]:
 print(-2)
-2
 print(1, 2, 3)
1 2 3

虽然这些例子中的print和abs看起来很像，但它们本质上以不同方式工作。print的返回值永远是None，它是一个 Python 特殊值，表示没有任何东西。Python 交互式解释器并不会自动打印None值。这里，print自己打印了输出，作为调用中的副作用。

调用print的嵌套表达式会凸显出它的非纯特性：

In [0]:
 print(print(1), print(2))
1
2
None None
如果你发现自己不能预料到这个输出，画出表达式树来弄清为什么这个表达式的求值会产生奇怪的输出。
要当心print！它的返回值为None，意味着它不应该在赋值语句中用作表达式：

In [0]:
 two = print(2)
2

In [0]:
 print(two)
None

**签名：**不同函数具有不同的允许接受的参数数量。为了跟踪这些必备条件，我们需要以一种展示函数名称和参数名称的方式，画出每个函数。abs函数值接受一个叫作number的参数，向它提供更多或更少的参数会产生错误。print函数可以接受任意数量的参数，所以它渲染为print(...)。函数的可接受参数的描述叫做函数的签名。

# 1.3 定义新的函数

我们已经在 Python 中认识了一些在任何强大的编程语言中都会出现的元素：
数值是内建数据，算数运算是函数。
嵌套函数提供了组合操作的手段。
名称到值的绑定提供了有限的抽象手段。
现在我们将要了解函数定义，一个更加强大的抽象技巧，名称通过它可以绑定到复合操作上，并可以作为一个单元来引用。
我们通过如何表达“平方”这个概念来开始。我们可能会说，“对一个数求平方就是将这个数乘上它自己”。在 Python 中就是：

In [0]:
 def square(x):
        return mul(x, x)

这定义了一个新的函数，并赋予了名称square。这个用户定义的函数并不内建于解释器。它表示将一个数乘上自己的复合操作。定义中的x叫做形式参数，它为被乘的东西提供一个名称。这个定义创建了用户定义的函数，并且将它关联到名称square上。
函数定义包含def语句，它标明了<name>（名称）和一列带有名字的<formal parameters>（形式参数）。之后，return（返回）语句叫做函数体，指定了函数的<return expression>（返回表达式），它是函数无论什么时候调用都需要求值的表达式。
def <name>(<formal parameters>):
    return <return expression>
第二行必须缩进！按照惯例我们应该缩进四个空格，而不是一个Tab，返回表达式并不是立即求值，它储存为新定义函数的一部分，并且只在函数最终调用时会被求出。（很快我们就会看到缩进区域可以跨越多行。）
定义了square之后，我们使用调用表达式来调用它：

In [0]:
 square(21)
441

In [0]:
 square(add(2, 5))
49

In [0]:
 square(square(3))
81

我们也可以在构建其它函数时，将square用作构建块。列入，我们可以轻易定义sum_squares函数，它接受两个数值作为参数，并返回它们的平方和：

In [0]:
 def sum_squares(x, y):
        return add(square(x), square(y))

In [0]:
 sum_squares(3, 4)
25

用户定义的函数和内建函数以同种方法使用。确实，我们不可能在sum_squares的定义中分辨出square是否构建于解释器中，从模块导入还是由用户定义。

## 1.3.1 环境
我们的 Python 子集已经足够复杂了，但程序的含义还不是非常明显。如果形式参数和内建函数具有相同名称会如何呢？两个函数是否能共享名称而不会产生混乱呢？为了解决这些疑问，我们必须详细描述环境。
表达式求值所在的环境由帧的序列组成，它们可以表述为一些盒子。每一帧都包含了一些绑定，它们将名称和对应的值关联起来。全局帧只有一个，它包含所有内建函数的名称绑定（只展示了abs和max）。我们使用地球符号来表示全局。

赋值和导入语句会向当前环境的第一个帧添加条目。到目前为止，我们的环境只包含全局帧。

In [0]:
 from math import pi
 tau = 2 * pi

def语句也将绑定绑定到由定义创建的函数上。定义square之后的环境如图所示：

这些环境图示展示了当前环境中的绑定，以及它们所绑定的值（并不是任何帧的一部分）。要注意函数名称是重复的，一个在帧中，另一个是函数的一部分。这一重复是有意的，许多不同的名字可能会引用相同函数，但是函数本身只有一个内在名称。但是，在环境中由名称检索值只检查名称绑定。函数的内在名称不在名称检索中起作用。在我们之前看到的例子中：

In [0]:
 f = max
 f
<built-in function max>

名称max是函数的内在名称，以及打印f时我们看到的名称。此外，名称max和f在全局环境中都绑定到了相同函数上。
在我们介绍 Python 的附加特性时，我们需要扩展这些图示。每次我们这样做的时候，我们都会列出图示可以表达的新特性。
**新的环境特性：**赋值和用户定义的函数定义。

## 1.3.2 调用用户定义的函数
为了求出运算符为用户定义函数的调用表达式，Python 解释器遵循与求出运算符为内建函数的表达式相似的过程。也就是说，解释器求出操作数表达式，并且对产生的实参调用具名函数。
调用用户定义的函数的行为引入了第二个局部帧，它只能由函数来访问。为了对一些实参调用用户定义的函数：
在新的局部帧中，将实参绑定到函数的形式参数上。
在当前帧的开头以及全局帧的末尾求出函数体。
函数体求值所在的环境由两个帧组成：第一个是局部帧，包含参数绑定，之后是全局帧，包含其它所有东西。每个函数示例都有自己的独立局部帧。

这张图包含两个不同的 Python 解释器层面：当前的环境，以及表达式树的一部分，它和要求值的代码的当前一行相关。我们描述了调用表达式的求值，用户定义的函数（蓝色）表示为两部分的圆角矩形。点线箭头表示哪个环境用于在每个部分求解表达式。
上半部分展示了调用表达式的求值。这个调用表达式并不在任何函数里面，所以他在全局环境中求值。所以，任何里面的名称（例如square）都会在全局帧中检索。
下半部分展示了square函数的函数体。它的返回表达式在上面的步骤1引入的新环境中求值，它将square的形式参数x的名称绑定到实参的值-2上。
环境中帧的顺序会影响由表达式中的名称检索返回的值。我们之前说名称求解为当前环境中与这个名称关联的值。我们现在可以更精确一些：
名称求解为当前环境中，最先发现该名称的帧中，绑定到这个名称的值。
我们关于环境、名称和函数的概念框架建立了求值模型，虽然一些机制的细节仍旧没有指明（例如绑定如何实现），我们的模型在描述解释器如何求解调用表示上，变得更准确和正确。在第三章我们会看到这一模型如何用作一个蓝图来实现编程语言的可工作的解释器。
**新的环境特性：**函数调用。

## 1.3.3 示例：调用用户定义的函数
让我们再一次考虑两个简单的定义：

In [0]:
 from operator import add, mul
 def square(x):
        return mul(x, x)
 def sum_squares(x, y):
        return add(square(x), square(y))

以及求解下列调用表达式的过程：

In [0]:
 sum_squares(5, 12)
169
Python 首先会求出名称sum_squares，它在全局帧绑定了用户定义的函数。基本的数字表达式 5 和 12 求值为它们所表达的数值。
之后，Python 调用了sum_squares，它引入了局部帧，将x绑定为 5，将y绑定为 12。

这张图中，局部帧指向它的后继，全局帧。所有局部帧必须指向某个先导，这些链接定义了当前环境中的帧序列。
sum_square的函数体包含下列调用表达式：
   add     (  square(x)  ,  square(y)  )
 ________     _________     _________
"operator"   "operand 0"   "operand 1"
全部三个子表达式在当前环境中求值，它开始于标记为sum_squares的帧。运算符字表达式add是全局帧中发现的名称，绑定到了内建的加法函数上。两个操作数子表达式必须在加法函数调用之前依次求值。两个操作数都在当前环境中求值，开始于标记为sum_squares的帧。在下面的环境图示中，我们把这一帧叫做A，并且将指向这一帧的箭头同时替换为标签A。
在使用这个局部帧的情况下，函数体表达式mul(x, x)求值为 25。
我们的求值过程现在轮到了操作数 1，y的值为 12。Python 再次求出square的函数体。这次引入了另一个局部环境帧，将x绑定为 12。所以，操作数 1 求值为 144。

最后，对实参 25 和 144 调用加法会产生sum_squares函数体的最终值：169。
这张图虽然复杂，但是用于展示我们目前为止发展出的许多基础概念。名称绑定到值上面，它延伸到许多局部帧中，局部帧在唯一的全局帧之上，全局帧包含共享名称。表达式为树形结构，以及每次子表达式包含用户定义函数的调用时，环境必须被扩展。
所有这些机制的存在确保了名称在表达式中正确的地方解析为正确的值。这个例子展示了为什么我们的模型需要所引入的复杂性。所有三个局部帧都包含名称x的绑定。但是这个名称在不同的帧中绑定到了不同的值上。局部帧分离了这些名称。

## 1.3.4 局部名称
函数实现的细节之一是实现者对形式参数名称的选择不应影响函数行为。所以，下面的函数应具有相同的行为：

In [0]:
 def square(x):
        return mul(x, x)
 def square(y):
        return mul(y, y)

这个原则 -- 也就是函数应不依赖于编写者选择的参数名称 -- 对编程语言来说具有重要的结果。最简单的结果就是函数参数名称应保留在函数体的局部范围中。
如果参数不位于相应函数的局部范围中，square的参数x可能和sum_squares中的参数x产生混乱。严格来说，这并不是问题所在：不同局部帧中的x的绑定是不相关的。我们的计算模型具有严谨的设计来确保这种独立性。
我们说局部名称的作用域被限制在定义它的用户定义函数的函数体中。当一个名称不能再被访问时，它就离开了作用域。作用域的行为并不是我们模型的新事实，它是环境的工作方式的结果。

## 1.3.5 实践指南：选择名称
可修改的名称并不代表形式参数的名称完全不重要。反之，选择良好的函数和参数名称对于函数定义的人类可解释性是必要的。
下面的准则派生于 Python 的代码风格指南，可被所有（非反叛）Python 程序员作为指南。一些共享的约定会使社区成员之间的沟通变得容易。遵循这些约定有一些副作用，我会发现你的代码在内部变得一致。
函数名称应该小写，以下划线分隔。提倡描述性的名称。
函数名称通常反映解释器向参数应用的操作（例如print、add、square），或者结果（例如max、abs、sum）。
参数名称应小写，以下划线分隔。提倡单个词的名称。
参数名称应该反映参数在函数中的作用，并不仅仅是满足的值的类型。
当作用非常明确时，单个字母的参数名称可以接受，但是永远不要使用l（小写的L）和O（大写的o），或者I（大写的i）来避免和数字混淆。
周期性对你编写的程序复查这些准则，不用多久你的名称会变得十分 Python 化。

## 1.3.6 作为抽象的函数
虽然sum_squares十分简单，但是它演示了用户定义函数的最强大的特性。sum_squares函数使用square函数定义，但是仅仅依赖于square定义在输入参数和输出值之间的关系。
我们可以编写sum_squares，而不用考虑如何计算一个数值的平方。平方计算的细节被隐藏了，并可以在之后考虑。确实，在sum_squares看来，square并不是一个特定的函数体，而是某个函数的抽象，也就是所谓的函数式抽象。在这个层级的抽象中，任何能计算平方的函数都是等价的。
所以，仅仅考虑返回值的情况下，下面两个计算平方的函数是难以区分的。每个都接受数值参数并且产生那个数的平方作为返回值。

In [0]:
 def square(x):
        return mul(x, x)
 def square(x):
        return mul(x, x-1) + x

换句话说，函数定义应该能够隐藏细节。函数的用户可能不能自己编写函数，但是可以从其它程序员那里获得它作为“黑盒”。用户不应该需要知道如何实现来调用。Python 库拥有这个特性。许多开发者使用在这里定义的函数，但是很少有人看过它们的实现。实际上，许多 Python 库的实现并不完全用 Python 编写，而是 C 语言。

## 1.3.7 运算符
算术运算符（例如+和-）在我们的第一个例子中提供了组合手段。但是我们还需要为包含这些运算符的表达式定义求值过程。
每个带有中缀运算符的 Python 表达式都有自己的求值过程，但是你通常可以认为他们是调用表达式的快捷方式。当你看到

In [0]:
2 + 3

的时候，可以简单认为它是

的快捷方式。
中缀记号可以嵌套，就像调用表达式那样。Python 运算符优先级中采用了常规的数学规则，它指导了如何解释带有多种运算符的复合表达式。

In [0]:
 2 + 3 * 4 + 5
19

In [0]:
和下面的表达式的求值结果相同
 add(add(2, mul(3, 4)) , 5)
19

In [0]:
调用表达式的嵌套比运算符版本更加明显。Python 也允许括号括起来的子表达式，来覆盖通常的优先级规则，或者使表达式的嵌套结构更加明显：
 (2 + 3) * (4 + 5)
45

和下面的表达式的求值结果相同

In [0]:
 mul(add(2, 3), add(4, 5))
45

你应该在你的程序中自由使用这些运算符和括号。对于简单的算术运算，Python 在惯例上倾向于运算符而不是调用表达式。

# 1.4 实践指南：函数的艺术

函数是所有程序的要素，无论规模大小，并且在编程语言中作为我们表达计算过程的主要媒介。目前为止，我们讨论了函数的形式特性，以及它们如何使用。我们现在跳转到如何编写良好的函数这一话题。
每个函数都应该只做一个任务。这个任务可以使用短小的名称来定义，使用一行文本来标识。顺序执行多个任务的函数应该拆分在多个函数中。
不要重复劳动（DRY）是软件工程的中心法则。所谓的DRY原则规定多个代码段不应该描述重复的逻辑。反之，逻辑应该只实现一次，指定一个名称，并且多次使用。如果你发现自己在复制粘贴一段代码，你可能发现了一个使用函数抽象的机会。
函数应该定义得通常一些，准确来说，平方并不是在 Python 库中，因为它是pow函数的一个特例，这个函数计算任何数的任何次方。
这些准则提升代码的可读性，减少错误数量，并且通常使编写的代码总数最小。将复杂的任务拆分为简洁的函数是一个技巧，它需要一些经验来掌握。幸运的是，Python 提供了一些特性来支持你的努力。

## 1.4.1 文档字符串
函数定义通常包含描述这个函数的文档，叫做文档字符串，它必须在函数体中缩进。文档字符串通常使用三个引号。第一行描述函数的任务。随后的一些行描述参数，并且澄清函数的行为：

In [0]:
def pressure(v, t, n):
        """Compute the pressure in pascals of an ideal gas.

        Applies the ideal gas law: http://en.wikipedia.org/wiki/Ideal_gas_law

        v -- volume of gas, in cubic meters
        t -- absolute temperature in degrees kelvin
        n -- particles of gas
        """
        k = 1.38e-23  # Boltzmann's constant
        return n * k * t / v

当你以函数名称作为参数来调用help时，你会看到它的文档字符串（按下q来退出 Python 帮助）。

In [0]:
 help(pressure)

编写 Python 程序时，除了最简单的函数之外，都要包含文档字符串。要记住，代码只编写一次，但是会阅读多次。Python 文档包含了文档字符串准则，它在不同的 Python 项目中保持一致。

## 1.4.2 参数默认值
定义普通函数的结果之一就是额外参数的引入。具有许多参数的函数调用起来非常麻烦，也难以阅读。
在 Python 中，我们可以为函数的参数提供默认值。调用这个函数时，带有默认值的参数是可选的。如果它们没有提供，默认值就会绑定到形式参数的名称上。例如，如果某个应用通常用来计算一摩尔粒子的压强，这个值就可以设为默认：

In [0]:
 k_b=1.38e-23  # Boltzmann's constant
 def pressure(v, t, n=6.022e23):
        """Compute the pressure in pascals of an ideal gas.

        v -- volume of gas, in cubic meters
        t -- absolute temperature in degrees kelvin
        n -- particles of gas (default: one mole)
        """
        return n * k_b * t / v
 pressure(1, 273.15)
2269.974834

这里，pressure的定义接受三个参数，但是在调用表达式中只提供了两个。这种情况下，n的值通过def语句的默认值获得（它看起来像对n的赋值，虽然就像这个讨论暗示的那样，更大程度上它是条件赋值）。
作为准则，用于函数体的大多数数据值应该表示为具名参数的默认值，这样便于查看，以及被函数调用者修改。一些值永远不会改变，就像基本常数k_b，应该定义在全局帧中。

# 1.5 控制
我们现在可以定义的函数能力有限，因为我们还不知道一种方法来进行测试，并且根据测试结果来执行不同的操作。控制语句可以让我们完成这件事。它们不像严格的求值子表达式那样从左向右编写，并且可以从它们控制解释器下一步做什么当中得到它们的名称。这可能基于表达式的值。

## 1.5.1 语句
目前为止，我们已经初步思考了如何求出表达式。然而，我们已经看到了三种语句：赋值、def和return语句。这些 Python 代码并不是表达式，虽然它们中的一部分是表达式。
要强调的是，语句的值是不相干的（或不存在的），我们使用执行而不是求值来描述语句。 每个语句都描述了对解释器状态的一些改变，执行语句会应用这些改变。像我们之前看到的return和赋值语句那样，语句的执行涉及到求解所包含的子表达式。
表达式也可以作为语句执行，其中它们会被求值，但是它们的值会舍弃。执行纯函数没有什么副作用，但是执行非纯函数会产生效果作为函数调用的结果。
考虑下面这个例子：

In [0]:
 def square(x):
        mul(x, x) # Watch out! This call doesn't return a value.

这是有效的 Python 代码，但是并不是想表达的意思。函数体由表达式组成。表达式本身是个有效的语句，但是语句的效果是，mul函数被调用了，然后结果被舍弃了。如果你希望对表达式的结果做一些事情，你需要这样做：使用赋值语句来储存它，或者使用return语句将它返回：

In [0]:
 def square(x):
        return mul(x, x)

有时编写一个函数体是表达式的函数是有意义的，例如调用类似print的非纯函数：

In [0]:
 def print_square(x):
        print(square(x))

在最高层级上，Python 解释器的工作就是执行由语句组成的程序。但是，许多有意思的计算工作来源于求解表达式。语句管理程序中不同表达式之间的关系，以及它们的结果会怎么样。

## 1.5.2 复合语句
通常，Python 的代码是语句的序列。一条简单的语句是一行不以分号结束的代码。复合语句之所以这么命名，因为它是其它（简单或复合）语句的复合。复合语句一般占据多行，并且以一行以冒号结尾的头部开始，它标识了语句的类型。同时，一个头部和一组缩进的代码叫做子句（或从句）。复合语句由一个或多个子句组成。
<header>:
    <statement>
    <statement>
    ...
<separating header>:
    <statement>
    <statement>
    ...
...
我们可以这样理解我们已经见到的语句：
表达式、返回语句和赋值语句都是简单语句。
def语句是复合语句。def头部之后的组定义了函数体。
为每种头部特化的求值规则指导了组内的语句什么时候以及是否会被执行。我们说头部控制语句组。例如，在def语句的例子中，我们看到返回表达式并不会立即求值，而是储存起来用于以后的使用，当所定义的函数最终调用时就会求值。
我们现在也能理解多行的程序了。
执行语句序列需要执行第一条语句。如果这个语句不是重定向控制，之后执行语句序列的剩余部分，如果存在的话。
这个定义揭示出递归定义“序列”的基本结构：一个序列可以划分为它的第一个元素和其余元素。语句序列的“剩余”部分也是一个语句序列。所以我们可以递归应用这个执行规则。这个序列作为递归数据结构的看法会在随后的章节中再次出现。
这一规则的重要结果就是语句顺序执行，但是随后的语句可能永远不会执行到，因为有重定向控制。
**实践指南：**在缩进代码组时，所有行必须以相同数量以及相同方式缩进（空格而不是Tab）。任何缩进的变动都会导致错误。

## 1.5.3 定义函数 II：局部赋值
一开始我们说，用户定义函数的函数体只由带有一个返回表达式的一个返回语句组成。实际上，函数可以定义为操作的序列，不仅仅是一条表达式。Python 复合语句的结构自然让我们将函数体的概念扩展为多个语句。
无论用户定义的函数何时被调用，定义中的子句序列在局部环境内执行。return语句会重定向控制：无论什么时候执行return语句，函数调用的流程都会中止，返回表达式的值会作为被调用函数的返回值。
于是，赋值语句现在可以出现在函数体中。例如，这个函数以第一个数的百分数形式，返回两个数量的绝对值，并使用了两步运算：

In [0]:
 def percent_difference(x, y):
        difference = abs(x-y)
        return 100 * difference / x
 percent_difference(40, 50)
25.0

赋值语句的效果是在当前环境的第一个帧上，将名字绑定到值上。于是，函数体内的赋值语句不会影响全局帧。函数只能操作局部作用域的现象是创建模块化程序的关键，其中纯函数只通过它们接受和返回的值与外界交互。
当然，percent_difference函数也可以写成一个表达式，就像下面这样，但是返回表达式会更加复杂：

In [0]:
 def percent_difference(x, y):
        return 100 * abs(x-y) / x

目前为止，局部赋值并不会增加函数定义的表现力。当它和控制语句组合时，才会这样。此外，局部赋值也可以将名称赋为间接量，在理清复杂表达式的含义时起到关键作用。
**新的环境特性：**局部赋值。

## 1.5.4 条件语句
Python 拥有内建的绝对值函数：

In [0]:
 abs(-2)
2

我们希望自己能够实现这个函数，但是我们当前不能直接定义函数来执行测试并做出选择。我们希望表达出，如果x是正的，abs(x)返回x，如果x是 0，abx(x)返回 0，否则abs(x)返回-x。Python 中，我们可以使用条件语句来表达这种选择。

In [0]:
 def absolute_value(x):
        """Compute abs(x)."""
        if x > 0:
            return x
        elif x == 0:
            return 0
        else:
            return -x
            
 absolute_value(-2) == abs(-2)
True

absolute_value的实现展示了一些重要的事情：
**条件语句。**Python 中的条件语句包含一系列的头部和语句组：一个必要的if子句，可选的elif子句序列，和最后可选的else子句：
if <expression>:
    <suite>
elif <expression>:
    <suite>
else:
    <suite>
当执行条件语句时，每个子句都按顺序处理：
求出头部中的表达式。
如果它为真，执行语句组。之后，跳过条件语句中随后的所有子句。
如果能到达else子句（仅当所有if和elif表达式值为假时），它的语句组才会被执行。
**布尔上下文。**上面过程的执行提到了“假值”和“真值”。条件块头部语句中的表达式也叫作布尔上下文：它们值的真假对控制流很重要，但在另一方面，它们的值永远不会被赋值或返回。Python 包含了多种假值，包括 0、None和布尔值False。所有其他数值都是真值。在第二章中，我们就会看到每个 Python 中的原始数据类型都是真值或假值。
**布尔值。**Python 有两种布尔值，叫做True和False。布尔值表示了逻辑表达式中的真值。内建的比较运算符，>、<、>=、<=、==、!=，返回这些值。

In [0]:
 4 < 2
False
 5 >= 5
True
第二个例子读作“5 大于等于 5”，对应operator模块中的函数ge。
 0 == -0
True

最后的例子读作“0 等于 -0”，对应operator模块的eq函数。要注意 Python 区分赋值（=）和相等测试（==）。许多语言中都有这个惯例。
**布尔运算符。**Python 也内建了三个基本的逻辑运算符：

In [0]:
 True and False
False
 True or False
True
 not False
True

逻辑表达式拥有对应的求值过程。这些过程揭示了逻辑表达式的真值有时可以不执行全部子表达式而确定，这个特性叫做短路。
为了求出表达式<left> and <right>：
求出子表达式<left>。
如果结果v是假值，那么表达式求值为v。
否则表达式的值为子表达式<right>。
为了求出表达式<left> or <right>：
求出子表达式<left>。
如果结果v是真值，那么表达式求值为v。
否则表达式的值为子表达式<right>。
为了求出表达式not <exp>：
求出<exp>，如果值是True那么返回值是假值，如果为False则反之。
这些值、规则和运算符向我们提供了一种组合测试结果的方式。执行测试以及返回布尔值的函数通常以is开头，并不带下划线（例如isfinite、isdigit、isinstance等等）。

## 1.5.5 迭代
除了选择要执行的语句，控制语句还用于表达重复操作。如果我们编写的每一行代码都只执行一次，程序会变得非常没有生产力。只有通过语句的重复执行，我们才可以释放计算机的潜力，使我们更加强大。我们已经看到了重复的一种形式：一个函数可以多次调用，虽然它只定义一次。迭代控制结构是另一种将相同语句执行多次的机制。
考虑斐波那契数列，其中每个数值都是前两个的和：
0, 1, 1, 2, 3, 5, 8, 13, 21, ...
每个值都通过重复使用“前两个值的和”的规则构造。为了构造第 n 个值，我们需要跟踪我们创建了多少个值（k），以及第 k 个值（curr）和它的上一个值（pred），像这样：

In [0]:
 def fib(n):
        """Compute the nth Fibonacci number, for n >= 2."""
        pred, curr = 0, 1   # Fibonacci numbers
        k = 2               # Position of curr in the sequence
        while k < n:
            pred, curr = curr, pred + curr  # Re-bind pred and curr
            k = k + 1                       # Re-bind k
        return curr
 fib(8)
13

要记住逗号在赋值语句中分隔了多个名称和值。这一行：
pred, curr = curr, pred + curr
具有将curr的值重新绑定到名称pred上，以及将pred + curr的值重新绑定到curr上的效果。所有=右边的表达式会在绑定发生之前求出来。
while子句包含一个头部表达式，之后是语句组：
while <expression>:
    <suite>
为了执行while子句：
求出头部表达式。
如果它为真，执行语句组，之后返回到步骤 1。
在步骤 2 中，整个while子句的语句组在头部表达式再次求值之前被执行。
为了防止while子句的语句组无限执行，它应该总是在每次通过时修改环境的状态。
不终止的while语句叫做无限循环。按下<Control>-C可以强制让 Python 停止循环。

## 1.5.6 实践指南：测试
函数的测试是验证函数的行为是否符合预期的操作。我们的函数现在已经足够复杂了，我们需要开始测试我们的实现。
测试是系统化执行这个验证的机制。测试通常写为另一个函数，这个函数包含一个或多个被测函数的样例调用。返回值之后会和预期结果进行比对。不像大多数通用的函数，测试涉及到挑选特殊的参数值，并使用它来验证调用。测试也可作为文档：它们展示了如何调用函数，以及什么参数值是合理的。
要注意我们也将“测试”这个词用于if或while语句的头部中作为一种技术术语。当我们将“测试”这个词用作表达式，或者用作一种验证机制时，它应该在语境中十分明显。
**断言。**程序员使用assert语句来验证预期，例如测试函数的输出。assert语句在布尔上下文中只有一个表达式，后面是带引号的一行文本（单引号或双引号都可以，但是要一致）如果表达式求值为假，它就会显示。

In [0]:
 assert fib(8) == 13, 'The 8th Fibonacci number should be 13'

当被断言的表达式求值为真时，断言语句的执行没有任何效果。当它是假时，asset会造成执行中断。
为fib编写的test函数测试了几个参数，包含n的极限值：

In [0]:
 def fib_test():
        assert fib(2) == 1, 'The 2nd Fibonacci number should be 1'
        assert fib(3) == 1, 'The 3nd Fibonacci number should be 1'
        assert fib(50) == 7778742049, 'Error at the 50th Fibonacci number'

在文件中而不是直接在解释器中编写 Python 时，测试可以写在同一个文件，或者后缀为_test.py的相邻文件中。
**Doctest。**Python 提供了一个便利的方法，将简单的测试直接写到函数的文档字符串内。文档字符串的第一行应该包含单行的函数描述，后面是一个空行。参数和行为的详细描述可以跟随在后面。此外，文档字符串可以包含调用该函数的简单交互式会话：

In [0]:
 def sum_naturals(n):
        """Return the sum of the first n natural numbers

         sum_naturals(10)
        55
         sum_naturals(100)
        5050
        """
        total, k = 0, 1
        while k <= n:
          total, k = total + k, k + 1
        return total

之后，可以使用 doctest 模块来验证交互。下面的globals函数返回全局变量的表示，解释器需要它来求解表达式。

In [0]:
 from doctest import run_docstring_examples

In [0]:
 run_docstring_examples(sum_naturals, globals())

在文件中编写 Python 时，可以通过以下面的命令行选项启动 Python 来运行一个文档中的所有 doctest。
python3 -m doctest <python_source_file>
高效测试的关键是在实现新的函数之后（甚至是之前）立即编写（以及执行）测试。只调用一个函数的测试叫做单元测试。详尽的单元测试是良好程序设计的标志。

# 1.6 高阶函数
来源：1.6 Higher-Order Functions
译者：飞龙
协议：CC BY-NC-SA 4.0
我们已经看到，函数实际上是描述复合操作的抽象，这些操作不依赖于它们的参数值。在square中，

In [0]:
 def square(x):
        return x * x

我们不会谈论特定数值的平方，而是一个获得任何数值平方的方法。当然，我们可以不定义这个函数来使用它，通过始终编写这样的表达式：

In [0]:
 3 * 3
9
 5 * 5
25

并且永远不会显式提及square。这种实践适合类似square的简单操作。但是对于更加复杂的操作会变得困难。通常，缺少函数定义会对我们非常不利，它会强迫我们始终工作在特定操作的层级上，这在语言中非常原始（这个例子中是乘法），而不是高级操作。我们应该从强大的编程语言索取的东西之一，是通过将名称赋为常用模式来构建抽象的能力，以及之后直接使用抽象的能力。函数提供了这种能力。
我们将会在下个例子中看到，代码中会反复出现一些常见的编程模式，但是使用一些不同函数来实现。这些模式也可以被抽象和给予名称。
为了将特定的通用模式表达为具名概念，我们需要构造可以接受其他函数作为参数的函数，或者将函数作为返回值的函数。操作函数的函数叫做高阶函数。这一节展示了高阶函数可用作强大的抽象机制，极大提升语言的表现力。

## 1.6.1 作为参数的函数
考虑下面三个函数，它们都计算总和。第一个，sum_naturals，计算截至n的自然数的和：

In [0]:
 def sum_naturals(n):
        total, k = 0, 1
        while k <= n:
            total, k = total + k, k + 1
        return total
 sum_naturals(100)
5050

第二个，sum_cubes，计算截至n的自然数的立方和：

In [0]:
 def sum_cubes(n):
        total, k = 0, 1
        while k <= n:
            total, k = total + pow(k, 3), k + 1
        return total
 sum_cubes(100)
25502500

第三个，计算这个级数中式子的和：

它会慢慢收敛于pi。

In [0]:
 def pi_sum(n):
        total, k = 0, 1
        while k <= n:
            total, k = total + 8 / (k * (k + 2)), k + 4
        return total
 pi_sum(100)

3.121594652591009
这三个函数在背后都具有相同模式。它们大部分相同，只是名字、用于计算被加项的k的函数，以及提供k的下一个值的函数不同。我们可以通过向相同的模板中填充槽位来生成每个函数：
def <name>(n):
    total, k = 0, 1
    while k <= n:
        total, k = total + <term>(k), <next>(k)
    return total
这个通用模板的出现是一个强有力的证据，证明有一个实用抽象正在等着我们表现出来。这些函数的每一个都是式子的求和。作为程序的设计者，我们希望我们的语言足够强大，便于我们编写函数来自我表达求和的概念，而不仅仅是计算特定和的函数。我们可以在 Python 中使用上面展示的通用模板，并且把槽位变成形式参数来轻易完成它。

In [0]:
 def summation(n, term, next):
        total, k = 0, 1
        while k <= n:
            total, k = total + term(k), next(k)
        return total

要注意summation接受上界n，以及函数term和next作为参数。我们可以像任何函数那样使用summation，它简洁地表达了求和。

In [0]:
 def cube(k):
        return pow(k, 3)
 def successor(k):
        return k + 1
 def sum_cubes(n):
        return summation(n, cube, successor)
 sum_cubes(3)
36

使用identity 函数来返回参数自己，我们就可以对整数求和：

In [0]:
 def identity(k):
        return k
 def sum_naturals(n):
        return summation(n, identity, successor)
 sum_naturals(10)
55

我们也可以逐步定义pi_sum，使用我们的summation抽象来组合组件。

In [0]:
 def pi_term(k):
        denominator = k * (k + 2)
        return 8 / denominator
 def pi_next(k):
        return k + 4
 def pi_sum(n):
        return summation(n, pi_term, pi_next)
 pi_sum(1e6)
3.1415906535898936

## 1.6.2 作为一般方法的函数
我们引入的用户定义函数作为一种数值运算的抽象模式，便于使它们独立于涉及到的特定数值。使用高阶函数，我们开始寻找更强大的抽象类型：一些函数表达了计算的一般方法，独立于它们调用的特定函数。
尽管函数的意义在概念上扩展了，我们对于如何求解调用表达式的环境模型也优雅地延伸到了高阶函数，没有任何改变。当一个用户定义函数以一些实参调用时，形式参数会在最新的局部帧中绑定实参的值（它们可能是函数）。
考虑下面的例子，它实现了迭代改进的一般方法，并且可以用于计算黄金比例。迭代改进算法以一个方程的解的guess（推测值）开始。它重复调用update函数来改进这个推测值，并且调用test来检查是否当前的guess“足够接近”所认为的正确值。

In [0]:
 def iter_improve(update, test, guess=1):
        while not test(guess):
            guess = update(guess)
        return guess

test函数通常检查两个函数f和g在guess值上是否彼此接近。测试f(x)是否接近于g(x)也是计算的一般方法。

In [0]:
 def near(x, f, g):
        return approx_eq(f(x), g(x))

程序中测试相似性的一个常见方式是将数值差的绝对值与一个微小的公差值相比：

In [0]:
 def approx_eq(x, y, tolerance=1e-5):
        return abs(x - y) < tolerance

黄金比例，通常叫做phi，是经常出现在自然、艺术、和建筑中的数值。它可以通过iter_improve使用golden_update来计算，并且在它的后继等于它的平方时收敛。

In [0]:
 def golden_update(guess):
        return 1/guess + 1
 def golden_test(guess):
        return near(guess, square, successor)

这里，我们已经向全局帧添加了多个绑定。函数值的描述为了简短而有所删节：

使用golden_update和golden_test参数来调用iter_improve会计算出黄金比例的近似值。

In [0]:
 iter_improve(golden_update, golden_test)
1.6180371352785146

通过跟踪我们的求值过程的步骤，我们就可以观察结果如何计算。首先，iter_improve的局部帧以update、test和guess构建。在iter_improve的函数体中，名称test绑定到golden_test上，它在初始值guess上调用。之后，golden_test调用near，创建第三个局部帧，它将形式参数f和g绑定到square和successor上。

完成near的求值之后，我们看到golden_test为False，因为 1 并不非常接近于 2。所以，while子句代码组内的求值过程，以及这个机制的过程会重复多次。
这个扩展后的例子展示了计算机科学中两个相关的重要概念。首先，命名和函数允许我们抽象而远离大量的复杂性。当每个函数定义不重要时，由求值过程触发的计算过程是相当复杂的，并且我们甚至不能展示所有东西。其次，基于事实，我们拥有了非常通用的求值过程，小的组件组合在复杂的过程中。理解这个过程便于我们验证和检查我们创建的程序。
像通常一样，我们的新的一般方法iter_improve需要测试来检查正确性。黄金比例可以提供这样一个测试，因为它也有一个闭式解，我们可以将它与迭代结果进行比较。

In [0]:
 phi = 1/2 + pow(5, 1/2)/2
 def near_test():
        assert near(phi, square, successor), 'phi * phi is not near phi + 1'
 def iter_improve_test():
        approx_phi = iter_improve(golden_update, golden_test)
        assert approx_eq(phi, approx_phi), 'phi differs from its approximation'

**新的环境特性：**高阶函数。
**附加部分：**我们在测试的证明中遗漏了一步。求出公差值e的范围，使得如果tolerance为e的near(x, square, successor)值为真，那么使用相同公差值的approx_eq(phi, x)值为真。

## 1.6.3 定义函数 III：嵌套定义
上面的例子演示了将函数作为参数传递的能力如何提高了编程语言的表现力。每个通用的概念或方程都能映射为自己的小型函数，这一方式的一个负面效果是全局帧会被小型函数弄乱。另一个问题是我们限制于特定函数的签名：iter_improve 的update参数必须只接受一个参数。Python 中，嵌套函数的定义解决了这些问题，但是需要我们重新修改我们的模型。
让我们考虑一个新问题：计算一个数的平方根。重复调用下面的更新操作会收敛于x的平方根：

In [0]:
 def average(x, y):
        return (x + y)/2
 def sqrt_update(guess, x):
        return average(guess, x/guess)

这个带有两个参数的更新函数和iter_improve不兼容，并且它只提供了一个介值。我们实际上只关心最后的平方根。这些问题的解决方案是把函数放到其他定义的函数体中。

In [0]:
 def square_root(x):
        def update(guess):
            return average(guess, x/guess)
        def test(guess):
            return approx_eq(square(guess), x)
        return iter_improve(update, test)

就像局部赋值，局部的def语句仅仅影响当前的局部帧。这些函数仅仅当square_root求值时在作用域内。和求值过程一致，局部的def语句在square_root调用之前并不会求值。
**词法作用域。**局部定义的函数也可以访问它们定义所在作用域的名称绑定。这个例子中，update引用了名称x，它是外层函数square_root的一个形参。这种在嵌套函数中共享名称的规则叫做词法作用域。严格来说，内部函数能够访问定义所在环境（而不是调用所在位置）的名称。
我们需要两个对我们环境的扩展来兼容词法作用域。
每个用户定义的函数都有一个关联环境：它的定义所在的环境。
当一个用户定义的函数调用时，它的局部帧扩展于函数所关联的环境。
回到square_root，所有函数都在全局环境中定义，所以它们都关联到全局环境，当我们求解square_root的前两个子句时，我们创建了关联到局部环境的函数。在

In [0]:
 square_root(256)
16.00000000000039

的调用中，环境首先添加了square_root的局部帧，并且求出def语句update和test（只展示了update）：

随后，update的名称解析到这个新定义的函数上，它是向iter_improve传入的参数。在iter_improve的函数体中，我们必须以初始值 1 调用update函数。最后的这个调用以一开始只含有g的局部帧创建了update的环境，但是之前的square_root帧上仍旧含有x的绑定。

这个求值过程中，最重要的部分是函数所关联的环境变成了局部帧，它是函数求值的地方。这个改变在图中以蓝色箭头高亮。
以这种方式，update的函数体能够解析名称x。所以我们意识到了词法作用域的两个关键优势。
局部函数的名称并不影响定义所在函数外部的名称，因为局部函数的名称绑定到了定义处的当前局部环境中，而不是全局环境。
局部函数可以访问外层函数的环境。这是因为局部函数的函数体的求值环境扩展于定义处的求值环境。
update函数自带了一些数据：也就是在定义处环境中的数据。因为它以这种方式封装信息，局部定义的函数通常叫做闭包。
**新的环境特性：**局部函数定义。

## 1.6.4 作为返回值的函数
我们的程序可以通过创建返回值是它们本身的函数，获得更高的表现力。带有词法作用域的编程语言的一个重要特性就是，局部定义函数在它们返回时仍旧持有所关联的环境。下面的例子展示了这一特性的作用。
在定义了许多简单函数之后，composition是包含在我们的编程语言中的自然组合法。也就是说，提供两个函数f(x)和g(x)，我们可能希望定义h(x) = f(g(x))。我们可以使用现有工具来定义复合函数：

In [0]:
 def compose1(f, g):
        def h(x):
            return f(g(x))
        return h
 add_one_and_square = compose1(square, successor)
 add_one_and_square(12)
169

compose1中的1表明复合函数和返回值都只接受一个参数。这种命名惯例并不由解释器强制，1只是函数名称的一部分。
这里，我们开始观察我们在计算的复杂模型中投入的回报。我们的环境模型不需要任何修改就能支持以这种方式返回函数的能力。

## 1.6.5 Lambda 表达式
目前为止，每次我们打算定义新的函数时，我们都会给它一个名称。但是对于其它类型的表达式，我们不需要将一个间接产物关联到名称上。也就是说，我们可以计算a*b + c*d，而不需要给子表达式a*b或c*d，或者整个表达式来命名。Python 中，我们可以使用 Lambda 表达式凭空创建函数，它会求值为匿名函数。Lambda 表达式是函数体具有单个返回表达式的函数，不允许出现赋值和控制语句。
Lambda 表达式十分受限：它们仅仅可用于简单的单行函数，求解和返回一个表达式。在它们适用的特殊情形中，Lambda 表达式具有强大的表现力。

In [0]:
 def compose1(f,g):
        return lambda x: f(g(x))

我们可以通过构造相应的英文语句来理解 Lambda 表达式：
     lambda            x            :          f(g(x))
"A function that    takes x    and returns     f(g(x))"
一些程序员发现使用 Lambda 表达式作为匿名函数非常简短和直接。但是，复合的 Lambda 表达式非常难以辨认，尽管它们很简洁。下面的定义是是正确的，但是许多程序员不能很快地理解它：

In [0]:
 compose1 = lambda f,g: lambda x: f(g(x))

通常，Python 的代码风格倾向于显式的def语句而不是 Lambda 表达式，但是允许它们在简单函数作为参数或返回值的情况下使用。
这种风格规范不是准则，你可以想怎么写就怎么写，但是，在你编写程序时，要考虑某一天可能会阅读你的程序的人们。如果你可以让你的程序更易于理解，你就帮了人们一个忙。
Lambda 的术语是一个历史的偶然结果，来源于手写的数学符号和早期打字系统限制的不兼容。
使用 lambda 来引入过程或函数看起来是不正当的。这个符号要追溯到 Alonzo Church，他在 20 世纪 30 年代开始使用“帽子”符号；他把平方函数记为ŷ . y × y。但是失败的打字员将这个帽子移到了参数左边，并且把它改成了大写的 lambda：Λy . y × y；之后大写的 lambda 就变成了小写，现在我们就会在数学书里看到λy . y × y，以及在 Lisp 里看到(lambda (y) (* y y))。
-- Peter Norvig (norvig.com/lispy2.html)
尽管它的词源不同寻常，Lambda 表达式和函数调用相应的形式语言，以及 Lambda 演算都成为了计算机科学概念的基础，并在 Python 编程社区广泛传播。当我们学习解释器的设计时，我们将会在第三章中重新碰到这个话题。

## 1.6.6 示例：牛顿法
最后的扩展示例展示了函数值、局部定义和 Lambda 表达式如何一起工作来简明地表达通常的概念。
牛顿法是一个传统的迭代方法，用于寻找使数学函数返回值为零的参数。这些值叫做一元数学函数的根。寻找一个函数的根通常等价于求解一个相关的数学方程。
16 的平方根是满足square(x) - 16 = 0的x值。
以 2 为底 32 的对数（例如 2 与某个指数的幂为 32）是满足pow(2, x) - 32 = 0的x值。
所以，求根的通用方法会向我们提供算法来计算平方根和对数。而且，我们想要计算根的等式只包含简单操作：乘法和乘方。
在我们继续之前有个注解：我们知道如何计算平方根和对数，这个事实很容易当做自然的事情。并不只是 Python，你的手机和计算机，可能甚至你的手表都可以为你做这件事。但是，学习计算机科学的一部分是弄懂这些数如何计算，而且，这里展示的通用方法可以用于求解大量方程，而不仅仅是内建于 Python 的东西。
在开始理解牛顿法之前，我们可以开始编程了。这就是函数抽象的威力。我们简单地将之前的语句翻译成代码：

In [0]:
 def square_root(a):
        return find_root(lambda x: square(x) - a)
 def logarithm(a, base=2):
        return find_root(lambda x: pow(base, x) - a)

当然，在我们定义find_root之前，现在还不能调用任何函数，所以我们需要理解牛顿法如何工作。
牛顿法也是一个迭代改进算法：它会改进任何可导函数的根的推测值。要注意我们感兴趣的两个函数都是平滑的。对于
f(x) = square(x) - 16（细线）
f(x) = pow(2, x) - 32（粗线）
在二维平面上画出x对f(x)的图像，它展示了两个函数都产生了光滑的曲线，它们在某个点穿过了 0。

由于它们是光滑的（可导的），这些曲线可以通过任何点上的直线来近似。牛顿法根据这些线性的近似值来寻找函数的根。
想象经过点(x, f(x))的一条直线，它与函数f(x)的曲线在这一点的斜率相同。这样的直线叫做切线，它的斜率叫做f在x上的导数。
这条直线的斜率是函数值改变量与函数参数改变量的比值。所以，按照f(x)除以这个斜率来平移x，就会得到切线到达 0 时的x值。

我们的牛顿更新操作表达了跟随这条切线到零的计算过程。我们通过在非常小的区间上计算函数斜率来近似得到函数的导数。

In [0]:
 def approx_derivative(f, x, delta=1e-5):
        df = f(x + delta) - f(x)
        return df/delta
 def newton_update(f):
        def update(x):
            return x - f(x) / approx_derivative(f, x)
        return update

最后，我们可以定义基于newton_update（我们的迭代改进算法）的find_root函数，以及一个测试来观察f(x)是否接近于 0。我们提供了一个较大的初始推测值来提升logarithm的性能。

In [0]:
 def find_root(f, initial_guess=10):
        def test(x):
            return approx_eq(f(x), 0)
        return iter_improve(newton_update(f), test, initial_guess)
 square_root(16)
4.000000000026422
 logarithm(32, 2)
5.000000094858201

当你实验牛顿法时，要注意它不总是收敛的。iter_improve的初始推测值必须足够接近于根，而且函数必须满足各种条件。虽然具有这些缺陷，牛顿法是一个用于解决微分方程的强大的通用计算方法。实际上，非常快速的对数算法和大整数除法也采用这个技巧的变体。

## 1.6.7 抽象和一等函数
这一节的开始，我们以观察用户定义函数作为关键的抽象技巧，因为它们让我们能够将计算的通用方法表达为编程语言中的显式元素。现在我们已经看到了高阶函数如何让我们操作这些通用方法来进一步创建抽象。
作为程序员，我们应该留意识别程序中低级抽象的机会，在它们之上构建，并泛化它们来创建更加强大的抽象。这并不是说，一个人应该总是尽可能以最抽象的方式来编程；专家级程序员知道如何选择合适于他们任务的抽象级别。但是能够基于这些抽象来思考，以便我们在新的上下文中能使用它们十分重要。高阶函数的重要性是，它允许我们更加明显地将这些抽象表达为编程语言中的元素，使它们能够处理其它的计算元素。
通常，编程语言会限制操作计算元素的途径。带有最少限制的元素被称为具有一等地位。一些一等元素的“权利和特权”是：
它们可以绑定到名称。
它们可以作为参数向函数传递。
它们可以作为函数的返回值返回。
它们可以包含在数据结构中。
Python 总是给予函数一等地位，所产生的表现力的收益是巨大的。另一方面，控制结构不能做到：你不能像使用sum那样将if传给一个函数。

## 1.6.8 函数装饰器
Python 提供了特殊的语法，将高阶函数用作执行def语句的一部分，叫做装饰器。

In [0]:
 def trace1(fn):
        def wrapped(x):
            print('-> ', fn, '(', x, ')')
            return fn(x)
        return wrapped
 @trace1
    def triple(x):
        return 3 * x
 triple(12)
->  <function triple at 0x102a39848> ( 12 )
36

这个例子中，定义了高阶函数trace1，它返回一个函数，这个函数在调用它的参数之前执行print语句来输出参数。triple的def语句拥有一个注解，@trace1，它会影响def的执行规则。像通常一样，函数triple被创建了，但是，triple的名称并没有绑定到这个函数上，而是绑定到了在新定义的函数triple上调用trace1的返回函数值上。在代码中，这个装饰器等价于：

In [0]:
 def triple(x):
        return 3 * x
 triple = trace1(triple)

**附加部分：**实际规则是，装饰器符号@可以放在表达式前面（@trace1仅仅是一个简单的表达式，由单一名称组成）。任何产生合适的值的表达式都可以。例如，使用合适的值，你可以定义装饰器check_range，使用@check_range(1, 10)来装饰函数定义，这会检查函数的结果来确保它们是 1 到 10 的整数。调用check_range(1,10)会返回一个函数，之后它会用在新定义的函数上，在新定义的函数绑定到def语句中的名称之前。感兴趣的同学可以阅读 Ariel Ortiz 编写的一篇装饰器的简短教程来了解更多的例子。