# Think Python
## How to Think Like a Computer Scientist
## 像计算机科学家一样思考


作者：$Allen Downey$、$Green Tea Press$

整理：$Vincent$

---

# 第一章 程序之道

本书的目标是教你像计算机科学家一样思考。这一思考方式集成了数学、工程以及自然科学的一些最好的特点。像数学家一样，计算机科学家使用形式语言表示思想（具体来说是计算）。像工程师一样，计算机科学家设计东西，将零件组成系统，在各种选择之间寻求平衡。像科学家一样，计算机科学家观察复杂系统的行为，形成假设并且对预测进行检验。

对于计算机科学家，最重要的技能是_问题求解_的能力。问题求解 (problem solving) 意味着对问题进行形式化，寻求创新型的解决方案，并且清晰、准确地表达解决方案的能力。事实证明，学习编程的过程是锻炼问题解决能力的一个绝佳机会。这就是为什么本章被称为 ‘‘程序之道’’。

一方面，你将学习如何编程，这本身就是一个有用的技能。另一方面，你将把编程作为实现自己目的的手段。随着学习的深入，你会更清楚自己的目的。

## 1.1 什么是程序？

*程序*是一系列定义计算机如何执行计算 (computation) 的指令。这种计算可以是数学上的计算，例如寻找公式的解或多项式的根，也可以是一个符号计算 (symbolic computation)，例如在文档中搜索并替换文本或者图片，就像处理图片或播放视频。

不同编程语言所写程序的细节各不一样，但是一些基本的指令几乎出现在每种语言当中：

**输入 (input)：** 从键盘、文件、网络或者其他设备获取数据。

**输出 (output)：** 在屏幕上显示数据，将数据保存至文件，通过网络传送数据，等等。

**数学 (math)：** 执行基本的数学运算，如加法和乘法。

**有条件执行 (conditional execution)：** 检查符合某个条件后，执行相应的代码。

**重复 (repetition):** 检查符合某个条件后，执行相应的代码。

无论你是否相信，程序的全部指令几乎都在这了。每个你曾经用过的程序，无论多么复杂，都是由跟这些差不多的指令构成的。因此，你可以认为编程就是将庞大、复杂的任务分解为越来越小的子任务，直到这些子任务简单到可以用这其中的一个基本指令执行。

## 1.2 运行Python

Python 入门的一个障碍，是你可能需要在电脑上安装 Python 和相关软件。如果你能熟练使用命令行 (command-line interface) ，安装 Python 对你来说就不是问题了。但对于初学者，同时学习系统管理 (system administration) 和编程这两方面的知识是件痛苦的事。

为了避免这个问题，我建议你首先在浏览器中运行 Python。等你对 Python 更加了解之后，我会建议你在电脑上安装 Python。

网络上有许多网页可以让你运行 Python。如果你已经有最喜欢的网站，那就打开 网 页 运 行 Python吧。

如果没有，我推荐PythonAnywhere。在http://tinyurl.com/thinkpython2e 我给出了详细的使用指南。目前 Python 有两个版本，分别是 Python 2 和 Python 3 。二者十分相似，因此如果你学过某个版本，可以很容易地切换到另一个版本。事实上，作为初学者，你只会接触到很少数的不同之处。本书采用的是 Python 3 ，但是我会加入一些关于 Python 2 的说明。

Python 的_解释器_是一个读取并执行 Python 代码的程序。根据你的电脑环境不同，你可以通过双击图标，或者在命令行输入python的方式来启动解释器。解释器启动后，应该看到类似下面的输出：

![image.png](attachment:image.png)

前三行中包含了关于解释器及其运行的操作系统的信息，因此你看到的内容可能不一
样。但是你应该检查下版本号是否以 3 开头，上面示例中的版本号是 3.4.0。如果以 3
开头，那说明你正在运行 Python 3。如果以 2 开头，那说明你正在运行（你猜对了）
Python 2。

最后一行是一个_提示符_ (prompt)，表明你可以在解释器中输入代码了。如果你输入一
行代码然后按回车 (Enter)，解释器就会显示结果：

In [55]:
1+1

2

现在你已经做好了开始学习的准备。接下来，我将默认你已经知道如何启动 Python 解释器和执行代码。

## 1.3 第一个程序

根据惯例，学习使用一门语言写的第一个程序叫做 “Hello, World!” ，因为它的功能就是显示单词 “Hello, World!” 。在 Python 中，这个程序看起来像这样：

In [56]:
print('Hello, World!')

Hello, World!


这是一个 `print` 函数的示例，尽管它并不会真的在纸上打印。它将结果显示在屏幕上。在此例中，结果是单词：

程序中的单引号标记了被打印文本的首尾；它们不会出现在结果中。

括号说明 print 是一个函数。我们将在第三章介绍函数。

Python 2 中的打印语句略微不同，打印语句在 Python 2 中并不是一个函数，因此不需要使用括号。

```>>>print 'Hello, World!```

很快你就会明白二者之间的区别，现在知道这些就足够了。

## 1.4 算术运算符

接下来介绍算术。Python 提供了许多代表加法和乘法等运算的特殊符号，叫做_运算符_(operators)。

运算符 + 、− 和 * 分别执行加法、减法和乘法，详见以下实例：

In [57]:
40 + 2

42

In [58]:
43 - 1

42

In [59]:
6 * 7

42

运算符 / 执行除法运算：

In [60]:
84 / 2

42.0

你可能会疑惑结果为什么是 `42.0` 而不是 `42` 。下节中我们会进行解释。

最后，运算符 * 执行乘方运算；也就是说，它将某个数字乘以自身相应的次数：

In [61]:
6**2 + 6

42

某些语言使用 ^ 运算符执行乘方运算，但是在 Python 中，它却属于一种位运算符，叫做 XOR 。如果你对位运算符不太了解，那么下面的结果会让你感到惊讶：

In [62]:
6 ^ 2

4

我们不会在本书中过深涉及位运算符，你可以通过阅读 位运算符(Python 百科) ，了解相关内容。

## 1.5 值和类型

`值` (value) 是程序处理的基本数据之一，一个单词或一个数字都是值的实例。我们目前已经接触到的值有：`2` ，`42.0` ，和 `'Hello World!'` 。

这些值又属于不同的`类型` (types) ：`2` 是一个`整型`数 (integer)，`42.0` 是一个`浮点型`数(floating point number)，而 `'Hello, World!'` 则是一个`字符串` (string)，这么称呼是因为其中的字符被串在了一起。

如果你不确定某个值的类型是什么，`解释器`可以告诉

In [63]:
type(2)

int

In [64]:
type(42.0)

float

In [65]:
type('Hello, World!')

str

“class” 一词在上面的输出结果中，是类别的意思；一个类型就是一个类别的值。

不出意料，整型数属于 `int` 类型，字符串属于 `str` 类型，浮点数属于 `float` 类型。

那么像 `'2'` 和 `'42.0'` 这样的值呢？它们看上去像数字，但是又和字符串一样被引号括在了一起？

In [66]:
type('2')

str

In [67]:
type('42.0')

str

它们其实是字符串。当你输入一个大数值的整型数时，你可能会想用逗号进行区分，比如说像这样：1,000,000。

在 Python 中，这不是一个合法的`整型数`，但是确实合法的值。

In [68]:
1,000,000

(1, 0, 0)

结果和我们预料的完全不同！Python 把 `1,000,000` 当作成了一个以逗号区分的整型数序列。在后面的章节中，我们会介绍更多有关这种序列的知识。

## 1.6 形式语言和自然语言

_自然语言_ (natural language) 是人们交流所使用的语言，例如英语、西班牙语和法语。它们不是人为设计出来的（尽管有人试图这样做）；而是自然演变而来。

_形式语言_ (formal languages) 是人类为了特殊用途而设计出来的。例如，数学家使用的记号 (notation) 就是形式语言，特别擅长表示数字和符号之间的关系。化学家使用形语言表示分子的化学结构。最重要的是：

**编程语言是被设计用于表达计算的形式语言。**

形式语言通常拥有严格的*语法* 规则，规定了详细的语句结构。例如，$3 + 3 = 6$ 是语法正确的数学表达式，而 $3+ = 3\$6$ 则不是；$H_2O$ 是语法正确的化学式，而 $_2Z_z$ 则不是。

语法规则有两种类型，分别涉及*记号*(tokens) 和结构。记号是语言的基本元素，例如单词、数字和化学元素。$3+ = 3\$6 $ 这个式子的问题之一，就是 \$ 在数学中不是一个合法的记号（至少据我所知）。类似的，$_2Z_z$ 也不合法，因为没有一个元素的简写是 $Z_z$

第二种语法规则与标记的组合方式有关。$3+ = 3$ 这个方程是非法的，因为即使 + 和 =都是合法的记号，但是你却不能把它们俩紧挨在一起。类似的，在化学式中，下标位于元素之后，而不是之前。

This is @ well-structured Engli$h sentence with invalid t*kens in it. This sentence allvalid tokens has, but invalid structure with.

当你读一个用英语写的句子或者用形式语言写的语句时，你都必须要理清各自的结构（尽管在阅读自然语言时，你是下意识地进行的）。这个过程被称为*解析* (parsing)。

虽然形式语言和自然语言有很多共同点 — 标记、结构和语法，它们也有一些不同：

**歧义性 (ambiguity)：** 自然语言充满歧义，人们使用上下文线索以及其它信息处理这些歧义。形式语言被设计成几乎或者完全没有歧义，这意味着不管上下文是什么，任何语句都只有一个意义。

**冗余性 (redundancy)：** 为了弥补歧义性并减少误解，自然语言使用很多冗余。结果，自然语言经常很冗长。形式语言则冗余较少，更简洁。

**字面性 (literalness)：** 自然语言充满成语和隐喻。如果我说 “The penny dropped’’，可能根本没有便士、也没什么东西掉下来（这个成语的意思是，经过一段时间的困惑后终于理解某事）。形式语言的含义，与它们字面的意思完全一致。

由于我们都是说着自然语言长大的，我们有时候很难适应形式语言。形式语言与自然语言之间的不同，类似诗歌与散文之间的差异，而且更加明显：

**诗歌 (Poetry)：** 单词的含义和声音都有作用，整首诗作为一个整理，会对人产生影响，或是引发情感上的共鸣。歧义不但常见，而且经常是故意为之。

**散文 (Prose)：** 单词表面的含义更重要，句子结构背后的寓意更深。散文比诗歌更适合分析，但仍然经常有歧义。

**程序 (Programs)：** 计算机程序的含义是无歧义、无引申义的，通过分析程序的标记和结构，即可完全理解。

形式语言要比自然语言更加稠密，因此阅读起来花的时间会更长。另外，形式语言的结构也很重要，所以从上往下、从左往右阅读，并不总是最好的策略。相反，你得学会在脑海里分析一个程序，识别不同的标记并理解其结构。最后，注重细节。拼影响和标点方面的小错误在自然语言中无伤大雅，但是在形式语言中却会产生很大的影响。

## 1.7 调试

程序员都会犯错。由于比较奇怪的原因，编程错误被称为*故障*，追踪错误的过程被称为*调试* (debugging) 。

编程，尤其是调试，有时会让人动情绪。如果你有个很难的 bug 解决不了，你可能会感到愤怒、沮丧抑或是难堪。

有证据表明，人们很自然地把计算机当人来对待。当计算机表现好的时候，我们认为它们是队友，而当它们固执或无礼时，我们也会像对待固执或无礼的人一样对待它们。

对这些反应做好准备有助于你对付它们。一种方法是将计算机看做是一个雇员，拥有特定的长处，例如速度和精度，也有些特别的缺点，像缺乏沟通以及不善于把握大局。

你的工作是当一个好的管理者：找到充分利用优点、摒弃弱点的方法。并且找到使用你的情感来解决问题的方法，而不是让你的情绪干扰你有效工作的能力。

学习调试可能很令人泄气，但是它对于许多编程之外的活动也是一个非常有价值的技能。在每一章的结尾，我都会花一节内容介绍一些调试建议，比如说这一节。希望能帮到你！

## 1.8 术语表

**问题求解 (problem solving)：** 将问题形式化、寻找并表达解决方案的过程。

**高级语言 (high-level language)：** 像 Python 这样被设计成人类容易阅读和编写的编程语言。

**低级语言 (low-level language)：** 被设计成计算机容易运行的编程语言；也被称为‘‘机器语言” (machine language ) 或 ‘‘汇编语言” (assembly language)。

**可移植性 (portability)：** 程序能够在多种计算机上运行的特性。解释器 (interpreter)： 读取另一个程序并执行该程序的程序。

**提示符 (prompt)：** 解释器所显示的字符，表明已准备好接受用户的输入。

**程序 (program)：** 一组定义了计算内容的指令。

**打印语句 (print statement)：** 使 Python 解释器在屏幕上显示某个值的指令。

**运算符 (operator)：** 代表类似加法、乘法或者字符串连接 (string concatenation) 等简单计算的特殊符号。

**值 (value)：** 程序所处理数据的基本元素之一，例如数字或字符串。

**类型 (type)：** 值的类别。我们目前接触的类型有整型数（类型为 `int`）、浮点数（类型为 `float` ）和字符串（类型为 `str` ）。

**整型数 (integer)：** 代表整数的类型。

**浮点数 (floating-point)：** 代表一个有小数点的数字的类型。

**字符串 (string)：** A type that represents sequences of characters.自然语言 (natural language)： 任何的人们日常使用的、由自然演变而来的语言。

**形式语言 (formal language)：** 任何由人类为了某种目的而设计的语言，例如用来表示数学概念或者电脑程序；所有的编程语言都是形式语言。

**记号 (token)：** 程序语法结构中的基本元素之一，与自然语言中的单词类似。语法 (syntax)： 规定了程序结构的规则。

**解析 (parse)：** 阅读程序，并分析其语法结构的过程故障 (bug)： 程序中的错误。

**调试 (debugging)：** 寻找并解决错误的过程。

## 1.9 练习

**Exercise 1.1.** 建议读者在电脑上阅读本书，这样你可以随时测试书中的示例。

每当你试验一个新特性的时候，你应该试着去犯错。举个例子，在“Hello, World!” 程序中，如果你漏掉一个引号会发生什么情况？如果你去掉两个引号呢？如果你把`print` 写错了呢？

这类试验能帮助你记忆读过的内容；对你平时编程也有帮助，因为你可以了解不同的错误信息代表的意思。现在故意犯错误总胜过以后不小心犯错。

1. 在打印语句中如果你去掉一个或两个括号会发生什么？

In [69]:
print "Hi!"
print("Hi"!

SyntaxError: Missing parentheses in call to 'print'. Did you mean print("Hi!")? (<ipython-input-69-b368181ddc62>, line 1)

2. 你想打印一个字符串，如果你去掉一个或两个引号，会发生什么？

In [32]:
print(Hi!)
print('Hi!)

SyntaxError: invalid syntax (<ipython-input-32-c03870ac4299>, line 1)

3. 你可以使用减号创建一个负数，如`−2` 。如果你在一个数字前再加上个加号，会发生什么？`2++2`会得出什么结果？

In [35]:
+ -2

-2

In [36]:
2++2

4

4. 在数学标记中，前导零 (leading zeros) 没有问题，如02 。如果我们在 Python 中这样做，会发生什么？

In [40]:
02

SyntaxError: invalid token (<ipython-input-40-0908cbeb2fbd>, line 1)

5. 如果两个值之间没有运算符，又会发生什么？

In [41]:
a, b = 1, 2
ab

NameError: name 'ab' is not defined

**Exercise 1.2.** 启动 Python 解释器，把它当计算器使用。

1. 42 分 42 秒一共是多少秒？

In [43]:
42 * 60 + 42

2562

2. 10 公里可以换算成多少英里？提示：一英里等于 1.61 公里。

In [44]:
10 * 1.61

16.1

3. 如果你花 42 分 42 秒跑完了 10 公里，你的平均配速是多少（每英里耗时，分别精确到分和秒）？你每小时平均跑了多少英里（英里/时）？

In [51]:
(10 / 1.61) / (42 + 42 / 60) # mile/min

0.14546089283896022

In [52]:
(10 / 1.61) / (42 * 60 + 42) # mile/s

0.0024243482139826703

In [53]:
(10 / 1.61) / (42 * 60 + 42) * 3600 # mile/h

8.727653570337614