# Chapter 01 Learning Math in Code

> yyuuaavv@yandex.com / 123456

本章讲述：
- 通过实现数学思想在代码中赚钱
- 在数学学习避免常见的错误
- 像程序员一样理解数学
- 使用 Python 来作为强大和可扩展的计算

数学像篮球，像首诗，或者像上好的葡萄酒。一些人痴迷于数学并为其付诸一生，而另一些人觉得并不需要。你可能强迫自己归属了一个阵营，或者通过十二年的义务数学教育选择了另一个阵营。

我们在学校能像学习葡萄酒那样学习数学吗？如果我听了一个小时关于葡萄酒种类和发酵技术的演讲，也不认为会喜欢上葡萄酒。可能我们得完成几个老师布置的家庭作业，有时这是一种美好的教育体验，但是有时我们并不喜欢晚上待在学校。我就常常被数据掌控着，就像葡萄酒，数学成了我的嗜好，日常的作业是没办法改善口感的。

如果您也很兴奋的想开始数学的学习，那就太好了！否则，这一章是为您设计的，您可能会感到“数学焦虑（math anxiety）”。我希望您能驱散任何焦虑，并告诉您数学可以令你兴奋，而不是恐惧。所以您需要正确的工具和心态。

主要是要学习 Python。我猜您在大学学过了数学，看到的是黑板的板书而不是计算机代码。这是可耻的，因为高水平的编程语言比黑板板书强大得多，用途也远远超过您使用过的高阶图形计算器。在数学中的优势是思想足够精确的让计算机理解。

我们学习新的东西，最好的方法就是让自己想去学它——兴趣是最好的老师。您会被美丽的数学概念迷住，享受“伤脑”的数学问题，可能只是您想构建的需要数学来工作的 APP 或者游戏。现在，让我们通过最低公分母（even lower common denominator）来激发你：通过软件来解决数学问题能让你充实起来。



## 1.1 使用数学软件解决赚钱的问题
在高等数学中我们常常提出这样的疑问“什么时候才会在现实中使用这些知识？”，老师告诉我们，数学能帮助我们成功并赚到钱。我想他们是对的，比如，我不能手工计算银行复利。如果我称为建筑测量员，可能通过正弦和余弦赚到钱。

### 1.1.1 金融市场走势预测
我们都听说过股票交易员花数百万美元在正确的时间买卖股票。在曼哈顿的摩天大楼背后，有成千上万的金融工程师（_quants_），也被称为定量分析师，设计数学算法自动交易股票来赚到钱。他们不穿西装，不经常打电话，但我想他们一定拥有漂亮的跑车。

那么，金融工程师如何编写程序自动赚钱呢？最好的回答是——金融工程师的秘密。但是可以确定的是他们拥有丰富的数学知识，我们可以来看看，如何实现自动化的交易策略。

股票（_Stocks_）代表所有权的股份公司，当市场认为公司做得很好时，价格会上涨：购买股票会更加昂贵，而出售它会更有价值。股票价格的变化不规律并且是实时的。一个交易日的股票价格图标看起来像这样。

**图 1.1** 股票价格的典型图

<img align="center" src="images/1.1.png"/>

如果您在 100 分钟时以 24 美元买入 1000 股的股票，在 400 分钟时以 38 美元卖出，你这天可以转到 14,000 美元。不错！挑战在于，您必须提前知道股票会上涨，并且在 100 分钟和 400 分钟分别是最佳的买入及卖出的时间。不可能如此精确的预测到最低和最高价位，但您可能转到比较好的时机来买入和卖出。让我们来看看这一数学方法。

首先，我们来衡量股票是否会找到一条向上或向下“最合适”的线，近似的遵循价格方向移动，这个过程称为**线性回归（_linear regression_）**，我们将在本书的第 3 部分讨论它。基于变化的数据，我们可以预测上下两条“最合适”的线来展示价格上下波动的范围。覆盖价格图表，我们看到它们遵循 这一趋势。

**图 1.2** 使用线性回归来确定股票价格的变化趋势

<img align="center" src="images/1.2.png"/>

通过数学来理解价格的移动，我们能编写软件，当价格处于低估时自动购买，当价格回归是自动卖出。具体的说，我们的软件可以通过网络连接到证券交易所在价格穿越底线购买 100 股股票，并在价格穿越顶线时卖出 100 股。一次赚钱的交易如下：27.80 美元买入并在 32.60 元卖出将在一小时赚取 480 美元。

**图 1.3** 根据规则买入卖出来赚钱

<img align="center" src="images/1.3.png"/>

我撇开了一堆的复杂性，只关注核心思想。这会儿，程序中许多未知数被构建并升级模型来测量和预测股票趋势以及其他金融工具（financial instruments）。如果你写了这样的程序，当它为你赚钱时，你正在享受悠闲时光。

###  1.1.2 找到好的交易
也许你没有足够多的财力来应对高风险的股票交易，数学仍能够帮助你在其他交易中赚钱和省钱。例如购买汽车，如果两个经销商销售同样的汽车，你显然后选择更便宜的。二手车则有更多的数据：根据里程和年份要价，你甚至可以根据一段时间二手车市场来评估其质量——时间越长越便宜。

在数学中，通过有序的列表（list）来描述的对象称为**向量（_vectors_）**，有称为**线性代数（_linear algebra_）**的整个领域来研究它们。二手车可能对应**四维（_four-dimensional_）**向量，意味着 four-tuple 的数值：
```
(2015, 41429, 22.27, 16980).
```
这些数值是年份、里程、天数、以及价格。比如一个二手车网站 CarGraph.com，展示出售丰田普锐斯101，为模型提供了四个价格，网站还展示了图表中的数据。很难想象四维（four-dimensionad）对象，但是如果你选择了其中了两个维度，类似 price 和 mileage，你能把他们当做散点图来绘制。

**图 1.4** CarGraph.com上用于普锐斯的 price 和 mileage 图表

<img align="center" src="images/1.4.png"/>

我们可能对趋势图感兴趣——图表中的每一个点表示某些人的价格，所以趋势图将这些节点集合成更为可靠的价格与里程。这种情况下，我决定适应**指数（exponential）**递减曲线，而不是一条直线，并且忽略低于零售价的新车。

**图 1.5** 适应的价格与里程指数递减曲线

<img align="center" src="images/1.5.png"/>

**图 1.6** 最适合的曲线方程式：

<img align="center" src="images/1.6.png"/>

也就是说，最恰当的价格是 $26,500 乘以 0.99999017 的 mileage 次方。带入值的方程，如果我们的预算是 $10,000，应该想要购买一辆 97,000 英里的普锐斯。如果相信这曲线图代表**公平（_fair_）**的价格，那么曲线以下的汽车会达成很好的交易。

**图 1.7** 查找里程以获得 $10,000 预算的普锐斯

<img align="center" src="images/1.7.png"/>

我们可以从图中了解更多信息——知道车子如何贬值的。首先最高价 $26,500 处于 0 英里。这接近于新普锐斯的价格，根据这一等式，当里程为 50,000 时，价格为 (0.99999017)^50,000 = .612 的百分率，即 61% 。

上图，实现了 `price(mileage)` 的 Python 函数。计算 `price(0) - price(50000)` 和 `price(50000) - price(100000)` 可以知道 50000 英里的价格比 100000 英里的价格贵 $6,300 元。如果我们使用“最合适”的线，将知道汽车每英里 0.10 美元的固定汇率的贬值。这意味着每 50000 英里有个固定的 $5000 成本。传统的观念认为第一英里您开的是辆最贵的新车，这个指数函数也表明了这一点。

记住，这只是个**二维（two-dimensional）**分析，我们仅仅构建了四维中两个维度的数学模型。在第一部分，我们将学习更多关于各种维度的向量，以及如何操作跟高维度的数据。类似线性函数和指数函数这些不同类型的函数将在第二部分介绍，我们将比较他们不同利率的变化。最后在第三部分，我们将看到如何构建数学模型来整合数据集的所有维度提供给我们精确的图片。

### 1.1.3 构建3D图形和动画
许多注明的财务软件能处理多维数据——特别是三维（3D）数据。这里我想 3D 动画和 3D 游戏总额在数十亿美元，皮克斯（Pixar）的 3D 动画软件帮助他们赢得了超过 130 亿美元的票房。使命召唤（_Call of Duty_）赚取了超过 160 亿美元，侠盗飞车5（_Grand Theft Auto V_）带来了 60 亿美元。

每一个广受好评的项目都是基于 3D 向量的计算，或者数字的三元组形式 `(x, y, z)`。三元组的数字足以定位一个点相对于参考点（原点）的三维空间位置。三元组中的每个数字告诉你分别离原点有多远：

**图 1.8** 标记三维向量的三个数字

<img align="center" src="images/1.8.png"/>

任何 3D 对象，从海底总动员（_Finding Nemo_）到使命召唤（_Call of Duty_），可以被定义为计算机 3D 向量的集合。在代码中，每个对象看起来就像三元组浮点值的列表（list）。通过三个三元组浮点值，我们通过空间的 3 个位置来定义三角形（triangle）：

In [3]:
triangle = [(2.3, 1.1, 0.9), (4.5, 3.3, 2.0), (1.0, 3.5, 3.9)]

**图 1.9** 构建三角形

<img align="center" src="images/1.9.png"/>

结合多个三角形，可以定义 3D 对象的表面。使用更小的三角形，你甚至可以使结果看起来光滑。

**图 1.10**

<img align="center" src="images/1.10.png"/>

在第三章、第四章，将学到如何使用 3D 向量来专横成 2D 图像的阴影。你需要让 3D 模型在游戏或者电影中平滑，还需要让他们以现实的方式移动和改变。这意味着你的对象应该遵循物理定律，这也是通过 3D 向量来表达。

设想你是侠盗猎车的程序员，希望基础用户能发射火箭炮击落直升飞机，火箭从主角位置抛射出来，然后随着时间改变，我们使用下标数字标明飞行的各种位置：$(x_0, y_0, z_0)$，一旦时间过去，炮弹抵达新的位置 $(x_1,y_1,z_1), (x_2,y_2,z_2)$ ，等等。x, y 和 z 值的变化是决定火箭炮的方向和速度的，而且，它可以随时间改变——炮弹应该较小 z 的位置，以为其持续下降的重力。

**图 1.11** 炮弹的位置随着时间而改变，根据其初始速度和重力

<img align="center" src="images/1.11.png"/>

任何有经验的玩家都会告诉你，你需要目标略高于直升飞机来击中它！为了模拟，你需要知道如何影响对象并初始其随着时间持续改变。连续变化的数学称为**微积分（_calculus_）**，物理定律的表达在微积分中称为**微分方程（_differential equations_）**。你将在第四、第五章学习如何画 3D 对象，然后在第二部分学习怎样使用微积分思想。

### 1.1.4 模型和物理世界
我想让数学软件创造出真是的金融价值而不仅仅是推测，我看到了我自己的职业价值。在 2013 年，我创立了一家叫做 *Tachyus* 的公司，构建软件以优化石油和天然气生产。我们的软件使用数学模型来理解石油和天然气的地下流以帮助生产商提升效率和利润。通过它，我们的客户每年在节约成本和产品增长上每年获取数百万美元。让我们来看看它是如何工作的：

传统上，陆地石油生产看起来通常像这样，井（_wells_）钻入地下直到抵达含有石油的多孔层（像海绵一样），富含石油的这一层岩石被称为水库（_reservoir_）。石油抽到地面，然后卖给炼油厂生产出我们每天使用的产品。

**图 1.12** 油田示意图

<img align="center" src="images/1.12.png"/>

这些年，石油价格从每桶 25 美元上涨到 100 美元。如果，通过钻井和有效抽运，公司每天可以提取 1000 桶石油，将有数千万美元的年收入，甚至几个百分点效率的提升就能够赚到一大笔钱。

最大的潜在问题可能在地下：石油怎么移动？这是非常复杂的问题，但是可以通过微分方程了解答。这里的变化量不再是炮弹，而是位置 、压力和地下流体。流体流动——是一种特殊的矢量值函数，称为**矢量场（_vector field_）**，流体的意义可以在任何速度三维方向流动的方向和速度水库内的不同位置上可能会有所不同。


通过对参数做最佳的猜测，我们可以使用称为**达西定律（_Darcy's law_）**——（描述饱和土中水的渗流速度与水力坡降之间的线性关系的规律，又称线性渗流定律）的微分方程预测流体通过类似多孔岩石中的砂岩的流量。达西定律看起来如下图所示，不用担心一些不熟悉的符号！

**图 1.13** 达西定律，计算多孔岩中流体流动的物理方程

<img align="center" src="images/1.13.png"/>

这个方程式最重要的部分是倒三角（$\nabla$）表示矢量微积分的梯度（_gradient_）操作。梯度的压强 _p_ 是 3D 矢量表示的方向压力越来越大，负号（negative）告诉我们流量的 3D 向量是相反（_opposite_）方向。这个方程，用数学术语来讲，流体区域由高压区域流向低压区域。

负梯度在物理定律中很常见，常认为自通常是由高势能流向低势能的状态。球体在山上的势能取决于高度 _h_ 和任何一个横向点 _x_ 。如果山的高度 _h_ 由函数 _h(x)_ 给出，梯度将指出坡上的球体滚动的相反方向。

**图 1.14**

<img align="center" src="images/1.14.png"/>

在第八章，你将学习如何计算梯度，我将告诉你如何应用他们来物理模拟，以及解决其他数学问题；**梯度是机器学习中最重要的一个数学概念**。

我希望这些例子比起你在现实中的高等数学应用来说，是足够引人注意的了。可能此时你确定这些数学概念是值得一学的，但仍担心它们太难了。的确，数学是很难学，特别是自学。为了让学习更顺滑，让我们谈一谈你可能遇到的坑，并版主你如何避免它们。

## 1.2 如何学习数学
当通过传统方式学习数学时，经常会遇到坎而放弃。下面是些典型的学习数学失效的故事。
### 1.2.1 Jane想学习数学
Jane 是一个在圣弗朗西斯科的 Medium 公司的全栈网页开发者，在大学，Jane 没有深入学习任何计算机科学和任何数学科目，她的职业是从产品经理开始的。在过去的十年里，她凭借 Python 和 JavaScript 的代码转型成软件工程师。现在，在新工作中，她是团队中能力最强的程序员，可以构建数据库、Web 服务器、以及用户接口要求传递给客户的重要特性。显然她做得很好！

Jane 意识到学习数据科学能帮助她设计和实现更好的特性，使用数据来改进客户体验。Juan 大多数时间在火车上通话，Jane 阅读关于科技的博客和文章，最近她对“深度学习（deep learning）”吃惊。一篇文章谈论到谷歌的 AlphaGo，因深度学习和强大，能够击败世界上的顶级的围棋选手。

另一篇文章说的是由普通图像生成抽象派图像，再次使用深度学习系统。读了这些文章之后，Jane 无意中听到她的朋友 Marcus 有“五大”科技公司的深度学习工作 。Marcus 可能得到每年 400,000 美元的报酬和股票。考虑到她职业生涯的下一步，还有什么比这更着迷且更赚钱的呢？

Jane 做了一些研究并发现了一些权威（且免费）的在线资源：Goodfellow 等撰写的书籍 _**Deep Learning**_ 。她阅读了大量科技博客文章，并且更加痴迷。但是随着她的阅读，内容越来越难，第一章涵盖的数学概念以及介绍的许多属于和符号是从未见过的，她略过它们并尝试获取书中的内容，但是变得越来越难。

Jane 决定暂停以下 AI 的学习直到她学一些数学。幸运的是 _**Deep Learning**_ 一书的数学章节为学生列出了从未见过的“线性代数”的内容。她找到了这本教科书—— Georgi Shiov 的 _**Linear Algebra**_ —— 并且发现它同 _**Deep Learning**_ 一样有 400 多页。

花了一个下午来阅读深奥的理论，类似“数字字段、行列式和辅因子”（_number fields, determinants, confactors_）之后，她决定退出。她不直到这些概念如何帮助她编写程序来赢得棋盘游戏或者生成艺术品，并且她不再甘心花几十小时来读取这枯燥的材料。

Jane 和我在咖啡店相遇，她谈到关于阅读 AI 的困扰，因为它不知道线性代数。最近，我听说了很多许多类似的失望：

> 我尝试阅读新的技术但看起来我该先学习数学。

她的方法令人钦佩：她知道了最好的资源，她想学习和寻找资源来作为先决条件，但是她迷失了。

### 1.2.2 钻研数学教科书

类似线性代数的大学数学教材非常刻板，每一章都类似：
1. 给出新的定义（definition）
1. 一个或者多个命题（propositions），是可以推断的定义
1. 主要定理，类似命题但是比命题更重要
1. 证明定理，定理必须被证明是真的
1. 最后，推论（corollaries），应用到定理上，是陈述和证明

这些听起来很好，逻辑有序——介绍了所谈的概念，得出结论，然后为他们证明。然而为什么搞定数学如此之难呢？

问题在于这不是如何创建数学，当你有了新的数学思想，在你知道正确的定义之前可以有长时期的想法。我认为大多数专业的数学家会这样描述步骤：
1. 首先，发明一种游戏，开始了解数学对象并通过列表找出他们之间的模式，或是找到一个特定属性。
1. 从一些猜测（conjectures），推断出你的游戏状态，至少说服自己它们必须是真是的。
1. 开发精确语言（precise language）来描述你的游戏和猜想，你的猜想一无是处，直到你能与之交流。
1. 最后，有决心和运气，证明你的猜想为什么是真的。

学习的主要过程是你应该先有大的思路，以后再形式化。一旦你知道了数学如何工作的思路，词汇和符号将是固化的而不会让你分心。数学教科书通常倒叙讲解，所以我推荐将其作为参考。

相对于传统的教科书，学习数学最好的方法是探索思想，得出自己的结论。然而，你并没有足够的时间来塑造这一切。怎样来平衡呢？我给出我的拙见，指导我如何编写这本非传统的书籍的。

## 1.3 使用你训练有素的左脑

这本书是为那些有经验的程序员而写的，能为程序员而写作真是太好了，因为你写代码可以训练左脑，我想最好的方法是学习数学来提高变成水平，我预计——这是不久的将来数学教室的常态。

这里有几个特别的程序员，我列举他们并不仅仅是迎合你，更重要的是你拥有学习数学的技能。

### 1.3.1 使用正式的语言
首先，写代码并不编写简单的英语，如果在编写邮件时语法有所偏差，也能知道你在说些什么，但是任何语法错误或者错误表示都将导致程序失败。在一些语言中，忘记分号也可能让程序终止运行。

一个简单的例子是变量赋值，在 Python 中下面两行看起来是一样的：
```
x = 5
5 = x
```
但是只有第一行是正确的，我们绑定值 5 到符号 x ，但是不能绑定符号到值上。

另一个例子：

In [10]:
class A():
    pass

A() == A()

False

当你在写代码时，不仅仅是书写正确的语句，你的语句需要正确的表达你的思想。如果你在写下数学语句是足够上心，你将快速的捕捉到错误。甚至，如果将数学语句写在代码中，将有助于你的工作。

### 1.3.2 构建自己的计算器
计算器在数学上是很流行的，因为它在校验的时候非常有用。你需要在没有计算器的情况下知道 6 * 7 值，但是通过计算器可以校验你的答案。计算机也能帮助你节省时间，如果做三角函数的时候需要知道 3.14159 /  6 的值，计算器将很方便的计算出来，计算器而又开箱即用，相当地方便。

有时候我们的计算器过于复杂。我在大学的时候，有一个计算器 T1-84， 它有 40 个按钮，每个都有 2~3 种不同模式。我只知道其中的 20 种，所以学习使用它是很难的。如果我要设计一款计算器，我打算设计成这样：

**图 1.15**

<img align="center" src="images/1.15.png"/>

它只有两个按钮，实现不断的加 1 。之后，你想练习添加更多的数字：

**图 1.16**

<img align="center" src="images/1.16.jpg"/>

接下来，又要添加“—、×、÷”。你可以升级计算器以拥有更多的操作。我们 已经解决了很多问题。在 Python 中，有一个模块 `math`，还有很多的第三方数学模块可以让我们的程序更加强大。

在本书，我们将在 Python 代码中实现数学概念，这样你能更好的理解新概念。

### 1.3.3 构建抽象函数

In [12]:
def greet(name):
    print("hello %s" % name)
    
for name in ["John","Paul","George","Ringo"]:
    greet(name)

hello John
hello Paul
hello George
hello Ringo


**图 1.17**

<img align="center" src="images/1.17.jpg"/>

## 1.4 总结

- 在软件工程领域数学是有趣并可以赚到钱的。
- 数学能帮助你随着时间的推移量化数据趋势，比如预测股票价格。
- 不同类型的函数表示不同的功能。例如，一个指数折旧函数 意味着一辆汽车损失的百分比与英里数转售的价值驱动，而不是一个固定的金额。
- 多维数据通过元组数表示。三元组的数字能代表点和空间，可以通过三角形向量构建 3D 动画。
- 微积分是表示不断的变化，物理定律中的微积分方程称为微分方程。
- 传统的教科书很难学号数学。数学需要探索，而不是通过简单的定义和定理。
- 作为一个程序员，需要训练你的思考方式，有助于学习数学。
- Python 就像可扩展的计算器，在 Python 中写新的函数类似给计算器添加新的按钮。

让我们开始接下来的学习吧！