# 12.1. 编译器和解释器

- 本书主要关注的是命令式编程（imperative programming）。
- 命令式编程使用诸如print、+和if之类的语句来更改程序的状态。
- 命令式编程很方便，但可能效率不高。
- 一方面原因，Python 会单独执行这三个函数的调用，而没有考虑 add 函数在 fancy_func 中被重复调用。如果在一个 GPU（甚至多个 GPU）上执行这些命令，那么 Python 解释器产生的开销可能会非常大。
- 需要保存 e 和 f 的变量值，直到 fancy_func 中的所有语句都执行完毕。

In [1]:
def add(a, b):
    return a + b

def fancy_func(a, b, c, d):
    e = add(a, b)
    f = add(c, d)
    g = add(e, f)
    return g

print(fancy_func(1, 2, 3, 4))

10


## 12.1.1. 符号式编程
- 符号式编程（symbolic programming），即代码通常只在完全定义了过程之后才执行计算
- 这个策略被多个深度学习框架使用，包括 Theano 和 TensorFlow（后者已经获得了命令式编程的扩展）。一般包括以下步骤：

1. 定义计算流程。
1. 将流程编译成可执行的程序。
1. 给定输入，调用编译好的程序执行。

In [2]:
# 将通过模拟命令式编程来进一步了解符号式编程的概念。
def add_():
    return '''
def add(a, b):
    return a + b
'''

def fancy_func_():
    return '''
def fancy_func(a, b, c, d):
    e = add(a, b)
    f = add(c, d)
    g = add(e, f)
    return g
'''

def evoke_():
    return add_() + fancy_func_() + 'print(fancy_func(1, 2, 3, 4))'

prog = evoke_()
print(prog)
y = compile(prog, '', 'exec')
exec(y)



def add(a, b):
    return a + b

def fancy_func(a, b, c, d):
    e = add(a, b)
    f = add(c, d)
    g = add(e, f)
    return g
print(fancy_func(1, 2, 3, 4))
10


命令式（解释型）编程和符号式编程的区别如下：

* 命令式编程更容易使用。在 Python 中，命令式编程的大部分代码都是简单易懂的。命令式编程也更容易调试，这是因为无论是获取和打印所有的中间变量值，或者使用 Python 的内置调试工具都更加简单。
* 符号式编程运行效率更高，更易于移植。符号式编程更容易在编译期间优化代码，同时还能够将程序移植到与 Python 无关的格式中，从而允许程序在非 Python 环境中运行，避免了任何潜在的与 Python 解释器相关的性能问题。

## 12.1.2. 混合式编程
大部分深度学习框架都在命令式编程与符号式编程之间进行选择。

## 12.1.3. Sequential的混合式编程

In [3]:
import torch
from torch import nn
from d2l import torch as d2l

# 义一个简单的多层感知机
# 生产网络的工厂模式
def get_net():
    net = nn.Sequential(nn.Linear(512, 256),
            nn.ReLU(),
            nn.Linear(256, 128),
            nn.ReLU(),
            nn.Linear(128, 2))
    return net

x = torch.randn(size=(1, 512))
net = get_net()
net(x)


tensor([[-0.3259,  0.0711]], grad_fn=<AddmmBackward0>)

In [4]:
# 通过使用 torch.jit.script 函数来转换模型，
# 我们就有能力编译和优化多层感知机中的计算，
# 而模型的计算结果保持不变。
net = torch.jit.script(net)
net(x)

tensor([[-0.3259,  0.0711]], grad_fn=<AddmmBackward0>)

### 通过混合式编程加速

In [5]:
# 定义一个度量时间的函数
#@save
class Benchmark:
    def __init__(self, description='Done'):
        self.description = description

    def __enter__(self):
        self.timer = d2l.Timer()
        return self

    def __exit__(self, *args):
        print(f'{self.description}: {self.timer.stop():.4f} sec')


In [6]:
# 可以调用网络两次，一次使用 torchscript，一次不使用 torchscript
net = get_net()
with Benchmark('无torchscript'):
    for i in range(1000): net(x)

net = torch.jit.script(net)
with Benchmark('有torchscript'):
    for i in range(1000): net(x)


无torchscript: 2.6593 sec
有torchscript: 2.5981 sec


如以上结果所示，在 nn.Sequential 的实例被函数 torch.jit.script 脚本化后，通过使用符号式编程提高了计算性能。

### 序列化
- 编译模型的好处之一是我们可以将模型及其参数序列化（保存）到磁盘。
- 这允许这些训练好的模型部署到其他设备上，并且还能方便地使用其他前端编程语言。
- 同时，通常编译模型的代码执行速度也比命令式编程更快。

In [7]:
net.save('my_mlp')
!ls -lh my_mlp*

-rw-rw-r-- 1 yuke yuke 651K 12月  5 11:12 my_mlp


## 12.1.4 小结

* 命令式编程使得新模型的设计变得容易，因为可以依据控制流编写代码，并拥有相对成熟的 Python 软件生态。
* 符号式编程要求我们先定义并且编译程序，然后再执行程序，其好处是提高了计算性能。