# 3 计算图和动态图机制

## 3.1 计算图

### 3.1.1 计算图的定义
深度学习就是对张量进行一系列的操作，随着操作种类和数量的增多，会出现各种值得思考的问题。
<br>比如多个操作之间是否可以并行，如何协同底层的不同设备，如何避免冗余的操作，以实现最高效的计算效率，同时避免一些 bug。
<br>因此产生了计算图 (Computational Graph)。
计算图是用来描述运算的有向无环图，有两个主要元素：节点 (Node) 和边 (Edge)。
<br>节点表示数据，如向量、矩阵、张量。边表示运算，如加减乘除卷积等。
<br>用计算图表示：$y=(x+w)*(w+1)$，如下所示：

![](https://image.zhangxiann.com/20200515221509.png)


## 3.1.2 计算图与梯度求导

上图中$y=(x+w)*(w+1)$可以看作$y=a \times b$ ，其中 $a=x+w$，$b=w+1$。
<br>这里求 $y$ 对 $w$ 的导数：
$\begin{aligned} \frac{\partial y}{\partial w} &=\frac{\partial y}{\partial a} \frac{\partial a}{\partial w}+\frac{\partial y}{\partial b} \frac{\partial b}{\partial w} \ &=b  1+a  1 \ &=b+a \ &=(w+1)+(x+w) \ &=2  w+x+1 \ &=2  1+2+1=5\end{aligned}$
<br>体现到计算图中，就是根节点 $y$ 到叶子节点 $w$ 有两条路径 y -> a -> w和y ->b -> w。根节点依次对每条路径的孩子节点求导，一直到叶子节点w，最后把每条路径的导数相加即可。
![](https://image.zhangxiann.com/20200515221816.png)
<br>代码如下：

In [3]:
import torch
w = torch.tensor([1])
x = torch.tensor([2])
print(w.dtype)
print(x.dtype)
a = torch.add(w, x)
b = torch.add(w, 1)
y = torch.multiply(a, b)

#y.backward()

# print(w.grad)

torch.int64
torch.int64
