# Stage 4: Creating neural networks

前面我们主要处理的变量是标量，但在机器学习领域，张量(多维数组)扮演着重要的角色。  
这一阶段的目标是将 DeZero 扩展到机器学习，尤其是神经网络领域。

In [1]:
import numpy as np
import dezero.functions as F
from dezero import Variable

## Step 37: Processing tensors

前面，我们处理的变量主要是标量。本步骤将将讨论使用张量时需要注意的地方，并为扩展DeZero做准备。

In [3]:
x = Variable(np.array(1.0))
y = F.sin(x)
print(y)

variable(0.8414709848078965)


In [5]:
# 会对多维数组进行逐元素运算，不改变形状
x = Variable(np.array([[1, 2, 3], [4, 5, 6]]))
y = F.sin(x)
print(y)
# 逐元素相加
x = Variable(np.array([[1, 2, 3], [4, 5, 6]]))
c = Variable(np.array([[10, 20, 30], [40, 50, 60]]))
y = x + c
print(y)

variable([[ 0.84147098  0.90929743  0.14112001]
          [-0.7568025  -0.95892427 -0.2794155 ]])
variable([[11 22 33]
          [44 55 66]])


在使用当前己实现函数的情况下，即使对张量进行计算，反向传播的代码也能
正常工作：
1. 以标量为对象实现了反向传播
2. 向目前实现的 DeZero 函数传入张量，函数会将每个张量的元素作为标量进行计算
3. 如果将张量的每个元素作为标量进行计算，那么以标量为前提实现的
反向传播也会对张量的每个元素进行计算

$\mathbf{y} = F(\mathbf{x})$向量求导（雅可比矩阵）：
$$
\begin{align*}
\frac{\partial \mathbf{y}}{\partial \mathbf{x}} = \left(
\begin{array}{ccc}
\frac{\partial y_1}{\partial x_1} & \frac{\partial y_1}{\partial x_2} & \cdots & \frac{\partial y_1}{\partial x_n} \\
\frac{\partial y_2}{\partial x_1} & \frac{\partial y_2}{\partial x_2} & \cdots & \frac{\partial y_2}{\partial x_n} \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial y_m}{\partial x_1} & \frac{\partial y_m}{\partial x_2} & \cdots & \frac{\partial y_m}{\partial x_n}
\end{array}
\right)
\end{align*}
$$
如果$\mathbf{y}$是标量，那么就只有一行$\left(\frac{\partial y}{\partial x_1}, \frac{\partial y}{\partial x_2}, \cdots, \frac{\partial y}{\partial x_n}\right)$。

接下来考虑复合函数，基于链式法则，可以得到：
$$
\begin{align*}
\frac{\partial \mathbf{y}}{\partial \mathbf{x}} = \frac{\partial \mathbf{y}}{\partial \mathbf{a}} \frac{\partial \mathbf{a}}{\partial \mathbf{b}} \frac{\partial \mathbf{b}}{\partial \mathbf{x}}
\end{align*}
$$
计算通过矩阵乘法实现。
