# Notebook 3: 矩阵与向量的乘法 - 核心计算

这是我们目前学到的知识融会贯通的地方！我们将把向量和矩阵放在一起，执行神经网络中最核心的运算：矩阵-向量乘法。

**目标:** 直观地理解矩阵如何“作用”于向量，并将其与神经网络中从一层到下一层的计算过程联系起来。

**核心直觉:** 果汁配方！
- **输入向量** 是你拥有的水果：`[苹果数量, 香蕉数量, 橙子数量]`
- **矩阵** 是你的果汁配方集合。矩阵的每一行都是一个制作特定果汁的配方。
- **输出向量** 是你根据配方制作出的各种果汁的量。

## 1. 果汁配方示例

假设我们有以下水果（输入向量）:
- `[2, 3, 1]` (2个苹果, 3个香蕉, 1个橙子)

我们有两个果汁配方（权重矩阵）:
1.  **热带果汁配方 (第一行):** 需要 `0.5`份苹果, `0.8`份香蕉, `0.2`份橙子。
2.  **柑橘果汁配方 (第二行):** 需要 `0.1`份苹果, `0.0`份香蕉, `1.2`份橙子。

这个配方矩阵可以写成：
```
[[0.5, 0.8, 0.2],  --> 热带果汁
 [0.1, 0.0, 1.2]]  --> 柑橘果汁
```

In [None]:
import numpy as np

# 输入向量：水果库存
fruits = np.array([2, 3, 1])

# 权重矩阵：果汁配方
recipes = np.array([
    [0.5, 0.8, 0.2],  # 热带果汁
    [0.1, 0.0, 1.2]   # 柑橘果汁
])

print(f"水果库存 (输入向量): {fruits}")
print(f"\n果汁配方 (权重矩阵):\n{recipes}")

## 2. 计算过程：点积 (Dot Product)

为了计算出每种果汁的最终产量，我们将输入向量与矩阵的 **每一行** 进行“点积”运算。

点积就是将两个向量的对应元素相乘，然后求和。

**热带果汁产量** = `(2 * 0.5) + (3 * 0.8) + (1 * 0.2)` = `1 + 2.4 + 0.2` = `3.6`
**柑橘果汁产量** = `(2 * 0.1) + (3 * 0.0) + (1 * 1.2)` = `0.2 + 0 + 1.2` = `1.4`

所以，我们的输出向量是 `[3.6, 1.4]`。

## 3. 用 Numpy 进行矩阵-向量乘法

Numpy 使用 `@` 符号或者 `np.dot()` 函数来进行这个操作。

In [None]:
# 使用 @ 符号进行矩阵乘法
juice_output = recipes @ fruits

print(f"输出的果汁 (输出向量): {juice_output}")
print(f"输出向量的形状: {juice_output.shape}")

**维度匹配规则:**
注意看！为了让乘法能够进行，矩阵的 **列数** 必须等于向量的 **元素个数**。
- `recipes` 的形状是 `(2, 3)`
- `fruits` 的形状是 `(3,)`
矩阵的列数(3)和向量的元素数(3)匹配，所以可以计算。输出向量的元素个数等于矩阵的 **行数** (2)。

`(n, m) @ (m,)  --> (n,)`

## 4. 与神经网络的联系

这正是神经网络中一层的工作原理！

- **输入向量** `fruits` 就是 **上一层神经元的激活值**。
- **权重矩阵** `recipes` 就是 **连接两层神经元的权重**。
- **输出向量** `juice_output` 就是 **下一层神经元在激活前的值**（我们称之为“加权和”）。



上图完美地展示了这个过程。输入层的3个神经元的激活值（我们的水果向量）通过权重矩阵（我们的配方）被转换成了隐藏层的2个神经元的加权和（我们的果汁向量）。

在下一课，我们会给这个输出再加一个“偏置项”，并通过“激活函数”进行处理，就完成了神经网络一层的完整计算。

## 总结

**关键回顾:**
1.  **矩阵-向量乘法是核心:** 这是神经网络信息传递和转换的基础运算。
2.  **直觉是“转换”:** 矩阵将一个输入向量转换成一个新的输出向量。
3.  **点积是基础:** 运算的核心是输入向量和矩阵每一行的点积。
4.  **维度是关键:** 必须遵循 `(n, m) @ (m,) --> (n,)` 的维度匹配规则。

我们已经成功地用数学语言描述了神经网络中最重要的一步计算。离我们的目标越来越近了！