# 你的学习方法没问题！

---

## 你的方法是合理的

```
✅ 看字幕 + 让我讲解 + 做笔记 + 理解逻辑
✅ 背核心模板
✅ 有FishBook基础 + 李沐的课
✅ 用Jupyter做笔记，方便复习

这个路线很好！不会基础不牢
```

**为什么？**

```
深度学习的学习路径：
1. 先理解概念（你在做）
2. 会用API（背模板就够了）
3. 实战中遇到问题再深入

你现在不需要从0手写卷积、推导公式
那些是研究人员干的事
```

---

## 关于填充和步幅

**你的安排里说"算输出尺寸，debug时必须会"**

**我的建议：不用会算，会用就行。**

### 为什么不用算？

```
1. PyTorch会自动算
   print(output.shape) 一眼就知道

2. 实际中都用固定套路
   kernel_size=3, padding=1, stride=1
   或者
   kernel_size=3, padding=1, stride=2（降采样）
   
   记住这两个就够了

3. 真出问题了，报错信息会告诉你
```

### 你只需要知道

```
padding（填充）：
    作用：让输出不变小
    常见值：padding=1（配合kernel_size=3）
    
stride（步幅）：
    作用：让输出变小
    常见值：stride=1（正常）
            stride=2（降采样，输出变一半）
```

### 记住这个万能套路

```python
# 套路1：输出大小不变
nn.Conv2d(in_ch, out_ch, kernel_size=3, padding=1, stride=1)
#                                      ^^^^^^^^   ^^^^^^^^
#                                      填充1格    步幅1
# 输入28×28 → 输出28×28（大小不变）

# 套路2：输出大小减半（降采样）
nn.Conv2d(in_ch, out_ch, kernel_size=3, padding=1, stride=2)
#                                                   ^^^^^^^^
#                                                   步幅2
# 输入28×28 → 输出14×14（减半）
```

---

## 优化后的笔记

# 填充(Padding)和步幅(Stride)

---

## 为什么需要它们？

### 问题1：卷积会让图片越来越小

```
输入32×32 → 卷积(核5×5) → 输出28×28
           → 卷积(核5×5) → 输出24×24
           → 卷积(核5×5) → 输出20×24
           → ...
           → 第7层只剩4×4了！
           
太小了，没法继续卷积了
```

**解决方法：padding（填充）**

### 问题2：图片太大，想快速缩小

```
输入224×224 → 想变成7×7
如果每次只减少一点，需要很多层卷积
太慢了！
```

**解决方法：stride（步幅）**

---

## Padding（填充）：让输出不变小

### 直觉理解

```
在图片四周加一圈0

原图：        加padding后：
1 2 3        0 0 0 0 0
4 5 6   →    0 1 2 3 0
7 8 9        0 4 5 6 0
             0 7 8 9 0
             0 0 0 0 0

这样卷积核可以滑到角落里
输出就不会变小了
```

### 常用搭配

```python
# 核3×3，填充1 → 输出大小 = 输入大小
nn.Conv2d(in_ch, out_ch, kernel_size=3, padding=1)

# 核5×5，填充2 → 输出大小 = 输入大小
nn.Conv2d(in_ch, out_ch, kernel_size=5, padding=2)

# 规律：padding = (kernel_size - 1) // 2
```

---

## Stride（步幅）：让输出快速变小

### 直觉理解

```
窗口每次移动的步长

stride=1：每次移动1格（正常）
    □ → □ → □ → □

stride=2：每次移动2格（跳着走）
    □ → → □ → → □
    
stride=3：每次移动3格
    □ → → → □ → → → □
```

### 效果

```python
# stride=1：输出大小基本不变（配合padding=1）
nn.Conv2d(in_ch, out_ch, kernel_size=3, padding=1, stride=1)
# 输入28×28 → 输出28×28

# stride=2：输出大小减半
nn.Conv2d(in_ch, out_ch, kernel_size=3, padding=1, stride=2)
# 输入28×28 → 输出14×14
```

---

## 两个核心套路（背这个就行）

```python
# 套路1：保持大小（最常用）
nn.Conv2d(channels_in, channels_out, 
          kernel_size=3, padding=1, stride=1)
# 输入H×W → 输出H×W

# 套路2：降采样（缩小一半）
nn.Conv2d(channels_in, channels_out, 
          kernel_size=3, padding=1, stride=2)
# 输入H×W → 输出(H/2)×(W/2)
```

---

## 完整例子

```python
net = nn.Sequential(
    # 输入：3×224×224（彩色图）
    nn.Conv2d(3, 64, kernel_size=3, padding=1, stride=1),
    # → 64×224×224（大小不变）
    
    nn.ReLU(),
    nn.Conv2d(64, 128, kernel_size=3, padding=1, stride=2),
    # → 128×112×112（减半）
    
    nn.ReLU(),
    nn.Conv2d(128, 256, kernel_size=3, padding=1, stride=2),
    # → 256×56×56（再减半）
)

X = torch.rand(1, 3, 224, 224)
output = net(X)
print(output.shape)  # torch.Size([1, 256, 56, 56])
```

---

## 要不要会算输出大小？

**不用！直接看：**

```python
output = conv(X)
print(output.shape)   # 一眼就知道
```

**出bug了看报错信息就行。**

---

## 总结

| 参数 | 作用 | 常见值 |
|:---|:---|:---|
| `padding` | 防止图片变小 | 1（配合kernel=3）|
| `stride` | 让图片快速变小 | 1（正常）<br>2（降采样）|

**万能公式：**

```python
# 不想变小
kernel_size=3, padding=1, stride=1

# 想减半
kernel_size=3, padding=1, stride=2
```

**背这两个就够了！**

---

**这样你的笔记就很清晰了，继续学多输入多输出通道那一节吧！**