### RNN（循环神经网络，Recurrent Neural Network）
- **定义**：RNN 是一种用于处理序列数据的神经网络，能够捕捉时间序列中的依赖关系。它通过在隐藏层中引入循环结构，使得当前时刻的输出不仅取决于当前输入，还取决于之前时刻的状态。
- **特点**：
  - 共享参数：所有时间步共享相同的权重矩阵。
  - 隐藏状态传递：通过隐藏状态将信息从一个时间步传递到下一个时间步。
- **局限性**：
  - 长期依赖问题：由于梯度消失或梯度爆炸，RNN 很难捕捉长时间间隔的依赖关系。

---

### LSTM（长短期记忆网络，Long Short-Term Memory）
- **定义**：LSTM 是 RNN 的一种改进版本，通过引入门控机制来解决长期依赖问题。
- **核心组件**：
  - **遗忘门（Forget Gate）**：决定丢弃哪些信息。
  - **输入门（Input Gate）**：决定更新哪些信息。
  - **输出门（Output Gate）**：决定当前单元的输出。
  - **细胞状态（Cell State）**：用于存储长期信息，通过门控机制进行更新和传递。
- **特点**：
  - 能够有效捕捉长时间间隔的依赖关系。
  - 复杂性较高，计算成本较大。

---

### GRU（门控循环单元，Gated Recurrent Unit）
- **定义**：GRU 是 LSTM 的简化版本，通过合并某些门控机制减少参数数量。
- **核心组件**：
  - **更新门（Update Gate）**：控制前一时刻的隐藏状态和当前输入对当前隐藏状态的影响。
  - **重置门（Reset Gate）**：决定是否忽略前一时刻的隐藏状态。
- **特点**：
  - 参数更少，计算效率更高。
  - 在许多任务中表现接近 LSTM，但训练速度更快。


## 诗歌生成的过程

### 数据预处理

1. **读取诗歌文件**：
   - 从文件中读取诗歌文本。
   - 去除特殊字符和不符合条件的诗歌。
   
2. **统计字频**：
   - 统计每个字在文本中出现的频率。
   
3. **构建字典**：
   - 创建一个字典，将每个字映射到一个唯一的整数索引。
   
4. **转换为整数索引**：
   - 将诗歌文本中的每个字转换为其对应的整数索引，形成整数索引的列表。

### 生成批次数据

1. **分割数据**：
   - 将诗歌数据分成多个批次，每个批次包含多个诗歌。
   
2. **生成输入和输出**：
   - 对于每个批次，生成输入和输出数据。
   - 输出数据是输入数据右移一位的结果，即输入数据的第 \(i\) 个位置对应输出数据的第 \(i+1\) 个位置。

### 模型训练

1. **初始化模型**：
   - 初始化词嵌入层和 RNN 模型。
   
2. **选择优化器和损失函数**：
   - 使用 RMSprop 优化器。
   - 使用负对数似然损失函数（NLLLoss）。
   
3. **训练过程**：
   - 在每个 epoch 中，遍历所有批次。
   - 计算每个批次的损失，并使用优化器更新模型参数。
   
4. **保存模型**：
   - 定期保存训练好的模型，以便后续使用。

### 诗歌生成

1. **加载模型**：
   - 加载训练好的 RNN 模型。
   
2. **生成过程**：
   - 从给定的开始字开始，逐步生成下一个字。
   - 将生成的整数索引转换为对应的汉字。
   - 当生成结束标记或达到最大长度时停止生成。

## 训练截图
![image.png](attachment:image.png)

## 生成诗歌
![d6077dbe330603473c4e42d16f70fb2.png](attachment:d6077dbe330603473c4e42d16f70fb2.png)