关于调用模型做分类任务 #5

louisinhit · 2022-06-20T06:11:41Z

你好作者！我对此工作很感兴趣，因为我现在在用基于transformer的模型做分类任务，transformer或者RNN在分类任务里通常采用最后一个模块的每个通道的最后一个元素作为输出，并通过全连接层映射到几个类别。
请问你觉得RWKV原理类似吗？依旧提取最后一个元素作为输出是否稳妥呢？希望您能给出一些建议，我将很感激！

BlinkDL · 2022-06-20T09:55:55Z

你好，可以试试传统方法，但还有一个办法，RWKV 的 hidden state 很小（请看 https://github.com/BlinkDL/RWKV-v2-RNN-Pile/blob/main/src/model.py 的 .xx .aa .bb ），可以试试直接加个线性层输出。试试用 .xx 和 .aa / .bb 作为线性层的输入。

louisinhit · 2022-06-20T13:22:16Z

好的好的！非常感谢！我这就试试

BlinkDL closed this as completed Feb 7, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于调用模型做分类任务 #5

关于调用模型做分类任务 #5

louisinhit commented Jun 20, 2022

BlinkDL commented Jun 20, 2022

louisinhit commented Jun 20, 2022

关于调用模型做分类任务 #5

关于调用模型做分类任务 #5

Comments

louisinhit commented Jun 20, 2022

BlinkDL commented Jun 20, 2022

louisinhit commented Jun 20, 2022