RobertaPromptForSequenceClassification 代码实现问题 #47

nongfang55 · 2023-02-12T13:08:04Z

RobertaPromptForSequenceClassification 中的实现原理，大致是单独把RobertaModel 中的 RobertaEmbeddings 拿出来。然后tokenize 过的输入通过 RobertaEmbeddings 获得输入embedding，再拼上 prompt 的 embedding 过 RobertaEncoder。

不过单独拎出来的输入embedding，之前经过RobertaEmbedding时候，已经经过了word、pos、type的embedding相加和LN、drop的过程。而以inputs_embeds为参数输入 RobertaModel 之后，似乎会再次经过上述的操作。

是不是我理解的不对？不然按照我的理解，这么实现好像是有问题的？

Xiao9905 · 2023-02-13T11:11:57Z

@nongfang55 你好，P-tuning v2中的prompt embeddings是通过past_key_value方式传入每一层进行计算的。具体可以看这一行代码，并非是要通过RobertaEmbedding。

nongfang55 · 2023-02-13T13:33:33Z

@Xiao9905 感谢回复， P-tuning v2(RobertaPrefixForSequenceClassification)的实现确实如你所说，没有问题。

我所疑问的点是用于对比的P-tuning v1的代码 (RobertaPromptForSequenceClassification)，这里

Xiao9905 · 2023-02-14T02:44:59Z

@nongfang55 你好，

是的。这里的实现有一些问题，应该使用self.roberta.embeddings.word_embeddings来获取inputs_embeddings。感谢指出，我们会更新这部分的代码。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

RobertaPromptForSequenceClassification 代码实现问题 #47

RobertaPromptForSequenceClassification 代码实现问题 #47

nongfang55 commented Feb 12, 2023

Xiao9905 commented Feb 13, 2023

nongfang55 commented Feb 13, 2023

Xiao9905 commented Feb 14, 2023

RobertaPromptForSequenceClassification 代码实现问题 #47

RobertaPromptForSequenceClassification 代码实现问题 #47

Comments

nongfang55 commented Feb 12, 2023

Xiao9905 commented Feb 13, 2023

nongfang55 commented Feb 13, 2023

Xiao9905 commented Feb 14, 2023