PaddlePaddle · LemonNoel · Feb 14, 2023 · Feb 14, 2023 · ZHUI · Feb 14, 2023
diff --git a/paddlenlp/transformers/ernie/modeling.py b/paddlenlp/transformers/ernie/modeling.py
@@ -1336,12 +1336,12 @@ def forward(
 
         batch_size, seq_len, hidden_size = sequence_output.shape
         flat_sequence_output = paddle.reshape(sequence_output, [-1, hidden_size])
+        flat_length = paddle.arange(batch_size) * seq_len
+        flat_length = flat_length.unsqueeze(axis=1).astype("int64")
 
-        cls_output = paddle.tensor.gather(flat_sequence_output, cls_positions)
+        cls_output = paddle.tensor.gather(flat_sequence_output, cls_positions + flat_length.squeeze(1))
         q = self.linear_q(cls_output)
 
-        flat_length = paddle.arange(batch_size) * seq_len
-        flat_length = flat_length.unsqueeze(axis=1).astype("int64")
         option_output = paddle.tensor.gather(flat_sequence_output, paddle.reshape(omask_positions + flat_length, [-1]))
         option_output = paddle.reshape(option_output, [batch_size, -1, hidden_size])
         k = self.linear_k(option_output)