把同一类别(例如code or math) 内多个数据集的得分取平均是如何取平均的?是两个数据集加起来除以2,还是按照样本个数来去计算?
把同一类别(例如code or math) 内多个数据集的得分取平均是如何取平均的?是两个数据集加起来除以2,还是按照样本个数来去计算?