欢迎参加科赛网和百度联合举办的Paddle AI智能问答比赛。我们提供此次比赛的评审脚本,供选手在K-Lab内对个人的模型进行验证(validation)和测试(testing)。
初赛将会使用目录下的1st_evaluation.py完成测评,返回 Bleu-4
和 Rouge-L
这两个算法分别对模型的跑分。
算法详细内容请移步至 bleu_scorer.py 和 bleu.py
算法详细内容请移步至 rouge.py
请按照如下步骤完成模型验证和测试。
- 在K-Lab内打开创建的比赛项目
- 在Code Cell内执行下面的指令:
%%bash cd /home/kesci/work git clone https://github.com/Kesci/Baidu_EvaluationScript.git
- 完成仓库的clone之后,请在Code Cell内执行下面的命令,完成validation。
%%bash cd /home/kesci/work/Baidu_EvaluationScript/ python3 1st_evaluation.py /path/to/submit/file /path/to/validation/file
- 你将会看到如下结果,其中的value便是对应算法评测的分数
[{'name': 'Bleu-4', 'value': xxxx, 'type': 'zhidao'}, {'name': 'Rouge-L', 'value': xxxx, 'type': 'zhidao'}]