作者:jinchengll
基于COCO Caption Evaluation page实现使用自动指标对Video captioning任务的结果进行评估。
它提供以下类型的得分:
- CIDEr
- Bleu_4
- Bleu_3
- Bleu_2
- Bleu_1
- ROUGE_L
- METEOR
- jdk8
更换清华源,更换方式自行查找。
- python = 2.7
- numpy=1.10.1
- matplotlib=1.5.1
- scikit-image=0.12.3
- 获取这份代码
git clone https://github.com/jinchengll/caption-eval.git
- 进入到目录
cd caption-eval
- 获取coco evaluation 脚本
sh get_coco_scripts.sh
- 去掉SPICE计算,非常重要!!! 注释掉
coco-caption/pycocoevalcap/eval.py
的第44行:# (Spice(), "SPICE")
- 将你的正确的描述格式化成与
data/lable_references/references.txt
一致 - 将你的模型输出文字格式化成与
data/caption_output/20_predicted_sentences.txt
一致,在caption_output
文件夹下可以放置多个输出文件,例如:20_predicted_sentences.txt
代表模型第20次训练得到的结果。因此如果有多个输出可以模仿这个样式。然而如果你只需要评估一个输出,你也需要以类似的方式命名你的文件:XXX_predicted_sentences.tx
- 在caption-eval文件下执行
eval_script.py
代码:python eval_script.py
- 最终结果保存在:
caption-eval/result.txt
有任何问题可以联系jinchengll@qq.com