Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

機械翻訳自動評価指標の比較, 今村+, NLP'04 #393

Open
AkihikoWatanabe opened this issue Jun 25, 2021 · 2 comments
Open

機械翻訳自動評価指標の比較, 今村+, NLP'04 #393

AkihikoWatanabe opened this issue Jun 25, 2021 · 2 comments

Comments

@AkihikoWatanabe
Copy link
Owner

https://www.anlp.jp/proceedings/annual_meeting/2004/pdf_dir/P4-8.pdf

@AkihikoWatanabe
Copy link
Owner Author

AkihikoWatanabe commented Jun 25, 2021

BLEUスコア、NISTスコア、WordErrorRate(WER)などに関して丁寧かつ簡潔に解説してある。
BLEUスコア算出に利用するN-gramは一般的にはN=4が用いられる、といった痒いところに手が届く情報も書いてある。
普段何気なく使っているBLEUスコアで、あれ定義ってどんなだっけ?と立ち帰りたくなった時に読むべし。

@AkihikoWatanabe
Copy link
Owner Author

実際に研究等でBLEUスコアを測りたい場合は、mosesの実装を使うのが間違いない:
https://github.com/moses-smt/mosesdecoder/blob/master/scripts/generic/multi-bleu.perl

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant