Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

chrF: character n-gram F-score for automatic MT evaluation, Mono Popovic, WMT'15 #985

Open
AkihikoWatanabe opened this issue Aug 13, 2023 · 2 comments

Comments

@AkihikoWatanabe
Copy link
Owner

https://aclanthology.org/W15-3049/

@AkihikoWatanabe
Copy link
Owner Author

AkihikoWatanabe commented Aug 13, 2023

We propose the use of character n-gram F-score for automatic evaluation of machine translation output. Character ngrams have already been used as a part of more complex metrics, but their individual potential has not been investigated yet. We report system-level correlations with human rankings for 6-gram F1-score (CHRF) on the WMT12, WMT13 and WMT14 data as well as segment-level correlation for 6-gram F1 (CHRF) and F3-scores (CHRF3) on WMT14 data for all available target languages. The results are very promising, especially for the CHRF3 score – for translation from English, this variant showed the highest segment-level correlations outperforming even the best metrics on the WMT14 shared evaluation task.

Translation (by gpt-3.5-turbo)

  • 私たちは、機械翻訳の出力の自動評価に文字n-gram Fスコアの使用を提案します。文字n-gramは、より複雑なメトリックの一部としてすでに使用されていますが、その個別の潜在能力はまだ調査されていません。私たちは、WMT12、WMT13、WMT14のデータにおける6-gram F1スコア(CHRF)のシステムレベルの人間のランキングとの相関関係、およびWMT14のデータにおける6-gram F1スコア(CHRF)とF3スコア(CHRF3)のセグメントレベルの相関関係を報告します。利用可能なすべてのターゲット言語に対して。結果は非常に有望であり、特にCHRF3スコアについては非常に高いセグメントレベルの相関関係を示し、WMT14の共有評価タスクでも最高のメトリックを上回りました。

Summary (by gpt-3.5-turbo)

  • 私たちは、機械翻訳の評価に文字n-gram Fスコアを使用することを提案します。私たちは、このメトリックがシステムレベルとセグメントレベルで人間のランキングと相関しており、特にセグメントレベルでの相関が非常に高いことを報告しました。この提案は非常に有望であり、WMT14の共有評価タスクでも最高のメトリックを上回りました。

@AkihikoWatanabe
Copy link
Owner Author

character-basedなn-gram overlapをreferenceとシステムで計算する手法

@AkihikoWatanabe AkihikoWatanabe changed the title chrF: character n-gram F-score for automatic MT evaluation, WMT'15 chrF: character n-gram F-score for automatic MT evaluation, Mono Popovic, WMT'15 Aug 14, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant