T5Score

This is the Repo for the paper: T5Score: Discriminative Fine-tuning of Generative Evaluation Metrics.

Evaluation

Calculate Evaluation Score

You can run T5Score on a corpus to get automatic evaluation score. An example to evaluate on WMT20 is provided. We also provide an example result of language pair cs-en for corpus WMT20.

Calculate Correlation Score

To compare the automatic evaluation method with human judgements, you can run segment level analysis and system level analysis as follows:

$ python evaluation/calculate_corr.py \
      --dir "./evaluation/results/" \
      --language_pair "cs-en" \
      --filename "scores.csv" \
      --metrics "t5_score_ref_F"

Training

Generative Training

You can use parallel data to train your custom unsupervised T5Score. An example trained on a multilingual paraphrase dataset Paracotta is provided.

Discriminative Training

You can use paired data with human judgements to train your custom supervised T5Score. An example trained on dataset from WMT17 to WMT19 is provided.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
discriminative_training		discriminative_training
evaluation		evaluation
generative_training		generative_training
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

discriminative_training

discriminative_training

evaluation

evaluation

generative_training

generative_training

.gitignore

.gitignore

README.md

README.md

init.py

init.py

requirements.txt

requirements.txt

Repository files navigation

T5Score

Evaluation

Calculate Evaluation Score

Calculate Correlation Score

Training

Generative Training

Discriminative Training

About

Releases

Packages

Languages

qinyiwei/T5Score

Folders and files

Latest commit

History

Repository files navigation

T5Score

Evaluation

Calculate Evaluation Score

Calculate Correlation Score

Training

Generative Training

Discriminative Training

About

Resources

Stars

Watchers

Forks

Languages