NUBIA, EvalNLGEval'20 #367

AkihikoWatanabe · 2021-06-02T04:44:39Z

NeUral Based Interchangeability Assessor. A new SoTA evaluation metric for text generation.
https://wl-research.github.io/blog/

AkihikoWatanabe · 2021-06-02T04:52:08Z

TextGenerationに関するSoTAの性能指標。BLEU, ROUGE等と比較して、人間との相関が高い。

pretrainedされたlanguage model（GPT-2=sentence legibility, RoBERTa_MNLI=logical inference, RoBERTa_STS=semantic similarity）を使い、Fully Connected Layerを利用してquality スコアを算出する。算出したスコアは最終的にcalibrationで0~1の値域に収まるように補正される。

AkihikoWatanabe · 2021-06-02T04:53:42Z

意味的に同等の内容を述べた文間でのexample

BLEU, ROUGE, BERTのスコアは低いが、NUBIAでは非常に高いスコアを出せている。

AkihikoWatanabe added ConceptToText DataToText DialogueGeneration DocumentSummarization Metrics NaturalLanguageGeneration NLP PersonalizedDocumentSummarization PersonalizedGeneration labels Jun 2, 2021

AkihikoWatanabe changed the title ~~NUBIA~~ NUBIA, EvalNLGEval'20 Aug 14, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

NUBIA, EvalNLGEval'20 #367

NUBIA, EvalNLGEval'20 #367

AkihikoWatanabe commented Jun 2, 2021

AkihikoWatanabe commented Jun 2, 2021

AkihikoWatanabe commented Jun 2, 2021

NUBIA, EvalNLGEval'20 #367

NUBIA, EvalNLGEval'20 #367

Comments

AkihikoWatanabe commented Jun 2, 2021

AkihikoWatanabe commented Jun 2, 2021

AkihikoWatanabe commented Jun 2, 2021