You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Evaluating automatically-generated text summaries is a challenging task.While there have been many interesting approaches, they still fall short ofhuman evaluations. We present RISE, a new approach for evaluating summaries byleveraging techniques from information retrieval. RISE is first trained as aretrieval task using a dual-encoder retrieval setup, and can then besubsequently utilized for evaluating a generated summary given an inputdocument, without gold reference summaries. RISE is especially well suited whenworking on new datasets where one may not have reference summaries availablefor evaluation. We conduct comprehensive experiments on the SummEval benchmark(Fabbri et al., 2021) and the results show that RISE has higher correlationwith human evaluations compared to many past approaches to summarizationevaluation. Furthermore, RISE also demonstrates data-efficiency andgeneralizability across languages.
Translation (by gpt-3.5-turbo)
自動生成されたテキストの要約の評価は困難な課題です。
興味深いアプローチは多く存在しますが、まだ人間の評価には及びません。
私たちは、情報検索の技術を活用して要約を評価するための新しいアプローチであるRISEを提案します。
RISEは、デュアルエンコーダー検索セットアップを使用して検索タスクとしてトレーニングされ、入力ドキュメントに対して生成された要約を評価する際に、ゴールドリファレンスの要約がなくても利用できます。
RISEは、評価のためのリファレンス要約が利用できない新しいデータセットで特に適しています。
私たちはSummEvalベンチマーク(Fabbri et al.、2021)で包括的な実験を行い、その結果、RISEは要約評価の過去のアプローチと比較して人間の評価との相関が高いことを示しました。
さらに、RISEはデータ効率性と言語間の汎用性も示しています。
AkihikoWatanabe
changed the title
a
RISE: Leveraging Retrieval Techniques for Summarization Evaluation, David Uthus+, N/A, arXiv'22
Aug 13, 2023
AkihikoWatanabe
changed the title
RISE: Leveraging Retrieval Techniques for Summarization Evaluation, David Uthus+, N/A, arXiv'22
RISE: Leveraging Retrieval Techniques for Summarization Evaluation, David Uthus+, N/A, Findings of ACL'23
Aug 14, 2023
URL
Affiliations
Abstract
Translation (by gpt-3.5-turbo)
興味深いアプローチは多く存在しますが、まだ人間の評価には及びません。
私たちは、情報検索の技術を活用して要約を評価するための新しいアプローチであるRISEを提案します。
RISEは、デュアルエンコーダー検索セットアップを使用して検索タスクとしてトレーニングされ、入力ドキュメントに対して生成された要約を評価する際に、ゴールドリファレンスの要約がなくても利用できます。
RISEは、評価のためのリファレンス要約が利用できない新しいデータセットで特に適しています。
私たちはSummEvalベンチマーク(Fabbri et al.、2021)で包括的な実験を行い、その結果、RISEは要約評価の過去のアプローチと比較して人間の評価との相関が高いことを示しました。
さらに、RISEはデータ効率性と言語間の汎用性も示しています。
Summary (by gpt-3.5-turbo)
The text was updated successfully, but these errors were encountered: