Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness, Li+, Peking University, arXiv'23 #534

AkihikoWatanabe · 2023-04-25T14:59:24Z

AkihikoWatanabe · 2023-04-25T15:07:26Z

情報抽出タスクにおいてChatGPTを評価した研究。スタンダードなIEの設定ではBERTベースのモデルに負けるが、OpenIEの場合は高い性能を示した。
また、ChatGPTは予測に対してクオリティが高く信頼に足る説明をしたが、一方で自信過剰な傾向がある。また、ChatGPTの予測はinput textに対して高いfaithfulnessを示しており、予測がinputから根ざしているものであることがわかる。（らしい）

AkihikoWatanabe · 2023-04-25T15:17:32Z

あまりしっかり読んでいないが、Entity Typing, NER, Relation Classification, Relation Extraction, Event Detection, Event Argument Extraction, Event Extractionで評価。standardIEでは、ChatGPTにタスクの説明と選択肢を与え、与えられた選択肢の中から正解を探す設定とした。一方OpenIEでは、選択肢を与えず、純粋にタスクの説明のみで予測を実施させた。OpenIEの結果を、3名のドメインエキスパートが出力が妥当か否か判定した結果、非常に高い性能を示すことがわかった。表を見ると、同じタスクでもstandardIEよりも高い性能を示している（そんなことある？？？）

AkihikoWatanabe · 2023-04-25T15:25:12Z

つまり、選択肢を与えてどれが正解ですか?ときくより、選択肢与えないでCoTさせた方が性能高いってこと？比較可能な設定で実験できているのだろうか。promptは付録に載っているが、output exampleが載ってないのでなんともいえない。StandardIEの設定をしたときに、CoTさせてるかどうかが気になる。もししてないなら、そりゃ性能低いだろうね、という気がする。

AkihikoWatanabe added ChatGPT NLP Assessment InformationExtraction labels Apr 25, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness, Li+, Peking University, arXiv'23 #534

Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness, Li+, Peking University, arXiv'23 #534

AkihikoWatanabe commented Apr 25, 2023

AkihikoWatanabe commented Apr 25, 2023

AkihikoWatanabe commented Apr 25, 2023 •

edited

AkihikoWatanabe commented Apr 25, 2023 •

edited

Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness, Li+, Peking University, arXiv'23 #534

Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness, Li+, Peking University, arXiv'23 #534

Comments

AkihikoWatanabe commented Apr 25, 2023

AkihikoWatanabe commented Apr 25, 2023

AkihikoWatanabe commented Apr 25, 2023 • edited

AkihikoWatanabe commented Apr 25, 2023 • edited

AkihikoWatanabe commented Apr 25, 2023 •

edited

AkihikoWatanabe commented Apr 25, 2023 •

edited