Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks, Bill Yuchen Lin+, N/A, arXiv'23 #752

Open
AkihikoWatanabe opened this issue Jun 16, 2023 · 0 comments
Labels

Comments

@AkihikoWatanabe
Copy link
Owner

AkihikoWatanabe commented Jun 16, 2023

URL

Affiliations

  • Bill Yuchen Lin, N/A
  • Yicheng Fu, N/A
  • Karina Yang, N/A
  • Prithviraj Ammanabrolu, N/A
  • Faeze Brahman, N/A
  • Shiyu Huang, N/A
  • Chandra Bhagavatula, N/A
  • Yejin Choi, N/A
  • Xiang Ren, N/A

Abstract

  • We introduce SwiftSage, a novel agent framework inspired by the dual-processtheory of human cognition, designed to excel in action planning for complexinteractive reasoning tasks. SwiftSage integrates the strengths of behaviorcloning and prompting large language models (LLMs) to enhance task completionperformance. The framework comprises two primary modules: the Swift module,representing fast and intuitive thinking, and the Sage module, emulatingdeliberate thought processes. The Swift module is a small encoder-decoder LMfine-tuned on the oracle agent's action trajectories, while the Sage moduleemploys LLMs such as GPT-4 for subgoal planning and grounding. We develop aheuristic method to harmoniously integrate the two modules, resulting in a moreefficient and robust problem-solving process. In 30 tasks from the ScienceWorldbenchmark, SwiftSage significantly outperforms other methods such as SayCan,ReAct, and Reflexion, demonstrating its effectiveness in solving complexreal-world tasks.

Translation (by gpt-3.5-turbo)

  • SwiftSageという新しいエージェントフレームワークを紹介する。これは、人間の認知の二重プロセス理論に着想を得て設計されたもので、複雑な対話型推論タスクにおけるアクションプランニングに優れている。SwiftSageは、行動クローニングと大規模言語モデル(LLMs)のプロンプティングの強みを統合して、タスク完了のパフォーマンスを向上させる。フレームワークには、SwiftモジュールとSageモジュールの2つの主要なモジュールが含まれる。Swiftモジュールは、オラクルエージェントのアクショントラジェクトリをファインチューニングした小さなエンコーダ・デコーダLMであり、Sageモジュールは、GPT-4などのLLMsを使用してサブゴールの計画とグラウンディングをエミュレートする。2つのモジュールを調和的に統合するためのヒューリスティックな方法を開発し、より効率的で堅牢な問題解決プロセスを実現する。ScienceWorldベンチマークの30のタスクにおいて、SwiftSageはSayCan、ReAct、Reflexionなどの他の手法を大幅に上回り、複雑な現実世界のタスクを解決する効果を示した。

Summary (by gpt-3.5-turbo)

  • SwiftSageは、人間の認知の二重プロセス理論に基づいて設計されたエージェントフレームワークであり、行動クローニングと大規模言語モデルのプロンプティングを統合して、複雑な対話型推論タスクにおけるアクションプランニングに優れている。SwiftモジュールとSageモジュールの2つの主要なモジュールを含み、30のタスクにおいて他の手法を大幅に上回り、複雑な現実世界のタスクを解決する効果を示した。
@AkihikoWatanabe AkihikoWatanabe changed the title SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks, Bill Yuchen Lin+, N/A, arXiv'23 Jun 16, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant