Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

CAMEL: Communicative Agents for ‘Mind’ Exploration of Large Language Model Society #45

Open
shnakazawa opened this issue Apr 21, 2024 · 0 comments

Comments

@shnakazawa
Copy link
Contributor

Li, Guohao, et al. “CAMEL: Communicative Agents for ‘Mind’ Exploration of Large Language Model Society.” arXiv [cs.AI], 31 Mar. 2023, http://arxiv.org/abs/2303.17760. arXiv.

  • 人間の介入を最小限に抑えつつ、課題をLLMエージェント内で協力して解決させるフレームワーク "CAMEL" を提案
  • ロールプレイングとインセプション・プロンプティングという二つの仕組みを導入し、LLMエージェント間の会話を自動化
  • エージェントに割り振るロール+タスク+エージェント同士の会話データを集めたデータセット (AI Society Dataset) も公開

Abstract

The rapid advancement of chat-based language models has led to remarkable progress in complex task-solving. However, their success heavily relies on human input to guide the conversation, which can be challenging and time-consuming. This paper explores the potential of building scalable techniques to facilitate autonomous cooperation among communicative agents, and provides insight into their "cognitive" processes. To address the challenges of achieving autonomous cooperation, we propose a novel communicative agent framework named role-playing. Our approach involves using inception prompting to guide chat agents toward task completion while maintaining consistency with human intentions. We showcase how role-playing can be used to generate conversational data for studying the behaviors and capabilities of a society of agents, providing a valuable resource for investigating conversational language models. In particular, we conduct comprehensive studies on instruction-following cooperation in multi-agent settings. Our contributions include introducing a novel communicative agent framework, offering a scalable approach for studying the cooperative behaviors and capabilities of multi-agent systems, and open-sourcing our library to support research on communicative agents and beyond: this https URL.

(DeepL翻訳)

チャットベースの言語モデルの急速な進歩は、複雑なタスク解決に目覚ましい進歩をもたらした。しかし、その成功は、会話を導くための人間の入力に大きく依存しており、これは困難で時間がかかる可能性がある。本稿では、コミュニケーションエージェント間の自律的な協力を促進するためのスケーラブルな技術構築の可能性を探り、彼らの「認知」プロセスに関する洞察を提供する。自律的な協力を達成するための課題に対処するために、我々はロールプレイングと名付けた新しいコミュニケーション・エージェントのフレームワークを提案する。我々のアプローチでは、人間の意図との整合性を保ちながら、タスク完了に向けてチャットエージェントを誘導するために、インセプションプロンプトを使用する。我々は、ロールプレイングがエージェント社会の行動と能力を研究するための会話データを生成するためにどのように利用できるかを紹介し、会話言語モデルを研究するための貴重なリソースを提供する。特に、マルチエージェント環境における指示に従う協力に関する包括的な研究を行う。我々の貢献には、新しいコミュニケーションエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供、コミュニケーションエージェントやそれ以外の研究をサポートするためのライブラリのオープンソース化などが含まれます。

コード

https://github.com/camel-ai/camel

解決した課題/先行研究との比較

  • LLMは様々なことができるようになってきている。しかし、それには人による、適切な方向に導くための介入が必須であった。
  • 適切な介入プロンプトの作成には手間も時間も専門知識も必要である。
  • 人の介入を自動化できないか?が大きな目標
  • 先行研究ではエージェント間の単純なコミュニケーションが着目されていたが、本論文ではより複雑なタスク解決のためのエージェントの自律性の強化を試みている。
  • エージェントが独自の役割を通じてタスクを理解し、適切な対応を導く新しいフレームワーク CAMEL を提案。

技術・手法のポイント

  • ロールプレイング:エージェントに特定の役割(例えば「Pythonプログラマー」や「株式トレーダー」など)を割り当て、役割に基づいて対話を行わせることで、特定のタスクを実行させる仕組み (Fig.1)。
    Image from Gyazo
  • インセプション・プロンプティング:エージェント間のコミュニケーションを自動化するための手法で、エージェントが自らの役割に基づいたプロンプトを自動生成する仕組み (Fig.2)。
  • これらの仕組みを連携させることで、エージェントが互いに指示を出し合い、協力してタスクの解決に向かっていく。
    • 人間のユーザーが専門知識を持たなくてもエージェントがタスクを自律的に進めることができるようになる。

評価指標

  • 課題を解決するための会話をgpt-3.5-turbo Wins single shotと、提案手法 (CAMEL) に生成させる→生成された文章を人とGPT-4が、どちらの文章のほうが優れているか(自然で、タスクの要求に沿っていて、実用的か)評価→約75%の確率でCAMELの方が優れた文章を生成した (Table 1)。
    • このエージェントに割り振るロール+タスクの組み合わせと、その解決プロセスの会話記録AI Society Datasetとして公開。
  • LLaMA 7Bモデルを20のAI Societyタスク、20のコーディングタスク、20の数学タスクと60の科学タスクでfine-tuning → Fine-tuningに用いるデータ種が増える程、性能が良くなった (Table 2)。

残された課題・議論・感想

  • 3エージェント以上への拡張は本論文では行われていない。
  • ロールの反転、エージェントがユーザーの入力を繰り返すだけ、タスク解決に寄与しない返答、会話の無限ループの発生が観察されている。

関連論文

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant