Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Towards A Unified Agent with Foundation Models, Norman Di Palo+, N/A, arXiv'23 #883

Open
AkihikoWatanabe opened this issue Jul 22, 2023 · 1 comment

Comments

@AkihikoWatanabe
Copy link
Owner

AkihikoWatanabe commented Jul 22, 2023

URL

Affiliations

  • Norman Di Palo, N/A
  • Arunkumar Byravan, N/A
  • Leonard Hasenclever, N/A
  • Markus Wulfmeier, N/A
  • Nicolas Heess, N/A
  • Martin Riedmiller, N/A

Abstract

  • Language Models and Vision Language Models have recently demonstratedunprecedented capabilities in terms of understanding human intentions,reasoning, scene understanding, and planning-like behaviour, in text form,among many others. In this work, we investigate how to embed and leverage suchabilities in Reinforcement Learning (RL) agents. We design a framework thatuses language as the core reasoning tool, exploring how this enables an agentto tackle a series of fundamental RL challenges, such as efficient exploration,reusing experience data, scheduling skills, and learning from observations,which traditionally require separate, vertically designed algorithms. We testour method on a sparse-reward simulated robotic manipulation environment, wherea robot needs to stack a set of objects. We demonstrate substantial performanceimprovements over baselines in exploration efficiency and ability to reuse datafrom offline datasets, and illustrate how to reuse learned skills to solvenovel tasks or imitate videos of human experts.

Translation (by gpt-3.5-turbo)

  • 最近、言語モデルとビジョン言語モデルは、テキスト形式での人間の意図の理解、推論、シーン理解、計画のような行動など、前例のない能力を示しています。本研究では、このような能力を強化学習(RL)エージェントに埋め込み、活用する方法を調査します。言語を中核とした推論ツールとして使用するフレームワークを設計し、これによってエージェントが効率的な探索、経験データの再利用、スキルのスケジューリング、観測からの学習など、従来は別々に設計されたアルゴリズムが必要とされるRLの基本的な課題に取り組むことができるかを探求します。我々は、スパースな報酬のシミュレーションロボット操作環境でのテストを行いました。この環境では、ロボットが一連のオブジェクトを積み重ねる必要があります。我々は、探索効率とオフラインデータセットからのデータ再利用能力において、ベースラインに比べて大幅な性能向上を実証し、学習済みのスキルを新しいタスクの解決や人間の専門家のビデオの模倣に活用する方法を示しています。

Summary (by gpt-3.5-turbo)

  • 本研究では、言語モデルとビジョン言語モデルを強化学習エージェントに組み込み、効率的な探索や経験データの再利用などの課題に取り組む方法を調査しました。スパースな報酬のロボット操作環境でのテストにおいて、ベースラインに比べて大幅な性能向上を実証し、学習済みのスキルを新しいタスクの解決や人間の専門家のビデオの模倣に活用する方法を示しました。
@AkihikoWatanabe
Copy link
Owner Author

image

@AkihikoWatanabe AkihikoWatanabe changed the title Towards A Unified Agent with Foundation Models, Norman Di Palo+, N/A, arXiv'23 Jul 22, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant