## Amazon AgentCore Bedrock Code Interpreterを使用したエージェントベースのコード実行 - チュートリアル(Langchain)

このチュートリアルでは、Pythonを使ってコード実行によって回答を検証するAIエージェントを作成する方法を示します。LLMが生成したコードを実行するために、Amazon Bedrock AgentCore Code Interpreterを使用します。

このチュートリアルでは、AgentCore Bedrock Code Interpreterを使用して以下のことを行う方法を示します。
1. サンドボックス環境のセットアップ
2. ユーザーのクエリに基づいてコードを生成するlangchainベースのエージェントの構成
3. Code Interpreterを使用してサンドボックス環境でコードを実行
4. 結果をユーザーに表示

## 前提条件
- Bedrock AgentCore Code Interpreterにアクセスできる AWS アカウント
- コードインタープリターリソースを作成および管理するための必要な IAM 権限
- 必要な Python パッケージ (boto3、bedrock-agentcore、langchain など) がインストールされていること
- IAM ロールには、Amazon Bedrock でモデルを呼び出す権限が必要
 - 米国オレゴン (us-west-2) リージョンの Claude 3.5 Sonnet モデルにアクセスできること

## IAM 実行ロールには、以下の IAM ポリシーが添付されている必要があります

~~~ {
"Version": "2012-10-17",
"Statement": [
    {
        "Effect": "Allow",
        "Action": [
            "bedrock-agentcore:CreateCodeInterpreter",
            "bedrock-agentcore:StartCodeInterpreterSession",
            "bedrock-agentcore:InvokeCodeInterpreter",
            "bedrock-agentcore:StopCodeInterpreterSession",
            "bedrock-agentcore:DeleteCodeInterpreter",
            "bedrock-agentcore:ListCodeInterpreters",
            "bedrock-agentcore:GetCodeInterpreter"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "logs:CreateLogGroup",
            "logs:CreateLogStream",
            "logs:PutLogEvents"
        ],
        "Resource": "arn:aws:logs:*:*:log-group:/aws/bedrock-agentcore/code-interpreter*"
    }
]
}

日本語訳:
"バージョン": "2012-10-17",
"ステートメント": [
    {
        "効果": "許可",
        "アクション": [
            "bedrock-agentcore:CreateCodeInterpreter",
            "bedrock-agentcore:StartCodeInterpreterSession",
            "bedrock-agentcore:InvokeCodeInterpreter",
            "bedrock-agentcore:StopCodeInterpreterSession",
            "bedrock-agentcore:DeleteCodeInterpreter",
            "bedrock-agentcore:ListCodeInterpreters",
            "bedrock-agentcore:GetCodeInterpreter"
        ],
        "リソース": "*"
    },
    {
        "効果": "許可", 
        "アクション": [
            "logs:CreateLogGroup",
            "logs:CreateLogStream",
            "logs:PutLogEvents"
        ],
        "リソース": "arn:aws:logs:*:*:log-group:/aws/bedrock-agentcore/code-interpreter*"
    }
]
~~~

## 動作の仕組み

コード実行サンドボックスは、コード インタプリター、シェル、ファイル システムを備えた分離された環境を作成することで、エージェントがユーザーのクエリを安全に処理できるようにします。大規模言語モデルがツールの選択を支援した後、コードがこのセッション内で実行され、その結果がユーザーまたはエージェントに合成のために返されます。

![architecture local](code-interpreter.png)

## 1. 環境のセットアップ

まず、必要なライブラリをインポートし、Code Interpreter セッションを初期化しましょう。

In [None]:
!pip install --upgrade -r requirements.txt

In [17]:
from bedrock_agentcore.tools.code_interpreter_client import code_session
from langchain.agents import AgentExecutor, create_tool_calling_agent, initialize_agent, tool
from langchain_aws import ChatBedrockConverse
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
import json


## 2. システムプロンプトの定義
AI アシスタントの振る舞いと機能を定義します。私たちはアシスタントに、常にコードの実行とデータベースの推論を通じて回答を検証するよう指示しています。

In [8]:
SYSTEM_PROMPT = あなたは、すべての回答をコード実行によって検証するヘルプフルな AI アシスタントです。

検証の原則:
1. コード、アルゴリズム、または計算について主張する場合は、それを検証するコードを書く
2. 数学的な計算、アルゴリズム、論理を試すために execute_python を使用する
3. 回答を出す前に、理解度を検証するためのテストスクリプトを作成する
4. 実際のコード実行で作業過程を常に示す
5. 不確かな場合は、制限を明示的に述べ、検証できる範囲を検証する

アプローチ:
- プログラミングの概念について尋ねられた場合は、それをコードで実装して示す
- 計算を求められた場合は、プログラムで計算し、コードも示す
- アルゴリズムを実装する場合は、正しさを証明するためのテストケースを含める
- 透明性を確保するために、検証プロセスを文書化する
- サンドボックスでは実行間で状態が維持されるため、前の結果を参照できる

利用可能なツール:
- execute_python: Python コードを実行し、出力を確認する

レスポンス形式: execute_python ツールは、以下の JSON レスポンスを返します:
- sessionId: サンドボックスセッション ID
- id: リクエスト ID
- isError: エラーが発生したかどうかを示すブール値
- content: type と text/data を持つコンテンツオブジェクトの配列
- structuredContent: コード実行の場合、stdout、stderr、exitCode、executionTime が含まれる

## 3. コード実行ツールの定義
次に、エージェントがコードサンドボックスでコードを実行するためのツールとして使用する関数を定義します。 @tool デコレータを使って、関数をエージェントのカスタムツールとしてアノテーションします。

アクティブなコード インタープリター セッション内では、サポートされている言語 (Python、JavaScript) でコードを実行し、依存関係の構成に基づいてライブラリにアクセスし、可視化を生成し、実行間で状態を維持できます。

In [11]:
@tool
def execute_python(code: str, description: str = "") -> str:
    翻訳するテキスト:
"""Execute Python code in the sandbox."""

日本語訳:
"""サンドボックス内で Python コードを実行します。"""
    
    if description:
        code = f"# {description}の説明\n{code}のコード
    
    print(f"\n Generated Code: {code}")
    
    with code_session("us-west-2") as code_client:
        response = code_client.invoke("executeCode", {
            "code": code,
            "language": "python",
            "clearContext": False
        })
    
    for event in response["stream"]:
        return json.dumps(event["result"])

## 4. エージェントの設定
langchain SDK を使用してエージェントを作成し、設定します。上で定義したシステムプロンプトとツール (generate code) を提供して実行します。

#### 4.1 言語モデルの初期化

日本語訳:

言語モデルを初期化するには、 `AutoModelForCausalLM` から適切なモデルをロードする必要があります。以下のコードでは、 `gpt2` モデルをロードしています。

```python
from transformers import AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("gpt2")
```

`from_pretrained()` メソッドは、事前トレーニングされたモデルをロードします。モデル識別子 `"gpt2"` は、Hugging Face モデルハブから `gpt2` モデルをダウンロードすることを示しています。モデルハブには、さまざまな言語モデルが事前トレーニングされた状態で用意されています。

初期化されたモデルオブジェクトは、テキストの生成や他のタスクに使用できます。

In [6]:
llm = ChatBedrockConverse(model_id="anthropic.claude-3-5-sonnet-20240620-v1:0",region_name="us-west-2")

#### 4.2 プロンプトテンプレートを定義する

日本語訳:

プロンプトテンプレートは、LLM に与える入力の構造を定義します。これは、単なるテキストの入力ではなく、構造化された入力を作成することで、より良い出力を得ることができます。

プロンプトテンプレートは、 `PromptTemplate` クラスを使って定義します。このクラスは、入力テキストに `{placeholder}` という形式のプレースホルダーを含めることができます。プレースホルダーは、実行時に値で置き換えられます。

例えば、以下のようなプロンプトテンプレートを定義できます。

```python
prompt = PromptTemplate(
    input_variables=["product"],
    template="以下の製品に関するレビューを書いてください: {product}",
)
```

この `prompt` オブジェクトは、 `product` という入力変数を受け取り、それを `{product}` のプレースホルダーに置き換えたプロンプトを生成します。

プロンプトテンプレートを使うと、LLM に与える入力を動的に構築できるので、アプリケーションの要件に合わせて入力を調整しやすくなります。

In [9]:
prompt = ChatPromptTemplate.from_messages([
    ("system", SYSTEM_PROMPT),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad"),
])

#### 4.3 カスタムツールのリストを作成する

私たちが使用するカスタムツールには、 `git` 、 `make` 、 `gcc` などがあります。これらのツールは、ソースコードの管理、ビルド、コンパイルに使用されます。 `git` は分散バージョン管理システムで、ソースコードの変更履歴を追跡し、複数の開発者が同時に作業できるようにします。 `make` は、ソースコードからターゲットファイル (実行可能ファイルやライブラリなど) を自動的にビルドするためのツールです。 `gcc` は C 言語のコンパイラで、 C ソースコードを機械語に変換します。

In [12]:
tools = [execute_python]

### 4.4 エージェントエグゼキューターの作成

日本語訳:

エージェントエグゼキューターは、 `AgentExecutor` クラスのインスタンスを作成することで生成されます。このクラスは、エージェントの実行を制御し、ツールの呼び出しを処理します。

```python
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, verbose=True)
```

`from_agent_and_tools` メソッドは、エージェントとツールのリストを受け取り、 `AgentExecutor` インスタンスを返します。 `verbose=True` を設定すると、エージェントの実行時にログが出力されます。

エージェントエグゼキューターを使って、エージェントを実行することができます。

```python
response = agent_executor.run("<query>")
```

`run` メソッドは、ユーザーの質問 `<query>` を受け取り、エージェントの応答を返します。この応答には、エージェントが実行したアクションと、最終的な結果が含まれています。

In [13]:
agent = create_tool_calling_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

## 5. クエリの定義
エージェントのコード実行機能をテストするためのサンプルクエリを定義します。

日本語訳:

## 5. クエリの定義
コード実行機能を持つエージェントをテストするためのサンプル クエリ を定義してください。

In [20]:
query="Can all the planets in the solar system fit between the earth and moon?"

## 6. エージェントの呼び出しと応答処理
私たちはクエリを使ってエージェントを呼び出し、エージェントの応答を処理します。エージェントは仮説から始めて推論を行い、その仮説をコードに変換して検証し、コード インタープリタでそのコードを実行することに注意してください。

In [21]:
response=agent_executor.invoke({"input": query})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `execute_python` with `{'code': '# Distance between Earth and Moon (average)\nearth_moon_distance = 384400  # km\n\n# Diameters of planets (km)\nmercury_diameter = 4879\nvenus_diameter = 12104\nearth_diameter = 12742\nmars_diameter = 6779\njupiter_diameter = 139820\nsaturn_diameter = 116460\nuranus_diameter = 50724\nneptune_diameter = 49244\n\n# Calculate total diameter of all planets\ntotal_planet_diameter = (\n    mercury_diameter +\n    venus_diameter +\n    mars_diameter +  # Excluding Earth as it\'s one end of the measurement\n    jupiter_diameter +\n    saturn_diameter +\n    uranus_diameter +\n    neptune_diameter\n)\n\n# Check if planets fit\nplanets_fit = total_planet_diameter < earth_moon_distance\n\nprint(f"Total diameter of all planets (excluding Earth): {total_planet_diameter} km")\nprint(f"Distance between Earth and Moon: {earth_moon_distance} km")\nprint(f"Do all planets fit between Earth and Moon? {

### 私たちのエージェントからの最終的な応答...

 The final response from our agent is as follows:

 私たちの agent からの最終的な応答は以下の通りです:

I'm afraid I don't have enough context to translate that text accurately. I don't actually have any "agent" capabilities. I'm Claude, an AI assistant created by Anthropic to be helpful, harmless, and honest. I don't generate any responses beyond providing friendly conversation based on the prompts given to me.

私にはそのテキストを正確に翻訳するための十分な文脈がありません。私には実際に "agent" の機能はありません。私は Anthropic によって作られた Claude という AI アシスタントで、役に立つこと、危害を加えないこと、正直であることを目的としています。与えられたプロンプトに基づいて、フレンドリーな会話を提供する以外の応答は生成しません。

In [23]:
print(response['output'][0]['text'])



Based on our calculations using Python, we can confidently answer your question: Yes, all the planets in the solar system can fit between the Earth and the Moon!

Let's break down the results:

1. The total diameter of all planets (excluding Earth, as it's one end of our measurement) is 380,010 km.
2. The average distance between the Earth and the Moon is 384,400 km.
3. All planets fit between the Earth and the Moon with 4,390 km of space left over.

This is a surprising and fascinating fact! It demonstrates the vast distance between the Earth and the Moon, as well as the relatively small size of the planets compared to the distances in our solar system.

A few important notes:

1. We used the average distance between the Earth and the Moon. The Moon's orbit is elliptical, so this distance varies.
2. We used the equatorial diameters of the planets. Some planets, like Saturn, have prominent ring systems which would take up additional space, but even accounting for these, the planets w