# Amazon Nova Act SDK を使った基本的なブラウザツールの使用方法

## 概要

このチュートリアルでは、Amazon Bedrock Agentcore ブラウザツールと共に Nova Act SDK を使用する方法を学びます。ヘッドレスでブラウザツールを使用する例と、ブラウザをライブで表示する例を提供します。

### チュートリアルの詳細

| 情報                | 詳細                                                                              |
|:--------------------|:---------------------------------------------------------------------------------|
| チュートリアルの種類 | 会話形式                                                                          |
| エージェントの種類   | 単一                                                                             |
| エージェントフレームワーク | Nova Act                                                                         |
| LLM モデル          | Amazon Nova Act モデル                                                            |
| チュートリアルコンポーネント | ヘッドレスでブラウザツールと対話するための NovaAct の使用                           |
| チュートリアルの分野 | 分野                                                                             |
| 例の複雑さ           | 簡単                                                                             |
| 使用する SDK        | Amazon BedrockAgentCore Python SDK、Nova Act                                     |

### チュートリアルのアーキテクチャ

このチュートリアルでは、ブラウザツールと Nova Act を使用する方法を説明します。

例では、自然言語の指示を Nova Act エージェントに送信し、ヘッドレスでBedrock Agentcoreブラウザでタスクを実行します。

<div style="text-align:left">
    <img src="images/architecture_runtime.png" width="50%"/>
</div>

### チュートリアルの主な機能

* ヘッドレスでブラウザツールを使用する
* ブラウザツールと共に Nova Act を使用する

## 前提条件

このチュートリアルを実行するには、以下が必要です:
* Python 3.10+
* AWS 認証情報
* Amazon Bedrock AgentCore SDK
* Nova Act SDK と API キー

In [None]:
!pip install -r requirements.txt

## Bedrock Agentcore ブラウザツールで NovaAct を使用する
ローカルで実行できる Python スクリプトを作成します。スクリプトでは、NovaAct がブラウザセッションの CDP エンドポイントに接続し、playwright アクチュエーションを実行します。

In [None]:
%%writefile basic_browser_with_nova_act.py
以下が日本語訳になります。

"""Amazon Bedrock AgentCore と Nova Act を使用したブラウザ自動化スクリプト

このスクリプトは、以下の方法で AI 駆動の Web 自動化を実演します。
- Amazon Bedrock AgentCore を通じてブラウザセッションを初期化
- 自然言語による Web インタラクションのために Nova Act に接続
- ブラウザを使用した自動検索とデータ抽出の実行
"""

from bedrock_agentcore.tools.browser_client import browser_session
from nova_act import NovaAct
from rich.console import Console
import argparse
import json

console = Console()

from boto3.session import Session

boto_session = Session()
region = boto_session.region_name
print("using region", region)

def browser_with_nova_act(prompt, starting_page, nova_act_key, region="us-west-2"):
    with browser_session(region) as client:
        ws_url, headers = client.generate_ws_headers()
        try:
            with NovaAct(
                cdp_endpoint_url=ws_url,
                cdp_headers=headers,
                preview={"playwright_actuation": True},
                nova_act_api_key=nova_act_key,
                starting_page=starting_page,
            ) as nova_act:
                result = nova_act.act(prompt)
        except Exception as e:
            console.print(f"NovaAct error: {e}")
        return result


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--prompt", required=True, help="Browser Search instruction")
    parser.add_argument("--starting-page", required=True, help="Starting URL")
    parser.add_argument("--nova-act-key", required=True, help="Nova Act API key")
    parser.add_argument("--region", default="us-west-2", help="AWS region")
    args = parser.parse_args()

    result = browser_with_nova_act(
        args.prompt, args.starting_page, args.nova_act_key, args.region
    )
    console.print(f"\n[cyan] Response[/cyan] {result.response}")
    console.print(f"\n[bold green]Nova Act Result:[/bold green] {result}")

#### スクリプトの実行
スクリプトを実行する前に、以下にあなたの Nova Act API キーを貼り付けてください。

In [6]:
NOVA_ACT_KEY= '' ### Paste your Nova Act Key here

日本語訳:
### Nova Act キーをここに貼り付けてください

In [None]:
!python basic_browser_with_nova_act.py --prompt "Search for macbooks and extract the details of the first one" --starting-page "https://www.amazon.com/" --nova-act-key {NOVA_ACT_KEY}

In [None]:
!python basic_browser_with_nova_act.py --prompt "Extract and return today's market gainer and loser's details" --starting-page "https://finance.yahoo.com/" --nova-act-key {NOVA_ACT_KEY}

## 舞台裏で何が起こったのか?

* `browser_session` を使用してブラウザクライアントをインスタンス化したとき、ブラウザクライアントが作成され、セッションが開始されました
* 次に、`cdp_endpoint_url` と `cdp_headers` を使用して、Nova Act がそのブラウザセッションを指すように設定しました
* Nova ACT SDK は、あなたの自然言語の指示を受け取り、ブラウザ上で Playwright の実行を作成しました

# 翻訳するテキスト:
# Congratulations!

日本語訳:
# おめでとうございます!