# Strands Agents with Bedrock AgentCore Browser

本研讨会演示如何将 Strands Agents 与 Amazon Bedrock AgentCore Browser 集成，以创建能够动态与网络浏览器交互的 AI 代理。

## 概述

在本实验中，您将：
- 了解 Bedrock AgentCore Browser 功能
- 使用 Strands Agents 测试浏览器自动化
- 以编程方式导航网站并提取信息
- 探索浏览器自动化的常见用例
- 了解网络交互的最佳实践

## 先决条件

开始本实验之前，请确保您具备：
- 已配置 AWS 凭证（IAM 角色或环境变量）
- 已安装所需的 Python 包
- 对 Strands Agents 和 Bedrock AgentCore 概念有基本了解

如果您没有在假设 IAM 角色的环境中运行，请将您的 AWS 凭证设置为环境变量：

In [None]:
import os

os.environ["AWS_ACCESS_KEY_ID"]=<YOUR ACCESS KEY>
os.environ["AWS_SECRET_ACCESS_KEY"]=<YOUR SECRET KEY>
os.environ["AWS_SESSION_TOKEN"]=<OPTIONAL - YOUR SESSION TOKEN IF TEMP CREDENTIAL>
os.environ["AWS_REGION"]=<AWS REGION WITH BEDROCK AGENTCORE AVAILABLE>

为 Strands Agents 和 Bedrock AgentCore Python SDK 安装所需的包：

In [None]:
%pip install -q strands-agents strands-agents-tools bedrock-agentcore playwright

## 什么是 Bedrock AgentCore Browser？

Amazon Bedrock AgentCore Browser 是一个强大的工具，使 AI 代理能够在安全的托管环境中动态与网络浏览器交互。主要功能包括：

- **网络导航**：以编程方式导航到网站、点击元素和填写表单
- **内容提取**：从网页中提取信息并捕获屏幕截图
- **安全环境**：在隔离的安全浏览器环境中运行
- **JavaScript 执行**：执行自定义 JavaScript 以进行高级网络交互
- **会话管理**：在多个操作中维护浏览器会话

Browser 工具使代理能够执行需要视觉理解和交互功能的复杂基于网络的任务。

### 使用浏览器自动化测试 Strands Agent

让我们演示使用 AgentCore Browser 进行网络自动化的 Strands Agent。我们将导航到 Amazon，搜索咖啡机，并从第一个结果中提取详细的产品信息。

In [None]:
from strands import Agent
from strands_tools.browser import AgentCoreBrowser

agentcore_browser = AgentCoreBrowser()

# Create a recipe assistant agent
agent = Agent(
    model="us.anthropic.claude-3-7-sonnet-20250219-v1:0",  # Optional: Specify the model ID
    #system_prompt="""You are a helpful assistant that provides concise responses. 
    #              When navigate website, please take screenshot for reference.
    #              """,
    system_prompt="""你是一位乐于助人的助手，提供简洁的答复。
                  浏览网站时，请截取屏幕截图以供参考。
                  """,
    tools=[agentcore_browser.browser],
)

#response = agent("Search for a coffee maker on amazon.com and extract details of the first one")
response = agent("在 amazon.com 上搜索咖啡机并提取第一款咖啡机的详细信息")
print(response)

让我们检查代理循环的详细执行流程，以了解代理如何处理请求和生成响应：

In [None]:
print("Agent Loop Detail")
print("-----------------")

print(f"Agent Loop Length: {len(agent.messages)})")
print("\nUser-Assistant Conversation:")
for message in agent.messages:
    print(message)

## Bedrock AgentCore Browser 的常见用例

除了网络搜索之外，Bedrock AgentCore Browser 还支持各种自动化场景：

### 网络应用程序测试
- 在安全环境中测试网络应用程序
- 验证用户界面和功能
- 执行自动化质量保证

### 数据收集和监控
- 从网站提取信息
- 监控网站变化和更新
- 捕获屏幕截图并记录浏览器会话

### 业务流程自动化
- 自动化表单提交和数据输入
- 执行电子商务交易
- 访问在线资源和服务

### AI 驱动的网络交互
- 构建能够导航网络的 AI 代理
- 智能地与网络界面交互
- 执行基于网络的任务和工作流程

**其他资源：**
[Bedrock AgentCore Browser 用例示例](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/browser-use-cases.html#browser-use-cases-examples)