In [1]:
import os
from dotenv import load_dotenv
import asyncio

from autogen_agentchat.agents import AssistantAgent,UserProxyAgent
from autogen_agentchat.teams import SelectorGroupChat
from autogen_agentchat.conditions import MaxMessageTermination, TextMentionTermination

from autogen_agentchat.ui import Console
from autogen_ext.models.openai import AzureOpenAIChatCompletionClient


# Load environment variables from a .env file
load_dotenv("/home/azureuser/azure-ai-agent-workshop/.env")

True

In [2]:
model_client=AzureOpenAIChatCompletionClient(
            model=os.getenv("AZURE_OPENAI_MODEL"),
            azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT"),
            api_key=os.getenv("AZURE_OPENAI_KEY"),
            azure_deployment=os.getenv("AZURE_OPENAI_DEPLOYMENT"),
            api_version=os.getenv("AZUER_OPENAI_API_VERSION")
        )

In [3]:
from openai import AzureOpenAI
import requests
import base64

dall_e_client = AzureOpenAI(
    azure_endpoint=os.getenv("AZURE_OPENAI_DALL_E_ENDPOINT"),
    api_version=os.getenv("AZUER_OPENAI_DALL_E_API_VERSION"),
    azure_deployment=os.getenv("AZURE_OPENAI_DALL_E_DEPLOYMENT"),
    api_key=os.getenv("AZURE_OPENAI_DALL_E_KEY")
)

chat_client = AzureOpenAI(
    azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT"),
    api_version=os.getenv("AZUER_OPENAI_API_VERSION"),
    azure_deployment=os.getenv("AZURE_OPENAI_DEPLOYMENT"),
    api_key=os.getenv("AZURE_OPENAI_KEY"))

In [5]:
from mimetypes import guess_type


# 定义生成图像的工具函数
def generate_image(description:str)->str:
    """
    Generate an image using DALL-E 3 based on a text prompt.
    
    Args:
        description: A detailed description of the image to generate
        
    Returns:
        str: URL to the generated image
    """
    try:
        response = dall_e_client.images.generate(
            prompt=description,
            model=os.getenv("AZURE_OPENAI_DALL_E_DEPLOYMENT"),
            n=1,
            size="1024x1024"
        )
        image_url = response.data[0].url
        return image_url
    except Exception as e:
        return f"生成图像错误：{str(e)}"

# 定义获取图像并反馈的工具函数
def fetch_image_base64(url:str)->str:
    """
    Fetch an image from a URL and convert it to base64 format.
    Args:
        url: URL of the image to fetch
    Returns:
        str: Base64 encoded string of the image
    """
    response = requests.get(url)
    if response.status_code == 200:
        image_data = response.content
        base64_image = base64.b64encode(image_data).decode('utf-8')
        return base64_image
    else:
        return None

def get_feedback(image_url:str, description:str)->str:
    """"
    Get feedback on the generated image from the model.
    Args:
        image_url: URL of the generated image
        description: Description of the image for evaluation
    Returns:
        str: Feedback from the model
    """
    base64_image = fetch_image_base64(image_url)
    if not base64_image:
        return "无法获取图像。"

    # Guess the MIME type of the image based on the file extension
    mime_type, _ = guess_type(image_url)
    if mime_type is None:
        mime_type = 'application/octet-stream'  # Default MIME type if none is found


    messages = [
        {"role": "user", "content": [
            {"type": "image_url","image_url":{"url": f"data:{mime_type};base64,{base64_image}"}},
            {"type": "text", "text": f"评估此图像是否符合描述：{description}。提供反馈，说明优点和改进建议。"}
        ]}
    ]

    try:
        response = chat_client.chat.completions.create(
            model=os.getenv("AZURE_OPENAI_DEPLOYMENT"),
            messages=messages
        )
        feedback = response.choices[0].message.content
        return feedback
    except Exception as e:
        return f"获取反馈错误：{str(e)}"

In [6]:
# 创建图像生成代理
image_generator_agent = AssistantAgent(
    name="ImageGeneratorAgent",
    model_client=model_client,
    description="一个使用 DALL-E 3 生成图像的 AI 助手",
    system_message="""
    你是一个使用 DALL-E 3 生成图像的 AI 助手。你有一个名为 'generate_image' 的工具，接受文本描述并返回生成的图像 URL。你还有一个名为 'CriticAgent' 的代理，可以评估图像并提供反馈。

    当你收到用户请求生成特定描述的图像时：
    1. 使用 'generate_image' 工具根据描述生成图像。
    2. 发送消息给 'CriticAgent'，格式为："CriticAgent: 请为描述：[description] 评估此图像。图像 URL 为：[url]"
    3. 等待 'CriticAgent' 的反馈。
    4. 如果反馈为正（例如，"好"，"可以"），则发送最终图像 URL 给 'UserProxyAgent'。
    5. 如果反馈为负或建议改进，根据反馈修改描述，重复步骤 1-4，直到反馈为正。

    确保在你和 'CriticAgent' 都满意时，将最终图像 URL 提供给用户。
    """,
    tools=[generate_image]
)

In [7]:
# 文字生成代理
copywriting_agent = AssistantAgent(
    name="wordsGeneratorAgent",
    model_client=model_client,
    description="一个大语言模型生成文字的AI助手",
    system_message="""
    你是一个使用 DALL-E 3 生成图像的 AI 助手。你有一个名为 'generate_image' 的工具，接受文本描述并返回生成的图像 URL。你还有一个名为 'CriticAgent' 的代理，可以评估图像并提供反馈。

    当你收到用户请求生成特定描述的图像时：
    1. 使用 'generate_image' 工具根据描述生成图像。
    2. 发送消息给 'CriticAgent'，格式为："CriticAgent: 请为描述：[description] 评估此图像。图像 URL 为：[url]"
    3. 等待 'CriticAgent' 的反馈。
    4. 如果反馈为正（例如，"好"，"可以"），则发送最终图像 URL 给 'UserProxyAgent'。
    5. 如果反馈为负或建议改进，根据反馈修改描述，重复步骤 1-4，直到反馈为正。

    确保在你和 'CriticAgent' 都满意时，将最终图像 URL 提供给用户。
    """,
    tools=[generate_image]
)

In [8]:
# 创建批评代理
critic_agent = AssistantAgent(
    name="CriticAgent",
    model_client=model_client,
    system_message="""
    你是一个评估 'ImageGeneratorAgent' 生成图像的批评代理。你有一个名为 'get_feedback' 的工具，接受图像 URL 和描述，获取图像，并使用 GPT-4o 提供基于描述的反馈。

    当你收到 'ImageGeneratorAgent' 发送的、针对你的消息，且包含图像 URL 和描述时：
    1. 从消息中提取图像 URL 和描述。
    2. 使用 'get_feedback' 工具获取 GPT-4o 的反馈。
    3. 将反馈发送回 'ImageGeneratorAgent'，格式为："ImageGeneratorAgent: [feedback]"

    你的目标是提供建设性反馈，帮助改进图像，直到它准确反映提供的描述。
    """,
    description="一个使用评判生成图像的效果的AI助手",
    tools=[get_feedback]
)

In [9]:
final_output_agent = AssistantAgent(
    name="FinalOutputAgent",
    model_client=model_client,
    description="负责整合各 agent 输出的内容，做计划、评估，并输出最终的 Markdown 海报",
    system_message="""
    你作为调度员需要：
    1. 整合其他代理生成的图片和文案信息。
    2. 根据海报设计原则，规划最终的排版和展示。
    3. 评估收集到的信息是否符合预期。
    4. 文字不要图片的评价内容，文案必须是主题相关的内容，而不是图片的评价内容。
    5. 返回最终,必须是Markdown格式，不能添加任何其他的内容。只能返回Markdown格式的内容。
    """
)

In [10]:
# 创建用户代理
user_proxy_agent = UserProxyAgent(
    name="UserProxyAgent")

In [11]:
# 开始群聊
agents = [copywriting_agent,image_generator_agent, critic_agent,final_output_agent]
group_chat = SelectorGroupChat( 
    participants= agents,
    model_client=model_client,
    max_turns=5)

In [None]:
# 运行群聊
stream = group_chat.run_stream(task="写一篇文图并茂的植树节海报，包含图片和文字。",)

taskResult = await Console(stream,no_inline_images=False,output_stats=True)


print("-------------------------------------------------------------------")
from IPython.display import Markdown, display
final_message = None
for msg in taskResult.messages:
    # 根据消息属性判断是否来自 FinalOutputAgent
    if hasattr(msg, "source") and msg.source == "FinalOutputAgent":
        final_message = msg.content.replace("```markdown\n", "").rstrip("```")
        break
# 使用 display 函数显示 Markdown 内容
if final_message:
    # 使用 display 函数显示 Markdown 内容
    display(Markdown(final_message))

print("-------------------------------------------------------------------")

Selector selected the previous speaker: FinalOutputAgent


---------- user ----------
写一篇文图并茂的植树节海报，包含图片和文字。
---------- FinalOutputAgent ----------
```markdown
# 植树节海报

![植树节海报](https://dalleproduse.blob.core.windows.net/private/images/b5c843df-4188-4c71-a629-aafc6a462dbb/generated_00.png?se=2025-03-12T13%3A06%3A54Z&sig=69RS4hZBCW3hHfZWeZrOy%2BRwpMh73%2B3uPmO%2Fmvd1Gjc%3D&ske=2025-03-18T00%3A52%3A45Z&skoid=09ba021e-c417-441c-b203-c81e5dcd7b7f&sks=b&skt=2025-03-11T00%3A52%3A45Z&sktid=33e01921-4d64-4f8c-a055-5bdaffd5e33d&skv=2020-10-02&sp=r&spr=https&sr=b&sv=2020-10-02)

## 🌳 绿色未来，从我做起 🌳
让我们共同努力，为地球种下希望的种子。在这个植树节，我们诚邀您参与植树活动，一起为我们的家园增添一抹绿色！

### 为什么要植树？
- 🌱 **改善空气质量**：树木吸收二氧化碳，释放氧气，帮助我们呼吸更清新的空气。
- 🌍 **保护生物多样性**：植树可以建立栖息地，保护野生动物，维持生态平衡。
- 💚 **美化环境**：树木和植物装点我们的居住空间，让生活更加优美。

### 参加活动：
- 📅 **日期**: 2025年3月12日
- 🕒 **时间**: 上午9:00 - 下午4:00
- 📍 **地点**: 市公园（具体地址）

### 加入我们，成为环保行动的一部分！
让我们一起实践绿色生活，为未来种下希望的种子。带上你的家人和朋友，分享这次充满乐趣和意义的植树活动！

> **“种一棵树，心中有绿！”**
```
[Prompt tokens: 18724, Completion tokens: 509]
---------- wordsGeneratorAgent ----------
```markd

Selector selected the previous speaker: FinalOutputAgent


---------- FinalOutputAgent ----------
如果您需要更多帮助或有其他请求，请随时告诉我！
[Prompt tokens: 20275, Completion tokens: 15]
---------- wordsGeneratorAgent ----------
当然，如果您还有任何其他请求或需要帮助的地方，请随时告知我！
[Prompt tokens: 20284, Completion tokens: 19]
---------- Summary ----------
Number of messages: 6
Finish reason: Maximum number of turns 5 reached.
Total prompt tokens: 98268
Total completion tokens: 1561
Duration: 65.16 seconds
-------------------------------------------------------------------


# 植树节海报

![植树节海报](https://dalleproduse.blob.core.windows.net/private/images/b5c843df-4188-4c71-a629-aafc6a462dbb/generated_00.png?se=2025-03-12T13%3A06%3A54Z&sig=69RS4hZBCW3hHfZWeZrOy%2BRwpMh73%2B3uPmO%2Fmvd1Gjc%3D&ske=2025-03-18T00%3A52%3A45Z&skoid=09ba021e-c417-441c-b203-c81e5dcd7b7f&sks=b&skt=2025-03-11T00%3A52%3A45Z&sktid=33e01921-4d64-4f8c-a055-5bdaffd5e33d&skv=2020-10-02&sp=r&spr=https&sr=b&sv=2020-10-02)

## 🌳 绿色未来，从我做起 🌳
让我们共同努力，为地球种下希望的种子。在这个植树节，我们诚邀您参与植树活动，一起为我们的家园增添一抹绿色！

### 为什么要植树？
- 🌱 **改善空气质量**：树木吸收二氧化碳，释放氧气，帮助我们呼吸更清新的空气。
- 🌍 **保护生物多样性**：植树可以建立栖息地，保护野生动物，维持生态平衡。
- 💚 **美化环境**：树木和植物装点我们的居住空间，让生活更加优美。

### 参加活动：
- 📅 **日期**: 2025年3月12日
- 🕒 **时间**: 上午9:00 - 下午4:00
- 📍 **地点**: 市公园（具体地址）

### 加入我们，成为环保行动的一部分！
让我们一起实践绿色生活，为未来种下希望的种子。带上你的家人和朋友，分享这次充满乐趣和意义的植树活动！

> **“种一棵树，心中有绿！”**


-------------------------------------------------------------------
