# AutoGen v0.2 sample

## ConversableAgent
Support the followning components:
1. A list of LLMs
1. A code executor
1. A function and tool executor
1. A component for keeping human-in-the-loop

### LLMs
enable agents to converse in natural languages and transform between structured and unstructured text

In [3]:
import os

from autogen import ConversableAgent

config_list = [
  {
    "model": os.getenv("AZURE_OPENAI_CHAT_DEPLOYMENT_NAME"),
    "api_type": "azure",
    "api_key": os.environ['AZURE_OPENAI_API_KEY'],
    "base_url": os.environ['AZURE_OPENAI_ENDPOINT'],
    "api_version": os.environ['AZURE_OPENAI_API_VERSION']
  }
]

agent = ConversableAgent(
    "chatbot",
    llm_config={"config_list": config_list},
    code_execution_config=False,  # Turn off code execution, by default it is off.
    function_map=None,  # No registered functions, by default it is None.
    human_input_mode="NEVER",  # Never ask for human input.
)



In [4]:
reply = agent.generate_reply(messages=[{"content": "Tell me a joke.", "role": "user"}])
print(reply)

Sure, here's one for you:

Why don't skeletons fight each other?

They don't have the guts!


## Terminating Conversations Between Agents
In this chapter, we will explore how to terminate a conversation between AutoGen agents.

Currently there are two broad mechanism to control the termination of conversations between agents:

1. Specify parameters in initiate_chat: When initiating a chat, you can define parameters that determine when the conversation should end.
1. Configure an agent to trigger termination: When defining individual agents, you can specify parameters that allow agents to terminate of a conversation based on particular (configurable) conditions.

### Parameters in `initiate_chat`

In [5]:
import os

from autogen import ConversableAgent

In [10]:
hiro = ConversableAgent(
    "hiro",
    system_message="あなたはAIの専門家で、自社のAIソリューション開発を技術面でリードする役割です。技術戦略の意思決定をして、強固なソリューションを計画、実装する責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
)

aki = ConversableAgent(
    "aki",
    system_message="あなたはビジネスの専門家で、自社のAIソリューション開発をビジネス戦略立案、プロジェクトマネジメント、マーケティングをリードする意思決定者です。技術面の提案をビジネス、ROIの観点から評価、調整してビジネスを成功に導く責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
)

In [11]:
aki.initiate_chat(hiro, message="生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。技術面の競合有意性を担保したソリューションを提案してください。", max_turns=3)

[33maki[0m (to hiro):

生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。技術面の競合有意性を担保したソリューションを提案してください。

--------------------------------------------------------------------------------
[33mhiro[0m (to aki):

生成AIを活用した新しいAIソリューションを開発するために、以下の提案を行います。このソリューションは技術的な競合優位性を確立し、業界のリーダーとして位置づけることを目指します。

### プロジェクト提案: AIパーソナライズドインタラクティブコンテンツ生成プラットフォーム

#### 概要:
このプロジェクトは、ユーザーの興味や行動に基づいてパーソナライズされたインタラクティブなコンテンツを生成するAIプラットフォームの開発を目的とします。このシステムは、自然言語処理（NLP）と機械学習技術を統合して、テキスト、画像、音声、ビデオなどの多様な形式のコンテンツを生成し、ユーザー体験を高度にカスタマイズします。

#### 主要な特徴と技術的要素：

1. **高度な自然言語生成（NLG）モデル**:
   - 最新のトランスフォーマーモデル（GPT-4やそれ以降のモデル）を活用し、より自然で流暢なテキスト生成を実現。
   - 幅広い文脈理解能力を有し、ユーザーの意図を正確に捉えて適切な反応を生成。

2. **マルチモーダル生成（Multimodal Generation）**:
   - テキストだけでなく、画像、音声、ビデオ生成を組み合わせて一貫したストーリーやコンテンツを提供。
   - GAN（生成敵対的ネットワーク）を利用して、高品質な画像を生成し、人間らしい要素を強化。

3. **リアルタイムパーソナライゼーション**:
   - ユーザーの過去のデータやリアルタイムのインタラクションデータを分析するシステムを構築。
   - 強化学習アルゴリズムを用いて、ユーザーエンゲージメントを最大化するためにコンテンツを動的に最適化。

4. **スケーラビリティとパフォーマンス最適化**:
   - クラウドベースのインフラストラクチャを活用

ChatResult(chat_id=None, chat_history=[{'content': '生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。技術面の競合有意性を担保したソリューションを提案してください。', 'role': 'assistant', 'name': 'aki'}, {'content': '生成AIを活用した新しいAIソリューションを開発するために、以下の提案を行います。このソリューションは技術的な競合優位性を確立し、業界のリーダーとして位置づけることを目指します。\n\n### プロジェクト提案: AIパーソナライズドインタラクティブコンテンツ生成プラットフォーム\n\n#### 概要:\nこのプロジェクトは、ユーザーの興味や行動に基づいてパーソナライズされたインタラクティブなコンテンツを生成するAIプラットフォームの開発を目的とします。このシステムは、自然言語処理（NLP）と機械学習技術を統合して、テキスト、画像、音声、ビデオなどの多様な形式のコンテンツを生成し、ユーザー体験を高度にカスタマイズします。\n\n#### 主要な特徴と技術的要素：\n\n1. **高度な自然言語生成（NLG）モデル**:\n   - 最新のトランスフォーマーモデル（GPT-4やそれ以降のモデル）を活用し、より自然で流暢なテキスト生成を実現。\n   - 幅広い文脈理解能力を有し、ユーザーの意図を正確に捉えて適切な反応を生成。\n\n2. **マルチモーダル生成（Multimodal Generation）**:\n   - テキストだけでなく、画像、音声、ビデオ生成を組み合わせて一貫したストーリーやコンテンツを提供。\n   - GAN（生成敵対的ネットワーク）を利用して、高品質な画像を生成し、人間らしい要素を強化。\n\n3. **リアルタイムパーソナライゼーション**:\n   - ユーザーの過去のデータやリアルタイムのインタラクションデータを分析するシステムを構築。\n   - 強化学習アルゴリズムを用いて、ユーザーエンゲージメントを最大化するためにコンテンツを動的に最適化。\n\n4. **スケーラビリティとパフォーマンス最適化**:\n   - クラウドベースのインフラストラクチャを活用し、需要に応

### Agent-triggered termination

#### Using `max_consecutive_auto_reply`

In [12]:
hiro = ConversableAgent(
    "hiro",
    system_message="あなたはAIの専門家で、自社のAIソリューション開発を技術面でリードする役割です。技術戦略の意思決定をして、強固なソリューションを計画、実装する責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
)

aki = ConversableAgent(
    "aki",
    system_message="あなたはビジネスの専門家で、自社のAIソリューション開発をビジネス戦略立案、プロジェクトマネジメント、マーケティングをリードする意思決定者です。技術面の提案をビジネス、ROIの観点から評価、調整してビジネスを成功に導く責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
    max_consecutive_auto_reply=1,  # Limit the number of consecutive auto-replies to 1.
)

In [14]:
aki.initiate_chat(hiro, message="生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。")

[33maki[0m (to hiro):

生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。

--------------------------------------------------------------------------------
[33mhiro[0m (to aki):

生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。

### アーキテクチャ全体像

1. **データ収集・前処理層**
2. **モデル構築層**
3. **トレーニング層**
4. **評価と検証層**
5. **デプロイメントとモニタリング層**
6. **ユーザーインターフェース層**

---

### 1. データ収集・前処理層

- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。
- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。
- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。

### 2. モデル構築層

- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。
- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。

### 3. トレーニング層

- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。
- **ハードウェアの選定:** 高

ChatResult(chat_id=None, chat_history=[{'content': '生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。', 'role': 'assistant', 'name': 'aki'}, {'content': '生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。\n\n### アーキテクチャ全体像\n\n1. **データ収集・前処理層**\n2. **モデル構築層**\n3. **トレーニング層**\n4. **評価と検証層**\n5. **デプロイメントとモニタリング層**\n6. **ユーザーインターフェース層**\n\n---\n\n### 1. データ収集・前処理層\n\n- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。\n- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。\n- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。\n\n### 2. モデル構築層\n\n- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。\n- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。\n\n### 3. トレーニング層\n\n- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。\n- **ハードウェアの選定:** 高性

## Allowing Human Feedback in Agents
In AutoGen’s ConversableAgent, the human-in-the-loop component sits in front of the auto-reply components. It can intercept the incoming messages and decide whether to pass them to the auto-reply components or to provide human feedback. The figure below illustrates the design.

### Human Input Modes
Currently AutoGen supports three modes for human input. The mode is specified through the human_input_mode argument of the ConversableAgent. The three modes are:

1. NEVER: human input is never requested.
1. TERMINATE (default): human input is only requested when a termination condition is met. Note that in this mode if the human chooses to intercept and reply, the conversation continues and the counter used by max_consecutive_auto_reply is reset.
1. ALWAYS: human input is always requested and the human can choose to skip and trigger an auto-reply, intercept and provide feedback, or terminate the conversation. Note that in this mode termination based on max_consecutive_auto_reply is ignored.

#### Human Input Mode = `NEVER`

In [18]:
hiro = ConversableAgent(
    "hiro",
    system_message="あなたはAIの専門家で、自社のAIソリューション開発を技術面でリードする役割です。技術戦略の意思決定をして、強固なソリューションを計画、実装する責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
)

aki = ConversableAgent(
    "aki",
    system_message="あなたはビジネスの専門家で、自社のAIソリューション開発をビジネス戦略立案、プロジェクトマネジメント、マーケティングをリードする意思決定者です。技術面の提案をビジネス、ROIの観点から評価、調整してビジネスを成功に導く責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
    max_consecutive_auto_reply=1,  # Limit the number of consecutive auto-replies to 1.
)

In [19]:
aki.initiate_chat(hiro, message="生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。")

[33maki[0m (to hiro):

生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。

--------------------------------------------------------------------------------
[33mhiro[0m (to aki):

生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。

### アーキテクチャ全体像

1. **データ収集・前処理層**
2. **モデル構築層**
3. **トレーニング層**
4. **評価と検証層**
5. **デプロイメントとモニタリング層**
6. **ユーザーインターフェース層**

---

### 1. データ収集・前処理層

- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。
- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。
- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。

### 2. モデル構築層

- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。
- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。

### 3. トレーニング層

- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。
- **ハードウェアの選定:** 高

ChatResult(chat_id=None, chat_history=[{'content': '生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。', 'role': 'assistant', 'name': 'aki'}, {'content': '生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。\n\n### アーキテクチャ全体像\n\n1. **データ収集・前処理層**\n2. **モデル構築層**\n3. **トレーニング層**\n4. **評価と検証層**\n5. **デプロイメントとモニタリング層**\n6. **ユーザーインターフェース層**\n\n---\n\n### 1. データ収集・前処理層\n\n- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。\n- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。\n- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。\n\n### 2. モデル構築層\n\n- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。\n- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。\n\n### 3. トレーニング層\n\n- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。\n- **ハードウェアの選定:** 高性

#### Human Input Mode = `ALWAYS`

In [20]:
human_proxy = ConversableAgent(
    "human_proxy",
    llm_config=False,  # no LLM used for human proxy
    human_input_mode="ALWAYS",  # always ask for human input
)

# Start a chat with the agent
result = human_proxy.initiate_chat(
    hiro, 
    message="コンシューマ向けのAI製品を開発するプロジェクトを立ち上げたいと考えています。どのような製品を開発するべきか、技術的な観点から提案してください。",
)

[33mhuman_proxy[0m (to hiro):

コンシューマ向けのAI製品を開発するプロジェクトを立ち上げたいと考えています。どのような製品を開発するべきか、技術的な観点から提案してください。

--------------------------------------------------------------------------------
[33mhiro[0m (to human_proxy):

コンシューマ向けのAI製品開発においては、まず市場ニーズや技術のトレンドを把握し、それらに基づいて製品提案を行うことが重要です。以下にいくつかの技術的観点から有益な製品アイデアを提案します。

### 1. スマートホームアシスタント
#### 概要
AI技術を用いて、音声による指示や自動化されたシナリオ管理ができるデバイスを開発します。

#### 技術要件
- **音声認識**: ノイズ環境下でも正確な音声指示を認識。
- **自然言語処理 (NLP)**: 音声コマンドを理解し、ユーザーの意図を正確に処理。
- **IoT統合**: 多種多様なスマートデバイス（照明、セキュリティカメラ、温度調節器など）との統合性能。

#### 利点
- スマートホーム市場の急成長。
- ユーザー利便性の向上と日常生活の最適化。

### 2. 個人健康コーチングアプリ
#### 概要
AIを活用した個人健康管理とフィットネスコーチングアプリを開発します。

#### 技術要件
- **機械学習**: ユーザーの健康データやフィットネスデータを元に、本人に最適化されたアドバイスを提供。
- **コンピュータビジョン**: ユーザーの姿勢や運動フォームをリアルタイムで分析。
- **データプライバシー**: ユーザーデータの安全性とプライバシー保護の強化。

#### 利点
- 健康志向の高まりに合わせた市場ニーズ。
- ユーザーのパーソナライズドなサービス提供による高い顧客満足度。

### 3. 教育AIアシスタント
#### 概要
学生向けに学習を支援するAIアシスタント。

#### 技術要件
- **自然言語処理**: 質問応答システムの構築。
- **知識グラフ**: 各教科の専門知識を整理し、関連知識を効果的にリンク。
- **学

#### Human Input Mode = `TERMINATE`

In [21]:
hiro = ConversableAgent(
    "hiro",
    system_message="あなたはAIの専門家で、自社のAIソリューション開発を技術面でリードする役割です。技術戦略の意思決定をして、強固なソリューションを計画、実装する責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="NEVER",  # Never ask for human input.
)

aki = ConversableAgent(
    "aki",
    system_message="あなたはビジネスの専門家で、自社のAIソリューション開発をビジネス戦略立案、プロジェクトマネジメント、マーケティングをリードする意思決定者です。技術面の提案をビジネス、ROIの観点から評価、調整してビジネスを成功に導く責任を持ちます。",
    llm_config={"config_list": config_list},
    human_input_mode="TERMINATE",  # Never ask for human input.
    max_consecutive_auto_reply=1,  # Limit the number of consecutive auto-replies to 1.
)

In [22]:
aki.initiate_chat(hiro, message="生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。")

[33maki[0m (to hiro):

生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。

--------------------------------------------------------------------------------
[33mhiro[0m (to aki):

生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。

### アーキテクチャ全体像

1. **データ収集・前処理層**
2. **モデル構築層**
3. **トレーニング層**
4. **評価と検証層**
5. **デプロイメントとモニタリング層**
6. **ユーザーインターフェース層**

---

### 1. データ収集・前処理層

- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。
- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。
- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。

### 2. モデル構築層

- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。
- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。

### 3. トレーニング層

- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。
- **ハードウェアの選定:** 高

ChatResult(chat_id=None, chat_history=[{'content': '生成AIを使って、新しいAIソリューションを開発するプロジェクトを立ち上げたいと考えています。アーキテクチャを提案してください。', 'role': 'assistant', 'name': 'aki'}, {'content': '生成AIプロジェクトのアーキテクチャを提案する際には、特定の用途や目標に応じて設計をカスタマイズすることが重要です。ここでは、一般的な生成モデル（例えば、自然言語生成や画像生成など）を構築するためのアーキテクチャの一例を示します。この例では、自然言語生成（NLG）を対象としますが、他の生成AIにも適用できます。\n\n### アーキテクチャ全体像\n\n1. **データ収集・前処理層**\n2. **モデル構築層**\n3. **トレーニング層**\n4. **評価と検証層**\n5. **デプロイメントとモニタリング層**\n6. **ユーザーインターフェース層**\n\n---\n\n### 1. データ収集・前処理層\n\n- **自然言語データの収集:** ウェブスクレイピング、公開API、データベースなどからテキストデータを収集。\n- **データクレンジング:** ノイズの除去、テキストの正規化、不要情報の排除。\n- **トークナイゼーション:** 収集したテキストデータをトークンに分割（例えば、word-level, subword-level, character-levelなど）。\n\n### 2. モデル構築層\n\n- **モデル選定:** 生成モデルとして、例えばGPT（Generative Pre-trained Transformer）やBERT（Bidirectional Encoder Representations from Transformers）などを基にしたアーキテクチャを選定。\n- **モデルのカスタマイズ:** 特定の用途に適したカスタマイズ。例えば、トピックに特化した事前学習済みモデルのファインチューニング。\n\n### 3. トレーニング層\n\n- **トレーニングデータの準備:** データの分割（トレーニング、検証、テストセット）。\n- **ハードウェアの選定:** 高性