# 使用 Azure AI Agent 服务和 Semantic Kernel 实现 RAG

此代码片段展示了如何使用 `Azure AI Agent Service` 和 `Semantic Kernel` 创建和管理一个用于检索增强生成（RAG）的 Azure AI 代理。该代理根据检索到的上下文处理用户查询，并相应地提供准确的响应。


SQLite版本修复  
如果您遇到以下错误：  
```
RuntimeError: Your system has an unsupported version of sqlite3. Chroma requires sqlite3 >= 3.35.0
```  

请在笔记本开头取消注释以下代码块：  


In [None]:
# %pip install pysqlite3-binary
# __import__('pysqlite3')
# import sys
# sys.modules['sqlite3'] = sys.modules.pop('pysqlite3')

### 导入包
以下代码导入了必要的包：


In [None]:
# Azure imports for project client and credentials
from azure.ai.projects.models import FileSearchTool, OpenAIFile, VectorStore
from azure.identity.aio import DefaultAzureCredential

# Semantic Kernel imports
from semantic_kernel.agents import AzureAIAgent, AzureAIAgentThread

# 使用语义内核和 Azure AI Agent Service 实现检索增强生成

本示例演示如何使用 **Azure AI Agent Service**，通过结合语言模型和上传文档中的领域特定上下文，执行 **检索增强生成 (RAG)**。

### 工作原理

1. **文档上传**：将包含信息（Contoso 的旅行保险政策）的 markdown 文件（document.md）上传到代理服务。

2. **向量存储创建**：将文档索引到向量存储中，以便对其内容进行语义搜索。

3. **代理配置**：使用 `gpt-4o` 模型实例化代理，并设置以下严格指令：
   - 仅基于从文档中检索的内容回答问题。
   - 如果问题超出范围，则拒绝回答。

4. **文件搜索工具集成**：将 `FileSearchTool` 注册到代理中，使模型在推理过程中能够搜索并检索索引文档中的相关片段。

5. **用户交互**：用户可以提问。如果在文档中找到相关信息，代理会生成一个有依据的回答。  
   如果没有，代理会明确回应文档中没有足够的信息。


### 主函数

```python
def main():
    # 初始化程序
    initialize_program()

    # 检查用户输入
    user_input = get_user_input()
    if not validate_input(user_input):
        print("输入无效，请重试。")
        return

    # 处理数据
    processed_data = process_data(user_input)

    # 显示结果
    display_results(processed_data)
```

### 功能概述

- `initialize_program()`: 设置程序的初始状态。
- `get_user_input()`: 获取用户输入。
- `validate_input(input)`: 验证输入是否符合要求。
- `process_data(data)`: 处理用户提供的数据。
- `display_results(data)`: 显示处理后的结果。

### 注意事项

[!NOTE] 确保用户输入符合预期格式。

[!WARNING] 如果输入数据过大，可能会导致性能问题。

[!TIP] 使用示例数据进行测试以确保程序正常运行。

[!IMPORTANT] 在修改代码时，请确保所有依赖项已更新。

[!CAUTION] 不要在生产环境中使用未经测试的代码。

### 示例代码

以下是一个简单的示例，展示如何调用主函数：

```python
if __name__ == "__main__":
    main()
```

### 常见问题

#### 为什么我的输入被认为是无效的？
- 确保输入符合预期格式，例如数字或字符串。
- 检查是否有多余的空格或特殊字符。

#### 如何提高数据处理的速度？
- 优化算法以减少复杂度。
- 使用更高效的数据结构，例如字典或集合。

#### 程序是否支持多语言？
- 当前版本仅支持英文，但可以通过修改代码添加多语言支持。

### 结论

通过遵循上述步骤和注意事项，您可以确保程序运行顺利并获得预期结果。如果遇到问题，请参考常见问题部分或联系开发团队。


确保首先使用 Azure CLI 运行 `az login`，以便在使用 `DefaultAzureCredential` 时提供正确的身份验证上下文。Azure AI Agent Service 不使用 API 密钥。


In [None]:
async def main():
    async with (
        DefaultAzureCredential() as creds,
        AzureAIAgent.create_client(credential=creds) as client,
    ):
        file: OpenAIFile = await client.agents.upload_file_and_poll(file_path="document.md", purpose="assistants")
        vector_store: VectorStore = await client.agents.create_vector_store_and_poll(
            file_ids=[file.id], name="my_vectorstore"
        )

        # Define agent name and instructions tailored for RAG.
        AGENT_NAME = "RAGAgent"
        AGENT_INSTRUCTIONS = """
        You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

        - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
        "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
        - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
        - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
        - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
        - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

        You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
        """

        
        # Create file search tool with uploaded resources
        file_search = FileSearchTool(vector_store_ids=[vector_store.id])

        # 3. Create an agent on the Azure AI agent service with the file search tool
        agent_definition = await client.agents.create_agent(
            model="gpt-4o",  # This model should match your Azure OpenAI deployment.
            name=AGENT_NAME,
            instructions=AGENT_INSTRUCTIONS,
            tools=file_search.definitions,
            tool_resources=file_search.resources,
        )
        
        # Create the Azure AI Agent using the client and definition.
        agent = AzureAIAgent(
            client=client,
            definition=agent_definition,
        )
        
        # Create a thread to hold the conversation
        # If no thread is provided, a new thread will be
        # created and returned with the initial response
        thread: AzureAIAgentThread | None = None
        
        # Example user queries.
        user_inputs = [
            "Can you explain Contoso's travel insurance coverage?",  # Relevant context.
            "What is a Neural Network?"  # No relevant context from the document. Will not contain a source annotation.
        ]
        
        try:
            for user_input in user_inputs:
                print(f"# User: '{user_input}'")
                # Invoke the agent for the specified thread for response
                async for response in agent.invoke(messages=user_input, thread=thread):
                    print(f"# {response.name}: {response}")
                    thread = response.thread
        finally:
            # Clean up resources.
            await thread.delete() if thread else None
            await client.agents.delete_vector_store(vector_store.id)
            await client.agents.delete_file(file.id)
            await client.agents.delete_agent(agent.id)
            print("\nCleaned up agent, thread, file, and vector store.")

await main()

好的，请提供需要翻译的 Markdown 文件内容，我将按照规则进行翻译。



---

**免责声明**：  
本文档使用AI翻译服务 [Co-op Translator](https://github.com/Azure/co-op-translator) 进行翻译。尽管我们努力确保翻译的准确性，但请注意，自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于重要信息，建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。
