# 🔍 Enterprise RAG с Azure AI Foundry (.NET)

## 📋 Цели обучения

Этот ноутбук демонстрирует, как создавать системы Retrieval-Augmented Generation (RAG) корпоративного уровня с использованием Microsoft Agent Framework в .NET и Azure AI Foundry. Вы научитесь создавать готовых к производству агентов, которые могут искать документы и предоставлять точные, контекстно-осведомленные ответы с учетом корпоративной безопасности и масштабируемости.

**Функции Enterprise RAG, которые вы создадите:**
- 📚 **Интеллектуальная обработка документов**: Продвинутая обработка документов с использованием сервисов Azure AI
- 🔍 **Семантический поиск**: Высокопроизводительный векторный поиск с корпоративными функциями
- 🛡️ **Интеграция безопасности**: Ролевой доступ и шаблоны защиты данных
- 🏢 **Масштабируемая архитектура**: Системы RAG, готовые к производству, с мониторингом

## 🎯 Архитектура Enterprise RAG

### Основные корпоративные компоненты
- **Azure AI Foundry**: Управляемая корпоративная платформа AI с безопасностью и соответствием требованиям
- **Постоянные агенты**: Агенты с сохранением состояния, историей разговоров и управлением контекстом
- **Управление векторным хранилищем**: Индексация и поиск документов корпоративного уровня
- **Интеграция идентификации**: Аутентификация Azure AD и управление доступом на основе ролей

### Преимущества .NET для корпоративных решений
- **Типобезопасность**: Проверка операций RAG и структур данных на этапе компиляции
- **Асинхронная производительность**: Неблокирующая обработка документов и операций поиска
- **Управление памятью**: Эффективное использование ресурсов для больших коллекций документов
- **Шаблоны интеграции**: Нативная интеграция сервисов Azure с внедрением зависимостей

## 🏗️ Техническая архитектура

### Конвейер Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Основные компоненты .NET
- **Azure.AI.Agents.Persistent**: Управление корпоративными агентами с сохранением состояния
- **Azure.Identity**: Интегрированная аутентификация для безопасного доступа к сервисам Azure
- **Microsoft.Agents.AI.AzureAI**: Оптимизированная для Azure реализация фреймворка агентов
- **System.Linq.Async**: Высокопроизводительные асинхронные операции LINQ

## 🔧 Функции и преимущества Enterprise

### Безопасность и соответствие требованиям
- **Интеграция Azure AD**: Управление корпоративной идентификацией и аутентификацией
- **Доступ на основе ролей**: Тонкая настройка разрешений для доступа к документам и операциям
- **Защита данных**: Шифрование в состоянии покоя и при передаче для конфиденциальных документов
- **Журналирование аудита**: Полное отслеживание активности для соблюдения требований

### Производительность и масштабируемость
- **Пул соединений**: Эффективное управление соединениями с сервисами Azure
- **Асинхронная обработка**: Неблокирующие операции для сценариев с высокой пропускной способностью
- **Стратегии кэширования**: Интеллектуальное кэширование часто запрашиваемых документов
- **Балансировка нагрузки**: Распределенная обработка для крупномасштабных развертываний

### Управление и мониторинг
- **Проверка состояния**: Встроенный мониторинг компонентов системы RAG
- **Метрики производительности**: Подробная аналитика качества поиска и времени ответа
- **Обработка ошибок**: Полное управление исключениями с политиками повторных попыток
- **Управление конфигурацией**: Настройки, специфичные для среды, с проверкой

## ⚙️ Предварительные требования и настройка

**Среда разработки:**
- .NET 9.0 SDK или выше
- Visual Studio 2022 или VS Code с расширением C#
- Подписка Azure с доступом к AI Foundry

**Необходимые пакеты NuGet:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Настройка аутентификации Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Конфигурация среды (.env файл):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Шаблоны Enterprise RAG

### Шаблоны управления документами
- **Массовая загрузка**: Эффективная обработка больших коллекций документов
- **Инкрементные обновления**: Добавление и изменение документов в реальном времени
- **Контроль версий**: Версионирование документов и отслеживание изменений
- **Управление метаданными**: Богатые атрибуты документов и таксономия

### Шаблоны поиска и извлечения
- **Гибридный поиск**: Сочетание семантического и ключевого поиска для оптимальных результатов
- **Фасетный поиск**: Многомерная фильтрация и категоризация
- **Настройка релевантности**: Пользовательские алгоритмы оценки для специфических доменов
- **Ранжирование результатов**: Продвинутое ранжирование с интеграцией бизнес-логики

### Шаблоны безопасности
- **Безопасность на уровне документа**: Тонкая настройка доступа к каждому документу
- **Классификация данных**: Автоматическая маркировка чувствительности и защита
- **Журналы аудита**: Полное логирование всех операций RAG
- **Защита конфиденциальности**: Обнаружение и редактирование PII

## 🔒 Функции корпоративной безопасности

### Аутентификация и авторизация
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Защита данных
- **Шифрование**: Сквозное шифрование документов и индексов поиска
- **Контроль доступа**: Интеграция с Azure AD для разрешений пользователей и групп
- **Резиденция данных**: Географический контроль местоположения данных для соблюдения требований
- **Резервное копирование и восстановление**: Автоматическое резервное копирование и процедуры восстановления

## 📈 Оптимизация производительности

### Шаблоны асинхронной обработки
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Управление памятью
- **Потоковая обработка**: Обработка больших документов без проблем с памятью
- **Пул ресурсов**: Эффективное повторное использование дорогостоящих ресурсов
- **Сборка мусора**: Оптимизированные шаблоны выделения памяти
- **Управление соединениями**: Правильный жизненный цикл соединений с сервисами Azure

### Стратегии кэширования
- **Кэширование запросов**: Кэширование часто выполняемых поисков
- **Кэширование документов**: Кэширование в памяти для часто используемых документов
- **Кэширование индексов**: Оптимизированное кэширование векторных индексов
- **Кэширование результатов**: Интеллектуальное кэширование сгенерированных ответов

## 📊 Корпоративные сценарии использования

### Управление знаниями
- **Корпоративная вики**: Интеллектуальный поиск по базам знаний компании
- **Политики и процедуры**: Автоматизированное соблюдение требований и руководство по процедурам
- **Учебные материалы**: Интеллектуальная помощь в обучении и развитии
- **Исследовательские базы данных**: Системы анализа академических и научных статей

### Поддержка клиентов
- **База знаний поддержки**: Автоматизированные ответы службы поддержки
- **Документация по продукту**: Интеллектуальный поиск информации о продукте
- **Руководства по устранению неполадок**: Контекстная помощь в решении проблем
- **Системы FAQ**: Динамическое создание FAQ из коллекций документов

### Соблюдение нормативных требований
- **Анализ юридических документов**: Интеллектуальная обработка контрактов и юридических документов
- **Мониторинг соответствия требованиям**: Автоматизированная проверка нормативного соответствия
- **Оценка рисков**: Анализ и отчетность о рисках на основе документов
- **Поддержка аудита**: Интеллектуальное обнаружение документов для аудитов

## 🚀 Развертывание в производственной среде

### Мониторинг и наблюдаемость
- **Application Insights**: Подробная телеметрия и мониторинг производительности
- **Пользовательские метрики**: Отслеживание и оповещение по бизнес-специфическим KPI
- **Распределенное трассирование**: Отслеживание запросов от начала до конца между сервисами
- **Панели состояния**: Визуализация состояния системы и производительности в реальном времени

### Масштабируемость и надежность
- **Автоматическое масштабирование**: Автоматическое увеличение масштабов на основе нагрузки и метрик производительности
- **Высокая доступность**: Развертывание в нескольких регионах с возможностями резервирования
- **Тестирование нагрузки**: Проверка производительности в условиях корпоративной нагрузки
- **Восстановление после сбоев**: Автоматическое резервное копирование и процедуры восстановления

Готовы создавать системы RAG корпоративного уровня, способные обрабатывать конфиденциальные документы в масштабе? Давайте спроектируем интеллектуальные системы управления знаниями для бизнеса! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Отказ от ответственности**:  
Этот документ был переведен с использованием сервиса автоматического перевода [Co-op Translator](https://github.com/Azure/co-op-translator). Несмотря на наши усилия обеспечить точность, автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его родном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникшие в результате использования данного перевода.
