# 🔍 Enterprise RAG с Azure AI Foundry (.NET)

## 📋 Цели на обучението

Тази тетрадка демонстрира как да изградите системи за извличане с допълнително генериране (RAG) на корпоративно ниво, използвайки Microsoft Agent Framework в .NET с Azure AI Foundry. Ще научите как да създавате агенти, готови за производство, които могат да търсят в документи и да предоставят точни, контекстуално осведомени отговори с корпоративна сигурност и мащабируемост.

**Възможности на Enterprise RAG, които ще изградите:**
- 📚 **Интелигентност на документи**: Разширена обработка на документи с Azure AI услуги
- 🔍 **Семантично търсене**: Високопроизводително векторно търсене с корпоративни функции
- 🛡️ **Интеграция на сигурността**: Ролева достъпност и модели за защита на данни
- 🏢 **Мащабируема архитектура**: RAG системи, готови за производство, с мониторинг

## 🎯 Архитектура на Enterprise RAG

### Основни корпоративни компоненти
- **Azure AI Foundry**: Управлявана корпоративна AI платформа със сигурност и съответствие
- **Постоянни агенти**: Агенти с история на разговорите и управление на контекста
- **Управление на векторни хранилища**: Индексиране и извличане на документи на корпоративно ниво
- **Интеграция на идентичност**: Автентикация с Azure AD и контрол на достъпа на базата на роли

### Предимства на .NET за корпоративни приложения
- **Типова безопасност**: Валидация по време на компилация за операции и структури на данни в RAG
- **Асинхронна производителност**: Неблокираща обработка на документи и операции за търсене
- **Управление на паметта**: Ефективно използване на ресурси за големи колекции от документи
- **Модели за интеграция**: Нативна интеграция с Azure услуги чрез dependency injection

## 🏗️ Техническа архитектура

### Enterprise RAG Pipeline
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Основни .NET компоненти
- **Azure.AI.Agents.Persistent**: Управление на корпоративни агенти с постоянство на състоянието
- **Azure.Identity**: Интегрирана автентикация за сигурен достъп до Azure услуги
- **Microsoft.Agents.AI.AzureAI**: Оптимизирана за Azure рамка за агенти
- **System.Linq.Async**: Високопроизводителни асинхронни LINQ операции

## 🔧 Корпоративни функции и предимства

### Сигурност и съответствие
- **Интеграция с Azure AD**: Управление на корпоративна идентичност и автентикация
- **Контрол на достъпа на базата на роли**: Прецизни разрешения за достъп до документи и операции
- **Защита на данни**: Шифроване при съхранение и пренос за чувствителни документи
- **Логове за одит**: Подробно проследяване на активността за изисквания за съответствие

### Производителност и мащабируемост
- **Управление на връзките**: Ефективно управление на връзките с Azure услуги
- **Асинхронна обработка**: Неблокиращи операции за сценарии с висока пропускателна способност
- **Стратегии за кеширане**: Интелигентно кеширане за често достъпвани документи
- **Баланс на натоварването**: Разпределена обработка за мащабни внедрения

### Управление и мониторинг
- **Проверки на здравето**: Вграден мониторинг на компонентите на RAG системата
- **Метрики за производителност**: Подробна аналитика за качеството на търсене и времето за отговор
- **Управление на грешки**: Комплексно управление на изключения с политики за повторение
- **Управление на конфигурацията**: Настройки, специфични за средата, с валидация

## ⚙️ Предварителни условия и настройка

**Среда за разработка:**
- .NET 9.0 SDK или по-нова версия
- Visual Studio 2022 или VS Code с разширение за C#
- Абонамент за Azure с достъп до AI Foundry

**Необходими NuGet пакети:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Настройка на автентикация в Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Конфигурация на средата (.env файл):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Модели на Enterprise RAG

### Модели за управление на документи
- **Масово качване**: Ефективна обработка на големи колекции от документи
- **Инкрементални актуализации**: Добавяне и модификация на документи в реално време
- **Контрол на версиите**: Версиониране на документи и проследяване на промените
- **Управление на метаданни**: Богати атрибути и таксономия на документи

### Модели за търсене и извличане
- **Хибридно търсене**: Комбиниране на семантично и ключово търсене за оптимални резултати
- **Фасетно търсене**: Многомерно филтриране и категоризация
- **Настройка на релевантността**: Персонализирани алгоритми за оценка за специфични домейни
- **Ранжиране на резултати**: Разширено ранжиране с интеграция на бизнес логика

### Модели за сигурност
- **Сигурност на ниво документ**: Прецизен контрол на достъпа за всеки документ
- **Класификация на данни**: Автоматично етикетиране на чувствителност и защита
- **Одитни следи**: Подробно логване на всички операции в RAG
- **Защита на личните данни**: Откриване и редактиране на PII

## 🔒 Корпоративни функции за сигурност

### Автентикация и авторизация
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Защита на данни
- **Шифроване**: Крайно шифроване за документи и индекси за търсене
- **Контроли за достъп**: Интеграция с Azure AD за разрешения на потребители и групи
- **Местоположение на данни**: Географски контрол на местоположението на данни за съответствие
- **Резервно копиране и възстановяване**: Автоматизирани процедури за резервно копиране и възстановяване при бедствия

## 📈 Оптимизация на производителността

### Модели за асинхронна обработка
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Управление на паметта
- **Потокова обработка**: Обработка на големи документи без проблеми с паметта
- **Управление на ресурси**: Ефективно повторно използване на скъпи ресурси
- **Събиране на боклук**: Оптимизирани модели за разпределение на паметта
- **Управление на връзките**: Правилен жизнен цикъл на връзките с Azure услуги

### Стратегии за кеширане
- **Кеширане на заявки**: Кеширане на често изпълнявани търсения
- **Кеширане на документи**: Кеширане в паметта за "горещи" документи
- **Кеширане на индекси**: Оптимизирано кеширане на векторни индекси
- **Кеширане на резултати**: Интелигентно кеширане на генерирани отговори

## 📊 Корпоративни случаи на употреба

### Управление на знания
- **Корпоративна уики**: Интелигентно търсене в бази от знания на компанията
- **Политики и процедури**: Автоматизирано ръководство за съответствие и процедури
- **Учебни материали**: Интелигентна помощ за обучение и развитие
- **Изследователски бази данни**: Системи за анализ на академични и изследователски документи

### Обслужване на клиенти
- **База знания за поддръжка**: Автоматизирани отговори за обслужване на клиенти
- **Документация за продукти**: Интелигентно извличане на информация за продукти
- **Ръководства за отстраняване на проблеми**: Контекстуална помощ за решаване на проблеми
- **Системи за често задавани въпроси**: Динамично генериране на FAQ от колекции документи

### Съответствие с регулации
- **Анализ на правни документи**: Интелигентност за договори и правни документи
- **Мониторинг на съответствието**: Автоматизирана проверка за регулаторно съответствие
- **Оценка на риска**: Анализ и докладване на рискове, базирани на документи
- **Поддръжка за одит**: Интелигентно откриване на документи за одити

## 🚀 Внедряване в производство

### Мониторинг и наблюдение
- **Application Insights**: Подробен мониторинг на телеметрията и производителността
- **Персонализирани метрики**: Проследяване и предупреждения за специфични KPI на бизнеса
- **Разпределено проследяване**: Проследяване на заявки от край до край между услуги
- **Табла за здраве**: Визуализация в реално време на здравето и производителността на системата

### Мащабируемост и надеждност
- **Автоматично мащабиране**: Автоматично мащабиране според натоварването и метриките за производителност
- **Висока наличност**: Мултирегионално внедряване с възможности за превключване при отказ
- **Тестове за натоварване**: Валидация на производителността при корпоративно натоварване
- **Възстановяване при бедствия**: Автоматизирани процедури за резервно копиране и възстановяване

Готови ли сте да изградите RAG системи на корпоративно ниво, които могат да обработват чувствителни документи в мащаб? Нека архитектурираме интелигентни системи за знания за бизнеса! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Отказ от отговорност**:  
Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия изходен език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.
