# 🔍 Enterprise RAG з Azure AI Foundry (.NET)

## 📋 Навчальні цілі

Цей блокнот демонструє, як створювати системи Retrieval-Augmented Generation (RAG) корпоративного рівня за допомогою Microsoft Agent Framework у .NET з Azure AI Foundry. Ви навчитеся створювати готових до виробництва агентів, які можуть здійснювати пошук у документах і надавати точні, контекстно-залежні відповіді з корпоративною безпекою та масштабованістю.

**Можливості Enterprise RAG, які ви створите:**
- 📚 **Інтелектуальна обробка документів**: Розширена обробка документів за допомогою сервісів Azure AI
- 🔍 **Семантичний пошук**: Високопродуктивний пошук за векторами з корпоративними функціями
- 🛡️ **Інтеграція безпеки**: Рольовий доступ і шаблони захисту даних
- 🏢 **Масштабована архітектура**: Системи RAG, готові до виробництва, з моніторингом

## 🎯 Архітектура Enterprise RAG

### Основні корпоративні компоненти
- **Azure AI Foundry**: Керована корпоративна платформа AI з безпекою та відповідністю
- **Стійкі агенти**: Агенти зі збереженням стану, історії розмов і управління контекстом
- **Управління векторним сховищем**: Індексація та пошук документів корпоративного рівня
- **Інтеграція ідентичності**: Аутентифікація Azure AD і контроль доступу на основі ролей

### Переваги .NET для корпоративних систем
- **Типова безпека**: Перевірка операцій RAG і структур даних на етапі компіляції
- **Асинхронна продуктивність**: Неблокуюча обробка документів і операції пошуку
- **Управління пам'яттю**: Ефективне використання ресурсів для великих колекцій документів
- **Шаблони інтеграції**: Нативна інтеграція сервісів Azure із впровадженням залежностей

## 🏗️ Технічна архітектура

### Конвеєр Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Основні компоненти .NET
- **Azure.AI.Agents.Persistent**: Управління корпоративними агентами зі збереженням стану
- **Azure.Identity**: Інтегрована аутентифікація для безпечного доступу до сервісів Azure
- **Microsoft.Agents.AI.AzureAI**: Оптимізована для Azure реалізація фреймворку агентів
- **System.Linq.Async**: Високопродуктивні асинхронні операції LINQ

## 🔧 Корпоративні функції та переваги

### Безпека та відповідність
- **Інтеграція Azure AD**: Управління корпоративною ідентичністю та аутентифікація
- **Рольовий доступ**: Тонке налаштування дозволів для доступу до документів і операцій
- **Захист даних**: Шифрування даних у стані спокою та під час передачі для конфіденційних документів
- **Журналювання**: Повне відстеження активності для вимог відповідності

### Продуктивність і масштабованість
- **Пул з'єднань**: Ефективне управління з'єднаннями сервісів Azure
- **Асинхронна обробка**: Неблокуючі операції для сценаріїв з високою пропускною здатністю
- **Стратегії кешування**: Інтелектуальне кешування часто використовуваних документів
- **Балансування навантаження**: Розподілена обробка для великих розгортань

### Управління та моніторинг
- **Перевірка стану**: Вбудований моніторинг компонентів системи RAG
- **Метрики продуктивності**: Детальна аналітика якості пошуку та часу відповіді
- **Обробка помилок**: Повне управління винятками з політиками повтору
- **Управління конфігурацією**: Налаштування для конкретного середовища з перевіркою

## ⚙️ Попередні умови та налаштування

**Середовище розробки:**
- .NET 9.0 SDK або новіший
- Visual Studio 2022 або VS Code з розширенням C#
- Підписка Azure з доступом до AI Foundry

**Необхідні пакети NuGet:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Налаштування аутентифікації Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Конфігурація середовища (.env файл):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Шаблони Enterprise RAG

### Шаблони управління документами
- **Масове завантаження**: Ефективна обробка великих колекцій документів
- **Інкрементні оновлення**: Додавання та модифікація документів у реальному часі
- **Контроль версій**: Версіонування документів і відстеження змін
- **Управління метаданими**: Розширені атрибути документів і таксономія

### Шаблони пошуку та отримання
- **Гібридний пошук**: Поєднання семантичного та ключового пошуку для оптимальних результатів
- **Фасетний пошук**: Багатовимірна фільтрація та категоризація
- **Налаштування релевантності**: Користувацькі алгоритми оцінки для специфічних доменів
- **Ранжування результатів**: Розширене ранжування з інтеграцією бізнес-логіки

### Шаблони безпеки
- **Безпека на рівні документів**: Тонке налаштування доступу до кожного документа
- **Класифікація даних**: Автоматичне маркування чутливості та захист
- **Журнали аудиту**: Повне журналювання всіх операцій RAG
- **Захист конфіденційності**: Виявлення та редагування PII

## 🔒 Функції корпоративної безпеки

### Аутентифікація та авторизація
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Захист даних
- **Шифрування**: Шифрування документів і пошукових індексів від початку до кінця
- **Контроль доступу**: Інтеграція з Azure AD для дозволів користувачів і груп
- **Резиденція даних**: Географічний контроль розташування даних для відповідності
- **Резервне копіювання та відновлення**: Автоматизоване резервне копіювання та процедури відновлення

## 📈 Оптимізація продуктивності

### Шаблони асинхронної обробки
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Управління пам'яттю
- **Стримінгова обробка**: Обробка великих документів без проблем із пам'яттю
- **Пул ресурсів**: Ефективне повторне використання дорогих ресурсів
- **Збір сміття**: Оптимізовані шаблони розподілу пам'яті
- **Управління з'єднаннями**: Правильний життєвий цикл з'єднань сервісів Azure

### Стратегії кешування
- **Кешування запитів**: Кешування часто виконуваних пошуків
- **Кешування документів**: Кешування в пам'яті для популярних документів
- **Кешування індексів**: Оптимізоване кешування векторних індексів
- **Кешування результатів**: Інтелектуальне кешування згенерованих відповідей

## 📊 Корпоративні сценарії використання

### Управління знаннями
- **Корпоративна вікі**: Інтелектуальний пошук у базах знань компанії
- **Політики та процедури**: Автоматизоване керівництво з відповідності та процедур
- **Навчальні матеріали**: Інтелектуальна допомога в навчанні та розвитку
- **Бази даних досліджень**: Системи аналізу академічних і дослідницьких робіт

### Підтримка клієнтів
- **База знань підтримки**: Автоматизовані відповіді для обслуговування клієнтів
- **Документація продукту**: Інтелектуальний пошук інформації про продукт
- **Посібники з усунення несправностей**: Контекстна допомога у вирішенні проблем
- **Системи FAQ**: Динамічне створення FAQ з колекцій документів

### Відповідність нормативним вимогам
- **Аналіз юридичних документів**: Інтелектуальна обробка контрактів і юридичних документів
- **Моніторинг відповідності**: Автоматизована перевірка відповідності нормативним вимогам
- **Оцінка ризиків**: Аналіз ризиків і звітність на основі документів
- **Підтримка аудиту**: Інтелектуальне виявлення документів для аудитів

## 🚀 Розгортання у виробництві

### Моніторинг і спостереження
- **Application Insights**: Детальний моніторинг телеметрії та продуктивності
- **Користувацькі метрики**: Відстеження KPI, специфічних для бізнесу, і оповіщення
- **Розподілене трасування**: Відстеження запитів від початку до кінця між сервісами
- **Панелі стану**: Візуалізація стану системи та продуктивності в реальному часі

### Масштабованість і надійність
- **Автоматичне масштабування**: Автоматичне масштабування на основі навантаження та метрик продуктивності
- **Висока доступність**: Розгортання в кількох регіонах із можливостями аварійного перемикання
- **Тестування навантаження**: Перевірка продуктивності під корпоративним навантаженням
- **Відновлення після аварій**: Автоматизовані процедури резервного копіювання та відновлення

Готові створювати системи RAG корпоративного рівня, які можуть обробляти конфіденційні документи в масштабі? Давайте спроектуємо інтелектуальні системи знань для підприємств! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Відмова від відповідальності**:  
Цей документ був перекладений за допомогою сервісу автоматичного перекладу [Co-op Translator](https://github.com/Azure/co-op-translator). Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.
