# 🔍 Enterprise RAG s Azure AI Foundry (.NET)

## 📋 Cíle učení

Tento notebook ukazuje, jak vytvořit podnikové systémy Retrieval-Augmented Generation (RAG) pomocí Microsoft Agent Framework v .NET s Azure AI Foundry. Naučíte se vytvářet produkčně připravené agenty, kteří dokážou prohledávat dokumenty a poskytovat přesné, kontextově relevantní odpovědi s podnikovou bezpečností a škálovatelností.

**Podnikové schopnosti RAG, které vytvoříte:**
- 📚 **Inteligence dokumentů**: Pokročilé zpracování dokumentů s Azure AI službami
- 🔍 **Sémantické vyhledávání**: Vysoce výkonné vektorové vyhledávání s podnikovými funkcemi
- 🛡️ **Integrace bezpečnosti**: Role-based přístup a vzory ochrany dat
- 🏢 **Škálovatelná architektura**: Produkčně připravené RAG systémy s monitorováním

## 🎯 Architektura Enterprise RAG

### Klíčové podnikové komponenty
- **Azure AI Foundry**: Spravovaná podniková AI platforma s bezpečností a souladem
- **Persistentní agenti**: Stavoví agenti s historií konverzací a správou kontextu
- **Správa vektorového úložiště**: Podnikové indexování a vyhledávání dokumentů
- **Integrace identity**: Autentizace Azure AD a role-based řízení přístupu

### Výhody .NET pro podniky
- **Typová bezpečnost**: Validace operací RAG a datových struktur při kompilaci
- **Asynchronní výkon**: Nezablokované zpracování dokumentů a vyhledávacích operací
- **Správa paměti**: Efektivní využití zdrojů pro velké kolekce dokumentů
- **Vzorové integrace**: Nativní integrace Azure služeb s dependency injection

## 🏗️ Technická architektura

### Pipeline Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Klíčové komponenty .NET
- **Azure.AI.Agents.Persistent**: Správa podnikových agentů s perzistencí stavu
- **Azure.Identity**: Integrovaná autentizace pro bezpečný přístup k Azure službám
- **Microsoft.Agents.AI.AzureAI**: Implementace agentního frameworku optimalizovaného pro Azure
- **System.Linq.Async**: Vysoce výkonné asynchronní LINQ operace

## 🔧 Podnikové funkce a výhody

### Bezpečnost a soulad
- **Integrace Azure AD**: Podniková správa identity a autentizace
- **Role-based přístup**: Jemně odstupňovaná oprávnění pro přístup k dokumentům a operacím
- **Ochrana dat**: Šifrování v klidu i při přenosu pro citlivé dokumenty
- **Auditní logování**: Komplexní sledování aktivit pro požadavky na soulad

### Výkon a škálovatelnost
- **Pooling připojení**: Efektivní správa připojení k Azure službám
- **Asynchronní zpracování**: Nezablokované operace pro scénáře s vysokou propustností
- **Strategie cachování**: Inteligentní cachování často přistupovaných dokumentů
- **Vyvažování zátěže**: Distribuované zpracování pro nasazení ve velkém měřítku

### Správa a monitorování
- **Kontroly zdraví**: Vestavěné monitorování komponent systému RAG
- **Výkonnostní metriky**: Detailní analýzy kvality vyhledávání a doby odezvy
- **Zpracování chyb**: Komplexní správa výjimek s politikami opakování
- **Správa konfigurace**: Nastavení specifická pro prostředí s validací

## ⚙️ Požadavky a nastavení

**Vývojové prostředí:**
- .NET 9.0 SDK nebo vyšší
- Visual Studio 2022 nebo VS Code s rozšířením pro C#
- Azure předplatné s přístupem k AI Foundry

**Požadované balíčky NuGet:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Nastavení autentizace Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Konfigurace prostředí (.env soubor):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Vzory Enterprise RAG

### Vzory správy dokumentů
- **Hromadné nahrávání**: Efektivní zpracování velkých kolekcí dokumentů
- **Inkrementální aktualizace**: Přidávání a úpravy dokumentů v reálném čase
- **Správa verzí**: Verzování dokumentů a sledování změn
- **Správa metadat**: Bohaté atributy dokumentů a taxonomie

### Vzory vyhledávání a získávání
- **Hybridní vyhledávání**: Kombinace sémantického a klíčového vyhledávání pro optimální výsledky
- **Fasetové vyhledávání**: Vícedimenzionální filtrování a kategorizace
- **Ladění relevance**: Vlastní algoritmy skórování pro specifické potřeby domény
- **Hodnocení výsledků**: Pokročilé hodnocení s integrací obchodní logiky

### Bezpečnostní vzory
- **Bezpečnost na úrovni dokumentů**: Jemně odstupňované řízení přístupu na úrovni dokumentů
- **Klasifikace dat**: Automatické označování citlivosti a ochrana
- **Auditní stopy**: Komplexní logování všech operací RAG
- **Ochrana soukromí**: Detekce a redakce PII

## 🔒 Podnikové bezpečnostní funkce

### Autentizace a autorizace
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Ochrana dat
- **Šifrování**: End-to-end šifrování dokumentů a vyhledávacích indexů
- **Řízení přístupu**: Integrace s Azure AD pro oprávnění uživatelů a skupin
- **Rezidence dat**: Geografická kontrola umístění dat pro soulad
- **Zálohování a obnova**: Automatizované zálohování a postupy obnovy po havárii

## 📈 Optimalizace výkonu

### Vzory asynchronního zpracování
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Správa paměti
- **Streamové zpracování**: Zpracování velkých dokumentů bez problémů s pamětí
- **Pooling zdrojů**: Efektivní opětovné využití nákladných zdrojů
- **Garbage Collection**: Optimalizované vzory alokace paměti
- **Správa připojení**: Správný životní cyklus připojení k Azure službám

### Strategie cachování
- **Cachování dotazů**: Cachování často prováděných vyhledávání
- **Cachování dokumentů**: Cachování v paměti pro často používané dokumenty
- **Cachování indexů**: Optimalizované cachování vektorových indexů
- **Cachování výsledků**: Inteligentní cachování generovaných odpovědí

## 📊 Podnikové případy použití

### Správa znalostí
- **Podniková wiki**: Inteligentní vyhledávání v podnikovém znalostním základu
- **Politiky a postupy**: Automatizované vedení v oblasti souladu a postupů
- **Školící materiály**: Inteligentní pomoc při učení a rozvoji
- **Výzkumné databáze**: Systémy analýzy akademických a výzkumných prací

### Zákaznická podpora
- **Znalostní báze podpory**: Automatizované odpovědi zákaznické podpory
- **Produktová dokumentace**: Inteligentní získávání informací o produktech
- **Průvodci řešením problémů**: Kontextová pomoc při řešení problémů
- **FAQ systémy**: Dynamická generace FAQ z kolekcí dokumentů

### Regulační soulad
- **Analýza právních dokumentů**: Inteligence smluv a právních dokumentů
- **Monitorování souladu**: Automatizované kontroly regulačního souladu
- **Hodnocení rizik**: Analýza a reportování rizik na základě dokumentů
- **Podpora auditu**: Inteligentní objevování dokumentů pro audity

## 🚀 Nasazení do produkce

### Monitorování a pozorovatelnost
- **Application Insights**: Detailní telemetrie a monitorování výkonu
- **Vlastní metriky**: Sledování a upozorňování na obchodně specifické KPI
- **Distribuované trasování**: Sledování požadavků od začátku do konce napříč službami
- **Dashboardy zdraví**: Vizualizace zdraví a výkonu systému v reálném čase

### Škálovatelnost a spolehlivost
- **Automatické škálování**: Automatické škálování na základě zátěže a metrik výkonu
- **Vysoká dostupnost**: Nasazení v několika regionech s možností přepnutí při selhání
- **Zátěžové testování**: Validace výkonu při podnikové zátěži
- **Obnova po havárii**: Automatizované zálohování a postupy obnovy

Připraveni vytvořit podnikové RAG systémy, které zvládnou citlivé dokumenty ve velkém měřítku? Pojďme navrhnout inteligentní znalostní systémy pro podniky! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Upozornění**:  
Tento dokument byl přeložen pomocí služby pro automatický překlad [Co-op Translator](https://github.com/Azure/co-op-translator). I když se snažíme o co největší přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Za autoritativní zdroj by měl být považován původní dokument v jeho původním jazyce. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné výklady vyplývající z použití tohoto překladu.
