# 🔍 Enterprise RAG s Azure AI Foundry (.NET)

## 📋 Ciele učenia

Tento notebook ukazuje, ako vytvoriť systémy Retrieval-Augmented Generation (RAG) na podnikovej úrovni pomocou Microsoft Agent Framework v .NET s Azure AI Foundry. Naučíte sa vytvárať produkčne pripravených agentov, ktorí dokážu vyhľadávať v dokumentoch a poskytovať presné, kontextovo relevantné odpovede s podnikovou bezpečnosťou a škálovateľnosťou.

**Funkcie Enterprise RAG, ktoré vytvoríte:**
- 📚 **Inteligencia dokumentov**: Pokročilé spracovanie dokumentov pomocou služieb Azure AI
- 🔍 **Semantické vyhľadávanie**: Vysoko výkonné vektorové vyhľadávanie s podnikovými funkciami
- 🛡️ **Integrácia bezpečnosti**: Riadenie prístupu na základe rolí a vzory ochrany údajov
- 🏢 **Škálovateľná architektúra**: Produkčne pripravené RAG systémy s monitorovaním

## 🎯 Architektúra Enterprise RAG

### Kľúčové podnikové komponenty
- **Azure AI Foundry**: Spravovaná podniková AI platforma s bezpečnosťou a súladom
- **Persistentní agenti**: Stavoví agenti s históriou konverzácií a správou kontextu
- **Správa vektorového úložiska**: Podnikové indexovanie a vyhľadávanie dokumentov
- **Integrácia identity**: Autentifikácia Azure AD a riadenie prístupu na základe rolí

### Výhody .NET pre podniky
- **Typová bezpečnosť**: Validácia operácií RAG a dátových štruktúr počas kompilácie
- **Asynchrónny výkon**: Nezablokované spracovanie dokumentov a vyhľadávacie operácie
- **Správa pamäte**: Efektívne využívanie zdrojov pre veľké kolekcie dokumentov
- **Vzory integrácie**: Natívna integrácia služieb Azure s injekciou závislostí

## 🏗️ Technická architektúra

### Pipeline Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Kľúčové komponenty .NET
- **Azure.AI.Agents.Persistent**: Správa podnikových agentov s perzistenciou stavu
- **Azure.Identity**: Integrovaná autentifikácia pre bezpečný prístup k službám Azure
- **Microsoft.Agents.AI.AzureAI**: Implementácia optimalizovaného agentového rámca pre Azure
- **System.Linq.Async**: Vysoko výkonné asynchrónne operácie LINQ

## 🔧 Funkcie a výhody pre podniky

### Bezpečnosť a súlad
- **Integrácia Azure AD**: Správa podnikovej identity a autentifikácie
- **Riadenie prístupu na základe rolí**: Jemne zrnité povolenia pre prístup k dokumentom a operáciám
- **Ochrana údajov**: Šifrovanie v pokoji a počas prenosu pre citlivé dokumenty
- **Auditné logovanie**: Komplexné sledovanie aktivít pre požiadavky na súlad

### Výkon a škálovateľnosť
- **Pooling pripojení**: Efektívna správa pripojení k službám Azure
- **Asynchrónne spracovanie**: Nezablokované operácie pre scenáre s vysokou priepustnosťou
- **Stratégie cache**: Inteligentné cache pre často prístupné dokumenty
- **Vyvažovanie záťaže**: Distribuované spracovanie pre veľké nasadenia

### Správa a monitorovanie
- **Kontroly zdravia**: Zabudované monitorovanie komponentov systému RAG
- **Výkonnostné metriky**: Podrobné analýzy kvality vyhľadávania a časov odozvy
- **Správa chýb**: Komplexné riadenie výnimiek s politikami opakovania
- **Správa konfigurácie**: Nastavenia špecifické pre prostredie s validáciou

## ⚙️ Predpoklady a nastavenie

**Vývojové prostredie:**
- .NET 9.0 SDK alebo vyšší
- Visual Studio 2022 alebo VS Code s rozšírením C#
- Predplatné Azure s prístupom k AI Foundry

**Požadované balíky NuGet:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Nastavenie autentifikácie Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Konfigurácia prostredia (.env súbor):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Vzory Enterprise RAG

### Vzory správy dokumentov
- **Hromadné nahrávanie**: Efektívne spracovanie veľkých kolekcií dokumentov
- **Postupné aktualizácie**: Pridávanie a úprava dokumentov v reálnom čase
- **Riadenie verzií**: Verziovanie dokumentov a sledovanie zmien
- **Správa metadát**: Bohaté atribúty dokumentov a taxonómia

### Vzory vyhľadávania a získavania
- **Hybridné vyhľadávanie**: Kombinácia semantického a kľúčového vyhľadávania pre optimálne výsledky
- **Fasetové vyhľadávanie**: Viacrozmerné filtrovanie a kategorizácia
- **Ladenie relevantnosti**: Vlastné algoritmy skórovania pre špecifické potreby domény
- **Hodnotenie výsledkov**: Pokročilé hodnotenie s integráciou obchodnej logiky

### Vzory bezpečnosti
- **Bezpečnosť na úrovni dokumentov**: Jemne zrnitá kontrola prístupu na úrovni dokumentov
- **Klasifikácia údajov**: Automatické označovanie citlivosti a ochrana
- **Auditné stopy**: Komplexné logovanie všetkých operácií RAG
- **Ochrana súkromia**: Detekcia a redakcia PII

## 🔒 Funkcie bezpečnosti pre podniky

### Autentifikácia a autorizácia
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Ochrana údajov
- **Šifrovanie**: End-to-end šifrovanie pre dokumenty a vyhľadávacie indexy
- **Kontroly prístupu**: Integrácia s Azure AD pre povolenia používateľov a skupín
- **Rezidencia údajov**: Geografické kontroly umiestnenia údajov pre súlad
- **Zálohovanie a obnova**: Automatizované zálohovanie a postupy obnovy po havárii

## 📈 Optimalizácia výkonu

### Vzory asynchrónneho spracovania
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Správa pamäte
- **Streamové spracovanie**: Spracovanie veľkých dokumentov bez problémov s pamäťou
- **Pooling zdrojov**: Efektívne opätovné použitie nákladných zdrojov
- **Zber odpadu**: Optimalizované vzory alokácie pamäte
- **Správa pripojení**: Správny životný cyklus pripojení k službám Azure

### Stratégie cache
- **Cache dotazov**: Cache často vykonávaných vyhľadávaní
- **Cache dokumentov**: Cache v pamäti pre často používané dokumenty
- **Cache indexov**: Optimalizovaná cache vektorových indexov
- **Cache výsledkov**: Inteligentná cache generovaných odpovedí

## 📊 Podnikové prípady použitia

### Správa znalostí
- **Firemná wiki**: Inteligentné vyhľadávanie v znalostných databázach spoločnosti
- **Politiky a postupy**: Automatizované usmernenia pre súlad a postupy
- **Školiace materiály**: Inteligentná pomoc pri vzdelávaní a rozvoji
- **Výskumné databázy**: Systémy analýzy akademických a výskumných prác

### Zákaznícka podpora
- **Znalostná báza podpory**: Automatizované odpovede zákazníckej podpory
- **Dokumentácia produktov**: Inteligentné vyhľadávanie informácií o produktoch
- **Príručky na riešenie problémov**: Kontextová pomoc pri riešení problémov
- **Systémy FAQ**: Dynamické generovanie FAQ z kolekcií dokumentov

### Regulačný súlad
- **Analýza právnych dokumentov**: Inteligencia zmlúv a právnych dokumentov
- **Monitorovanie súladu**: Automatizované kontroly regulačného súladu
- **Hodnotenie rizík**: Analýza rizík na základe dokumentov a reportovanie
- **Podpora auditu**: Inteligentné vyhľadávanie dokumentov pre audity

## 🚀 Produkčné nasadenie

### Monitorovanie a pozorovateľnosť
- **Application Insights**: Podrobné telemetrie a monitorovanie výkonu
- **Vlastné metriky**: Sledovanie a upozorňovanie na špecifické KPI
- **Distribuované sledovanie**: Sledovanie požiadaviek od začiatku do konca medzi službami
- **Dashboardy zdravia**: Vizualizácia zdravia systému a výkonu v reálnom čase

### Škálovateľnosť a spoľahlivosť
- **Automatické škálovanie**: Automatické škálovanie na základe záťaže a výkonnostných metrík
- **Vysoká dostupnosť**: Nasadenie vo viacerých regiónoch s možnosťou preklopenia
- **Testovanie záťaže**: Validácia výkonu pri podnikovej záťaži
- **Obnova po havárii**: Automatizované postupy zálohovania a obnovy

Pripravení vytvoriť systémy RAG na podnikovej úrovni, ktoré zvládnu citlivé dokumenty vo veľkom rozsahu? Poďme navrhnúť inteligentné systémy znalostí pre podniky! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Upozornenie**:  
Tento dokument bol preložený pomocou služby AI prekladu [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, upozorňujeme, že automatické preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nezodpovedáme za žiadne nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.
