# 🔍 RAG pentru Enterprise cu Azure AI Foundry (.NET)

## 📋 Obiective de Învățare

Acest notebook demonstrează cum să construiești sisteme RAG (Retrieval-Augmented Generation) de nivel enterprise folosind Microsoft Agent Framework în .NET cu Azure AI Foundry. Vei învăța să creezi agenți pregătiți pentru producție, capabili să caute în documente și să ofere răspunsuri precise și relevante, cu securitate și scalabilitate la nivel enterprise.

**Capabilități RAG pentru Enterprise pe care le vei construi:**
- 📚 **Inteligența Documentelor**: Procesare avansată a documentelor cu serviciile Azure AI
- 🔍 **Căutare Semantică**: Căutare vectorială performantă cu funcționalități enterprise
- 🛡️ **Integrare Securitate**: Acces bazat pe roluri și modele de protecție a datelor
- 🏢 **Arhitectură Scalabilă**: Sisteme RAG pregătite pentru producție, cu monitorizare

## 🎯 Arhitectura RAG pentru Enterprise

### Componentele de Bază ale Enterprise
- **Azure AI Foundry**: Platformă AI gestionată pentru enterprise, cu securitate și conformitate
- **Agenți Persistenți**: Agenți cu stare, care gestionează istoricul conversațiilor și contextul
- **Managementul Magazinului de Vectori**: Indexare și recuperare de documente la nivel enterprise
- **Integrare Identitate**: Autentificare Azure AD și control de acces bazat pe roluri

### Beneficii .NET pentru Enterprise
- **Siguranța Tipurilor**: Validare la compilare pentru operațiuni RAG și structuri de date
- **Performanță Async**: Procesare documente și operațiuni de căutare non-blocante
- **Managementul Memoriei**: Utilizare eficientă a resurselor pentru colecții mari de documente
- **Modele de Integrare**: Integrare nativă cu serviciile Azure prin injecție de dependențe

## 🏗️ Arhitectura Tehnică

### Fluxul RAG pentru Enterprise
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Componentele de Bază .NET
- **Azure.AI.Agents.Persistent**: Managementul agenților enterprise cu persistența stării
- **Azure.Identity**: Autentificare integrată pentru acces securizat la serviciile Azure
- **Microsoft.Agents.AI.AzureAI**: Implementare optimizată pentru agenți în Azure
- **System.Linq.Async**: Operațiuni LINQ asincrone de înaltă performanță

## 🔧 Funcționalități și Beneficii pentru Enterprise

### Securitate și Conformitate
- **Integrare Azure AD**: Managementul identității și autentificării la nivel enterprise
- **Acces Bazat pe Roluri**: Permisiuni detaliate pentru accesul la documente și operațiuni
- **Protecția Datelor**: Criptare în repaus și în tranzit pentru documente sensibile
- **Jurnalizare Audit**: Urmărirea activităților pentru cerințele de conformitate

### Performanță și Scalabilitate
- **Pooling Conexiuni**: Management eficient al conexiunilor cu serviciile Azure
- **Procesare Async**: Operațiuni non-blocante pentru scenarii de mare volum
- **Strategii de Caching**: Caching inteligent pentru documentele accesate frecvent
- **Balansare Sarcină**: Procesare distribuită pentru implementări la scară mare

### Management și Monitorizare
- **Verificări de Sănătate**: Monitorizare integrată pentru componentele sistemului RAG
- **Metrice de Performanță**: Analize detaliate ale calității căutării și timpilor de răspuns
- **Gestionarea Erorilor**: Management complet al excepțiilor cu politici de retry
- **Management Configurații**: Setări specifice mediului cu validare

## ⚙️ Cerințe Prealabile și Configurare

**Mediu de Dezvoltare:**
- SDK .NET 9.0 sau mai recent
- Visual Studio 2022 sau VS Code cu extensia C#
- Abonament Azure cu acces la AI Foundry

**Pachete NuGet Necesare:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configurare Autentificare Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configurare Mediu (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Modele RAG pentru Enterprise

### Modele de Management al Documentelor
- **Încărcare în Masă**: Procesare eficientă a colecțiilor mari de documente
- **Actualizări Incrementale**: Adăugare și modificare de documente în timp real
- **Control Versiuni**: Versionare și urmărire a modificărilor documentelor
- **Management Metadata**: Atribute bogate și taxonomie pentru documente

### Modele de Căutare și Recuperare
- **Căutare Hibridă**: Combinarea căutării semantice și pe cuvinte cheie pentru rezultate optime
- **Căutare Facetată**: Filtrare și categorisire multidimensională
- **Ajustare Relevanță**: Algoritmi personalizați de scor pentru nevoi specifice domeniului
- **Clasificare Rezultate**: Clasificare avansată cu integrarea logicii de business

### Modele de Securitate
- **Securitate la Nivel de Document**: Control detaliat al accesului pentru fiecare document
- **Clasificare Date**: Etichetare automată a sensibilității și protecție
- **Urme Audit**: Jurnalizare completă a tuturor operațiunilor RAG
- **Protecția Confidențialității**: Detectare și redactare PII (informații personale identificabile)

## 🔒 Funcționalități de Securitate pentru Enterprise

### Autentificare și Autorizare
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protecția Datelor
- **Criptare**: Criptare end-to-end pentru documente și indici de căutare
- **Control Acces**: Integrare cu Azure AD pentru permisiuni utilizatori și grupuri
- **Rezidența Datelor**: Control geografic al locației datelor pentru conformitate
- **Backup și Recuperare**: Proceduri automate de backup și recuperare în caz de dezastru

## 📈 Optimizare Performanță

### Modele de Procesare Async
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Managementul Memoriei
- **Procesare Streaming**: Gestionarea documentelor mari fără probleme de memorie
- **Pooling Resurse**: Reutilizarea eficientă a resurselor costisitoare
- **Colectare Gunoi**: Modele optimizate de alocare memorie
- **Management Conexiuni**: Ciclu de viață corect al conexiunilor cu serviciile Azure

### Strategii de Caching
- **Caching Interogări**: Cache pentru căutările executate frecvent
- **Caching Documente**: Cache în memorie pentru documentele accesate frecvent
- **Caching Indici**: Optimizare cache pentru indici vectoriali
- **Caching Rezultate**: Cache inteligent pentru răspunsurile generate

## 📊 Cazuri de Utilizare pentru Enterprise

### Managementul Cunoștințelor
- **Wiki Corporativ**: Căutare inteligentă în bazele de cunoștințe ale companiei
- **Politici și Proceduri**: Ghid automatizat pentru conformitate și proceduri
- **Materiale de Training**: Asistență inteligentă pentru învățare și dezvoltare
- **Baze de Date de Cercetare**: Sisteme de analiză pentru lucrări academice și de cercetare

### Suport pentru Clienți
- **Bază de Cunoștințe pentru Suport**: Răspunsuri automatizate pentru serviciul clienți
- **Documentație Produs**: Recuperare inteligentă a informațiilor despre produse
- **Ghiduri de Depanare**: Asistență contextuală pentru rezolvarea problemelor
- **Sisteme FAQ**: Generare dinamică de FAQ din colecțiile de documente

### Conformitate Regulatorie
- **Analiză Documente Legale**: Inteligență pentru contracte și documente legale
- **Monitorizare Conformitate**: Verificare automată a conformității reglementărilor
- **Evaluare Riscuri**: Analiză și raportare a riscurilor bazate pe documente
- **Suport Audit**: Descoperire inteligentă de documente pentru audituri

## 🚀 Implementare în Producție

### Monitorizare și Observabilitate
- **Application Insights**: Telemetrie detaliată și monitorizare performanță
- **Metrice Personalizate**: Urmărirea KPI-urilor specifice business-ului și alerte
- **Tracing Distribuit**: Urmărirea cererilor end-to-end între servicii
- **Dashboard-uri de Sănătate**: Vizualizare în timp real a sănătății și performanței sistemului

### Scalabilitate și Fiabilitate
- **Auto-Scaling**: Scalare automată bazată pe sarcină și metrice de performanță
- **Disponibilitate Ridicată**: Implementare multi-regională cu capabilități de failover
- **Testare Sarcină**: Validare performanță sub condiții de încărcare enterprise
- **Recuperare în Caz de Dezastru**: Proceduri automate de backup și recuperare

Ești pregătit să construiești sisteme RAG de nivel enterprise care pot gestiona documente sensibile la scară? Hai să arhitectăm sisteme inteligente de cunoștințe pentru enterprise! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Declinare de responsabilitate**:  
Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm responsabilitatea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.
