# 🔍 Enterprise RAG s Azure AI Foundry (.NET)

## 📋 Ciljevi učenja

Ovaj notebook pokazuje kako izgraditi sustave za dohvat i generiranje (RAG) na razini poduzeća koristeći Microsoft Agent Framework u .NET-u s Azure AI Foundry. Naučit ćete kako kreirati agente spremne za produkciju koji mogu pretraživati dokumente i pružati točne, kontekstualno svjesne odgovore uz sigurnost i skalabilnost na razini poduzeća.

**Sposobnosti Enterprise RAG-a koje ćete razviti:**
- 📚 **Inteligencija dokumenata**: Napredno procesiranje dokumenata uz Azure AI usluge
- 🔍 **Semantičko pretraživanje**: Visokoučinkovito pretraživanje vektora s funkcijama za poduzeća
- 🛡️ **Integracija sigurnosti**: Pristup temeljen na ulogama i obrasci zaštite podataka
- 🏢 **Skalabilna arhitektura**: Sustavi RAG spremni za produkciju s praćenjem

## 🎯 Arhitektura Enterprise RAG-a

### Ključne komponente za poduzeća
- **Azure AI Foundry**: Upravljana AI platforma za poduzeća sa sigurnošću i usklađenošću
- **Persistentni agenti**: Agenti sa stanjem koji čuvaju povijest razgovora i upravljanje kontekstom
- **Upravljanje vektorskom pohranom**: Indeksiranje i dohvat dokumenata na razini poduzeća
- **Integracija identiteta**: Autentifikacija putem Azure AD-a i kontrola pristupa temeljenog na ulogama

### Prednosti .NET-a za poduzeća
- **Sigurnost tipova**: Provjera valjanosti operacija RAG-a i struktura podataka tijekom kompajliranja
- **Asinkrona izvedba**: Neblokirajuće procesiranje dokumenata i operacije pretraživanja
- **Upravljanje memorijom**: Učinkovito korištenje resursa za velike kolekcije dokumenata
- **Integracijski obrasci**: Izvorna integracija Azure usluga s ubrizgavanjem ovisnosti

## 🏗️ Tehnička arhitektura

### Enterprise RAG cjevovod
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Ključne .NET komponente
- **Azure.AI.Agents.Persistent**: Upravljanje agentima za poduzeća s očuvanjem stanja
- **Azure.Identity**: Integrirana autentifikacija za siguran pristup Azure uslugama
- **Microsoft.Agents.AI.AzureAI**: Implementacija okvira za agente optimizirana za Azure
- **System.Linq.Async**: Visokoučinkovite asinkrone LINQ operacije

## 🔧 Značajke i prednosti za poduzeća

### Sigurnost i usklađenost
- **Integracija s Azure AD-om**: Upravljanje identitetima i autentifikacija na razini poduzeća
- **Pristup temeljen na ulogama**: Precizne dozvole za pristup dokumentima i operacijama
- **Zaštita podataka**: Šifriranje u mirovanju i tijekom prijenosa za osjetljive dokumente
- **Dnevnik aktivnosti**: Sveobuhvatno praćenje aktivnosti za zahtjeve usklađenosti

### Izvedba i skalabilnost
- **Upravljanje vezama**: Učinkovito upravljanje vezama s Azure uslugama
- **Asinkrono procesiranje**: Neblokirajuće operacije za scenarije visokog protoka
- **Strategije predmemoriranja**: Inteligentno predmemoriranje često pristupanih dokumenata
- **Ravnoteža opterećenja**: Distribuirano procesiranje za implementacije velikih razmjera

### Upravljanje i praćenje
- **Provjera zdravlja**: Ugrađeno praćenje komponenti sustava RAG
- **Metričke izvedbe**: Detaljna analitika kvalitete pretraživanja i vremena odgovora
- **Upravljanje greškama**: Sveobuhvatno upravljanje iznimkama s politikama ponovnog pokušaja
- **Upravljanje konfiguracijom**: Postavke specifične za okruženje s provjerom valjanosti

## ⚙️ Preduvjeti i postavljanje

**Razvojno okruženje:**
- .NET 9.0 SDK ili noviji
- Visual Studio 2022 ili VS Code s C# ekstenzijom
- Azure pretplata s pristupom AI Foundry

**Potrebni NuGet paketi:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Postavljanje autentifikacije za Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Konfiguracija okruženja (.env datoteka):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Obrasci Enterprise RAG-a

### Obrasci upravljanja dokumentima
- **Masovno učitavanje**: Učinkovito procesiranje velikih kolekcija dokumenata
- **Inkrementalna ažuriranja**: Dodavanje i izmjena dokumenata u stvarnom vremenu
- **Kontrola verzija**: Verzioniranje dokumenata i praćenje promjena
- **Upravljanje metapodacima**: Bogati atributi dokumenata i taksonomija

### Obrasci pretraživanja i dohvaćanja
- **Hibridno pretraživanje**: Kombinacija semantičkog i ključnog pretraživanja za optimalne rezultate
- **Pretraživanje s fasetama**: Višedimenzionalno filtriranje i kategorizacija
- **Podešavanje relevantnosti**: Prilagođeni algoritmi bodovanja za specifične domene
- **Rangiranje rezultata**: Napredno rangiranje s integracijom poslovne logike

### Obrasci sigurnosti
- **Sigurnost na razini dokumenta**: Precizna kontrola pristupa po dokumentu
- **Klasifikacija podataka**: Automatsko označavanje osjetljivosti i zaštita
- **Dnevnik aktivnosti**: Sveobuhvatno bilježenje svih operacija RAG-a
- **Zaštita privatnosti**: Otkrivanje i redakcija osobnih podataka (PII)

## 🔒 Značajke sigurnosti za poduzeća

### Autentifikacija i autorizacija
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Zaštita podataka
- **Šifriranje**: Šifriranje od kraja do kraja za dokumente i indekse pretraživanja
- **Kontrole pristupa**: Integracija s Azure AD-om za dozvole korisnika i grupa
- **Rezidencija podataka**: Kontrole lokacije podataka za usklađenost
- **Sigurnosne kopije i oporavak**: Automatizirane sigurnosne kopije i postupci oporavka

## 📈 Optimizacija izvedbe

### Obrasci asinkronog procesiranja
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Upravljanje memorijom
- **Procesiranje u strujama**: Obrada velikih dokumenata bez problema s memorijom
- **Upravljanje resursima**: Učinkovito ponovno korištenje skupih resursa
- **Sakupljanje smeća**: Optimizirani obrasci dodjele memorije
- **Upravljanje vezama**: Pravilno upravljanje životnim ciklusom veze s Azure uslugama

### Strategije predmemoriranja
- **Predmemoriranje upita**: Predmemoriranje često izvršenih pretraživanja
- **Predmemoriranje dokumenata**: Predmemoriranje u memoriji za "vruće" dokumente
- **Predmemoriranje indeksa**: Optimizirano predmemoriranje vektorskih indeksa
- **Predmemoriranje rezultata**: Inteligentno predmemoriranje generiranih odgovora

## 📊 Primjene za poduzeća

### Upravljanje znanjem
- **Korporativni wiki**: Inteligentno pretraživanje kroz baze znanja tvrtke
- **Politike i procedure**: Automatizirano usmjeravanje za usklađenost i procedure
- **Materijali za obuku**: Inteligentna pomoć u učenju i razvoju
- **Baze podataka za istraživanje**: Sustavi za analizu akademskih i istraživačkih radova

### Korisnička podrška
- **Baza znanja za podršku**: Automatizirani odgovori za korisničku podršku
- **Dokumentacija proizvoda**: Inteligentno dohvaćanje informacija o proizvodima
- **Vodiči za rješavanje problema**: Kontekstualna pomoć u rješavanju problema
- **Sustavi FAQ-a**: Dinamičko generiranje FAQ-a iz kolekcija dokumenata

### Usklađenost s propisima
- **Analiza pravnih dokumenata**: Inteligencija za ugovore i pravne dokumente
- **Praćenje usklađenosti**: Automatizirano provjeravanje usklađenosti s propisima
- **Procjena rizika**: Analiza i izvještavanje o rizicima temeljenim na dokumentima
- **Podrška za revizije**: Inteligentno otkrivanje dokumenata za revizije

## 🚀 Produkcijska implementacija

### Praćenje i preglednost
- **Application Insights**: Detaljno praćenje telemetrije i izvedbe
- **Prilagođene metrike**: Praćenje i upozorenja za poslovne KPI-jeve
- **Distribuirano praćenje**: Praćenje zahtjeva od kraja do kraja kroz usluge
- **Nadzorne ploče zdravlja**: Vizualizacija zdravlja sustava i izvedbe u stvarnom vremenu

### Skalabilnost i pouzdanost
- **Automatsko skaliranje**: Automatsko skaliranje na temelju opterećenja i metrika izvedbe
- **Visoka dostupnost**: Implementacija u više regija s mogućnostima prebacivanja
- **Testiranje opterećenja**: Validacija izvedbe pod opterećenjem na razini poduzeća
- **Oporavak od katastrofe**: Automatizirane sigurnosne kopije i postupci oporavka

Spremni za izgradnju RAG sustava na razini poduzeća koji mogu obrađivati osjetljive dokumente u velikom opsegu? Idemo arhitektirati inteligentne sustave znanja za poduzeća! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Izjava o odricanju odgovornosti**:  
Ovaj dokument je preveden pomoću AI usluge za prevođenje [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za nesporazume ili pogrešna tumačenja koja mogu proizaći iz korištenja ovog prijevoda.
