# 🔍 Įmonės RAG su Azure AI Foundry (.NET)

## 📋 Mokymosi tikslai

Šiame užrašų knygelėje parodoma, kaip sukurti įmonės lygio Retrieval-Augmented Generation (RAG) sistemas naudojant Microsoft Agent Framework .NET su Azure AI Foundry. Sužinosite, kaip kurti gamybai paruoštus agentus, kurie gali ieškoti dokumentuose ir pateikti tikslius, kontekstinius atsakymus su įmonės saugumu ir mastelio keitimu.

**Įmonės RAG galimybės, kurias sukursite:**
- 📚 **Dokumentų intelektas**: Pažangus dokumentų apdorojimas su Azure AI paslaugomis
- 🔍 **Semantinė paieška**: Didelio našumo vektorinė paieška su įmonės funkcijomis
- 🛡️ **Saugumo integracija**: Prieigos pagal vaidmenis ir duomenų apsaugos modeliai
- 🏢 **Mastelio keitimo architektūra**: Gamybai paruoštos RAG sistemos su stebėsena

## 🎯 Įmonės RAG architektūra

### Pagrindiniai įmonės komponentai
- **Azure AI Foundry**: Valdoma įmonės AI platforma su saugumu ir atitiktimi
- **Nuolatiniai agentai**: Agentai su pokalbių istorija ir konteksto valdymu
- **Vektorinės saugyklos valdymas**: Įmonės lygio dokumentų indeksavimas ir paieška
- **Tapatybės integracija**: Azure AD autentifikacija ir prieigos kontrolė pagal vaidmenis

### .NET įmonės privalumai
- **Tipų saugumas**: Kompiliavimo metu patvirtinamos RAG operacijos ir duomenų struktūros
- **Asinchroninis našumas**: Neužblokuojantis dokumentų apdorojimas ir paieškos operacijos
- **Atminties valdymas**: Efektyvus išteklių naudojimas didelėms dokumentų kolekcijoms
- **Integracijos modeliai**: Natūrali Azure paslaugų integracija su priklausomybių injekcija

## 🏗️ Techninė architektūra

### Įmonės RAG procesas
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Pagrindiniai .NET komponentai
- **Azure.AI.Agents.Persistent**: Įmonės agentų valdymas su būsenos išsaugojimu
- **Azure.Identity**: Integruota autentifikacija saugiam Azure paslaugų naudojimui
- **Microsoft.Agents.AI.AzureAI**: Azure optimizuota agentų sistemos įgyvendinimas
- **System.Linq.Async**: Didelio našumo asinchroninės LINQ operacijos

## 🔧 Įmonės funkcijos ir privalumai

### Saugumas ir atitiktis
- **Azure AD integracija**: Įmonės tapatybės valdymas ir autentifikacija
- **Prieiga pagal vaidmenis**: Smulkiai detalizuotos leidimų kontrolės dokumentų prieigai ir operacijoms
- **Duomenų apsauga**: Šifravimas ramybės būsenoje ir perduodant jautrius dokumentus
- **Audito žurnalai**: Išsamus veiklos stebėjimas atitikties reikalavimams

### Našumas ir mastelio keitimas
- **Jungčių telkinys**: Efektyvus Azure paslaugų jungčių valdymas
- **Asinchroninis apdorojimas**: Neužblokuojančios operacijos didelio našumo scenarijams
- **Talpyklos strategijos**: Protingas talpyklos naudojimas dažnai pasiekiamiems dokumentams
- **Krovos balansavimas**: Paskirstytas apdorojimas didelio masto diegimams

### Valdymas ir stebėsena
- **Sveikatos patikrinimai**: Įmontuota RAG sistemos komponentų stebėsena
- **Našumo metrika**: Išsami analizė apie paieškos kokybę ir atsako laiką
- **Klaidų valdymas**: Išsamus išimčių valdymas su pakartojimo politikomis
- **Konfigūracijos valdymas**: Aplinkai specifiniai nustatymai su patvirtinimu

## ⚙️ Reikalavimai ir nustatymas

**Kūrimo aplinka:**
- .NET 9.0 SDK ar naujesnė
- Visual Studio 2022 arba VS Code su C# plėtiniu
- Azure prenumerata su AI Foundry prieiga

**Reikalingi NuGet paketai:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure autentifikacijos nustatymas:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Aplinkos konfigūracija (.env failas):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Įmonės RAG modeliai

### Dokumentų valdymo modeliai
- **Masinis įkėlimas**: Efektyvus didelių dokumentų kolekcijų apdorojimas
- **Inkrementiniai atnaujinimai**: Dokumentų pridėjimas ir keitimas realiu laiku
- **Versijų kontrolė**: Dokumentų versijų valdymas ir pakeitimų stebėjimas
- **Metaduomenų valdymas**: Turtingi dokumentų atributai ir taksonomija

### Paieškos ir gavimo modeliai
- **Hibridinė paieška**: Semantinės ir raktažodžių paieškos derinimas optimaliems rezultatams
- **Fasetinė paieška**: Daugiamatė filtracija ir kategorijų nustatymas
- **Reikšmingumo derinimas**: Individualizuoti vertinimo algoritmai specifiniams poreikiams
- **Rezultatų reitingavimas**: Pažangus reitingavimas su verslo logikos integracija

### Saugumo modeliai
- **Dokumentų lygio saugumas**: Smulkiai detalizuota prieigos kontrolė kiekvienam dokumentui
- **Duomenų klasifikacija**: Automatinis jautrumo žymėjimas ir apsauga
- **Audito pėdsakai**: Išsamus visų RAG operacijų žurnalavimas
- **Privatumo apsauga**: PII aptikimas ir redagavimas

## 🔒 Įmonės saugumo funkcijos

### Autentifikacija ir autorizacija
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Duomenų apsauga
- **Šifravimas**: Pilnas dokumentų ir paieškos indeksų šifravimas
- **Prieigos kontrolė**: Integracija su Azure AD vartotojų ir grupių leidimams
- **Duomenų buvimo vieta**: Geografinė duomenų vietos kontrolė atitikties reikalavimams
- **Atsarginės kopijos ir atkūrimas**: Automatinės atsarginės kopijos ir nelaimių atkūrimo galimybės

## 📈 Našumo optimizavimas

### Asinchroninio apdorojimo modeliai
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Atminties valdymas
- **Srautinio apdorojimo**: Didelių dokumentų apdorojimas be atminties problemų
- **Išteklių telkinys**: Efektyvus brangių išteklių pakartotinis naudojimas
- **Šiukšlių surinkimas**: Optimizuoti atminties paskirstymo modeliai
- **Jungčių valdymas**: Tinkamas Azure paslaugų jungčių gyvavimo ciklas

### Talpyklos strategijos
- **Užklausų talpykla**: Dažnai vykdomų paieškų talpyklos naudojimas
- **Dokumentų talpykla**: Atminties talpykla karštiems dokumentams
- **Indeksų talpykla**: Optimizuota vektorinė indeksų talpykla
- **Rezultatų talpykla**: Protinga sugeneruotų atsakymų talpykla

## 📊 Įmonės naudojimo atvejai

### Žinių valdymas
- **Įmonės wiki**: Išmanioji paieška per įmonės žinių bazes
- **Politika ir procedūros**: Automatinė atitikties ir procedūrų pagalba
- **Mokymo medžiaga**: Išmanioji mokymosi ir tobulėjimo pagalba
- **Tyrimų duomenų bazės**: Akademinių ir mokslinių straipsnių analizės sistemos

### Klientų aptarnavimas
- **Pagalbos žinių bazė**: Automatiniai klientų aptarnavimo atsakymai
- **Produkto dokumentacija**: Išmanioji produkto informacijos paieška
- **Trikčių šalinimo vadovai**: Kontekstinė problemų sprendimo pagalba
- **DUK sistemos**: Dinaminis DUK generavimas iš dokumentų kolekcijų

### Reglamentinė atitiktis
- **Teisinių dokumentų analizė**: Sutarčių ir teisinių dokumentų intelektas
- **Atitikties stebėjimas**: Automatinis reglamentinės atitikties tikrinimas
- **Rizikos vertinimas**: Dokumentais pagrįsta rizikos analizė ir ataskaitos
- **Audito pagalba**: Išmanioji dokumentų paieška auditams

## 🚀 Gamybos diegimas

### Stebėsena ir stebimumas
- **Application Insights**: Išsami telemetrija ir našumo stebėjimas
- **Individualizuota metrika**: Verslo specifinių KPI stebėjimas ir įspėjimai
- **Paskirstytas sekimas**: Pilnas užklausų sekimas per paslaugas
- **Sveikatos skydeliai**: Realaus laiko sistemos sveikatos ir našumo vizualizacija

### Mastelio keitimas ir patikimumas
- **Automatinis mastelio keitimas**: Automatinis mastelio keitimas pagal apkrovą ir našumo metrikas
- **Didelis prieinamumas**: Daugiaregioninis diegimas su perjungimo galimybėmis
- **Krovos testavimas**: Našumo patvirtinimas esant įmonės apkrovos sąlygoms
- **Nelaimių atkūrimas**: Automatinės atsarginės kopijos ir atkūrimo procedūros

Pasiruošę kurti įmonės lygio RAG sistemas, kurios gali apdoroti jautrius dokumentus dideliu mastu? Sukurkime išmaniąsias žinių sistemas įmonei! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Atsakomybės atsisakymas**:  
Šis dokumentas buvo išverstas naudojant AI vertimo paslaugą [Co-op Translator](https://github.com/Azure/co-op-translator). Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudoti profesionalų žmogaus vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar neteisingus aiškinimus, kylančius dėl šio vertimo naudojimo.
