# 🔍 Ettevõtte RAG Azure AI Foundryga (.NET)

## 📋 Õpieesmärgid

See märkmik näitab, kuidas luua ettevõtte tasemel Retrieval-Augmented Generation (RAG) süsteeme, kasutades Microsoft Agent Frameworki .NET-is koos Azure AI Foundryga. Õpid looma tootmisvalmis agente, kes suudavad dokumente otsida ja pakkuda täpseid, kontekstitundlikke vastuseid koos ettevõtte turvalisuse ja skaleeritavusega.

**Ettevõtte RAG võimekused, mida ehitad:**
- 📚 **Dokumenditöötlus**: Täiustatud dokumenditöötlus Azure AI teenustega
- 🔍 **Semantiline otsing**: Kõrge jõudlusega vektorotsing koos ettevõtte funktsioonidega
- 🛡️ **Turvalisuse integreerimine**: Rollipõhine juurdepääs ja andmekaitse mustrid
- 🏢 **Skaleeritav arhitektuur**: Tootmisvalmis RAG süsteemid koos jälgimisega

## 🎯 Ettevõtte RAG arhitektuur

### Põhilised ettevõtte komponendid
- **Azure AI Foundry**: Hallatud ettevõtte AI platvorm koos turvalisuse ja vastavusega
- **Püsivad agendid**: Oleku säilitamisega agendid, kes haldavad vestluste ajalugu ja konteksti
- **Vektorite haldamine**: Ettevõtte tasemel dokumentide indekseerimine ja otsing
- **Identiteedi integreerimine**: Azure AD autentimine ja rollipõhine juurdepääsukontroll

### .NET-i ettevõtte eelised
- **Tüübikindlus**: Kompileerimise ajal valideerimine RAG operatsioonide ja andmestruktuuride jaoks
- **Asünkroonne jõudlus**: Mitteblokeeriv dokumenditöötlus ja otsingutegevused
- **Mälu haldamine**: Tõhus ressursside kasutamine suurte dokumendikogude jaoks
- **Integreerimismustrid**: Natiivne Azure teenuste integreerimine sõltuvuste süstimisega

## 🏗️ Tehniline arhitektuur

### Ettevõtte RAG torujuhe
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Põhilised .NET komponendid
- **Azure.AI.Agents.Persistent**: Ettevõtte agentide haldamine oleku säilitamisega
- **Azure.Identity**: Integreeritud autentimine turvaliseks Azure teenuste kasutamiseks
- **Microsoft.Agents.AI.AzureAI**: Azure-optimeeritud agentide raamistik
- **System.Linq.Async**: Kõrge jõudlusega asünkroonsed LINQ operatsioonid

## 🔧 Ettevõtte funktsioonid ja eelised

### Turvalisus ja vastavus
- **Azure AD integreerimine**: Ettevõtte identiteedihaldus ja autentimine
- **Rollipõhine juurdepääs**: Täpne õiguste haldamine dokumentide ja operatsioonide jaoks
- **Andmekaitse**: Krüpteerimine nii salvestamisel kui edastamisel tundlike dokumentide jaoks
- **Auditilogid**: Põhjalik tegevuste jälgimine vastavusnõuete täitmiseks

### Jõudlus ja skaleeritavus
- **Ühenduste haldamine**: Tõhus Azure teenuste ühenduste haldamine
- **Asünkroonne töötlemine**: Mitteblokeerivad operatsioonid suure läbilaskevõimega stsenaariumide jaoks
- **Vahemälu strateegiad**: Nutikas vahemälu sageli kasutatavate dokumentide jaoks
- **Koormuse tasakaalustamine**: Hajutatud töötlemine suurte juurutuste jaoks

### Haldamine ja jälgimine
- **Tervisekontrollid**: Sisseehitatud jälgimine RAG süsteemi komponentide jaoks
- **Jõudlusmõõdikud**: Üksikasjalik analüüs otsingukvaliteedi ja vastuseaegade kohta
- **Vigade käsitlemine**: Põhjalik erandite haldamine koos korduspoliitikatega
- **Konfiguratsiooni haldamine**: Keskkonnaspetsiifilised seaded koos valideerimisega

## ⚙️ Eeltingimused ja seadistamine

**Arenduskeskkond:**
- .NET 9.0 SDK või uuem
- Visual Studio 2022 või VS Code koos C# laiendusega
- Azure tellimus koos AI Foundry juurdepääsuga

**Nõutavad NuGet paketid:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure autentimise seadistamine:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Keskkonna konfiguratsioon (.env fail):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Ettevõtte RAG mustrid

### Dokumendihalduse mustrid
- **Massiline üleslaadimine**: Tõhus suurte dokumendikogude töötlemine
- **Järk-järguline uuendamine**: Reaalajas dokumentide lisamine ja muutmine
- **Versioonihaldus**: Dokumentide versioonide ja muudatuste jälgimine
- **Metaandmete haldamine**: Rikkalikud dokumendi atribuudid ja taksonoomia

### Otsingu ja leidmise mustrid
- **Hübriidotsing**: Semantilise ja märksõnaotsingu kombineerimine parimate tulemuste saavutamiseks
- **Faktoriotsing**: Mitmemõõtmeline filtreerimine ja kategoriseerimine
- **Asjakohasuse häälestamine**: Kohandatud skoorimisalgoritmid valdkonnaspetsiifiliste vajaduste jaoks
- **Tulemuste järjestamine**: Täiustatud järjestamine äriloogika integreerimisega

### Turvalisuse mustrid
- **Dokumenditasemel turvalisus**: Täpne juurdepääsukontroll iga dokumendi jaoks
- **Andmete klassifitseerimine**: Automaatne tundlikkuse märgistamine ja kaitse
- **Auditijäljed**: Kõigi RAG operatsioonide põhjalik logimine
- **Privaatsuse kaitse**: PII tuvastamine ja redigeerimine

## 🔒 Ettevõtte turvalisuse funktsioonid

### Autentimine ja autoriseerimine
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Andmekaitse
- **Krüpteerimine**: Dokumentide ja otsinguindeksite otsast lõpuni krüpteerimine
- **Juurdepääsukontrollid**: Integreerimine Azure AD-ga kasutaja ja grupi õiguste haldamiseks
- **Andmete asukoht**: Geograafiline andmete asukoha kontroll vastavuse tagamiseks
- **Varundamine ja taastamine**: Automaatne varundamine ja katastroofide taastamise võimalused

## 📈 Jõudluse optimeerimine

### Asünkroonsed töötlemismustrid
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Mälu haldamine
- **Voogtöötlus**: Suurte dokumentide töötlemine ilma mäluprobleemideta
- **Ressursside haldamine**: Kallite ressursside tõhus taaskasutus
- **Prügi kogumine**: Optimeeritud mälukasutuse mustrid
- **Ühenduste haldamine**: Azure teenuste ühenduste elutsükli korrektne haldamine

### Vahemälu strateegiad
- **Päringute vahemälu**: Sageli teostatud otsingute vahemällu salvestamine
- **Dokumentide vahemälu**: Kuumade dokumentide mälusisene vahemälu
- **Indeksite vahemälu**: Optimeeritud vektorindeksite vahemällu salvestamine
- **Tulemuste vahemälu**: Nutikas genereeritud vastuste vahemällu salvestamine

## 📊 Ettevõtte kasutusjuhtumid

### Teadmiste haldamine
- **Ettevõtte Wiki**: Intelligentsed otsingud ettevõtte teadmistebaasides
- **Poliitikad ja protseduurid**: Automaatne vastavus ja protseduuride juhendamine
- **Koolitusmaterjalid**: Intelligentsed õppimise ja arendamise abivahendid
- **Uurimisandmebaasid**: Akadeemiliste ja teadusartiklite analüüsi süsteemid

### Klienditugi
- **Tugiteenuste teadmistebaas**: Automaatne klienditeeninduse vastamine
- **Tootedokumentatsioon**: Intelligentsed tooteteabe otsingud
- **Tõrkeotsingu juhendid**: Kontekstipõhine probleemide lahendamise abi
- **KKK süsteemid**: Dünaamiline KKK genereerimine dokumendikogudest

### Regulatiivne vastavus
- **Juriidiliste dokumentide analüüs**: Lepingute ja juriidiliste dokumentide intelligentsus
- **Vastavuse jälgimine**: Automaatne regulatiivsete nõuete kontrollimine
- **Riskihindamine**: Dokumentide põhine riskianalüüs ja aruandlus
- **Auditi tugi**: Intelligentsed dokumentide avastamise süsteemid auditite jaoks

## 🚀 Tootmise juurutamine

### Jälgimine ja nähtavus
- **Application Insights**: Üksikasjalik telemeetria ja jõudluse jälgimine
- **Kohandatud mõõdikud**: Ärispetsiifiliste KPI-de jälgimine ja hoiatused
- **Hajutatud jälgimine**: Päringute otsast lõpuni jälgimine teenuste vahel
- **Tervise juhtpaneelid**: Reaalajas süsteemi tervise ja jõudluse visualiseerimine

### Skaleeritavus ja töökindlus
- **Automaatne skaleerimine**: Automaatne skaleerimine koormuse ja jõudlusmõõdikute alusel
- **Kõrge saadavus**: Mitme piirkonna juurutamine koos tõrkesiirde võimalustega
- **Koormustestimine**: Jõudluse valideerimine ettevõtte koormustingimustes
- **Katastroofide taastamine**: Automaatne varundamine ja taastamise protseduurid

Valmis ehitama ettevõtte tasemel RAG süsteeme, mis suudavad hallata tundlikke dokumente suurel skaalal? Kujundame intelligentsed teadmiste süsteemid ettevõtetele! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Lahtiütlus**:  
See dokument on tõlgitud AI tõlketeenuse [Co-op Translator](https://github.com/Azure/co-op-translator) abil. Kuigi püüame tagada täpsust, palume arvestada, et automaatsed tõlked võivad sisaldada vigu või ebatäpsusi. Algne dokument selle algses keeles tuleks pidada autoriteetseks allikaks. Olulise teabe puhul soovitame kasutada professionaalset inimtõlget. Me ei vastuta selle tõlke kasutamisest tulenevate arusaamatuste või valesti tõlgenduste eest.
