# 🔍 Enterprise RAG med Azure AI Foundry (.NET)

## 📋 Læringsmål

Denne notebook viser, hvordan man bygger virksomhedsklare Retrieval-Augmented Generation (RAG) systemer ved hjælp af Microsoft Agent Framework i .NET med Azure AI Foundry. Du lærer at oprette produktionsklare agenter, der kan søge i dokumenter og levere præcise, kontekstbevidste svar med virksomhedssikkerhed og skalerbarhed.

**Enterprise RAG-funktioner, du vil opbygge:**
- 📚 **Dokumentintelligens**: Avanceret dokumentbehandling med Azure AI-tjenester
- 🔍 **Semantisk søgning**: Højtydende vektorsøgning med virksomhedsfunktioner
- 🛡️ **Sikkerhedsintegration**: Rollebaseret adgang og databeskyttelsesmønstre
- 🏢 **Skalerbar arkitektur**: Produktionsklare RAG-systemer med overvågning

## 🎯 Enterprise RAG-arkitektur

### Centrale virksomhedskomponenter
- **Azure AI Foundry**: Administreret AI-platform med sikkerhed og overholdelse
- **Vedvarende agenter**: Agenter med samtalehistorik og kontekststyring
- **Vector Store Management**: Virksomhedsklar dokumentindeksering og -hentning
- **Identitetsintegration**: Azure AD-autentificering og rollebaseret adgangskontrol

### Fordele ved .NET i virksomheder
- **Type-sikkerhed**: Validering af RAG-operationer og datastrukturer ved kompilering
- **Asynkron ydeevne**: Ikke-blokerende dokumentbehandling og søgeoperationer
- **Hukommelsesstyring**: Effektiv ressourceudnyttelse til store dokumentkollektioner
- **Integrationsmønstre**: Native integration med Azure-tjenester via dependency injection

## 🏗️ Teknisk arkitektur

### Enterprise RAG-pipeline
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Centrale .NET-komponenter
- **Azure.AI.Agents.Persistent**: Agentstyring med vedvarende tilstand
- **Azure.Identity**: Integreret autentificering for sikker adgang til Azure-tjenester
- **Microsoft.Agents.AI.AzureAI**: Optimeret agentframework til Azure
- **System.Linq.Async**: Højtydende asynkrone LINQ-operationer

## 🔧 Virksomhedsfunktioner og fordele

### Sikkerhed og overholdelse
- **Azure AD-integration**: Identitetsstyring og autentificering på virksomhedsniveau
- **Rollebaseret adgang**: Finkornet tilladelse til dokumentadgang og operationer
- **Databeskyttelse**: Kryptering af dokumenter både i hvile og under transport
- **Audit-logning**: Omfattende aktivitetsregistrering for overholdelseskrav

### Ydeevne og skalerbarhed
- **Forbindelsespooling**: Effektiv styring af Azure-tjenesteforbindelser
- **Asynkron behandling**: Ikke-blokerende operationer til scenarier med høj gennemstrømning
- **Caching-strategier**: Intelligent caching af ofte tilgåede dokumenter
- **Load balancing**: Distribueret behandling til store implementeringer

### Styring og overvågning
- **Sundhedstjek**: Indbygget overvågning af RAG-systemkomponenter
- **Ydelsesmålinger**: Detaljeret analyse af søgekvalitet og svartider
- **Fejlhåndtering**: Omfattende undtagelseshåndtering med genforsøgspolitikker
- **Konfigurationsstyring**: Miljøspecifikke indstillinger med validering

## ⚙️ Forudsætninger og opsætning

**Udviklingsmiljø:**
- .NET 9.0 SDK eller nyere
- Visual Studio 2022 eller VS Code med C#-udvidelse
- Azure-abonnement med adgang til AI Foundry

**Påkrævede NuGet-pakker:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure-autentificeringsopsætning:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Miljøkonfiguration (.env-fil):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Enterprise RAG-mønstre

### Dokumentstyringsmønstre
- **Bulk-upload**: Effektiv behandling af store dokumentkollektioner
- **Inkrementelle opdateringer**: Realtids tilføjelse og ændring af dokumenter
- **Versionskontrol**: Dokumentversionering og ændringssporing
- **Metadata-styring**: Rig dokumentattributter og taksonomi

### Søge- og hentemønstre
- **Hybrid søgning**: Kombination af semantisk og nøgleordssøgning for optimale resultater
- **Facetteret søgning**: Multidimensionel filtrering og kategorisering
- **Relevansjustering**: Tilpassede scoringsalgoritmer til domænespecifikke behov
- **Resultatrangering**: Avanceret rangering med forretningslogik

### Sikkerhedsmønstre
- **Dokumentniveau-sikkerhed**: Finkornet adgangskontrol pr. dokument
- **Dataklassificering**: Automatisk følsomhedsmærkning og beskyttelse
- **Audit-spor**: Omfattende logning af alle RAG-operationer
- **Privatlivsbeskyttelse**: PII-detektion og redigeringsfunktioner

## 🔒 Virksomhedssikkerhedsfunktioner

### Autentificering og autorisation
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Databeskyttelse
- **Kryptering**: Ende-til-ende kryptering af dokumenter og søgeindekser
- **Adgangskontrol**: Integration med Azure AD for bruger- og gruppeadgang
- **Dataophold**: Geografisk dataplacering for overholdelse
- **Backup og gendannelse**: Automatiserede backup- og katastrofegendannelsesfunktioner

## 📈 Ydelsesoptimering

### Asynkrone behandlingsmønstre
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Hukommelsesstyring
- **Streaming-behandling**: Håndtering af store dokumenter uden hukommelsesproblemer
- **Ressourcepooling**: Effektiv genbrug af dyre ressourcer
- **Garbage Collection**: Optimerede mønstre for hukommelsestildeling
- **Forbindelsesstyring**: Korrekt livscyklus for Azure-tjenesteforbindelser

### Caching-strategier
- **Forespørgselscaching**: Cache ofte udførte søgninger
- **Dokumentcaching**: In-memory caching af populære dokumenter
- **Indekscaching**: Optimeret caching af vektorindekser
- **Resultatcaching**: Intelligent caching af genererede svar

## 📊 Virksomhedsanvendelser

### Vidensstyring
- **Corporate Wiki**: Intelligent søgning i virksomhedens vidensbaser
- **Politikker og procedurer**: Automatisk vejledning i overholdelse og procedurer
- **Uddannelsesmaterialer**: Intelligent lærings- og udviklingsassistance
- **Forskningsdatabaser**: Analyse af akademiske og forskningsartikler

### Kundesupport
- **Supportvidensbase**: Automatiserede kundeserviceresponser
- **Produktdokumentation**: Intelligent produktinformationshentning
- **Fejlfindingsvejledninger**: Kontekstuel problemløsningsassistance
- **FAQ-systemer**: Dynamisk FAQ-generering fra dokumentkollektioner

### Overholdelse af regler
- **Analyse af juridiske dokumenter**: Intelligens i kontrakter og juridiske dokumenter
- **Overholdelsesovervågning**: Automatisk kontrol af regeloverholdelse
- **Risikovurdering**: Dokumentbaseret risikovurdering og rapportering
- **Audit-support**: Intelligent dokumentopdagelse til revisioner

## 🚀 Produktionsimplementering

### Overvågning og synlighed
- **Application Insights**: Detaljeret telemetri og ydeevneovervågning
- **Brugerdefinerede målinger**: KPI-sporing og alarmering specifikt for virksomheden
- **Distribueret sporing**: End-to-end sporing af anmodninger på tværs af tjenester
- **Sundheds-dashboard**: Realtidsvisualisering af systemets sundhed og ydeevne

### Skalerbarhed og pålidelighed
- **Auto-skalering**: Automatisk skalering baseret på belastning og ydeevnemålinger
- **Høj tilgængelighed**: Multi-region implementering med failover-funktioner
- **Load-testning**: Ydeevnevalidering under virksomhedens belastningsforhold
- **Katastrofegendannelse**: Automatiserede backup- og gendannelsesprocedurer

Klar til at bygge virksomhedsklare RAG-systemer, der kan håndtere følsomme dokumenter i stor skala? Lad os designe intelligente videnssystemer til virksomheder! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Ansvarsfraskrivelse**:  
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på nøjagtighed, skal det bemærkes, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os ikke ansvar for eventuelle misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.
