# 🔍 Enterprise RAG med Azure AI Foundry (.NET)

## 📋 Inlärningsmål

Den här notebooken visar hur man bygger företagsklassade Retrieval-Augmented Generation (RAG)-system med Microsoft Agent Framework i .NET och Azure AI Foundry. Du kommer att lära dig att skapa produktionsklara agenter som kan söka igenom dokument och ge korrekta, kontextmedvetna svar med företagsmässig säkerhet och skalbarhet.

**Funktioner för Enterprise RAG som du kommer att bygga:**
- 📚 **Dokumentintelligens**: Avancerad dokumentbearbetning med Azure AI-tjänster
- 🔍 **Semantisk sökning**: Högpresterande vektorsökning med företagsfunktioner
- 🛡️ **Säkerhetsintegration**: Rollbaserad åtkomst och dataskyddsmönster
- 🏢 **Skalbar arkitektur**: Produktionsklara RAG-system med övervakning

## 🎯 Arkitektur för Enterprise RAG

### Kärnkomponenter för företag
- **Azure AI Foundry**: Hanterad AI-plattform för företag med säkerhet och efterlevnad
- **Persistenta agenter**: Tillståndsbaserade agenter med konversationshistorik och kontexthantering
- **Hantering av vektorlagring**: Företagsklassad dokumentindexering och hämtning
- **Identitetsintegration**: Azure AD-autentisering och rollbaserad åtkomstkontroll

### Fördelar med .NET för företag
- **Typkontroll**: Validering vid kompilering för RAG-operationer och datastrukturer
- **Asynkron prestanda**: Icke-blockerande dokumentbearbetning och sökoperationer
- **Minneshantering**: Effektiv resursanvändning för stora dokumentkollektioner
- **Integrationsmönster**: Inbyggd integration med Azure-tjänster och beroendeinjektion

## 🏗️ Teknisk arkitektur

### Enterprise RAG-pipeline
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Kärnkomponenter i .NET
- **Azure.AI.Agents.Persistent**: Hantering av företagsagenter med tillståndsbevarande
- **Azure.Identity**: Integrerad autentisering för säker åtkomst till Azure-tjänster
- **Microsoft.Agents.AI.AzureAI**: Azure-optimerad implementering av agentramverket
- **System.Linq.Async**: Högpresterande asynkrona LINQ-operationer

## 🔧 Funktioner och fördelar för företag

### Säkerhet och efterlevnad
- **Azure AD-integration**: Hantering av företagsidentitet och autentisering
- **Rollbaserad åtkomst**: Finkorniga behörigheter för dokumentåtkomst och operationer
- **Dataskydd**: Kryptering vid lagring och överföring för känsliga dokument
- **Revisionsloggning**: Omfattande aktivitetsövervakning för efterlevnadskrav

### Prestanda och skalbarhet
- **Anslutningspoolning**: Effektiv hantering av anslutningar till Azure-tjänster
- **Asynkron bearbetning**: Icke-blockerande operationer för scenarier med hög genomströmning
- **Cache-strategier**: Intelligent caching för ofta åtkomna dokument
- **Lastbalansering**: Distribuerad bearbetning för storskaliga distributioner

### Hantering och övervakning
- **Hälsokontroller**: Inbyggd övervakning av RAG-systemkomponenter
- **Prestandamått**: Detaljerad analys av sökkvalitet och svarstider
- **Felkorrigering**: Omfattande undantagshantering med återförsökspolicyer
- **Konfigurationshantering**: Miljöspecifika inställningar med validering

## ⚙️ Förutsättningar och installation

**Utvecklingsmiljö:**
- .NET 9.0 SDK eller högre
- Visual Studio 2022 eller VS Code med C#-tillägg
- Azure-prenumeration med åtkomst till AI Foundry

**Nödvändiga NuGet-paket:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure-autentiseringsinställningar:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Miljökonfiguration (.env-fil):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Mönster för Enterprise RAG

### Mönster för dokumenthantering
- **Massuppladdning**: Effektiv bearbetning av stora dokumentkollektioner
- **Inkrementella uppdateringar**: Realtidsaddition och modifiering av dokument
- **Versionskontroll**: Versionshantering och spårning av ändringar i dokument
- **Metadatahantering**: Rika dokumentattribut och taxonomi

### Mönster för sökning och hämtning
- **Hybrid sökning**: Kombination av semantisk och nyckelordssökning för optimala resultat
- **Facetterad sökning**: Multidimensionell filtrering och kategorisering
- **Relevansjustering**: Anpassade poängalgoritmer för domänspecifika behov
- **Resultatrangering**: Avancerad rangordning med affärslogikintegration

### Säkerhetsmönster
- **Dokumentnivåsäkerhet**: Finkornig åtkomstkontroll per dokument
- **Dataklassificering**: Automatisk känslighetsmärkning och skydd
- **Revisionsspår**: Omfattande loggning av alla RAG-operationer
- **Integritetsskydd**: Identifiering och redigering av PII (personligt identifierbar information)

## 🔒 Säkerhetsfunktioner för företag

### Autentisering och auktorisering
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Dataskydd
- **Kryptering**: Kryptering från början till slut för dokument och sökindex
- **Åtkomstkontroller**: Integration med Azure AD för användar- och gruppbehörigheter
- **Dataresidens**: Geografiska dataplatskontroller för efterlevnad
- **Backup och återställning**: Automatiserade backup- och katastrofåterställningsfunktioner

## 📈 Prestandaoptimering

### Mönster för asynkron bearbetning
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Minneshantering
- **Strömningsbearbetning**: Hantera stora dokument utan minnesproblem
- **Resurspoolning**: Effektiv återanvändning av dyra resurser
- **Skräpsamling**: Optimerade mönster för minnesallokering
- **Anslutningshantering**: Korrekt livscykelhantering för anslutningar till Azure-tjänster

### Cache-strategier
- **Frågecache**: Cache för ofta utförda sökningar
- **Dokumentcache**: Cache i minnet för "heta" dokument
- **Indexcache**: Optimerad cache för vektorindex
- **Resultatcache**: Intelligent cache för genererade svar

## 📊 Användningsfall för företag

### Kunskapshantering
- **Företagswiki**: Intelligent sökning i företags kunskapsbaser
- **Policyer och procedurer**: Automatiserad efterlevnad och vägledning för procedurer
- **Utbildningsmaterial**: Intelligent hjälp för lärande och utveckling
- **Forskningsdatabaser**: System för analys av akademiska och forskningsartiklar

### Kundsupport
- **Supportkunskapsbas**: Automatiserade svar för kundservice
- **Produktdokumentation**: Intelligent hämtning av produktinformation
- **Felsökningsguider**: Kontextbaserad problemlösningshjälp
- **FAQ-system**: Dynamisk FAQ-generering från dokumentkollektioner

### Regelverksefterlevnad
- **Analys av juridiska dokument**: Intelligens för kontrakt och juridiska dokument
- **Efterlevnadsövervakning**: Automatiserad kontroll av regelverksefterlevnad
- **Riskbedömning**: Riskanalys och rapportering baserad på dokument
- **Revisionsstöd**: Intelligent dokumentupptäckt för revisioner

## 🚀 Produktionsdistribution

### Övervakning och insyn
- **Application Insights**: Detaljerad telemetri och prestandaövervakning
- **Anpassade mått**: Spårning och varningar för affärsspecifika KPI:er
- **Distribuerad spårning**: Spårning av begäran från början till slut över tjänster
- **Hälsodashboards**: Visualisering i realtid av systemhälsa och prestanda

### Skalbarhet och tillförlitlighet
- **Autoskalning**: Automatisk skalning baserat på belastning och prestandamått
- **Hög tillgänglighet**: Multiregional distribution med failover-funktioner
- **Lasttestning**: Prestandavalidering under företagsbelastning
- **Katastrofåterställning**: Automatiserade backup- och återställningsprocedurer

Redo att bygga företagsklassade RAG-system som kan hantera känsliga dokument i stor skala? Låt oss designa intelligenta kunskapssystem för företag! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Ansvarsfriskrivning**:  
Detta dokument har översatts med hjälp av AI-översättningstjänsten [Co-op Translator](https://github.com/Azure/co-op-translator). Även om vi strävar efter noggrannhet, bör det noteras att automatiserade översättningar kan innehålla fel eller brister. Det ursprungliga dokumentet på dess originalspråk bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för eventuella missförstånd eller feltolkningar som kan uppstå vid användning av denna översättning.
