# 🔍 Enterprise RAG mit Azure AI Foundry (.NET)

## 📋 Lernziele

Dieses Notebook zeigt, wie man unter Verwendung des Microsoft Agent Frameworks in .NET mit Azure AI Foundry unternehmensgerechte Retrieval-Augmented Generation (RAG)-Systeme erstellt. Sie lernen, produktionsreife Agenten zu entwickeln, die Dokumente durchsuchen und präzise, kontextbezogene Antworten mit Unternehmenssicherheit und Skalierbarkeit liefern können.

**Funktionen des Enterprise RAG, die Sie entwickeln werden:**
- 📚 **Dokumentenintelligenz**: Fortschrittliche Dokumentenverarbeitung mit Azure AI-Diensten
- 🔍 **Semantische Suche**: Hochleistungsfähige Vektorsuche mit Unternehmensfunktionen
- 🛡️ **Sicherheitsintegration**: Rollenbasierter Zugriff und Datenschutzmuster
- 🏢 **Skalierbare Architektur**: Produktionsreife RAG-Systeme mit Überwachung

## 🎯 Architektur des Enterprise RAG

### Kernkomponenten für Unternehmen
- **Azure AI Foundry**: Verwaltete Unternehmensplattform für KI mit Sicherheit und Compliance
- **Persistente Agenten**: Zustandsbehaftete Agenten mit Gesprächsverlauf und Kontextverwaltung
- **Vektorspeicherverwaltung**: Unternehmensgerechte Dokumentenindizierung und -abfrage
- **Identitätsintegration**: Azure AD-Authentifizierung und rollenbasierte Zugriffskontrolle

### Vorteile von .NET für Unternehmen
- **Typensicherheit**: Validierung von RAG-Operationen und Datenstrukturen zur Kompilierungszeit
- **Asynchrone Leistung**: Nicht blockierende Dokumentenverarbeitung und Suchoperationen
- **Speicherverwaltung**: Effiziente Ressourcennutzung für große Dokumentensammlungen
- **Integrationsmuster**: Native Integration von Azure-Diensten mit Dependency Injection

## 🏗️ Technische Architektur

### Enterprise RAG-Pipeline
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Kernkomponenten von .NET
- **Azure.AI.Agents.Persistent**: Verwaltung von Unternehmensagenten mit Zustandspersistenz
- **Azure.Identity**: Integrierte Authentifizierung für sicheren Zugriff auf Azure-Dienste
- **Microsoft.Agents.AI.AzureAI**: Azure-optimierte Implementierung des Agentenframeworks
- **System.Linq.Async**: Hochleistungsfähige asynchrone LINQ-Operationen

## 🔧 Funktionen und Vorteile für Unternehmen

### Sicherheit und Compliance
- **Azure AD-Integration**: Unternehmensweite Identitätsverwaltung und Authentifizierung
- **Rollenbasierter Zugriff**: Fein abgestufte Berechtigungen für Dokumentenzugriff und -operationen
- **Datenschutz**: Verschlüsselung im Ruhezustand und während der Übertragung für sensible Dokumente
- **Protokollierung**: Umfassende Aktivitätsverfolgung für Compliance-Anforderungen

### Leistung und Skalierbarkeit
- **Verbindungs-Pooling**: Effiziente Verwaltung von Azure-Dienstverbindungen
- **Asynchrone Verarbeitung**: Nicht blockierende Operationen für Szenarien mit hohem Durchsatz
- **Caching-Strategien**: Intelligentes Caching für häufig genutzte Dokumente
- **Lastverteilung**: Verteilte Verarbeitung für großflächige Bereitstellungen

### Verwaltung und Überwachung
- **Gesundheitsprüfungen**: Eingebaute Überwachung der RAG-Systemkomponenten
- **Leistungskennzahlen**: Detaillierte Analysen zur Suchqualität und Antwortzeiten
- **Fehlerbehandlung**: Umfassendes Ausnahme-Management mit Wiederholungsrichtlinien
- **Konfigurationsmanagement**: Umgebungsspezifische Einstellungen mit Validierung

## ⚙️ Voraussetzungen und Einrichtung

**Entwicklungsumgebung:**
- .NET 9.0 SDK oder höher
- Visual Studio 2022 oder VS Code mit C#-Erweiterung
- Azure-Abonnement mit Zugriff auf AI Foundry

**Erforderliche NuGet-Pakete:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure-Authentifizierungseinrichtung:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Umgebungskonfiguration (.env-Datei):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Muster für Enterprise RAG

### Muster für Dokumentenverwaltung
- **Massenupload**: Effiziente Verarbeitung großer Dokumentensammlungen
- **Inkrementelle Updates**: Echtzeit-Dokumentenhinzufügung und -änderung
- **Versionskontrolle**: Dokumentenversionierung und Änderungsverfolgung
- **Metadatenverwaltung**: Umfangreiche Dokumentattribute und Taxonomie

### Muster für Suche und Abfrage
- **Hybridsuche**: Kombination aus semantischer und Schlüsselwortsuche für optimale Ergebnisse
- **Facettensuche**: Mehrdimensionale Filterung und Kategorisierung
- **Relevanzanpassung**: Benutzerdefinierte Bewertungsalgorithmen für domänenspezifische Anforderungen
- **Ergebnisranking**: Fortschrittliches Ranking mit Integration von Geschäftslogik

### Sicherheitsmuster
- **Dokumentensicherheit auf Ebene**: Fein abgestufte Zugriffskontrolle pro Dokument
- **Datenklassifizierung**: Automatische Sensitivitätskennzeichnung und Schutz
- **Protokollierung**: Umfassende Aufzeichnung aller RAG-Operationen
- **Datenschutz**: Erkennung und Schwärzung von personenbezogenen Daten (PII)

## 🔒 Sicherheitsfunktionen für Unternehmen

### Authentifizierung und Autorisierung
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Datenschutz
- **Verschlüsselung**: End-to-End-Verschlüsselung für Dokumente und Suchindizes
- **Zugriffskontrollen**: Integration mit Azure AD für Benutzer- und Gruppenberechtigungen
- **Datenresidenz**: Geografische Datenstandortkontrollen für Compliance
- **Backup und Wiederherstellung**: Automatisierte Backup- und Wiederherstellungsfunktionen

## 📈 Leistungsoptimierung

### Muster für asynchrone Verarbeitung
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Speicherverwaltung
- **Streaming-Verarbeitung**: Verarbeitung großer Dokumente ohne Speicherprobleme
- **Ressourcen-Pooling**: Effiziente Wiederverwendung teurer Ressourcen
- **Speicherbereinigung**: Optimierte Muster für Speicherzuweisung
- **Verbindungsmanagement**: Richtige Lebenszyklusverwaltung von Azure-Dienstverbindungen

### Caching-Strategien
- **Abfrage-Caching**: Caching häufig ausgeführter Suchanfragen
- **Dokumenten-Caching**: In-Memory-Caching für häufig genutzte Dokumente
- **Index-Caching**: Optimiertes Caching von Vektorindizes
- **Ergebnis-Caching**: Intelligentes Caching generierter Antworten

## 📊 Anwendungsfälle für Unternehmen

### Wissensmanagement
- **Unternehmens-Wiki**: Intelligente Suche in Unternehmenswissensdatenbanken
- **Richtlinien und Verfahren**: Automatisierte Compliance- und Verfahrensrichtlinien
- **Schulungsmaterialien**: Intelligente Unterstützung für Lernen und Entwicklung
- **Forschungsdatenbanken**: Analyse von akademischen und wissenschaftlichen Arbeiten

### Kundensupport
- **Support-Wissensdatenbank**: Automatisierte Kundenservice-Antworten
- **Produktdokumentation**: Intelligente Produktinformationsabfrage
- **Fehlerbehebungsleitfäden**: Kontextbezogene Problemlösungsunterstützung
- **FAQ-Systeme**: Dynamische FAQ-Generierung aus Dokumentensammlungen

### Einhaltung gesetzlicher Vorschriften
- **Analyse rechtlicher Dokumente**: Intelligenz für Verträge und rechtliche Dokumente
- **Compliance-Überwachung**: Automatisierte Überprüfung der Einhaltung gesetzlicher Vorschriften
- **Risikobewertung**: Dokumentenbasierte Risikoanalyse und Berichterstattung
- **Audit-Unterstützung**: Intelligente Dokumentensuche für Audits

## 🚀 Produktionsbereitstellung

### Überwachung und Beobachtbarkeit
- **Application Insights**: Detaillierte Telemetrie und Leistungsüberwachung
- **Benutzerdefinierte Kennzahlen**: Verfolgung und Alarmierung von geschäftsspezifischen KPIs
- **Verteiltes Tracing**: End-to-End-Verfolgung von Anforderungen über Dienste hinweg
- **Gesundheits-Dashboards**: Echtzeitvisualisierung der Systemgesundheit und Leistung

### Skalierbarkeit und Zuverlässigkeit
- **Auto-Skalierung**: Automatische Skalierung basierend auf Last- und Leistungskennzahlen
- **Hohe Verfügbarkeit**: Bereitstellung in mehreren Regionen mit Failover-Funktionen
- **Lasttests**: Leistungsvalidierung unter Unternehmenslastbedingungen
- **Katastrophenwiederherstellung**: Automatisierte Backup- und Wiederherstellungsverfahren

Bereit, unternehmensgerechte RAG-Systeme zu entwickeln, die sensible Dokumente in großem Maßstab verarbeiten können? Lassen Sie uns intelligente Wissenssysteme für Unternehmen entwerfen! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Haftungsausschluss**:  
Dieses Dokument wurde mit dem KI-Übersetzungsdienst [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
