# 🔍 Enterprise RAG z Azure AI Foundry (.NET)

## 📋 Cele nauki

Ten notebook pokazuje, jak budować systemy Retrieval-Augmented Generation (RAG) na poziomie korporacyjnym, korzystając z Microsoft Agent Framework w .NET z Azure AI Foundry. Nauczysz się tworzyć gotowe do produkcji agenty, które potrafią przeszukiwać dokumenty i dostarczać precyzyjne, kontekstowe odpowiedzi z zachowaniem bezpieczeństwa i skalowalności na poziomie korporacyjnym.

**Funkcje Enterprise RAG, które zbudujesz:**
- 📚 **Inteligencja dokumentów**: Zaawansowane przetwarzanie dokumentów z usługami Azure AI
- 🔍 **Wyszukiwanie semantyczne**: Wydajne wyszukiwanie wektorowe z funkcjami korporacyjnymi
- 🛡️ **Integracja bezpieczeństwa**: Dostęp oparty na rolach i wzorce ochrony danych
- 🏢 **Skalowalna architektura**: Systemy RAG gotowe do produkcji z monitoringiem

## 🎯 Architektura Enterprise RAG

### Kluczowe komponenty korporacyjne
- **Azure AI Foundry**: Zarządzana platforma AI dla przedsiębiorstw z bezpieczeństwem i zgodnością
- **Agenty trwałe**: Agenty z zachowaniem historii rozmów i zarządzaniem kontekstem
- **Zarządzanie magazynem wektorów**: Indeksowanie i wyszukiwanie dokumentów na poziomie korporacyjnym
- **Integracja tożsamości**: Uwierzytelnianie Azure AD i kontrola dostępu oparta na rolach

### Korzyści z .NET dla przedsiębiorstw
- **Bezpieczeństwo typów**: Walidacja operacji RAG i struktur danych na etapie kompilacji
- **Wydajność asynchroniczna**: Nieblokujące przetwarzanie dokumentów i operacje wyszukiwania
- **Zarządzanie pamięcią**: Efektywne wykorzystanie zasobów dla dużych kolekcji dokumentów
- **Wzorce integracji**: Natywna integracja z usługami Azure z wykorzystaniem wstrzykiwania zależności

## 🏗️ Architektura techniczna

### Pipeline Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Kluczowe komponenty .NET
- **Azure.AI.Agents.Persistent**: Zarządzanie agentami korporacyjnymi z zachowaniem stanu
- **Azure.Identity**: Zintegrowane uwierzytelnianie dla bezpiecznego dostępu do usług Azure
- **Microsoft.Agents.AI.AzureAI**: Implementacja frameworku agentów zoptymalizowana dla Azure
- **System.Linq.Async**: Wydajne operacje LINQ asynchroniczne

## 🔧 Funkcje i korzyści dla przedsiębiorstw

### Bezpieczeństwo i zgodność
- **Integracja Azure AD**: Zarządzanie tożsamością i uwierzytelnianie na poziomie korporacyjnym
- **Dostęp oparty na rolach**: Precyzyjne uprawnienia do dostępu do dokumentów i operacji
- **Ochrona danych**: Szyfrowanie danych w spoczynku i w tranzycie dla dokumentów wrażliwych
- **Rejestrowanie audytowe**: Kompleksowe śledzenie aktywności dla wymagań zgodności

### Wydajność i skalowalność
- **Pooling połączeń**: Efektywne zarządzanie połączeniami z usługami Azure
- **Przetwarzanie asynchroniczne**: Operacje nieblokujące dla scenariuszy o dużej przepustowości
- **Strategie buforowania**: Inteligentne buforowanie dla często używanych dokumentów
- **Równoważenie obciążenia**: Rozproszone przetwarzanie dla wdrożeń na dużą skalę

### Zarządzanie i monitoring
- **Kontrole zdrowia**: Wbudowany monitoring komponentów systemu RAG
- **Metryki wydajności**: Szczegółowa analiza jakości wyszukiwania i czasów odpowiedzi
- **Obsługa błędów**: Kompleksowe zarządzanie wyjątkami z politykami ponawiania
- **Zarządzanie konfiguracją**: Ustawienia specyficzne dla środowiska z walidacją

## ⚙️ Wymagania wstępne i konfiguracja

**Środowisko deweloperskie:**
- .NET 9.0 SDK lub wyższy
- Visual Studio 2022 lub VS Code z rozszerzeniem C#
- Subskrypcja Azure z dostępem do AI Foundry

**Wymagane pakiety NuGet:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Konfiguracja uwierzytelniania Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Konfiguracja środowiska (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Wzorce Enterprise RAG

### Wzorce zarządzania dokumentami
- **Masowe przesyłanie**: Wydajne przetwarzanie dużych kolekcji dokumentów
- **Aktualizacje przyrostowe**: Dodawanie i modyfikacja dokumentów w czasie rzeczywistym
- **Kontrola wersji**: Wersjonowanie dokumentów i śledzenie zmian
- **Zarządzanie metadanymi**: Bogate atrybuty dokumentów i taksonomia

### Wzorce wyszukiwania i pobierania
- **Wyszukiwanie hybrydowe**: Łączenie wyszukiwania semantycznego i słownego dla optymalnych wyników
- **Wyszukiwanie fasetowe**: Wielowymiarowe filtrowanie i kategoryzacja
- **Dostrajanie trafności**: Niestandardowe algorytmy scoringowe dla specyficznych potrzeb domeny
- **Ranking wyników**: Zaawansowane rankingi z integracją logiki biznesowej

### Wzorce bezpieczeństwa
- **Bezpieczeństwo na poziomie dokumentu**: Precyzyjna kontrola dostępu dla każdego dokumentu
- **Klasyfikacja danych**: Automatyczne etykietowanie wrażliwości i ochrona
- **Ścieżki audytowe**: Kompleksowe rejestrowanie wszystkich operacji RAG
- **Ochrona prywatności**: Wykrywanie i redakcja danych osobowych (PII)

## 🔒 Funkcje bezpieczeństwa korporacyjnego

### Uwierzytelnianie i autoryzacja
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Ochrona danych
- **Szyfrowanie**: Szyfrowanie end-to-end dla dokumentów i indeksów wyszukiwania
- **Kontrole dostępu**: Integracja z Azure AD dla uprawnień użytkowników i grup
- **Rezydencja danych**: Kontrola lokalizacji danych dla zgodności
- **Kopia zapasowa i odzyskiwanie**: Automatyczne kopie zapasowe i procedury odzyskiwania danych

## 📈 Optymalizacja wydajności

### Wzorce przetwarzania asynchronicznego
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Zarządzanie pamięcią
- **Przetwarzanie strumieniowe**: Obsługa dużych dokumentów bez problemów z pamięcią
- **Pooling zasobów**: Efektywne ponowne wykorzystanie kosztownych zasobów
- **Zbieranie śmieci**: Optymalizacja wzorców alokacji pamięci
- **Zarządzanie połączeniami**: Prawidłowy cykl życia połączeń z usługami Azure

### Strategie buforowania
- **Buforowanie zapytań**: Buforowanie często wykonywanych wyszukiwań
- **Buforowanie dokumentów**: Buforowanie w pamięci dla "gorących" dokumentów
- **Buforowanie indeksów**: Optymalizacja buforowania indeksów wektorowych
- **Buforowanie wyników**: Inteligentne buforowanie wygenerowanych odpowiedzi

## 📊 Przypadki użycia w przedsiębiorstwie

### Zarządzanie wiedzą
- **Wiki korporacyjne**: Inteligentne wyszukiwanie w bazach wiedzy firmy
- **Polityki i procedury**: Automatyczne wskazówki dotyczące zgodności i procedur
- **Materiały szkoleniowe**: Inteligentna pomoc w nauce i rozwoju
- **Bazy danych badawczych**: Systemy analizy prac akademickich i badawczych

### Obsługa klienta
- **Baza wiedzy wsparcia**: Automatyczne odpowiedzi na zapytania klientów
- **Dokumentacja produktów**: Inteligentne wyszukiwanie informacji o produktach
- **Przewodniki rozwiązywania problemów**: Kontekstowa pomoc w rozwiązywaniu problemów
- **Systemy FAQ**: Dynamiczne generowanie FAQ z kolekcji dokumentów

### Zgodność regulacyjna
- **Analiza dokumentów prawnych**: Inteligencja kontraktów i dokumentów prawnych
- **Monitorowanie zgodności**: Automatyczne sprawdzanie zgodności regulacyjnej
- **Ocena ryzyka**: Analiza ryzyka na podstawie dokumentów i raportowanie
- **Wsparcie audytowe**: Inteligentne wyszukiwanie dokumentów na potrzeby audytów

## 🚀 Wdrożenie produkcyjne

### Monitoring i obserwowalność
- **Application Insights**: Szczegółowa telemetria i monitoring wydajności
- **Metryki niestandardowe**: Śledzenie i alerty dla specyficznych KPI biznesowych
- **Śledzenie rozproszone**: Śledzenie żądań end-to-end w różnych usługach
- **Pulpity zdrowia**: Wizualizacja zdrowia systemu i wydajności w czasie rzeczywistym

### Skalowalność i niezawodność
- **Auto-skalowanie**: Automatyczne skalowanie na podstawie obciążenia i metryk wydajności
- **Wysoka dostępność**: Wdrożenie wieloregionowe z funkcjami przełączania awaryjnego
- **Testy obciążeniowe**: Walidacja wydajności pod obciążeniem korporacyjnym
- **Odzyskiwanie po awarii**: Automatyczne procedury kopii zapasowych i odzyskiwania

Gotowy, aby zbudować systemy RAG na poziomie korporacyjnym, które mogą obsługiwać wrażliwe dokumenty na dużą skalę? Zaprojektujmy inteligentne systemy wiedzy dla przedsiębiorstw! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Zastrzeżenie**:  
Ten dokument został przetłumaczony za pomocą usługi tłumaczenia AI [Co-op Translator](https://github.com/Azure/co-op-translator). Chociaż staramy się zapewnić dokładność, prosimy pamiętać, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w jego rodzimym języku powinien być uznawany za autorytatywne źródło. W przypadku informacji krytycznych zaleca się skorzystanie z profesjonalnego tłumaczenia przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z użycia tego tłumaczenia.
