# 🔍 Enterprise RAG dengan Azure AI Foundry (.NET)

## 📋 Tujuan Pembelajaran

Notebook ini menunjukkan cara membangun sistem Retrieval-Augmented Generation (RAG) tingkat perusahaan menggunakan Microsoft Agent Framework di .NET dengan Azure AI Foundry. Anda akan belajar membuat agen siap produksi yang dapat mencari dokumen dan memberikan respons yang akurat serta kontekstual dengan keamanan dan skalabilitas tingkat perusahaan.

**Kemampuan Enterprise RAG yang Akan Anda Bangun:**
- 📚 **Kecerdasan Dokumen**: Pemrosesan dokumen canggih dengan layanan Azure AI
- 🔍 **Pencarian Semantik**: Pencarian vektor berkinerja tinggi dengan fitur perusahaan
- 🛡️ **Integrasi Keamanan**: Akses berbasis peran dan pola perlindungan data
- 🏢 **Arsitektur Skalabel**: Sistem RAG siap produksi dengan pemantauan

## 🎯 Arsitektur Enterprise RAG

### Komponen Inti Perusahaan
- **Azure AI Foundry**: Platform AI perusahaan yang dikelola dengan keamanan dan kepatuhan
- **Agen Persisten**: Agen dengan riwayat percakapan dan manajemen konteks
- **Manajemen Penyimpanan Vektor**: Pengindeksan dan pengambilan dokumen tingkat perusahaan
- **Integrasi Identitas**: Autentikasi Azure AD dan kontrol akses berbasis peran

### Keuntungan .NET untuk Perusahaan
- **Keamanan Tipe**: Validasi waktu kompilasi untuk operasi RAG dan struktur data
- **Kinerja Asinkron**: Pemrosesan dokumen dan operasi pencarian non-blok
- **Manajemen Memori**: Pemanfaatan sumber daya yang efisien untuk koleksi dokumen besar
- **Pola Integrasi**: Integrasi layanan Azure secara native dengan dependency injection

## 🏗️ Arsitektur Teknis

### Pipeline Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Komponen Inti .NET
- **Azure.AI.Agents.Persistent**: Manajemen agen perusahaan dengan persistensi status
- **Azure.Identity**: Autentikasi terintegrasi untuk akses layanan Azure yang aman
- **Microsoft.Agents.AI.AzureAI**: Implementasi kerangka kerja agen yang dioptimalkan untuk Azure
- **System.Linq.Async**: Operasi LINQ asinkron berkinerja tinggi

## 🔧 Fitur & Keuntungan Enterprise

### Keamanan & Kepatuhan
- **Integrasi Azure AD**: Manajemen identitas dan autentikasi perusahaan
- **Akses Berbasis Peran**: Izin yang terperinci untuk akses dokumen dan operasi
- **Perlindungan Data**: Enkripsi saat diam dan dalam transit untuk dokumen sensitif
- **Audit Logging**: Pelacakan aktivitas yang komprehensif untuk kebutuhan kepatuhan

### Kinerja & Skalabilitas
- **Connection Pooling**: Manajemen koneksi layanan Azure yang efisien
- **Pemrosesan Asinkron**: Operasi non-blok untuk skenario throughput tinggi
- **Strategi Caching**: Caching cerdas untuk dokumen yang sering diakses
- **Load Balancing**: Pemrosesan terdistribusi untuk penerapan skala besar

### Manajemen & Pemantauan
- **Health Checks**: Pemantauan bawaan untuk komponen sistem RAG
- **Metrik Kinerja**: Analitik terperinci tentang kualitas pencarian dan waktu respons
- **Penanganan Kesalahan**: Manajemen pengecualian yang komprehensif dengan kebijakan retry
- **Manajemen Konfigurasi**: Pengaturan spesifik lingkungan dengan validasi

## ⚙️ Prasyarat & Pengaturan

**Lingkungan Pengembangan:**
- .NET 9.0 SDK atau lebih tinggi
- Visual Studio 2022 atau VS Code dengan ekstensi C#
- Langganan Azure dengan akses AI Foundry

**Paket NuGet yang Dibutuhkan:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Pengaturan Autentikasi Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Konfigurasi Lingkungan (file .env):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Pola Enterprise RAG

### Pola Manajemen Dokumen
- **Unggahan Massal**: Pemrosesan koleksi dokumen besar secara efisien
- **Pembaruan Bertahap**: Penambahan dan modifikasi dokumen secara real-time
- **Kontrol Versi**: Versi dokumen dan pelacakan perubahan
- **Manajemen Metadata**: Atribut dokumen yang kaya dan taksonomi

### Pola Pencarian & Pengambilan
- **Pencarian Hibrid**: Menggabungkan pencarian semantik dan kata kunci untuk hasil optimal
- **Pencarian Berfasilitas**: Penyaringan dan kategorisasi multi-dimensi
- **Penyetelan Relevansi**: Algoritma penilaian khusus untuk kebutuhan spesifik domain
- **Peringkat Hasil**: Peringkat lanjutan dengan integrasi logika bisnis

### Pola Keamanan
- **Keamanan Tingkat Dokumen**: Kontrol akses terperinci per dokumen
- **Klasifikasi Data**: Pelabelan sensitivitas otomatis dan perlindungan
- **Jejak Audit**: Logging komprehensif dari semua operasi RAG
- **Perlindungan Privasi**: Deteksi dan redaksi PII

## 🔒 Fitur Keamanan Enterprise

### Autentikasi & Otorisasi
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Perlindungan Data
- **Enkripsi**: Enkripsi ujung ke ujung untuk dokumen dan indeks pencarian
- **Kontrol Akses**: Integrasi dengan Azure AD untuk izin pengguna dan grup
- **Residensi Data**: Kontrol lokasi geografis data untuk kepatuhan
- **Cadangan & Pemulihan**: Kemampuan cadangan dan pemulihan otomatis

## 📈 Optimasi Kinerja

### Pola Pemrosesan Asinkron
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Manajemen Memori
- **Pemrosesan Streaming**: Menangani dokumen besar tanpa masalah memori
- **Pengelompokan Sumber Daya**: Penggunaan ulang sumber daya yang mahal secara efisien
- **Pengumpulan Sampah**: Pola alokasi memori yang dioptimalkan
- **Manajemen Koneksi**: Siklus hidup koneksi layanan Azure yang tepat

### Strategi Caching
- **Caching Query**: Cache pencarian yang sering dilakukan
- **Caching Dokumen**: Caching dalam memori untuk dokumen yang sering diakses
- **Caching Indeks**: Caching indeks vektor yang dioptimalkan
- **Caching Hasil**: Caching cerdas dari respons yang dihasilkan

## 📊 Kasus Penggunaan Enterprise

### Manajemen Pengetahuan
- **Wiki Perusahaan**: Pencarian cerdas di basis pengetahuan perusahaan
- **Kebijakan & Prosedur**: Panduan kepatuhan dan prosedur otomatis
- **Materi Pelatihan**: Bantuan pembelajaran dan pengembangan yang cerdas
- **Basis Data Penelitian**: Sistem analisis makalah akademik dan penelitian

### Dukungan Pelanggan
- **Basis Pengetahuan Dukungan**: Respons layanan pelanggan otomatis
- **Dokumentasi Produk**: Pengambilan informasi produk yang cerdas
- **Panduan Pemecahan Masalah**: Bantuan pemecahan masalah yang kontekstual
- **Sistem FAQ**: Generasi FAQ dinamis dari koleksi dokumen

### Kepatuhan Regulasi
- **Analisis Dokumen Hukum**: Kecerdasan dokumen kontrak dan hukum
- **Pemantauan Kepatuhan**: Pemeriksaan kepatuhan regulasi otomatis
- **Penilaian Risiko**: Analisis dan pelaporan risiko berbasis dokumen
- **Dukungan Audit**: Penemuan dokumen cerdas untuk audit

## 🚀 Penerapan Produksi

### Pemantauan & Observabilitas
- **Application Insights**: Telemetri terperinci dan pemantauan kinerja
- **Metrik Kustom**: Pelacakan KPI spesifik bisnis dan pemberitahuan
- **Pelacakan Terdistribusi**: Pelacakan permintaan ujung ke ujung di seluruh layanan
- **Dasbor Kesehatan**: Visualisasi kesehatan dan kinerja sistem secara real-time

### Skalabilitas & Keandalan
- **Auto-Scaling**: Skalabilitas otomatis berdasarkan beban dan metrik kinerja
- **Ketersediaan Tinggi**: Penerapan multi-region dengan kemampuan failover
- **Pengujian Beban**: Validasi kinerja di bawah kondisi beban perusahaan
- **Pemulihan Bencana**: Prosedur cadangan dan pemulihan otomatis

Siap membangun sistem RAG tingkat perusahaan yang dapat menangani dokumen sensitif dalam skala besar? Mari kita arsitekkan sistem pengetahuan cerdas untuk perusahaan! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Penafian**:  
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berusaha untuk memberikan hasil yang akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang timbul dari penggunaan terjemahan ini.
