# üîç Enterprise RAG dengan Microsoft Foundry (.NET)

## üìã Tujuan Pembelajaran

Notebook ini menunjukkan cara membangun sistem Retrieval-Augmented Generation (RAG) kelas enterprise menggunakan Microsoft Agent Framework di .NET dengan Microsoft Foundry. Anda akan belajar membuat agen siap produksi yang dapat mencari melalui dokumen dan memberikan respons yang akurat dan kontekstual dengan keamanan dan skalabilitas enterprise.

**Kemampuan Enterprise RAG yang Akan Anda Bangun:**
- üìö **Intelijen Dokumen**: Pemrosesan dokumen tingkat lanjut dengan layanan Azure AI
- üîç **Pencarian Semantik**: Pencarian vektor berkinerja tinggi dengan fitur enterprise
- üõ°Ô∏è **Integrasi Keamanan**: Pola perlindungan data dan akses berbasis peran
- üè¢ **Arsitektur Skalabel**: Sistem RAG siap produksi dengan pemantauan

## üéØ Arsitektur Enterprise RAG

### Komponen Inti Enterprise
- **Microsoft Foundry**: Platform AI enterprise terkelola dengan keamanan dan kepatuhan
- **Persistent Agents**: Agen stateful dengan riwayat percakapan dan manajemen konteks
- **Vector Store Management**: Pengindeksan dan pengambilan dokumen kelas enterprise
- **Identity Integration**: Otentikasi Azure AD dan kontrol akses berbasis peran

### Manfaat .NET untuk Enterprise
- **Keamanan Tipe**: Validasi pada waktu kompilasi untuk operasi RAG dan struktur data
- **Performa Asinkron**: Pemrosesan dokumen dan operasi pencarian non-blocking
- **Manajemen Memori**: Pemanfaatan sumber daya yang efisien untuk koleksi dokumen besar
- **Pola Integrasi**: Integrasi layanan Azure native dengan dependency injection

## üèóÔ∏è Arsitektur Teknis

### Alur Enterprise RAG
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Komponen Inti .NET
- **Azure.AI.Agents.Persistent**: Manajemen agen enterprise dengan persistensi state
- **Azure.Identity**: Otentikasi terintegrasi untuk akses layanan Azure yang aman
- **Microsoft.Agents.AI.AzureAI**: Implementasi framework agen dioptimalkan untuk Azure
- **System.Linq.Async**: Operasi LINQ asinkron berkinerja tinggi

## üîß Fitur & Manfaat Enterprise

### Keamanan & Kepatuhan
- **Integrasi Azure AD**: Manajemen identitas enterprise dan otentikasi
- **Akses Berbasis Peran**: Izin granular untuk akses dan operasi dokumen
- **Perlindungan Data**: Enkripsi saat disimpan dan dalam transmisi untuk dokumen sensitif
- **Audit Logging**: Pelacakan aktivitas komprehensif untuk kebutuhan kepatuhan

### Performa & Skalabilitas
- **Connection Pooling**: Manajemen koneksi layanan Azure yang efisien
- **Pemrosesan Asinkron**: Operasi non-blocking untuk skenario throughput tinggi
- **Strategi Caching**: Caching cerdas untuk dokumen yang sering diakses
- **Load Balancing**: Pemrosesan terdistribusi untuk deployment berskala besar

### Manajemen & Pemantauan
- **Health Checks**: Pemantauan bawaan untuk komponen sistem RAG
- **Performance Metrics**: Analitik terperinci tentang kualitas pencarian dan waktu respons
- **Error Handling**: Manajemen exception komprehensif dengan kebijakan retry
- **Configuration Management**: Pengaturan spesifik lingkungan dengan validasi

## ‚öôÔ∏è Prasyarat & Pengaturan

**Lingkungan Pengembangan:**
- .NET 9.0 SDK atau lebih tinggi
- Visual Studio 2022 atau VS Code dengan ekstensi C#
- Langganan Azure dengan akses AI Foundry

**Paket NuGet yang Diperlukan:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Pengaturan Otentikasi Azure:**
```bash
# Instal Azure CLI dan autentikasi
az login
az account set --subscription "your-subscription-id"
```

**Konfigurasi Lingkungan (file .env):**
```env
# Microsoft Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Pola Enterprise RAG

### Pola Manajemen Dokumen
- **Unggah Massal**: Pemrosesan efisien untuk koleksi dokumen besar
- **Pembaruan Incremental**: Penambahan dan modifikasi dokumen secara real-time
- **Kontrol Versi**: Versi dokumen dan pelacakan perubahan
- **Manajemen Metadata**: Atribut dokumen yang kaya dan taksonomi

### Pola Pencarian & Pengambilan
- **Pencarian Hibrida**: Menggabungkan pencarian semantik dan kata kunci untuk hasil optimal
- **Pencarian Berfaset**: Penyaringan dan kategorisasi multi-dimensi
- **Penyetelan Relevansi**: Algoritma skor kustom untuk kebutuhan domain-spesifik
- **Peringkat Hasil**: Peringkat lanjutan dengan integrasi logika bisnis

### Pola Keamanan
- **Keamanan Tingkat Dokumen**: Kontrol akses granular per dokumen
- **Klasifikasi Data**: Pelabelan sensitivitas otomatis dan perlindungan
- **Jejak Audit**: Logging komprehensif untuk semua operasi RAG
- **Perlindungan Privasi**: Deteksi PII dan kemampuan redaksi

## üîí Fitur Keamanan Enterprise

### Otentikasi & Otorisasi
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Perlindungan Data
- **Enkripsi**: Enkripsi ujung-ke-ujung untuk dokumen dan indeks pencarian
- **Kontrol Akses**: Integrasi dengan Azure AD untuk izin pengguna dan grup
- **Residensi Data**: Kontrol lokasi data secara geografis untuk kepatuhan
- **Cadangan & Pemulihan**: Kemampuan cadangan otomatis dan pemulihan bencana

## üìà Optimisasi Performa

### Pola Pemrosesan Asinkron
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Manajemen Memori
- **Pemrosesan Streaming**: Menangani dokumen besar tanpa masalah memori
- **Pengelompokan Sumber Daya**: Pemanfaatan kembali sumber daya yang mahal secara efisien
- **Pengumpulan Sampah**: Pola alokasi memori yang dioptimalkan
- **Manajemen Koneksi**: Siklus hidup koneksi layanan Azure yang tepat

### Strategi Caching
- **Caching Kuery**: Cache untuk pencarian yang sering dijalankan
- **Caching Dokumen**: Caching in-memory untuk dokumen panas
- **Caching Indeks**: Caching indeks vektor yang dioptimalkan
- **Caching Hasil**: Caching cerdas untuk respons yang dihasilkan

## üìä Kasus Penggunaan Enterprise

### Manajemen Pengetahuan
- **Wiki Perusahaan**: Pencarian cerdas di basis pengetahuan perusahaan
- **Kebijakan & Prosedur**: Panduan kepatuhan dan prosedur otomatis
- **Materi Pelatihan**: Bantuan pembelajaran dan pengembangan yang cerdas
- **Basis Data Riset**: Sistem analisis makalah akademik dan riset

### Dukungan Pelanggan
- **Basis Pengetahuan Dukungan**: Respons layanan pelanggan otomatis
- **Dokumentasi Produk**: Pengambilan informasi produk yang cerdas
- **Panduan Pemecahan Masalah**: Bantuan pemecahan masalah kontekstual
- **Sistem FAQ**: Pembuatan FAQ dinamis dari koleksi dokumen

### Kepatuhan Regulasi
- **Analisis Dokumen Hukum**: Intelijen kontrak dan dokumen hukum
- **Pemantauan Kepatuhan**: Pemeriksaan kepatuhan otomatis terhadap regulasi
- **Penilaian Risiko**: Analisis dan pelaporan risiko berbasis dokumen
- **Dukungan Audit**: Penemuan dokumen cerdas untuk audit

## üöÄ Penerapan Produksi

### Pemantauan & Observabilitas
- **Application Insights**: Telemetri dan pemantauan performa terperinci
- **Metrik Kustom**: Pelacakan KPI bisnis spesifik dan alerting
- **Pelacakan Terdistribusi**: Pelacakan permintaan ujung-ke-ujung antar layanan
- **Dasbor Kesehatan**: Visualisasi kesehatan dan performa sistem secara real-time

### Skalabilitas & Keandalan
- **Skalasi Otomatis**: Penskalaan otomatis berdasarkan beban dan metrik performa
- **Ketersediaan Tinggi**: Deployment multi-region dengan kemampuan failover
- **Pengujian Beban**: Validasi performa di bawah kondisi beban enterprise
- **Pemulihan Bencana**: Prosedur cadangan dan pemulihan otomatis

Siap membangun sistem RAG kelas enterprise yang dapat menangani dokumen sensitif dalam skala besar? Mari merancang sistem pengetahuan cerdas untuk enterprise! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**Penafian**:
Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Meskipun kami berupaya untuk akurat, harap diperhatikan bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidaktepatan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi yang penting, disarankan menggunakan jasa penerjemah profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran keliru yang timbul dari penggunaan terjemahan ini.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
