# üîç RAG Perusahaan dengan Microsoft Foundry (.NET)

## üìã Objektif Pembelajaran

Notebook ini menunjukkan cara membina sistem Retrieval-Augmented Generation (RAG) bertaraf perusahaan menggunakan Microsoft Agent Framework dalam .NET dengan Microsoft Foundry. Anda akan belajar membuat ejen sedia produksi yang boleh mencari dalam dokumen dan memberikan respons yang tepat dan berasaskan konteks dengan keselamatan dan kebolehskalaan perusahaan.

**Keupayaan RAG Perusahaan yang Akan Anda Bina:**
- üìö **Kepintaran Dokumen**: Pemprosesan dokumen lanjutan dengan perkhidmatan Azure AI
- üîç **Carian Semantik**: Carian vektor berprestasi tinggi dengan ciri perusahaan
- üõ°Ô∏è **Integrasi Keselamatan**: Corak akses berasaskan peranan dan perlindungan data
- üè¢ **Arkitektur Boleh Diskala**: Sistem RAG sedia produksi dengan pemantauan

## üéØ Seni Bina RAG Perusahaan

### Komponen Teras Perusahaan
- **Microsoft Foundry**: Platform AI perusahaan terurus dengan keselamatan dan pematuhan
- **Ejen Persisten**: Ejen berkeadaan dengan sejarah perbualan dan pengurusan konteks
- **Pengurusan Stor Vektor**: Pengindeksan dan pengambilan dokumen bertaraf perusahaan
- **Integrasi Identiti**: Pengesahan Azure AD dan kawalan capaian berasaskan peranan

### Kelebihan .NET untuk Perusahaan
- **Keselamatan Jenis**: Pengesahan pada masa kompilasi untuk operasi RAG dan struktur data
- **Prestasi Asinkron**: Pemprosesan dokumen dan operasi carian tanpa penghalang
- **Pengurusan Memori**: Penggunaan sumber yang cekap untuk koleksi dokumen besar
- **Corak Integrasi**: Integrasi perkhidmatan Azure asli dengan penyuntikan kebergantungan

## üèóÔ∏è Arkitektur Teknikal

### Pipeline RAG Perusahaan
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Komponen Teras .NET
- **Azure.AI.Agents.Persistent**: Pengurusan ejen perusahaan dengan pengekalan keadaan
- **Azure.Identity**: Pengesahan bersepadu untuk akses perkhidmatan Azure yang selamat
- **Microsoft.Agents.AI.AzureAI**: Implementasi rangka kerja ejen dioptimumkan untuk Azure
- **System.Linq.Async**: Operasi LINQ asinkron berprestasi tinggi

## üîß Ciri & Manfaat Perusahaan

### Keselamatan & Pematuhan
- **Integrasi Azure AD**: Pengurusan identiti perusahaan dan pengesahan
- **Akses Berasaskan Peranan**: Kebenaran terperinci untuk akses dokumen dan operasi
- **Perlindungan Data**: Penyulitan semasa rehat dan semasa transit untuk dokumen sensitif
- **Log Audit**: Penjejakan aktiviti yang komprehensif untuk keperluan pematuhan

### Prestasi & Kebolehskalaan
- **Penggumpulan Sambungan**: Pengurusan sambungan perkhidmatan Azure yang cekap
- **Pemprosesan Asinkron**: Operasi tanpa penghalang untuk senario berkapasiti tinggi
- **Strategi Caching**: Caching pintar untuk dokumen yang kerap diakses
- **Imbangan Beban**: Pemprosesan teragih untuk penyebaran skala besar

### Pengurusan & Pemantauan
- **Semakan Kesihatan**: Pemantauan terbina untuk komponen sistem RAG
- **Metik Prestasi**: Analitik terperinci tentang kualiti carian dan masa respons
- **Pengendalian Ralat**: Pengurusan pengecualian yang komprehensif dengan dasar cuba semula
- **Pengurusan Konfigurasi**: Tetapan khusus persekitaran dengan pengesahan

## ‚öôÔ∏è Prasyarat & Persediaan

**Persekitaran Pembangunan:**
- .NET 9.0 SDK atau lebih tinggi
- Visual Studio 2022 atau VS Code dengan sambungan C#
- Langganan Azure dengan akses AI Foundry

**Pakej NuGet Diperlukan:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Penetapan Pengesahan Azure:**
```bash
# Pasang Azure CLI dan log masuk
az login
az account set --subscription "your-subscription-id"
```

**Konfigurasi Persekitaran (fail .env):**
```env
# Microsoft Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Corak RAG Perusahaan

### Corak Pengurusan Dokumen
- **Muat Naik Borong**: Pemprosesan cekap bagi koleksi dokumen besar
- **Kemas Kini Inkremental**: Penambahan dan pengubahsuaian dokumen masa nyata
- **Kawalan Versi**: Versi dokumen dan penjejakan perubahan
- **Pengurusan Metadata**: Atribut dokumen yang kaya dan taksonomi

### Corak Carian & Pengambilan
- **Carian Hibrid**: Menggabungkan carian semantik dan kata kunci untuk hasil yang optimum
- **Carian Berfacet**: Penapisan dan pengkategorian berbilang dimensi
- **Pelarasan Relevansi**: Algoritma pemarkahan tersuai untuk keperluan khusus domain
- **Pengurutan Keputusan**: Pengurutan lanjutan dengan integrasi logik perniagaan

### Corak Keselamatan
- **Keselamatan Pada Tahap Dokumen**: Kawalan capaian terperinci bagi setiap dokumen
- **Pengelasan Data**: Pelabelan kepekaan automatik dan perlindungan
- **Jejak Audit**: Pencatatan komprehensif bagi semua operasi RAG
- **Perlindungan Privasi**: Keupayaan pengesanan dan pengaburan PII

## üîí Ciri Keselamatan Perusahaan

### Pengesahan & Kebenaran
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Perlindungan Data
- **Penyulitan**: Penyulitan hujung ke hujung untuk dokumen dan indeks carian
- **Kawalan Akses**: Integrasi dengan Azure AD untuk kebenaran pengguna dan kumpulan
- **Kediaman Data**: Kawalan lokasi geografi data untuk pematuhan
- **Sandaran & Pemulihan**: Keupayaan sandaran automatik dan pemulihan bencana

## üìà Pengoptimuman Prestasi

### Corak Pemprosesan Asinkron
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Pengurusan Memori
- **Pemprosesan Aliran**: Mengendalikan dokumen besar tanpa isu memori
- **Penggumpulan Sumber**: Penggunaan semula sumber yang mahal dengan cekap
- **Pengumpulan Sampah**: Corak pengagihan memori yang dioptimumkan
- **Pengurusan Sambungan**: Kitar hayat sambungan perkhidmatan Azure yang betul

### Strategi Caching
- **Caching Pertanyaan**: Cache carian yang kerap dijalankan
- **Caching Dokumen**: Caching dalam memori untuk dokumen yang sering diakses
- **Caching Indeks**: Caching indeks vektor yang dioptimumkan
- **Caching Keputusan**: Caching pintar bagi respons yang dijana

## üìä Kes Penggunaan Perusahaan

### Pengurusan Pengetahuan
- **Wiki Korporat**: Carian pintar merentasi pangkalan pengetahuan syarikat
- **Polisi & Prosedur**: Panduan pematuhan dan prosedur automatik
- **Bahan Latihan**: Bantuan pembelajaran dan pembangunan pintar
- **Pangkalan Data Penyelidikan**: Sistem analisis kertas akademik dan penyelidikan

### Sokongan Pelanggan
- **Pangkalan Pengetahuan Sokongan**: Respons perkhidmatan pelanggan automatik
- **Dokumentasi Produk**: Pengambilan maklumat produk pintar
- **Panduan Penyelesaian Masalah**: Bantuan penyelesaian masalah berasaskan konteks
- **Sistem FAQ**: Penjanaan FAQ dinamik daripada koleksi dokumen

### Pematuhan Peraturan
- **Analisis Dokumen Undang-Undang**: Kepintaran kontrak dan dokumen undang-undang
- **Pemantauan Pematuhan**: Pemeriksaan pematuhan peraturan automatik
- **Penilaian Risiko**: Analisis risiko dan pelaporan berasaskan dokumen
- **Sokongan Audit**: Penemuan dokumen pintar untuk audit

## üöÄ Penyebaran Produksi

### Pemantauan & Kebolehlihatan
- **Application Insights**: Telemetri terperinci dan pemantauan prestasi
- **Metik Tersuai**: Penjejakan dan pemberitahuan KPI khusus perniagaan
- **Penjejakan Teragih**: Penjejakan permintaan hujung-ke-hujung merentasi perkhidmatan
- **Papan Pemuka Kesihatan**: Visualisasi kesihatan sistem dan prestasi masa nyata

### Kebolehskalaan & Kebolehpercayaan
- **Penskal automatik**: Penskalaan automatik berdasarkan beban dan metik prestasi
- **Ketersediaan Tinggi**: Penyebaran pelbagai rantau dengan keupayaan failover
- **Ujian Beban**: Pengesahan prestasi di bawah keadaan beban perusahaan
- **Pemulihan Bencana**: Prosedur sandaran dan pemulihan automatik

Bersedia untuk membina sistem RAG bertaraf perusahaan yang boleh mengendalikan dokumen sensitif pada skala besar? Mari reka seni bina sistem pengetahuan pintar untuk perusahaan! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**Penafian**:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Walaupun kami berusaha memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi ralat atau ketidaktepatan. Dokumen asal dalam bahasa asalnya hendaklah dianggap sebagai sumber yang sahih. Untuk maklumat penting, disyorkan terjemahan profesional oleh penterjemah manusia. Kami tidak bertanggungjawab terhadap sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
