# 🔍 Azure AI Foundry (.NET) を活用したエンタープライズRAG

## 📋 学習目標

このノートブックでは、Microsoft Agent Frameworkを使用してAzure AI Foundryでエンタープライズ向けのRetrieval-Augmented Generation (RAG) システムを構築する方法を紹介します。ドキュメントを検索し、正確でコンテキストに基づいた回答を提供する、セキュリティとスケーラビリティを備えたプロダクション対応のエージェントを作成する方法を学びます。

**構築するエンタープライズRAGの機能:**
- 📚 **ドキュメントインテリジェンス**: Azure AIサービスを活用した高度なドキュメント処理
- 🔍 **セマンティック検索**: エンタープライズ機能を備えた高性能ベクトル検索
- 🛡️ **セキュリティ統合**: ロールベースのアクセスとデータ保護パターン
- 🏢 **スケーラブルなアーキテクチャ**: 監視機能を備えたプロダクション対応のRAGシステム

## 🎯 エンタープライズRAGアーキテクチャ

### エンタープライズの主要コンポーネント
- **Azure AI Foundry**: セキュリティとコンプライアンスを備えた管理型エンタープライズAIプラットフォーム
- **永続エージェント**: 会話履歴とコンテキスト管理を備えたステートフルエージェント
- **ベクトルストア管理**: エンタープライズ向けのドキュメントインデックスと検索
- **アイデンティティ統合**: Azure AD認証とロールベースのアクセス制御

### .NETのエンタープライズメリット
- **型安全性**: RAG操作とデータ構造のコンパイル時検証
- **非同期パフォーマンス**: 非ブロッキングのドキュメント処理と検索操作
- **メモリ管理**: 大規模なドキュメントコレクションに対する効率的なリソース利用
- **統合パターン**: 依存性注入を活用したAzureサービスのネイティブ統合

## 🏗️ 技術アーキテクチャ

### エンタープライズRAGパイプライン
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### .NETの主要コンポーネント
- **Azure.AI.Agents.Persistent**: 状態の永続性を備えたエンタープライズエージェント管理
- **Azure.Identity**: 安全なAzureサービスアクセスのための統合認証
- **Microsoft.Agents.AI.AzureAI**: Azureに最適化されたエージェントフレームワークの実装
- **System.Linq.Async**: 高性能な非同期LINQ操作

## 🔧 エンタープライズ機能とメリット

### セキュリティとコンプライアンス
- **Azure AD統合**: エンタープライズアイデンティティ管理と認証
- **ロールベースのアクセス**: ドキュメントアクセスと操作に対する詳細な権限設定
- **データ保護**: 機密文書の保存時および転送時の暗号化
- **監査ログ**: コンプライアンス要件に対応した包括的な活動追跡

### パフォーマンスとスケーラビリティ
- **接続プール**: 効率的なAzureサービス接続管理
- **非同期処理**: 高スループットシナリオ向けの非ブロッキング操作
- **キャッシュ戦略**: 頻繁にアクセスされるドキュメントのインテリジェントキャッシュ
- **負荷分散**: 大規模展開向けの分散処理

### 管理と監視
- **ヘルスチェック**: RAGシステムコンポーネントの組み込み監視
- **パフォーマンス指標**: 検索品質と応答時間に関する詳細な分析
- **エラーハンドリング**: 再試行ポリシーを備えた包括的な例外管理
- **構成管理**: 環境固有の設定と検証

## ⚙️ 前提条件とセットアップ

**開発環境:**
- .NET 9.0 SDK以上
- Visual Studio 2022またはC#拡張機能付きVS Code
- Azure AI Foundryアクセスを含むAzureサブスクリプション

**必要なNuGetパッケージ:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure認証設定:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**環境構成 (.envファイル):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 エンタープライズRAGパターン

### ドキュメント管理パターン
- **一括アップロード**: 大規模なドキュメントコレクションの効率的な処理
- **増分更新**: ドキュメントのリアルタイム追加と変更
- **バージョン管理**: ドキュメントのバージョン管理と変更追跡
- **メタデータ管理**: 豊富なドキュメント属性と分類体系

### 検索と取得パターン
- **ハイブリッド検索**: セマンティック検索とキーワード検索の組み合わせによる最適な結果
- **ファセット検索**: 多次元フィルタリングと分類
- **関連性調整**: ドメイン固有のニーズに対応したカスタムスコアリングアルゴリズム
- **結果ランキング**: ビジネスロジック統合による高度なランキング

### セキュリティパターン
- **ドキュメントレベルのセキュリティ**: ドキュメントごとの詳細なアクセス制御
- **データ分類**: 自動感度ラベル付けと保護
- **監査トレイル**: すべてのRAG操作の包括的なログ記録
- **プライバシー保護**: PII検出と編集機能

## 🔒 エンタープライズセキュリティ機能

### 認証と認可
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### データ保護
- **暗号化**: ドキュメントと検索インデックスのエンドツーエンド暗号化
- **アクセス制御**: Azure ADとの統合によるユーザーとグループの権限設定
- **データ所在地**: コンプライアンス対応の地理的データ配置制御
- **バックアップと復旧**: 自動バックアップと災害復旧機能

## 📈 パフォーマンス最適化

### 非同期処理パターン
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### メモリ管理
- **ストリーミング処理**: メモリ問題を回避しながら大規模ドキュメントを処理
- **リソースプール**: 高価なリソースの効率的な再利用
- **ガベージコレクション**: 最適化されたメモリ割り当てパターン
- **接続管理**: 適切なAzureサービス接続ライフサイクル

### キャッシュ戦略
- **クエリキャッシュ**: 頻繁に実行される検索のキャッシュ
- **ドキュメントキャッシュ**: ホットドキュメントのインメモリキャッシュ
- **インデックスキャッシュ**: 最適化されたベクトルインデックスキャッシュ
- **結果キャッシュ**: 生成された応答のインテリジェントキャッシュ

## 📊 エンタープライズユースケース

### ナレッジ管理
- **企業Wiki**: 企業のナレッジベースを横断するインテリジェント検索
- **ポリシーと手順**: 自動コンプライアンスと手順ガイダンス
- **トレーニング資料**: インテリジェントな学習と開発支援
- **研究データベース**: 学術論文や研究資料の分析システム

### カスタマーサポート
- **サポートナレッジベース**: 自動化されたカスタマーサービス応答
- **製品ドキュメント**: インテリジェントな製品情報検索
- **トラブルシューティングガイド**: コンテキストに基づいた問題解決支援
- **FAQシステム**: ドキュメントコレクションから動的にFAQを生成

### 規制コンプライアンス
- **法的文書分析**: 契約書や法的文書のインテリジェンス
- **コンプライアンス監視**: 自動化された規制コンプライアンスチェック
- **リスク評価**: ドキュメントベースのリスク分析と報告
- **監査支援**: 監査向けのインテリジェントなドキュメント検索

## 🚀 プロダクション展開

### 監視と可観測性
- **Application Insights**: 詳細なテレメトリとパフォーマンス監視
- **カスタム指標**: ビジネス固有のKPI追跡とアラート
- **分散トレーシング**: サービス間のリクエストをエンドツーエンドで追跡
- **ヘルスダッシュボード**: システムのリアルタイムの健康状態とパフォーマンスの可視化

### スケーラビリティと信頼性
- **自動スケーリング**: 負荷とパフォーマンス指標に基づく自動スケーリング
- **高可用性**: フェイルオーバー機能を備えたマルチリージョン展開
- **負荷テスト**: エンタープライズ負荷条件下でのパフォーマンス検証
- **災害復旧**: 自動バックアップと復旧手順

エンタープライズ規模で機密文書を扱えるRAGシステムを構築する準備はできていますか？インテリジェントなナレッジシステムをエンタープライズ向けに設計しましょう！ 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**免責事項**:  
この文書は、AI翻訳サービス[Co-op Translator](https://github.com/Azure/co-op-translator)を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。元の言語で記載された文書を正式な情報源としてお考えください。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解について、当社は責任を負いません。
