# Lab 2: Azure AI Search RAG 지식 베이스 구성하기

## 개요 (Overview)

이 노트북에서는 Azure AI Search를 사용하여 RAG(Retrieval-Augmented Generation) 지식 베이스를 구성합니다.

### 아키텍처 (Architecture)

```
┌─────────────────────────────────────────────────────────┐
│                  RAG Pipeline                            │
│                                                          │
│  Documents (JSON) → Embeddings (OpenAI)                 │
│                         ↓                                │
│              Azure AI Search Index                       │
│           (Vector Store + Keyword Search)                │
│                         ↓                                │
│            Hybrid Search (Vector + BM25)                 │
│                         ↓                                │
│              Research Agent Query                        │
└─────────────────────────────────────────────────────────┘
```

### 학습 목표 (Learning Objectives)

이 실습을 완료하면 다음을 할 수 있게 됩니다:

1. ✅ Azure AI Search 인덱스 스키마 설계 및 생성
2. ✅ Azure OpenAI로 텍스트 임베딩 생성
3. ✅ 벡터 및 키워드 검색을 위한 문서 업로드
4. ✅ 하이브리드 검색 (벡터 + BM25) 실행 및 테스트
5. ✅ RAG 파이프라인 성능 평가 및 최적화

### 사용할 데이터 (Data)

- **data/knowledge-base.json**: 54개의 AI 에이전트 관련 문서 (섹션별 청킹)
- **카테고리**: Agent Development, RAG Patterns, MCP, Deployment, Architecture
- **임베딩 모델**: text-embedding-3-large (3072차원 기본값 사용)

## 1. 사전 요구 사항 확인 (Prerequisites Check)

다음 도구들이 설치되어 있는지 확인합니다:

- Python 3.9 이상
- Azure CLI
- Azure Developer CLI (azd)
- Docker (Container Apps 배포 시 필요)

In [1]:
import sys, subprocess, os
import platform

# 운영체제에 따라 PATH 설정 (macOS, Linux, Codespaces 모두 지원)
system = platform.system()
if system == 'Darwin':  # macOS
    # Homebrew 경로 추가 (Intel & Apple Silicon)
    extra_paths = '/opt/homebrew/bin:/usr/local/bin'
elif system == 'Linux':  # Linux / Codespaces
    # 일반적인 Linux 바이너리 경로
    extra_paths = '/usr/local/bin:/usr/bin:/home/codespace/.local/bin'
else:  # Windows
    extra_paths = ''

if extra_paths:
    os.environ['PATH'] = extra_paths + ':' + os.environ.get('PATH', '')

def check(cmd, name):
    try:
        result = subprocess.run(cmd, shell=True, capture_output=True, timeout=3, env=os.environ)
        print(f"{'✓' if result.returncode == 0 else '✗'} {name}")
    except Exception as e:
        print(f"✗ {name}")

print("=== Prerequisites Check ===")
print(f"✓ Python {sys.version.split()[0]} ({system})")
check("az --version", "Azure CLI")
check("azd version", "Azure Developer CLI")
check("docker --version", "Docker")
print("="*50)

=== Prerequisites Check ===
✓ Python 3.13.7 (Darwin)
✓ Azure CLI
✓ Azure Developer CLI
✓ Docker


## 2. 패키지 설치 및 설정 로드 (Install Packages & Load Configuration)

In [2]:
# 필요한 패키지 설치
import sys
import subprocess

packages = [
    "azure-search-documents>=11.4.0",
    "azure-identity>=1.15.0",
    "openai>=1.12.0",
    "python-dotenv>=1.0.0"
]

print("📦 패키지 설치 중...")
for package in packages:
    subprocess.check_call([sys.executable, "-m", "pip", "install", "-q", package])
print("✅ 패키지 설치 완료")

📦 패키지 설치 중...
✅ 패키지 설치 완료


In [3]:
# Notebook 1에서 저장한 설정 파일 로드
import json
import os

config_path = "./config.json"

if not os.path.exists(config_path):
    raise FileNotFoundError(
        f"❌ 설정 파일을 찾을 수 없습니다: {config_path}\n"
        "먼저 Notebook 1 (01_deploy_azure_resources.ipynb)을 실행하세요."
    )

with open(config_path, 'r') as f:
    config = json.load(f)

# 필수 설정 확인 (Managed Identity 사용으로 키 불필요)
required_keys = ["search_endpoint", "project_connection_string"]
missing_keys = [key for key in required_keys if not config.get(key)]

if missing_keys:
    raise ValueError(f"❌ 필수 설정이 누락되었습니다: {', '.join(missing_keys)}")

print("✅ 설정 파일 로드 완료")
print(f"📍 Search Endpoint: {config['search_endpoint']}")
print(f"📍 AI Project Connection: {'✓ Set' if config['project_connection_string'] else '✗ Missing'}")
print(f"🔐 인증 방식: Managed Identity (DefaultAzureCredential)")

✅ 설정 파일 로드 완료
📍 Search Endpoint: https://srch-flyoy4n4dll42.search.windows.net/
📍 AI Project Connection: ✓ Set
🔐 인증 방식: Managed Identity (DefaultAzureCredential)


## 3. Azure 인증 (Azure Authentication)

Lab 1에서 이미 Azure에 로그인했지만, 세션이 만료되었을 수 있으므로 인증 상태를 확인하고 필요시 재인증합니다.

In [None]:
import subprocess, json

print("=== Azure Authentication ===")
print("ℹ️  인증 상태를 확인하고 필요시 로그인합니다.\n")

# Azure CLI 인증 상태 확인
az_account = subprocess.run("az account show", shell=True, capture_output=True, text=True)

if az_account.returncode == 0:
    account_info = json.loads(az_account.stdout)
    print(f"✅ Azure CLI 인증 완료 (기존 세션 사용)")
    print(f"   구독: {account_info.get('name', 'N/A')}")
    print(f"   테넌트: {account_info.get('tenantId', 'N/A')}")
else:
    print("⚠️  Azure CLI 인증이 필요합니다. 브라우저가 열립니다...")
    az_login = subprocess.run("az login --tenant 16b3c013-d300-468d-ac64-7eda0820b6d3", shell=True)
    if az_login.returncode == 0:
        print("✅ Azure CLI 로그인 완료")
    else:
        raise Exception("❌ Azure CLI 로그인 실패")

print("="*50)

=== Azure Authentication ===
🔐 Browser will open for authentication...

✅ Azure CLI
✅ Azure Developer CLI


## 4. 지식 베이스 데이터 로드 (Load Knowledge Base Data)

In [5]:
# 지식 베이스 JSON 파일 로드
knowledge_base_path = "./data/knowledge-base.json"

if not os.path.exists(knowledge_base_path):
    raise FileNotFoundError(f"❌ 지식 베이스 파일을 찾을 수 없습니다: {knowledge_base_path}")

with open(knowledge_base_path, 'r', encoding='utf-8') as f:
    knowledge_base = json.load(f)

# JSON이 직접 배열이거나 documents 래퍼가 있을 수 있음
if isinstance(knowledge_base, list):
    documents = knowledge_base
else:
    documents = knowledge_base.get("documents", [])

print(f"✅ 지식 베이스 로드 완료")
print(f"📚 총 문서 개수: {len(documents)}")
print(f"\n📂 카테고리별 문서 수:")

# 카테고리별 분류
from collections import Counter
categories = Counter(doc["category"] for doc in documents)
for category, count in categories.items():
    print(f"  • {category}: {count}개")

# 첫 번째 문서 샘플 출력
if documents:
    print(f"\n📄 샘플 문서:")
    sample = documents[0]
    print(f"  ID: {sample['id']}")
    print(f"  제목: {sample['title']}")
    print(f"  카테고리: {sample['category']}")
    print(f"  섹션: {sample.get('section', 'N/A')}")
    print(f"  내용 길이: {len(sample['content'])} 자")


✅ 지식 베이스 로드 완료
📚 총 문서 개수: 54

📂 카테고리별 문서 수:
  • 에이전트 개발 기초: 7개
  • 멀티 에이전트 아키텍처: 9개
  • RAG와 Azure AI Search: 6개
  • 사용자 쿼리: 1개
  • 지식 베이스 검색: 1개
  • 컨텍스트 구성: 1개
  • 에이전트에 컨텍스트 제공: 1개
  • 에이전트 실행: 4개
  • Model Context Protocol (MCP): 11개
  • Container Apps 배포: 13개

📄 샘플 문서:
  ID: doc-01-00
  제목: 에이전트 개발 기초 - 개요
  카테고리: 에이전트 개발 기초
  섹션: 1
  내용 길이: 176 자


## 5. Azure AI Search 인덱스 생성 (Create Search Index)

### 📝 인덱서(Indexer) vs. 직접 업로드 방식

이 Lab에서는 **인덱서(Indexer)를 사용하지 않고** 직접 문서를 업로드하는 방식을 사용합니다.

**두 방식의 차이:**

| 구분 | 인덱서 방식 | 직접 업로드 방식 (이 Lab) |
|------|------------|------------------------|
| **데이터 소스** | Blob Storage, Cosmos DB 등 | JSON 파일, 메모리 데이터 |
| **자동화** | 자동 크롤링 및 업데이트 | 수동 업로드 (코드 실행 시) |
| **임베딩** | Azure OpenAI Skills 사용 | Python 코드로 직접 생성 |
| **복잡도** | 높음 (여러 리소스 필요) | 낮음 (코드만 있으면 됨) |
| **유연성** | 제한적 | 높음 (완전한 제어) |
| **적합한 경우** | 대량 데이터, 정기 업데이트 | 소량 데이터, 일회성 작업 |

**이 Lab에서 직접 업로드 방식을 선택한 이유:**
- ✅ 학습 목적: RAG 파이프라인의 각 단계를 명확히 이해
- ✅ 간단한 구성: 추가 Azure 리소스 불필요 (Blob Storage 등)
- ✅ 완전한 제어: 임베딩 생성 과정을 직접 확인 가능
- ✅ 빠른 테스트: 코드 실행만으로 즉시 업데이트 가능

In [8]:
from azure.search.documents.indexes import SearchIndexClient
from azure.search.documents.indexes.models import (
    SearchIndex,
    SearchField,
    SearchFieldDataType,
    VectorSearch,
    VectorSearchProfile,
    HnswAlgorithmConfiguration,
    SimpleField,
    SearchableField
)
from azure.core.credentials import AzureKeyCredential
import subprocess

# Azure AI Search Admin Key 가져오기
print("🔑 AI Search Admin Key 가져오는 중...")
search_service_name = config.get("search_service_name", "")
resource_group = config.get("resource_group", "")

key_result = subprocess.run(
    f"az search admin-key show --resource-group {resource_group} --service-name {search_service_name} --query primaryKey -o tsv",
    shell=True,
    capture_output=True,
    text=True
)

if key_result.returncode != 0:
    raise Exception(f"❌ Admin Key를 가져올 수 없습니다: {key_result.stderr}")

search_admin_key = key_result.stdout.strip()
print("✅ Admin Key 획득 완료")

# Search Index Client 생성 (Admin Key 인증)
index_client = SearchIndexClient(
    endpoint=config["search_endpoint"],
    credential=AzureKeyCredential(search_admin_key)
)
print("✅ Search Index Client 생성 완료 (Admin Key 인증)")

# 인덱스 이름 설정
index_name = "ai-agent-knowledge-base"

# 인덱스 스키마 정의
fields = [
    SimpleField(name="id", type=SearchFieldDataType.String, key=True),
    SearchableField(name="title", type=SearchFieldDataType.String, 
                   filterable=True, sortable=True),
    SearchableField(name="content", type=SearchFieldDataType.String, 
                   analyzer_name="ko.microsoft"),  # 한국어 분석기
    SimpleField(name="category", type=SearchFieldDataType.String, 
               filterable=True, sortable=True, facetable=True),
    SimpleField(name="section", type=SearchFieldDataType.String, 
               filterable=True, sortable=False),
    SearchField(
        name="contentVector",
        type=SearchFieldDataType.Collection(SearchFieldDataType.Single),
        searchable=True,
        vector_search_dimensions=3072,  # text-embedding-3-large
        vector_search_profile_name="vector-profile"
    )
]

# 벡터 검색 설정
vector_search = VectorSearch(
    algorithms=[
        HnswAlgorithmConfiguration(name="hnsw-algorithm")
    ],
    profiles=[
        VectorSearchProfile(
            name="vector-profile",
            algorithm_configuration_name="hnsw-algorithm"
        )
    ]
)

# 인덱스 생성
index = SearchIndex(
    name=index_name,
    fields=fields,
    vector_search=vector_search
)

# 기존 인덱스가 있으면 삭제 후 재생성
try:
    index_client.delete_index(index_name)
    print(f"⚠️ 기존 인덱스 '{index_name}' 삭제됨")
except:
    pass

result = index_client.create_index(index)
print(f"✅ 인덱스 생성 완료: {result.name}")
print(f"📊 필드 개수: {len(result.fields)}")
print("🔍 벡터 검색: 활성화 (3072 차원)")


🔑 AI Search Admin Key 가져오는 중...
✅ Admin Key 획득 완료
✅ Search Index Client 생성 완료 (Admin Key 인증)
⚠️ 기존 인덱스 'ai-agent-knowledge-base' 삭제됨
✅ 인덱스 생성 완료: ai-agent-knowledge-base
📊 필드 개수: 6
🔍 벡터 검색: 활성화 (3072 차원)


## 6. Azure OpenAI로 임베딩 생성 (Generate Embeddings with Azure OpenAI)

In [9]:
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
import time

# Azure OpenAI 클라이언트 생성 (Managed Identity 사용)
token_provider = get_bearer_token_provider(
    DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default"
)

# Project connection string에서 OpenAI 엔드포인트 추출
# 형식 1: https://aoai-xxx.services.ai.azure.com/api/projects/proj-xxx;...
# 형식 2: workspace=...;subscription_id=...;resource_group=...;aiservices_name=...
import re

project_conn_str = config['project_connection_string']

# URL에서 AI Services 이름 추출 (형식 1)
url_match = re.match(r'https://([^.]+)\.', project_conn_str)
if url_match:
    aiservices_name = url_match.group(1)
    openai_endpoint = f"https://{aiservices_name}.openai.azure.com/"
else:
    # 키-값 형식에서 추출 (형식 2)
    conn_parts = {}
    for part in project_conn_str.split(';'):
        if '=' in part:
            key, value = part.split('=', 1)
            conn_parts[key] = value
    
    aiservices_name = conn_parts.get('aiservices_name', '')
    if not aiservices_name:
        raise ValueError("❌ AI Services 이름을 찾을 수 없습니다. config.json의 project_connection_string을 확인하세요.")
    
    openai_endpoint = f"https://{aiservices_name}.openai.azure.com/"

print(f"🔗 Azure OpenAI Endpoint: {openai_endpoint}")

openai_client = AzureOpenAI(
    azure_ad_token_provider=token_provider,
    api_version="2024-02-01",
    azure_endpoint=openai_endpoint
)

# 임베딩 모델 설정
embedding_model = "text-embedding-3-large"

def generate_embedding(text: str) -> list[float]:
    """텍스트를 벡터로 변환"""
    response = openai_client.embeddings.create(
        input=text,
        model=embedding_model,
        dimensions=3072  # 명시적으로 3072 차원으로 설정
    )
    return response.data[0].embedding

# 모든 문서에 대해 임베딩 생성
print("🔄 임베딩 생성 중...")
print(f"📄 처리할 문서: {len(documents)}개")

for i, doc in enumerate(documents, 1):
    # 제목과 내용을 결합하여 임베딩 생성
    text_to_embed = f"{doc['title']}\n\n{doc['content']}"
    doc["contentVector"] = generate_embedding(text_to_embed)
    
    print(f"  [{i}/{len(documents)}] {doc['title'][:50]}... ✓")
    
    # Rate limit 방지 (TPM 제한 고려)
    if i < len(documents):
        time.sleep(0.5)

print(f"\n✅ 임베딩 생성 완료")
print(f"📊 벡터 차원: {len(documents[0]['contentVector'])}차원 (3072차원)")
print(f"💾 메모리 사용량: ~{len(documents) * 3072 * 4 / 1024 / 1024:.2f} MB")


🔗 Azure OpenAI Endpoint: https://aoai-flyoy4n4dll42.openai.azure.com/
🔄 임베딩 생성 중...
📄 처리할 문서: 54개
  [1/54] 에이전트 개발 기초 - 개요... ✓
  [2/54] 에이전트 개발 기초 - 핵심 개념... ✓
  [3/54] 에이전트 개발 기초 - Azure AI Foundry SDK로 에이전트 구축... ✓
  [4/54] 에이전트 개발 기초 - Function Tools 추가... ✓
  [5/54] 에이전트 개발 기초 - Thread와 Run 관리... ✓
  [6/54] 에이전트 개발 기초 - Tool Call 처리... ✓
  [7/54] 에이전트 개발 기초 - Best Practices... ✓
  [8/54] 멀티 에이전트 아키텍처 - 개요... ✓
  [9/54] 멀티 에이전트 아키텍처 - 아키텍처 개요... ✓
  [10/54] 멀티 에이전트 아키텍처 - 에이전트 역할... ✓
  [11/54] 멀티 에이전트 아키텍처 - 통신 패턴... ✓
  [12/54] 멀티 에이전트 아키텍처 - Azure AI Foundry에서 Connected Agents... ✓
  [13/54] 멀티 에이전트 아키텍처 - Azure AI Foundry에서 Connected Agents... ✓
  [14/54] 멀티 에이전트 아키텍처 - Azure AI Foundry에서 Connected Agents... ✓
  [15/54] 멀티 에이전트 아키텍처 - 설계 고려사항... ✓
  [16/54] 멀티 에이전트 아키텍처 - Best Practices... ✓
  [17/54] RAG와 Azure AI Search - 개요... ✓
  [18/54] RAG와 Azure AI Search - Azure AI Search 개요... ✓
  [19/54] RAG와 Azure AI Search - Azure AI Search로 RAG 구현... ✓
  [20/54] RAG와 Azure AI Searc

## 7. 문서를 Azure AI Search에 업로드 (Upload Documents to Azure AI Search)

In [10]:
from azure.search.documents import SearchClient

# SearchClient 생성 (Admin Key 인증 재사용)
search_client = SearchClient(
    endpoint=config["search_endpoint"],
    index_name=index_name,
    credential=AzureKeyCredential(search_admin_key)
)

print("📤 문서 업로드 시작...")
print(f"🔐 인증 방식: Admin Key")

# 인덱스 스키마에 정의된 필드만 포함하도록 문서 정리
allowed_fields = {"id", "title", "content", "category", "section", "contentVector"}
cleaned_documents = []
for doc in documents:
    cleaned_doc = {key: value for key, value in doc.items() if key in allowed_fields}
    cleaned_documents.append(cleaned_doc)

print(f"📋 정리된 문서 필드: {list(cleaned_documents[0].keys())}")

# Upload documents with embeddings
result = search_client.upload_documents(documents=cleaned_documents)

# Check results
succeeded = sum([1 for r in result if r.succeeded])
failed = sum([1 for r in result if not r.succeeded])

print(f"\n✅ 업로드 완료! (Upload complete!)")
print(f"   - 성공: {succeeded}개")
print(f"   - 실패: {failed}개")

if failed > 0:
    print("\n⚠️  일부 문서 업로드 실패. 다음을 확인하세요:")
    print("   1. 인덱스 스키마와 문서 필드가 일치하는지 확인")
    print("   2. contentVector 차원이 3072인지 확인")
    print("   3. Azure AI Search 서비스 상태 확인")
else:
    print("\n🎉 모든 문서가 성공적으로 인덱싱되었습니다!")
    print(f"   인덱스 '{index_name}'에 {succeeded}개 문서가 저장되었습니다.")

📤 문서 업로드 시작...
🔐 인증 방식: Admin Key
📋 정리된 문서 필드: ['id', 'title', 'content', 'category', 'section', 'contentVector']

✅ 업로드 완료! (Upload complete!)
   - 성공: 54개
   - 실패: 0개

🎉 모든 문서가 성공적으로 인덱싱되었습니다!
   인덱스 'ai-agent-knowledge-base'에 54개 문서가 저장되었습니다.


## 8. 하이브리드 검색 테스트 (Test Hybrid Search)

이제 **벡터 검색**(의미 기반)과 **키워드 검색**(전통적 검색)을 결합한 **하이브리드 검색**을 테스트합니다.

**하이브리드 검색의 장점:**
- 벡터 검색: 의미적으로 유사한 문서를 찾습니다 (예: "에이전트 만들기" ≈ "agent development")
- 키워드 검색: 정확한 단어 매칭으로 관련성 높은 결과를 찾습니다
- 두 방식을 결합하여 더 정확하고 포괄적인 검색 결과 제공

In [11]:
from azure.search.documents.models import VectorizedQuery

def test_hybrid_search(query_text: str, top: int = 3):
    """
    하이브리드 검색 실행: 벡터 검색 + 키워드 검색
    """
    print(f"\n🔍 검색 쿼리: '{query_text}'")
    print("=" * 80)
    
    # 1. 쿼리 텍스트를 벡터로 변환
    query_vector = generate_embedding(query_text)
    
    # 2. 벡터 검색 쿼리 생성
    vector_query = VectorizedQuery(
        vector=query_vector,
        k_nearest_neighbors=top,
        fields="contentVector"
    )
    
    # 3. 하이브리드 검색 실행 (벡터 + 키워드)
    results = search_client.search(
        search_text=query_text,  # 키워드 검색
        vector_queries=[vector_query],  # 벡터 검색
        select=["id", "title", "content", "category", "section"],
        top=top
    )
    
    # 4. 결과 출력
    for i, result in enumerate(results, 1):
        score = result.get("@search.score", 0)
        print(f"\n📄 결과 {i} (점수: {score:.4f})")
        print(f"   ID: {result['id']}")
        print(f"   제목: {result['title']}")
        print(f"   카테고리: {result['category']}")
        print(f"   섹션: {result.get('section', 'N/A')}")
        print(f"   내용 (처음 200자): {result['content'][:200]}...")
    
    print("\n" + "=" * 80)

# 테스트 쿼리 1: 에이전트 개발
test_hybrid_search("Azure AI 에이전트를 어떻게 개발하나요?")

# 테스트 쿼리 2: RAG 최적화
test_hybrid_search("RAG 시스템의 성능을 최적화하는 방법")

# 테스트 쿼리 3: MCP 구현
test_hybrid_search("Model Context Protocol 도구 서버 구현하기")

print("\n✅ 하이브리드 검색 테스트 완료!")
print("   - 한국어 분석기(ko.microsoft)가 잘 작동합니다")
print("   - 벡터 검색과 키워드 검색이 결합되어 정확한 결과를 반환합니다")



🔍 검색 쿼리: 'Azure AI 에이전트를 어떻게 개발하나요?'

📄 결과 1 (점수: 0.0325)
   ID: doc-01-01
   제목: 에이전트 개발 기초 - 핵심 개념
   카테고리: 에이전트 개발 기초
   섹션: 1
   내용 (처음 200자): ### 에이전트 아키텍처
Azure AI 에이전트는 다음으로 구성됩니다:
- **Instructions**: 에이전트의 행동과 성격을 정의하는 시스템 프롬프트
- **Model**: 기본 언어 모델 (예: GPT-4o)
- **Tools**: 에이전트가 작업을 수행하기 위해 호출할 수 있는 함수
- **Knowledge**: 에이전트가 참조할 수 있는 정보...

📄 결과 2 (점수: 0.0321)
   ID: doc-01-02
   제목: 에이전트 개발 기초 - Azure AI Foundry SDK로 에이전트 구축
   카테고리: 에이전트 개발 기초
   섹션: 1
   내용 (처음 200자): Azure AI Foundry SDK는 에이전트를 생성하고 관리하기 위한 Python 기반 인터페이스를 제공합니다:

```python
from azure.ai.projects import AIProjectClient
from azure.identity import DefaultAzureCredential

# Client 초기화
client = AIPro...

📄 결과 3 (점수: 0.0291)
   ID: doc-01-06
   제목: 에이전트 개발 기초 - Best Practices
   카테고리: 에이전트 개발 기초
   섹션: 1
   내용 (처음 200자): 1. **명확한 지시사항**: 에이전트 동작에 대한 상세하고 구체적인 지시사항 제공
2. **도구 선택**: 에이전트의 작업에 적합한 도구 선택
3. **에러 처리**: 강력한 에러 처리 및 폴백 메커니즘 구현
4. **모니터링**: Application Insights를 사용하여 에이전트 성능 모니터링
5. **보안**: Managed I

## 9. 검색 성능 비교 (Search Performance Comparison)

벡터 전용 검색 vs. 하이브리드 검색의 성능을 비교해봅니다.

In [12]:
import sys
import time

test_query = "에이전트 시스템 보안"

# 쿼리 임베딩 생성 (1회만)
print("🔄 검색 쿼리 임베딩 생성 중...")
query_vector = generate_embedding(test_query)
vector_query = VectorizedQuery(vector=query_vector, k_nearest_neighbors=3, fields="contentVector")
print("✅ 임베딩 생성 완료\n")
sys.stdout.flush()  # 출력 버퍼 강제 비우기

# === 방법 1: 벡터 전용 검색 ===
print("🔍 방법 1: 벡터 전용 검색 (의미 기반)")
print("=" * 80)
sys.stdout.flush()

# 검색 실행 및 결과 수집 (동기적)
vector_search_results = search_client.search(
    search_text=None,  # 키워드 검색 비활성화
    vector_queries=[vector_query],
    select=["title", "category"],
    top=3
)
vector_results = []
for result in vector_search_results:
    vector_results.append(result)

# 결과 출력
for i, r in enumerate(vector_results, 1):
    print(f"   {i}. {r['title']}")
sys.stdout.flush()
time.sleep(0.1)  # 출력 완료 대기

# === 방법 2: 하이브리드 검색 ===
print("\n🔍 방법 2: 하이브리드 검색 (의미 + 키워드)")
print("=" * 80)
sys.stdout.flush()

# 검색 실행 및 결과 수집 (동기적)
hybrid_search_results = search_client.search(
    search_text=test_query,  # 키워드 검색 활성화
    vector_queries=[vector_query],
    select=["title", "category"],
    top=3
)
hybrid_results = []
for result in hybrid_search_results:
    hybrid_results.append(result)

# 결과 출력
for i, r in enumerate(hybrid_results, 1):
    print(f"   {i}. {r['title']}")
sys.stdout.flush()
time.sleep(0.1)  # 출력 완료 대기

# === 방법 3: 키워드 전용 검색 ===
print("\n🔍 방법 3: 키워드 전용 검색 (전통적 검색)")
print("=" * 80)
sys.stdout.flush()

# 검색 실행 및 결과 수집 (동기적)
keyword_search_results = search_client.search(
    search_text=test_query,
    vector_queries=None,  # 벡터 검색 비활성화
    select=["title", "category"],
    top=3
)
keyword_results = []
for result in keyword_search_results:
    keyword_results.append(result)

# 결과 출력
for i, r in enumerate(keyword_results, 1):
    print(f"   {i}. {r['title']}")
sys.stdout.flush()
time.sleep(0.1)  # 출력 완료 대기

print("\n" + "=" * 80)
print("📊 결론:")
print("   - 벡터 검색: 의미적으로 유사한 문서 검색에 강함")
print("   - 키워드 검색: 정확한 단어 매칭에 강함")
print("   - 하이브리드 검색: 두 방식의 장점을 결합하여 가장 정확한 결과 제공 (권장)")

🔄 검색 쿼리 임베딩 생성 중...
✅ 임베딩 생성 완료

🔍 방법 1: 벡터 전용 검색 (의미 기반)
   1. 멀티 에이전트 아키텍처 - 아키텍처 개요
   2. 에이전트 개발 기초 - Best Practices
   3. 멀티 에이전트 아키텍처 - Best Practices

🔍 방법 2: 하이브리드 검색 (의미 + 키워드)
   1. 에이전트 개발 기초 - Best Practices
   2. 멀티 에이전트 아키텍처 - Best Practices
   3. 멀티 에이전트 아키텍처 - 아키텍처 개요

🔍 방법 3: 키워드 전용 검색 (전통적 검색)
   1. 에이전트 개발 기초 - 핵심 개념
   2. 에이전트 개발 기초 - Best Practices
   3. 멀티 에이전트 아키텍처 - Best Practices

📊 결론:
   - 벡터 검색: 의미적으로 유사한 문서 검색에 강함
   - 키워드 검색: 정확한 단어 매칭에 강함
   - 하이브리드 검색: 두 방식의 장점을 결합하여 가장 정확한 결과 제공 (권장)


## 10. 설정 파일 업데이트 (Update Configuration)

인덱스 이름을 `config.json`에 저장하여 Notebook 3 (에이전트 배포)에서 사용할 수 있도록 합니다.

In [13]:
# config.json 다시 로드
with open("./config.json", "r", encoding="utf-8") as f:
    config = json.load(f)

# 인덱스 이름 추가
config["search_index"] = index_name

# 업데이트된 설정 저장
with open("./config.json", "w", encoding="utf-8") as f:
    json.dump(config, f, indent=2, ensure_ascii=False)

print("✅ 설정 파일 업데이트 완료!")
print(f"   - 인덱스 이름: {index_name}")
print(f"   - 저장 위치: config.json")
print("\n🔗 다음 단계:")
print("   - Notebook 3에서 이 설정을 사용하여 Research Agent 배포")
print("   - Research Agent가 이 인덱스를 검색하여 질문에 답변합니다")

✅ 설정 파일 업데이트 완료!
   - 인덱스 이름: ai-agent-knowledge-base
   - 저장 위치: config.json

🔗 다음 단계:
   - Notebook 3에서 이 설정을 사용하여 Research Agent 배포
   - Research Agent가 이 인덱스를 검색하여 질문에 답변합니다


## 11. RAG 구성 완료 및 요약 (RAG Setup Summary)

### 🎉 Lab 2 완료!

이번 실습에서 구성한 내용:

| 항목 | 세부 내용 |
|------|-----------|
| **인덱스 이름** | `ai-agent-knowledge-base` |
| **문서 수** | 10개 (agent development, RAG patterns, MCP, deployment, multi-agent, SDK, vector search, prompting, security, cost management) |
    "| **벡터 차원** | 3072 (text-embedding-3-large, 기본값) |\n",
| **검색 알고리즘** | HNSW (Hierarchical Navigable Small World) |
| **언어 분석기** | ko.microsoft (한국어 지원) |
| **검색 방식** | 하이브리드 (벡터 + 키워드) |

### 📊 RAG 파이프라인 구성 완료

```
📄 Knowledge Base (10 docs)
    ↓
"🔢 Embeddings (3072-dim vectors)\n",
    ↓
💾 Azure AI Search Index
    ↓
🔍 Hybrid Search (Vector + Keyword)
    ↓
🤖 Research Agent (Notebook 3에서 배포 예정)
```

### 🔗 다음 단계: Notebook 3

**Lab 3: Multi-Agent 시스템 배포하기**에서는:

1. **MCP Server 배포** - 날씨 정보 도구 서버 (Container Apps)
2. **Agent Container 빌드** - Main/Tool/Research Agent 컨테이너화
3. **Agent Service 배포** - Multi-Agent 시스템 배포 (Container Apps)
4. **Managed Identity 권한 설정** - Azure AI User 역할 자동 할당
5. **HTTP API 테스트** - 배포된 Agent 엔드포인트 테스트
6. **Application Analytics 확인** - 메트릭 및 성능 모니터링
7. **Tracing UI 확인** - 상세 실행 흐름 및 Input/Output 확인

이제 Notebook 3을 실행할 준비가 완료되었습니다! 🚀

## 12. 문제 해결 (Troubleshooting)

### ❌ 일반적인 오류와 해결 방법

#### 1️⃣ **인덱스 생성 실패 - Forbidden 오류**
```
HttpResponseError: Operation returned an invalid status 'Forbidden'
```
**해결 방법:**
- 섹션 4에서 역할 할당이 완료되었는지 확인
- 역할 전파를 위해 1-2분 대기 후 재시도
- Azure Portal에서 수동으로 역할 확인: AI Search 서비스 → Access Control (IAM)

#### 2️⃣ **인덱스 생성 실패 - 일반 오류**
```
Error: Index creation failed
```
**해결 방법:**
- Azure AI Search 서비스가 정상 실행 중인지 확인
- 서비스 티어가 벡터 검색을 지원하는지 확인 (Basic 이상)
- `index_name`이 Azure 명명 규칙을 따르는지 확인 (소문자, 숫자, 하이픈만 사용)

#### 3️⃣ **임베딩 생성 실패**
```
Error: Rate limit exceeded / API quota exceeded
```
**해결 방법:**
- `time.sleep(0.5)` 대신 더 긴 대기 시간 설정 (예: 1초)
- Azure OpenAI 서비스의 TPM (Tokens Per Minute) 할당량 확인
- 배포 모델의 용량 확대 필요 시 Azure Portal에서 조정

#### 4️⃣ **문서 업로드 실패**
```
Error: Document upload failed
```
**해결 방법:**
- `contentVector` 차원이 정확히 3072인지 확인
- 모든 필수 필드(`id`, `title`, `content`)가 있는지 확인
- 문서 ID가 고유한지 확인 (중복 시 오류 발생)

#### 5️⃣ **검색 결과가 없음**
```
Search returned 0 results
```
**해결 방법:**
- 문서가 실제로 업로드되었는지 확인: `search_client.get_document_count()`
- 인덱싱이 완료될 때까지 1-2분 대기
- 쿼리 텍스트가 너무 구체적이지 않은지 확인

#### 6️⃣ **한국어 검색 품질 낮음**
```
Korean text search returns poor results
```
**해결 방법:**
- 인덱스의 `content` 필드가 `ko.microsoft` 분석기를 사용하는지 확인
- 하이브리드 검색을 사용하여 벡터 + 키워드 검색 결합
- 쿼리 텍스트를 더 자연스러운 문장으로 작성

### 🔍 디버깅 팁

```python
# 인덱스 문서 수 확인
doc_count = search_client.get_document_count()
print(f"인덱스의 총 문서 수: {doc_count}")

# 특정 문서 조회
doc = search_client.get_document(key="doc_001")
print(f"문서 제목: {doc['title']}")
print(f"벡터 차원: {len(doc['contentVector'])}")

# 인덱스 통계 확인 (Azure Portal)
# https://portal.azure.com → AI Search 서비스 → 인덱스 → 통계 탭
```