# Azure AI Foundry

<center><img src="../../../images/Azure-AI-Foundry_1600x900.jpg" alt="Azure AI Foundry" width="600">

## Laborat√≥rio 5 - RAG (Retrieval-Augmented Generation)

Neste laborat√≥rio iremos implementar um sistema RAG (Retrieval-Augmented Generation) usando Azure AI Search e Azure OpenAI. O RAG √© uma t√©cnica que combina recupera√ß√£o de informa√ß√µes com gera√ß√£o de texto, permitindo que os modelos de linguagem acessem conhecimentos espec√≠ficos externos ao seu treinamento.

Vamos explorar:
1. **Consulta sem RAG**: Como a LLM responde sem conhecimento adicional
2. **Configura√ß√£o do Azure AI Search**: Prepara√ß√£o do √≠ndice de busca vetorial
3. **Implementa√ß√£o do RAG**: Integra√ß√£o da busca com a gera√ß√£o de respostas
4. **Compara√ß√£o de resultados**: Demonstra√ß√£o da diferen√ßa entre respostas com e sem RAG

O primeiro passo √© a valida√ß√£o da configura√ß√£o das vari√°veis de ambiente no arquivo `.env` presente na raiz do reposit√≥rio.

Preencha os valores das vari√°veis de acordo com o solicitado, incluindo as credenciais do Azure AI Search.

### Exerc√≠cio 1 - Configura√ß√£o e Importa√ß√£o de Bibliotecas

Vamos realizar a importa√ß√£o das bibliotecas necess√°rias para o laborat√≥rio de RAG.

In [None]:
import json
import os
from openai import AzureOpenAI
from dotenv import load_dotenv
from azure.search.documents import SearchClient
from azure.core.credentials import AzureKeyCredential
from azure.search.documents.models import VectorizedQuery
import numpy as np

load_dotenv(dotenv_path="../../../.env")

Vamos carregar as credenciais em vari√°veis para facilitar o uso no laborat√≥rio.

In [None]:
# Azure OpenAI Configuration
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
api_key = os.getenv("AZURE_OPENAI_API_KEY")
api_version = os.getenv("API_VERSION")
deployment_name = os.getenv("AZURE_OPENAI_DEPLOYMENT")
embedding_model = os.getenv("AZURE_OPENAI_EMBEDDING_MODEL")

# Azure AI Search Configuration
search_endpoint = os.getenv("AZURE_SEARCH_ENDPOINT")
search_key = os.getenv("AZURE_SEARCH_KEY")
search_index = os.getenv("AZURE_SEARCH_INDEX", "rag-index")

print("Configura√ß√µes carregadas:")
print(f"Azure OpenAI Endpoint: {azure_endpoint}")
print(f"Azure Search Endpoint: {search_endpoint}")
print(f"Search Index: {search_index}")

Agora vamos inicializar os clientes do Azure OpenAI e Azure AI Search.

In [None]:
# Initialize Azure OpenAI client
openai_client = AzureOpenAI(
    azure_endpoint=azure_endpoint,
    api_key=api_key,
    api_version=api_version
)

# Initialize Azure AI Search client
search_client = SearchClient(
    endpoint=search_endpoint,
    index_name=search_index,
    credential=AzureKeyCredential(search_key)
)

print("Clientes inicializados com sucesso!")

### Exerc√≠cio 2 - Consulta Sem RAG (Baseline)

Primeiro, vamos fazer uma pergunta espec√≠fica sobre um t√≥pico que provavelmente n√£o est√° no conhecimento base da LLM ou est√° desatualizado. Isso nos permitir√° comparar a qualidade das respostas antes e depois da implementa√ß√£o do RAG.

In [None]:
# Pergunta espec√≠fica sobre um t√≥pico que pode n√£o estar no conhecimento da LLM
question = "Quais s√£o as principais funcionalidades do Azure AI Foundry lan√ßadas em 2024?"

def query_without_rag(question):
    """Faz uma consulta direta ao modelo sem usar RAG"""
    response = openai_client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": "Voc√™ √© um assistente √∫til especializado em tecnologias Azure."},
            {"role": "user", "content": question}
        ],
        max_tokens=500,
        temperature=0.7
    )
    return response.choices[0].message.content

# Consulta sem RAG
print("=== RESPOSTA SEM RAG ===")
response_without_rag = query_without_rag(question)
print(response_without_rag)
print("\n" + "="*50 + "\n")

### Exerc√≠cio 3 - Prepara√ß√£o de Dados para RAG

Vamos criar alguns documentos de exemplo sobre Azure AI Foundry para simular uma base de conhecimento. Em um cen√°rio real, estes dados viriam de documenta√ß√£o oficial, manuais, ou outros reposit√≥rios de conhecimento.

In [None]:
# Dados de exemplo sobre Azure AI Foundry
sample_documents = [
    {
        "id": "1",
        "title": "Azure AI Foundry - Vis√£o Geral",
        "content": """Azure AI Foundry √© uma plataforma unificada para desenvolvimento de aplica√ß√µes de IA. 
        Lan√ßado em 2024, oferece ferramentas integradas para construir, treinar e implementar modelos de IA. 
        Inclui suporte nativo para RAG, function calling, e integra√ß√£o com Azure AI Search. 
        A plataforma permite colabora√ß√£o entre equipes e governan√ßa centralizada de modelos."""
    },
    {
        "id": "2", 
        "title": "Funcionalidades do Azure AI Foundry 2024",
        "content": """As principais funcionalidades do Azure AI Foundry incluem: 
        1) Model Catalog com mais de 200 modelos pr√©-treinados
        2) Prompt Flow para orquestra√ß√£o de workflows de IA
        3) Azure AI Search integrado para implementa√ß√µes RAG
        4) Evaluation tools para m√©tricas de qualidade
        5) Responsible AI dashboard para monitoramento √©tico
        6) Multi-cloud deployment support
        7) Real-time inference endpoints com auto-scaling"""
    },
    {
        "id": "3",
        "title": "RAG no Azure AI Foundry", 
        "content": """O Azure AI Foundry oferece suporte nativo para Retrieval-Augmented Generation (RAG). 
        Permite conectar facilmente com Azure AI Search, Cosmos DB, e outras fontes de dados. 
        Inclui ferramentas visuais para configurar pipelines RAG sem c√≥digo. 
        Suporta embeddings personalizados e m√∫ltiplos tipos de retrieval como h√≠brido e sem√¢ntico."""
    },
    {
        "id": "4",
        "title": "Azure AI Search Integration",
        "content": """A integra√ß√£o com Azure AI Search permite busca vetorial avan√ßada com suporte a:
        - Busca h√≠brida (keyword + sem√¢ntica)
        - Filtros de metadados
        - Re-ranking sem√¢ntico 
        - M√∫ltiplos algoritmos de similaridade (cosine, dot product, euclidean)
        - Indexa√ß√£o autom√°tica de documentos
        - Suporte a mais de 300 formatos de arquivo"""
    }
]

print(f"Preparados {len(sample_documents)} documentos de exemplo")
for doc in sample_documents:
    print(f"- {doc['title']}")

### Exerc√≠cio 4 - Gera√ß√£o de Embeddings

Agora vamos gerar embeddings para nossos documentos usando o Azure OpenAI. Os embeddings s√£o representa√ß√µes vetoriais dos documentos que permitem busca sem√¢ntica.

In [None]:
def get_embedding(text):
    """Gera embedding para um texto usando Azure OpenAI"""
    response = openai_client.embeddings.create(
        input=text,
        model=embedding_model
    )
    return response.data[0].embedding

# Gerar embeddings para todos os documentos
print("Gerando embeddings para os documentos...")
for doc in sample_documents:
    # Combinar t√≠tulo e conte√∫do para o embedding
    full_text = f"{doc['title']} {doc['content']}"
    doc['embedding'] = get_embedding(full_text)
    print(f"‚úì Embedding gerado para: {doc['title']}")

print(f"\nEmbeddings gerados! Dimens√£o: {len(sample_documents[0]['embedding'])}")

### Exerc√≠cio 5 - Busca Sem√¢ntica (Simulada)

Como n√£o temos um √≠ndice real do Azure AI Search configurado, vamos simular a busca sem√¢ntica calculando a similaridade entre embeddings. Em um ambiente real, o Azure AI Search faria isso automaticamente.

In [None]:
def cosine_similarity(vec1, vec2):
    """Calcula a similaridade coseno entre dois vetores"""
    vec1 = np.array(vec1)
    vec2 = np.array(vec2)
    dot_product = np.dot(vec1, vec2)
    norm_vec1 = np.linalg.norm(vec1)
    norm_vec2 = np.linalg.norm(vec2)
    return dot_product / (norm_vec1 * norm_vec2)

def semantic_search(query, documents, top_k=2):
    """Realiza busca sem√¢ntica nos documentos"""
    # Gerar embedding da consulta
    query_embedding = get_embedding(query)
    
    # Calcular similaridades
    similarities = []
    for doc in documents:
        similarity = cosine_similarity(query_embedding, doc['embedding'])
        similarities.append({
            'document': doc,
            'similarity': similarity
        })
    
    # Ordenar por similaridade (maior primeiro)
    similarities.sort(key=lambda x: x['similarity'], reverse=True)
    
    return similarities[:top_k]

# Teste da busca sem√¢ntica
print("=== BUSCA SEM√ÇNTICA ===")
results = semantic_search(question, sample_documents)

for i, result in enumerate(results, 1):
    doc = result['document']
    similarity = result['similarity']
    print(f"{i}. {doc['title']} (Similaridade: {similarity:.3f})")
    print(f"   Conte√∫do: {doc['content'][:100]}...")
    print()

### Exerc√≠cio 6 - Implementa√ß√£o do RAG

Agora vamos implementar o sistema RAG completo, combinando a busca sem√¢ntica com a gera√ß√£o de respostas pelo modelo de linguagem.

In [None]:
def query_with_rag(question, documents):
    """Implementa RAG: busca documentos relevantes e gera resposta baseada no contexto"""
    
    # 1. Recupera√ß√£o (Retrieval): Buscar documentos relevantes
    search_results = semantic_search(question, documents, top_k=2)
    
    # 2. Construir contexto com os documentos recuperados
    context_parts = []
    for result in search_results:
        doc = result['document']
        context_parts.append(f"Documento: {doc['title']}\nConte√∫do: {doc['content']}")
    
    context = "\n\n".join(context_parts)
    
    # 3. Construir prompt com contexto
    system_message = """Voc√™ √© um assistente especializado em tecnologias Azure. 
    Use APENAS as informa√ß√µes fornecidas no contexto para responder √† pergunta. 
    Se a informa√ß√£o n√£o estiver no contexto, diga que n√£o possui essa informa√ß√£o espec√≠fica.
    Seja preciso e cite informa√ß√µes espec√≠ficas do contexto quando poss√≠vel."""
    
    user_message = f"""Contexto:
{context}

Pergunta: {question}

Resposta baseada no contexto fornecido:"""
    
    # 4. Gera√ß√£o (Augmented Generation): Gerar resposta com contexto
    response = openai_client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": system_message},
            {"role": "user", "content": user_message}
        ],
        max_tokens=500,
        temperature=0.3  # Menor temperatura para respostas mais precisas
    )
    
    return {
        'answer': response.choices[0].message.content,
        'sources': [result['document']['title'] for result in search_results],
        'context': context
    }

# Executar RAG com a mesma pergunta
print("=== RESPOSTA COM RAG ===")
rag_result = query_with_rag(question, sample_documents)

print("Resposta:")
print(rag_result['answer'])
print(f"\nFontes utilizadas: {', '.join(rag_result['sources'])}")
print("\n" + "="*50 + "\n")

### Exerc√≠cio 7 - Compara√ß√£o de Resultados

Vamos comparar diretamente as respostas obtidas sem RAG e com RAG para evidenciar as diferen√ßas e benef√≠cios do uso de conhecimento espec√≠fico.

In [None]:
print("üîç AN√ÅLISE COMPARATIVA: RAG vs Sem RAG")
print("="*60)

print("\nüìù PERGUNTA:")
print(f'"{question}"')

print("\n‚ùå RESPOSTA SEM RAG (conhecimento limitado):")
print("-" * 50)
print(response_without_rag)

print("\n‚úÖ RESPOSTA COM RAG (conhecimento aumentado):")
print("-" * 50)
print(rag_result['answer'])

print(f"\nüìö FONTES UTILIZADAS NO RAG:")
for source in rag_result['sources']:
    print(f"‚Ä¢ {source}")

print("\nüí° BENEF√çCIOS OBSERVADOS DO RAG:")
benefits = [
    "‚úì Informa√ß√µes mais espec√≠ficas e atualizadas",
    "‚úì Respostas baseadas em fontes confi√°veis",
    "‚úì Maior precis√£o em detalhes t√©cnicos", 
    "‚úì Rastreabilidade das informa√ß√µes (sources)",
    "‚úì Redu√ß√£o de alucina√ß√µes do modelo"
]

for benefit in benefits:
    print(benefit)

### Exerc√≠cio 8 - RAG com Azure AI Search (Exemplo Real)

Embora tenhamos simulado a busca sem√¢ntica, vamos mostrar como seria a implementa√ß√£o real usando Azure AI Search. Este c√≥digo demonstra como conectar com um √≠ndice real.

In [None]:
def query_with_azure_ai_search(question, search_client, openai_client):
    """
    Implementa√ß√£o real de RAG usando Azure AI Search
    Nota: Este c√≥digo requer um √≠ndice configurado no Azure AI Search
    """
    try:
        # 1. Gerar embedding da pergunta
        query_embedding = get_embedding(question)
        
        # 2. Criar consulta vetorizada para Azure AI Search
        vector_query = VectorizedQuery(
            vector=query_embedding,
            k_nearest_neighbors=3,  # Top 3 resultados mais similares
            fields="content_vector"  # Campo que cont√©m os embeddings
        )
        
        # 3. Executar busca no Azure AI Search
        search_results = search_client.search(
            search_text=question,  # Busca h√≠brida: texto + vetorial
            vector_queries=[vector_query],
            top=3,
            include_total_count=True
        )
        
        # 4. Extrair contexto dos resultados
        context_parts = []
        sources = []
        
        for result in search_results:
            context_parts.append(f"T√≠tulo: {result['title']}\\nConte√∫do: {result['content']}")
            sources.append(result['title'])
        
        context = "\\n\\n".join(context_parts)
        
        # 5. Gerar resposta com contexto
        system_message = """Voc√™ √© um assistente especializado em Azure. 
        Use APENAS as informa√ß√µes do contexto fornecido para responder."""
        
        user_message = f"""Contexto:\\n{context}\\n\\nPergunta: {question}\\n\\nResposta:"""
        
        response = openai_client.chat.completions.create(
            model=deployment_name,
            messages=[
                {"role": "system", "content": system_message},
                {"role": "user", "content": user_message}
            ],
            max_tokens=500,
            temperature=0.3
        )
        
        return {
            'answer': response.choices[0].message.content,
            'sources': sources,
            'context': context
        }
        
    except Exception as e:
        return {
            'answer': f"Erro ao conectar com Azure AI Search: {str(e)}",
            'sources': [],
            'context': ""
        }

# Exemplo de uso (comentado pois requer √≠ndice configurado)
print("üìã C√ìDIGO PARA AZURE AI SEARCH REAL:")
print("# Para usar este c√≥digo, voc√™ precisa:")
print("# 1. Criar um √≠ndice no Azure AI Search")
print("# 2. Configurar campos de embedding") 
print("# 3. Indexar seus documentos")
print("# 4. Executar: query_with_azure_ai_search(question, search_client, openai_client)")

# result = query_with_azure_ai_search(question, search_client, openai_client)
# print(result['answer'])

### Exerc√≠cio 9 - Teste Interativo

Agora voc√™ pode testar o sistema RAG com suas pr√≥prias perguntas! Experimente diferentes tipos de consultas para ver como o RAG se comporta.

In [None]:
# Teste suas pr√≥prias perguntas aqui!
test_questions = [
    "Como o Azure AI Foundry suporta RAG?",
    "Quantos modelos est√£o dispon√≠veis no Model Catalog?",
    "Quais s√£o os tipos de busca suportados pelo Azure AI Search?",
    "O que √© o Prompt Flow no Azure AI Foundry?"
]

print("üß™ TESTE INTERATIVO - Experimente diferentes perguntas:")
print("="*60)

for test_q in test_questions:
    print(f"\n‚ùì Pergunta: {test_q}")
    
    # Resposta sem RAG
    no_rag = query_without_rag(test_q)
    print(f"‚ùå Sem RAG: {no_rag[:150]}...")
    
    # Resposta com RAG
    with_rag = query_with_rag(test_q, sample_documents)
    print(f"‚úÖ Com RAG: {with_rag['answer'][:150]}...")
    print(f"üìö Fontes: {', '.join(with_rag['sources'])}")
    print("-" * 40)

print("\nüí° Experimente criar suas pr√≥prias perguntas modificando a lista 'test_questions'!")

## Conclus√£o e Pr√≥ximos Passos

Neste laborat√≥rio exploramos o conceito e implementa√ß√£o de RAG (Retrieval-Augmented Generation), demonstrando como:

### ‚úÖ O que aprendemos:
1. **Diferen√ßa fundamental**: Como RAG melhora significativamente a qualidade das respostas
2. **Embedding Generation**: Convers√£o de texto em representa√ß√µes vetoriais
3. **Busca Sem√¢ntica**: Encontrar documentos relevantes usando similaridade de embeddings
4. **Augmented Generation**: Combinar contexto recuperado com gera√ß√£o de texto
5. **Implementa√ß√£o pr√°tica**: C√≥digo funcional para sistema RAG completo

### üöÄ Benef√≠cios do RAG demonstrados:
- **Conhecimento atualizado**: Acesso a informa√ß√µes espec√≠ficas e recentes
- **Redu√ß√£o de alucina√ß√µes**: Respostas baseadas em fontes confi√°veis  
- **Rastreabilidade**: Capacidade de identificar fontes das informa√ß√µes
- **Especializa√ß√£o**: Respostas mais precisas sobre t√≥picos espec√≠ficos
- **Flexibilidade**: F√°cil atualiza√ß√£o da base de conhecimento

### üîß Para implementa√ß√£o em produ√ß√£o:
1. **Configure Azure AI Search** com √≠ndices vetoriais otimizados
2. **Implemente chunking** para documentos grandes (512-1024 tokens)
3. **Use busca h√≠brida** (keyword + sem√¢ntica) para melhor recall
4. **Adicione re-ranking** para melhorar a relev√¢ncia dos resultados
5. **Monitore performance** e ajuste par√¢metros (top_k, temperature, etc.)
6. **Implemente cache** para consultas frequentes
7. **Configure governan√ßa** para valida√ß√£o de fontes

### üìö Recursos adicionais:
- [Azure AI Search Vector Search](https://learn.microsoft.com/en-us/azure/search/vector-search-overview)
- [Azure OpenAI RAG Patterns](https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/use-your-data)
- [Azure AI Foundry Documentation](https://learn.microsoft.com/en-us/azure/ai-foundry/)
- [RAG Best Practices](https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/advanced-usage)