# Azure AI Foundry

<center><img src="../../../images/Azure-AI-Foundry_1600x900.jpg" alt="Azure AI Foundry" width="600">

## Laborat√≥rio 1

Neste laborat√≥rio iremos realizar a conex√£o com o Azure OpenAI e executar diversas tarefas: solicitar respostas da API, usar respostas baseadas em texto, analisar as respostas obtidas, realizar a convers√£o de texto em embeddings, fazer chamadas √† API enviando imagens e tamb√©m realizar chamadas a outros modelos LLM.

O primeiro passo √© a valida√ß√£o da configura√ß√£o das vari√°veis de ambiente no arquivo `.env` presente na raiz do reposit√≥rio.

Preencha os valores das vari√°veis de acordo com o solicitado.

### Exerc√≠cio 1 - Chamada √† API

Vamos realizar a importa√ß√£o das bibliotecas necess√°rias para o laborat√≥rio.

In [None]:
#%pip install -r ../../requirements.txt

In [None]:
#%pip install openai dotenv

In [None]:
import json
import os
from openai import AzureOpenAI
from dotenv import load_dotenv

load_dotenv(dotenv_path="../../../.env")

Vamos carregar as credenciais em vari√°veis para facilitar o uso no laborat√≥rio.

In [None]:
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
api_version=os.getenv("API_VERSION")
deployment_name = os.getenv("AZURE_OPENAI_DEPLOYMENT")
embedding_model = os.getenv("AZURE_OPENAI_EMBEDDING_MODEL")

Agora vamos iniciar o client com as credenciais fornecidas.

In [None]:
client = AzureOpenAI(
  azure_endpoint = azure_endpoint[0], 
  api_key=api_key[0],  
  api_version=api_version
)


Ap√≥s criarmos o cliente, vamos realizar uma chamada simples onde passaremos:

1. Uma mensagem para a role "system" definindo o papel da LLM
2. Uma pergunta inicial do usu√°rio
3. Uma resposta do assistente demonstrando como ele deve responder (exemplo)
4. Uma nova pergunta para ele responder baseado no contexto estabelecido anteriormente

In [None]:
response = client.chat.completions.create(
    model=deployment_name, 
    messages=[
        {"role": "system", "content": "Voc√™ √© um assistente √∫til."},
        {"role": "user", "content": "O Azure OpenAI suporta chaves gerenciadas pelo cliente?"},
        {"role": "assistant", "content": "Sim, chaves gerenciadas pelo cliente s√£o suportadas pelo Azure OpenAI."},
        {"role": "user", "content": "Outros servi√ßos do Azure tamb√©m suportam isso?"}
    ]
)

Agora vamos acessar diretamente a resposta da LLM.

In [None]:
print(response.choices[0].message.content)

### Exerc√≠cio 2 - Analisando a Resposta

Agora que fizemos uma chamada para o Azure OpenAI, vamos analisar o conte√∫do completo da resposta:

In [None]:
response

Agora vamos estruturar a resposta em um formato mais leg√≠vel para melhor visualiza√ß√£o dos dados:

In [None]:
response_dict = {
    "id": response.id,
    "model": response.model,
    "created": response.created,
    "usage": {
        "prompt_tokens": response.usage.prompt_tokens,
        "completion_tokens": response.usage.completion_tokens,
        "total_tokens": response.usage.total_tokens
    },
    "completion_tokens_details": {
        "accepted_prediction_tokens": response.usage.completion_tokens_details.accepted_prediction_tokens,
        "audio_tokens": response.usage.completion_tokens_details.audio_tokens,
        "reasoning_tokens": response.usage.completion_tokens_details.reasoning_tokens,
        "rejected_prediction_tokens": response.usage.completion_tokens_details.rejected_prediction_tokens
    },
    "choices": [{
        "index": choice.index,
        "message": {
            "role": choice.message.role,
            "content": choice.message.content
        },
        "finish_reason": choice.finish_reason,
        "content_filter_results": choice.content_filter_results
    } for choice in response.choices],
    "prompt_filter_results": response.prompt_filter_results
}

print(json.dumps(response_dict, indent=2, ensure_ascii=False))

A API n√£o responde apenas com o texto gerado pela LLM. Temos muito mais informa√ß√µes nessa resposta, como por exemplo:
- Se usa √°udio ou imagem
- Filtragem de conte√∫do
- Avalia√ß√£o de conte√∫do
- Contagem de tokens do prompt
- Contagem de tokens gerados na resposta
- Detalhes sobre tokens de racioc√≠nio (para modelos que suportam)
- Resultados de filtros aplicados

Essas informa√ß√µes s√£o essenciais para monitoramento, custos e controle de qualidade da aplica√ß√£o.

Ap√≥s realizar a chamada e explorar a resposta, teste voc√™ tamb√©m criando um prompt personalizado. Realize experimentos com os seguintes par√¢metros importantes:

- **max_completion_tokens**: N√∫mero m√°ximo de tokens que podem ser gerados na resposta
- **temperature**: Controla a criatividade (0.0 = mais determin√≠stico, 1.0 = mais criativo)
- **top_p**: Controla a diversidade da resposta via nucleus sampling
- **frequency_penalty**: Penaliza repeti√ß√£o de tokens baseado na frequ√™ncia
- **presence_penalty**: Penaliza repeti√ß√£o de tokens independentemente da frequ√™ncia

In [None]:
response = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": "Voc√™ √© um assistente √∫til.",
        },
        {
            "role": "user",
            "content": "Vou viajar para Paris, o que devo ver?",
        },
        {
            "role": "assistant",
            "content": "Paris, a capital da Fran√ßa, √© conhecida por sua arquitetura deslumbrante, museus de arte, marcos hist√≥ricos e atmosfera rom√¢ntica. Aqui est√£o algumas das principais atra√ß√µes para ver em Paris:\n \n 1. A Torre Eiffel: A ic√¥nica Torre Eiffel √© um dos marcos mais reconhec√≠veis do mundo e oferece vistas deslumbrantes da cidade.\n 2. O Museu do Louvre: O Louvre √© um dos maiores e mais famosos museus do mundo, abrigando uma impressionante cole√ß√£o de arte e artefatos, incluindo a Mona Lisa.\n 3. Catedral de Notre-Dame: Esta bela catedral √© um dos marcos mais famosos de Paris e √© conhecida por sua arquitetura g√≥tica e vitrais deslumbrantes.\n \n Estas s√£o apenas algumas das muitas atra√ß√µes que Paris tem a oferecer. Com tanto para ver e fazer, n√£o √© de admirar que Paris seja um dos destinos tur√≠sticos mais populares do mundo.",
        },
        {
            "role": "user",
            "content": "O que h√° de t√£o especial no #1?",
        }
    ],
    max_completion_tokens=800,
    temperature=1.0,
    top_p=1.0,
    frequency_penalty=0.0,
    presence_penalty=0.0,
    model=deployment_name
)

print(response.choices[0].message.content)

### Exerc√≠cio 3 - Embeddings

Os embeddings s√£o representa√ß√µes num√©ricas de texto que capturam o significado sem√¢ntico das palavras ou frases. No Azure OpenAI, voc√™ pode usar o modelo de embeddings para converter texto em vetores num√©ricos que podem ser usados para tarefas como busca sem√¢ntica, classifica√ß√£o e an√°lise de similaridade.

Para mais informa√ß√µes sobre como trabalhar com embeddings no Azure OpenAI, consulte a [documenta√ß√£o oficial](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/embeddings?tabs=python-new).

In [None]:
response = client.embeddings.create(
    input = "cachorro",
    model= embedding_model
)

print(response.model_dump_json(indent=2))

Aqui geramos o embedding de uma √∫nica palavra, mas podemos fazer o mesmo para trechos de texto maiores. O modelo organizar√° automaticamente o conte√∫do em vetores num√©ricos que capturam o significado sem√¢ntico.

Para armazenar embeddings podemos usar uma s√©rie de servi√ßos dispon√≠veis no Azure. Basta escolher o que mais se adequa √† sua solu√ß√£o:

- [Azure AI Search](https://learn.microsoft.com/en-us/azure/search/vector-search-overview)
- [Azure Cosmos DB for MongoDB vCore](https://learn.microsoft.com/en-us/azure/cosmos-db/mongodb/vcore/vector-search)
- [Azure SQL Database](https://learn.microsoft.com/en-us/azure/azure-sql/database/ai-artificial-intelligence-intelligent-applications?view=azuresql&preserve-view=true#vector-search)
- [Azure Cosmos DB for NoSQL](https://learn.microsoft.com/en-us/azure/cosmos-db/vector-search)
- [Azure Cosmos DB for PostgreSQL](https://learn.microsoft.com/en-us/azure/cosmos-db/postgresql/howto-use-pgvector)
- [Azure Database for PostgreSQL - Flexible Server](https://learn.microsoft.com/en-us/azure/postgresql/flexible-server/how-to-use-pgvector)
- [Azure Cache for Redis](https://learn.microsoft.com/en-us/azure/azure-cache-for-redis/cache-tutorial-vector-similarity)
- [Use Eventhouse as a vector database - Real-Time Intelligence in Microsoft Fabric](https://learn.microsoft.com/en-us/fabric/real-time-intelligence/vector-database)

### Exerc√≠cio 4 - Processamento de Imagens

No Azure AI Foundry podemos trabalhar com modelos que processam imagens, tanto para gera√ß√£o de imagens quanto modelos multimodais nos quais podemos usar imagens como contexto. Neste exerc√≠cio vamos aprender como utilizar imagens como contexto do prompt.

**Primeiro ponto importante**: temos que pensar em como enviar uma imagem junto ao prompt. Para isso temos 2 op√ß√µes principais:
1. Enviar a imagem junto com o prompt via base64 (codificada)
2. Enviar a imagem como um link/URL

Vamos ver os 2 exemplos pr√°ticos a seguir.

Primeiro, vamos aproveitar o cliente que j√° instanciamos e enviar uma URL de uma imagem, pedindo para o modelo descrev√™-la:

In [None]:
image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/0/05/Itaim_Bibi_Business_District.jpg/250px-Itaim_Bibi_Business_District.jpg"


<center><img src="https://upload.wikimedia.org/wikipedia/commons/thumb/0/05/Itaim_Bibi_Business_District.jpg/250px-Itaim_Bibi_Business_District.jpg" alt="Azure AI Foundry" width="600">

In [None]:
response = client.chat.completions.create(
    model=deployment_name,
    messages=[
        { "role": "system", "content": "Voc√™ √© um assistente √∫til." },
        { "role": "user", "content": [  
            { 
                "type": "text", 
                "text": "Descreva essa imagem:" 
            },
            { 
                "type": "image_url",
                "image_url": {
                    "url": image_url
                }
            }
        ] } 
    ],
    max_tokens=2000 
)
print(response.choices[0].message.content)

Agora vamos ler uma imagem local armazenada em nosso sistema e envi√°-la junto com a mensagem:

In [None]:
import base64
from mimetypes import guess_type

In [None]:
def local_image_to_data_url(image_path):
    # Guess the MIME type of the image based on the file extension
    mime_type, _ = guess_type(image_path)
    if mime_type is None:
        mime_type = 'application/octet-stream'  # Default MIME type if none is found

    # Read and encode the image file
    with open(image_path, "rb") as image_file:
        base64_encoded_data = base64.b64encode(image_file.read()).decode('utf-8')

    # Construct the data URL
    return f"data:{mime_type};base64,{base64_encoded_data}"

In [None]:
image_path = "../../../samples/234039841.jpg"
data_url = local_image_to_data_url(image_path)
print("Data URL:", data_url)

In [None]:
response = client.chat.completions.create(
    model=deployment_name,
    messages=[
        { "role": "system", "content": "Voc√™ √© um assistente √∫til." },
        { "role": "user", "content": [  
            { 
                "type": "text", 
                "text": "Descreva essa imagem:" 
            },
            { 
                "type": "image_url",
                "image_url": {
                    "url": data_url
                }
            }
        ] } 
    ],
    max_tokens=2000 
)
print(response.choices[0].message.content)

Utilizando o Azure OpenAI temos acesso a diversos tipos de funcionalidades al√©m das que exploramos aqui. Recomendo navegar e explorar as op√ß√µes dispon√≠veis para entender qual √© a melhor abordagem para sua aplica√ß√£o espec√≠fica:

- [Responses API](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/responses)
- [Reasoning Models](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/reasoning)
- [Chat completions API](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/chatgpt)
- [Computer Use](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/computer-use)
- [Model router concepts](https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/model-router)
- [Function calling](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/function-calling)
- [Predicted outputs](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/predicted-outputs)
- [Prompt caching](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/prompt-caching)
- [Structured outputs](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/structured-outputs)
- [Vision-enabled chats](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/structured-outputs)
- [JSON Mode](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/json-mode)
- [Reproducible output](https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/reproducible-output)

### Exerc√≠cio 5 - Outros modelos no Azure AI Foundry

Atrav√©s do Azure AI Foundry podemos explorar uma s√©rie de modelos dispon√≠veis no [Model Catalog](https://learn.microsoft.com/en-us/azure/ai-foundry/concepts/foundry-models-overview). 

L√° temos acesso a modelos que s√£o disponibilizados pela Microsoft (OpenAI, Meta, Mistral AI, Deepseek, xAI, Black Forest Labs) bem como modelos disponibilizados por parceiros e pela comunidade (Nixtla, AI21, NTT Data, Core42, NVIDIA NIM Microservices, Stability AI). 

Atrav√©s da documenta√ß√£o fornecida √© poss√≠vel entender a diferen√ßa entre os diferentes modos de disponibiliza√ß√£o dos modelos e como escolher de acordo com seu cen√°rio espec√≠fico.



Agora vamos seguir com um exemplo pr√°tico de como chamar um modelo disponibilizado pelo Azure AI Foundry atrav√©s de uma chamada de chat completion usando uma biblioteca diferente da anterior:

In [None]:
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage

In [None]:
%pip install azure-ai-inference azure-core

In [None]:
endpoint = os.getenv("AZURE_PHI4_ENDPOINT")
api_key = os.getenv("AZURE_PHI4_API_KEY")
model_name = os.getenv("AZURE_PHI4_DEPLOYMENT")


In [None]:
clientPhi = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(api_key),
    api_version="2024-05-01-preview"
)

In [None]:
response = clientPhi.complete(
    messages=[
        SystemMessage(content="Voc√™ √© um assistente √∫til."),
        UserMessage(content="Vou viajar para Paris, o que devo ver?"),
    ],
    max_tokens=2048,
    temperature=0.8,
    top_p=0.1,
    presence_penalty=0.0,
    frequency_penalty=0.0,
    model=model_name
)

print(response.choices[0].message.content)

## üéØ Atividades Pr√°ticas 

Agora que voc√™ explorou os conceitos b√°sicos do Azure AI Foundry, vamos praticar com algumas atividades simples e direcionadas para consolidar o aprendizado!

### üìù Atividade 1: Teste de Temperatura
**Objetivo**: Entender como a temperatura afeta a criatividade das respostas.

Execute o c√≥digo abaixo e observe como o mesmo prompt gera respostas diferentes com temperaturas variadas:

In [None]:
prompt = "Escreva um slogan criativo para uma empresa de tecnologia."

# Testando diferentes temperaturas
temperaturas = [0.1, 0.5, 1.0]

for temp in temperaturas:
    print(f"\nüå°Ô∏è TEMPERATURA: {temp}")
    print("-" * 40)
    
    response = client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": "Voc√™ √© um assistente criativo de marketing."},
            {"role": "user", "content": prompt}
        ],
        temperature=temp,
        max_completion_tokens=100
    )
    
    print(response.choices[0].message.content)
    print(f"Tokens usados: {response.usage.total_tokens}")

### üîç Atividade 2: Compara√ß√£o de Embeddings
**Objetivo**: Comparar como palavras similares t√™m embeddings pr√≥ximos.

Vamos gerar embeddings para palavras relacionadas e ver seus tamanhos:

In [None]:
%pip install numpy

In [None]:
import numpy as np

# Palavras para comparar
palavras = ["gato", "felino", "cachorro", "c√£o", "autom√≥vel", "carro"]

embeddings_dict = {}

print("Gerando embeddings para as palavras...")
for palavra in palavras:
    response = client.embeddings.create(
        input=palavra,
        model=embedding_model
    )
    embedding = response.data[0].embedding
    embeddings_dict[palavra] = embedding
    print(f"‚úÖ {palavra}: {len(embedding)} dimens√µes")

print(f"\nPrimeiros 5 valores do embedding da palavra 'gato':")
print(embeddings_dict["gato"][:5])

In [None]:
# Fun√ß√£o para calcular similaridade de cosseno
def calcular_similaridade(vec1, vec2):
    return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))

# Comparando similaridades
print("üîç Comparando similaridades:")
print("-" * 50)

# Gato vs Felino
sim_gato_felino = calcular_similaridade(embeddings_dict["gato"], embeddings_dict["felino"])
print(f"Gato ‚Üî Felino: {sim_gato_felino:.3f}")

# Cachorro vs C√£o
sim_cachorro_cao = calcular_similaridade(embeddings_dict["cachorro"], embeddings_dict["c√£o"])
print(f"Cachorro ‚Üî C√£o: {sim_cachorro_cao:.3f}")

# Autom√≥vel vs Carro
sim_auto_carro = calcular_similaridade(embeddings_dict["autom√≥vel"], embeddings_dict["carro"])
print(f"Autom√≥vel ‚Üî Carro: {sim_auto_carro:.3f}")

# Gato vs Carro (deve ser baixa)
sim_gato_carro = calcular_similaridade(embeddings_dict["gato"], embeddings_dict["carro"])
print(f"Gato ‚Üî Carro: {sim_gato_carro:.3f}")

print(f"\nüí° Palavras similares t√™m similaridade mais alta (pr√≥xima de 1.0)!")

### üñºÔ∏è Atividade 3: An√°lise de Imagem com Diferentes Prompts
**Objetivo**: Testar como diferentes prompts afetam a an√°lise da mesma imagem.

Vamos usar diferentes tipos de perguntas para a mesma imagem:

In [None]:
# Usando a mesma imagem com diferentes prompts
image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/0/05/Itaim_Bibi_Business_District.jpg/250px-Itaim_Bibi_Business_District.jpg"

# Diferentes tipos de an√°lise
prompts = [
    "Descreva esta imagem em uma frase:",
    "Que tipo de local √© este?",
    "Quais cores predominam nesta imagem?",
    "Esta imagem transmite que sensa√ß√£o?",
    "Conte os pr√©dios que voc√™ consegue ver:"
]

for i, prompt_text in enumerate(prompts, 1):
    print(f"\nüîç PERGUNTA {i}: {prompt_text}")
    print("-" * 60)
    
    response = client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": "Voc√™ √© um assistente especializado em an√°lise de imagens."},
            {"role": "user", "content": [
                {"type": "text", "text": prompt_text},
                {"type": "image_url", "image_url": {"url": image_url}}
            ]}
        ],
        max_tokens=150
    )
    
    print(response.choices[0].message.content)

### üî¢ Atividade 4: Contador de Tokens
**Objetivo**: Entender como o tamanho do prompt afeta o consumo de tokens.

Vamos testar prompts de diferentes tamanhos e ver o impacto nos tokens:

In [None]:
# Prompts de diferentes tamanhos
prompts_teste = [
    "Ol√°",
    "Explique o que √© intelig√™ncia artificial",
    "Explique detalhadamente o que √© intelig√™ncia artificial, como funciona, suas aplica√ß√µes pr√°ticas, benef√≠cios e desafios para a sociedade moderna"
]

print("üìä AN√ÅLISE DE CONSUMO DE TOKENS")
print("=" * 50)

for i, prompt in enumerate(prompts_teste, 1):
    response = client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": "Voc√™ √© um assistente √∫til."},
            {"role": "user", "content": prompt}
        ],
        max_completion_tokens=100  # Limitando resposta para focar no prompt
    )
    
    print(f"\nüîç TESTE {i}:")
    print(f"Prompt: '{prompt[:50]}{'...' if len(prompt) > 50 else ''}'")
    print(f"Tokens do prompt: {response.usage.prompt_tokens}")
    print(f"Tokens da resposta: {response.usage.completion_tokens}")
    print(f"Total de tokens: {response.usage.total_tokens}")
    print(f"Resposta: {response.choices[0].message.content[:100]}...")

print("\nüí° Prompts maiores consomem mais tokens de entrada!")

### üé≠ Atividade 5: Teste de Personas
**Objetivo**: Ver como diferentes personas (system messages) afetam as respostas.

Vamos fazer a mesma pergunta para diferentes "personalidades" do assistente:

In [None]:
# Diferentes personas para testar
personas = [
    {"nome": "Professor", "system": "Voc√™ √© um professor universit√°rio que explica conceitos de forma did√°tica e detalhada."},
    {"nome": "Amigo", "system": "Voc√™ √© um amigo pr√≥ximo que conversa de forma casual e descontra√≠da."},
    {"nome": "Especialista", "system": "Voc√™ √© um especialista t√©cnico que d√° respostas precisas e diretas."},
    {"nome": "Poeta", "system": "Voc√™ √© um poeta que responde sempre de forma criativa e art√≠stica."}
]

pergunta = "O que voc√™ pensa sobre o futuro da tecnologia?"

print("üé≠ TESTANDO DIFERENTES PERSONAS")
print("=" * 50)

for persona in personas:
    print(f"\nüë§ PERSONA: {persona['nome']}")
    print("-" * 30)
    
    response = client.chat.completions.create(
        model=deployment_name,
        messages=[
            {"role": "system", "content": persona["system"]},
            {"role": "user", "content": pergunta}
        ],
        max_completion_tokens=200,
        temperature=0.7
    )
    
    print(response.choices[0].message.content)

print("\nüí° O system message define completamente o 'jeito' do assistente!")