#Fundamentos de LLM Engineering & Gestão de Contexto
Este notebook faz parte dos meus estudos avançados em LLM Engineering, RAG & AI Agents. O objetivo principal é demonstrar a implementação técnica de chamadas de API estruturadas, utilizando as melhores práticas de mercado para garantir segurança, escalabilidade e controle comportamental de modelos de linguagem de larga escala (LLMs).

##Destaques Técnicos
Integração com Gemini 2.5 Flash: Implementação utilizando o SDK v1.0+ (google-genai), focando em alta performance e baixa latência para aplicações industriais.

Arquitetura de Prompt com System Instructions: Uso de instruções de sistema nativas para modularizar personalidades da IA, garantindo consistência no tom de voz e redução de alucinações.

Segurança de Dados: Gestão de credenciais sensíveis através de variáveis de ambiente com python-dotenv, seguindo padrões de segurança para ambientes produtivos.

Contextualização Setorial: Configuração de personas voltadas para a análise de licitações técnicas e engenharia, conectando a IA com desafios reais do setor produtivo brasileiro.

In [33]:
import os
from google.genai import Client, types
from dotenv import load_dotenv

In [13]:
load_dotenv()

True

In [22]:
# Inicializa o cliente novo
# Garanta que o cliente saiba que é para usar o backend do AI Studio
client = Client(api_key=os.environ.get("GOOGLE_API_KEY"), http_options={'api_version': 'v1beta'})



In [17]:
#Definindo uma mensagem que queremos enviar para o usuario
my_message = "Escreva um Poema para minha mae Helena parabenizando a pelos seus 62 anos!"
print(f"mandando mensagem para OpenAI: {my_message}")

mandando mensagem para OpenAI: Escreva um Poema para minha mae Helena parabenizando a pelos seus 62 anos!


In [26]:

response = client.models.generate_content(
    model="models/gemini-2.5-flash", 
    contents=my_message
)

In [None]:


# Vamos imprimir a resposta
print("\nAI: \n")
print(response.text)

In [None]:
# for model in client.models.list():
#     print(model.name)

In [35]:
# dando personalidade a nossa IA fazemos isso utilizando system prompt
# sendo system prompt uma instrucao especial com o role 'system' colocando no inicio da mensagem

# Dicionário de Personalidades para Prompts
character_personalities = {
    "mentor_tecnico": (
        "Você é um Engenheiro de IA Sênior com 15 anos de experiência. "
        "Sua linguagem é técnica, precisa, mas encorajadora. Ao explicar conceitos, "
        "use analogias de engenharia e sempre forneça exemplos de código limpo."
    ),
    "analista_negocios": (
        "Você é um consultor de estratégia focado em ROI e eficiência. "
        "Sua comunicação é direta, baseada em tópicos (bullet points) e sempre "
        "focada nos resultados práticos e viabilidade econômica de uma solução de IA."
    ),
    "explicador_simples": (
        "Você é um professor especializado em simplificar temas complexos (ELI5). "
        "Evite jargões técnicos excessivos. Se precisar usar um termo técnico, "
        "explique-o antes. Use um tom amigável e didático."
    ),
    "agente_critico": (
        "Você é um revisor de código rigoroso e pessimista. Seu objetivo é "
        "encontrar falhas, vulnerabilidades de segurança e gargalos de performance "
        "em arquiteturas RAG. Seja direto e aponte os problemas sem rodeios."
    )
}
character_personalities["especialista_licitacoes"] = (
    "Você é um especialista em direito administrativo e licitações brasileiras. "
    "Sua função é analisar resumos de editais e identificar riscos jurídicos ou "
    "oportunidades para empresas de engenharia. Seja extremamente analítico."
)


# Escolhendo a personalidade 
chosen_character = 'mentor_tecnico'
system_instructions = character_personalities[chosen_character]
system_instructions

'Você é um Engenheiro de IA Sênior com 15 anos de experiência. Sua linguagem é técnica, precisa, mas encorajadora. Ao explicar conceitos, use analogias de engenharia e sempre forneça exemplos de código limpo.'

In [None]:
my_message ="Quais as melhores habilidades para um engenheiro de IA em 2026?"
response = client.models.generate_content(
    model="models/gemini-2.5-flash",
    config=types.GenerateContentConfig(
        system_instruction=system_instructions, # Aqui entra a persona
        temperature=0.7, # Adicionando controle de criatividade
        top_p=0.95,
    ),
    contents=my_message
)
print(f"--- Resposta como {chosen_character.upper()} ---\n")
print(response.text)