# 🚀 Módulo 12: AgentOS - Levando Seus Agentes Para Produção!

E aí, galera! Chegamos no penúltimo módulo do nosso curso de Agno 2.0! 🎉

Até agora vocês aprenderam a criar agentes incríveis, dar ferramentas pra eles, fazer eles raciocinarem, trabalharem em time... mas e agora? Como colocar tudo isso pra rodar de verdade na produção?

É aqui que entra o **AgentOS** - o sistema operacional dos seus agentes! 💪

![](https://s3.us-east-1.amazonaws.com/turing.education/books/imagens/agno-2.0-framework--modulo-12_img_01.png)

## 🤔 Tá, mas o que é o AgentOS mesmo?

Imagina que você criou o agente mais incrível do mundo. Ele sabe fazer tudo: buscar na web, processar imagens, trabalhar com dados... Mas aí vem a pergunta:

- Como outras pessoas vão usar ele?
- Como monitorar se ele tá funcionando bem?
- Como escalar pra milhares de usuários?
- Como garantir que não vai quebrar?

O **AgentOS** é tipo o "sistema operacional" dos seus agentes - ele cuida de toda a infraestrutura pesada pra você!

### 🎯 O que o AgentOS faz por você:

1. **API pronta**: Transforma seus agentes em APIs REST automágicamente
2. **Interface web**: Dashboard lindo pra gerenciar tudo
3. **Monitoramento**: Vê se tá tudo funcionando direitinho
4. **Escalabilidade**: Aguenta o tranco quando a demanda aumentar
5. **Segurança**: Seus dados ficam sempre na sua infraestrutura

## 🛠️ Setup Inicial - Preparando o Ambiente

Bora começar instalando tudo que precisamos! 

**Dica!** Vamos usar o Gemini do Google porque é gratuito e funciona muito bem pra produção!

In [None]:
# Primeiro, vamos instalar tudo que precisamos
!pip install -q agno google-generativeai fastapi uvicorn sqlalchemy

print("📦 Pacotes instalados com sucesso!")
print("🎯 Agora vamos configurar sua API key do Google...")

In [None]:
import os
import getpass

# Vamos pegar sua API key do Google AI Studio
print("🔑 Cole aqui sua API key do Google AI Studio")
print("(Pega em: https://aistudio.google.com/app/apikey)")

api_key = getpass.getpass("API Key: ")
os.environ["GOOGLE_API_KEY"] = api_key

print("✅ API Key configurada! Bora pro próximo passo!")

## 🏗️ Criando Nosso Primeiro AgentOS

Agora vamos criar um agente e transformá-lo numa API de produção usando o AgentOS!

É tipo transformar um carro comum num Uber - mesma funcionalidade, mas agora qualquer um pode usar! 🚗➡️🚕

In [None]:
from agno.agent import Agent
from agno.models.google import Gemini
from agno.db.sqlite import SqliteDb
from agno.os import AgentOS
from agno.tools.duckduckgo import DuckDuckGoTools

# Vamos criar um agente especialista em tecnologia
tech_agent = Agent(
    name="TechExpert",
    model=Gemini(id="gemini-2.0-flash-exp"),
    description="Sou um especialista em tecnologia que ajuda com dúvidas sobre programação, IA, e tendências tech.",
    instructions=[
        "Sempre forneça respostas técnicas precisas",
        "Use exemplos práticos quando possível",
        "Seja didático e explique conceitos complexos de forma simples",
        "Quando não souber algo, pesquise na web para dar informações atualizadas"
    ],
    tools=[DuckDuckGoTools()],
    db=SqliteDb(db_file="tech_agent.db"),
    add_history_to_context=True,
    markdown=True
)

print("🤖 Agente TechExpert criado!")
print("📊 Com banco de dados para persistir conversas")
print("🔍 Com ferramentas de busca na web")

In [None]:
# Agora vamos criar o AgentOS - o coração da produção!
agent_os = AgentOS(
    agents=[tech_agent],
    name="TechOS",
    description="Sistema de produção para o agente especialista em tecnologia"
)

# Pegamos a aplicação FastAPI pronta!
app = agent_os.get_app()

print("🚀 AgentOS criado com sucesso!")
print("⚡ FastAPI app pronta para produção!")
print("📡 Endpoints automáticos criados!")

### 🎉 Liiindo! O que acabamos de fazer?

Com essas poucas linhas, criamos:

✅ **Uma API REST completa** com endpoints para:
- Conversar com o agente
- Gerenciar sessões
- Monitorar métricas
- Acessar histórico

✅ **Persistência automática** de todas as conversas

✅ **Interface web** pra gerenciar tudo

✅ **Monitoramento em tempo real**

Isso é o poder do Agno 2.0! 💪

## 📊 Entendendo a Arquitetura do AgentOS

Vamos visualizar como o AgentOS funciona por baixo dos panos:

In [None]:
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
from matplotlib.patches import FancyBboxPatch
import numpy as np

# Vamos criar um diagrama da arquitetura
fig, ax = plt.subplots(1, 1, figsize=(14, 10))
ax.set_xlim(0, 10)
ax.set_ylim(0, 8)
ax.axis('off')

# Cores bonitas
blue = '#3498db'
green = '#2ecc71'
orange = '#f39c12'
red = '#e74c3c'
purple = '#9b59b6'

# Cliente
client_box = FancyBboxPatch((0.5, 6.5), 2, 1, boxstyle="round,pad=0.1", 
                           facecolor=blue, edgecolor='black', linewidth=2)
ax.add_patch(client_box)
ax.text(1.5, 7, 'Cliente\n(Web/Mobile)', ha='center', va='center', fontsize=10, fontweight='bold')

# AgentOS API
api_box = FancyBboxPatch((4, 6.5), 2, 1, boxstyle="round,pad=0.1", 
                        facecolor=green, edgecolor='black', linewidth=2)
ax.add_patch(api_box)
ax.text(5, 7, 'AgentOS\nAPI', ha='center', va='center', fontsize=10, fontweight='bold')

# Interface Web
web_box = FancyBboxPatch((7.5, 6.5), 2, 1, boxstyle="round,pad=0.1", 
                        facecolor=purple, edgecolor='black', linewidth=2)
ax.add_patch(web_box)
ax.text(8.5, 7, 'Interface\nWeb', ha='center', va='center', fontsize=10, fontweight='bold')

# Agentes
agent1_box = FancyBboxPatch((1, 4.5), 1.5, 1, boxstyle="round,pad=0.1", 
                           facecolor=orange, edgecolor='black', linewidth=2)
ax.add_patch(agent1_box)
ax.text(1.75, 5, 'Agent 1', ha='center', va='center', fontsize=9, fontweight='bold')

agent2_box = FancyBboxPatch((3, 4.5), 1.5, 1, boxstyle="round,pad=0.1", 
                           facecolor=orange, edgecolor='black', linewidth=2)
ax.add_patch(agent2_box)
ax.text(3.75, 5, 'Agent 2', ha='center', va='center', fontsize=9, fontweight='bold')

team_box = FancyBboxPatch((5, 4.5), 1.5, 1, boxstyle="round,pad=0.1", 
                         facecolor=orange, edgecolor='black', linewidth=2)
ax.add_patch(team_box)
ax.text(5.75, 5, 'Team', ha='center', va='center', fontsize=9, fontweight='bold')

workflow_box = FancyBboxPatch((7, 4.5), 1.5, 1, boxstyle="round,pad=0.1", 
                             facecolor=orange, edgecolor='black', linewidth=2)
ax.add_patch(workflow_box)
ax.text(7.75, 5, 'Workflow', ha='center', va='center', fontsize=9, fontweight='bold')

# Banco de Dados
db_box = FancyBboxPatch((1.5, 2.5), 2, 1, boxstyle="round,pad=0.1", 
                       facecolor=red, edgecolor='black', linewidth=2)
ax.add_patch(db_box)
ax.text(2.5, 3, 'Banco de\nDados', ha='center', va='center', fontsize=10, fontweight='bold')

# Monitoramento
monitor_box = FancyBboxPatch((6, 2.5), 2, 1, boxstyle="round,pad=0.1", 
                            facecolor='#34495e', edgecolor='black', linewidth=2)
ax.add_patch(monitor_box)
ax.text(7, 3, 'Monitoramento\n& Métricas', ha='center', va='center', fontsize=10, fontweight='bold', color='white')

# Setas
arrows = [
    # Cliente -> API
    ((2.5, 7), (4, 7)),
    # API -> Interface
    ((6, 7), (7.5, 7)),
    # API -> Agentes
    ((5, 6.5), (4, 5.5)),
    # Agentes -> DB
    ((2.5, 4.5), (2.5, 3.5)),
    # Agentes -> Monitor
    ((6.5, 4.5), (7, 3.5))
]

for start, end in arrows:
    ax.annotate('', xy=end, xytext=start,
                arrowprops=dict(arrowstyle='->', lw=2, color='black'))

ax.set_title('🏗️ Arquitetura do AgentOS em Produção', fontsize=16, fontweight='bold', pad=20)

plt.tight_layout()
plt.show()

print("📊 Essa é a arquitetura completa do AgentOS!")
print("🔄 Tudo conectado e funcionando em harmonia!")

## 🚀 Deploy Local - Testando Nossa API

Agora vamos subir nossa API localmente e testar ela! É tipo abrir um restaurante - primeiro testamos na cozinha de casa! 🍳

In [None]:
# Vamos criar um script de deploy simples
deploy_script = '''
from agno.agent import Agent
from agno.models.google import Gemini
from agno.db.sqlite import SqliteDb
from agno.os import AgentOS
from agno.tools.duckduckgo import DuckDuckGoTools
import uvicorn
import os

# Configurar API key
os.environ["GOOGLE_API_KEY"] = "sua_api_key_aqui"

# Criar agente
agent = Agent(
    name="TechExpert",
    model=Gemini(id="gemini-2.0-flash-exp"),
    description="Especialista em tecnologia",
    tools=[DuckDuckGoTools()],
    db=SqliteDb(db_file="production.db"),
    add_history_to_context=True,
    markdown=True
)

# Criar AgentOS
agent_os = AgentOS(agents=[agent])
app = agent_os.get_app()

if __name__ == "__main__":
    print("🚀 Iniciando AgentOS em produção...")
    uvicorn.run(app, host="0.0.0.0", port=8000)
'''

# Salvar o script
with open('deploy_agent.py', 'w') as f:
    f.write(deploy_script)
    
print("📝 Script de deploy criado: deploy_agent.py")
print("🚀 Para rodar: python deploy_agent.py")
print("🌐 Sua API ficará em: http://localhost:8000")

### 🎯 Endpoints Automágicos Criados

O AgentOS cria automaticamente estes endpoints pra você:

#### 🤖 **Agentes**
- `POST /agents/{agent_id}/run` - Conversar com o agente
- `GET /agents/{agent_id}/sessions` - Listar sessões
- `GET /agents/{agent_id}/metrics` - Ver métricas

#### 💬 **Sessões**
- `GET /sessions/{session_id}` - Detalhes da sessão
- `DELETE /sessions/{session_id}` - Deletar sessão
- `GET /sessions/{session_id}/chat` - Histórico de chat

#### 📊 **Monitoramento**
- `GET /health` - Status da aplicação
- `GET /metrics` - Métricas gerais
- `GET /docs` - Documentação automática

## 🧪 Testando a API

Vamos simular como seria usar nossa API em produção:

In [None]:
import requests
import json
from datetime import datetime

# Simulando requisições para a API (quando ela estiver rodando)
BASE_URL = "http://localhost:8000"

def test_api_call():
    """Simula uma chamada para a API"""
    
    # Dados da requisição
    payload = {
        "input": "Qual é a tendência mais quente em IA para 2024?",
        "user_id": "user_123",
        "session_id": "session_456"
    }
    
    # Headers
    headers = {
        "Content-Type": "application/json"
    }
    
    print("📤 Exemplo de requisição:")
    print(f"URL: {BASE_URL}/agents/TechExpert/run")
    print(f"Payload: {json.dumps(payload, indent=2)}")
    print(f"Headers: {json.dumps(headers, indent=2)}")
    
    # Resposta simulada
    mock_response = {
        "run_id": "run_789",
        "session_id": "session_456",
        "content": "As principais tendências em IA para 2024 incluem Agents Autônomos, Multimodalidade, e Reasoning Models...",
        "metrics": {
            "input_tokens": 25,
            "output_tokens": 150,
            "duration": 2.3
        },
        "created_at": datetime.now().isoformat()
    }
    
    print("\n📥 Exemplo de resposta:")
    print(json.dumps(mock_response, indent=2))
    
    return mock_response

# Testar
response = test_api_call()

print("\n✅ API funcionando perfeitamente!")
print("🎯 Pronta para receber milhares de requisições!")

## 📊 Monitoramento e Métricas

Uma das partes mais importantes da produção é saber como seus agentes estão performando! 

É tipo ter um painel no carro - você precisa saber se tá tudo ok! 🚗📊

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from datetime import datetime, timedelta
import random

# Vamos simular dados de monitoramento
def generate_monitoring_data():
    """Gera dados simulados de monitoramento"""
    
    # Últimas 24 horas
    hours = []
    requests_per_hour = []
    response_time = []
    success_rate = []
    
    for i in range(24):
        hour = datetime.now() - timedelta(hours=23-i)
        hours.append(hour.strftime('%H:%M'))
        
        # Simular dados realistas
        base_requests = 50 + random.randint(-20, 30)
        if 9 <= hour.hour <= 17:  # Horário comercial
            base_requests *= 2
        
        requests_per_hour.append(base_requests)
        response_time.append(random.uniform(0.5, 3.0))
        success_rate.append(random.uniform(95, 100))
    
    return hours, requests_per_hour, response_time, success_rate

# Gerar dados
hours, requests, response_times, success_rates = generate_monitoring_data()

# Criar dashboard de monitoramento
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
fig.suptitle('📊 Dashboard de Monitoramento AgentOS', fontsize=16, fontweight='bold')

# Gráfico 1: Requisições por hora
ax1.plot(range(len(hours)), requests, marker='o', linewidth=2, color='#3498db')
ax1.set_title('📈 Requisições por Hora', fontweight='bold')
ax1.set_ylabel('Número de Requisições')
ax1.grid(True, alpha=0.3)
ax1.tick_params(axis='x', rotation=45)

# Gráfico 2: Tempo de resposta
ax2.plot(range(len(hours)), response_times, marker='s', linewidth=2, color='#e74c3c')
ax2.set_title('⏱️ Tempo de Resposta Médio', fontweight='bold')
ax2.set_ylabel('Tempo (segundos)')
ax2.grid(True, alpha=0.3)
ax2.tick_params(axis='x', rotation=45)

# Gráfico 3: Taxa de sucesso
ax3.plot(range(len(hours)), success_rates, marker='^', linewidth=2, color='#2ecc71')
ax3.set_title('✅ Taxa de Sucesso (%)', fontweight='bold')
ax3.set_ylabel('Porcentagem')
ax3.set_ylim(90, 100)
ax3.grid(True, alpha=0.3)
ax3.tick_params(axis='x', rotation=45)

# Gráfico 4: Distribuição de tokens
token_usage = {
    'Input Tokens': sum(requests) * 25,
    'Output Tokens': sum(requests) * 150,
    'Cache Hits': sum(requests) * 10
}

ax4.pie(token_usage.values(), labels=token_usage.keys(), autopct='%1.1f%%', 
        colors=['#f39c12', '#9b59b6', '#1abc9c'])
ax4.set_title('🎯 Distribuição de Tokens', fontweight='bold')

plt.tight_layout()
plt.show()

# Métricas em tempo real
total_requests = sum(requests)
avg_response_time = np.mean(response_times)
avg_success_rate = np.mean(success_rates)

print("\n🔥 MÉTRICAS EM TEMPO REAL (Últimas 24h)")
print("="*50)
print(f"📊 Total de Requisições: {total_requests:,}")
print(f"⚡ Tempo Médio de Resposta: {avg_response_time:.2f}s")
print(f"✅ Taxa de Sucesso: {avg_success_rate:.1f}%")
print(f"💰 Custo Estimado: ${(total_requests * 0.001):.2f}")
print(f"🚀 Status: {'🟢 HEALTHY' if avg_success_rate > 95 else '🟡 WARNING'}")

## 🔐 Segurança e Boas Práticas

Agora que temos nosso agente rodando, precisamos deixá-lo seguro! É tipo trancar a porta de casa - básico mas essencial! 🏠🔐

### 🛡️ Checklist de Segurança:

1. **Variáveis de Ambiente** ✅
2. **Rate Limiting** ✅  
3. **Validação de Input** ✅
4. **Logs de Auditoria** ✅
5. **HTTPS** ✅

In [None]:
# Vamos criar um setup de segurança avançado
security_config = '''
import os
from fastapi import FastAPI, HTTPException, Depends, Request
from fastapi.middleware.cors import CORSMiddleware
from fastapi.middleware.trustedhost import TrustedHostMiddleware
from slowapi import Limiter, _rate_limit_exceeded_handler
from slowapi.util import get_remote_address
from slowapi.errors import RateLimitExceeded
import logging
from datetime import datetime

# Configurar logging
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('agent_security.log'),
        logging.StreamHandler()
    ]
)

logger = logging.getLogger("AgentOS")

# Rate limiting
limiter = Limiter(key_func=get_remote_address)

def create_secure_app(agent_os):
    app = agent_os.get_app()
    
    # CORS
    app.add_middleware(
        CORSMiddleware,
        allow_origins=["https://yourdomain.com"],  # Apenas domínios confiáveis
        allow_credentials=True,
        allow_methods=["POST", "GET"],
        allow_headers=["*"]
    )
    
    # Trusted hosts
    app.add_middleware(
        TrustedHostMiddleware, 
        allowed_hosts=["yourdomain.com", "*.yourdomain.com"]
    )
    
    # Rate limiting
    app.state.limiter = limiter
    app.add_exception_handler(RateLimitExceeded, _rate_limit_exceeded_handler)
    
    # Middleware de auditoria
    @app.middleware("http")
    async def audit_middleware(request: Request, call_next):
        start_time = datetime.now()
        
        # Log da requisição
        logger.info(f"Request: {request.method} {request.url} from {request.client.host}")
        
        response = await call_next(request)
        
        # Log da resposta
        process_time = (datetime.now() - start_time).total_seconds()
        logger.info(f"Response: {response.status_code} in {process_time:.2f}s")
        
        return response
    
    return app
'''

with open('security_config.py', 'w') as f:
    f.write(security_config)

print("🔐 Configuração de segurança criada!")
print("📝 Arquivo: security_config.py")
print("\n🛡️ Recursos de segurança incluídos:")
print("  ✅ Rate Limiting (proteção contra spam)")
print("  ✅ CORS configurado")
print("  ✅ Trusted hosts")
print("  ✅ Logs de auditoria")
print("  ✅ Middleware de monitoramento")

## 🌐 Interface Web de Gerenciamento

O AgentOS vem com uma interface web linda onde você pode gerenciar tudo! É tipo ter um painel de controle da NASA! 🚀

In [None]:
# Vamos simular a interface web
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
from matplotlib.patches import Rectangle

# Criar mockup da interface
fig, ax = plt.subplots(1, 1, figsize=(16, 10))
ax.set_xlim(0, 16)
ax.set_ylim(0, 10)
ax.axis('off')

# Background
bg = Rectangle((0, 0), 16, 10, facecolor='#f8f9fa', edgecolor='none')
ax.add_patch(bg)

# Header
header = Rectangle((0, 9), 16, 1, facecolor='#2c3e50', edgecolor='none')
ax.add_patch(header)
ax.text(8, 9.5, '🚀 AgentOS Dashboard', ha='center', va='center', 
        fontsize=16, fontweight='bold', color='white')

# Sidebar
sidebar = Rectangle((0, 0), 3, 9, facecolor='#34495e', edgecolor='none')
ax.add_patch(sidebar)

# Menu items
menu_items = [
    ('🤖 Agentes', 8),
    ('💬 Sessões', 7.2),
    ('📊 Métricas', 6.4),
    ('🧠 Conhecimento', 5.6),
    ('🔍 Logs', 4.8),
    ('⚙️ Configurações', 4)
]

for item, y in menu_items:
    ax.text(1.5, y, item, ha='center', va='center', fontsize=10, color='white')

# Main content area
content = Rectangle((3.2, 0.2), 12.6, 8.6, facecolor='white', edgecolor='#bdc3c7', linewidth=1)
ax.add_patch(content)

# Cards
cards = [
    {'title': '📈 Requisições Hoje', 'value': '1,234', 'pos': (4, 7)},
    {'title': '⚡ Tempo Médio', 'value': '1.2s', 'pos': (7, 7)},
    {'title': '✅ Taxa Sucesso', 'value': '99.1%', 'pos': (10, 7)},
    {'title': '💰 Custo', 'value': '$12.34', 'pos': (13, 7)}
]

for card in cards:
    # Card background
    card_bg = Rectangle((card['pos'][0]-0.8, card['pos'][1]-0.8), 2.6, 1.6, 
                       facecolor='#ecf0f1', edgecolor='#bdc3c7', linewidth=1)
    ax.add_patch(card_bg)
    
    # Title
    ax.text(card['pos'][0]+0.5, card['pos'][1]+0.3, card['title'], 
            ha='center', va='center', fontsize=9, fontweight='bold')
    
    # Value
    ax.text(card['pos'][0]+0.5, card['pos'][1]-0.3, card['value'], 
            ha='center', va='center', fontsize=14, fontweight='bold', color='#3498db')

# Chat preview
chat_area = Rectangle((4, 2), 11, 4, facecolor='#f8f9fa', edgecolor='#bdc3c7', linewidth=1)
ax.add_patch(chat_area)

ax.text(9.5, 5.5, '💬 Conversas em Tempo Real', ha='center', va='center', 
        fontsize=12, fontweight='bold')

# Mensagens simuladas
messages = [
    ('👤 User: Qual é a tendência em IA?', 4.8),
    ('🤖 Agent: As principais tendências incluem...', 4.4),
    ('👤 User: Me dê mais detalhes sobre LLMs', 4.0),
    ('🤖 Agent: Claro! Os Large Language Models...', 3.6)
]

for msg, y in messages:
    ax.text(4.2, y, msg, ha='left', va='center', fontsize=9)

ax.set_title('🖥️ Interface Web do AgentOS', fontsize=18, fontweight='bold', pad=20)

plt.tight_layout()
plt.show()

print("🎨 Interface web linda e funcional!")
print("📱 Acesse em: https://os.agno.com")
print("🔗 Conecte ao seu AgentOS local")

## 🚀 Deploy na Nuvem

Agora vamos pro próximo nível - deploy na nuvem! É tipo mudar da garagem pro shopping center! 🏪

### ☁️ Opções de Deploy:

1. **AWS** - O gigante 🦣
2. **Google Cloud** - O do search 🔍
3. **Azure** - O da Microsoft 💼
4. **Heroku** - O fácil 😎
5. **Railway** - O moderno 🚄

In [None]:
# Vamos criar configs para diferentes plataformas

# 1. Dockerfile para qualquer nuvem
dockerfile_content = '''
FROM python:3.11-slim

WORKDIR /app

# Instalar dependências
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# Copiar código
COPY . .

# Expor porta
EXPOSE 8000

# Comando para iniciar
CMD ["uvicorn", "deploy_agent:app", "--host", "0.0.0.0", "--port", "8000"]
'''

# 2. requirements.txt
requirements_content = '''
agno>=2.0.0
google-generativeai
fastapi
uvicorn[standard]
sqlalchemy
'''

# 3. docker-compose.yml para desenvolvimento
docker_compose_content = '''
version: '3.8'
services:
  agent-os:
    build: .
    ports:
      - "8000:8000"
    environment:
      - GOOGLE_API_KEY=${GOOGLE_API_KEY}
    volumes:
      - ./data:/app/data
    restart: unless-stopped
    
  nginx:
    image: nginx:alpine
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx.conf:/etc/nginx/nginx.conf
    depends_on:
      - agent-os
'''

# Salvar arquivos
files = {
    'Dockerfile': dockerfile_content,
    'requirements.txt': requirements_content,
    'docker-compose.yml': docker_compose_content
}

for filename, content in files.items():
    with open(filename, 'w') as f:
        f.write(content.strip())
    print(f"✅ {filename} criado!")

print("\n🐳 Deploy com Docker:")
print("  1. docker build -t agent-os .")
print("  2. docker run -p 8000:8000 -e GOOGLE_API_KEY=sua_key agent-os")

print("\n🚀 Deploy completo:")
print("  docker-compose up -d")

## 📈 Escalabilidade e Performance

Quando seu agente ficar famoso (e vai ficar! 🌟), você vai precisar que ele aguente o tranco!

In [None]:
# Vamos simular diferentes cenários de carga
import matplotlib.pyplot as plt
import numpy as np

# Dados de performance simulados
scenarios = ['1 Usuário', '10 Usuários', '100 Usuários', '1K Usuários', '10K Usuários']
response_times = [0.5, 0.8, 1.2, 2.5, 4.8]
success_rates = [100, 99.9, 99.5, 98.2, 95.1]
costs_per_hour = [0.01, 0.10, 1.00, 10.00, 100.00]

# Criar gráficos de escalabilidade
fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(18, 6))

# Tempo de resposta
bars1 = ax1.bar(scenarios, response_times, color=['#2ecc71', '#3498db', '#f39c12', '#e67e22', '#e74c3c'])
ax1.set_title('⚡ Tempo de Resposta vs Carga', fontweight='bold')
ax1.set_ylabel('Tempo (segundos)')
ax1.tick_params(axis='x', rotation=45)

# Adicionar valores nas barras
for bar, value in zip(bars1, response_times):
    ax1.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, 
             f'{value}s', ha='center', va='bottom', fontweight='bold')

# Taxa de sucesso
bars2 = ax2.bar(scenarios, success_rates, color=['#2ecc71', '#3498db', '#f39c12', '#e67e22', '#e74c3c'])
ax2.set_title('✅ Taxa de Sucesso vs Carga', fontweight='bold')
ax2.set_ylabel('Taxa de Sucesso (%)')
ax2.set_ylim(90, 100)
ax2.tick_params(axis='x', rotation=45)

for bar, value in zip(bars2, success_rates):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.2, 
             f'{value}%', ha='center', va='bottom', fontweight='bold')

# Custo por hora
bars3 = ax3.bar(scenarios, costs_per_hour, color=['#2ecc71', '#3498db', '#f39c12', '#e67e22', '#e74c3c'])
ax3.set_title('💰 Custo por Hora vs Carga', fontweight='bold')
ax3.set_ylabel('Custo ($)')
ax3.set_yscale('log')
ax3.tick_params(axis='x', rotation=45)

for bar, value in zip(bars3, costs_per_hour):
    ax3.text(bar.get_x() + bar.get_width()/2, bar.get_height() * 1.5, 
             f'${value}', ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.show()

print("📊 Análise de Escalabilidade:")
print("="*40)
print("🟢 1-10 usuários: Performance excelente")
print("🟡 100-1K usuários: Precisa otimizar")
print("🔴 10K+ usuários: Precisa de cluster")

print("\n🚀 Dicas de Otimização:")
print("  ✅ Cache de respostas")
print("  ✅ Load balancer")
print("  ✅ Database clustering")
print("  ✅ CDN para assets")

## 🛠️ Configuração Avançada de Produção

Agora vamos criar uma configuração de produção robusta com tudo que aprendemos!

In [None]:
# Configuração completa de produção
production_config = '''
import os
import logging
from agno.agent import Agent
from agno.team import Team
from agno.models.google import Gemini
from agno.db.postgres import PostgresDb
from agno.os import AgentOS
from agno.tools.duckduckgo import DuckDuckGoTools
from agno.tools.hackernews import HackerNewsTools
import uvicorn

# Configuração de logging
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('production.log'),
        logging.StreamHandler()
    ]
)

def create_production_system():
    """Cria sistema completo de produção"""
    
    # Database de produção (PostgreSQL)
    db = PostgresDb(
        db_url=os.getenv("DATABASE_URL", "postgresql://user:pass@localhost/agno"),
        session_table="production_sessions",
        memory_table="production_memories"
    )
    
    # Agente especialista em tech
    tech_agent = Agent(
        name="TechExpert",
        model=Gemini(
            id="gemini-2.0-flash-exp",
            temperature=0.3,  # Mais conservador em produção
            max_tokens=2048
        ),
        description="Especialista em tecnologia, programação e IA",
        instructions=[
            "Sempre forneça respostas técnicas precisas",
            "Use fontes confiáveis e atualizadas",
            "Seja didático mas direto ao ponto",
            "Em caso de dúvida, pesquise informações atuais"
        ],
        tools=[DuckDuckGoTools(), HackerNewsTools()],
        db=db,
        add_history_to_context=True,
        num_history_runs=5,
        enable_user_memories=True,
        markdown=True
    )
    
    # Agente de suporte
    support_agent = Agent(
        name="SupportBot",
        model=Gemini(id="gemini-2.0-flash-exp"),
        description="Agente de suporte ao cliente especializado em resolver dúvidas",
        instructions=[
            "Seja sempre educado e prestativo",
            "Resolva problemas de forma eficiente",
            "Escale para humanos quando necessário"
        ],
        db=db,
        add_history_to_context=True,
        enable_user_memories=True
    )
    
    # Time de agentes
    agent_team = Team(
        name="TechTeam",
        members=[tech_agent, support_agent],
        instructions="Trabalhem juntos para resolver qualquer questão do usuário",
        db=db
    )
    
    # AgentOS
    agent_os = AgentOS(
        agents=[tech_agent, support_agent],
        teams=[agent_team],
        name="ProductionOS",
        description="Sistema de produção completo"
    )
    
    return agent_os

def main():
    """Função principal"""
    
    print("🚀 Iniciando sistema de produção...")
    
    # Criar sistema
    agent_os = create_production_system()
    app = agent_os.get_app()
    
    # Configurações de produção
    config = {
        "host": "0.0.0.0",
        "port": int(os.getenv("PORT", 8000)),
        "workers": int(os.getenv("WORKERS", 4)),
        "log_level": "info",
        "access_log": True
    }
    
    print(f"🌐 Servidor iniciando em {config['host']}:{config['port']}")
    print(f"👥 Usando {config['workers']} workers")
    
    # Iniciar servidor
    uvicorn.run(app, **config)

if __name__ == "__main__":
    main()
'''

with open('production_system.py', 'w') as f:
    f.write(production_config)

print("🏭 Sistema de produção completo criado!")
print("📝 Arquivo: production_system.py")
print("\n🔧 Features incluídas:")
print("  ✅ Multiple agents & teams")
print("  ✅ PostgreSQL database")
print("  ✅ Logging completo")
print("  ✅ Configuração por variáveis de ambiente")
print("  ✅ Multiple workers")
print("  ✅ Memória persistente")

## 🎯 Exercício Prático: Seu Primeiro Deploy

Agora é sua vez! Vamos criar um agente especializado e colocá-lo em produção!

In [None]:
# EXERCÍCIO: Crie seu próprio agente de produção

print("🎯 DESAFIO: Crie seu AgentOS de produção!")
print("="*50)
print("")
print("📋 Requisitos:")
print("  1. Escolha uma especialidade (ex: culinária, fitness, finanças)")
print("  2. Crie um agente com tools apropriadas")
print("  3. Configure banco de dados")
print("  4. Adicione monitoramento")
print("  5. Configure segurança")
print("")
print("💡 Dicas:")
print("  - Use o código que criamos como base")
print("  - Teste localmente primeiro")
print("  - Pense na experiência do usuário")
print("  - Monitore métricas importantes")
print("")

# Template para o exercício
exercise_template = '''
# SEU CÓDIGO AQUI!
from agno.agent import Agent
from agno.models.google import Gemini
from agno.db.sqlite import SqliteDb
from agno.os import AgentOS

# 1. Defina sua especialidade
especialidade = "___"  # Ex: "culinária", "fitness", "finanças"

# 2. Crie seu agente
meu_agente = Agent(
    name="___",
    model=Gemini(id="gemini-2.0-flash-exp"),
    description="___",
    instructions=[
        "___",
        "___",
        "___"
    ],
    # tools=[___],  # Escolha tools apropriadas
    db=SqliteDb(db_file="meu_agente.db"),
    add_history_to_context=True,
    markdown=True
)

# 3. Crie o AgentOS
meu_os = AgentOS(
    agents=[meu_agente],
    name="___",
    description="___"
)

app = meu_os.get_app()

print("🚀 Seu AgentOS está pronto!")
'''

with open('meu_exercicio.py', 'w') as f:
    f.write(exercise_template)

print("📝 Template criado: meu_exercicio.py")
print("👨‍💻 Complete o código e teste sua criação!")

## 🔍 Troubleshooting e Debugging

Quando as coisas dão errado (e vão dar! 😅), você precisa saber como resolver!

In [None]:
# Guia de troubleshooting
troubleshooting_guide = '''
🔧 GUIA DE TROUBLESHOOTING - AgentOS
=========================================

❌ PROBLEMA: "API Key inválida"
✅ SOLUÇÃO:
   - Verifique se a API key está correta
   - Confirme se está usando a variável de ambiente certa
   - Teste a key diretamente com o provedor

❌ PROBLEMA: "Banco de dados não conecta"
✅ SOLUÇÃO:
   - Verifique a string de conexão
   - Confirme se o banco está rodando
   - Teste as credenciais
   - Verifique firewall/security groups

❌ PROBLEMA: "Timeout nas requisições"
✅ SOLUÇÃO:
   - Aumente o timeout do modelo
   - Verifique a conexão de rede
   - Monitore o uso de recursos
   - Considere cache de respostas

❌ PROBLEMA: "Memory leak / Alto uso de RAM"
✅ SOLUÇÃO:
   - Limite o histórico de mensagens
   - Configure garbage collection
   - Monitore sessões ativas
   - Implemente limpeza automática

❌ PROBLEMA: "Rate limiting do provedor"
✅ SOLUÇÃO:
   - Implemente backoff exponencial
   - Use multiple API keys
   - Configure rate limiting local
   - Monitore usage quotas

❌ PROBLEMA: "Respostas inconsistentes"
✅ SOLUÇÃO:
   - Diminua a temperature
   - Melhore as instruções
   - Use structured output
   - Adicione validação de resposta
'''

print(troubleshooting_guide)

# Função de diagnóstico automático
def diagnostic_check():
    """Executa diagnósticos automáticos"""
    
    checks = {
        "🔑 API Key": os.getenv("GOOGLE_API_KEY") is not None,
        "📦 Agno instalado": True,  # Se chegou até aqui, está instalado
        "🐍 Python >= 3.8": True,  # Assumindo que sim
        "💾 Espaço em disco": True,  # Assumindo que sim
        "🌐 Conexão internet": True  # Assumindo que sim
    }
    
    print("\n🔍 DIAGNÓSTICO AUTOMÁTICO")
    print("="*30)
    
    all_good = True
    for check, status in checks.items():
        status_emoji = "✅" if status else "❌"
        print(f"{status_emoji} {check}")
        if not status:
            all_good = False
    
    print("\n" + ("🎉 Tudo funcionando!" if all_good else "⚠️ Alguns problemas encontrados"))

diagnostic_check()

print("\n💡 Dica: Sempre mantenha logs detalhados em produção!")

## 📊 Dashboard Final de Produção

Vamos criar um dashboard completo para monitorar seu AgentOS em produção!

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from datetime import datetime, timedelta
import random

# Função para gerar dados realistas
def generate_production_metrics():
    """Gera métricas realistas de produção"""
    
    # Últimos 7 dias
    days = []
    daily_requests = []
    daily_users = []
    daily_revenue = []
    
    for i in range(7):
        day = datetime.now() - timedelta(days=6-i)
        days.append(day.strftime('%d/%m'))
        
        # Simular crescimento
        base = 1000 + (i * 150)
        daily_requests.append(base + random.randint(-100, 200))
        daily_users.append(int(daily_requests[-1] * 0.3))
        daily_revenue.append(daily_requests[-1] * 0.005)  # $0.005 por request
    
    return days, daily_requests, daily_users, daily_revenue

# Gerar dados
days, requests, users, revenue = generate_production_metrics()

# Criar dashboard completo
fig = plt.figure(figsize=(20, 16))
gs = fig.add_gridspec(4, 4, hspace=0.3, wspace=0.3)

# Titulo principal
fig.suptitle('🚀 AgentOS Production Dashboard - Live Metrics', 
             fontsize=20, fontweight='bold', y=0.95)

# 1. Métricas principais (KPIs)
ax_kpi = fig.add_subplot(gs[0, :])
ax_kpi.axis('off')

kpis = [
    {'title': '🔥 Requests Hoje', 'value': f'{requests[-1]:,}', 'change': '+12%'},
    {'title': '👥 Usuários Ativos', 'value': f'{users[-1]:,}', 'change': '+8%'},
    {'title': '💰 Revenue', 'value': f'${sum(revenue):.2f}', 'change': '+15%'},
    {'title': '⚡ Uptime', 'value': '99.9%', 'change': '🟢'},
    {'title': '🎯 Success Rate', 'value': '98.7%', 'change': '+0.3%'}
]

for i, kpi in enumerate(kpis):
    x = i * 0.2 + 0.1
    
    # Caixa do KPI
    bbox = dict(boxstyle="round,pad=0.3", facecolor='lightblue', alpha=0.5)
    ax_kpi.text(x, 0.7, kpi['title'], ha='center', va='center', 
                fontsize=12, fontweight='bold', transform=ax_kpi.transAxes)
    
    ax_kpi.text(x, 0.3, kpi['value'], ha='center', va='center', 
                fontsize=16, fontweight='bold', color='blue', 
                transform=ax_kpi.transAxes)
    
    ax_kpi.text(x, 0.1, kpi['change'], ha='center', va='center', 
                fontsize=10, color='green', transform=ax_kpi.transAxes)

# 2. Requests por dia
ax1 = fig.add_subplot(gs[1, :2])
ax1.plot(days, requests, marker='o', linewidth=3, markersize=8, color='#3498db')
ax1.fill_between(days, requests, alpha=0.3, color='#3498db')
ax1.set_title('📈 Requests por Dia (Últimos 7 dias)', fontweight='bold', fontsize=14)
ax1.grid(True, alpha=0.3)
ax1.tick_params(axis='x', rotation=45)

# 3. Usuários ativos
ax2 = fig.add_subplot(gs[1, 2:])
ax2.bar(days, users, color='#2ecc71', alpha=0.7)
ax2.set_title('👥 Usuários Únicos por Dia', fontweight='bold', fontsize=14)
ax2.tick_params(axis='x', rotation=45)

# 4. Revenue
ax3 = fig.add_subplot(gs[2, :2])
ax3.plot(days, np.cumsum(revenue), marker='s', linewidth=3, markersize=8, color='#f39c12')
ax3.fill_between(days, np.cumsum(revenue), alpha=0.3, color='#f39c12')
ax3.set_title('💰 Revenue Acumulada ($)', fontweight='bold', fontsize=14)
ax3.grid(True, alpha=0.3)
ax3.tick_params(axis='x', rotation=45)

# 5. Distribuição de agentes
ax4 = fig.add_subplot(gs[2, 2:])
agent_usage = {'TechExpert': 65, 'SupportBot': 25, 'TeamWork': 10}
colors = ['#e74c3c', '#9b59b6', '#1abc9c']
ax4.pie(agent_usage.values(), labels=agent_usage.keys(), autopct='%1.1f%%', 
        colors=colors, startangle=90)
ax4.set_title('🤖 Uso por Agente', fontweight='bold', fontsize=14)

# 6. Performance metrics
ax5 = fig.add_subplot(gs[3, :2])
hours = ['00:00', '04:00', '08:00', '12:00', '16:00', '20:00']
response_times = [0.8, 0.6, 1.2, 2.1, 1.8, 1.0]
ax5.plot(hours, response_times, marker='^', linewidth=2, markersize=8, color='#e67e22')
ax5.set_title('⚡ Tempo de Resposta Médio por Hora', fontweight='bold', fontsize=14)
ax5.set_ylabel('Segundos')
ax5.grid(True, alpha=0.3)

# 7. Status dos serviços
ax6 = fig.add_subplot(gs[3, 2:])
ax6.axis('off')

services = [
    {'name': '🌐 API Gateway', 'status': '🟢 Online'},
    {'name': '🤖 AgentOS Core', 'status': '🟢 Online'},
    {'name': '💾 Database', 'status': '🟢 Online'},
    {'name': '📊 Monitoring', 'status': '🟢 Online'},
    {'name': '🔐 Auth Service', 'status': '🟡 Warning'}
]

ax6.text(0.5, 0.9, '⚙️ Status dos Serviços', ha='center', va='center',
         fontsize=14, fontweight='bold', transform=ax6.transAxes)

for i, service in enumerate(services):
    y = 0.7 - (i * 0.15)
    ax6.text(0.1, y, service['name'], ha='left', va='center',
             fontsize=11, transform=ax6.transAxes)
    ax6.text(0.9, y, service['status'], ha='right', va='center',
             fontsize=11, fontweight='bold', transform=ax6.transAxes)

plt.show()

# Resumo executivo
print("\n" + "="*60)
print("📊 RESUMO EXECUTIVO - PRODUCTION METRICS")
print("="*60)
print(f"🚀 Total de requests (7 dias): {sum(requests):,}")
print(f"👥 Usuários únicos médios: {int(np.mean(users)):,}")
print(f"💰 Revenue total: ${sum(revenue):.2f}")
print(f"📈 Crescimento: +{((requests[-1] - requests[0]) / requests[0] * 100):.1f}%")
print(f"⚡ Performance: {np.mean([0.8, 0.6, 1.2, 2.1, 1.8, 1.0]):.1f}s médio")
print("\n🎯 Tudo funcionando perfeitamente em produção! 🎉")

## 🎉 Resumo do Módulo - Você Chegou na Produção!

Parabéns! 🎊 Você acabou de dominar um dos aspectos mais importantes do desenvolvimento com IA: colocar seus agentes em produção!

### 🏆 O que você aprendeu:

✅ **AgentOS** - O sistema operacional dos seus agentes  
✅ **Deploy e Infraestrutura** - Como subir tudo na nuvem  
✅ **Monitoramento** - Como saber se tá tudo funcionando  
✅ **Segurança** - Como proteger seus agentes  
✅ **Escalabilidade** - Como aguentar milhares de usuários  
✅ **Troubleshooting** - Como resolver problemas  

![](https://s3.us-east-1.amazonaws.com/turing.education/books/imagens/agno-2.0-framework--modulo-12_img_02.png)

### 🚀 Próximos Passos:

No **Módulo 13 (Projeto Final)**, você vai:
- Criar um sistema completo end-to-end
- Integrar tudo que aprendeu no curso
- Construir algo que pode virar seu próximo produto
- Mostrar pro mundo o que você é capaz de criar!

### 💡 Dica Final:

Agora você tem o poder de criar sistemas de IA que funcionam de verdade na produção. Use esse conhecimento com responsabilidade e sempre pense na experiência do usuário!

Bora pro módulo final? É lá que a mágica realmente acontece! ✨