#**Trabalho final - Simulador de ChatBot com GenAI e VectorDB**

**Nota de atenção:**
- Leia com atenção o descritivo do trabalho e as orientações do template.
- O trabalho deve ser entregue **respeitando a estrutura do arquivo de template**, utilizando o notebook "Template Trabalho final - Simulador de ChatBot.ipynb" e compactado no formato .zip.
- Deve haver apenas um arquivo no formato .ipynb, consolidando todo o trabalho.

**Participantes (RM - NOME):**<br>
João Paulo Martins Rodrigues – RM 364668<br>
Herivelto Raimundo Lemos de Macedo Junior – RM 364212<br>
Evaldo Loiola Mota Junior – RM 364056<br>
Bruno Gomes Nogueira – RM 364457<br>

###**Caso de uso - Marketplace de classificados veículos**

Imagine que você trabalha na empresa **iAutos** que tem como produto principal um marketplace de classificados de veículos e você como um Engenheiro de Dados, tem a missão de ajudar a empresa a oferecer um melhor serviço para seus clientes (vendedores e compradores).

Contexto:
- Sua empresa oferece um serviço (site/plataforma) de classificados de veículos (semelhantes aos marketplaces convencionais, mas focado em vendas de veículos), onde os vendedores (sellers) podem cadastrar e anunciar seus veículos, e compradores (buyers) podem buscar veículos de seu interesse e contatar os vendedores para negociar os veículos de seu interesse.
- Diariamente a empresa recebe muitos chamados de dúvidas sobre as regras de publicação de veículos e regras de uso do produto.
- Veja mais detalhes das regras do documento de [Quem Somos e Políticas de Uso](https://drive.google.com/file/d/1-ZpUOl8OA4lxa8CJ6auT42hSxaF3jclk) (em PDF).

---
Como podemos ajudar a empresa?


###**Desafio**

A ideia é criar um ChatBot mais "turbinado" do que praticamos nas aulas.
Esse ChatBot será ser responsável por atender e responder as dúvidas dos clientes sobre o marketplace.

Criem um **ChatBot demonstrativo** usando IA Generativa para criar um novo **canal de atendimento** para tirar dúvidas dos clientes referente a plataforma, políticas de uso e publicação, para isso considere as orientações abaixo:

- Utilizem o framework do **LangChain** para criar a lógica do ChatBot, gerenciar a conexão com o modelo LLM e modelo de Embedding, para gerenciar o ChromaDB com base no contexto e para gerenciar a memória do agente.
- Usem como contexto o arquivo PDF [Quem Somos e Políticas de Uso](https://drive.google.com/file/d/1-ZpUOl8OA4lxa8CJ6auT42hSxaF3jclk).
- Criem o VectorDB com o ChromaDB e com base no contexto do PDF.
  - Obs.: Não necessariamente precisa carregar o PDF, fiquem a vontade para definirem a melhor estratégia.
- Utilizem as boas práticas de Prompt Engineering para criar o template do prompt para o serviço e gerenciar a conversa.
- Utilizem como base e referência todos os materiais apresentados, tanto de Generative AI quanto de Database for GenAI.
  - Estruturem bem o trabalho, organizem em funções, expliquem e documentem bem os códigos e decisões.
- Fiquem a vontade de complementar o contexto e o prompt para otimizar o serviço.
- Fiquem a vontade de trazer técnicas que façam sentido e complemente o trabalho.

### Dicas:
- Comecem os desenvolvimentos de forma simples, testando os componentes e vá aumentando a complexidade gradativamente.
- Utilizem os modelos LLMs da OpenAI ou da Azure com OpenAI.

###**Orientações:**

---
####**Usem o Google Colab com Python e esse template para desenvolverem o trabalho.**
---

**1. Desenvolvimento e testes**, nessa parte é onde vocês podem explorar o desenvolvimento do trabalho aplicando as técnicas, testando as ferramentas e serviços de GenAI.
  - Explorem diferentes formas de tratar o problema. Comecem testando os componentes e definindo a melhor estratégia.
  - Testem as ferramentas, framework, APIs e técnicas de prompt engineering.
  - Fiquem à vontade para explorar os serviços e frameworks vistos em aula: API da OpenAI Platform, API da Azure AI Foundry, LangChain e outros.
  - Sejam criativos, mas não precisa de muita complexidade e podem explorar outras formas de desenvolver.
  - Expliquem as decisões e racional do desenvolvimento. **Abuse dos comentários**.

**2. Processo final**, aqui nessa parte separem apenas o processo final com um pipeline completo para o ChatBot, desde a instalação das bibliotecas até a simulação.
  - Organizem em funções que façam sentido.
  - Resultado esperado: Um processo estruturado utilizando LangChain e ChromaDB, criando um VectorDB com uma boa estratégia de indexação e busca (retriever), uma simulação do ChatBot (pode ser estruturando uma API ou alguma lógica para simular uma conversa).
  - Exemplos: Deixem e/ou compartilhem no notebook exemplos de conversas.
  - Testem bem esse pipeline antes, pois o professor tentará executar o processo para validar a implementação.

###**Avaliação:**
O trabalho será avaliado pelas seguintes diretrizes:
  - Demonstração de conhecimento com os temas abordados em sala de aula.
  - Utilização correta dos frameworks, APIs e aplicação das técnicas de prompt engineering.
  - Organização, comentários e explicação certamente vão ajudar na nota.
  - Resultado esperado seguindo as orientações do professor nesse template.

###**Atenção:**
- Usem a conta da **Azure AI Foundry** ou da **OpenAI Platform** para desenvolverem o trabalho, mas dê preferência para a conta da Azure por causa dos limites de crédito. **Não deixem suas credenciais no trabalho, por favor!**
- Trabalhos iguais são passíveis de reprovação ou desconto de nota.
- Respeitem a estrutura do template fornecido pelo professor.
- Limite de 2 a 4 pessoas por grupo, de preferência o mesmo grupo do Startup One.

##**1. Desenvolvimento e testes**

Desenvolva aqui:

Instalacao de bibliotecas

In [1]:
!pip install pypdf==6.0.0 --quiet
!pip install pdfminer.six==20250506 --quiet
!pip install langchain==0.3.27 langchain_community==0.3.27 langchain-openai==0.3.27 --quiet
!pip install langchain-chroma==0.2.5 chromadb-client==1.0.20 --quiet
!pip install pyngrok==7.3.0 --quiet
!pip install fastapi==0.116.1 uvicorn==0.35.0 nest_asyncio==1.6.0 --quiet
!pip install chromadb
!pip install python-dotenv tiktoken requests pydantic psutil --quiet



Importacao Bibliotecas

In [2]:
from dotenv import load_dotenv
import tiktoken
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import PDFMinerLoader
import requests
from fastapi import FastAPI, Request
from fastapi.responses import HTMLResponse
from pydantic import BaseModel
import uuid
import nest_asyncio
import uvicorn
import chromadb
import langchain
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.schema import Document
from langchain.chains import ConversationalRetrievalChain
from langchain.prompts.chat import ChatPromptTemplate, HumanMessagePromptTemplate, SystemMessagePromptTemplate, MessagesPlaceholder
from langchain.memory import ConversationBufferMemory
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from pyngrok import ngrok, conf
import os, sys, time, psutil, socket, subprocess, shutil
from langchain_openai import AzureOpenAIEmbeddings, AzureChatOpenAI

Chaves e Parametros

In [3]:
KEY_NGROK = "34piJFJVU1Si8AFxTsi8AqwgvOd_7jo5qV2hbPtayYsLbUHBQ" 

OPENAI_API_KEY = "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"

azure_api_key = "2YtgC1igEt7izb0fsR2LsNwKmpw6uSiwpc2oRpXziXR2Fe24vFXsJQQJ99BHACHYHv6XJ3w3AAABACOGs58E"
azure_endpoint = "https://openai-dourado.openai.azure.com/"
llm_deployment_model = "gpt-4.1"
llm_api_version = "2025-01-01-preview"

emb_deployment_model = "text-embedding-3-small" 
emb_api_version = "2024-02-01"

Se quiser ir pela OpenAI

In [4]:
# Modelo LLM
llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0.5,
    openai_api_key=OPENAI_API_KEY
)

# Define qual o modelo de embeddings, no caso vamos usar um modelo da OpenAI - text-embedding-3-small
embedding_model = OpenAIEmbeddings(
    openai_api_key = OPENAI_API_KEY,
    model = 'text-embedding-3-small'
)

  llm = ChatOpenAI(
  embedding_model = OpenAIEmbeddings(


Se quiser ir pela Azure, pela ordem coloquei para usar a Azure

In [5]:
llm = AzureChatOpenAI(
    azure_endpoint=azure_endpoint,
    azure_deployment=llm_deployment_model,
    openai_api_key=azure_api_key,
    openai_api_version=llm_api_version,
    temperature=0,
)

embedding_model = AzureOpenAIEmbeddings(
    azure_endpoint=azure_endpoint,
    azure_deployment=emb_deployment_model,
    openai_api_key=azure_api_key,
    openai_api_version=emb_api_version,
)

Definição e criação do ChromaDB

In [6]:
CHROMA_HOST = "127.0.0.1" 
CHROMA_PORT = 8000

def is_port_in_use(port, host="127.0.0.1"): #checa se a porta esta em uso
    with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s:
        s.settimeout(0.5)
        return s.connect_ex((host, port)) == 0

def wait_for_port(port, host="127.0.0.1", timeout=30): #aguarda retorno da porta
    start = time.time()
    while time.time() - start < timeout:
        if is_port_in_use(port, host):
            return True
        time.sleep(0.5)
    return False

def build_chroma_cmd(host, port): #cria funcao para chromadb
        chroma_exe = os.path.join(os.path.dirname(sys.executable), "Scripts", "chroma.exe")
        return [chroma_exe, "run", "--host", host, "--port", str(port)]

In [7]:
chroma_exe = os.path.join(os.path.dirname(sys.executable), "Scripts", "chroma.exe")

In [8]:
chroma_exe

'c:\\Users\\JOAO PC\\AppData\\Local\\Programs\\Python\\Python313\\Scripts\\chroma.exe'

In [9]:
os.path.exists(chroma_exe) #precisa retornar True

True

In [10]:
chroma = build_chroma_cmd(CHROMA_HOST, CHROMA_PORT)

In [11]:
subprocess.Popen(chroma, stdout=subprocess.DEVNULL, stderr=subprocess.STDOUT) #cria o chroma db


<Popen: returncode: None args: ['c:\\Users\\JOAO PC\\AppData\\Local\\Program...>

In [12]:
wait_for_port(CHROMA_PORT) #precisa retornar true

True

In [13]:
# Verifica se o servidor está respondendo (opcional, mas recomendado)
print("Verificando status do servidor...")
!curl http://127.0.0.1:8000/api/v2/heartbeat
print("\nSe a resposta acima for '{\"nanosecond heartbeat\":...}', o servidor está no ar!")

Verificando status do servidor...
{"nanosecond heartbeat":1761943094310527100}

Se a resposta acima for '{"nanosecond heartbeat":...}', o servidor está no ar!


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed

  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
100    44  100    44    0     0  33820      0 --:--:-- --:--:-- --:--:-- 44000


In [14]:
# Associar o Servidor Chroma com o Ngrok
# Configurando e iniciando o Ngrok
print("Configurando e iniciando o Ngrok")
ngrok.set_auth_token(KEY_NGROK)
#conf.get_default().auth_token = KEY_NGROK

# Mata qualquer túnel anterior para garantir um início limpo
try:
  ngrok.kill()
except:
  pass

# Expor o servidor com Ngrok
public_url = ngrok.connect(8000)
print(f"Servidor Chroma está online e acessível na URL: {public_url}")
# Inicia o túnel na porta 8000, onde nosso servidor Chroma está escutando

Configurando e iniciando o Ngrok
Servidor Chroma está online e acessível na URL: NgrokTunnel: "https://operculate-vernon-unmissed.ngrok-free.dev" -> "http://localhost:8000"


In [15]:
public_url.public_url

'https://operculate-vernon-unmissed.ngrok-free.dev'

In [16]:
url = public_url.public_url  

# testa o endpoint de heartbeat
!curl {url}/api/v2/heartbeat
print("\nSe a resposta acima for '{\"nanosecond heartbeat\":...}', o servidor está no ar! 🚀")

{"nanosecond heartbeat":1761943095814817000}

Se a resposta acima for '{"nanosecond heartbeat":...}', o servidor está no ar! 🚀


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed

  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
100    44  100    44    0     0     75      0 --:--:-- --:--:-- --:--:--    75


In [17]:
file_id = "1-ZpUOl8OA4lxa8CJ6auT42hSxaF3jclk" #pelo link do documento, obvtive o file id do pdf e baseado na aula 1 fiz a importacao pelo pdf miner loader para melhor preservacao da estrutura
url_download = f"https://drive.google.com/uc?export=download&id={file_id}"
local_filename = "quemsomospoliticasdeuso.pdf"

response = requests.get(url_download)
response.raise_for_status()

with open(local_filename, "wb") as f:
    f.write(response.content)

print("✅ PDF baixado com sucesso!")

loader = PDFMinerLoader(local_filename)
contexto = loader.load()

len(contexto)

✅ PDF baixado com sucesso!


1

In [18]:
# Escolhe o tokenizer utilizando o mesmo método do modelo de Embeddings
encoding = tiktoken.encoding_for_model("text-embedding-3-small")

# Função que conta tokens
def fn_conta_token(text: str) -> int:
    return len(encoding.encode(text))

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 500,        # máximo de tokens por chunk
    chunk_overlap = 50,      # sobreposição entre chunks
    length_function = fn_conta_token,
    separators=["\n\n", "\n", ".", " ", ""]
)

conteudo_completo = " ".join([doc.page_content for doc in contexto])

# O método create_documents divide e retorna uma lista de objetos Document
documents = text_splitter.create_documents([conteudo_completo])

print(f"✅ O PDF foi dividido em {len(documents)} chunks (documentos menores).")
print("📘 Exemplo de chunk:\n")
print(documents[0].page_content)

✅ O PDF foi dividido em 4 chunks (documentos menores).
📘 Exemplo de chunk:

iAutos - Marketplace de classificados 
veículos 

Conectando compradores e vendedores de veículos com segurança e 
confiança. 

Quem Somos? – iAutos 

Nossa História 

O iAutos nasceu com a missão de revolucionar o mercado de classificados de veículos, 
oferecendo uma plataforma simples, intuitiva e segura para conectar vendedores e 
compradores em todo o Brasil. 

Inspirados por marketplaces de referência, mas focados exclusivamente em veículos, 
criamos um espaço onde a negociação é clara, direta e protegida, garantindo que todos os 
usuários possam realizar bons negócios com tranquilidade. 

O que fazemos? 

O iAutos é um marketplace especializado em anúncios de veículos, onde: 

●  Vendedores podem cadastrar e expor seus veículos a potenciais compradores. 

●  Compradores podem buscar veículos por tipo, preço, localização e características, 

solicitando contato com o vendedor diretamente pela plataforma. 


In [19]:
client_chromadb = chromadb.HttpClient(
    host = CHROMA_HOST
)

In [20]:
# O nome da "coleção" no servidor. Pense nisso como o nome de uma tabela em um banco de dados.
CHROMADB_COLLECTION_NAME = "chromadb_vactorstore_iautos"

# Cria o Vectorstore com o Chroma a partir dos documentos divididos
vectorstore = Chroma.from_documents(
    documents = documents,
    embedding = embedding_model,
    client = client_chromadb,  # Passamos o "client" em vez do persist_directory
    collection_name = CHROMADB_COLLECTION_NAME
)

# Instancia o retriever (podemos controlar o número de chunks do retorno da análise de similaridade)
retriever = vectorstore.as_retriever(
    search_type = "similarity",   # similarity por "mmr" - (max marginal relevance) - pode trazer mais diversidade nos resultados
    search_kwargs = {"k": 3}      # define quantos chunks vão retornar
)

In [21]:
# Teste da busca por similaridade
query = "O que é a iAutos?"

docs_retornados = vectorstore.similarity_search(query, k=2)
print(docs_retornados[0].page_content)
print(docs_retornados[1].page_content)

iAutos - Marketplace de classificados 
veículos 

Conectando compradores e vendedores de veículos com segurança e 
confiança. 

Quem Somos? – iAutos 

Nossa História 

O iAutos nasceu com a missão de revolucionar o mercado de classificados de veículos, 
oferecendo uma plataforma simples, intuitiva e segura para conectar vendedores e 
compradores em todo o Brasil. 

Inspirados por marketplaces de referência, mas focados exclusivamente em veículos, 
criamos um espaço onde a negociação é clara, direta e protegida, garantindo que todos os 
usuários possam realizar bons negócios com tranquilidade. 

O que fazemos? 

O iAutos é um marketplace especializado em anúncios de veículos, onde: 

●  Vendedores podem cadastrar e expor seus veículos a potenciais compradores. 

●  Compradores podem buscar veículos por tipo, preço, localização e características, 

solicitando contato com o vendedor diretamente pela plataforma. 

Nosso compromisso é com a transparência, a experiência do usuário e a segur

Feito toda adaptação do system template para o novo cenario da iAutos

In [22]:
system_template = """
Você é um assistente virtual inteligente chamado **iAutoBot**, representante oficial do **iAutos**, 
um marketplace especializado em compra e venda de veículos.

# **Seu papel e objetivo:**
1. Ajudar usuários a entender o funcionamento do iAutos e suas políticas de uso.
2. Responder perguntas sobre quem somos, missão, valores, segurança e regras da plataforma.
3. Orientar vendedores e compradores sobre práticas corretas e evitar fraudes.
4. Manter uma comunicação empática, profissional e segura, transmitindo confiança.

# **Diretrizes importantes:**
- Sempre responda em **português (pt-BR)**.
- Use uma linguagem **clara, cordial e profissional**, mas acessível.
- Utilize emojis de forma leve e simpática (ex: 🤖🚗🔒✨😉), sem exageros.
- Seja **ético e imparcial** — nunca incentive comportamentos fora das políticas.
- **Baseie-se APENAS** nas informações disponíveis no contexto abaixo.
- Se a resposta não estiver no contexto, diga algo como:
  "_Desculpe, essa informação não está disponível nas políticas oficiais do iAutos, 
  mas posso te ajudar com outras dúvidas sobre a plataforma!_"
- Mantenha coerência com o histórico da conversa.
- Quando o usuário fizer perguntas fora de contexto, redirecione gentilmente para assuntos do iAutos.

---

**Contexto disponível:**
{context}
"""

chat_prompt = ChatPromptTemplate.from_messages([
    SystemMessagePromptTemplate.from_template(system_template),   ## regras fixas do assistente
    MessagesPlaceholder(variable_name="chat_history", n_messages = 6, optional = True), ## Insere o histórico de conversas aqui (opcional e limitado a N mensagens) / Monta uma lista de mensagens (AIMessage, HumanMessage, SystemMessage)
    HumanMessagePromptTemplate.from_template("{question}")        ## define a entrada do usuário - entrada dinâmica
])
# optional = True, deixa o histórico como opcional caso esteja vazio para evitar erros


In [23]:
# Configura o memory para manter o histórico da conversa
memory_test = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True
    )

# Cria a cadeia de conversa com retriever e memória
chain_test = ConversationalRetrievalChain.from_llm(
    llm = llm,
    retriever = retriever,
    memory = memory_test,
    combine_docs_chain_kwargs = {"prompt": chat_prompt},
    chain_type = "stuff", # O tipo "stuff" simplesmente junta os chunks em um único prompt.
)


  memory_test = ConversationBufferMemory(


In [24]:
# Função com o loop de iteração simulando um chat
def fn_chat_test():
  """Função para simular um chat com o assistente"""
  print("Iniciado o Chatbot da AutoToya! Digite 'sair' para encerrar.\n")

  # Pré-carregar uma mensagem de histórico com uma saudação inicial
  memory_test.chat_memory.clear() ## limpa o histórico (buffer)
  memory_test.chat_memory.add_ai_message("Olá! 👋 Seja muito bem-vindo ao iAutos! Sou o AutoBot 🤖, assistente virtual da plataforma."
        "Estou aqui para te ajudar a entender como funciona o iAutos — o marketplace seguro e confiável para compra e venda de veículos."
        "Quer saber sobre anúncios, regras de uso ou dicas de segurança?")
  print(f"ToyaBot 🤖: {memory_test.chat_memory.messages[0].content}")

  while True:
    user_question = input("\nVocê: ")
    if user_question.lower() == "sair":
        print("ToyaBot 🤖: 👋 Conversa encerrada. Até logo! 🚗")
        break
    response = chain_test.invoke({"question": user_question})
    #response = chain_test.run(question = user_question) ## Essa função está depreciada
    print(f"ToyaBot 🤖: {response['answer']}")


In [25]:
# Gerenciamento de múltiplos usuários (memória por sessão)
sessions = {}

def get_chat_chain(session_id):
    if session_id not in sessions:

        # Configura o memory para manter o histórico da conversa
        memory = ConversationBufferMemory(
            memory_key="chat_history",
            return_messages=True
            )

        # Cria a cadeia de conversa com retriever e memória
        chain = ConversationalRetrievalChain.from_llm(
            llm = llm,
            retriever = retriever,
            memory = memory,
            combine_docs_chain_kwargs = {"prompt": chat_prompt},
            chain_type = "stuff", # O tipo "stuff" simplesmente junta os chunks em um único prompt.
            )

        # Carrega mensagem inicial
        memory.chat_memory.add_ai_message("Olá! 👋 Seja muito bem-vindo ao iAutos! Sou o AutoBot 🤖, assistente virtual da plataforma."
        "Estou aqui para te ajudar a entender como funciona o iAutos — o marketplace seguro e confiável para compra e venda de veículos."
        "Quer saber sobre anúncios, regras de uso ou dicas de segurança?")

        # Gerencia sessão - cada chat vira um objeto chain identificado pelo session_id
        sessions[session_id] = chain
    return sessions[session_id]

# Configura o FastAPI para criar a estrutura de API
app = FastAPI(title="API - Chatbot AutoBot", version="1.0")

# Estrutura resposta com parse do pydantic
class ChatRequest(BaseModel):
    session_id: str
    question: str

# Rota para chamar a função que chama o LLM e toda estrutura do chat (chain, retriever, vectorstore, etc.)
@app.post("/chat")
def chat(req: ChatRequest):
    chain = get_chat_chain(req.session_id)
    #resposta = chain.run(question = req.question)
    resposta = chain.invoke({"question": req.question})
    resposta = resposta['answer']
    return {"answer": resposta}

# Rota para inicializar o chat com a mensagem de saudação inicial
@app.get("/start/{session_id}")
def start(session_id: str):
    chain = get_chat_chain(session_id)
    msg_inicial = chain.memory.chat_memory.messages[0].content
    return {"answer": msg_inicial}

# Rota principal que renderiza página HTML do chat (simples)
@app.get("/", response_class = HTMLResponse)
def index():
    return """
<!DOCTYPE html>
<html lang="pt-BR">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
  <title>🤖 iAutoBot Chat - iAutos 🚗</title>
  <script src="https://cdn.tailwindcss.com"></script>
  <style>
    ::-webkit-scrollbar { width: 6px; }
    ::-webkit-scrollbar-thumb { background-color: #ccc; border-radius: 3px; }
    .chat-bubble { max-width: 80%; padding: 10px 15px; border-radius: 18px; margin: 6px 0; line-height: 1.4; }
    .user-msg { background-color: #2563eb; color: white; margin-left: auto; border-bottom-right-radius: 4px; }
    .bot-msg { background-color: #f1f5f9; color: #111827; margin-right: auto; border-bottom-left-radius: 4px; }
    .fade-in { animation: fadeIn 0.4s ease; }
    @keyframes fadeIn { from {opacity: 0; transform: translateY(10px);} to {opacity: 1; transform: translateY(0);} }
  </style>
</head>
<body class="bg-gray-50 flex flex-col items-center justify-center min-h-screen">

  <div class="bg-white shadow-2xl rounded-2xl w-full max-w-md overflow-hidden">
    <div class="bg-blue-600 text-white text-center py-4">
      <h2 class="text-xl font-semibold">🤖 iAutoBot - Assistente do iAutos 🚗</h2>
      <p class="text-sm opacity-80">Seu marketplace confiável para veículos</p>
    </div>

    <div id="chat" class="p-4 h-[400px] overflow-y-auto space-y-2 bg-gray-100"></div>

    <div class="flex items-center border-t p-3 bg-white">
      <input id="msg" type="text" placeholder="Digite sua mensagem..." 
             class="flex-1 p-2 border border-gray-300 rounded-xl focus:outline-none focus:ring-2 focus:ring-blue-500" />
      <button onclick="send()" 
              class="ml-2 bg-blue-600 hover:bg-blue-700 text-white px-4 py-2 rounded-xl font-semibold transition">
        Enviar
      </button>
    </div>
  </div>

  <script>
    let session_id = Math.random().toString(36).substring(7);

    function appendMessage(sender, text) {
      let chat = document.getElementById("chat");
      let msgDiv = document.createElement("div");
      msgDiv.classList.add("chat-bubble", sender === "user" ? "user-msg" : "bot-msg", "fade-in");
      msgDiv.innerHTML = text;
      chat.appendChild(msgDiv);
      chat.scrollTop = chat.scrollHeight;
    }

    async function startChat() {
      let r = await fetch('/start/' + session_id);
      let data = await r.json();
      appendMessage("bot", data.answer);
    }

    async function send() {
      let msgInput = document.getElementById("msg");
      let msg = msgInput.value.trim();
      if (!msg) return;

      appendMessage("user", msg);
      msgInput.value = "";

      let r = await fetch('/chat', {
        method: 'POST',
        headers: {'Content-Type':'application/json'},
        body: JSON.stringify({session_id: session_id, question: msg})
      });

      let data = await r.json();
      appendMessage("bot", data.answer);
    }

    document.getElementById("msg").addEventListener("keypress", function(e) {
      if (e.key === "Enter") send();
    });

    startChat();
  </script>

</body>
</html>
"""


In [26]:
# Executa o App no Colab + ngrok
if __name__ == "__main__":
  #ngrok.set_auth_token(KEY_NGROK) ## Já fizemos essa configuração antes (agora é opcional)
  public_url = ngrok.connect(8001)
  print("URL pública gerada pelo Ngrok:", public_url)

  nest_asyncio.apply()
  uvicorn.run(app, host="0.0.0.0", port=8001, reload=False)

INFO:     Started server process [6432]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8001 (Press CTRL+C to quit)


URL pública gerada pelo Ngrok: NgrokTunnel: "https://operculate-vernon-unmissed.ngrok-free.dev" -> "http://localhost:8001"
INFO:     187.255.127.46:0 - "GET / HTTP/1.1" 200 OK
INFO:     187.255.127.46:0 - "GET /start/z43qve HTTP/1.1" 200 OK


INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [6432]
