# üöÇ Sistema Ollama + FastAPI
## Modelos de IA para An√°lise de Transporte Ferrovi√°rio

Este notebook permite usar modelos de linguagem local para an√°lises de transporte:
- **TinyLLama**: Modelo r√°pido e leve (1.1B par√¢metros)
- **Qwen2:1.5b**: Modelo mais preciso (1.5B par√¢metros) - pode ser lento

### ‚ö° Como usar:
1. **IMPORTANTE**: Certifique-se de que o Docker esteja rodando: `docker compose up -d`
2. Execute a **C√©lula 1**: Configura√ß√£o inicial
3. Execute a **C√©lula 2**: Verificar modelos dispon√≠veis  
4. Execute a **C√©lula 3**: Teste r√°pido
5. Use as **C√©lulas 4-5**: Para consultas espec√≠ficas

### ‚ö†Ô∏è Notas importantes:
- Os modelos podem demorar 30-60s para responder
- Se der timeout, tente novamente ou use o TinyLLama
- Primeiro download dos modelos pode demorar v√°rios minutos

In [None]:
# 1. CONFIGURA√á√ÉO INICIAL
from chat_client import ChatClient
import time

# Configurar cliente
client = ChatClient(base_url="http://localhost:8000")

print("‚úÖ Cliente configurado")
print("‚úÖ URL da API:", client.base_url)

# Verificar status da API
try:
    health = client.health_check()
    print("‚úÖ API funcionando:", health)
except:
    print("‚ùå API n√£o est√° respondendo. Execute: docker compose up -d")

MODELOS DE BAIXO CONSUMO

"tinyllama:latest" </br>
"qwen2:1.5b"</br>
"deepcoder:1.5b"</br>
"stablelm2:1.6b"</br>
"tinydolphin:latest"</br>
"exaone-deep:2.4b"</br>

</br>
granite3.3:2b</br>
granite3.1-dense:2b</br>

In [None]:
modelos_a_baixar = ["tinyllama:latest","qwen2:1.5b","qwen3:1.7b"]

In [None]:
# 2. VERIFICAR MODELOS DISPON√çVEIS
print("Verificando modelos dispon√≠veis...")

# Listar modelos j√° instalados
modelos_disponiveis = client.listar_modelos()
print(f"Modelos instalados: {modelos_disponiveis}")

# Verificar se temos os modelos necess√°rios
for modelo in modelos_a_baixar:
    if modelo in modelos_disponiveis:
        print(f"‚úì {modelo}: dispon√≠vel")
    else:
        print(f"‚úó {modelo}: n√£o encontrado, baixando")
        client.baixar_modelo(modelo)

print("\nPronto para usar os modelos dispon√≠veis!")

In [None]:
contexto = """
Plano Estrat√©gico Ferrovi√°rio de Minas Gerais
Perfil da Proposta da Ferrovia para Transporte de Passageiros
Proposta: S√£o Sebasti√£o do Rio Verde / Passa Quatro C√≥digo: TUR 59
Categoria: Proposta Tur√≠stica Vers√£o: 00
Tipo de empreendimento:
Greenfield
Brownfield (exist√™ncia da faixa de dom√≠nio,
com reconstru√ß√£o da via permanente)
Caracter√≠sticas f√≠sicas:
Extens√£o (km): 25,28 Tipo bitola: -
Total de esta√ß√µes: 3
Esta√ß√µes atendidas (extens√£o acumulado em km):
S√£o Sebasti√£o do Rio Verde 0,00
Itanhandu 13,43
Passa Quatro 25,28
Caracter√≠sticas operacionais:
Tempo de viagem ida (min): 76,2 Tempo de viagem ida & volta (min): 152,4
Viagens (m√™s): 5 (ida + volta) Dias de opera√ß√£o (m√™s): 5
Demanda (m√™s): 1.924 Produ√ß√£o quilom√©trica (km/m√™s): 252,8
Tarifa do servi√ßo: 65,00 Tarifa ida e volta (R$)
Desempenho da linha:
Receita anual (R$): 1 500 720,00
Pass.ano/km: 7,6 Receita.ano/km: 494,7
"""

In [None]:
# 5. SUA CONSULTA PERSONALIZADA
# Modifique a pergunta abaixo e execute para suas proprias analises

# Escolha o modelo (tinyllama:latest √© mais rapido e confiavel)
modelo = "tinyllama:latest"
modelo = "tinydolphin:latest"  
modelo = "qwen2:1.5b"  # Modelo mais confiavel
# modelo = "deepcoder:1.5b"     # Erro de resposta, timeout
# modelo = "exaone-deep:2.4b"   # Erro de resposta, timeout
# modelo = "stablelm2:1.6b"     # Resultado 100% errado
modelo = "qwen3:1.7b"         # Erro de resposta, timeout

# Sua pergunta personalizada - MODIFIQUE AQUI:
# os dados sempres estar√£o assim:  <key>: <value>

print(f"Modelo selecionado: {modelo}")
print("\nProcessando...")

# Adicionar contexto para melhorar resposta
prompt = f"""
voc√™ foi designado a responder o formulario <json> com base nos dados no <contexto>,
ent√£o responda rapidamente e com precis√£o.

# Formulario JSON:
<json>
{{
    "Proposta": value1,
    "C√≥digo": value2,
    "Categoria": value3,
    "Tipo de empreendimento": ["empreendimento1", "empreendimento2", "empreendimento3" ...], # RESPONDA COM OS NOMES DOS EMPREENDIMENTOS

    "Extens√£o (km)": value5,
    "Tipo bitola": value6,
    "Total de esta√ß√µes": value7,
    "Esta√ß√µes atendidas": ["esta√ß√£o1", "esta√ß√£o2", "esta√ß√£o3" ...], # RESPONDA COM OS NOMES DE ESTA√á√ïES

    "Tempo de viagem ida (min)": value9,
    "Tempo de viagem ida & volta (min)": value10,
    "Viagens (m√™s)": value11,
    "Dias de opera√ß√£o (m√™s)": value12,
    "Demanda (m√™s)": value13,
    "Produ√ß√£o quilom√©trica (km/m√™s)": value14,
    "Tarifa do servi√ßo": value15,

    "Receita anual (R$)": value16,
    "Pass.ano/km": value17,
    "Receita.ano/km": value18
}}
</json>

# Fonte de dados:
<contexto> 
{contexto}
</contexto> 

<tarefa>
extraia os dados da fonde dados com a tag <contexto> e preencha o json com tag <json> nos campos value1, value2, etc.
</tarefa>

<resposta>
retorne o formulario JSON preenchido, e quando falar dele inicie com a tag <json> e quando finalizar insira a tag </json>.
</resposta>
"""

try:
    inicio = time.time()
    resposta = client.chat(prompt, modelo=modelo, stream=False, timeout=6000)
    tempo = time.time() - inicio

    print(f"\nTempo: {tempo:.1f}s")
    print(f"\nResposta Especializada:")
    print("=" * 60)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
    else:
        print(str(resposta))
    print("=" * 60)
    
    print("\nPara fazer outra pergunta:")
    print("1. Modifique a variavel 'sua_pergunta' acima")
    print("2. Execute esta celula novamente")
except Exception as e:
    print(f"Erro: {str(e)}")
    print("Verifique se o Docker est√° rodando: docker compose up -d")

In [None]:
client.baixar_modelo("qwen3:1.7b")

In [None]:

modelo
