# 🚂 Sistema Ollama + FastAPI
## Modelos de IA para Análise de Transporte Ferroviário

Este notebook permite usar modelos de linguagem local para análises de transporte:
- **TinyLLama**: Modelo rápido e leve (1.1B parâmetros)
- **Qwen2:1.5b**: Modelo mais preciso (1.5B parâmetros) - pode ser lento

### ⚡ Como usar:
1. **IMPORTANTE**: Certifique-se de que o Docker esteja rodando: `docker compose up -d`
2. Execute a **Célula 1**: Configuração inicial
3. Execute a **Célula 2**: Verificar modelos disponíveis  
4. Execute a **Célula 3**: Teste rápido
5. Use as **Células 4-5**: Para consultas específicas

### ⚠️ Notas importantes:
- Os modelos podem demorar 30-60s para responder
- Se der timeout, tente novamente ou use o TinyLLama
- Primeiro download dos modelos pode demorar vários minutos

In [1]:
# 1. CONFIGURAÇÃO INICIAL
from chat_client import ChatClient
import time

# Configurar cliente
client = ChatClient(base_url="http://localhost:8000")

print("✅ Cliente configurado")
print("✅ URL da API:", client.base_url)

# Verificar status da API
try:
    health = client.health_check()
    print("✅ API funcionando:", health)
except:
    print("❌ API não está respondendo. Execute: docker compose up -d")

✅ Cliente configurado
✅ URL da API: http://localhost:8000
✅ API funcionando: {'status': 'saudavel', 'ollama': 'disponivel', 'url': 'http://ollama-server:11434'}


In [None]:
# 2. VERIFICAR MODELOS DISPONÍVEIS
print("Verificando modelos disponíveis...")

# Listar modelos já instalados
modelos_disponiveis = client.listar_modelos()
print(f"Modelos instalados: {modelos_disponiveis}")

# Verificar se temos os modelos necessários
for modelo in modelos_a_baixar:
    if modelo in modelos_disponiveis:
        print(f"✓ {modelo}: disponível")
    else:
        print(f"✗ {modelo}: não encontrado, baixando")
        client.baixar_modelo(modelo)

print("\nPronto para usar os modelos disponíveis!")

In [None]:
# 3. TESTE SIMPLES
pergunta = "O que é transporte ferroviário?"

print("Testando TinyLLama...")
print(f"Pergunta: {pergunta}")
print("Aguarde... (pode demorar 30-60s)")

try:
    inicio = time.time()
    resposta = client.chat(pergunta, modelo="tinyllama:latest", stream=False)
    tempo = time.time() - inicio
    
    print(f"\nTempo de resposta: {tempo:.1f}s")
    print(f"\nResposta do TinyLLama:")
    print("=" * 50)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
    else:
        print(str(resposta))
    print("=" * 50)
    print("\nTeste concluído! Modelo funcionando.")
    
except Exception as e:
    print(f"Erro na conexão: {str(e)}")
    print("Dica: Verifique se o Docker está rodando com 'docker compose up -d'")

In [None]:
# 4. EXEMPLO PRATICO - Analise de Viabilidade
modelo_escolhido = "tinyllama:latest"  # Modelo mais confiavel

pergunta_tecnica = """
Liste os principais fatores para analisar a viabilidade de uma ferrovia 
para passageiros em Minas Gerais. Considere aspectos economicos e tecnicos.
"""

print(f"Modelo: {modelo_escolhido}")
print(f"Pergunta: {pergunta_tecnica.strip()}")
print("\nProcessando... (30-60s)")

try:
    inicio = time.time()
    resposta = client.chat(pergunta_tecnica, modelo=modelo_escolhido, stream=False)
    tempo = time.time() - inicio

    print(f"\nTempo: {tempo:.1f}s")
    print(f"\nAnalise Tecnica:")
    print("=" * 60)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
        print("\nDica: O modelo pode estar ocupado, tente novamente.")
    else:
        print(str(resposta))
    print("=" * 60)
    
except Exception as e:
    print(f"Erro: {str(e)}")
    print("Dica: Verifique a conexao Docker")

In [None]:
# 5. SUA CONSULTA PERSONALIZADA
# Modifique a pergunta abaixo e execute para suas proprias analises

# Escolha o modelo (tinyllama:latest é mais rapido e confiavel)
modelo = "tinyllama:latest"
modelo = "tinydolphin:latest"  
modelo = "qwen2:1.5b"  # Modelo mais confiavel
# modelo = "deepcoder:1.5b"     # Erro de resposta, timeout
# modelo = "exaone-deep:2.4b"   # Erro de resposta, timeout
# modelo = "stablelm2:1.6b"     # Resultado 100% errado
modelo = "qwen3:1.7b"         # Erro de resposta, timeout

# Sua pergunta personalizada - MODIFIQUE AQUI:
# os dados sempres estarão assim:  <key>: <value>

print(f"Modelo selecionado: {modelo}")
print("\nProcessando...")

# Adicionar contexto para melhorar resposta
prompt = f"""
você foi designado a responder o formulario <json> com base nos dados no <contexto>,
então responda rapidamente e com precisão.

# Formulario JSON:
<json>
{{
    "Proposta": value1,
    "Código": value2,
    "Categoria": value3,
    "Tipo de empreendimento": ["empreendimento1", "empreendimento2", "empreendimento3" ...], # RESPONDA COM OS NOMES DOS EMPREENDIMENTOS

    "Extensão (km)": value5,
    "Tipo bitola": value6,
    "Total de estações": value7,
    "Estações atendidas": ["estação1", "estação2", "estação3" ...], # RESPONDA COM OS NOMES DE ESTAÇÕES

    "Tempo de viagem ida (min)": value9,
    "Tempo de viagem ida & volta (min)": value10,
    "Viagens (mês)": value11,
    "Dias de operação (mês)": value12,
    "Demanda (mês)": value13,
    "Produção quilométrica (km/mês)": value14,
    "Tarifa do serviço": value15,

    "Receita anual (R$)": value16,
    "Pass.ano/km": value17,
    "Receita.ano/km": value18
}}
</json>

# Fonte de dados:
<contexto> 
{contexto}
</contexto> 

<tarefa>
extraia os dados da fonde dados com a tag <contexto> e preencha o json com tag <json> nos campos value1, value2, etc.
</tarefa>

<resposta>
retorne o formulario JSON preenchido, e quando falar dele inicie com a tag <json> e quando finalizar insira a tag </json>.
</resposta>
"""

try:
    inicio = time.time()
    resposta = client.chat(prompt, modelo=modelo, stream=False, timeout=6000)
    tempo = time.time() - inicio

    print(f"\nTempo: {tempo:.1f}s")
    print(f"\nResposta Especializada:")
    print("=" * 60)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
    else:
        print(str(resposta))
    print("=" * 60)
    
    print("\nPara fazer outra pergunta:")
    print("1. Modifique a variavel 'sua_pergunta' acima")
    print("2. Execute esta celula novamente")
except Exception as e:
    print(f"Erro: {str(e)}")
    print("Verifique se o Docker está rodando: docker compose up -d")

In [None]:
from pdf_processor import PDFReader, DataStructureDetector
import json

# Adicionar contexto para melhorar resposta
prompt      = """
você foi designado a responder o formulario <json> com base nos dados no <contexto>,
então responda com precisão, e para ajuda leia as <regras> abaixo:

# Regras:
<regras>
1. Responda com precisão e clareza.
2. Use os nomes exatos dos empreendimentos e estações conforme aparecem no texto.
3. Geralmente o dado esta logo depois dos dois pontos (:).
4. Atente-se a casos com mais de uma resposta possível, como em "Tipo de empreendimento" e "Estações atendidas".
5. A key do <json> está exatamente conforme o formulario, isso facilita a sua busca nos dados em <contexto>
6. Se não encontrar um dado, deixe o campo vazio ou com valor nulo.
7. Leia os comentarios ## com atenção, eles ajudam a entender o que deve ser preenchido.
8. Leia a mudança de topico com #, dentro do contexto também e dividido por tópicos.
9. Ao responder remova os comentarios ## e os divisores de tópicos #
</regras>

# Formulario JSON:
<json>
{{
    "Proposta": value1, ## NOME DA PROPOSTA QUE E DIFERENTE DO "Código"
    "Código": value2, ## CÓDIGO DA PROPOSTA QUE E DIFERENTE DA "Proposta"
    "Categoria": value3,
    "Tipo de empreendimento": ["empreendimento1", "empreendimento2", "empreendimento3" ...], ## RESPONDA COM OS NOMES DOS EMPREENDIMENTOS

    # Dados operacionais: 
    "Extensão (km)": value5,
    "Tipo bitola": value6,
    "Total de estações": value7,
    "Estações atendidas": ["estação1", "estação2", "estação3" ...], ## RESPONDA COM OS NOMES DE ESTAÇÕES

    # Demanda e receita:
    "Tempo de viagem ida (min)": value9,
    "Tempo de viagem ida & volta (min)": value10,
    "Viagens (mês)": value11,
    "Dias de operação (mês)": value12,
    "Demanda (mês)": value13,
    "Produção quilométrica (km/mês)": value14,
    "Tarifa do serviço": value15,

    # Desempenho da linha:
    "Receita anual (R$)": value16,
    "Pass.ano/km": value17,
    "Receita.ano/km": value18,
    
    # Características da frota:
    "Frota Total (operacional + reserva)": value19,
    "Total de carros de passageiros/trem": value20,
    "Tipo carros": ["carro_tipo1", "carro_tipo2", "carro_tipo3" ...], ## RESPONDA COM NOME DOS TIPOS DE CARROS
    "Quantidade/composição": [value21, value22, value23], ## RESPONDA COM OS NÚMERO PARA CADA TIPO CARRO
    "Especificação": ["especificação1", "especificação2", "especificação3" ...], ## RESPONDA COM AS ESPECIFICAÇÕES DOS TIPOS DE CARROS LISTADOS
    "Capacidade (PAX/viagem): value21
}}
</json>

# Fonte de dados:
<contexto> 
{}
</contexto> 

<tarefa>
extraia os dados da fonde de dados com a tag <contexto> e preencha o formulario com tag <json> nos campos value1, value2, etc.
</tarefa>

<resposta>
retorne o formulario <json> preenchido, ao falar dele abra com <json> e ao terminar de falar dele feche com a tag </json>.
</resposta>
"""

modelo      = "qwen3:1.7b"

path_pdf    = "D:\\CODEMGE\\PROJETOS\\modelagem-transporte-pessoas\\Documents\\Plano Estratégico Ferroviário (PEF)\\Relatorio_PEF_Minas_2021_ANEXOS.pdf"
PDFTool     = PDFReader(path_pdf, verbose=False)

# results     = {}
# for page in range(207+2, 244+2, 2):
for page in [223, 241]:
    if page not in results:
        results[page]   = {}
    text_start_page     = PDFTool.extract_text_from_page(page)
    text_next_page      = PDFTool.extract_text_from_page(page+1)
    if text_start_page and text_next_page:
        text_start_page = text_start_page[0]
        text_next_page  = text_next_page[0]
        if "text" in text_start_page and "text" in text_next_page:
            results[page]["text"] = text_start_page["text"] + " \n\n " + text_next_page["text"]
            resposta    = client.chat(prompt.format(results[page]["text"]), modelo=modelo, stream=False, timeout=6000)
            results[page]["parsed_llm"] = resposta["resposta"]
            with open("PARSED_LLM.json", "w", encoding="utf-8") as file:
                json.dump(results, file, ensure_ascii=False)
        