# üöÇ Sistema Ollama + FastAPI
## Modelos de IA para An√°lise de Transporte Ferrovi√°rio

Este notebook permite usar modelos de linguagem local para an√°lises de transporte:
- **TinyLLama**: Modelo r√°pido e leve (1.1B par√¢metros)
- **Qwen2:1.5b**: Modelo mais preciso (1.5B par√¢metros) - pode ser lento

### ‚ö° Como usar:
1. **IMPORTANTE**: Certifique-se de que o Docker esteja rodando: `docker compose up -d`
2. Execute a **C√©lula 1**: Configura√ß√£o inicial
3. Execute a **C√©lula 2**: Verificar modelos dispon√≠veis  
4. Execute a **C√©lula 3**: Teste r√°pido
5. Use as **C√©lulas 4-5**: Para consultas espec√≠ficas

### ‚ö†Ô∏è Notas importantes:
- Os modelos podem demorar 30-60s para responder
- Se der timeout, tente novamente ou use o TinyLLama
- Primeiro download dos modelos pode demorar v√°rios minutos

In [1]:
# 1. CONFIGURA√á√ÉO INICIAL
from chat_client import ChatClient
import time

# Configurar cliente
client = ChatClient(base_url="http://localhost:8000")

print("‚úÖ Cliente configurado")
print("‚úÖ URL da API:", client.base_url)

# Verificar status da API
try:
    health = client.health_check()
    print("‚úÖ API funcionando:", health)
except:
    print("‚ùå API n√£o est√° respondendo. Execute: docker compose up -d")

‚úÖ Cliente configurado
‚úÖ URL da API: http://localhost:8000
‚úÖ API funcionando: {'status': 'saudavel', 'ollama': 'disponivel', 'url': 'http://ollama-server:11434'}


In [None]:
# 2. VERIFICAR MODELOS DISPON√çVEIS
print("Verificando modelos dispon√≠veis...")

# Listar modelos j√° instalados
modelos_disponiveis = client.listar_modelos()
print(f"Modelos instalados: {modelos_disponiveis}")

# Verificar se temos os modelos necess√°rios
for modelo in modelos_a_baixar:
    if modelo in modelos_disponiveis:
        print(f"‚úì {modelo}: dispon√≠vel")
    else:
        print(f"‚úó {modelo}: n√£o encontrado, baixando")
        client.baixar_modelo(modelo)

print("\nPronto para usar os modelos dispon√≠veis!")

In [None]:
# 3. TESTE SIMPLES
pergunta = "O que √© transporte ferrovi√°rio?"

print("Testando TinyLLama...")
print(f"Pergunta: {pergunta}")
print("Aguarde... (pode demorar 30-60s)")

try:
    inicio = time.time()
    resposta = client.chat(pergunta, modelo="tinyllama:latest", stream=False)
    tempo = time.time() - inicio
    
    print(f"\nTempo de resposta: {tempo:.1f}s")
    print(f"\nResposta do TinyLLama:")
    print("=" * 50)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
    else:
        print(str(resposta))
    print("=" * 50)
    print("\nTeste conclu√≠do! Modelo funcionando.")
    
except Exception as e:
    print(f"Erro na conex√£o: {str(e)}")
    print("Dica: Verifique se o Docker est√° rodando com 'docker compose up -d'")

In [None]:
# 4. EXEMPLO PRATICO - Analise de Viabilidade
modelo_escolhido = "tinyllama:latest"  # Modelo mais confiavel

pergunta_tecnica = """
Liste os principais fatores para analisar a viabilidade de uma ferrovia 
para passageiros em Minas Gerais. Considere aspectos economicos e tecnicos.
"""

print(f"Modelo: {modelo_escolhido}")
print(f"Pergunta: {pergunta_tecnica.strip()}")
print("\nProcessando... (30-60s)")

try:
    inicio = time.time()
    resposta = client.chat(pergunta_tecnica, modelo=modelo_escolhido, stream=False)
    tempo = time.time() - inicio

    print(f"\nTempo: {tempo:.1f}s")
    print(f"\nAnalise Tecnica:")
    print("=" * 60)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
        print("\nDica: O modelo pode estar ocupado, tente novamente.")
    else:
        print(str(resposta))
    print("=" * 60)
    
except Exception as e:
    print(f"Erro: {str(e)}")
    print("Dica: Verifique a conexao Docker")

In [None]:
# 5. SUA CONSULTA PERSONALIZADA
# Modifique a pergunta abaixo e execute para suas proprias analises

# Escolha o modelo (tinyllama:latest √© mais rapido e confiavel)
modelo = "tinyllama:latest"
modelo = "tinydolphin:latest"  
modelo = "qwen2:1.5b"  # Modelo mais confiavel
# modelo = "deepcoder:1.5b"     # Erro de resposta, timeout
# modelo = "exaone-deep:2.4b"   # Erro de resposta, timeout
# modelo = "stablelm2:1.6b"     # Resultado 100% errado
modelo = "qwen3:1.7b"         # Erro de resposta, timeout

# Sua pergunta personalizada - MODIFIQUE AQUI:
# os dados sempres estar√£o assim:  <key>: <value>

print(f"Modelo selecionado: {modelo}")
print("\nProcessando...")

# Adicionar contexto para melhorar resposta
prompt = f"""
voc√™ foi designado a responder o formulario <json> com base nos dados no <contexto>,
ent√£o responda rapidamente e com precis√£o.

# Formulario JSON:
<json>
{{
    "Proposta": value1,
    "C√≥digo": value2,
    "Categoria": value3,
    "Tipo de empreendimento": ["empreendimento1", "empreendimento2", "empreendimento3" ...], # RESPONDA COM OS NOMES DOS EMPREENDIMENTOS

    "Extens√£o (km)": value5,
    "Tipo bitola": value6,
    "Total de esta√ß√µes": value7,
    "Esta√ß√µes atendidas": ["esta√ß√£o1", "esta√ß√£o2", "esta√ß√£o3" ...], # RESPONDA COM OS NOMES DE ESTA√á√ïES

    "Tempo de viagem ida (min)": value9,
    "Tempo de viagem ida & volta (min)": value10,
    "Viagens (m√™s)": value11,
    "Dias de opera√ß√£o (m√™s)": value12,
    "Demanda (m√™s)": value13,
    "Produ√ß√£o quilom√©trica (km/m√™s)": value14,
    "Tarifa do servi√ßo": value15,

    "Receita anual (R$)": value16,
    "Pass.ano/km": value17,
    "Receita.ano/km": value18
}}
</json>

# Fonte de dados:
<contexto> 
{contexto}
</contexto> 

<tarefa>
extraia os dados da fonde dados com a tag <contexto> e preencha o json com tag <json> nos campos value1, value2, etc.
</tarefa>

<resposta>
retorne o formulario JSON preenchido, e quando falar dele inicie com a tag <json> e quando finalizar insira a tag </json>.
</resposta>
"""

try:
    inicio = time.time()
    resposta = client.chat(prompt, modelo=modelo, stream=False, timeout=6000)
    tempo = time.time() - inicio

    print(f"\nTempo: {tempo:.1f}s")
    print(f"\nResposta Especializada:")
    print("=" * 60)
    if 'resposta' in resposta:
        print(resposta['resposta'])
    elif 'erro' in resposta:
        print(f"Erro: {resposta['erro']}")
    else:
        print(str(resposta))
    print("=" * 60)
    
    print("\nPara fazer outra pergunta:")
    print("1. Modifique a variavel 'sua_pergunta' acima")
    print("2. Execute esta celula novamente")
except Exception as e:
    print(f"Erro: {str(e)}")
    print("Verifique se o Docker est√° rodando: docker compose up -d")

In [None]:
from pdf_processor import PDFReader, DataStructureDetector
import json

# Adicionar contexto para melhorar resposta
prompt      = """
voc√™ foi designado a responder o formulario <json> com base nos dados no <contexto>,
ent√£o responda com precis√£o, e para ajuda leia as <regras> abaixo:

# Regras:
<regras>
1. Responda com precis√£o e clareza.
2. Use os nomes exatos dos empreendimentos e esta√ß√µes conforme aparecem no texto.
3. Geralmente o dado esta logo depois dos dois pontos (:).
4. Atente-se a casos com mais de uma resposta poss√≠vel, como em "Tipo de empreendimento" e "Esta√ß√µes atendidas".
5. A key do <json> est√° exatamente conforme o formulario, isso facilita a sua busca nos dados em <contexto>
6. Se n√£o encontrar um dado, deixe o campo vazio ou com valor nulo.
7. Leia os comentarios ## com aten√ß√£o, eles ajudam a entender o que deve ser preenchido.
8. Leia a mudan√ßa de topico com #, dentro do contexto tamb√©m e dividido por t√≥picos.
9. Ao responder remova os comentarios ## e os divisores de t√≥picos #
</regras>

# Formulario JSON:
<json>
{{
    "Proposta": value1, ## NOME DA PROPOSTA QUE E DIFERENTE DO "C√≥digo"
    "C√≥digo": value2, ## C√ìDIGO DA PROPOSTA QUE E DIFERENTE DA "Proposta"
    "Categoria": value3,
    "Tipo de empreendimento": ["empreendimento1", "empreendimento2", "empreendimento3" ...], ## RESPONDA COM OS NOMES DOS EMPREENDIMENTOS

    # Dados operacionais: 
    "Extens√£o (km)": value5,
    "Tipo bitola": value6,
    "Total de esta√ß√µes": value7,
    "Esta√ß√µes atendidas": ["esta√ß√£o1", "esta√ß√£o2", "esta√ß√£o3" ...], ## RESPONDA COM OS NOMES DE ESTA√á√ïES

    # Demanda e receita:
    "Tempo de viagem ida (min)": value9,
    "Tempo de viagem ida & volta (min)": value10,
    "Viagens (m√™s)": value11,
    "Dias de opera√ß√£o (m√™s)": value12,
    "Demanda (m√™s)": value13,
    "Produ√ß√£o quilom√©trica (km/m√™s)": value14,
    "Tarifa do servi√ßo": value15,

    # Desempenho da linha:
    "Receita anual (R$)": value16,
    "Pass.ano/km": value17,
    "Receita.ano/km": value18,
    
    # Caracter√≠sticas da frota:
    "Frota Total (operacional + reserva)": value19,
    "Total de carros de passageiros/trem": value20,
    "Tipo carros": ["carro_tipo1", "carro_tipo2", "carro_tipo3" ...], ## RESPONDA COM NOME DOS TIPOS DE CARROS
    "Quantidade/composi√ß√£o": [value21, value22, value23], ## RESPONDA COM OS N√öMERO PARA CADA TIPO CARRO
    "Especifica√ß√£o": ["especifica√ß√£o1", "especifica√ß√£o2", "especifica√ß√£o3" ...], ## RESPONDA COM AS ESPECIFICA√á√ïES DOS TIPOS DE CARROS LISTADOS
    "Capacidade (PAX/viagem): value21
}}
</json>

# Fonte de dados:
<contexto> 
{}
</contexto> 

<tarefa>
extraia os dados da fonde de dados com a tag <contexto> e preencha o formulario com tag <json> nos campos value1, value2, etc.
</tarefa>

<resposta>
retorne o formulario <json> preenchido, ao falar dele abra com <json> e ao terminar de falar dele feche com a tag </json>.
</resposta>
"""

modelo      = "qwen3:1.7b"

path_pdf    = "D:\\CODEMGE\\PROJETOS\\modelagem-transporte-pessoas\\Documents\\Plano Estrat√©gico Ferrovi√°rio (PEF)\\Relatorio_PEF_Minas_2021_ANEXOS.pdf"
PDFTool     = PDFReader(path_pdf, verbose=False)

# results     = {}
# for page in range(207+2, 244+2, 2):
for page in [223, 241]:
    if page not in results:
        results[page]   = {}
    text_start_page     = PDFTool.extract_text_from_page(page)
    text_next_page      = PDFTool.extract_text_from_page(page+1)
    if text_start_page and text_next_page:
        text_start_page = text_start_page[0]
        text_next_page  = text_next_page[0]
        if "text" in text_start_page and "text" in text_next_page:
            results[page]["text"] = text_start_page["text"] + " \n\n " + text_next_page["text"]
            resposta    = client.chat(prompt.format(results[page]["text"]), modelo=modelo, stream=False, timeout=6000)
            results[page]["parsed_llm"] = resposta["resposta"]
            with open("PARSED_LLM.json", "w", encoding="utf-8") as file:
                json.dump(results, file, ensure_ascii=False)
        