# üîç Teste LangChain SQL Toolkit com Gemini 2.5 Pro
## Projeto PROAtivo - Testes de LLM para SQL

Este notebook demonstra o uso das **4 ferramentas principais** do LangChain SQL Toolkit:

1. **QuerySQLDataBaseTool** - Executa queries SQL
2. **InfoSQLDatabaseTool** - Obt√©m schema e amostras de tabelas
3. **ListSQLDatabaseTool** - Lista tabelas dispon√≠veis  
4. **QuerySQLCheckerTool** - Valida queries antes da execu√ß√£o

**üéØ Objetivo**: Testar conectividade e funcionalidade com o PostgreSQL do projeto PROAtivo rodando no Docker Desktop.

---

### ‚öôÔ∏è Configura√ß√µes do Ambiente:
- **LLM**: Google Gemini 2.5 Pro
- **Banco**: PostgreSQL (Docker - localhost:5432)
- **Database**: proativo_db
- **Framework**: LangChain SQL Toolkit


## üì¶ Instala√ß√£o de Depend√™ncias

As bibliotecas necess√°rias para este teste:


In [1]:
# Instalar depend√™ncias necess√°rias
%pip install -q langchain-community langchain-google-genai psycopg2-binary sqlalchemy


Note: you may need to restart the kernel to use updated packages.


## üì• Importa√ß√µes e Configura√ß√µes


In [2]:
import os
import getpass
from sqlalchemy import create_engine, text

# Importa√ß√µes do LangChain
from langchain_community.utilities.sql_database import SQLDatabase
from langchain_community.agent_toolkits.sql.toolkit import SQLDatabaseToolkit
from langchain_google_genai import ChatGoogleGenerativeAI

# Importa√ß√µes das ferramentas individuais
from langchain_community.tools.sql_database.tool import (
    InfoSQLDatabaseTool,
    ListSQLDatabaseTool,
    QuerySQLCheckerTool,
    QuerySQLDataBaseTool,
)

print("‚úÖ Importa√ß√µes realizadas com sucesso!")


‚úÖ Importa√ß√µes realizadas com sucesso!


### üîë Configura√ß√£o da API do Google Gemini

**Importante**: Voc√™ precisar√° inserir sua chave da API do Google Gemini quando solicitado.


In [3]:
# Configurar API do Google Gemini
# Tenta carregar da vari√°vel de ambiente primeiro, sen√£o solicita input
if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("üîë Digite sua Google API Key: ")
    
print("‚úÖ Google API Key configurada!")


üîë Digite sua Google API Key:  ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑


‚úÖ Google API Key configurada!


‚úÖ Google API Key configurada!


### üêò Configura√ß√£o da Conex√£o PostgreSQL

Conectando com o banco PostgreSQL do projeto PROAtivo rodando no Docker Desktop:


In [4]:
# Configura√ß√µes do PostgreSQL (Docker Local)
DB_CONFIG = {
    "host": "localhost",
    "port": "5432", 
    "database": "proativo_db",
    "user": "proativo_user",
    "password": "proativo_password"  # Senha padr√£o do docker-compose
}

# Criar a URL de conex√£o
DATABASE_URL = f"postgresql+psycopg2://{DB_CONFIG['user']}:{DB_CONFIG['password']}@{DB_CONFIG['host']}:{DB_CONFIG['port']}/{DB_CONFIG['database']}"

print(f"üîó URL de Conex√£o: {DATABASE_URL.replace(DB_CONFIG['password'], '***')}")


üîó URL de Conex√£o: postgresql+psycopg2://proativo_user:***@localhost:5432/proativo_db


In [5]:
# Criar engine e testar conex√£o
try:
    engine = create_engine(DATABASE_URL)
    
    # Testar conex√£o
    with engine.connect() as conn:
        result = conn.execute(text("SELECT 1")).fetchone()
        print("‚úÖ Conex√£o com PostgreSQL estabelecida com sucesso!")
    
    # Criar objeto SQLDatabase do LangChain
    db = SQLDatabase(engine)
    print("‚úÖ Objeto SQLDatabase criado com sucesso!")
    
except Exception as e:
    print(f"‚ùå Erro na conex√£o: {e}")
    print("\nüîß Verifique se:")
    print("   1. Docker Desktop est√° rodando")
    print("   2. Container postgres est√° ativo: docker ps")
    print("   3. Porta 5432 est√° dispon√≠vel")
    raise


‚úÖ Conex√£o com PostgreSQL estabelecida com sucesso!
‚úÖ Objeto SQLDatabase criado com sucesso!


### ü§ñ Configura√ß√£o do LLM - Gemini 2.5 Pro


In [6]:
# Configurar LLM Gemini 2.5 Pro
llm = ChatGoogleGenerativeAI(
    model="gemini-2.5-pro",  # Usar flash para testes (mais r√°pido e eficiente)
    temperature=0.1,  # Baixa temperatura para queries SQL mais precisas
    max_output_tokens=2048
)

# Testar o LLM
test_response = llm.invoke("Diga apenas 'Gemini funcionando!' em uma frase.")
print(f"ü§ñ Teste LLM: {test_response.content}")
print("‚úÖ Gemini 2.5 Pro configurado com sucesso!")


ü§ñ Teste LLM: !Gemini funcionando
‚úÖ Gemini 2.5 Pro configurado com sucesso!


## üõ†Ô∏è Configura√ß√£o do SQL Toolkit

Agora vamos criar o toolkit com as 4 ferramentas principais:


In [7]:
# Criar o SQL Toolkit
toolkit = SQLDatabaseToolkit(db=db, llm=llm)

# Obter todas as ferramentas
tools = toolkit.get_tools()

print("üõ†Ô∏è SQL Toolkit criado com sucesso!")
print(f"üìä N√∫mero de ferramentas dispon√≠veis: {len(tools)}")
print("\nüîß Ferramentas dispon√≠veis:")
for i, tool in enumerate(tools, 1):
    print(f"   {i}. {tool.__class__.__name__}")
    print(f"      üìù Descri√ß√£o: {tool.description[:100]}...")
    print()


üõ†Ô∏è SQL Toolkit criado com sucesso!
üìä N√∫mero de ferramentas dispon√≠veis: 4

üîß Ferramentas dispon√≠veis:
   1. QuerySQLDatabaseTool
      üìù Descri√ß√£o: Input to this tool is a detailed and correct SQL query, output is a result from the database. If the...

   2. InfoSQLDatabaseTool
      üìù Descri√ß√£o: Input to this tool is a comma-separated list of tables, output is the schema and sample rows for tho...

   3. ListSQLDatabaseTool
      üìù Descri√ß√£o: Input is an empty string, output is a comma-separated list of tables in the database....

   4. QuerySQLCheckerTool
      üìù Descri√ß√£o: Use this tool to double check if your query is correct before executing it. Always use this tool bef...



## üß™ Teste das 4 Ferramentas Principais

Vamos testar cada ferramenta individualmente para entender seu funcionamento:


### üìã 1. ListSQLDatabaseTool - Listar Tabelas

Esta ferramenta lista todas as tabelas dispon√≠veis no banco de dados:


In [8]:
# Teste 1: ListSQLDatabaseTool
list_tool = ListSQLDatabaseTool(db=db)

print("üîç Executando ListSQLDatabaseTool...")
tables_result = list_tool.run("")

print("üìã Tabelas encontradas no banco proativo_db:")
print(tables_result)
print(f"\n‚úÖ Total de tabelas listadas: {len(tables_result.split(', ')) if tables_result else 0}")


üîç Executando ListSQLDatabaseTool...
üìã Tabelas encontradas no banco proativo_db:
data_history, equipments, failures, maintenances, upload_status, user_feedback

‚úÖ Total de tabelas listadas: 6


### üìä 2. InfoSQLDatabaseTool - Obter Schema e Amostras

Esta ferramenta obt√©m o schema e amostras de linhas das tabelas especificadas:


In [10]:
# Teste 2: InfoSQLDatabaseTool
info_tool = InfoSQLDatabaseTool(db=db)

# Testar com algumas tabelas principais do projeto PROAtivo
tables_to_inspect = "equipments, maintenances, failures"

print(f"üîç Executando InfoSQLDatabaseTool para: {tables_to_inspect}")
schema_result = info_tool.run(tables_to_inspect)

print("üìä Schema e amostras das tabelas:")
print(schema_result[:2000])  # Limitar output para legibilidade
if len(schema_result) > 2000:
    print(f"\n... (resultado truncado - total: {len(schema_result)} caracteres)")

print("\n‚úÖ Schema obtido com sucesso!")


üîç Executando InfoSQLDatabaseTool para: equipments, maintenances, failures
üìä Schema e amostras das tabelas:

CREATE TABLE equipments (
	id UUID NOT NULL, 
	code VARCHAR(50) NOT NULL, 
	name VARCHAR(200) NOT NULL, 
	description TEXT, 
	equipment_type VARCHAR(50) NOT NULL, 
	category VARCHAR(50), 
	criticality VARCHAR(20) NOT NULL, 
	location VARCHAR(200), 
	substation VARCHAR(100), 
	manufacturer VARCHAR(100), 
	model VARCHAR(100), 
	serial_number VARCHAR(100), 
	manufacturing_year INTEGER, 
	installation_date TIMESTAMP WITH TIME ZONE, 
	rated_voltage NUMERIC(10, 2), 
	rated_power NUMERIC(10, 2), 
	rated_current NUMERIC(10, 2), 
	status VARCHAR(20) NOT NULL, 
	is_critical BOOLEAN NOT NULL, 
	metadata_json JSONB, 
	created_at TIMESTAMP WITH TIME ZONE DEFAULT now() NOT NULL, 
	updated_at TIMESTAMP WITH TIME ZONE DEFAULT now() NOT NULL, 
	CONSTRAINT equipments_pkey PRIMARY KEY (id), 
	CONSTRAINT equipments_code_key UNIQUE NULLS DISTINCT (code), 
	CONSTRAINT ck_equipment_criticality CH

### ‚úÖ 3. QuerySQLCheckerTool - Validar Query SQL

Esta ferramenta valida queries SQL antes da execu√ß√£o usando o LLM:


In [11]:
# Teste 3: QuerySQLCheckerTool
checker_tool = QuerySQLCheckerTool(db=db, llm=llm)

# Query de teste simples
test_query = "SELECT COUNT(*) FROM equipments LIMIT 10;"

print(f"üîç Validando query: {test_query}")
validation_result = checker_tool.run(test_query)

print("‚úÖ Resultado da valida√ß√£o:")
print(validation_result)

# Teste com query incorreta
wrong_query = "SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;"

print(f"\nüîç Testando query incorreta: {wrong_query}")
wrong_validation = checker_tool.run(wrong_query)

print("‚ùå Resultado da valida√ß√£o (query incorreta):")
print(wrong_validation)

print("\n‚úÖ QuerySQLCheckerTool testado com sucesso!")


üîç Validando query: SELECT COUNT(*) FROM equipments LIMIT 10;
‚úÖ Resultado da valida√ß√£o:
```sql
SELECT COUNT(*) FROM equipments;
```

üîç Testando query incorreta: SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;
‚ùå Resultado da valida√ß√£o (query incorreta):
```sql
SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;
```

‚úÖ QuerySQLCheckerTool testado com sucesso!


### üöÄ 4. QuerySQLDataBaseTool - Executar Query SQL

Esta ferramenta executa queries SQL no banco de dados e retorna os resultados:


In [12]:
# Teste 4: QuerySQLDataBaseTool
query_tool = QuerySQLDataBaseTool(db=db)

# Queries de teste progressivas
queries_test = [
    "SELECT 1 as test_connection;",
    "SELECT COUNT(*) as total_tables FROM information_schema.tables WHERE table_schema = 'public';",
    "SELECT table_name FROM information_schema.tables WHERE table_schema = 'public' LIMIT 5;",
]

for i, query in enumerate(queries_test, 1):
    print(f"üîç Teste {i}: {query}")
    try:
        result = query_tool.run(query)
        print(f"‚úÖ Resultado: {result}")
    except Exception as e:
        print(f"‚ùå Erro: {e}")
    print("-" * 50)

print("\n‚úÖ QuerySQLDataBaseTool testado com sucesso!")


üîç Teste 1: SELECT 1 as test_connection;
‚úÖ Resultado: [(1,)]
--------------------------------------------------
üîç Teste 2: SELECT COUNT(*) as total_tables FROM information_schema.tables WHERE table_schema = 'public';
‚úÖ Resultado: [(6,)]
--------------------------------------------------
üîç Teste 3: SELECT table_name FROM information_schema.tables WHERE table_schema = 'public' LIMIT 5;
‚úÖ Resultado: [('user_feedback',), ('upload_status',), ('equipments',), ('maintenances',), ('data_history',)]
--------------------------------------------------

‚úÖ QuerySQLDataBaseTool testado com sucesso!


  query_tool = QuerySQLDataBaseTool(db=db)


## üéØ Resumo dos Testes

Se voc√™ chegou at√© aqui com sucesso, **parab√©ns!** Voc√™ conseguiu:

‚úÖ **Conectar** o notebook com o PostgreSQL do Docker  
‚úÖ **Configurar** o Gemini 2.5 Flash como LLM  
‚úÖ **Testar** as 4 ferramentas principais do LangChain SQL Toolkit:

1. **ListSQLDatabaseTool** - Listou todas as tabelas
2. **InfoSQLDatabaseTool** - Obteve schemas e amostras  
3. **QuerySQLCheckerTool** - Validou queries com IA
4. **QuerySQLDataBaseTool** - Executou queries no banco

---

## üöÄ Pr√≥ximos Passos

Agora que o ambiente est√° funcionando, voc√™ pode:

1. **Criar um agente conversacional** para consultas autom√°ticas
2. **Integrar** com o sistema existente do PROAtivo  
3. **Testar queries complexas** espec√≠ficas do dom√≠nio
4. **Implementar** valida√ß√µes autom√°ticas mais robustas

---

### üí° Dica
Este notebook pode ser usado como base para integrar o LangChain SQL Toolkit no sistema principal do PROAtivo, melhorando a camada de IA existente!


## üî• Teste Pr√°tico Final - Sistema Completo

Vamos fazer um teste pr√°tico usando todas as ferramentas em sequ√™ncia:


In [13]:
# Teste pr√°tico completo - simulando um fluxo real
print("üî• TESTE PR√ÅTICO COMPLETO - SISTEMA INTEGRADO")
print("=" * 60)

# 1. Listar tabelas
print("\n1Ô∏è‚É£ DESCOBRINDO TABELAS...")
tables = list_tool.run("")
print(f"Tabelas encontradas: {tables}")

# 2. Se existirem tabelas, obter info das principais
if tables and tables.strip():
    print("\n2Ô∏è‚É£ ANALISANDO ESTRUTURA...")
    # Pegar as primeiras tabelas para an√°lise
    first_tables = ", ".join(tables.split(", ")[:3])  # Primeiras 3 tabelas
    schema_info = info_tool.run(first_tables)
    print(f"Schema das primeiras tabelas:\n{schema_info[:500]}...")

# 3. Criar e validar uma query
print("\n3Ô∏è‚É£ CRIANDO E VALIDANDO QUERY...")
test_query = "SELECT count(*) as total_registros FROM information_schema.tables WHERE table_schema = 'public';"

validated_query = checker_tool.run(test_query)
print(f"Query validada: {validated_query}")

# 4. Executar a query validada
print("\n4Ô∏è‚É£ EXECUTANDO QUERY...")
final_result = query_tool.run(validated_query)
print(f"Resultado final: {final_result}")

print("\n" + "=" * 60)
print("üéâ TESTE COMPLETO FINALIZADO COM SUCESSO!")
print("üöÄ O LangChain SQL Toolkit est√° totalmente operacional!")
print("üîó Conex√£o com PostgreSQL (Docker) funcionando perfeitamente!")
print("ü§ñ Gemini 2.5 Flash integrado e validando queries!")
print("=" * 60)


üî• TESTE PR√ÅTICO COMPLETO - SISTEMA INTEGRADO

1Ô∏è‚É£ DESCOBRINDO TABELAS...
Tabelas encontradas: data_history, equipments, failures, maintenances, upload_status, user_feedback

2Ô∏è‚É£ ANALISANDO ESTRUTURA...
Schema das primeiras tabelas:

CREATE TABLE data_history (
	id UUID NOT NULL, 
	equipment_id UUID NOT NULL, 
	data_source VARCHAR(50) NOT NULL, 
	data_type VARCHAR(50) NOT NULL, 
	timestamp TIMESTAMP WITH TIME ZONE NOT NULL, 
	measurement_type VARCHAR(100), 
	measurement_value NUMERIC(15, 4), 
	measurement_unit VARCHAR(20), 
	text_value TEXT, 
	condition_status VARCHAR(50), 
	alert_level VARCHAR(20), 
	inspector VARCHAR(100), 
	collection_method VARCHAR(50), 
	source_file VARCHAR(255), 
	source_row INTEGER, 
	is_validated BO...

3Ô∏è‚É£ CRIANDO E VALIDANDO QUERY...
Query validada: ```sql
SELECT count(*) as total_registros FROM information_schema.tables WHERE table_schema = 'public';
```

4Ô∏è‚É£ EXECUTANDO QUERY...
Resultado final: Error: (psycopg2.errors.SyntaxError) syntax 