# 🔍 Teste LangChain SQL Toolkit com Gemini 2.5 Pro
## Projeto PROAtivo - Testes de LLM para SQL

Este notebook demonstra o uso das **4 ferramentas principais** do LangChain SQL Toolkit:

1. **QuerySQLDataBaseTool** - Executa queries SQL
2. **InfoSQLDatabaseTool** - Obtém schema e amostras de tabelas
3. **ListSQLDatabaseTool** - Lista tabelas disponíveis  
4. **QuerySQLCheckerTool** - Valida queries antes da execução

**🎯 Objetivo**: Testar conectividade e funcionalidade com o PostgreSQL do projeto PROAtivo rodando no Docker Desktop.

---

### ⚙️ Configurações do Ambiente:
- **LLM**: Google Gemini 2.5 Pro
- **Banco**: PostgreSQL (Docker - localhost:5432)
- **Database**: proativo_db
- **Framework**: LangChain SQL Toolkit


## 📦 Instalação de Dependências

As bibliotecas necessárias para este teste:


In [1]:
# Instalar dependências necessárias
%pip install -q langchain-community langchain-google-genai psycopg2-binary sqlalchemy


Note: you may need to restart the kernel to use updated packages.


## 📥 Importações e Configurações


In [2]:
import os
import getpass
from sqlalchemy import create_engine, text

# Importações do LangChain
from langchain_community.utilities.sql_database import SQLDatabase
from langchain_community.agent_toolkits.sql.toolkit import SQLDatabaseToolkit
from langchain_google_genai import ChatGoogleGenerativeAI

# Importações das ferramentas individuais
from langchain_community.tools.sql_database.tool import (
    InfoSQLDatabaseTool,
    ListSQLDatabaseTool,
    QuerySQLCheckerTool,
    QuerySQLDataBaseTool,
)

print("✅ Importações realizadas com sucesso!")


✅ Importações realizadas com sucesso!


### 🔑 Configuração da API do Google Gemini

**Importante**: Você precisará inserir sua chave da API do Google Gemini quando solicitado.


In [3]:
# Configurar API do Google Gemini
# Tenta carregar da variável de ambiente primeiro, senão solicita input
if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("🔑 Digite sua Google API Key: ")
    
print("✅ Google API Key configurada!")


🔑 Digite sua Google API Key:  ········


✅ Google API Key configurada!


✅ Google API Key configurada!


### 🐘 Configuração da Conexão PostgreSQL

Conectando com o banco PostgreSQL do projeto PROAtivo rodando no Docker Desktop:


In [4]:
# Configurações do PostgreSQL (Docker Local)
DB_CONFIG = {
    "host": "localhost",
    "port": "5432", 
    "database": "proativo_db",
    "user": "proativo_user",
    "password": "proativo_password"  # Senha padrão do docker-compose
}

# Criar a URL de conexão
DATABASE_URL = f"postgresql+psycopg2://{DB_CONFIG['user']}:{DB_CONFIG['password']}@{DB_CONFIG['host']}:{DB_CONFIG['port']}/{DB_CONFIG['database']}"

print(f"🔗 URL de Conexão: {DATABASE_URL.replace(DB_CONFIG['password'], '***')}")


🔗 URL de Conexão: postgresql+psycopg2://proativo_user:***@localhost:5432/proativo_db


In [5]:
# Criar engine e testar conexão
try:
    engine = create_engine(DATABASE_URL)
    
    # Testar conexão
    with engine.connect() as conn:
        result = conn.execute(text("SELECT 1")).fetchone()
        print("✅ Conexão com PostgreSQL estabelecida com sucesso!")
    
    # Criar objeto SQLDatabase do LangChain
    db = SQLDatabase(engine)
    print("✅ Objeto SQLDatabase criado com sucesso!")
    
except Exception as e:
    print(f"❌ Erro na conexão: {e}")
    print("\n🔧 Verifique se:")
    print("   1. Docker Desktop está rodando")
    print("   2. Container postgres está ativo: docker ps")
    print("   3. Porta 5432 está disponível")
    raise


✅ Conexão com PostgreSQL estabelecida com sucesso!
✅ Objeto SQLDatabase criado com sucesso!


### 🤖 Configuração do LLM - Gemini 2.5 Pro


In [6]:
# Configurar LLM Gemini 2.5 Pro
llm = ChatGoogleGenerativeAI(
    model="gemini-2.5-pro",  # Usar flash para testes (mais rápido e eficiente)
    temperature=0.1,  # Baixa temperatura para queries SQL mais precisas
    max_output_tokens=2048
)

# Testar o LLM
test_response = llm.invoke("Diga apenas 'Gemini funcionando!' em uma frase.")
print(f"🤖 Teste LLM: {test_response.content}")
print("✅ Gemini 2.5 Pro configurado com sucesso!")


🤖 Teste LLM: !Gemini funcionando
✅ Gemini 2.5 Pro configurado com sucesso!


## 🛠️ Configuração do SQL Toolkit

Agora vamos criar o toolkit com as 4 ferramentas principais:


In [7]:
# Criar o SQL Toolkit
toolkit = SQLDatabaseToolkit(db=db, llm=llm)

# Obter todas as ferramentas
tools = toolkit.get_tools()

print("🛠️ SQL Toolkit criado com sucesso!")
print(f"📊 Número de ferramentas disponíveis: {len(tools)}")
print("\n🔧 Ferramentas disponíveis:")
for i, tool in enumerate(tools, 1):
    print(f"   {i}. {tool.__class__.__name__}")
    print(f"      📝 Descrição: {tool.description[:100]}...")
    print()


🛠️ SQL Toolkit criado com sucesso!
📊 Número de ferramentas disponíveis: 4

🔧 Ferramentas disponíveis:
   1. QuerySQLDatabaseTool
      📝 Descrição: Input to this tool is a detailed and correct SQL query, output is a result from the database. If the...

   2. InfoSQLDatabaseTool
      📝 Descrição: Input to this tool is a comma-separated list of tables, output is the schema and sample rows for tho...

   3. ListSQLDatabaseTool
      📝 Descrição: Input is an empty string, output is a comma-separated list of tables in the database....

   4. QuerySQLCheckerTool
      📝 Descrição: Use this tool to double check if your query is correct before executing it. Always use this tool bef...



## 🧪 Teste das 4 Ferramentas Principais

Vamos testar cada ferramenta individualmente para entender seu funcionamento:


### 📋 1. ListSQLDatabaseTool - Listar Tabelas

Esta ferramenta lista todas as tabelas disponíveis no banco de dados:


In [8]:
# Teste 1: ListSQLDatabaseTool
list_tool = ListSQLDatabaseTool(db=db)

print("🔍 Executando ListSQLDatabaseTool...")
tables_result = list_tool.run("")

print("📋 Tabelas encontradas no banco proativo_db:")
print(tables_result)
print(f"\n✅ Total de tabelas listadas: {len(tables_result.split(', ')) if tables_result else 0}")


🔍 Executando ListSQLDatabaseTool...
📋 Tabelas encontradas no banco proativo_db:
data_history, equipments, failures, maintenances, upload_status, user_feedback

✅ Total de tabelas listadas: 6


### 📊 2. InfoSQLDatabaseTool - Obter Schema e Amostras

Esta ferramenta obtém o schema e amostras de linhas das tabelas especificadas:


In [10]:
# Teste 2: InfoSQLDatabaseTool
info_tool = InfoSQLDatabaseTool(db=db)

# Testar com algumas tabelas principais do projeto PROAtivo
tables_to_inspect = "equipments, maintenances, failures"

print(f"🔍 Executando InfoSQLDatabaseTool para: {tables_to_inspect}")
schema_result = info_tool.run(tables_to_inspect)

print("📊 Schema e amostras das tabelas:")
print(schema_result[:2000])  # Limitar output para legibilidade
if len(schema_result) > 2000:
    print(f"\n... (resultado truncado - total: {len(schema_result)} caracteres)")

print("\n✅ Schema obtido com sucesso!")


🔍 Executando InfoSQLDatabaseTool para: equipments, maintenances, failures
📊 Schema e amostras das tabelas:

CREATE TABLE equipments (
	id UUID NOT NULL, 
	code VARCHAR(50) NOT NULL, 
	name VARCHAR(200) NOT NULL, 
	description TEXT, 
	equipment_type VARCHAR(50) NOT NULL, 
	category VARCHAR(50), 
	criticality VARCHAR(20) NOT NULL, 
	location VARCHAR(200), 
	substation VARCHAR(100), 
	manufacturer VARCHAR(100), 
	model VARCHAR(100), 
	serial_number VARCHAR(100), 
	manufacturing_year INTEGER, 
	installation_date TIMESTAMP WITH TIME ZONE, 
	rated_voltage NUMERIC(10, 2), 
	rated_power NUMERIC(10, 2), 
	rated_current NUMERIC(10, 2), 
	status VARCHAR(20) NOT NULL, 
	is_critical BOOLEAN NOT NULL, 
	metadata_json JSONB, 
	created_at TIMESTAMP WITH TIME ZONE DEFAULT now() NOT NULL, 
	updated_at TIMESTAMP WITH TIME ZONE DEFAULT now() NOT NULL, 
	CONSTRAINT equipments_pkey PRIMARY KEY (id), 
	CONSTRAINT equipments_code_key UNIQUE NULLS DISTINCT (code), 
	CONSTRAINT ck_equipment_criticality CHECK (c

### ✅ 3. QuerySQLCheckerTool - Validar Query SQL

Esta ferramenta valida queries SQL antes da execução usando o LLM:


In [11]:
# Teste 3: QuerySQLCheckerTool
checker_tool = QuerySQLCheckerTool(db=db, llm=llm)

# Query de teste simples
test_query = "SELECT COUNT(*) FROM equipments LIMIT 10;"

print(f"🔍 Validando query: {test_query}")
validation_result = checker_tool.run(test_query)

print("✅ Resultado da validação:")
print(validation_result)

# Teste com query incorreta
wrong_query = "SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;"

print(f"\n🔍 Testando query incorreta: {wrong_query}")
wrong_validation = checker_tool.run(wrong_query)

print("❌ Resultado da validação (query incorreta):")
print(wrong_validation)

print("\n✅ QuerySQLCheckerTool testado com sucesso!")


🔍 Validando query: SELECT COUNT(*) FROM equipments LIMIT 10;
✅ Resultado da validação:
```sql
SELECT COUNT(*) FROM equipments;
```

🔍 Testando query incorreta: SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;
❌ Resultado da validação (query incorreta):
```sql
SELECT * FROM tabela_inexistente WHERE coluna_errada = 123;
```

✅ QuerySQLCheckerTool testado com sucesso!


### 🚀 4. QuerySQLDataBaseTool - Executar Query SQL

Esta ferramenta executa queries SQL no banco de dados e retorna os resultados:


In [12]:
# Teste 4: QuerySQLDataBaseTool
query_tool = QuerySQLDataBaseTool(db=db)

# Queries de teste progressivas
queries_test = [
    "SELECT 1 as test_connection;",
    "SELECT COUNT(*) as total_tables FROM information_schema.tables WHERE table_schema = 'public';",
    "SELECT table_name FROM information_schema.tables WHERE table_schema = 'public' LIMIT 5;",
]

for i, query in enumerate(queries_test, 1):
    print(f"🔍 Teste {i}: {query}")
    try:
        result = query_tool.run(query)
        print(f"✅ Resultado: {result}")
    except Exception as e:
        print(f"❌ Erro: {e}")
    print("-" * 50)

print("\n✅ QuerySQLDataBaseTool testado com sucesso!")


🔍 Teste 1: SELECT 1 as test_connection;
✅ Resultado: [(1,)]
--------------------------------------------------
🔍 Teste 2: SELECT COUNT(*) as total_tables FROM information_schema.tables WHERE table_schema = 'public';
✅ Resultado: [(6,)]
--------------------------------------------------
🔍 Teste 3: SELECT table_name FROM information_schema.tables WHERE table_schema = 'public' LIMIT 5;
✅ Resultado: [('user_feedback',), ('upload_status',), ('equipments',), ('maintenances',), ('data_history',)]
--------------------------------------------------

✅ QuerySQLDataBaseTool testado com sucesso!


  query_tool = QuerySQLDataBaseTool(db=db)


## 🎯 Resumo dos Testes

Se você chegou até aqui com sucesso, **parabéns!** Você conseguiu:

✅ **Conectar** o notebook com o PostgreSQL do Docker  
✅ **Configurar** o Gemini 2.5 Flash como LLM  
✅ **Testar** as 4 ferramentas principais do LangChain SQL Toolkit:

1. **ListSQLDatabaseTool** - Listou todas as tabelas
2. **InfoSQLDatabaseTool** - Obteve schemas e amostras  
3. **QuerySQLCheckerTool** - Validou queries com IA
4. **QuerySQLDataBaseTool** - Executou queries no banco

---

## 🚀 Próximos Passos

Agora que o ambiente está funcionando, você pode:

1. **Criar um agente conversacional** para consultas automáticas
2. **Integrar** com o sistema existente do PROAtivo  
3. **Testar queries complexas** específicas do domínio
4. **Implementar** validações automáticas mais robustas

---

### 💡 Dica
Este notebook pode ser usado como base para integrar o LangChain SQL Toolkit no sistema principal do PROAtivo, melhorando a camada de IA existente!


## 🔥 Teste Prático Final - Sistema Completo

Vamos fazer um teste prático usando todas as ferramentas em sequência:


In [13]:
# Teste prático completo - simulando um fluxo real
print("🔥 TESTE PRÁTICO COMPLETO - SISTEMA INTEGRADO")
print("=" * 60)

# 1. Listar tabelas
print("\n1️⃣ DESCOBRINDO TABELAS...")
tables = list_tool.run("")
print(f"Tabelas encontradas: {tables}")

# 2. Se existirem tabelas, obter info das principais
if tables and tables.strip():
    print("\n2️⃣ ANALISANDO ESTRUTURA...")
    # Pegar as primeiras tabelas para análise
    first_tables = ", ".join(tables.split(", ")[:3])  # Primeiras 3 tabelas
    schema_info = info_tool.run(first_tables)
    print(f"Schema das primeiras tabelas:\n{schema_info[:500]}...")

# 3. Criar e validar uma query
print("\n3️⃣ CRIANDO E VALIDANDO QUERY...")
test_query = "SELECT count(*) as total_registros FROM information_schema.tables WHERE table_schema = 'public';"

validated_query = checker_tool.run(test_query)
print(f"Query validada: {validated_query}")

# 4. Executar a query validada
print("\n4️⃣ EXECUTANDO QUERY...")
final_result = query_tool.run(validated_query)
print(f"Resultado final: {final_result}")

print("\n" + "=" * 60)
print("🎉 TESTE COMPLETO FINALIZADO COM SUCESSO!")
print("🚀 O LangChain SQL Toolkit está totalmente operacional!")
print("🔗 Conexão com PostgreSQL (Docker) funcionando perfeitamente!")
print("🤖 Gemini 2.5 Flash integrado e validando queries!")
print("=" * 60)


🔥 TESTE PRÁTICO COMPLETO - SISTEMA INTEGRADO

1️⃣ DESCOBRINDO TABELAS...
Tabelas encontradas: data_history, equipments, failures, maintenances, upload_status, user_feedback

2️⃣ ANALISANDO ESTRUTURA...
Schema das primeiras tabelas:

CREATE TABLE data_history (
	id UUID NOT NULL, 
	equipment_id UUID NOT NULL, 
	data_source VARCHAR(50) NOT NULL, 
	data_type VARCHAR(50) NOT NULL, 
	timestamp TIMESTAMP WITH TIME ZONE NOT NULL, 
	measurement_type VARCHAR(100), 
	measurement_value NUMERIC(15, 4), 
	measurement_unit VARCHAR(20), 
	text_value TEXT, 
	condition_status VARCHAR(50), 
	alert_level VARCHAR(20), 
	inspector VARCHAR(100), 
	collection_method VARCHAR(50), 
	source_file VARCHAR(255), 
	source_row INTEGER, 
	is_validated BO...

3️⃣ CRIANDO E VALIDANDO QUERY...
Query validada: ```sql
SELECT count(*) as total_registros FROM information_schema.tables WHERE table_schema = 'public';
```

4️⃣ EXECUTANDO QUERY...
Resultado final: Error: (psycopg2.errors.SyntaxError) syntax error at or near "``