In [4]:
import pandas as pd
from sqlalchemy import create_engine
import warnings

warnings.filterwarnings('ignore')

# String de conexão para o nosso banco de dados PostgreSQL
db_url = "postgresql://imunno_user:imunno_password@localhost:5432/imunno_db"

# Cria a "ponte" de conexão
engine = create_engine(db_url)

print("Conexão com o banco de dados pronta.")

Conexão com o banco de dados pronta.


In [5]:
# Carrega os dados da tabela 'events' para um DataFrame do Pandas
try:
    df_files = pd.read_sql("SELECT * FROM events", engine)
    print(f"Carregados {len(df_files)} eventos de arquivo.")
    display(df_files.head())
except Exception as e:
    print(f"Erro ao carregar eventos de arquivo: {e}")

# Carrega os dados da tabela 'process_events'
try:
    df_processes = pd.read_sql("SELECT * FROM process_events", engine)
    print(f"\nCarregados {len(df_processes)} eventos de processo.")
    display(df_processes.head())
except Exception as e:
    print(f"Erro ao carregar eventos de processo: {e}")

Carregados 1 eventos de arquivo.


Unnamed: 0,id,agent_id,hostname,file_path,file_hash_sha256,event_type,event_timestamp,threat_score,analysis_findings,created_at
0,1,agent-001,fb7c7888e36d,/data/cavalo-de-troia.php,27e740538aaf0d557544099dbb56be12d359e1016edbaa...,CREATE,2025-07-07 14:04:42.574751+00:00,125,"[Função perigosa 'eval', Função perigosa 'shel...",2025-07-07 14:04:42.577498+00:00



Carregados 0 eventos de processo.


Unnamed: 0,id,agent_id,hostname,event_timestamp,process_id,parent_id,command,username,created_at


In [6]:
from sklearn.ensemble import IsolationForest
import joblib

# Por enquanto, vamos usar apenas a pontuação de ameaça dos arquivos como nossa primeira "feature"
# para ensinar o modelo. É um começo simples e poderoso.
features = df_files[['threat_score']]

# Cria o nosso modelo de Detecção de Anomalia (Isolation Forest)
# O parâmetro 'contamination' diz ao modelo qual a porcentagem aproximada de anomalias
# que esperamos encontrar. Um valor baixo é bom para começar.
model = IsolationForest(n_estimators=100, contamination=0.01, random_state=42)

# TREINAMENTO: O modelo "estuda" os dados para aprender o que é normal.
print("Iniciando o treinamento do modelo de IA...")
model.fit(features)
print("Treinamento concluído!")

# SALVANDO A INTELIGÊNCIA: Salvamos o modelo treinado em um arquivo.
# Este arquivo é o "cérebro" que nosso serviço FastAPI irá usar.
model_filename = 'imunno_model.joblib'
joblib.dump(model, model_filename)

print(f"Modelo salvo com sucesso no arquivo: {model_filename}")

Iniciando o treinamento do modelo de IA...
Treinamento concluído!
Modelo salvo com sucesso no arquivo: imunno_model.joblib
