In [8]:
# Prosty SQL Agent dla analizy log√≥w sieciowych
# Jupyter Notebook

# 1. Imports i konfiguracja
import os
import sqlite3
import pandas as pd
from dotenv import load_dotenv

from langchain_openai import ChatOpenAI
from langchain_community.utilities.sql_database import SQLDatabase
from langchain_community.agent_toolkits.sql.toolkit import SQLDatabaseToolkit
from langchain_community.agent_toolkits.sql.base import create_sql_agent
from langchain.agents.agent_types import AgentType

# Za≈Çaduj zmienne ≈õrodowiskowe
load_dotenv()

# 2. Konfiguracja
class Config:
    DB_PATH = ".
    ./parser/logs.db"  # Zmie≈Ñ na swojƒÖ ≈õcie≈ºkƒô
    OPENAI_API_KEY = os.environ.get('OPENAI_API_KEY_TEG')

# 3. Inicjalizacja LLM
llm = ChatOpenAI(
    model_name="gpt-4o-mini",
    openai_api_key=Config.OPENAI_API_KEY,
    temperature=0,
)

print("‚úÖ LLM zainicjalizowany")

# 4. Po≈ÇƒÖczenie z bazƒÖ danych
try:
    db = SQLDatabase.from_uri(f"sqlite:///{Config.DB_PATH}")
    print("‚úÖ Po≈ÇƒÖczono z bazƒÖ danych")
    
    # Sprawd≈∫ tabele
    print("\nüìã Dostƒôpne tabele:")
    print(db.get_table_names())
    
    # Sprawd≈∫ strukturƒô tabeli logs
    print("\nüîç Struktura tabeli 'logs':")
    print(db.get_table_info(["logs"]))
    
except Exception as e:
    print(f"‚ùå B≈ÇƒÖd po≈ÇƒÖczenia z bazƒÖ: {e}")

# 5. Stworzenie SQL agenta
toolkit = SQLDatabaseToolkit(db=db, llm=llm)

sql_agent = create_sql_agent(
    llm=llm,
    toolkit=toolkit,
    agent_type=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True,  # Poka≈º proces my≈õlenia
    max_iterations=10,
    early_stopping_method="generate"
)

print("‚úÖ SQL Agent utworzony")

# 6. Funkcja pomocnicza do testowania
def zapytaj_agenta(pytanie):
    """
    Zadaj pytanie SQL agentowi
    """
    print(f"\nü§î PYTANIE: {pytanie}")
    print("="*60)
    
    try:
        odpowiedz = sql_agent.invoke({"input": pytanie})
        print(f"\n‚úÖ ODPOWIED≈π:")
        print(odpowiedz['output'])
        return odpowiedz
    except Exception as e:
        print(f"‚ùå B≈ÅƒÑD: {e}")
        return None

# 7. Sprawdzenie danych w bazie
print("\nüîç Sprawdzanie zawarto≈õci bazy...")

# Podstawowe statystyki
conn = sqlite3.connect(Config.DB_PATH)
cursor = conn.cursor()

# Liczba rekord√≥w
cursor.execute("SELECT COUNT(*) FROM logs")
total_rows = cursor.fetchone()[0]
print(f"üìä Ca≈Çkowita liczba rekord√≥w: {total_rows}")

# Zakres dat
cursor.execute("SELECT MIN(date) as min_date, MAX(date) as max_date FROM logs")
date_range = cursor.fetchone()
print(f"üìÖ Zakres dat: {date_range[0]} - {date_range[1]}")

# Top 5 u≈ºytkownik√≥w
cursor.execute("SELECT srcname, COUNT(*) as count FROM logs GROUP BY srcname ORDER BY count DESC LIMIT 5")
top_users = cursor.fetchall()
print(f"\nüë• Top 5 u≈ºytkownik√≥w:")
for user, count in top_users:
    print(f"  - {user}: {count} sesji")

# Top 5 aplikacji
cursor.execute("SELECT app, COUNT(*) as count FROM logs GROUP BY app ORDER BY count DESC LIMIT 5")
top_apps = cursor.fetchall()
print(f"\nüì± Top 5 aplikacji:")
for app, count in top_apps:
    print(f"  - {app}: {count} sesji")

conn.close()

# 8. Przyk≈Çadowe pytania do testowania
print("\nüß™ TESTY AGENTA")
print("="*60)

# Test 1: Podstawowe zapytanie
zapytaj_agenta("Ile rekord√≥w jest w tabeli logs?")

# Test 2: Zapytanie o u≈ºytkownika
zapytaj_agenta("Poka≈º mi 5 najaktywniejszych u≈ºytkownik√≥w")

# Test 3: Zapytanie o aplikacje
zapytaj_agenta("Kt√≥re aplikacje sƒÖ najczƒô≈õciej u≈ºywane?")

# Test 4: Zapytanie o czas
zapytaj_agenta("Jaki jest ca≈Çkowity czas spƒôdzony przez u≈ºytkownika Dawid w aplikacjach?")

# Test 5: Zapytanie o kategorie
zapytaj_agenta("Poka≈º podzia≈Ç na kategorie aplikacji (appcat)")

# 9. Interaktywna sesja
def interaktywna_sesja():
    """
    Uruchom interaktywnƒÖ sesjƒô z agentem
    """
    print("\nüöÄ INTERAKTYWNA SESJA Z SQL AGENTEM")
    print("Wpisz 'quit' aby zako≈Ñczyƒá")
    print("="*60)
    
    while True:
        pytanie = input("\n‚ùì Twoje pytanie: ")
        
        if pytanie.lower() in ['quit', 'exit', 'koniec']:
            print("üëã Do widzenia!")
            break
            
        if pytanie.strip():
            zapytaj_agenta(pytanie)

# Uruchom interaktywnƒÖ sesjƒô (odkomentuj poni≈ºej)
# interaktywna_sesja()

# 10. Przydatne funkcje pomocnicze
def pokaz_strukture_tabeli():
    """Poka≈º strukturƒô tabeli logs"""
    conn = sqlite3.connect(Config.DB_PATH)
    cursor = conn.cursor()
    
    cursor.execute("PRAGMA table_info(logs)")
    columns = cursor.fetchall()
    
    print("\nüìã STRUKTURA TABELI 'logs':")
    print("-" * 60)
    print(f"{'Kolumna':<20} {'Typ':<15} {'Nullable':<10}")
    print("-" * 60)
    
    for col in columns:
        nullable = "NO" if col[3] else "YES"
        print(f"{col[1]:<20} {col[2]:<15} {nullable:<10}")
    
    conn.close()

def pokaz_przykladowe_dane(limit=5):
    """Poka≈º przyk≈Çadowe dane z tabeli"""
    conn = sqlite3.connect(Config.DB_PATH)
    
    df = pd.read_sql_query(f"SELECT * FROM logs LIMIT {limit}", conn)
    print(f"\nüìä PRZYK≈ÅADOWE DANE ({limit} rekord√≥w):")
    print("="*100)
    print(df.to_string())
    
    conn.close()

# Uruchom funkcje pomocnicze
pokaz_strukture_tabeli()
pokaz_przykladowe_dane(3)

print("\nüéâ SQL Agent jest gotowy do u≈ºycia!")
print("üí° U≈ºyj funkcji zapytaj_agenta('twoje pytanie') aby zadaƒá pytanie")
print("üí° Lub uruchom interaktywna_sesja() dla trybu interaktywnego")       

‚úÖ LLM zainicjalizowany
‚úÖ Po≈ÇƒÖczono z bazƒÖ danych

üìã Dostƒôpne tabele:
['logs']

üîç Struktura tabeli 'logs':

CREATE TABLE logs (
	date TEXT, 
	time TEXT, 
	eventtime TEXT, 
	logid TEXT, 
	srcip TEXT, 
	srcname TEXT, 
	srcport INTEGER, 
	dstip TEXT, 
	dstport INTEGER, 
	proto INTEGER, 
	action TEXT, 
	policyname TEXT, 
	service TEXT, 
	transport TEXT, 
	appid TEXT, 
	app TEXT, 
	appcat TEXT, 
	apprisk TEXT, 
	duration INTEGER, 
	sentbyte INTEGER, 
	rcvdbyte INTEGER, 
	sentpkt INTEGER, 
	rcvdpkt INTEGER, 
	shapersentname TEXT, 
	osname TEXT, 
	mastersrcmac TEXT
)

/*
3 rows from logs table:
date	time	eventtime	logid	srcip	srcname	srcport	dstip	dstport	proto	action	policyname	service	transport	appid	app	appcat	apprisk	duration	sentbyte	rcvdbyte	sentpkt	rcvdpkt	shapersentname	osname	mastersrcmac
2025-05-16	10:19:02	1747383542538331649	0000000013	10.22.7.133	Dawid-s-S23	33232	57.144.112.141	443	6	close	LAN2WAN	HTTPS	33232	15832	Facebook	Social.Media	medium	1	2070	1707	9	7	medium

  print(db.get_table_names())


[32;1m[1;3mAction: sql_db_list_tables  
Action Input: ""  [0m[38;5;200m[1;3mlogs[0m[32;1m[1;3mI need to check the schema of the "logs" table to understand its structure and then count the records in it.  
Action: sql_db_schema  
Action Input: "logs"  [0m[33;1m[1;3m
CREATE TABLE logs (
	date TEXT, 
	time TEXT, 
	eventtime TEXT, 
	logid TEXT, 
	srcip TEXT, 
	srcname TEXT, 
	srcport INTEGER, 
	dstip TEXT, 
	dstport INTEGER, 
	proto INTEGER, 
	action TEXT, 
	policyname TEXT, 
	service TEXT, 
	transport TEXT, 
	appid TEXT, 
	app TEXT, 
	appcat TEXT, 
	apprisk TEXT, 
	duration INTEGER, 
	sentbyte INTEGER, 
	rcvdbyte INTEGER, 
	sentpkt INTEGER, 
	rcvdpkt INTEGER, 
	shapersentname TEXT, 
	osname TEXT, 
	mastersrcmac TEXT
)

/*
3 rows from logs table:
date	time	eventtime	logid	srcip	srcname	srcport	dstip	dstport	proto	action	policyname	service	transport	appid	app	appcat	apprisk	duration	sentbyte	rcvdbyte	sentpkt	rcvdpkt	shapersentname	osname	mastersrcmac
2025-05-16	10:19:02	174738354