<a href="https://colab.research.google.com/github/DimSouk/EKPA/blob/main/Colab_%CE%95%CF%85%CF%86%CF%85%CE%AD%CF%82_%CE%A3%CF%8D%CF%83%CF%84%CE%B7%CE%BC%CE%B1_%CE%9C%CE%B5_%CE%A3%CF%87%CF%8C%CE%BB%CE%B9%CE%B1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Ευφυές Σύστημα Ανίχνευσης Απειλών
Αυτό το Colab notebook υλοποιεί ένα μοντέλο μηχανικής μάθησης για την ανίχνευση κακόβουλης κίνησης δικτύου με χρήση του συνόλου δεδομένων DarkNet.csv. Όλα τα βήματα περιέχουν σχόλια για την κατανόηση της διαδικασίας.

In [None]:
# Εισάγουμε τις απαραίτητες βιβλιοθήκες για ανάλυση δεδομένων, οπτικοποίηση και μηχανική μάθηση
import pandas as pd  # για φόρτωση και διαχείριση δεδομένων
import numpy as np   # για αριθμητικούς υπολογισμούς
import matplotlib.pyplot as plt  # για γραφήματα
import seaborn as sns  # για πιο όμορφα γραφήματα
from sklearn.model_selection import train_test_split  # για διαχωρισμό train/test
from sklearn.ensemble import RandomForestClassifier  # αλγόριθμος ταξινόμησης
from sklearn.metrics import classification_report, confusion_matrix  # μετρικές αξιολόγησης

In [None]:
# Φόρτωση του συνόλου δεδομένων από GitHub
url = 'https://raw.githubusercontent.com/kdemertzis/EKPA/main/Data/DarkNet.csv'
df = pd.read_csv(url)  # φόρτωση csv σε dataframe
print('Μέγεθος συνόλου δεδομένων:', df.shape)
df.head()  # εμφάνιση των πρώτων 5 γραμμών για έλεγχο

In [None]:
# Έλεγχος για κενές τιμές και αφαίρεσή τους αν υπάρχουν
print('Κενές τιμές ανά στήλη:')
print(df.isnull().sum())
df = df.dropna()  # αφαίρεση γραμμών με κενά

# Διαχωρισμός δεδομένων σε χαρακτηριστικά (X) και ετικέτες (y)
X = df.drop('Label', axis=1)  # όλα τα χαρακτηριστικά εκτός από την ετικέτα
y = df['Label']  # η ετικέτα (κανονική ή επίθεση)
print('Διαστάσεις Χ:', X.shape, '| Διαστάσεις y:', y.shape)

In [None]:
# Διαχωρίζουμε τα δεδομένα σε train (70%) και test (30%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
print('Μέγεθος train set:', X_train.shape, '| Μέγεθος test set:', X_test.shape)

In [None]:
# Δημιουργία και εκπαίδευση του μοντέλου Random Forest
clf = RandomForestClassifier(n_estimators=100, random_state=42)  # ορίζουμε 100 δέντρα
clf.fit(X_train, y_train)  # εκπαίδευση στο training set
print('Το μοντέλο εκπαιδεύτηκε επιτυχώς!')

In [None]:
# Χρήση του μοντέλου για πρόβλεψη στο test set
y_pred = clf.predict(X_test)

# Αναφορά ταξινόμησης: δείχνει precision, recall, f1-score
print('Αναφορά ταξινόμησης:')
print(classification_report(y_test, y_pred))

# Confusion matrix για οπτική επιβεβαίωση της απόδοσης
cm = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(6,4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Προβλεπόμενη Κλάση')
plt.ylabel('Πραγματική Κλάση')
plt.title('Confusion Matrix')
plt.show()