In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import matplotlib.pyplot as plt

# Veri setini yükleyelim
file_path = 'updated_cybersecurity_attacks.csv'  # Dosya yolunuza göre değiştirin
data = pd.read_csv(file_path)

# 'Protocol' sütununu kategorik verilerden sayısal değerlere dönüştürelim
data['Protocol'] = data['Protocol'].astype('category').cat.codes

# Gerekli sütunları tekrar seçelim
features = data[['Source Port', 'Destination Port', 'Protocol', 'Packet Length']]
target = data['Traffic Type']

# Özellikleri ölçeklendirelim
scaler = StandardScaler()
scaled_features = scaler.fit_transform(features)

# Veriyi eğitim ve test setlerine bölelim
X_train, X_test, y_train, y_test = train_test_split(scaled_features, target, test_size=0.3, random_state=42)

# SVM modelini tanımlayalım
svm = SVC(kernel='linear')

# Modeli eğitelim
svm.fit(X_train, y_train)

# Test seti üzerinde tahmin yapalım
y_pred = svm.predict(X_test)

# Model doğruluğunu hesaplayalım
accuracy = accuracy_score(y_test, y_pred)
print(f'SVM Model Accuracy: {accuracy * 100:.2f}%')

# Detaylı sınıflandırma raporu
print(classification_report(y_test, y_pred))

# Karışıklık matrisi
conf_matrix = confusion_matrix(y_test, y_pred)
print('Confusion Matrix:')
print(conf_matrix)

SVM Model Accuracy: 33.13%
              precision    recall  f1-score   support

         DNS       0.33      0.29      0.31      4016
         FTP       0.33      0.43      0.38      3953
        HTTP       0.33      0.28      0.30      4031

    accuracy                           0.33     12000
   macro avg       0.33      0.33      0.33     12000
weighted avg       0.33      0.33      0.33     12000

Confusion Matrix:
[[1151 1693 1172]
 [1143 1701 1109]
 [1193 1714 1124]]
