In [1]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
import os

# Caminho relativo ao dataset
caminho_ddos = "../datasets/DDoS.csv"

# Leitura do dataset
try:
    df_ddos = pd.read_csv(caminho_ddos, encoding="utf-8")
except UnicodeDecodeError:
    df_ddos = pd.read_csv(caminho_ddos, encoding="ISO-8859-1")

# Preview
print(df_ddos.head())

# Colunas não numéricas
colunas_nao_numericas = df_ddos.select_dtypes(include=['object']).columns.tolist()
print("Colunas não numéricas:", colunas_nao_numericas)

# Dummy variables
df_dummies = pd.get_dummies(df_ddos, columns=colunas_nao_numericas)

# Coluna alvo
coluna_alvo = [col for col in df_dummies.columns if 'attack' in col.lower() or 'label' in col.lower()]
if not coluna_alvo:
    raise ValueError("Nenhuma coluna 'attack' ou 'label' encontrada.")
coluna_alvo = coluna_alvo[0]

# Separar X e y
y_ddos = df_dummies[coluna_alvo]
X_ddos = df_dummies.drop(columns=[coluna_alvo])

# Treinamento
modelo = RandomForestClassifier(n_estimators=100, random_state=42)
modelo.fit(X_ddos, y_ddos)

# Importância
importancias = pd.Series(modelo.feature_importances_, index=X_ddos.columns).sort_values(ascending=False)

# Plot
importancias.head(10).plot(kind='barh')
plt.title("Top 10 Importâncias - DDoS")
plt.gca().invert_yaxis()
plt.tight_layout()
plt.show()


  Highest Layer Transport Layer  Source IP       Dest IP  Source Port  \
0           ARP             UDP          1   192.168.1.1            0   
1           ARP             UDP          0  192.168.1.10            0   
2           ARP             UDP          1   192.168.1.1            0   
3           ARP             UDP          0  192.168.1.12            0   
4           ARP             UDP          1   192.168.1.1            0   

   Dest Port  Packet Length  Packets/Time  target  
0          0             60          92.8       1  
1          0             42          92.9       0  
2          0             60         362.8       1  
3          0             42         362.8       0  
4          0             60         364.3       1  
Colunas não numéricas: ['Highest Layer', 'Transport Layer', 'Dest IP']


ValueError: Nenhuma coluna 'attack' ou 'label' encontrada.