# Flash Evaluation on CamFow Dataset:

This notebook is dedicated to evaluating Flash on the 5G CamFlow datasets, which are graph-level in nature. We employ Flash in graph-level detection mode to analyze this dataset effectively. Upon completion of the notebook execution, the results will be presented.

## Dataset Access: 
- This dataset will be publically available upon publishing

## Data Parsing and Execution:
- Utilize the parser included in this notebook to process the downloaded files.
- To obtain the evaluation results, execute all cells within this notebook.

## Model Training and Execution Flexibility:
- By default, the notebook operates using pre-trained model weights.
- Additionally, this notebook offers the flexibility to set parameters for training Graph Neural Networks (GNNs) and word2vec models from scratch.
- You can then utilize these freshly trained models to conduct the evaluation. 

Follow these guidelines for a thorough and efficient analysis of the Unicorn datasets using Flash.


In [1]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
import torch
from torch_geometric.data import Data
import os
import torch.nn.functional as F
import json
import warnings
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
warnings.filterwarnings('ignore')
from torch_geometric.loader import NeighborLoader
import multiprocessing

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
%matplotlib inline

In [2]:
from pprint import pprint
import gzip
from sklearn.manifold import TSNE
import json
import copy
import os
from tqdm import tqdm

In [3]:
Train_Gnn = True
Train_Word2vec = False
Parse_data = False

In [4]:
import os.path as osp
import csv
import time

def show(str):
	print (str + ' ' + time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time())))

def parse_data():
    
    show('Start processing.')
    f = open('datasets/5gcamflow/preprocessed.txt', 'r')
    
    file_idx = 0
    i = 0 
    for i, line in tqdm(enumerate(f)):

        # Split the large graph into smaller graph each with 1M edges
        if i >= file_idx * 1000000:
            if file_idx > 0: fw.close()
            fw = open('5gcamflow/'+str(file_idx)+'.txt', 'w')
            file_idx += 1

        tempp = line.strip('\n').split('\t')
        temp = []
        temp.append(tempp[0])
        temp.append(tempp[2].split(':')[0])
        temp.append(tempp[1])
        temp.append(tempp[2].split(':')[1])
        temp.append(tempp[2].split(':')[2])
        temp.append(tempp[2].split(':')[3])
        fw.write(temp[0]+'\t'+temp[1]+'\t'+temp[2]+'\t'+temp[3]+'\t'+temp[4]+'\t'+temp[5]+'\n')
            
    f.close()
    fw.close()
    show('Done.')

if Parse_data:
    parse_data()

In [5]:
from tqdm import tqdm 
def prepare_graph(df):
    def process_node(node, action, node_dict, label_dict, dummies, node_type):
        node_dict.setdefault(node, []).append(action)
        label_dict[node] = dummies.get(getattr(row, node_type), -1)  

    nodes = {}
    labels = {}
    edges = []
    dummies = {
        "7998762093665332071": 0, "14709879154498484854": 1, "10991425273196493354": 2,
        "14871526952859113360": 3, "8771628573506871447": 4, "7877121489144997480": 5,
        "17841021884467483934": 6, "7895447931126725167": 7, "15125250455093594050": 8,
        "8664433583651064836": 9, "14377490526132269506": 10, "15554536683409451879": 11,
        "8204541918505434145": 12, "14356114695140920775": 13
    }

    for row in df.itertuples():
        process_node(row.actorID, row.action, nodes, labels, dummies, 'actor_type')
        process_node(row.objectID, row.action, nodes, labels, dummies, 'object')

        edges.append((row.actorID, row.objectID))

    features = [nodes[node] for node in tqdm(nodes)]
    feat_labels = [labels[node] for node in tqdm(nodes)]
    edge_index = [[], []]
    node_index_map = {node: i for i, node in enumerate(nodes.keys())}
    for src, dst in tqdm(edges):
        src_index = node_index_map[src]
        dst_index = node_index_map[dst]
        edge_index[0].append(src_index)
        edge_index[1].append(dst_index)

    return features, feat_labels, edge_index, list(nodes.keys())


In [6]:
from torch_geometric.nn import GCNConv
from torch_geometric.nn import SAGEConv, GATConv
import torch.nn.functional as F
import torch.nn as nn

class GCN(torch.nn.Module):
    def __init__(self,in_channel,out_channel):
        super().__init__()
        self.conv1 = SAGEConv(in_channel, 32, normalize=True)
        self.conv2 = SAGEConv(32, 20, normalize=True)
        self.linear = nn.Linear(in_features=20,out_features=out_channel)

    def forward(self, x, edge_index):
        x = self.conv1(x, edge_index)
        x = x.relu()
        x = F.dropout(x, p=0.5, training=self.training)

        x = self.conv2(x, edge_index)
        x = self.linear(x)
        return F.softmax(x, dim=1)

In [7]:
from gensim.models.callbacks import CallbackAny2Vec
import gensim
from gensim.models import Word2Vec
from multiprocessing import Pool
from itertools import compress
from tqdm import tqdm


class EpochSaver(CallbackAny2Vec):
    '''Callback to save model after each epoch.'''

    def __init__(self):
        self.epoch = 0

    def on_epoch_end(self, model):
        model.save('trained_weights/5gcamflow/5gcamflow.model')
        self.epoch += 1

In [8]:
class EpochLogger(CallbackAny2Vec):
    '''Callback to log information about training'''

    def __init__(self):
        self.epoch = 0

    def on_epoch_begin(self, model):
        print("Epoch #{} start".format(self.epoch))

    def on_epoch_end(self, model):
        print("Epoch #{} end".format(self.epoch))
        self.epoch += 1

In [9]:
logger = EpochLogger()
saver = EpochSaver()

In [10]:
if Train_Word2vec:
    comb_data = []
    for i in tqdm(range(12)):
        f = open(f"5gcamflow/{i}.txt")
        data = f.read().split('\n')
        data = [line.split('\t') for line in data]
        comb_data = comb_data + data

    df = pd.DataFrame (comb_data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
    df.sort_values(by='timestamp', ascending=True,inplace=True)
    df = df.dropna()
    phrases,labels,edges,mapp = prepare_graph(df)
    


In [11]:
if Train_Word2vec:
        word2vec = Word2Vec(sentences=phrases, vector_size=30, window=5, min_count=1, workers=32,epochs=300,callbacks=[saver,logger])

In [12]:
from sklearn.utils import class_weight
import torch.nn.functional as F
from torch.nn import CrossEntropyLoss

model = GCN(30,14).to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01, weight_decay=5e-4)

In [13]:
from collections import Counter
import math

class PositionalEncoder:

    def __init__(self, d_model, max_len=100000, device='cuda' if torch.cuda.is_available() else 'cpu'):
        self.device = device
        position = torch.arange(max_len, device=device).unsqueeze(1)
        div_term = torch.exp(torch.arange(0, d_model, 2, device=device) * (-math.log(10000.0) / d_model))
        self.pe = torch.zeros(max_len, d_model, device=device)
        self.pe[:, 0::2] = torch.sin(position * div_term)
        self.pe[:, 1::2] = torch.cos(position * div_term)

    def embed(self, x):
        return x + self.pe[:x.size(0)]

def infer(document):
    word_embeddings = [w2vmodel.wv[word] for word in document if word in  w2vmodel.wv]
    
    if not word_embeddings:
        return np.zeros(20)

    output_embedding = torch.tensor(word_embeddings, dtype=torch.float, device=device)
    if len(document) < 100000:
        output_embedding = encoder.embed(output_embedding)

    output_embedding = output_embedding.detach().cpu().numpy()
    return np.mean(output_embedding, axis=0)

encoder = PositionalEncoder(30)
w2vmodel = Word2Vec.load("trained_weights/5gcamflow/5gcamflow.model")

In [14]:
i = 1
f = open(f"5gcamflow/{i}.txt")
data = f.read().split('\n')

data = [line.split('\t') for line in data]
df = pd.DataFrame (data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
df.sort_values(by='timestamp', ascending=True,inplace=True)
df = df.dropna()
phrases,labels,edges,mapp = prepare_graph(df)

criterion = CrossEntropyLoss()

nodes = [infer(x) for x in tqdm(phrases, desc='Inferring Phrases')]
nodes = np.array(nodes)  

graph = Data(x=torch.tensor(nodes,dtype=torch.float).to(device),y=torch.tensor(labels,dtype=torch.long).to(device), edge_index=torch.tensor(edges,dtype=torch.long).to(device))
graph.n_id = torch.arange(graph.num_nodes)
mask = torch.tensor([True]*graph.num_nodes, dtype=torch.bool)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 486933/486933 [00:00<00:00, 2709852.04it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 486933/486933 [00:00<00:00, 3002234.43it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1000000/1000000 [00:00<00:00, 2427231.17it/s]
Inferring Phrases: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

In [15]:
%env CUDA_LAUNCH_BLOCKING=1

env: CUDA_LAUNCH_BLOCKING=1


In [17]:
loader = NeighborLoader(graph, num_neighbors=[-1,-1], batch_size=5000,input_nodes=mask)
total_loss = 0
for subg in loader:
    model.train()
    optimizer.zero_grad() 
    out = model(subg.x, subg.edge_index) 
    loss = criterion(out, subg.y) 
    loss.backward() 
    optimizer.step()      
    total_loss += loss.item() * subg.batch_size

/opt/conda/conda-bld/pytorch_1711403378171/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [0,0,0] Assertion `t >= 0 && t < n_classes` failed.
/opt/conda/conda-bld/pytorch_1711403378171/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [1,0,0] Assertion `t >= 0 && t < n_classes` failed.
/opt/conda/conda-bld/pytorch_1711403378171/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [2,0,0] Assertion `t >= 0 && t < n_classes` failed.
/opt/conda/conda-bld/pytorch_1711403378171/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [3,0,0] Assertion `t >= 0 && t < n_classes` failed.
/opt/conda/conda-bld/pytorch_1711403378171/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [4,0,0] Assertion `t >= 0 && t < n_cl

RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`

In [16]:
batch = next(iter(loader))

In [26]:
print(max(map(len, phrases)))

21278


In [None]:
from torch_geometric import utils

################################## Training Main Model #####################################
if Train_Gnn:
    for i in tqdm(range(13)):
        f = open(f"5gcamflow/{i}.txt")
        data = f.read().split('\n')

        data = [line.split('\t') for line in data]
        df = pd.DataFrame (data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
        df.sort_values(by='timestamp', ascending=True,inplace=True)
        df = df.dropna()
        phrases,labels,edges,mapp = prepare_graph(df)

        criterion = CrossEntropyLoss()

        nodes = [infer(x) for x in tqdm(phrases, desc='Inferring Phrases')]
        nodes = np.array(nodes)  

        graph = Data(x=torch.tensor(nodes,dtype=torch.float).to(device),y=torch.tensor(labels,dtype=torch.long).to(device), edge_index=torch.tensor(edges,dtype=torch.long).to(device))
        graph.n_id = torch.arange(graph.num_nodes)
        mask = torch.tensor([True]*graph.num_nodes, dtype=torch.bool)

        for m_n in range(20):
            loader = NeighborLoader(graph, num_neighbors=[-1,-1], batch_size=5000,input_nodes=mask)
            total_loss = 0
            for subg in loader:
                model.train()
                optimizer.zero_grad() 
                out = model(subg.x, subg.edge_index) 
                loss = criterion(out, subg.y) 
                loss.backward() 
                optimizer.step()      
                total_loss += loss.item() * subg.batch_size

            loader = NeighborLoader(graph, num_neighbors=[-1,-1], batch_size=5000,input_nodes=mask)
            for subg in loader:
              model.eval()
              out = model(subg.x, subg.edge_index)
              sorted, indices = out.sort(dim=1,descending=True)
              conf = (sorted[:,0] - sorted[:,1]) / sorted[:,0]
              conf = (conf - conf.min()) / conf.max()
              pred = indices[:,0]
              cond = (pred == subg.y)w
              mask[subg.n_id[cond]] = False

            print(f'Model# {m_n}. {mask.sum().item()} nodes still misclassified \n')
            torch.save(model.state_dict(), f'trained_weights/5gcamflow/5gcamflow{m_n}.pth')

### Validation

In [None]:
from torch.utils.data import Dataset, DataLoader
class PhraseDataset(Dataset):
    def __init__(self, phrases):
        self.phrases = phrases

    def __len__(self):
        return len(self.phrases)

    def __getitem__(self, idx):
        return self.phrases[idx]

def batch_infer(phrases):
    return [infer(phrase) for phrase in phrases] 

In [24]:
from tqdm import tqdm

for i in range(95,98):
    print(f"Graph #: {i}")
    f = open(f"datasets/5gcamflow/{i}.txt")
    data = f.read().split('\n')

    data = [line.split('\t') for line in data]
    df = pd.DataFrame (data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
    df.sort_values(by='timestamp', ascending=True,inplace=True)
    df = df.dropna()

    print("Preparing Graph")
    phrases,labels,edges,mapp = prepare_graph(df)
    print("Done")
    print("Inferring words")
    # dataset = PhraseDataset(phrases)
    # loader = DataLoader(dataset, batch_size=10, num_workers=4)
    # nodes = []
    # for batch in tqdm(loader):
    #     batch_embeddings = batch_infer(batch)
    #     nodes.extend(batch_embeddings)
    nodes = [infer(x) for x in tqdm(phrases)]
    nodes = np.array(nodes)  
    print("Done!")

    graph = Data(x=torch.tensor(nodes,dtype=torch.float).to(device),y=torch.tensor(labels,dtype=torch.long).to(device), edge_index=torch.tensor(edges,dtype=torch.long).to(device))
    graph.n_id = torch.arange(graph.num_nodes).to(device)
    flag = torch.tensor([True]*graph.num_nodes, dtype=torch.bool).to(device)
    print("Evaluating...")
    for m_n in tqdm(range(20)):
        model.load_state_dict(torch.load(f'trained_weights/5gcamflow/5gcamflow{m_n}.pth'))
        model.eval()
        out = model(graph.x, graph.edge_index)

        sorted, indices = out.sort(dim=1,descending=True)
        conf = (sorted[:,0] - sorted[:,1]) / sorted[:,0]
        conf = (conf - conf.min()) / conf.max()

        pred = indices[:,0]
        cond = (pred == graph.y).to(device)
        falses = torch.tensor([False] * len(flag[graph.n_id[cond]]), dtype=torch.bool).to(device)
        flag[graph.n_id[cond]] = torch.logical_and(flag[graph.n_id[cond]], falses)
    print("Done!")
            
    print(flag.sum().item(), (flag.sum().item() / len(flag))*100)

Graph #: 95


 20%|█████████████████                                                                   | 50600/249325 [00:43<02:50, 1167.95it/s]


Preparing Graph



100%|████████████████████████████████████████████████████████████████████████████████| 230438/230438 [00:00<00:00, 2330345.30it/s][A
100%|████████████████████████████████████████████████████████████████████████████████| 230438/230438 [00:00<00:00, 3058426.58it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 900266/900266 [00:00<00:00, 2473264.16it/s]


Done
Inferring words


100%|███████████████████████████████████████████████████████████████████████████████████| 230438/230438 [00:26<00:00, 8655.05it/s]


Done!
Evaluating...


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 52.39it/s]


Done!
11884 5.157135541881113
Graph #: 96
Preparing Graph


100%|████████████████████████████████████████████████████████████████████████████████| 249325/249325 [00:00<00:00, 2452491.54it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 249325/249325 [00:00<00:00, 3141006.88it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 950908/950908 [00:00<00:00, 2387755.67it/s]


Done
Inferring words


100%|███████████████████████████████████████████████████████████████████████████████████| 249325/249325 [00:28<00:00, 8743.87it/s]


Done!
Evaluating...


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.32it/s]


Done!
14759 5.91958287375915
Graph #: 97
Preparing Graph


100%|████████████████████████████████████████████████████████████████████████████████| 245135/245135 [00:00<00:00, 2322132.73it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 245135/245135 [00:00<00:00, 2947230.15it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 940300/940300 [00:00<00:00, 2427787.30it/s]


Done
Inferring words


100%|███████████████████████████████████████████████████████████████████████████████████| 245135/245135 [00:27<00:00, 8769.24it/s]


Done!
Evaluating...


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:00<00:00, 50.48it/s]

Done!
13215 5.390907051216677





### Testing

In [25]:
thresh = 330

In [34]:
correct_benign = 0

for i in range(100,125):
    print(f"Graph #: {i}")
    f = open(f"datasets/5gcamflow/{i}.txt")
    data = f.read().split('\n')

    data = [line.split('\t') for line in data]
    df = pd.DataFrame (data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
    df.sort_values(by='timestamp', ascending=True,inplace=True)
    df = df.dropna()

    phrases,labels,edges,mapp = prepare_graph(df)

    nodes = [infer(x) for x in tqdm(phrases)]
    nodes = np.array(nodes)  

    graph = Data(x=torch.tensor(nodes,dtype=torch.float).to(device),y=torch.tensor(labels,dtype=torch.long).to(device), edge_index=torch.tensor(edges,dtype=torch.long).to(device))
    graph.n_id = torch.arange(graph.num_nodes).to(device)
    flag = torch.tensor([True]*graph.num_nodes, dtype=torch.bool).to(device)

    for m_n in range(20):
        model.load_state_dict(torch.load(f'trained_weights/5gcamflow/5gcamflow{m_n}.pth'))
        model.eval()
        out = model(graph.x, graph.edge_index)

        sorted, indices = out.sort(dim=1,descending=True)
        conf = (sorted[:,0] - sorted[:,1]) / sorted[:,0]
        conf = (conf - conf.min()) / conf.max()

        pred = indices[:,0]
        cond = (pred == graph.y).to(device)
        falses = torch.tensor([False]*len(flag[graph.n_id[cond]]), dtype=torch.bool).to(device)
        flag[graph.n_id[cond]] = torch.logical_and(flag[graph.n_id[cond]], falses)

    if flag.sum().item() <= thresh:
        correct_benign = correct_benign + 1
            
    print(flag.sum().item(), (flag.sum().item() / len(flag))*100)

Graph #: 100


FileNotFoundError: [Errno 2] No such file or directory: 'datasets/5gcamflow/100.txt'

In [34]:
correct_attack = 0

for i in range(125,150):
    print(f"Graph #: {i}")
    f = open(f"datasets/5gcamflow/{i}.txt")
    data = f.read().split('\n')

    data = [line.split('\t') for line in data]
    df = pd.DataFrame (data, columns = ['actorID', 'actor_type','objectID','object','action','timestamp'])
    df.sort_values(by='timestamp', ascending=True,inplace=True)
    df = df.dropna()
    
    phrases,labels,edges,mapp = prepare_graph(df)

    nodes = [infer(x) for x in phrases]
    nodes = np.array(nodes)  
    
    graph = Data(x=torch.tensor(nodes,dtype=torch.float).to(device),y=torch.tensor(labels,dtype=torch.long).to(device), edge_index=torch.tensor(edges,dtype=torch.long).to(device))
    graph.n_id = torch.arange(graph.num_nodes).to(device)
    flag = torch.tensor([True]*graph.num_nodes, dtype=torch.bool).to(device)

    for m_n in range(20):
        model.load_state_dict(torch.load(f'trained_weights/5gcamflow/5gcamflw{m_n}.pth'))
        model.eval()
        out = model(graph.x, graph.edge_index)

        sorted, indices = out.sort(dim=1,descending=True)
        conf = (sorted[:,0] - sorted[:,1]) / sorted[:,0]
        conf = (conf - conf.min()) / conf.max()

        pred = indices[:,0]
        cond = (pred == graph.y).to(device)
        falses = torch.tensor([False]*len(flag[graph.n_id[cond]]), dtype=torch.bool).to(device)
        flag[graph.n_id[cond]] = torch.logical_and(flag[graph.n_id[cond]], falses)

    if  flag.sum().item() > thresh:
        correct_attack = correct_attack + 1
   
    print(flag.sum().item(), (flag.sum().item() / len(flag))*100)

Graph #: 125


100%|████████████████████████████████████████████████████████████████████████████████| 250904/250904 [00:00<00:00, 2364791.41it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 250904/250904 [00:00<00:00, 3093561.21it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 973950/973950 [00:00<00:00, 2138024.61it/s]


13218 5.2681503682683415
Graph #: 126


100%|████████████████████████████████████████████████████████████████████████████████| 233846/233846 [00:00<00:00, 2458956.55it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 233846/233846 [00:00<00:00, 3216123.60it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 927125/927125 [00:00<00:00, 2344874.72it/s]


12855 5.497207563952345
Graph #: 127


100%|████████████████████████████████████████████████████████████████████████████████| 276042/276042 [00:00<00:00, 2389550.38it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 276042/276042 [00:00<00:00, 2999865.44it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 1058110/1058110 [00:00<00:00, 2372442.15it/s]


15369 5.567631012671985
Graph #: 128


100%|████████████████████████████████████████████████████████████████████████████████| 248200/248200 [00:00<00:00, 2379722.47it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 248200/248200 [00:00<00:00, 2994311.39it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 969084/969084 [00:00<00:00, 2393933.23it/s]


13046 5.25624496373892
Graph #: 129


100%|████████████████████████████████████████████████████████████████████████████████| 255584/255584 [00:00<00:00, 2442368.36it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 255584/255584 [00:00<00:00, 3161114.04it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 977788/977788 [00:00<00:00, 2386377.53it/s]


13458 5.265587830224114
Graph #: 130


100%|████████████████████████████████████████████████████████████████████████████████| 244068/244068 [00:00<00:00, 2454769.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 244068/244068 [00:00<00:00, 3176090.91it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 947473/947473 [00:00<00:00, 2400440.82it/s]


12878 5.276398380779127
Graph #: 131


100%|████████████████████████████████████████████████████████████████████████████████| 255432/255432 [00:00<00:00, 2414842.71it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 255432/255432 [00:00<00:00, 3110366.32it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 990249/990249 [00:00<00:00, 2445917.60it/s]


14002 5.481693758025619
Graph #: 132


100%|████████████████████████████████████████████████████████████████████████████████| 249089/249089 [00:00<00:00, 2342058.87it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 249089/249089 [00:00<00:00, 2848668.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 960122/960122 [00:00<00:00, 2274216.33it/s]


12885 5.1728498649077235
Graph #: 133


100%|████████████████████████████████████████████████████████████████████████████████| 237216/237216 [00:00<00:00, 2416824.80it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 237216/237216 [00:00<00:00, 3087940.42it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 929153/929153 [00:00<00:00, 2402231.73it/s]


12390 5.223087818696884
Graph #: 134


100%|████████████████████████████████████████████████████████████████████████████████| 248175/248175 [00:00<00:00, 2401590.56it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 248175/248175 [00:00<00:00, 2945381.53it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 951876/951876 [00:00<00:00, 2412885.77it/s]


13146 5.297068600785735
Graph #: 135


100%|████████████████████████████████████████████████████████████████████████████████| 224288/224288 [00:00<00:00, 2333332.64it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 224288/224288 [00:00<00:00, 3094981.66it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 896440/896440 [00:00<00:00, 2418936.63it/s]


12293 5.480899557711514
Graph #: 136


100%|████████████████████████████████████████████████████████████████████████████████| 253091/253091 [00:00<00:00, 2328496.49it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 253091/253091 [00:00<00:00, 2316570.41it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 953372/953372 [00:00<00:00, 2358927.95it/s]


13549 5.353410433401424
Graph #: 137


100%|████████████████████████████████████████████████████████████████████████████████| 261156/261156 [00:00<00:00, 2263773.71it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 261156/261156 [00:00<00:00, 2912150.77it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 1018644/1018644 [00:00<00:00, 2457999.79it/s]


14153 5.419366202576239
Graph #: 138


100%|████████████████████████████████████████████████████████████████████████████████| 232184/232184 [00:00<00:00, 2434114.54it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 232184/232184 [00:00<00:00, 3236630.33it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 927643/927643 [00:00<00:00, 2445221.41it/s]


11909 5.1291217310408985
Graph #: 139


100%|████████████████████████████████████████████████████████████████████████████████| 249251/249251 [00:00<00:00, 2227409.11it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 249251/249251 [00:00<00:00, 2408230.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 973399/973399 [00:00<00:00, 1655847.85it/s]


14038 5.63207369278358
Graph #: 140


100%|████████████████████████████████████████████████████████████████████████████████| 256627/256627 [00:00<00:00, 2464294.16it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 256627/256627 [00:00<00:00, 3205566.86it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 988930/988930 [00:00<00:00, 2409626.40it/s]


14226 5.543454118233857
Graph #: 141


100%|████████████████████████████████████████████████████████████████████████████████| 236217/236217 [00:00<00:00, 2397022.03it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 236217/236217 [00:00<00:00, 3112073.39it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 908925/908925 [00:00<00:00, 2379737.02it/s]


12013 5.085578091331276
Graph #: 142


100%|████████████████████████████████████████████████████████████████████████████████| 226388/226388 [00:00<00:00, 2392879.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 226388/226388 [00:00<00:00, 3071454.29it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 905630/905630 [00:00<00:00, 2377003.68it/s]


12430 5.490573705320069
Graph #: 143


100%|████████████████████████████████████████████████████████████████████████████████| 225121/225121 [00:00<00:00, 2385444.97it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 225121/225121 [00:00<00:00, 3023874.28it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 904585/904585 [00:00<00:00, 2436164.48it/s]


12202 5.420196250016658
Graph #: 144


100%|████████████████████████████████████████████████████████████████████████████████| 227384/227384 [00:00<00:00, 2022838.16it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 227384/227384 [00:00<00:00, 2635758.60it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 889691/889691 [00:00<00:00, 2148834.94it/s]


12282 5.401435457200155
Graph #: 145


100%|████████████████████████████████████████████████████████████████████████████████| 249572/249572 [00:00<00:00, 2389103.31it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 249572/249572 [00:00<00:00, 2999079.85it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 962409/962409 [00:00<00:00, 2459782.50it/s]


12964 5.1944929719680095
Graph #: 146


100%|████████████████████████████████████████████████████████████████████████████████| 249389/249389 [00:00<00:00, 2396375.88it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 249389/249389 [00:00<00:00, 3137553.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 973099/973099 [00:00<00:00, 2380639.45it/s]


12894 5.17023605692312
Graph #: 147


100%|████████████████████████████████████████████████████████████████████████████████| 229636/229636 [00:00<00:00, 2383194.26it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 229636/229636 [00:00<00:00, 3155553.20it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 905318/905318 [00:00<00:00, 2432730.77it/s]


12640 5.504363427337177
Graph #: 148


100%|████████████████████████████████████████████████████████████████████████████████| 247628/247628 [00:00<00:00, 2384233.87it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 247628/247628 [00:00<00:00, 3076137.63it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 960381/960381 [00:00<00:00, 2347300.64it/s]


13146 5.3087696060219365
Graph #: 149


100%|████████████████████████████████████████████████████████████████████████████████| 224930/224930 [00:00<00:00, 2362590.21it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 224930/224930 [00:00<00:00, 2659579.90it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 893784/893784 [00:00<00:00, 2199442.16it/s]


12223 5.434135064242208


In [None]:
TP = correct_attack
FP = 25 - correct_benign
TN = correct_benign
FN = 25 - correct_attack

FPR = FP / (FP + TN) if (FP + TN) > 0 else 0
TPR = TP / (TP + FN) if (TP + FN) > 0 else 0

print(f"Number of True Positives (TP): {TP}")
print(f"Number of False Positives (FP): {FP}")
print(f"Number of False Negatives (FN): {FN}")
print(f"Number of True Negatives (TN): {TN}\n")

precision = TP / (TP + FP) if (TP + FP) > 0 else 0
recall = TPR  
print(f"Precision: {precision}")
print(f"Recall: {recall}")

fscore = (2 * precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
print(f"Fscore: {fscore}\n")