In [1]:
import sys
import os
import csv
import time
import statistics
import numpy as np
from pathlib import Path, PureWindowsPath
from numpy import dot
from numpy.linalg import norm
import networkx as nx
import networkx.algorithms.matching
from collections import Counter
from IPython.display import Image, display
from matplotlib import pyplot as plt
from scipy.spatial import distance
from sklearn.metrics.pairwise import cosine_similarity

In [2]:
def printProgressBar (iteration, total, prefix = '', suffix = '', decimals = 1, length = 100, fill = '█', printEnd = "\r"):
    """
    Call in a loop to create terminal progress bar
    @params:
        iteration   - Required  : current iteration (Int)
        total       - Required  : total iterations (Int)
        prefix      - Optional  : prefix string (Str)
        suffix      - Optional  : suffix string (Str)
        decimals    - Optional  : positive number of decimals in percent complete (Int)
        length      - Optional  : character length of bar (Int)
        fill        - Optional  : bar fill character (Str)
        printEnd    - Optional  : end character (e.g. "\r", "\r\n") (Str)
    """
    percent = ("{0:." + str(decimals) + "f}").format(100 * (iteration / float(total)))
    filledLength = int(length * iteration // total)
    bar = fill * filledLength + '-' * (length - filledLength)
    print('\r%s |%s| %s%% %s' % (prefix, bar, percent, suffix), end = printEnd)
    # Print New Line on Complete
    if iteration == total: 
        print()

In [3]:
def similarityMetric(sr):
    counterA = 0
    counterB = 0
    counterC = 0
    for i in sr :
        A,B = i[0].split(',')[0], i[0].split(',')[1]
        C,D = i[2].split(',')[0], i[2].split(',')[1]
        if A==C and B==D:
            counterA +=1
        if A==C or B==D:
            counterB +=1
        if A==C or A==D or B == C or B == D:
            counterC += 1
    print("cA = %d (%f) cB= %d (%f) cC =%d (%f)"%(counterA, counterA/len(sr), counterB, counterB/len(sr), counterC, counterC/len(sr)))
    return [counterA/len(sr),counterB/len(sr),counterC/len(sr)]

In [4]:
def createDirs(fold):
    path = "DATASET F1/fold_" +str(fold)
    mal_path = path+ "/20%_test"
    train_path = path+ "/80%_train"
    benign_path = "DATASET F1/specimen_benign/20%_test"
    
    w_mal_path = PureWindowsPath(mal_path)
    w_train_path= PureWindowsPath(train_path)
    w_benign_path = PureWindowsPath(benign_path)
#     print( mal_path+"\n"+ train_path+"\n"+ benign_path)
#     print( w_mal_path, w_train_path, w_benign_path)

    filename = "default_G_tone_map"
    mapFilename = "default_unique_mapping"
    
    rootDir = [os.path.join(root, name)
             for root, dirs, files in os.walk(w_mal_path)
             for name in files
             if name.endswith(filename+".csv")]
    rootDir.sort()
    # for i in range(len(paths)):
    #     p = [os.path.join(root, name)
    #              for root, dirs, files in os.walk(paths[i]+"/"+path)
    #              for name in files
    #              if name.endswith(filename+".csv")]
    #     p.sort()
    #     rootDirs[i] = p
    # print(rootDirs[10])
    benignDir = [os.path.join(root, name)
                 for root, dirs, files in os.walk(w_benign_path)
                 for name in files
                 if name.endswith(filename+".csv")]
    benignDir.sort()

    # for i in range(len(paths)):
    trainDir = [os.path.join(root, name)
                 for root, dirs, files in os.walk(w_train_path)
                 for name in files
                 if name.endswith(filename+".csv")]
    trainDir.sort()
    #     trainDirs[i] = trainDir
    return [rootDir,benignDir,trainDir]

In [5]:
def createGraphs(dirs, npmode):
    rootDir = dirs[0]
    benignDir = dirs[1]
    trainDir = dirs[2]
    mal_gs = []
    mal_np_gs = []
    ben_gs = []
    train_gs = []
    train_np_gs = []
    ben_np_gs = []
    csm_vals = {}
    for i in range(len(rootDir)):
        A = np.array(getArray(rootDir[i]))
        G = nx.from_numpy_matrix(A)
        mal_gs.append(G)
        mal_np_gs.append(A)
        printProgressBar(i, len(rootDir)-1, suffix = 'malware gs')
    for i in range(len(trainDir)):
        A = np.array(getArray(trainDir[i]))
        G = nx.from_numpy_matrix(A)
        train_gs.append(G)
        train_np_gs.append(A)
        printProgressBar(i, len(trainDir)-1, suffix = 'train gs')
    for i in range(len(benignDir)):
        A = np.array(getArray(benignDir[i]))
        G = nx.from_numpy_matrix(A)
        ben_gs.append(G)
        ben_np_gs.append(A)
        printProgressBar(i, len(benignDir)-1, suffix = 'benign gs')
    if npmode: 
        return [mal_np_gs, ben_np_gs, train_np_gs]
    else: 
        return [mal_gs, ben_gs, train_gs]



In [6]:
def getArray (path):
    results = []
    with open(path) as csvfile:
        reader = csv.reader(csvfile,csv.QUOTE_NONNUMERIC) # change contents to floats
        for row in reader: # each row is a list
            nums = []
            for i in row: 
                if i :
                    nums.append(int(i))
            results.append(nums)
    return results

In [7]:
def detection(ben, mal, step= 10):
    dif = ben[0]-ben[-1]
    thresh = [ben[-1]+i*dif/step for i in range(step)]
    m = np.array(sum(i > thresh for i in mal)/len(mal))
    p = np.array(sum(i > thresh for i in ben)/len(ben))
#     print(m)
    plt.plot(m)
    plt.plot(p)

In [8]:
c = [createDirs(i) for i in range(1,6)]
print(len(c))

5


In [19]:
gs = [createGraphs(c[i], False) for i in range(len(c))]


 |----------------------------------------------------------------------------------------------------| 0.0% malware gs |----------------------------------------------------------------------------------------------------| 0.2% malware gs |----------------------------------------------------------------------------------------------------| 0.4% malware gs |----------------------------------------------------------------------------------------------------| 0.6% malware gs |----------------------------------------------------------------------------------------------------| 0.8% malware gs |----------------------------------------------------------------------------------------------------| 1.0% malware gs |█---------------------------------------------------------------------------------------------------| 1.2% malware gs |█---------------------------------------------------------------------------------------------------| 1.3% malware gs |█----------------------------

 |█████████████████████████████████████████████████████-----------------------------------------------| 53.3% malware gs |█████████████████████████████████████████████████████-----------------------------------------------| 53.5% malware gs |█████████████████████████████████████████████████████-----------------------------------------------| 53.7% malware gs |█████████████████████████████████████████████████████-----------------------------------------------| 53.8% malware gs |██████████████████████████████████████████████████████----------------------------------------------| 54.0% malware gs |██████████████████████████████████████████████████████----------------------------------------------| 54.2% malware gs |██████████████████████████████████████████████████████----------------------------------------------| 54.4% malware gs |██████████████████████████████████████████████████████----------------------------------------------| 54.6% malware gs |█████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |---------------------------------------------

 |████████████████------------------------------------------------------------------------------------| 17.0% train gs |█████████████████-----------------------------------------------------------------------------------| 17.0% train gs |█████████████████-----------------------------------------------------------------------------------| 17.1% train gs |█████████████████-----------------------------------------------------------------------------------| 17.1% train gs |█████████████████-----------------------------------------------------------------------------------| 17.2% train gs |█████████████████-----------------------------------------------------------------------------------| 17.2% train gs |█████████████████-----------------------------------------------------------------------------------| 17.3% train gs |█████████████████-----------------------------------------------------------------------------------| 17.3% train gs |█████████████████--------------------

 |██████████████████████████████----------------------------------------------------------------------| 30.4% train gs |██████████████████████████████----------------------------------------------------------------------| 30.5% train gs |██████████████████████████████----------------------------------------------------------------------| 30.5% train gs |██████████████████████████████----------------------------------------------------------------------| 30.6% train gs |██████████████████████████████----------------------------------------------------------------------| 30.6% train gs |██████████████████████████████----------------------------------------------------------------------| 30.7% train gs |██████████████████████████████----------------------------------------------------------------------| 30.7% train gs |██████████████████████████████----------------------------------------------------------------------| 30.8% train gs |██████████████████████████████-------

 |█████████████████████████████████████████████-------------------------------------------------------| 45.1% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.1% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.1% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.2% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.2% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.3% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.3% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.4% train gs |█████████████████████████████████████

 |██████████████████████████████████████████████████████████------------------------------------------| 58.8% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.9% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.9% train gs |██████████████████████████████████████████████████████████------------------------------------------| 59.0% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.0% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.1% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.1% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.2% train gs |█████████████████████████████████████

 |████████████████████████████████████████████████████████████████████████----------------------------| 72.8% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.8% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.9% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.9% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 73.0% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.0% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.1% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.1% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.6% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.7% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.7% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.8% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.8% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.9% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.9% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.9% train gs |█████████████████████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% malware gs |----------------------------------------------------------------------------------------------------| 0.2% malware gs |----------------------------------------------------------------------------------------------------| 0.4% malware gs |----------------------------------------------------------------------------------------------------| 0.6% malware gs |----------------------------------------------------------------------------------------------------| 0.8% malware gs |----------------------------------------------------------------------------------------------------| 1.0% malware gs |█---------------------------------------------------------------------------------------------------| 1.2% malware gs |█---------------------------------------------------------------------------------------------------| 1.3% malware gs |█----------------------------

 |█████████████████████████████████████████████████████████-------------------------------------------| 57.5% malware gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.7% malware gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.9% malware gs |██████████████████████████████████████████████████████████------------------------------------------| 58.1% malware gs |██████████████████████████████████████████████████████████------------------------------------------| 58.3% malware gs |██████████████████████████████████████████████████████████------------------------------------------| 58.5% malware gs |██████████████████████████████████████████████████████████------------------------------------------| 58.7% malware gs |██████████████████████████████████████████████████████████------------------------------------------| 58.8% malware gs |█████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |---------------------------------------------

 |████████████----------------------------------------------------------------------------------------| 12.4% train gs |████████████----------------------------------------------------------------------------------------| 12.5% train gs |████████████----------------------------------------------------------------------------------------| 12.5% train gs |████████████----------------------------------------------------------------------------------------| 12.6% train gs |████████████----------------------------------------------------------------------------------------| 12.6% train gs |████████████----------------------------------------------------------------------------------------| 12.7% train gs |████████████----------------------------------------------------------------------------------------| 12.7% train gs |████████████----------------------------------------------------------------------------------------| 12.8% train gs |████████████-------------------------

 |██████████████████████████--------------------------------------------------------------------------| 26.3% train gs |██████████████████████████--------------------------------------------------------------------------| 26.4% train gs |██████████████████████████--------------------------------------------------------------------------| 26.4% train gs |██████████████████████████--------------------------------------------------------------------------| 26.4% train gs |██████████████████████████--------------------------------------------------------------------------| 26.5% train gs |██████████████████████████--------------------------------------------------------------------------| 26.5% train gs |██████████████████████████--------------------------------------------------------------------------| 26.6% train gs |██████████████████████████--------------------------------------------------------------------------| 26.6% train gs |██████████████████████████-----------

 |█████████████████████████████████████████-----------------------------------------------------------| 41.1% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.1% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.2% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.2% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.3% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.3% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.4% train gs |█████████████████████████████████████████-----------------------------------------------------------| 41.4% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████---------------------------------------------| 56.0% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.0% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.0% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.1% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.1% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.2% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.2% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.3% train gs |█████████████████████████████████████

 |█████████████████████████████████████████████████████████████████████-------------------------------| 69.3% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.4% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.4% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.5% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.5% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.6% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.6% train gs |█████████████████████████████████████████████████████████████████████-------------------------------| 69.7% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████████████████-----------------| 83.9% train gs |███████████████████████████████████████████████████████████████████████████████████-----------------| 83.9% train gs |███████████████████████████████████████████████████████████████████████████████████-----------------| 84.0% train gs |████████████████████████████████████████████████████████████████████████████████████----------------| 84.0% train gs |████████████████████████████████████████████████████████████████████████████████████----------------| 84.1% train gs |████████████████████████████████████████████████████████████████████████████████████----------------| 84.1% train gs |████████████████████████████████████████████████████████████████████████████████████----------------| 84.2% train gs |████████████████████████████████████████████████████████████████████████████████████----------------| 84.2% train gs |████████████████████████████████████

 |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.0% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.1% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.1% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.2% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.2% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.3% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.3% train gs |██████████████████████████████████████████████████████████████████████████████████████████████████--| 98.4% train gs |█████████████████████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% malware gs |----------------------------------------------------------------------------------------------------| 0.2% malware gs |----------------------------------------------------------------------------------------------------| 0.4% malware gs |----------------------------------------------------------------------------------------------------| 0.6% malware gs |----------------------------------------------------------------------------------------------------| 0.8% malware gs |----------------------------------------------------------------------------------------------------| 1.0% malware gs |█---------------------------------------------------------------------------------------------------| 1.2% malware gs |█---------------------------------------------------------------------------------------------------| 1.3% malware gs |█----------------------------

 |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |---------------------------------------------

 |██████████████--------------------------------------------------------------------------------------| 14.2% train gs |██████████████--------------------------------------------------------------------------------------| 14.3% train gs |██████████████--------------------------------------------------------------------------------------| 14.3% train gs |██████████████--------------------------------------------------------------------------------------| 14.3% train gs |██████████████--------------------------------------------------------------------------------------| 14.4% train gs |██████████████--------------------------------------------------------------------------------------| 14.4% train gs |██████████████--------------------------------------------------------------------------------------| 14.5% train gs |██████████████--------------------------------------------------------------------------------------| 14.5% train gs |██████████████-----------------------

 |█████████████████████████████-----------------------------------------------------------------------| 29.4% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.5% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.5% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.6% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.6% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.7% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.7% train gs |█████████████████████████████-----------------------------------------------------------------------| 29.7% train gs |█████████████████████████████--------

 |███████████████████████████████████████████---------------------------------------------------------| 43.6% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.7% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.7% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.8% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.8% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.9% train gs |███████████████████████████████████████████---------------------------------------------------------| 43.9% train gs |███████████████████████████████████████████---------------------------------------------------------| 44.0% train gs |████████████████████████████████████

 |██████████████████████████████████████████████████████████------------------------------------------| 58.3% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.3% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.4% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.4% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.5% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.5% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.6% train gs |██████████████████████████████████████████████████████████------------------------------------------| 58.6% train gs |█████████████████████████████████████

 |████████████████████████████████████████████████████████████████████████----------------------------| 72.6% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.6% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.7% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.7% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.8% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.8% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.9% train gs |████████████████████████████████████████████████████████████████████████----------------------------| 72.9% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.1% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.2% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.2% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.3% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.3% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.4% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.4% train gs |███████████████████████████████████████████████████████████████████████████████████████-------------| 87.5% train gs |█████████████████████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% benign gs |██--------------------------------------------------------------------------------------------------| 2.9% benign gs |█████-----------------------------------------------------------------------------------------------| 5.9% benign gs |████████--------------------------------------------------------------------------------------------| 8.8% benign gs |███████████-----------------------------------------------------------------------------------------| 11.8% benign gs |██████████████--------------------------------------------------------------------------------------| 14.7% benign gs |█████████████████-----------------------------------------------------------------------------------| 17.6% benign gs |████████████████████--------------------------------------------------------------------------------| 20.6% benign gs |███████████████████████----------

 |----------------------------------------------------------------------------------------------------| 0.0% malware gs |----------------------------------------------------------------------------------------------------| 0.2% malware gs |----------------------------------------------------------------------------------------------------| 0.4% malware gs |----------------------------------------------------------------------------------------------------| 0.6% malware gs |----------------------------------------------------------------------------------------------------| 0.8% malware gs |----------------------------------------------------------------------------------------------------| 1.0% malware gs |█---------------------------------------------------------------------------------------------------| 1.2% malware gs |█---------------------------------------------------------------------------------------------------| 1.3% malware gs |█----------------------------

 |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |---------------------------------------------

 |█████████████---------------------------------------------------------------------------------------| 13.4% train gs |█████████████---------------------------------------------------------------------------------------| 13.5% train gs |█████████████---------------------------------------------------------------------------------------| 13.5% train gs |█████████████---------------------------------------------------------------------------------------| 13.6% train gs |█████████████---------------------------------------------------------------------------------------| 13.6% train gs |█████████████---------------------------------------------------------------------------------------| 13.7% train gs |█████████████---------------------------------------------------------------------------------------| 13.7% train gs |█████████████---------------------------------------------------------------------------------------| 13.8% train gs |█████████████------------------------

 |███████████████████████████-------------------------------------------------------------------------| 27.7% train gs |███████████████████████████-------------------------------------------------------------------------| 27.7% train gs |███████████████████████████-------------------------------------------------------------------------| 27.8% train gs |███████████████████████████-------------------------------------------------------------------------| 27.8% train gs |███████████████████████████-------------------------------------------------------------------------| 27.9% train gs |███████████████████████████-------------------------------------------------------------------------| 27.9% train gs |███████████████████████████-------------------------------------------------------------------------| 28.0% train gs |████████████████████████████------------------------------------------------------------------------| 28.0% train gs |████████████████████████████---------

 |██████████████████████████████████████████----------------------------------------------------------| 42.4% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.4% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.5% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.5% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.6% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.6% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.7% train gs |██████████████████████████████████████████----------------------------------------------------------| 42.7% train gs |█████████████████████████████████████

 |████████████████████████████████████████████████████████--------------------------------------------| 56.8% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.9% train gs |████████████████████████████████████████████████████████--------------------------------------------| 56.9% train gs |████████████████████████████████████████████████████████--------------------------------------------| 57.0% train gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.0% train gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.1% train gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.1% train gs |█████████████████████████████████████████████████████████-------------------------------------------| 57.1% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████-----------------------------| 71.0% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.1% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.1% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.2% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.2% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.3% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.3% train gs |███████████████████████████████████████████████████████████████████████-----------------------------| 71.4% train gs |█████████████████████████████████████

 |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.3% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.4% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.4% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.5% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.5% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.6% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.6% train gs |█████████████████████████████████████████████████████████████████████████████████████---------------| 85.7% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████████████████████████████████-| 99.9% train gs |███████████████████████████████████████████████████████████████████████████████████████████████████-| 100.0% train gs |████████████████████████████████████████████████████████████████████████████████████████████████████| 100.0% train gs
 |----------------------------------------------------------------------------------------------------| 0.0% benign gs |██--------------------------------------------------------------------------------------------------| 2.9% benign gs |█████-----------------------------------------------------------------------------------------------| 5.9% benign gs |████████--------------------------------------------------------------------------------------------| 8.8% benign gs |███████████-----------------------------------------------------------------------------------------| 11.8% benign gs |██████████████-------------------

 |----------------------------------------------------------------------------------------------------| 0.0% malware gs |----------------------------------------------------------------------------------------------------| 0.2% malware gs |----------------------------------------------------------------------------------------------------| 0.4% malware gs |----------------------------------------------------------------------------------------------------| 0.6% malware gs |----------------------------------------------------------------------------------------------------| 0.8% malware gs |----------------------------------------------------------------------------------------------------| 0.9% malware gs |█---------------------------------------------------------------------------------------------------| 1.1% malware gs |█---------------------------------------------------------------------------------------------------| 1.3% malware gs |█----------------------------

 |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.0% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.1% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.2% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |----------------------------------------------------------------------------------------------------| 0.3% train gs |---------------------------------------------

 |███████████████-------------------------------------------------------------------------------------| 15.5% train gs |███████████████-------------------------------------------------------------------------------------| 15.5% train gs |███████████████-------------------------------------------------------------------------------------| 15.6% train gs |███████████████-------------------------------------------------------------------------------------| 15.6% train gs |███████████████-------------------------------------------------------------------------------------| 15.7% train gs |███████████████-------------------------------------------------------------------------------------| 15.7% train gs |███████████████-------------------------------------------------------------------------------------| 15.7% train gs |███████████████-------------------------------------------------------------------------------------| 15.8% train gs |███████████████----------------------

 |██████████████████████████████----------------------------------------------------------------------| 30.2% train gs |██████████████████████████████----------------------------------------------------------------------| 30.3% train gs |██████████████████████████████----------------------------------------------------------------------| 30.3% train gs |██████████████████████████████----------------------------------------------------------------------| 30.4% train gs |██████████████████████████████----------------------------------------------------------------------| 30.4% train gs |██████████████████████████████----------------------------------------------------------------------| 30.5% train gs |██████████████████████████████----------------------------------------------------------------------| 30.5% train gs |██████████████████████████████----------------------------------------------------------------------| 30.6% train gs |██████████████████████████████-------

 |████████████████████████████████████████████--------------------------------------------------------| 44.9% train gs |████████████████████████████████████████████--------------------------------------------------------| 45.0% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.0% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.1% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.1% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.2% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.2% train gs |█████████████████████████████████████████████-------------------------------------------------------| 45.3% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████-----------------------------------------| 59.6% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.6% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.7% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.7% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.8% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.8% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.9% train gs |███████████████████████████████████████████████████████████-----------------------------------------| 59.9% train gs |█████████████████████████████████████

 |█████████████████████████████████████████████████████████████████████████---------------------------| 73.7% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.7% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.8% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.8% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.9% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 73.9% train gs |█████████████████████████████████████████████████████████████████████████---------------------------| 74.0% train gs |██████████████████████████████████████████████████████████████████████████--------------------------| 74.0% train gs |█████████████████████████████████████

 |███████████████████████████████████████████████████████████████████████████████████████-------------| 88.0% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.0% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.1% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.1% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.2% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.2% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.3% train gs |████████████████████████████████████████████████████████████████████████████████████████------------| 88.3% train gs |████████████████████████████████████

 |----------------------------------------------------------------------------------------------------| 0.0% benign gs |██--------------------------------------------------------------------------------------------------| 2.9% benign gs |█████-----------------------------------------------------------------------------------------------| 5.9% benign gs |████████--------------------------------------------------------------------------------------------| 8.8% benign gs |███████████-----------------------------------------------------------------------------------------| 11.8% benign gs |██████████████--------------------------------------------------------------------------------------| 14.7% benign gs |█████████████████-----------------------------------------------------------------------------------| 17.6% benign gs |████████████████████--------------------------------------------------------------------------------| 20.6% benign gs |███████████████████████----------

In [23]:
len(gs[0][2])

2092

In [10]:
def calculateDifference(listA, listB, dirs,isBenign):
    csm_val = []
    rootDir = dirs[0]
    benDir = dirs[1]
    trainDir = dirs[2]
    for i in range(len(listA)):
        printProgressBar(i,len(listA)-1,prefix='diff calculation:')
        val = []
        for j in range(len(listB)):
            val.append(1-distance.cosine(listA[i], listB[j]))
        if isBenign:
            csm_val.append([benDir[i].split('\\')[-3],max(val),trainDir[val.index(max(val))].split('\\')[-3]])
        else :
            csm_val.append([rootDir[i].split('\\')[-3],max(val),trainDir[val.index(max(val))].split('\\')[-3]])
    return csm_val

In [11]:
from networkx.algorithms import approximation as approx

In [15]:
# clust = [approx.average_clustering(gs[i])]

# e = [approx.average_clustering(gs[0][i]) for i in range(len(gs[0]))]

In [None]:
# q =[approx.average_clustering(g[1][i]) for i in range(len(g[1]))]

In [31]:
# plt.hist(e,bins= 10)
# plt.hist(q,bins=10)
len(gs[0][1][0])

30

In [35]:
x0 = [[nx.degree_assortativity_coefficient(gs[0][i][j]) for j in range(len(gs[0][i]))] for i in range(len(gs[0]))]
x1 = [[nx.degree_assortativity_coefficient(gs[1][i][j]) for j in range(len(gs[1][i]))] for i in range(len(gs[1]))]
x2 = [[nx.degree_assortativity_coefficient(gs[2][i][j]) for j in range(len(gs[2][i]))] for i in range(len(gs[2]))]
x3 = [[nx.degree_assortativity_coefficient(gs[3][i][j]) for j in range(len(gs[3][i]))] for i in range(len(gs[3]))]
x4 = [[nx.degree_assortativity_coefficient(gs[4][i][j]) for j in range(len(gs[4][i]))] for i in range(len(gs[4]))]
asort = [x0,x1,x2,x3,x4]
len(asort)

5

In [None]:
# f = [nx.degree_assortativity_coefficient(g[1][i]) for i in range(len(g[1]))]

In [None]:
mal_det = np.array([d[i][0] for i in range(len(d))])
ben_det = np.array([d[i][1] for i in range(len(d))])
avg_d = np.mean(mal_det,axis=0)
avg_d_b =  np.mean(ben_det,axis=0)

plt.figure(num=None, figsize=(10,7), dpi=200, facecolor='w', edgecolor=None)
plt.margins(0.01)
plt.plot(avg_d,'r')
plt.plot(avg_d_b,'g')
plt.yticks(np.arange(0,1.05,0.05))
plt.xticks(np.arange(0,len(avg_d),1))
plt.draw()
plt.savefig('average--btc.png')
plt.clf()

In [None]:
sx = sorted(x,reverse= True)
sf = sorted(f,reverse= True)

detection(sx,sf, step = 25)

In [None]:
avgd = [nx.average_neighbor_degree(g[0][i]) for i in range(len(g[0]))]

In [None]:
avgd_ben = [nx.average_neighbor_degree(g[1][i]) for i in range(len(g[1]))]

In [None]:
avgdList = [list(avgd[i].values()) for i in range(len(avgd))]
avgdListBen = [list(avgd_ben[i].values())for i in range(len(avgd_ben))]

In [None]:
calculateDifference(avgdListBen,avgdList, c, True)

In [None]:
from networkx.algorithms.link_analysis import pagerank_numpy
from networkx.algorithms import eccentricity

In [None]:
pgr = [nx.pagerank_numpy(g[0][i])for i in range(len(g[0]))]
pgr_ben = [nx.pagerank_numpy(g[1][i]) for i in range(len(g[1]))]
pgr_train = [nx.pagerank_numpy(g[2][i]) for i in range(len(g[2]))]

In [None]:
pgrgs = [list(pgr[i].values()) for i in range(len(pgr))]
pgrgs_ben = [list(pgr_ben[i].values())for i in range(len(pgr_ben))]
pgrgs_train = [list(pgr_train[i].values())for i in range(len(pgr_train))]

In [None]:
similarityMetric(calculateDifference(pgrgs,pgrgs_train, c, False))

In [None]:
srr = sorted(calculateDifference(pgrgs_ben,pgrgs_train,c, True), key= lambda kv:kv[1],reverse= True)
malrr = sorted(calculateDifference(pgrgs,pgrgs_train,c, False), key= lambda kv:kv[1],reverse = True)

In [None]:
malr = [malrr[i][1] for i in range(len(malrr))]
benr = [srr [i][1] for i in range(len(srr))]

In [None]:
detection(benr,malr,step = 35)

In [None]:
dirs = [createDirs(i) for i in range(1, 6)]

In [None]:
graphs = [createGraphs(dirs[i], False) for i in range(len(dirs))]

In [None]:
def pgrank (graphs,fold) :
    mal_g = graphs[0]
    ben_g = graphs[1]
    train_g =  graphs[2]
    
    pgr = [nx.pagerank_numpy(mal_g[i])for i in range(len(mal_g))]
    pgr_ben = [nx.pagerank_numpy(ben_g[i]) for i in range(len(ben_g))]
    pgr_train = [nx.pagerank_numpy(train_g[i]) for i in range(len(train_g))]
    
    pgrgs = [list(pgr[i].values()) for i in range(len(pgr))]
    pgrgs_ben = [list(pgr_ben[i].values())for i in range(len(pgr_ben))]
    pgrgs_train = [list(pgr_train[i].values())for i in range(len(pgr_train))]
    
    srr = sorted(calculateDifference(pgrgs_ben,pgrgs_train, dirs[fold], True), key= lambda kv:kv[1],reverse= True)
    malrr = sorted(calculateDifference(pgrgs,pgrgs_train, dirs[fold], False), key= lambda kv:kv[1],reverse = True)
    print("-------------==========================--------------------")
    malr = [malrr[i][1] for i in range(len(malrr))]
    benr = [srr [i][1] for i in range(len(srr))]
    
    return [malr,benr]

In [None]:
# srr = sorted(calculateDifference(pgrgs_ben,pgrgs_train,c, True), key= lambda kv:kv[1],reverse= True)
# malrr = sorted(calculateDifference(pgrgs,pgrgs_train,c, False), key= lambda kv:kv[1],reverse = True)
# print("-------------==========================--------------------")
# malr = [malrr[i][1] for i in range(len(malrr))]
# benr = [srr [i][1] for i in range(len(srr))]

In [None]:
exps = [pgrank(graphs[i], i ) for i in range(len(graphs))]