## Imports

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import json
from pathlib import Path
from time import time
from sklearn.metrics import confusion_matrix, accuracy_score, recall_score, precision_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import Perceptron
from sklearn.tree import DecisionTreeClassifier
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.utils import shuffle
from joblib import Parallel, delayed

In [2]:
#DEFININDO ALGUNS PARÂMETROS DO GRÁFICO
%matplotlib inline
%config InlineBackend.figure_format = 'svg'
params = {
    'figure.figsize': [12, 3.3], 
    'axes.labelsize': 12,
    'axes.titlesize':14, 
    'font.size': 12,
    'legend.fontsize': 10, 
    'xtick.labelsize': 10, 
    'ytick.labelsize': 10,
    'axes.axisbelow': True
}
plt.rcParams.update(params)

## Definição de funções

In [3]:
def abrirDataframe(qtdUsuarios, caminhoPastaCSVs="../../CSV/"):
    caminhoCSV = list(Path(caminhoPastaCSVs).glob("*"+str(qtdUsuarios)+"usuarios*.csv"))[0]
    df = pd.read_csv(caminhoCSV)
    return df

In [4]:
def separarTreinamentoETeste(df, featuresSelecionadas=None, treinarComIntervaloDeSNR=5):
    
    # SELECIONANDO TODAS AS FEATURES SE FEATURESSELECIONADAS VIER NONE
    if featuresSelecionadas == None:
        featuresSelecionadas = df.columns.drop(["potenciaEspiao", "ataquePresente"])
    
    # INDEXES DE TREINAMENTO E TESTE
    indexTrain = df.loc[df["snr"] % treinarComIntervaloDeSNR == 0].index
    indexTest  = df.loc[df["snr"] % treinarComIntervaloDeSNR != 0].index
    
    # TIRANDO UM PERCENTUAL DO TREINAMENTO PARA QUE O TESTE TB TENHA SNRS MOD 5
#     indexesDoTreinamentoParaTeste = shuffle(indexTrain)[:int(0.1*len(indexTrain))]
#     indexTrain = indexTrain.drop(indexesDoTreinamentoParaTeste)
#     indexTest  = indexTest.append(indexesDoTreinamentoParaTeste)
    
    # SEPARANDO OS ARRAYS
    XTrain         = df[featuresSelecionadas].loc[indexTrain]
    XTest          = df[featuresSelecionadas].loc[indexTest]
    yTrain         = df["ataquePresente"].loc[indexTrain]
    yTest          = df["ataquePresente"].loc[indexTest]
    snrTrain       = df["snr"].loc[indexTrain]
    snrTest        = df["snr"].loc[indexTest]
    potEspiaoTrain = df["potenciaEspiao"].loc[indexTrain]
    potEspiaoTest  = df["potenciaEspiao"].loc[indexTest]
    
    return XTrain, XTest, yTrain, yTest, snrTrain, snrTest, potEspiaoTrain, potEspiaoTest

In [5]:
def deteccaoMachineLearning(xTrain, xTest, yTrain, objClassificador):

    # TREINANDO O CLASSIFICADOR
    objClassificador.fit(xTrain, yTrain)

    # PREDIZENDO OS DE TESTE
    yPred = objClassificador.predict(xTest)
        
    return yPred

In [6]:
def deteccaoHassan(XTest):
    tic = time()
    yPred = np.array(list(map(lambda dado: 1 if dado[1]["E"] > dado[1]["eta"] else 0, XTest.iterrows())))
    toc = time()
    return yPred, (toc-tic)/len(XTest)

In [7]:
def deteccaoKapetanovic(XTest, threshold):
    tic = time()
    yPred = np.array(list(map(lambda dado: 1 if dado[1]["a1"]/dado[1]["a2"] > threshold else 0, XTest.iterrows())))
    toc = time()
    return yPred, (toc-tic)/len(XTest)

In [8]:
def obterValoresUnicos(arraySNR, arrayPotEspiao):
    rangeSNRs      = np.unique(arraySNR)
    rangePotEspiao = np.unique(arrayPotEspiao)
    return rangeSNRs, rangePotEspiao

In [9]:
def calcularMetricas(yTest, yPred):
    acuracia  = accuracy_score(yTest, yPred)
    precisao  = precision_score(yTest, yPred)
    revocacao = recall_score(yTest, yPred)
    matrizConfusao = confusion_matrix(yTest, yPred)
    
    return acuracia, precisao, revocacao, matrizConfusao

In [10]:
def plotarResultado(matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeSNRs, qtdUsuarios, qtdAntenas, qtdSimbolos, descricao, acuracia, precisao, revocacao):
    
    # MONTANDO O TITULO DA FIGURA
    titulo  = descricao + "\n"
    titulo += "Usuários: " + str(qtdUsuarios) + " - Antenas: " + str(qtdAntenas) + " - Símbolos: " + str(qtdSimbolos) + "\n"
    titulo += "Acurácia: " + str(acuracia)[:7] + " - Precisão: " + str(precisao)[:7] + " - Revocação: " + str(revocacao)[:7] + "\n"
    
    # CRIANDO O PRIMEIRO GRAFICO
    fig, axs = plt.subplots(1, 2)
    for i in range(len(rangePotEspiao)):
        axs[0].plot(rangeSNRs, matrizProbabilidadeDeteccao[i], label="Potência do Espião: "+str(rangePotEspiao[i]))
    axs[0].set_xlabel("SNR")
    axs[0].set_ylabel("Probabilidade de Detecção")
    axs[0].grid(alpha=0.5)
    axs[0].legend()
    
    # CRIANDO A MATRIZ DE CONFUSAO
    axs[1].imshow(matrizConfusao, cmap="gray")
    for (j,i), total in np.ndenumerate(matrizConfusao):
        axs[1].text(i, j, int(total), ha="center", va="center", color="#e6005c", size=15)
    axs[1].set_xlabel("Predito")
    axs[1].set_ylabel("Real")
    axs[1].set_xticklabels([])
    axs[1].set_yticklabels([])
    
    # PRINTANDO
    plt.suptitle(titulo, y=1.15)
    plt.show()

In [11]:
def obterDictNovoResultado(classificador, matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeSNRs, qtdUsuarios, qtdAntenas, qtdSimbolos, featuresSelecionadas, acuracia, precisao, revocacao, tempoMedioPredicao, repetibilidadeDataset):
    
    classificador = classificador.__class__.__name__ if type(classificador) != str else classificador
    descricao = "Deteccao baseada em " + classificador + " com " + " ".join(featuresSelecionadas)
    
    dictNovoResultado = {
        classificador + "_" + str(time()): {
            "qtdUsuarios": int(qtdUsuarios),
            "qtdAntenas": int(qtdAntenas),
            "qtdSimbolos": int(qtdSimbolos),
            "descricao": descricao,
            "repetibilidadeDataset": int(repetibilidadeDataset),
            "acuracia": float(acuracia),
            "precisao": float(precisao),
            "revocacao": float(revocacao),
            "tempoMedioPredicao": tempoMedioPredicao, 
            "featuresSelecionadas": featuresSelecionadas,
            "rangePotEspiao": rangePotEspiao.tolist(),
            "rangeSNRs": rangeSNRs.tolist(),
            "matrizProbabilidadeDeteccao": matrizProbabilidadeDeteccao.tolist(),
            "matrizConfusao": matrizConfusao.tolist()
        }
    }
    
    return dictNovoResultado

In [12]:
def rodarTesteDeteccao(qtdUsuarios, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic=100):
    
    # PEGO O QUE E O QUE
    XTrain, XTest, yTrain, yTest, snrTrain, snrTest, potEspiaoTrain, potEspiaoTest = separarTreinamentoETeste(abrirDataframe(qtdUsuarios), featuresSelecionadas)
    
    # VALORES UNICOS DE SNR E POTENCIA DE ESPIAO PRA EU SABER O INDEX DAS MATRIZES DE RESULTADOS
    rangeSNRs, rangePotEspiao = obterValoresUnicos(snrTest, potEspiaoTest)
    
    # MATRIZES QUE VAO GUARDAR OS RESULTADOS
    matrizProbabilidadeDeteccao = np.zeros(shape=(len(rangePotEspiao), len(rangeSNRs)))
    
    # PREDICAO
    if esquemaDeteccao == "ML":
        yPred, tempoMedioPredicao = deteccaoMachineLearning(XTrain, XTest, yTrain, classificador)
    elif esquemaDeteccao == "Hassan":
        yPred, tempoMedioPredicao = deteccaoHassan(XTest)
    else:
        yPred, tempoMedioPredicao = deteccaoKapetanovic(XTest, thresholdKapetanovic)

    # AGREGO NA MATRIZ DE PROB DE DETECCAO
    for (indexTesteAtual, predicaoAtual) in zip(yTest.index, yPred):

        # PEGANDO EM QUAL LINHA E EM QUAL COLUNA DA MATRIZ EU VOU COLOCAR O RESULTADO
        indexPotEsp = np.where(rangePotEspiao==potEspiaoTest[indexTesteAtual])[0][0]
        indexSNR    = np.where(rangeSNRs==snrTest[indexTesteAtual])[0][0]

        # JA SOMO COM A PROBABILIDADE (DIVIDINDO PELA REPETIBILIDADE)
        matrizProbabilidadeDeteccao[indexPotEsp][indexSNR] += predicaoAtual/repetibilidadeDataset       
    
    # CONSIDERANDO QUE O DATASET ESTA BALANCEADO, HA MUITO MAIS REPETIBILIDADE QUANDO POTESP = 0
    matrizProbabilidadeDeteccao[0] /= (len(rangePotEspiao) - 1)
    
    # METRICAS
    acuracia, precisao, revocacao, matrizConfusao = calcularMetricas(yTest, yPred)
    
    # DICIONARIOS COM OS RESULTADOS 
    dictNovoResultado = obterDictNovoResultado(classificador, matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeSNRs, qtdUsuarios, qtdAntenas, qtdSimbolos, featuresSelecionadas, acuracia, precisao, revocacao, tempoMedioPredicao, repetibilidadeDataset)
    
    return dictNovoResultado

In [13]:
def salvarNovosResultados(arrayResultados, arquivoSalvar):
    for dictNovoResultado in arrayResultados:
        keyNova    = list(dictNovoResultado.keys())[0]
        valuesNovo = dictNovoResultado[list(dictNovoResultado.keys())[0]]
        with open(arquivoSalvar, mode="r+") as file:
            dictResultados = json.load(file)
            dictResultados[keyNova] = valuesNovo
            file.seek(0)
            json.dump(dictResultados, file, indent=4)
            file.truncate()

## Parâmetros iniciais

In [14]:
classificadores       = [DecisionTreeClassifier(), Perceptron(), LinearDiscriminantAnalysis()]
rangeQtdUsuarios      = np.array([1, 2, 4, 8, 16, 32, 64])
qtdAntenas            = 256
qtdSimbolos           = 128
repetibilidadeDataset = 1000
nucleosProcessador    = -1
thresholdKapetanovic  = 100
plotar                = True
verbose               = 100
combinacoesFeaturesML = [
    ["E"],
    ["E", "eta"],
    ["E", "eta", "snr"],
    ["E", "eta", "snr", "a1", "a2", "a3"],
    ["E", "eta", "a1", "a2", "a3"],
    ["E", "snr", "a1", "a2", "a3"],
    ["E", "a1", "a2", "a3"],
    ["a1", "a2", "a3"]
]
dictResultados = {}
arquivoSalvar = Path("../../Resultados/probabilidadeDeteccao_" + str(time()) + ".json")
with open(arquivoSalvar, mode="w") as file:
    json.dump(dictResultados, file)

## Rodando os testes de detecção com machine learning, hassan e kapetanovic

In [15]:
esquemaDeteccao = "ML"
arrayResultados = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(qtdUsuarios, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for classificador in classificadores for qtdUsuarios in rangeQtdUsuarios for featuresSelecionadas in combinacoesFeaturesML)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:   30.6s
[Parallel(n_jobs=-1)]: Done   2 tasks      | elapsed:   30.9s
[Parallel(n_jobs=-1)]: Done   3 tasks      | elapsed:   31.6s
[Parallel(n_jobs=-1)]: Done   4 tasks      | elapsed:   31.8s
[Parallel(n_jobs=-1)]: Done   5 tasks      | elapsed:   32.1s
[Parallel(n_jobs=-1)]: Done   6 tasks      | elapsed:   32.3s
[Parallel(n_jobs=-1)]: Done   7 tasks      | elapsed:   33.5s
[Parallel(n_jobs=-1)]: Done   8 tasks      | elapsed:   34.5s
[Parallel(n_jobs=-1)]: Done   9 tasks      | elapsed:   57.5s
[Parallel(n_jobs=-1)]: Done  10 tasks      | elapsed:   58.5s
[Parallel(n_jobs=-1)]: Done  11 tasks      | elapsed:   59.2s
[Parallel(n_jobs=-1)]: Done  12 tasks      | elapsed:  1.0min
[Parallel(n_jobs=-1)]: Done  13 tasks      | elapsed:  1.0min
[Parallel(n_jobs=-1)]: Done  14 tasks      | elapsed:  1.0min
[Parallel(n_jobs=-1)]: Done  15 tasks      | elapsed:  1

[Parallel(n_jobs=-1)]: Done 132 tasks      | elapsed:  8.1min
[Parallel(n_jobs=-1)]: Done 133 tasks      | elapsed:  8.2min
[Parallel(n_jobs=-1)]: Done 134 tasks      | elapsed:  8.2min
[Parallel(n_jobs=-1)]: Done 135 tasks      | elapsed:  8.2min
[Parallel(n_jobs=-1)]: Done 136 tasks      | elapsed:  8.2min
[Parallel(n_jobs=-1)]: Done 137 tasks      | elapsed:  8.3min
[Parallel(n_jobs=-1)]: Done 138 tasks      | elapsed:  8.3min
[Parallel(n_jobs=-1)]: Done 139 tasks      | elapsed:  8.4min
[Parallel(n_jobs=-1)]: Done 140 tasks      | elapsed:  8.5min
[Parallel(n_jobs=-1)]: Done 141 tasks      | elapsed:  8.6min
[Parallel(n_jobs=-1)]: Done 142 tasks      | elapsed:  8.6min
[Parallel(n_jobs=-1)]: Done 143 tasks      | elapsed:  8.6min
[Parallel(n_jobs=-1)]: Done 144 tasks      | elapsed:  8.6min
[Parallel(n_jobs=-1)]: Done 145 tasks      | elapsed:  8.7min
[Parallel(n_jobs=-1)]: Done 146 tasks      | elapsed:  8.7min
[Parallel(n_jobs=-1)]: Done 147 tasks      | elapsed:  8.8min
[Paralle

In [16]:
esquemaDeteccao      = "Hassan"
classificador        = esquemaDeteccao
featuresSelecionadas = ["E", "eta"]
arrayResultados      = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(qtdUsuarios, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for qtdUsuarios in rangeQtdUsuarios)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:  1.7min
[Parallel(n_jobs=-1)]: Done   2 out of   7 | elapsed:  1.8min remaining:  4.4min
[Parallel(n_jobs=-1)]: Done   3 out of   7 | elapsed:  1.8min remaining:  2.3min
[Parallel(n_jobs=-1)]: Done   4 out of   7 | elapsed:  1.8min remaining:  1.3min
[Parallel(n_jobs=-1)]: Done   5 out of   7 | elapsed:  1.8min remaining:   42.4s
[Parallel(n_jobs=-1)]: Done   7 out of   7 | elapsed:  1.8min remaining:    0.0s
[Parallel(n_jobs=-1)]: Done   7 out of   7 | elapsed:  1.8min finished


In [17]:
esquemaDeteccao      = "Kapetanovic"
classificador        = esquemaDeteccao
featuresSelecionadas = ["a1", "a2"]
arrayResultados      = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(qtdUsuarios, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for qtdUsuarios in rangeQtdUsuarios)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:  1.6min
[Parallel(n_jobs=-1)]: Done   2 out of   7 | elapsed:  1.6min remaining:  4.1min
[Parallel(n_jobs=-1)]: Done   3 out of   7 | elapsed:  1.6min remaining:  2.2min
[Parallel(n_jobs=-1)]: Done   4 out of   7 | elapsed:  1.6min remaining:  1.2min
[Parallel(n_jobs=-1)]: Done   5 out of   7 | elapsed:  1.6min remaining:   39.1s
[Parallel(n_jobs=-1)]: Done   7 out of   7 | elapsed:  1.6min remaining:    0.0s
[Parallel(n_jobs=-1)]: Done   7 out of   7 | elapsed:  1.6min finished
