## Imports

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import json
from pathlib import Path
from time import time
from sklearn.metrics import confusion_matrix, accuracy_score, recall_score, precision_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import Perceptron
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.utils import shuffle
from joblib import Parallel, delayed

In [2]:
#DEFININDO ALGUNS PARÂMETROS DO GRÁFICO
%matplotlib inline
%config InlineBackend.figure_format = 'svg'
params = {
    'figure.figsize': [12, 3.3], 
    'axes.labelsize': 12,
    'axes.titlesize':14, 
    'font.size': 12,
    'legend.fontsize': 10, 
    'xtick.labelsize': 10, 
    'ytick.labelsize': 10,
    'axes.axisbelow': True
}
plt.rcParams.update(params)

## Definição de funções

In [13]:
def abrirDataframe(snr, tipo, caminhoPastaCSVs="../../CSV/teste_1_influencia_qtd_usuarios/"):
    if tipo=="treinamento":
        caminhoCSV = list(Path(caminhoPastaCSVs).glob("train_dataset_" + str(snr) + "dB_*.csv"))[0]
    else:
        caminhoCSV = list(Path(caminhoPastaCSVs).glob("test_dataset_" + str(snr) + "dB_*.csv"))[0]
    df = pd.read_csv(caminhoCSV)
    return df

In [12]:
def separarXeY(dfTreinamento, dfTeste, featuresSelecionadas=None):
    
    # SELECIONANDO TODAS AS FEATURES SE FEATURESSELECIONADAS VIER NONE
    if featuresSelecionadas == None:
        featuresSelecionadas = df.columns.drop(["qtdUsuarios", "potenciaEspiao", "ataquePresente"])
    
    # SEPARANDO OS ARRAYS
    XTrain           = dfTreinamento[featuresSelecionadas]
    XTest            = dfTeste[featuresSelecionadas]
    yTrain           = dfTreinamento["ataquePresente"]
    yTest            = dfTeste["ataquePresente"]
    qtdUsuariosTrain = dfTreinamento["qtdUsuarios"]
    qtdUsuariosTest  = dfTeste["qtdUsuarios"]
    potEspiaoTrain   = dfTreinamento["potenciaEspiao"]
    potEspiaoTest    = dfTeste["potenciaEspiao"]
    
    return XTrain, XTest, yTrain, yTest, qtdUsuariosTrain, qtdUsuariosTest, potEspiaoTrain, potEspiaoTest

In [5]:
def deteccaoMachineLearning(XTrain, XTest, yTrain, objClassificador):

    # TREINANDO O CLASSIFICADOR
    objClassificador.fit(XTrain, yTrain)

    # PREDIZENDO OS DE TESTE
    arrayTempos = []
    yPred       = []
    for i, amostraTeste in XTest.iterrows():
        tic = time()
        yPred.append(objClassificador.predict([amostraTeste.to_numpy()])[0])
        toc = time()
        arrayTempos.append(toc-tic)
        
    return np.array(yPred), np.mean(arrayTempos), np.std(arrayTempos)

In [6]:
def deteccaoHassan(XTest):
    arrayTempos = []
    yPred       = []
    for i, amostraTeste in XTest.iterrows():
        tic = time()
        yPred.append(1 if amostraTeste["E"] > amostraTeste["eta"] else 0)
        toc = time()
        arrayTempos.append(toc-tic)
        
    return np.array(yPred), np.mean(arrayTempos), np.std(arrayTempos)

In [7]:
def deteccaoKapetanovic(XTest, threshold):
    arrayTempos = []
    yPred       = []
    for i, amostraTeste in XTest.iterrows():
        tic = time()
        yPred.append(1 if amostraTeste["a1"]/amostraTeste["a2"] > threshold else 0)
        toc = time()
        arrayTempos.append(toc-tic)
        
    return np.array(yPred), np.mean(arrayTempos), np.std(arrayTempos)

In [8]:
def obterValoresUnicos(arrayUsuarios, arrayPotEspiao):
    rangeQtdUsuarios = np.unique(arrayUsuarios)
    rangePotEspiao   = np.unique(arrayPotEspiao)
    return rangeQtdUsuarios, rangePotEspiao

In [9]:
def calcularMetricas(yTest, yPred):
    acuracia       = accuracy_score(yTest, yPred)
    precisao       = precision_score(yTest, yPred)
    revocacao      = recall_score(yTest, yPred)
    matrizConfusao = confusion_matrix(yTest, yPred)
    return acuracia, precisao, revocacao, matrizConfusao

In [10]:
def plotarResultado(matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeQtdUsuarios, snr, qtdAntenas, qtdSimbolos, descricao, acuracia, precisao, revocacao):
    
    # MONTANDO O TITULO DA FIGURA
    titulo  = descricao + "\n"
    titulo += "SNR: " + str(snr) + " - Antenas: " + str(qtdAntenas) + " - Símbolos: " + str(qtdSimbolos) + "\n"
    titulo += "Acurácia: " + str(acuracia)[:7] + " - Precisão: " + str(precisao)[:7] + " - Revocação: " + str(revocacao)[:7] + "\n"
    
    # CRIANDO O PRIMEIRO GRAFICO
    fig, axs = plt.subplots(1, 2)
    for i in range(len(rangePotEspiao)):
        axs[0].plot(rangeQtdUsuarios, matrizProbabilidadeDeteccao[i], label="Potência do Espião: "+str(rangePotEspiao[i]))
    axs[0].set_xlabel("Qtd Usuários")
    axs[0].set_ylabel("Probabilidade de Detecção")
    axs[0].grid(alpha=0.5)
    axs[0].legend()
    
    # CRIANDO A MATRIZ DE CONFUSAO
    axs[1].imshow(matrizConfusao, cmap="gray")
    for (j,i), total in np.ndenumerate(matrizConfusao):
        axs[1].text(i, j, int(total), ha="center", va="center", color="#e6005c", size=15)
    axs[1].set_xlabel("Predito")
    axs[1].set_ylabel("Real")
    axs[1].set_xticklabels([])
    axs[1].set_yticklabels([])
    
    # PRINTANDO
    plt.suptitle(titulo, y=1.15)
    plt.show()

In [11]:
def obterDictNovoResultado(classificador, matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeQtdUsuarios, snr, qtdAntenas, qtdSimbolos, featuresSelecionadas, acuracia, precisao, revocacao, tempoMedioPredicao, tempoDesvioPredicao, repetibilidadeDataset):
    
    classificador = classificador.__class__.__name__ if type(classificador) != str else classificador
    descricao = "Deteccao baseada em " + classificador + " com " + " ".join(featuresSelecionadas)
    
    dictNovoResultado = {
        classificador + "_" + str(time()): {
            "snr":                         float(snr),
            "qtdAntenas":                  int(qtdAntenas),
            "qtdSimbolos":                 int(qtdSimbolos),
            "descricao":                   descricao,
            "repetibilidadeDataset":       int(repetibilidadeDataset),
            "acuracia":                    float(acuracia),
            "precisao":                    float(precisao),
            "revocacao":                   float(revocacao),
            "tempoMedioPredicao":          tempoMedioPredicao,
            "tempoDesvioPredicao":         tempoDesvioPredicao, 
            "featuresSelecionadas":        featuresSelecionadas,
            "rangePotEspiao":              rangePotEspiao.tolist(),
            "rangeQtdUsuarios":            rangeQtdUsuarios.tolist(),
            "matrizProbabilidadeDeteccao": matrizProbabilidadeDeteccao.tolist(),
            "matrizConfusao":              matrizConfusao.tolist()
        }
    }
    
    return dictNovoResultado

In [14]:
def rodarTesteDeteccao(snr, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic=100):
    
    # PEGO O QUE E O QUE
    XTrain, XTest, yTrain, yTest, qtdUsuariosTrain, qtdUsuariosTest, potEspiaoTrain, potEspiaoTest = separarXeY(abrirDataframe(snr, "treinamento"), abrirDataframe(snr, "teste"), featuresSelecionadas)
    
    # VALORES UNICOS DE SNR E POTENCIA DE ESPIAO PRA EU SABER O INDEX DAS MATRIZES DE RESULTADOS
    rangeQtdUsuarios, rangePotEspiao = obterValoresUnicos(qtdUsuariosTest, potEspiaoTest)
    
    # MATRIZES QUE VAO GUARDAR OS RESULTADOS
    matrizProbabilidadeDeteccao = np.zeros(shape=(len(rangePotEspiao), len(rangeQtdUsuarios)))
    
    # PREDICAO
    if esquemaDeteccao == "ML":
        yPred, tempoMedioPredicao, tempoDesvioPredicao = deteccaoMachineLearning(XTrain, XTest, yTrain, classificador)
    elif esquemaDeteccao == "Hassan":
        yPred, tempoMedioPredicao, tempoDesvioPredicao = deteccaoHassan(XTest)
    else:
        yPred, tempoMedioPredicao, tempoDesvioPredicao = deteccaoKapetanovic(XTest, thresholdKapetanovic)

    # AGREGO NA MATRIZ DE PROB DE DETECCAO
    for (indexTesteAtual, predicaoAtual) in zip(yTest.index, yPred):

        # PEGANDO EM QUAL LINHA E EM QUAL COLUNA DA MATRIZ EU VOU COLOCAR O RESULTADO
        indexPotEsp      = np.where(rangePotEspiao==potEspiaoTest[indexTesteAtual])[0][0]
        indexQtdUsuarios = np.where(rangeQtdUsuarios==qtdUsuariosTest[indexTesteAtual])[0][0]

        # JA SOMO COM A PROBABILIDADE (DIVIDINDO PELA REPETIBILIDADE)
        matrizProbabilidadeDeteccao[indexPotEsp][indexQtdUsuarios] += predicaoAtual/repetibilidadeDataset       
    
    # CONSIDERANDO QUE O DATASET ESTA BALANCEADO, HA MUITO MAIS REPETIBILIDADE QUANDO POTESP = 0
    matrizProbabilidadeDeteccao[0] /= (len(rangePotEspiao) - 1)
    
    # METRICAS
    acuracia, precisao, revocacao, matrizConfusao = calcularMetricas(yTest, yPred)
    
    # DICIONARIOS COM OS RESULTADOS 
    dictNovoResultado = obterDictNovoResultado(classificador, matrizProbabilidadeDeteccao, matrizConfusao, rangePotEspiao, rangeQtdUsuarios, snr, qtdAntenas, qtdSimbolos, featuresSelecionadas, acuracia, precisao, revocacao, tempoMedioPredicao, tempoDesvioPredicao, repetibilidadeDataset)
    
    return dictNovoResultado

In [15]:
def salvarNovosResultados(arrayResultados, arquivoSalvar):
    for dictNovoResultado in arrayResultados:
        keyNova    = list(dictNovoResultado.keys())[0]
        valuesNovo = dictNovoResultado[list(dictNovoResultado.keys())[0]]
        with open(arquivoSalvar, mode="r+") as file:
            dictResultados = json.load(file)
            dictResultados[keyNova] = valuesNovo
            file.seek(0)
            json.dump(dictResultados, file, indent=4)
            file.truncate()

## Parâmetros iniciais

In [16]:
classificadores       = [DecisionTreeClassifier()]
rangeSNRs             = np.array([10])
qtdAntenas            = 256
qtdSimbolos           = 128
repetibilidadeDataset = 1000
nucleosProcessador    = -1
thresholdKapetanovic  = 100
plotar                = True
verbose               = 100
combinacoesFeaturesML = [
    ["E"],
#     ["E", "a1", "a2"],
#     ["a1", "a2"]
]
dictResultados = {}
arquivoSalvar = Path("../../Resultados/probabilidadeDeteccao_teste1_influencia_qtd_usuarios_" + str(time()) + ".json")
with open(arquivoSalvar, mode="w") as file:
    json.dump(dictResultados, file)

## Rodando os testes de detecção com machine learning, hassan e kapetanovic

In [18]:
esquemaDeteccao = "ML"
arrayResultados = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(snr, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for classificador in classificadores for snr in rangeSNRs for featuresSelecionadas in combinacoesFeaturesML)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:  1.1min
[Parallel(n_jobs=-1)]: Done   1 out of   1 | elapsed:  1.1min finished


In [19]:
esquemaDeteccao      = "Hassan"
classificador        = esquemaDeteccao
featuresSelecionadas = ["E", "eta"]
arrayResultados      = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(snr, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for snr in rangeSNRs)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:   35.4s
[Parallel(n_jobs=-1)]: Done   1 out of   1 | elapsed:   35.5s finished


In [20]:
esquemaDeteccao      = "Kapetanovic"
classificador        = esquemaDeteccao
featuresSelecionadas = ["a1", "a2"]
arrayResultados      = Parallel(verbose=verbose, n_jobs=nucleosProcessador)(delayed(rodarTesteDeteccao)(snr, featuresSelecionadas, classificador, esquemaDeteccao, repetibilidadeDataset, thresholdKapetanovic) for snr in rangeSNRs)
salvarNovosResultados(arrayResultados, arquivoSalvar)

[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:   37.4s
[Parallel(n_jobs=-1)]: Done   1 out of   1 | elapsed:   37.4s finished
