**Multilayer Perceptron (MLP)**: é um perceptron multicamada é uma classe de rede neural artificial tipo feedforward, consistindo de pelo menos três camadas de nós, sendo uma camada de entrada, uma camada oculta e uma camada de saída. Exceto pelos nós de entrada, cada nó é um neurônio que usa uma função de ativação não linear. O MLP utiliza uma técnica de aprendizado supervisionado chamada retropropagação para treinamento, podendo distinguir dados que não são linearmente separáveis.

Collobert, R.; Bengio, S. Links between perceptrons, MLPs and SVMs. ICML '04: Proceedings of the twenty-first international conference on Machine learning. https://doi.org/10.1145/1015330.1015415, 2004.

Explicação do algoritmo MLP: https://youtu.be/oivb9285i54

---



**Support Vector Machine (SVM)**: método desenvolvido nos laboratórios da AT&T por Vapnik e Cortes em 1995 é um método de previsão baseado em aprendizagem estatística, que consiste em um conjunto de exemplos de treinamento, onde cada dados é rotulado como pertencente a uma das classes, classificando os dados, mapeando os pontos no espaço, objetivando maximizar a largura da lacuna entre as classes.

Cortes, C.; Vapnik, V. Support-vector networks. Machine Learning. 20 (3): 273–297, Springer. https://doi.org/10.1007/BF00994018, 1995.

Explicação do algoritmo SVM: https://youtu.be/UrR5tcY-wYw



---



**K-Nearest Neighbors (KNN)**: método K vizinhos mais próximos foi proposto por Fukunaga e Narendra em 1975, se tornando um dos algoritmos para solução de problemas da classe de classificação mais usados, pois possui uma abordagem simples de ser implementada, apesar que para grandes volumes de dados irá usar muito recursos de hardware devido a base de sua lógica que consiste no cálculo de distância, e essa é uma tarefa custosa para o hardware, consumindo muito tempo computacional, e é um método que depende no fator K, assim quanto maior, mais recurso de hardware será consumido.

Fukunaga, K.; Narendra, P. A Branch and Bound Algorithm for Computing k-Nearest Neighbors. IEEE Transactions on Computers Volume: C-24, Issue: 7. https://doi.org/10.1109/T-C.1975.224297, 1975.

Explicação do algoritmo KNN: https://youtu.be/oafK8OGu_Vk

In [None]:
#instalar biblioteca Orange Canvas
!pip install Orange3

In [2]:
#importar biblioteca Orange Canvas
import Orange

In [None]:
#importar dados do disco local
from google.colab import files
files.upload()

In [4]:
#instanciar objeto de dados com base no caminho gerado com a importação do arquivo
dados = Orange.data.Table("/content/rotas.csv")

In [None]:
#imprimir os primeiros 5 registros
for d in dados[:5]:
  print(d)

In [None]:
#explorar os metadados
qtde_campos = len(dados.domain.attributes)
qtde_cont = sum(1 for a in dados.domain.attributes if a.is_continuous)
qtde_disc = sum(1 for a in dados.domain.attributes if a.is_discrete)
print("%d metadados: %d continuos, %d discretos" % (qtde_campos, qtde_cont, qtde_disc))
print("Nome dos metadados:", ", ".join(dados.domain.attributes[i].name for i in range(qtde_campos)),)

In [None]:
#explorar classe
dados.domain.class_var

In [None]:
#criar amostra
qtde100 = len(dados)
qtde70 = len(dados) * 70 / 100
qtde30 = len(dados) * 30 / 100
print("Qtde 100%:", qtde100)
print("Qtde  70%:", qtde70)
print("Qtde  30%:", qtde30)
amostra = Orange.data.Table(dados.domain, [d for d in dados if d.row_index < qtde70])
print("Registros:", len(dados))
print("Registros:", len(amostra))

Hiperparâmetros do Multilayer Perceptron

hidden_layer_sizes=(100,): qtde de neurônios por camada(s) oculta(s).

activation='relu': função de ativação para as camadas ocultas.

solver='adam': solucionador para otimização de peso.

alpha=0.0001: parâmetro de penalidade sendo L2 o prazo de regularização.

batch_size='auto': Tamanho dos lotes para otimizadores estocásticos.

learning_rate='constant': cronograma da taxa de aprendizado p/ atualizações de peso.

learning_rate_init=0.001: taxa de aprendizado inicial.

power_t=0.5: expoente para a taxa de aprendizado de escala inversa.

shuffle=True: se as amostras devem ser embaralhadas em cada iteração.

random_state=None: determina a geração de números aleatórios para inicialização de pesos e viés.

tol=0.0001: Tolerância para a otimização.

verbose=False: Se as mensagens de progresso devem ser impressas em stdout.

warm_start=False: ativa/desativa a reutilização da solução da chamada anterior para caber como inicialização.

momentum=0.9: atualização de gradiente descendente.

nesterovs_momentum=True: ativa/desativa o impulso de Nesterov.

early_stopping=False: ativa/desativa a interrupção antecipada para encerrar o treinamento quando a pontuação de validação não estiver melhorando.

validation_fraction=0.1: proporção de dados de treinamento a serem reservados como validação definida para interrupção antecipada.

beta_1=0.9: taxa de decaimento exponencial para estimativas do vetor de primeiro momento.

beta_2=0.999: taxa de decaimento exponencial para estimativas do vetor de segundo momento.

epsilon=1e-08: valor para estabilidade numérica.

max_iter: número máximo de iterações.

preprocessors: é usado o pré-processamento padrão quando nenhum outro pré-processador é fornecido. Ele os executa na seguinte ordem: remove instâncias com valores de destino desconhecidos; continua variáveis categóricas (com codificação one-hot); remove colunas vazias; imputa valores ausentes com valores médios.

In [9]:
#Técnica Multi-Layer Perceptron (MLP)
mlp = Orange.classification.NNClassificationLearner(
    hidden_layer_sizes=(64,64),
    activation='relu',
    solver='sgd',
    alpha=0.0001,
    batch_size='auto',
    learning_rate='constant',
    learning_rate_init=0.001,
    power_t=0.5, max_iter=200,
    shuffle=True, random_state=None,
    tol=0.0001, verbose=False,
    warm_start=False,
    momentum=0.9,
    nesterovs_momentum=True,
    early_stopping=False,
    validation_fraction=0.1,
    beta_1=0.9,
    beta_2=0.999,
    epsilon=1e-08,
    preprocessors=None)

Hiperparâmetros do Support Vector Machine

C: quanto menor, mais larga será a margem, porém com mais chances de violação de margem (função custo).

Kernel: determina a técnica para permitir o uso do SVM não linear com o default sendo o Radial Basis Function (RBF), mas também podendo ser utiliado o Linear, Polymonial e Sigmoid.

Degree: determina o grau que o kernel irá utilizar e o default é 3.

Gamma: determina o valor recomendado para o Kernel de 1/k, onde k é o número de atributos.

Coef0: controla o quanto o modelo é influenciado por polinômios de alto grau versus polinômios de baixo grau.

Shrinking: ativa/desativa o método heurístico de escolha.

Probability: ativa/desativa a construção de um modelo propabilítico.

Tol: taxa de tolerância do critério de rescisão.

Cache_size: tamanho da memória cache em MB

Max_iter: número máximo de iterações.

Preprocessors: é usado o pré-processamento padrão quando nenhum outro pré-processador é fornecido. Ele os executa na seguinte ordem: remove instâncias com valores de destino desconhecidos; continua variáveis categóricas (com codificação one-hot); remove colunas vazias; imputa valores ausentes com valores médios.

In [10]:
#Técnica Support Vector Machine (SVM)
svm = Orange.classification.SVMLearner(
    C=1.0,
    kernel='rbf',
    degree=5,
    gamma='auto',
    coef0=0.0,
    shrinking=True,
    probability=False,
    tol=0.001,
    cache_size=200,
    max_iter=200,
    preprocessors=None)

Hiperparâmetros do K-Nearest Neighbors

n_neighbors: valor correspondente a quantidade de vizinhos mais próximos.

metric: métrica a ser utilizada para cálculo da distância com o default sendo a euclidiana.

weights: determina se o peso será distance onde os vizinhos mais próximos têm influência maior, ou se uniform onde todos os pontos em cada vizinhança são ponderados igualmente.

preprocessors: é usado o pré-processamento padrão quando nenhum outro pré-processador é fornecido. Ele os executa na seguinte ordem: remove instâncias com valores de destino desconhecidos; continua variáveis categóricas (com codificação one-hot); remove colunas vazias; imputa valores ausentes com valores médios.

In [11]:
#Técnica K-Nearest Neightbors (KNN)
knn = Orange.classification.KNNLearner(
    n_neighbors=5,
    metric='euclidean',
    weights='distance',
    algorithm='auto',
    metric_params=None,
    preprocessors=None)

In [None]:
#validar o aprendizado para as 3 técnicas
aprendizado = [mlp, svm, knn]
avaliacao = Orange.evaluation.CrossValidation(dados, aprendizado, k=5)

In [26]:
#imprimir os indicadores para as 3 técnicas
print(" " * 10 + " | ".join("%-4s" % learner.name for learner in aprendizado))
print("MSE..................  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.MSE(avaliacao))) #Erro Médio Quadrático
print("RMSE.................  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.RMSE(avaliacao))) #Raiz do Erro Médio Quadrático
print("MAE..................  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.MAE(avaliacao))) #Erro Médio Absoluto
print("R2...................  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.R2(avaliacao))) #Coeficiênte da Determinação
print("RMSE.................  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.RMSE(avaliacao))) #Coeficiênte da Variação do RMSE
#print("Acurácia  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.CA(avaliacao))) #A =  (VP+VN) / (VP+VN+FP+FN)
#print("Precisão  %s" % " | ".join("%.2f" % s for s in Orange.evaluation.Precision(avaliacao))) #P = (VP) / (VP + FP)
#print("Revocação %s" % " | ".join("%.2f" % s for s in Orange.evaluation.Recall(avaliacao))) #R = (VP) / (VP + FN)
#print("F1        %s" % " | ".join("%.2f" % s for s in Orange.evaluation.F1(avaliacao))) #F = 2 * ((Precisão * Revocação) / (Precisão + Revocação))
#print("ROC       %s" % " | ".join("%.2f" % s for s in Orange.evaluation.AUC(avaliacao))) #

          nn classification | svm  | knn 
MSE..................  4.72 | 4.72 | 4.72
RMSE.................  2.17 | 2.17 | 2.17
MAE..................  2.01 | 2.01 | 2.01
R2...................  -6.02 | -6.02 | -6.02
RMSE.................  2.17 | 2.17 | 2.17
