In [1]:
'''
PREPARAÇÃO DOS DADOS
'''

'\nPREPARAÇÃO DOS DADOS\n'

In [2]:
import numpy as np
import pandas as pd
import scipy.optimize  
import os, re, operator
from pprint import pprint
from datetime import datetime

from src.utils import *
from src.k_nearest_neighbors import *
from src.logistic_regression import *
from src.naive_bayes import *
from src.neural_network import *
from src.support_vector_machines import *
from src.validation import *

#Base de dados
POSITIVE_TRUTHFUL  = ['op_spam_v1.4/positive/truthful/']
POSITIVE_DECEPTIVE = ['op_spam_v1.4/positive/deceptive/']
NEGATIVE_TRUTHFUL  = ['op_spam_v1.4/negative/truthful/']
NEGATIVE_DECEPTIVE = ['op_spam_v1.4/negative/deceptive/']
POSITIVE = [POSITIVE_TRUTHFUL[0], POSITIVE_DECEPTIVE[0]]
NEGATIVE = [NEGATIVE_TRUTHFUL[0], NEGATIVE_DECEPTIVE[0]]
DECEPTIVE = [POSITIVE_DECEPTIVE[0], NEGATIVE_DECEPTIVE[0]]
TRUTHFUL = [POSITIVE_TRUTHFUL[0], NEGATIVE_TRUTHFUL[0]]
ALL = [POSITIVE_TRUTHFUL[0], POSITIVE_DECEPTIVE[0],
           NEGATIVE_TRUTHFUL[0], NEGATIVE_DECEPTIVE[0]]

#Parametros
    #Pre-processamento
USE_NGRAM = True
REMOVE_STOPWORD = False
REMOVE_ABOVE_THRESHOLD = 3
MIN_GRAM = 1
MAX_GRAM = 2
NORMALIZE = False
SAVE = False

    #FOLD
K_FOLD = 5

    #Outras constants
EMPTY = ''
ZERO = 0
ONE = 1
ENGLISH = 'english'
STOPWORDS = 'stopwords'

if K_FOLD == ZERO:
    raise Exception('Error on parameter for generate folds.')
if MIN_GRAM > MAX_GRAM or MIN_GRAM < ONE or MAX_GRAM < ONE:
    raise Exception('Error on parameter for N-Gram.')
    
print('Preparações realizadas com sucesso.')

Preparações realizadas com sucesso.


In [3]:
# Remoção de Stop Words
import nltk
from nltk.corpus import stopwords

# Download do dicionário de stop wordsgreat
nltk.download(STOPWORDS)

def stopwords_removal(tokens_list):
    '''
        Dado uma lista de tokens.
        Então é removido as stopwords.
        
        Entrada: tokens_list - Uma lista de tokens.
        Saida: new_tokens_list - Uma lista de tokens.
    '''
    if len(tokens_list) == ZERO:
        raise Exception('Error on stopwords_removal.')
        
    new_tokens_list = []
    
    stop_words = stopwords.words(ENGLISH)
    new_tokens_list = [token for token in tokens_list if token not in stop_words]
    
    if len(new_tokens_list) == ZERO:
        raise Exception('Error on stopwords_removal.')
        
    return new_tokens_list

[nltk_data] Downloading package stopwords to C:\Users\Bruno
[nltk_data]     Morii\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [4]:
# N-gram dos tokens
def generate_ngram(tokens_list):
    '''
        Dado uma lista de tokens.
        Então é gerado N-Gram com base no MAX_GRAM e MIN_GRAM.
        
        Entrada: tokens_list - Uma lista de tokens.
        Saida: allNGrams - Uma lista de N-Gram.
    '''
    if len(tokens_list) == ZERO:
        raise Exception('Error on generate_ngram.')
        
    allNGrams = []
    
    #N-Gram
    for idx in range(MIN_GRAM, MAX_GRAM+1):
        ngrams = zip(*[tokens_list[i:] for i in range(idx)])
        allNGrams += ([" ".join(ngram) for ngram in ngrams])
    
    if len(allNGrams) == ZERO:
        raise Exception('Error on generate_ngram.')
        
    return allNGrams

In [5]:
# Remoção de features irrelevantes por threshold
def features_removal(features_dic, threshold):
    '''
        Dado um dicionario de features e um threshold.
        Então o dicionario é filtrado pelo numero do threshold.
        
        Entrada: features_dic - Um dicionario de features.
                 threshold - Um inteiro para limitar o minimo de ocorrencias de um item do dicionario.
        Saida: new_features_list - Um dicionario de features filtradas.
               new_features_dic - Um dicionario com as features filtradas.
    '''
    if len(features_dic) == ZERO or threshold < ONE:
        raise Exception('Error on features_removal.')

    new_features_dic = {}
    
    #Remove values < threshold
    for key, value in features_dic.items():
        if value > threshold:
            new_features_dic[key] = value

    new_features_list = [k for k, v in new_features_dic.items()]
    new_features_dic = sorted(new_features_dic.items(), key=operator.itemgetter(1))
    
    if len(new_features_list) == ZERO or len(new_features_dic) == ZERO:
        raise Exception('Error on features_removal.')
        
    return new_features_dic, new_features_list

In [6]:
# Tokenização dos textos
def pre_processing(paths, stopwords=False, ngram=False, threshold=0):
    '''
        Dado arquivos de textos.
        Então o texto é limpo (são removidos pontuação) e
            aplicado alguns métodos como remoção de stopwords, N-Gram e filtragem por threshold.
        
        Entrada: paths - Um dicionario de features.
                 stopwords - Um boolean indicando se é para utilizar este método.
                 ngram - Um boolean indicando se é para utilizar este método.
                 threshold - Um inteiro maior que zero que é utilizado na função features_removal.
        Saida: token_list - Uma lista contendo todas as features.
               token_dic - Um dicionario com as features e a sua ocorrencia.
    '''
    if len(paths) == ZERO:
        raise Exception('Error on pre_processing.')
        
    token_dic = {}
    dirs =[]
    token_list = []
    
    #Juntando arquivos de texto
    for p in paths:
        text_path = [p + t for t in os.listdir(p)]
        dirs += (text_path)
    
    for texts in dirs:
        with open(texts, 'r', encoding='utf-8') as stream:
            tokens = []
            text = stream.read()

            #Tokenizando o texto
            tokens = [word for word in (re.sub(r'[^\w\s]+','', text.replace('\n','')).lower().split(' ')) if word != '']
            
            #Tratando stopwords
            if stopwords:
                tokens = stopwords_removal(tokens)
            
            #Aplicando ngram
            if ngram:
                tokens = generate_ngram(tokens)
            
            #Criando dicionario de palavras
            for token in tokens:
                if token in token_dic:
                    token_dic[token] += 1
                else:
                    token_dic[token] = 1
    
    #Removendo palavras com base no threshold
    if threshold > ZERO:
        token_dic, token_list = features_removal(token_dic, threshold)
    else:
        token_list = sorted(token_dic.items(), key=operator.itemgetter(1))
    
    if len(token_dic) == ZERO or len(token_list) == ZERO:
        raise Exception('Error on pre_processing.')
        
    return token_dic, token_list

print('Pré processamento em andamento...')
start_time = datetime.now()
dicFeatures, listFeatures = pre_processing(NEGATIVE_DECEPTIVE, REMOVE_STOPWORD, USE_NGRAM, REMOVE_ABOVE_THRESHOLD)
print('Pré-processamento finalizado.')
end_time = datetime.now()
print('Duração: {}'.format(end_time - start_time))
print('Foram gerados {} features.'.format(len(listFeatures)))


Pré processamento em andamento...
Pré-processamento finalizado.
Duração: 0:00:00.250819
Foram gerados 4387 features.


In [7]:
#Gera a matriz de features X e o vetor de classes Y
X = []
Y = []

def generateFeatures(paths, listFeatures, stopwords=False, ngram=False, threshold=0, example_class=0):
    '''
        Dado arquivos de textos.
        Então o dicionario é filtrado pelo numero do threshold
            e é gerado uma matriz que faz a contagem das features por texto.
        
        Entrada: paths - Textos a serem analizados para a geração das features.
                 listFeatures - Uma lista de features.
                 stopwords - Um boolean indicando se é para utilizar este método.
                 ngram - Um boolean indicando se é para utilizar este método.
                 threshold - Um inteiro maior que zero que é utilizado na função features_removal.
        Saida: Nenhuma.
    '''
    if len(paths) == ZERO:
        raise Exception('Error on generateFeatures.')
        
    dirs = []
    
    for p in paths:
        text_path = [p + t for t in os.listdir(p)]
        dirs += (text_path)
    
    for texts in dirs:
        row = np.zeros(len(listFeatures))
        with open(texts, 'r', encoding='utf-8') as stream:
            tokens = []
            text = stream.read()

            #Pre processing
            tokens = [word for word in (re.sub(r'[^\w\s]+','', text.replace('\n','')).lower().split(' ')) if word != '']
            
            if stopwords:
                tokens = stopwords_removal(tokens)
            
            if ngram:
                tokens = generate_ngram(tokens)
            
            for token in tokens:
                for idx, feature in enumerate(listFeatures):
                    if token == feature:
                        row[idx] += 1
                        
            Y.append(example_class)
            X.append(row)
            
start_time = datetime.now()
print('Tratamento em andamento...')

generateFeatures(NEGATIVE_DECEPTIVE, listFeatures, REMOVE_STOPWORD, USE_NGRAM, REMOVE_ABOVE_THRESHOLD, 1)
end_time = datetime.now()
print('Duração - ND: {}'.format(end_time - start_time))

generateFeatures(NEGATIVE_TRUTHFUL, listFeatures, REMOVE_STOPWORD, USE_NGRAM, REMOVE_ABOVE_THRESHOLD, 0)
end_time = datetime.now()
print('Duração - NT: {}'.format(end_time - start_time))

#generateFeatures(POSITIVE_DECEPTIVE, listFeatures, REMOVE_STOPWORD, USE_NGRAM, REMOVE_ABOVE_THRESHOLD, 1)
end_time = datetime.now()
print('Duração - PD: {}'.format(end_time - start_time))

#generateFeatures(POSITIVE_TRUTHFUL, listFeatures, REMOVE_STOPWORD, USE_NGRAM, REMOVE_ABOVE_THRESHOLD, 0)
end_time = datetime.now()
print('Duração - PT: {}'.format(end_time - start_time))

#Transformando X e Y que são listas em array
X = np.array(X)
Y = np.array(Y)
print('Tratamento finalizado.')

Tratamento em andamento...
Duração - ND: 0:00:30.603054
Duração - NT: 0:00:59.190050
Duração - PD: 0:00:59.190050
Duração - PT: 0:00:59.190050
Tratamento finalizado.


In [8]:
#Salva os dados
if SAVE == True:
    save(np.column_stack((X, Y)), listFeatures, 'matrix_x')
    print('Dados salvos.')

In [9]:
#Normaliza os dados
X_norm = []
mu = 0
sigma = 0

if NORMALIZE == True:
    X_norm, mu, sigma = normalize(X)
    print('Dados normalizados.')

In [10]:
#Gera os folds necessários para os treinamentos 
start_time = datetime.now()
print('Gerando folders...')
folds = stratified_kfolds(Y, K_FOLD, np.unique(Y))
end_time = datetime.now()


print("Foram gerados {} fold(s)".format(K_FOLD), end='\n')
print('Duração: {}\n'.format(end_time - start_time))
idx = 0
for train_index, test_index in folds:
    print('Fold {} - Treino: {}'.format(idx, len(train_index)))
    print('Fold {} - Teste:  {}'.format(idx, len(test_index)), end='\n\n')
    idx += 1
    

Gerando folders...
Foram gerados 5 fold(s)
Duração: 0:00:00.001017

Fold 0 - Treino: 640
Fold 0 - Teste:  160

Fold 1 - Treino: 640
Fold 1 - Teste:  160

Fold 2 - Treino: 640
Fold 2 - Teste:  160

Fold 3 - Treino: 640
Fold 3 - Teste:  160

Fold 4 - Treino: 640
Fold 4 - Teste:  160



In [None]:
'''
NAIVE BAYES
'''

In [None]:
# Multinomial Naive Bayes
def multinomial_naiveBayes(folds, X, Y):
    '''
        Dado os folds, X e Y.
        Então é executado o algoritmo naive bayes para cada fold.
        
        Entrada: folds - Folds para serem testados.
                 X - Matriz de conjunto de dados.
                 Y - Lista com as classes correspondente aos dados da matriz X.
        Saida: resultados - Lista de resultados para cada fold.
               classes - Lista com as classes baseada na lista Y.
    '''
    resultados = []
    classes = np.unique(Y)

    for train_index, test_index in folds:
        # Treinamento
        probsPos, probsNeg = mult_nb_calcular_probabilidades(X[train_index], Y[train_index])

        # Classificação
        pred = []
        for x in X[test_index]:
            pred.append(mult_nb_classificacao(x, probsPos, probsNeg, sum(Y == 1)/len(Y), sum(Y == 0)/len(Y)))

        cm = get_confusionMatrix(Y[test_index], pred, np.unique(Y))
        resultado = relatorioDesempenho(cm, classes, False)

        resultados.append(resultado)
    
    return resultados, classes


In [None]:
# ---------------------------
# Rotina de testes - NB
#----------------------------
start_time = datetime.now()
print('Naive Bayes em andamento...')
resultados, classes = multinomial_naiveBayes(folds, X, Y)
mediaFolds(resultados, classes)
end_time = datetime.now()
print('Duração - Naive Bayes: {}'.format(end_time - start_time))

In [None]:
# KNN
def K_Nearest_Neighbors(folds, X, Y):
    '''
        Dado os folds, X e Y.
        Então é executado o algoritmo KNN para cada fold.
        
        Entrada: folds - Folds para serem testados.
                 X - Matriz de conjunto de dados.
                 Y - Lista com as classes correspondente aos dados da matriz X.
        Saida: resultados - Lista de resultados para cada fold.
               classes - Lista com as classes baseada na lista Y.
    '''
    resultados = []
    classes = np.unique(Y)

    for train_index, test_index in folds:
        # Classificação
        pred = []
        K = 3
        for x in X[test_index]:
            y, ind_viz = knn(x, X, Y, K)
            pred.append(y)

        cm = get_confusionMatrix(Y[test_index], pred, np.unique(Y))
        resultado = relatorioDesempenho(cm, classes, False)

        resultados.append(resultado)
    
    return resultados, classes


In [None]:
# ---------------------------
# Rotina de testes - KNN
#----------------------------
print('KNN em andamento...')
start_time = datetime.now()
resultados, classes = K_Nearest_Neighbors(folds, X, Y)
end_time = datetime.now()
print('Duração - KNN: {}'.format(end_time - start_time))
mediaFolds(resultados, classes)

In [None]:
'''
REDE NEURAL
'''

In [None]:
# Rede Neural
def redeNeural(folds, X, Y, vLambda, tamanho_intermediaria):
    '''
        Dado os folds, X e Y, vLambda e tamanho_intermediaria.
        Em que:
            vLambda é coeficiente de regularização
            tamanho_intermediaria é o número de neurônios na camada intemediária
        Então é executado o algoritmo naive bayes para cada fold.
        
        Entrada: folds - Folds para serem testados.
                 X - Matriz de conjunto de dados.
                 Y - Lista com as classes correspondente aos dados da matriz X.
                 
        Saida: resultados - Lista de resultados para cada fold.
               classes - Lista com as classes baseada na lista Y.
    '''
    resultados = []
    
    classes = np.unique(Y)
    tamanho_entrada = X.shape[1]

    
    Theta1 = inicializaPesosAleatorios(tamanho_entrada, tamanho_intermediaria, randomSeed = 10);
    Theta2 = inicializaPesosAleatorios(tamanho_intermediaria, 2, randomSeed = 20);
    Thetas = np.concatenate([np.ravel(Theta1), np.ravel(Theta2)])
    
    start_time = datetime.now()
    for train_index, test_index in folds:
        
        # Otimização dos Thetas
        
        Theta1, Theta2 = rna_treino(Thetas, tamanho_entrada, tamanho_intermediaria, 2, X[train_index], Y[train_index], vLambda)
        save_raw(Theta1, 'RNAResults/' + 'v' + str(vLambda) + 'n' + str(tamanho_intermediaria) + 'Theta1')
        save_raw(Theta2, 'RNAResults/' + 'v' + str(vLambda) + 'n' + str(tamanho_intermediaria) + 'Theta2')
        
        # Classificação
        pred = rna_predicao(Theta1, Theta2, X[test_index])
        #display(pred)

        cm = get_confusionMatrix(Y[test_index], pred, np.unique(Y))
        resultado = relatorioDesempenho(cm, classes, False)

        resultados.append(resultado)
        end_time = datetime.now()
        print('Duração - Fold em RNA: {}'.format(end_time - start_time))
    
    return resultados, classes


In [None]:
print('RNA em andamento...')
start_time = datetime.now()
resultados, classes = redeNeural(folds, X, Y, 17, 15)
end_time = datetime.now()
print('Duração - RNA: {}'.format(end_time - start_time))
mediaFolds(resultados, classes)

In [None]:
# ---------------------------
# Rotina de testes - RNA
#----------------------------
vlambdas = [1, 3, 5 , 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 42]
inter_neuros = [2, 3, 5, 7 ,10, 15, 25]
#inter_neuros = [10]

#cria matriz para salvar no csv
save_matrix = [[0 for x in range(len(inter_neuros)+1)] for y in range(len(vlambdas)+1)]
save_matrix[0][0] = -1
for i in range(len(inter_neuros)):
    save_matrix[0][i+1] = inter_neuros[i]
for i in range(len(vlambdas)):
    save_matrix[i+1][0] = vlambdas[i]
display(save_matrix)

display('#############################')
display('Iniciando rotina de Testes...')
display('#############################')
start_all = datetime.now()
for v in range(len(vlambdas)):
    for i in range(len(inter_neuros)):
        display('------------------------------------------------------------')
        display('RNA em andamento com vLambda = ' + str(vlambdas[v]) + ' e ' + str(inter_neuros[i]) + ' neurônios na camada intermediária...' )
        start_time = datetime.now()
        resultados, classes = redeNeural(folds, X, Y, vlambdas[v], inter_neuros[i])
        end_time = datetime.now()
        print('Duraçãos Total - RNA: {}'.format(end_time - start_time))
        save_matrix[v+1][i+1] = mediaFolds(resultados, classes)
        display(save_matrix)
        
display('############################')
display('Rotina de testes finalizadas')
end_time = datetime.now()
print('Duração Total - RNA: {}'.format(end_time - start_all))
save_raw(save_matrix, 'RNAResults/Results')
display('############################')

In [None]:
mat = np.array(save_matrix)
mat = mat[1:,1:]
display(inter_neuros[np.argmax(np.mean(mat, axis=0))])
display(vlambdas[np.argmax(np.mean(mat, axis=1))])


In [None]:
'''
REGRESSAO LOGISTICA
'''

In [None]:
# REGRESSAO LOGISTICA
def regressaoLogistica(folds, X, Y):
    '''
        Dado os folds, X e Y.
        Então é executado o algoritmo para cada fold.
        
        Entrada: folds - Folds para serem testados.
                 X - Matriz de conjunto de dados.
                 Y - Lista com as classes correspondente aos dados da matriz X.
        Saida: resultados - Lista de resultados para cada fold.
               classes - Lista com as classes baseada na lista Y.
    '''
    
    resultados = []
    classes = np.unique(Y)
    m, n = X.shape
    X = np.column_stack( (np.ones(m),X) ) 
    MaxIter = 100 

    theta = np.zeros(n+1)
    result = scipy.optimize.minimize(fun=funcaoCusto, x0=theta, args=(X, Y),  
                method='BFGS', jac=True, options={'maxiter': MaxIter, 'disp':True})
    theta = result.x

    for train_index, test_index in folds:
        pred = []
        pred = predicao(theta, X[test_index])

        cm = get_confusionMatrix(Y[test_index], pred, np.unique(Y))
        resultado = relatorioDesempenho(cm, classes, False)

        resultados.append(resultado)
    
    return resultados, classes


In [None]:
# ---------------------------
# Rotina de testes - RL
#----------------------------

print('Regressao Logistica em andamento...')
start_time = datetime.now()
resultados, classes = regressaoLogistica(folds, X, Y)
end_time = datetime.now()
print('Duração - Regressao Logistica: {}'.format(end_time - start_time))
mediaFolds(resultados, classes)

In [None]:
'''
SUPPORT VECTOR MACHINES
'''

In [None]:
KERNEL = 2
def testaUmFoldSVM():
    COST = [0.09*(i**2)+(i*0.5)+0.1 for i in range(0, 30)]
    GAMMA = [0.09*(i**2)+(i*0.5)+0.1 for i in range(0, 30)]
    for train_index, test_index in folds:
        melhor_custo, melhor_gamma = svm_encontrar_melhor(X_norm[train_index], Y[train_index], X_norm[test_index], Y[test_index], COST, GAMMA, KERNEL)
        print('Foram encontrados:\nCusto: {}\nGamma: {}\nKernel: {}'.format(melhor_custo, melhor_gamma, KERNEL))
        return melhor_custo, melhor_gamma

In [None]:
def predSVM(folds, X, Y):
    resultados = []
    classes = np.unique(Y)
    
    start_time = datetime.now()
    for train_index, test_index in folds:
        resultado = []
        pred = svm_predizer(X_norm[train_index], Y[train_index], X_norm[test_index], Y[test_index], COST, GAMMA, KERNEL)
        
        cm = get_confusionMatrix(Y[test_index], pred[0], np.unique(Y))
        resultado = relatorioDesempenho(cm, classes, False)
        
        resultados.append(resultado)
        end_time = datetime.now()
        print('Duração - Fold em SVM: {}'.format(end_time - start_time))
        
    return resultados, classes

print('Encontrando o melhor Custo e Gamma para Kernel = {} em andamento...'.format(KERNEL))
start_time = datetime.now()
COST, GAMMA = testaUmFoldSVM()
end_time = datetime.now()
print('Duração - SVM: {}'.format(end_time - start_time))

print('SVM em andamento...')
start_time = datetime.now()
resultados, classes = predSVM(folds, X, Y)
end_time = datetime.now()
print('Duração - SVM: {}'.format(end_time - start_time))
mediaFolds(resultados, classes)

In [18]:
PERC = 0.8
train_index, val_index = stratified_holdOut(Y, PERC)

Xpol_train_v, Xpol_val = X[train_index, :], X[val_index, :]
Y_train_v, Y_val = Y[train_index], Y[val_index]

In [20]:
def curva_aprendizado(X, Y, Xval, Yval):
    """
    Funcao usada gerar a curva de aprendizado.
  
    Parametros
    ----------
  
    X : matriz com os dados de treinamento
  
    Y : vetor com as classes dos dados de treinamento
  
    Xval : matriz com os dados de validação
  
    Yval : vetor com as classes dos dados de validação
  
    """

    # inicializa as listas que guardarao a performance no treinamento e na validacao
    perf_train = []
    perf_val = []

    # inicializa o parametro de regularizacao da regressao logistica
    lambda_reg = 1
        
    # Configura o numero de interacaoes da regressao logistica
    iteracoes = 100
    
    start_general = datetime.now()
    for idx in range(10, len(X)):
        display('Iteração' + str(idx))
        start_time = datetime.now()
        theta = np.zeros(X.shape[1])
        result = scipy.optimize.minimize(fun=funcaoCusto, x0=theta, args=(X[:idx], Y[:idx]),  
                    method='BFGS', jac=True, options={'maxiter': iteracoes, 'disp':True})
        theta = result.x
        
        predTr = predicao(X[:idx], theta)
        predVal = predicao(Xval, theta)
        
        cmTr = get_confusionMatrix(Y[:idx], predTr, np.unique(np.sort(Y)))
        cmVal = get_confusionMatrix(Yval, predVal, np.unique(np.sort(Y)))
        
        relTr = relatorioDesempenho(cmTr, np.unique(np.sort(Y)))
        relVal = relatorioDesempenho(cmVal, np.unique(np.sort(Y)))
        
        perf_val.append(relVal['acuracia'])
        perf_train.append(relTr['acuracia'])
        end_time = datetime.now()
        print('Duração - Curva: {}'.format(end_time - start_general))
    
    end_time = datetime.now()
    print('Duração - Curva: {}'.format(end_time - start_general))
    
    # Define o tamanho da figura 
    plt.figure(figsize=(20,12))

    # Plota os dados
    plt.plot(perf_train, color='blue', linestyle='-', linewidth=1.5, label='Treino') 
    plt.plot(perf_val, color='red', linestyle='-', linewidth=1.5, label='Validação')

    # Define os nomes do eixo x e do eixo y
    plt.xlabel(r'# Qtd. de dados de treinamento',fontsize='x-large') 
    plt.ylabel(r'Acuracia',fontsize='x-large') 

    # Define o título do gráfico
    plt.title(r'Curva de aprendizado', fontsize='x-large')

    # Acrescenta um grid no gráfico
    plt.grid(axis='both')

    # Plota a legenda
    plt.legend()
    
    plt.show()


curva_aprendizado(Xpol_train_v, Y_train_v, Xpol_val, Y_val)

'Iteração10'

Optimization terminated successfully.
         Current function value: 0.000001
         Iterations: 6
         Function evaluations: 11
         Gradient evaluations: 11
Duração - Curva: 0:00:13.499558


'Iteração11'

KeyboardInterrupt: 