## Otimização de hiperparâmetros



## Introdução



Escolheu-se "árvores aleatórias" como algoritmo para otimizar três hiperparâmetros utilizando-se de redes neurais para achar o melhor conjunto de hiperparâmetros.


## Objetivo



**Objetivo**: use algoritmos genéticos para encontrar um bom conjunto de hiperparâmetros em um experimento de aprendizado de máquina. Escolha um algoritmo que tenha pelo menos 3 hiperparâmetros para serem otimizados.



## Importações



Todos os comandos de `import` devem estar dentro desta seção.



In [13]:
import random
import time
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error
from operator import itemgetter
from funcoes import populacao_inicial_hiperparametros as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_hiperparametros
from funcoes import funcao_objetivo_hiperparametros
from funcoes import funcao_objetivo_standard
from funcoes import selecao_torneio_min_hiperparametros as funcao_selecao
from funcoes import reproducao_shuffle_ordenado_hiperparametros as funcao_cruzamento
from funcoes import mutacao_hiperparametros
from funcoes import mutacao_tendencia_as_cegas
from funcoes import hiperparametros_modelo
from deap import base
from deap import creator
from deap import tools

## Códigos e discussão



In [None]:
#########################################################
#CÓDIGO INCOMPLETO
#O ALGORITMO ORIGINAL AINDA NÃO PÔDE SER ADAPTADO AO MÓDULO DEAP.

O notebook GA.08 é um dos experimentos da "Lista de experimentos - hp tuning" e aborda o problema de otimização de hiperparâmetros. Desse modo, foi definido um conjunto de hiperparâmetros aos quais quer se investigar possibilidades de um MSE razoável por meio de algoritmos genéticos. Existem funções particularmente interessantes, como é o caso da "funcao_objetivo_hiperparametros", que utiliza do MSE como parâmetro base para determinar o fitness de cada indivíduo da população, naturalmente aplicando uma "punição" àqueles que não cumprem a condição de ser menor que o "MSE_standard_calculated". Outra interessante é a "mutacao_tendencia_as_cegas", que muta um individuo em um gene aleatório, baseado em um gene (aleatório) de um dos três melhores indivíduos. Ainda, é interessante citar a "reproducao_suffle_ordenado", que cria um indivíduo a partir de outros três - "pai", "mae" e "pae", em que cada um deles fornece um gene aleatório para gerar outros três indivíduos, respeitando a ordem estabelecida. Em última instância, é possível explicitar a "mutacao_hiperparametros", que seleciona um gene aleatório do dicionário que contém os valores dos hiperparâmetros e substitui um gene do indivíduo. Sabe-se que "MSE_standard"/"MSE_standard_calculated" é o valor obtido por meio da modificação mínima (apenas da random_seed) dos hiperparâmetros padrões do scikit-learn. Nota-se que foi utilizado o dataframe "diamonds" (que é completo, bem comportado e ideal) do seaborn pois o foco deste notebook é a estruturação do código de algoritmos genéticos. Entretanto, é possível que, com algumas modificações e otimizações, o código possa ser utilizado para dataframes menos ideais.

In [2]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 9
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
CHANCE_MUTACAO_2 = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3
NUM_GERACOES = 5
NUM_GENES = 5
TAMANHO_HALL_DA_FAMA = 3
CORTE = 3

# relacionadas ao problema a ser resolvido - dataset
TAMANHO_TESTE = 0.25
SEMENTE_ALEATORIA = 1024
DATASET_NAME = "diamonds"
FEATURES = ["carat", "depth", "table", "x", "y", "z"]
TARGET = ["price"]
HIPER_RANGE_1=20
HIPER_RANGE_2=10

In [3]:
#define o dataset e os datasets de treino e teste
#função global pois é o modelo que será usado para esta situação. Isso evita que o mesmo código rode várias vezes.
df = sns.load_dataset(DATASET_NAME) #importar dataset

indices = df.index
indices_treino, indices_teste = train_test_split(
indices, test_size=TAMANHO_TESTE, random_state=SEMENTE_ALEATORIA) #separar os indices entre dataset de treino e teste

df_treino = df.loc[indices_treino] #separa o dataset entre treino e teste
df_teste = df.loc[indices_teste]

# observe que usamos o .values aqui pois queremos apenas os valores
X_treino = df_treino.reindex(FEATURES, axis=1).values
y_treino = df_treino.reindex(TARGET, axis=1).values
X_teste = df_teste.reindex(FEATURES, axis=1).values
y_teste = df_teste.reindex(TARGET, axis=1).values
    


In [4]:
# funções locais
def funcao_objetivo_pop(X_treino,X_teste,y_treino,y_teste,SEMENTE_ALEATORIA,populacao,MSE_standard):
    return funcao_objetivo_pop_hiperparametros(X_treino,X_teste,y_treino,y_teste,SEMENTE_ALEATORIA,populacao,MSE_standard_calculated)

def funcao_mutacao(individuo,hiper_range_1,hiper_range_2):
    return mutacao_hiperparametros(individuo,hiper_range_1,hiper_range_2)

def funcao_mutacao_2(individuo, populacao, corte=3):
    return mutacao_tendencia_as_cegas(individuo, populacao, corte=3)

In [14]:
MSE_standard_calculated = funcao_objetivo_standard(X_treino,X_teste,y_treino,y_teste,SEMENTE_ALEATORIA)
creator.create("Fitness_max", base.Fitness, weights=(1.0,))
creator.create("Individuo", list, fitness=creator.Fitness_max)

toolbox = base.Toolbox()

#toolbox.register(
#    "individuo", tools.initRepeat, creator.Individuo, gene_cb, NUM_CAIXAS
#)

toolbox.register(
    "populacao", list, cria_populacao_inicial(TAMANHO_POP,HIPER_RANGE_1,HIPER_RANGE_2)
)

toolbox.register("evaluate", funcao_objetivo_pop(X_treino,X_teste,y_treino,y_teste,SEMENTE_ALEATORIA,toolbox.populacao,MSE_standard_calculated))

toolbox.register(
    "select", funcao_selecao(populacao, fitness), tournsize=NUM_COMBATENTES_NO_TORNEIO
)

toolbox.register("mate", funcao_cruzamento((pai, mae, pae)))

toolbox.register("mutate",mutacao_tendencia_as_cegas(individuo,populacao,CORTE), indpb=CHANCE_MUTACAO)
toolbox.register("mutate",mutacao_hiperparametros(individuo,HIPER_RANGE_1,HIPER_RANGE_2), indpb=CHANCE_MUTACAO_2)

hall_da_fama = tools.HallOfFame(TAMANHO_HALL_DA_FAMA)

#estatisticas = tools.Statistics(lambda ind: ind.fitness.values)
#estatisticas.register("avg", np.mean)
#estatisticas.register("std", np.std)
#estatisticas.register("min", np.min)
#estatisticas.register("max", np.max)

#log = tools.Logbook()



TypeError: 'functools.partial' object is not iterable

In [6]:
populacao = toolbox.populacao()

# É assim que calculamos a fitness dos individuos com DEAP
fitness = toolbox.map(toolbox.evaluate, populacao)

# Precisamos agora inserir essa informação nos nossos individuos
for ind, fit in zip(populacao, fitness):
    ind.fitness.values = fit

# Critério de parada neste caso é o número de gerações
for n in range(NUM_GERACOES):

    # Seleção
    proxima_geracao = toolbox.select(populacao, len(populacao))

    # Clone dos individuos (para evitar problemas com a forma que o python trabalha com listas)
    proxima_geracao = [toolbox.clone(ind) for ind in proxima_geracao]

    # Cruzamento
    pais = proxima_geracao[0::2]
    maes = proxima_geracao[1::2]

    for pai, mae in zip(pais, maes):
        if random.random() < CHANCE_CRUZAMENTO:
            toolbox.mate(pai, mae)

            # se cruzou, temos que deletar o fitness para calcular de novo
            del pai.fitness.values
            del mae.fitness.values

    # Mutação
    for possivel_mutante in proxima_geracao:
        if random.random() < CHANCE_MUTACAO:
            toolbox.mutate(possivel_mutante)

            # se mutou, temos que deletar o fitness para calcular de novo
            del possivel_mutante.fitness.values

    # Calcular o fitness de todos que mutaram ou cruzaram
    ind_sem_fitness = [ind for ind in proxima_geracao if not ind.fitness.valid]
    fitness = toolbox.map(toolbox.evaluate, ind_sem_fitness)
    for ind, fit in zip(ind_sem_fitness, fitness):
        ind.fitness.values = fit

    # Vamos atualizar a população!
    populacao[:] = proxima_geracao #evitar problemas com interferência. a=b altera a e b. quer-se apenas alterar a.

    # Vamos atualizar o hall da fama
    hall_da_fama.update(populacao)

    # Vamos computar a estatística e atualizar o livro de registros
    #estatistica_local = estatisticas.compile(populacao)
    #log.record(gen=n + 1, nevals=len(ind_sem_fitness), **estatistica_local)
    #print(log.stream)

TypeError: initRepeat() got an unexpected keyword argument 'tamanho'

## Conclusão



Este código tem o objetivo de resolver o problema de otimização de hiperparâmetros com algoritmos genéticos. O problema se baseia em encontrar um conjunto de hiperparâmetros razoáveis por meio de algoritmos genéticos, com base em um dicionário que contém os hiperparâmetros e seus valores estabelecidos. O resultado obtido foi satisfatório, pois em geral (dado o fato de que é um algoritmo probabilístico, não se pode afirmar 100% das vezes) o código entrega conjuntos de hiperparâmetros razoáveis (menores que o MSE_standard). Nota-se que foram escolhidos 3 conjuntos com o fim de explicitar que existem várias possibilidades que geram resultados próximos, não se limitando a apenas uma possibilidade. Um problema deste código é que ele demora consideravelmente para terminar de rodar. Naturalmente, uma mínima otimização foi feita, especificamente onde fosse mais óbvio, no entento isso não solucionou o problema. Nesse caso, as ações possíveis a serem tomadas para otimização é usar o módulo DEAP sem o eaSimple (o que permite maior liberadade para modificações, enquanto se pode aproveitar da otimização e rapidez do DEAP) e analisar meticulosamente as funções para evitar repetições.

## Playground



In [None]:
a = 'aaaaa'
for i in a:
    print(i)

In [None]:
#ideias
#seria uma otima ideia, não implementarei pois achei, até certo grau, reduntante.

#list comprehension inside a dict comprehension

#{
#c:[i for i in range(1,v)] for c,v in hiperparametros.items() #c: chave; v: valor
#}


#**args, *args, **kwargs
######################################

Todo código de teste que não faz parte do seu experimento deve vir aqui. Este código não será considerado na avaliação.



In [None]:
funcao_objetivo_hiperparametros([9, 'poisson', 7],MSE_standard,punishment=1e6)

In [None]:
individuo = [1,2,3]
lst = [[1,2,3],[5,6,7]]

if individuo not in lst:
    print('goofy aah')
else:
    print('yee')

In [None]:
dicio = {
    'a':10,
    'b':11,
    'c':14,
}
#dicio_2 = (a = 10, b = 11, c = 14)
def func(a,b,c, **kwargs):
    print(a)

In [None]:
print(tuple([[1],['a'],[2]]))

In [None]:
dicio = {
    'a':10,
    'b':11,
    'c':14,
}
#dicio_2 = (a = 10, b = 11, c = 14)
def func(a,b,c):
    print(a)

In [None]:
def tendencia_as_cegas(individuo, populacao, fitness_populacao, corte=3):
    
    print(individuo)
    lista_index = [i for i in range(0, (len(individuo)))]
    
    par_populacao_fitness = list(zip(populacao, fitness_populacao))
    par_populacao_fitness_sorted = sorted(par_populacao_fitness, key=itemgetter(-1))
    
    melhores_individuos_zip = par_populacao_fitness_sorted[:corte]
    
    individuo_melhor = random.choice(melhores_individuos_zip)[0]
    
    print('individuo',individuo_melhor)
    numero_mutacoes = random.randint(1, len(individuo))
    print(numero_mutacoes)
    mutate_random_index = random.sample(lista_index, numero_mutacoes)
    print(mutate_random_index)
    
    if individuo_melhor == individuo or numero_mutacoes == len(individuo):
        return individuo
    else:
        for gene_index in mutate_random_index:
            individuo[gene_index] = individuo_melhor[gene_index]
        
    return individuo

In [None]:
def gene_hiperparametros(max_depth_range,min_samples_split_range):
    '''Gera um valor aleatório para cada hiperparâmetro em uma dada faixa.
    
    Returns:
        Um valor válido para os 3 hiparparâmetros variados
        '''

    individuo = []
    hiperparametros = [
    [max_depth for max_depth in range(1,max_depth_range)], #max_depth
    ["gini","entropy","log_loss"], #criterion
    [min_samples_split for min_samples_split in range(2,min_samples_split_range)]
                        ]
    
    for i in (range(0,len(hiperparametros))):
        gene = random.sample(hiperparametros[i], k=1)
        individuo.append(gene)
        
    return individuo
        

In [None]:
def mutacao_hp(individuo,hiper_range_1,hiper_range_2):
    mutacao_individual = 0.25
    hiperparametros_possiveis = hiperparametros_modelo(hiper_range_1,hiper_range_2)
    for i in range(0,len(individuo)):
        if random.random() <= mutacao_individual:
            #mutate_random_hp = random.choice(range(0,len(hiperparametros_possiveis)))
            mutate_random_hp_parameter = random.choice((list(hiperparametros_possiveis.values())[i]))
    
            individuo[i] = mutate_random_hp_parameter
    
    return individuo

In [None]:
def funcao_objetivo_pop_hiperparametros(populacao):

    #print(populacao)
    fitness_pop = []
    high_fit =[] #fit superior a baseline
    low_fit = [] #fit inferior a baseline
    for individuo in populacao:
        populacao_MSE_fit = funcao_objetivo_hiperparametros(individuo)
        individuo = individuo.extend(populacao_MSE_fit)
    
    for individuo_MSE_fit in populacao_MSE_fit:
        if individuo_MSE_fit[-1] != individuo_MSE_fit[-2]: # index([-2,-1]) = [MSE, fitness]
            high_fit.append(individuo_MSE_fit)
            
        else:
            low_fit.append(individuo_MSE_fit)
            
    low_fit_sorted = sorted(low_fit, key=itemgetter(-1)) #itemgetter muito util para sort() em listas de listas
    for low_fit_individuo in low_fit_sorted:
        print(low_fit_sorted)
        low_fit_individuo[1] = low_fit.index(low_fit_individuo)*500
        
        
    return low_fit + high_fit
#ideia: detectar aqueles com o fit menor do que o standard, organiza-los em ordem crescente, de modo que index*500 == fitness