# Ajuste de Hiperparâmetros 

As duas técnicas que são bastante utilizada são:

    - Grid Search
    - Random Search
    
![image](https://miro.medium.com/max/363/1*Je_xZzHl49PjQGQbQmjHHQ.jpeg)

## Oque são os hiper-parâmetros

Hiperparâmetros são parâmetros de modelos que devem ser definidos antes de treinar o modelo, como por exemplo quando chamamos a função `Ridge()` um dos parâmetros é o `alpha` que pode variar a fim de gerar um melhor resultado, ou em `ElasticNet()` que devemos alterar a porcentagem que vai ser utilizada pela regularização L1 ou L2 definindo o `l1_ratio`. 

Para isso existem diferentes técnicas que buscam otimizá-los que resultará um melhor acurácia em seu modelo.

## Random Search
Técnica que viza suprir o problema com muitas combinações de hiperparâmetros. Isso deve ao fato de testar combinações aleatórias e os melhores resultados funciona como um guia para a escolha dos próximos hiperparâmetros.


## Grid Search

Essa técnica irá testar todas as combinações possíveis dos hiperparâmetros, exaustivamente. Basicamente, irá fornecer alguns vaores de input e testar todas as combinações plotando em um plano cartesiano *(por isso o nome **Grid**)*. Em seguida, selecionará os hiperparâmetros que obtiveram o menor erro.

*Entretanto, sim irá custar mais computacionalmente ainda mais se os valores de hiperparâmetros e valores possíveis forem altos. Por exemplo, supondo que tenhamos 5 hiperparâmetros e 1000 valores possíveis para cada um. Segundo o grid search tentaremos 1000⁵, alguns casos nem processando paralelo pode ajudar.*


In [4]:
import pandas as pd
df = pd.read_csv("/home/gabriel/Documents/MachineLearning-Files/Exercicios/Datasets/Admission_Predict.csv")
df.drop('Serial No.', axis=1, inplace=True)

In [5]:
df.head()

Unnamed: 0,GRE Score,TOEFL Score,University Rating,SOP,LOR,CGPA,Research,Chance of Admit
0,337,118,4,4.5,4.5,9.65,1,0.92
1,324,107,4,4.0,4.5,8.87,1,0.76
2,316,104,3,3.0,3.5,8.0,1,0.72
3,322,110,3,3.5,2.5,8.67,1,0.8
4,314,103,2,2.0,3.0,8.21,0,0.65


In [6]:
# Separando as variáveis entre preditoras e variável target
y = df['Chance of Admit ']
x = df.drop('Chance of Admit ', axis=1)

In [7]:
from sklearn.model_selection import RandomizedSearchCV
from sklearn.linear_model import ElasticNet

É importante que os valores sejam colocados em um dicionário informando quais os paramêtros e os valores que irão ser testados.

In [8]:
# Definindo os valores que serão testados:
alpha_values = [0.1, 0.5, 1, 2, 5, 10, 25, 50, 100, 150, 200, 300, 500, 750, 1000, 1500, 2000, 3000, 5000]
l1_ratio_values = [0.002, 0.02, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]

valores= {'alpha':alpha_values, 'l1_ratio':l1_ratio_values}

Entendendo a função `RandomizedSearchCV`, que neste caso estamos passando 4 parametros mas o `random_state`, que são:

**estimator** : Que é o modelo de Regressão que vamos utilizar;

**param_distributions** : São os valores que deverão ser informados para a função testar, neste caso estamos informando `valores` que são o `alpha` e o `l1_ratio`, *(LEMBRANDO QUE A ENTRADA DESSE VALOR DEVERÁ SER UM **DICIONÁRIO**)*;

**n_iter** : Número de iterações que o algoritmo deverá realizar;

**cv** : Aqui estamos indicando qual a quantidade folds que desejamos como quando é utilizado o `K-Fold`, Como se fosse o valore de K do K-fold.

In [11]:
# Criando o modelo:
modelo = ElasticNet()
procura = RandomizedSearchCV(estimator = modelo, param_distributions=valores, n_iter=150, cv=5, random_state=15, n_jobs=-1)
procura.fit(x, y)

#Imprimindo o resultado:
print('Melhor Score ::', procura.best_score_)
print('Melhor Alpha ::', procura.best_estimator_.alpha)
print('Melhor l1_ratio ::', procura.best_estimator_.l1_ratio)

Melhor Score :: 0.7478459941349235
Melhor Alpha :: 0.1
Melhor l1_ratio :: 0.002
