## Parâmetros para melhorar performance

- ajuste fino
- alteração dos parâmetros, para melhorar os modelos
- a chave para melhoria dos modelos
- Existem funções que fazem um loop for para alterar os parâmetros(combinações) e testar

In [2]:
import pandas as pd
dataset_raw = pd.read_csv('./Admission_Predict.csv')
dataset_raw.drop('Serial No.', axis=1, inplace=True)

In [3]:
y = dataset_raw['Chance of Admit ']
x = dataset_raw.drop('Chance of Admit ', axis = 1)

## Randomized Search

In [5]:
from sklearn.model_selection import RandomizedSearchCV
from sklearn.linear_model import ElasticNet

In [6]:
# definindo os valores que serão testados:
# a função fará várias combinações conforme os valores abaixo dos parâmetros necessários para o Elastic Net(de forma randômica)
# não faz todas as combinações possíveis
valores = {
    'alpha': [ 0.1,0.5,1,2,5,10,25,50,100,150,200,300,500,750,1000,1500,2000,3000,5000],
    'l1_ratio':[0.02, 0.05,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9]
}


In [9]:
# criando o modelo
modelo = ElasticNet()
procura = RandomizedSearchCV(estimator=modelo, #qual  o algoritmo
                             param_distributions= valores, # entrada é um dict - quais valores serão distribuidos 
                             n_iter=150,  # quantas iterações vai realizar
                             cv=5, # utiliza o kfold internamente, com isso vc passa a quantidade k
                             random_state=15)
procura.fit(x,y)
print(f'melhor score:{procura.best_score_}')
print(f'melhor score:{procura.best_estimator_.alpha}')
print(f'melhor score:{procura.best_estimator_.l1_ratio}')

melhor score:0.7408292165331448
melhor score:0.1
melhor score:0.02


Com a função RandomizedSearchCV, é possível achar os melhores parametros para o algoritmo e então encontrar o melhor R2

## GridSearchCV

In [12]:
from sklearn.model_selection import GridSearchCV
from sklearn.linear_model import ElasticNet

In [16]:
# definindo os valores que serão testados:
# vai testar todas as combinações possíveis
valores = {
    'alpha': [ 0.1,0.5,1,2,5,10,25,50,100,150,200,300,500,750,1000,1500,2000,3000,5000],
    'l1_ratio':[0.02, 0.05,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9]
}


In [17]:
# criando o modelo
modelo = ElasticNet()
procura = GridSearchCV(estimator=modelo, #qual  o algoritmo
                             param_grid = valores, # entrada é um dict - quais valores serão distribuidos 
                             cv=5, # utiliza o kfold internamente, com isso vc passa a quantidade k
                            )
procura.fit(x,y)
print(f'melhor score:{procura.best_score_}')
print(f'melhor score:{procura.best_estimator_.alpha}')
print(f'melhor score:{procura.best_estimator_.l1_ratio}')

melhor score:0.7408292165331448
melhor score:0.1
melhor score:0.02
