# Feature Selection


A seleção de recursos é um processo que seleciona automaticamente os recursos em seus dados que mais contribuem para a predição ou da saída em que você está interessado.

Ter muitos recursos irrelevantes nos dados pode diminuir a precisão dos modelos.  
Três benefícios de executar a seleção de recursos antes da modelagem dos dados:

- ##### Reduzir Overfitting:  
Dados menos redundantes significa menos oportunidades de tomar decisões.
  
- ##### Melhora a Accuracy:  
Dados sem redundancia melhora os resultados de precisão.  

- ##### Reduz o tempo de treinamento:  
Com a remoção de alguns dados o treinamento se torna mais rapido.

### Recursive Feature Elimination - *RFE*

In [34]:
from sklearn import datasets
from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression

dataset = datasets.load_iris()
features = dataset.feature_names

model = LogisticRegression()

# create the RFE model and select 3 attributes
rfe = RFE(model, 2)
rfe = rfe.fit(dataset.data, dataset.target)

print('Melhores selecionados recebem ranking 1: ')
for i, r in enumerate(rfe.ranking_):
    print([r, features[i]])
    
print()

print('Features usadas:')
for i, s in enumerate(rfe.support_):
    if s:
        print(features[i])

Melhores selecionados recebem ranking 1: 
[3, 'sepal length (cm)']
[1, 'sepal width (cm)']
[2, 'petal length (cm)']
[1, 'petal width (cm)']

Features usadas:
sepal width (cm)
petal width (cm)
