#### 1. Feature Selection

- https://www.analyticsvidhya.com/blog/2020/10/feature-selection-techniques-in-machine-learning/

- Adding redundant variables reduces the model's generalization capability.
- Adding more variables to a model increases the overall complexity of the model.
- What is feature selection in machine learning?
    - Find the best set of features that allows one to build optimized models.
    - Supervised techniques:
        - Labeled data.
        - Identify the relevant features for increasing the efficiency of supervised models like classification and regression.
    - Unsupervised techniques:
        - Unlabeled data.
    - Filter Methods:
        - Intrinsic properties of the features.
        - Measured via univariate statistics, not cross-validation.
        - Faster and less expensive.
        - Information gain (feature importances):
            - Reduction in entropy from the transformation of a dataset.
        - Chi-square test (selectkbest):
            - Categorical features.
            - Calculate Chi-square between each feature and the target and select the desired number of features with the best Chi-square scores.
        - Correlation Coefficient:
            - Good variables correlate highly with the target.
            - Variables should be correlated with the target but uncorrelated among themselves.
            - If two features are correlated, the model only needs one, as the second does not add additional information.
        - Variance Threshold:
            - It removes all features whose variance doesn’t meet some threshold.
            - By default, it removes all zero-variance features, i.e., features with the same value in all samples.
    - Wrapper Methods:
        - Search the space of all possible subset of features.
        - Assess their quality by learning and evaluating a classifier with that feature subset.
        - Usually result in better predictive accuracy than filter methods.
        - Recursive Feature Elimination:
            - Select features by recursively considering smaller and smaller sets of features.
            - First, the estimator is trained on the initial set of features, and each feature’s importance is obtained.
            - Then, the least important features are pruned from the current set of features. That procedure is recursively repeated on the pruned set until the desired number of features to select is eventually reached.
    - Embedded Methods:
        - takes care of each iteration of the model training process and carefully extract those features which contribute the most to the training for a particular iteration.
        - LASSO Regularization (L1).
        - Random Forest Importance.


https://www.linkedin.com/posts/andreyukio_como-escolher-as-features-para-seu-modelo-activity-7135595939083210752-qdDm/?utm_source=share&utm_medium=member_desktop

Como escolher as features para seu modelo de Machine Learning?

Alguns dos métodos que existem, explicado no português claro:
- Variance Threshold: Você impõe um limite de variância e exclui features que possuem baixa variância.
- Drop Correlated Features: Como o nome diz, exclui as features altamente correlacionadas, afinal, elas são redundantes para a predição.
- Probe Selection: Você cria uma variável aleatória e verifica quais features estão abaixo dela no feature importance. Se a feature é menos importante do que uma feature aleatória, é sinal de que ela não importa muito.
- RFE: Exclui features recursivamente excluindo uma a uma. Basicamente, você treina um modelo com todas as features e verifica o score. Depois, exclui a feature menos importante e verifica o novo score. Se a diferença dos scores for inferior a um certo limite imposto (ou seja, a exclusão da feature não fez diferença no score), você exclui a feature. Você segue fazendo isso até que a diferença do score original para o score novo seja relevante, o que significaria que a feature excluída impacta no poder preditivo do modelo.
- RFA: Exclui features recursivamente adicionando uma a uma. Você treina um modelo com uma feature e verifica o score. Depois, adiciona uma segunda feature, treina de novo e verifica o score. Se subiu acima de um certo valor, você mantém a feature, caso contrário, pode deixá-la de fora.
- SelectKBest: Seleciona as K features com maior score de algum teste estatístico de sua escolha.

![image.png](attachment:image.png)