# **CONCLUSIONES**

Hemos podido ver claramente que tenemos **un dataset muy desbalanceado** no llegando la clase objetivo ni al 1% del total. Al fin y al cabo esto es más común de lo que suele parecer.

Como bien hemos comentado y se ha visto a lo largo del proceso de desarrollo, la métrica de accuracy no nos es suficientemente útil, ya que el **Accuracy del modelo es básicamente el numero total de predicciones correctas dividido por el número total de predicciones**. Esto hace que al tener una clase muy desbalanceada, la clase que deseamos y que tenemos interés en clasificar, que será la minoritaria, no se clasifique correctamente a pesar de tener un accuracy muy bueno.  

Por ello no nos centraremos en la métrica comentada, será necesario entender las métricas **precision y recall**.  
* **Precision**. La Precisión de una clase define cuan confiable es un modelo en responder si un punto pertenece a esa clase.  
* **Recall**. El Recall de una clase expresa cuan bien puede el modelo detectar a esa clase.  

Con estas 2 métricas podemos tener varias combinaciones en función de sus valores que nos perimitirán escoger entre los diferentes resultados.
* **Alta precision y alto recall**: el modelo maneja perfectamente esa clase.
* **Alta precision y bajo recall**: el modelo no detecta la clase muy bien, pero cuando lo hace es altamente confiable.
* **Baja precisión y alto recall**: La clase detecta bien la clase pero también incluye muestras de otras clases.
* **Baja precisión y bajo recall**: El modelo no logra clasificar la clase correctamente.

Una vez conocidas las metricas que utilizaremos, definiremos el algoritmo que utilizaremos en primera instancia. Utilizaremos el algoritmo RandomForest (RF). **El Random Forest es un algoritmo de clasificación supervisado**. Este algoritmo crea un conjunto de árboles de decisión y a partir de los resultados individuales de cada uno de ellos, se realiza una predicción del comportamiento de un individuo.

**Random Forest funciona así:**

1. Seleccionamos k features (columnas) de las m totales (siendo k menor a m) y creamos un árbol de decisión con esas k características.
2. Creamos n árboles variando siempre la cantidad de k features y también podríamos variar la cantidad de muestras que pasamos a esos árboles (esto es conocido como “bootstrap sample”)
3. Tomamos cada uno de los n árboles y le pedimos que hagan una misma clasificación. Guardamos el resultado de cada árbol obteniendo n salidas.
4. Calculamos los votos obtenidos para cada “clase” seleccionada y consideraremos a la más votada como la clasificación final de nuestro “bosque”.

Debido a la problemática que tenemos del dataset debemos combinar el algoritmo seleccionado con diferentes técnicas que permitan miticar la problemática del desbalanceo. A continuación se explicarán las diferentes técnicas utilizadas en el desarrollo:
* **Ajuste de Parámetros del modelo**: Consiste en ajustar parametros ó metricas del propio algoritmo para intentar equilibrar a la clase minoritaria penalizando a la clase mayoritaria durante el entrenamiento. Ejemplos on ajuste de peso en árboles, también en logisticregression tenemos el parámetro class_weight= “balanced” que utilizaremos en este ejemplo. No todos los algoritmos tienen estas posibilidades. En redes neuronales por ejemplo podríamos ajustar la métrica de Loss para que penalice a las clases mayoritarias.
* **Modificar el Dataset**: podemos eliminar muestras de la clase mayoritaria para reducirlo e intentar equilibrar la situación. Tiene como “peligroso” que podemos prescindir de muestras importantes, que brindan información y por lo tanto empeorar el modelo. Entonces para seleccionar qué muestras eliminar, deberíamos seguir algún criterio. También podríamos agregar nuevas filas con los mismos valores de las clases minoritarias, por ejemplo cuadriplicar nuestras 492 filas. Pero esto no sirve demasiado y podemos llevar al modelo a caer en overfitting.  
* **Muestras artificiales**: podemos intentar crear muestras sintéticas (no idénticas) utilizando diversos algoritmos que intentan seguir la tendencia del grupo minoritario. Según el método, podemos mejorar los resultados. Lo peligroso de crear muestras sintéticas es que podemos alterar la distribución “natural” de esa clase y confundir al modelo en su clasificación.
* **Balanced Ensemble Methods**: Utiliza las ventajas de hacer ensamble de métodos, es decir, entrenar diversos modelos y entre todos obtener el resultado final (por ejemplo “votando”) pero se asegura de tomar muestras de entrenamiento equilibradas.

Realizaremos un modleo base sobre el que comparar los resultados. 

Dentro de las diferentes técnicas para el tratamiento de datos desbalanceados, existen distintos algoritmos. En concreto se explicarán los utilizados en las tecnicas de **Muestras artificiales** y **Balanced Ensemble Methods**:

1. **Muestras artificiales**:
  * **Subsampling en la clase mayoritaria**.
    * **RandomUnderSampler**: Submuestrear la(s) clase(s) mayoritaria(s) seleccionando muestras al azar con o sin reemplazo
  * **Oversampling en la clase minoritaria**.
    * **SMOTE**: Este objeto es una implementación de SMOTE - Técnica de sobremuestreo de minorías sintéticas.
  * **Combinamos OverSampling con Subsampling**.
    * **SMOTE & RandomUnderSampler**
    * **SMOTE-Tomek**: Sobremuestreo usando SMOTE y limpieza usando enlaces Tomek. Combina sobremuestreo y submuestreo utilizando enlaces SMOTE y Tomek.
    
2. **Balanced Ensemble Methods**:
  * **Ensamble de Modelos con Balanceo**
    * **BalancedBaggingClassifier**: Un clasificador de ensacado con balanceo adicional. Esta implementación de Bagging es similar a la implementación de scikit-learn. Incluye un paso adicional para equilibrar el conjunto de entrenamiento en el momento de ajuste utilizando un muestreador determinado. 
    * **RUSBoostClassifier**: Submuestreo aleatorio integrado en el aprendizaje de AdaBoost. Durante el aprendizaje, el problema del equilibrio de clases se alivia mediante un submuestreo aleatorio de la muestra en cada iteración del algoritmo de refuerzo.

--------------

# **Resultados** 

## 1. Notebook: Modelo_1.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 1.00 | 1.00 | 1.00 | **1.00** | 0.98 | 0.86 | **0.92** | 26 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Penalización para compensar** | -- | 0.99 | 1.00 | 1.00 | **1.00** | 0.92 | 0.87 | **0.89** | 25 |
| Modelo 2 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.93 | 1.00 | 0.93 | **0.96** | 0.27 | 0.92 | **0.42** | 26 |
| Modelo 3 | **Oversampling en la clase minoritaria** | SMOTE| 1.00 | 1.00 | 1.00 | **1.00** | 0.96 | 0.86 | **0.91** | 26 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 1.00 | 1.00 | **1.00** | 0.93 | 0.86 | **0.9** | 24 |
| Modelo 5 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 1.00 | 1.00 | 1.00 | **1.00** | 0.96 | 0.86 | **0.91** | 27 |
| Modelo 6 | **Ensamble de Modelos con Balanceo** | BalancedBaggingClassifier| 0.95 | 1.00 | 0.95 | **0.97** | 0.34 | 0.91 | **0.5**  | -- |
| Modelo 7 | **Ensamble de Modelos con Balanceo** | RUSBoostClassifier| 0.97 | 1.00 | 0.98 | **0.99** | 0.5 | 0.9 | **0.64** | -- |

Tras los resultados obtenidos y expuestos, podemos concluir que las técnicas que mejores resultados nos han proporcionado estan entre **Penalización para compensar**, **Oversampling en la clase minoritaria** y **Combinamos OverSampling con Subsampling**, (SMOTE y SMOTE-Tomek respectivamente). Los resultados de las técnicas son muy parecidos al del modelo Base.

Análizando las diferentes métricas obtenidas, en primer lugar nos fijamos que todos las diferentes técnicas tienen un F1-score de la clase No Clientes muy similar entre ellas, por lo que marcará la diferencias será la clase Clientes.

Observando que el modelo base y las técnicas SMOTE y SMOTE-Tomek son los que mejor F1 en la clase clientes tienen, analizaremos en detalle la precisión y recall de cada uno.

Entendiendo que el objetivo del negocio es poder desarrollar una estrategia en base a un determinado grupo, lo que premiaremos es el modelo que mejor recall tenga, ya que lo que interesa es detectar bien la clase clientes. El modelo que mejor responde a esto es el que utiliza la técnica **penalizar para compensar**.

## 2. Notebook: Modelo_2- PF.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 1.00 | 1.00 | 1.00 | **1.00** | 0.97 | 0.76 | **0.85** | 34 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Penalización para compensar** | -- | 0.99 | 1.00 | 1.00 | **1.00** | 0.74 | 0.79 | **0.77** | 29 |
| Modelo 2 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.9 | 1.00 | 0.9 | **0.94** | 0.1 | 0.9 | **0.18** | 30 |
| Modelo 3 | **Oversampling en la clase minoritaria** | SMOTE| 1.00 | 1.00 | 1.00 | **1.00** | 0.88 | 0.77 | **0.82** | 36 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 1.00 | 1.00 | 1.00 | **1.00** | 0.87 | 0.78 | **0.82** | 32 |
| Modelo 5 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 1.00 | 1.00 | 1.00 | **1.00** | 0.89 | 0.77 | **0.82** | 35 |
| Modelo 6 | **Ensamble de Modelos con Balanceo** | BalancedBaggingClassifier| 0.92 | 1.00 | 0.92 | **0.96** | 0.12 | 0.87 | **0.22**  | -- |
| Modelo 7 | **Ensamble de Modelos con Balanceo** | RUSBoostClassifier| 0.93 | 1.00 | 0.93 | **0.96** | 0.13 | 0.87 | **0.23** | -- |

Tras los resultados obtenidos y expuestos, podemos concluir que las técnicas que mejores resultados nos han proporcionado estan entre **Oversampling en la clase minoritaria** y **Combinación OverSampling con Subsampling**. Los resultados de las técnicas son muy parecidos al del modelo Base.

Análizando las diferentes métricas obtenidas, en primer lugar nos fijamos que todos las diferentes técnicas tienen un F1-score de la clase No Clientes muy similar entre ellas, por lo que marcará la diferencias será la clase Clientes.

Observando que el modelo base y las técnicas SMOTE y las de combinación de oversampling y subsampling son los que mejor F1 en la clase clientes tienen, analizaremos en detalle la precisión y recall de cada uno.Unicamente la técnica de ensamblado de modelos con balanceo son los que peor resultado han proporcionado, en los que a F1 de la clase Clientes se refiere.

Sin embargo, entendiendo que el objetivo del negocio es poder desarrollar una estrategia en base a un determinado grupo, lo que premiaremos es el modelo que mejor recall tenga, ya que lo que interesa es detectar bien la clase clientes.

**En este caso preferiremos enviar ofertas a más clientes que perder clientes que si lo son**

El modelo que mejor responde a esto es el que utiliza la técnica **Ensamble de Modelos con Balanceo**, en concreto un boosting, que parece que tiene mejor recall de la clase No Clientes.

## 3. Notebook: Modelo_2- PJ.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 0.99 | 0.99 | 1.00 | **1.00** | 1.00 | 0.91 | **0.95** | 28 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Penalización para compensar** | -- | 0.99 | 0.99 | 1.00 | **1.00** | 1.00 | 0.91 | **0.95** | 29 |
| Modelo 2 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.96 | 1.00 | 0.97 | **0.98** | 0.67 | 0.95 | **0.78** | 28 |
| Modelo 3 | **Oversampling en la clase minoritaria** | SMOTE| 0.99 | 0.99 | 1.00 | **1.00** | 0.99 | 0.92 | **0.95** | 29 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 0.99 | 1.00 | **1.00** | 0.98 | 0.92 | **0.95** | 27 |
| Modelo 5 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 0.99 | 0.99 | 1.00 | **1.00** | 0.99 | 0.92 | **0.95** | 30 |
| Modelo 6 | **Ensamble de Modelos con Balanceo** | BalancedBaggingClassifier| 0.98 | 1.00 | 0.98 | **0.99** | 0.75 | 0.94 | **0.84**  | -- |
| Modelo 7 | **Ensamble de Modelos con Balanceo** | RUSBoostClassifier| 0.98 | 1.00 | 0.98 | **0.99** | 0.81 | 0.94 | **0.87** | -- |

Tras los resultados obtenidos y expuestos, podemos concluir que las técnicas que mejores resultados nos han proporcionado estan entre **Penalización para compensar**, **Oversampling en la clase minoritaria** y **Combinamos OverSampling con Subsampling**. Los resultados de las técnicas son muy parecidos al del modelo Base.

Análizando las diferentes métricas obtenidas, en primer lugar nos fijamos que todos las diferentes técnicas tienen un F1-score de la clase No Clientes muy similar entre ellas, por lo que marcará la diferencias será la clase Clientes.

Observando que el modelo base y las técnicas SMOTE y SMOTE-Tomek son los que mejor F1 en la clase clientes tienen, analizaremos en detalle la precisión y recall de cada uno. Unicamente la técnica de **ensamblado de modelos con balanceo** son los que peor resultado han proporcionado, en los que a F1 de la clase Clientes se refiere. 

Sin embargo, entendiendo que el objetivo del negocio es poder desarrollar una estrategia en base a un determinado grupo, lo que premiaremos es el modelo que mejor recall tenga, ya que lo que interesa es detectar bien la clase clientes. 

El modelo que mejor responde a esto es el que utiliza la técnica **Ensamble de Modelos con Balanceo**, en concreto un boosting.

## 4. Notebook: Modelo_3- ALTAS.ipynb

| Modelo | Accuracy  | NoAltas - Precision  | NoAltas - Recall  | NoAltas F1-score | Altas - Precision | Altas - Recall | Altas F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 0.99 | 0.99 | 1.00 | **1.00** | 0.98 | 0.81 | **0.88** | 26 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoAltas - Precision  | NoAltas - Recall  | NoAltas F1-score | Altas - Precision | Altas - Recall | Altas F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Penalización para compensar** | -- | 0.99 | 0.99 | 1.00 | **1.00** | 0.89 | 0.82 | **0.85** | 24 |
| Modelo 2 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.91 | 1.00 | 0.91 | **0.95** | 0.24 | 0.89 | **0.38** | 24 |
| Modelo 3 | **Oversampling en la clase minoritaria** | SMOTE| 0.99 | 0.99 | 1.00 | **1.00** | 0.92 | 0.81 | **0.86** | 26 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 0.99 | 1.00 | **1.00** | 0.9 | 0.81 | **0.86** | 23 |
| Modelo 5 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 0.99 | 0.99 | 1.00 | **1.00** | 0.92 | 0.81 | **0.86** | 27 |
| Modelo 6 | **Ensamble de Modelos con Balanceo** | BalancedBaggingClassifier| 0.94 | 1.00 | 0.94 | **0.97** | 0.32 | 0.87 | **0.47**  | -- |
| Modelo 7 | **Ensamble de Modelos con Balanceo** | RUSBoostClassifier| 0.96 | 1.00 | 0.96 | **0.98** | 0.43 | 0.86 | **0.58** | -- |

Tras los resultados obtenidos y expuestos, podemos concluir que las técnicas que mejores resultados nos han proporcionado estan entre **Penalización para compensar**, **Oversampling en la clase minoritaria** y **Combinamos OverSampling con Subsampling**, (SMOTE y SMOTE-Tomek respectivamente). Los resultados de las técnicas son muy parecidos al del modelo Base.

Análizando las diferentes métricas obtenidas, en primer lugar nos fijamos que todos las diferentes técnicas tienen un F1-score de la clase No Clientes muy similar entre ellas, por lo que marcará la diferencias será la clase Clientes.

Observando que el modelo base y las técnicas SMOTE y SMOTE-Tomek son los que mejor F1 en la clase clientes tienen, analizaremos en detalle la precisión y recall de cada uno.

Entendiendo que el objetivo del negocio es poder desarrollar una estrategia en base a un determinado grupo, lo que premiaremos es el modelo que mejor recall tenga, ya que lo que interesa es detectar bien la clase clientes. El modelo que mejor responde a esto es el que utiliza la técnica **penalizar para compensar**.

--------------

## 5. Notebook: Modelo_4- XGBoost.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 1.00 | 1.00 | 1.00 | **1.00** | 0.97 | 0.84 | **0.90** | 26 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.92 | 1.00 | 0.92 | **0.96** | 0.23 | 0.92 | **0.37** | 17 |
| Modelo 2 | **Oversampling en la clase minoritaria** | SMOTE| 0.99 | 1.00 | 1.00 | **1.00** | 0.92 | 0.85 | **0.88** | 21 |
| Modelo 3 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 1.00 | 1.00 | **1.00** | 0.88 | 0.86 | **0.87** | 25 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 0.99 | 1.00 | 1.00 | **1.00** | 0.91 | 0.85 | **0.88** | 24 |

## 6. Notebook: Modelo_5- PF - XGBoost.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 1.00 | 1.00 | 1.00 | **1.00** | 0.95 | 0.73 | **0.82** | 46 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.87 | 1.00 | 0.87 | **0.93** | 0.08 | 0.90 | **0.15** | 40 |
| Modelo 2 | **Oversampling en la clase minoritaria** | SMOTE| 1.00 | 1.00 | 1.00 | **1.00** | 0.84 | 0.74 | **0.79** | 42 |
| Modelo 3 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 1.00 | 1.00 | **1.00** | 0.78 | 0.76 | **0.77** | 31 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 1.00 | 1.00 | 1.00 | **1.00** | 0.83 | 0.75 | **0.79** | 34 |

## 7. Notebook: Modelo_5- PJ - XGBoost.ipynb

| Modelo | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Baseline | 0.99 | 0.99 | 1.00 | **1.00** | 0.97 | 0.93 | **0.95** | 25 |  

| Modelo |Tecnica |Algoritmo   | Accuracy  | NoClientes - Precision  | NoClientes - Recall  | NoClientes F1-score | Clientes - Precision | Clientes - Recall | Clientes F1-score | # Variables utilizadas
|---|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
| Modelo 1 | **Subsampling en la clase mayoritaria** | RandomUnderSampler | 0.94 | 1.00 | 0.94 | **0.97** | 0.52 | 0.95 | **0.67** | 17 |
| Modelo 2 | **Oversampling en la clase minoritaria** | SMOTE| 0.99 | 0.99 | 1.00 | **1.00** | 0.97 | 0.93 | **0.95** | 18 |
| Modelo 3 | **Combinamos OverSampling con Subsampling** | SMOTE & RandomUnderSampler | 0.99 | 0.99 | 1.00 | **1.00** | 0.94 | 0.93 | **0.93** | 23 |
| Modelo 4 | **Combinamos OverSampling con Subsampling** | SMOTE-Tomek| 0.99 | 0.99 | 1.00 | **1.00** | 0.97 | 0.92 | **0.95** | 19 |