# Dummy Model

Un Dummy Model es un modelo simple que no utiliza los datos de entrada para hacer predicciones significativas. En cambio, sus predicciones se basan en reglas básicas o completamente aleatorias. Su propósito principal no es realizar una clasificación precisa, sino proporcionar un punto de referencia contra el cual se puedan comparar los modelos más avanzados.

---
## ¿Por qué usar un Dummy Model?

1. Establecer un Punto de Referencia:
- Antes de construir un modelo sofisticado (como KNN), es importante saber si dicho modelo realmente agrega valor.
- Un Dummy Model establece un "mínimo aceptable" que cualquier modelo útil debería superar.
2. Detectar Problemas en los Datos:
- Si un modelo avanzado no supera al Dummy Model, podría indicar problemas en los datos, como ruido, desequilibrio de clases o irrelevancia de las características.
3. Evaluar Métricas en Contexto:
- Proporciona un contexto para las métricas de evaluación. Por ejemplo, una precisión del 80% podría no ser impresionante si un Dummy Model logra el 79%.

---

## ¿Cuándo usar un Dummy Model?
- Durante la fase inicial de un proyecto de Machine Learning, para establecer un punto de comparación.
- Al probar nuevos enfoques o algoritmos, para evaluar si aportan mejoras.
- Al manejar conjuntos de datos desbalanceados, para comparar con una estrategia básica como predecir siempre la clase mayoritaria.

---


## Explicación del Código
El código genera predicciones simuladas de un Dummy Model que retorna 1 con una probabilidad definida P.

In [6]:
import numpy as np

In [7]:
def rnd_model_predict(P, size, seed=42):
    rng = np.random.default_rng(seed=seed)  # Inicializa un generador de números pseudoaleatorios.
    return rng.binomial(n=1, p=P, size=size)

**Donde se tiene:**
1. Parámetros:
    - `P`: Probabilidad de predecir `1`. Por ejemplo, si `P=0.7`, el modelo predecirá `1` en el 70% de los casos.
    - `size`: Número de predicciones a generar.
    - `seed`: Semilla para asegurar que los resultados sean reproducibles.

2. Generador de Números Aleatorios:
    ```python
    rng = np.random.default_rng(seed=seed)
    ```
    Se usa `np.random.default_rng()` para crear un generador de números pseudoaleatorios moderno y reproducible.

3. Distribución Binomial:
    ```python
    return rng.binomial(n=1, p=P, size=size)
    ```
    Genera predicciones siguiendo una distribución binomial:
    - `n=1`: Indica que estamos realizando un único experimento de Bernoulli por predicción.
    - `p=P`: Es la probabilidad de éxito (predecir `1`).
    - `size=size`: Especifica cuántas predicciones queremos generar.
    Cada predicción será `1`con probabilidad `P` y `0` con probabilidad `1-P`.

## Ejemplo Práctico
Supongamos que tenemos un dataset con 100 instancias y queremos usar un Dummy Model con probabilidad `P=0.7` para predecir:

In [8]:
predicciones = rnd_model_predict(P=0.7, size=100, seed=42)
print(predicciones)

[0 1 0 1 1 0 0 0 1 1 1 0 1 0 1 1 1 1 0 1 0 1 0 0 0 1 1 1 1 1 0 0 1 1 1 1 1
 1 1 1 1 0 0 1 0 0 1 1 1 1 1 1 0 1 0 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1
 1 1 1 1 1 0 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 0]


Aproximadamente el 70% de los valores serán `1`.

---

## Comparación con un Modelo Real (como KNN)
1. F1-Score en el Dummy Model:
    - Si las clases están desbalanceadas, el Dummy Model puede tener un F1-score relativamente alto al predecir constantemente la clase mayoritaria.

2. KNN y Escalado:
    - KNN puede superar al Dummy Model si las características están bien diseñadas y el escalado mejora su rendimiento. Comparar el F1-score en ambos casos es crucial para verificar si el modelo agrega valor.
---
## Pros y Contras del Dummy Model
**Pros**
- Sencillo y rápido de implementar.
- Útil para detectar problemas en los datos o evaluar nuevas estrategias.
- Proporciona un punto de referencia objetivo.


**Contras**
- No considera patrones complejos en los datos.
- No es adecuado para tareas donde la precisión es crítica.