# Algoritmo de Bosques Aleatorios para Clasificación Binaria (Random Forest Classifier)

La **Clasificación con Bosques Aleatorios** es un método de aprendizaje supervisado de tipo **Ensamble** que, al igual que su contraparte de regresión, utiliza múltiples Árboles de Decisión durante el entrenamiento. En el contexto de la clasificación binaria (donde la variable objetivo $Y$ tiene solo dos posibles resultados, $\mathbf{0}$ o $\mathbf{1}$), el resultado final se determina por **votación mayoritaria** de los árboles.

---

## 1. Fundamentos: Bagging y Aleatoriedad

Random Forest se basa en dos pilares para reducir la varianza y el sobreajuste: **Bagging** y la **Aleatoriedad de Características**.

### A. Bagging (Bootstrap Aggregating)
Se generan $K$ subconjuntos de datos (muestras bootstrap) muestreando el conjunto de datos original con reemplazo. Cada árbol $k$ del bosque se entrena con su propia muestra bootstrap.

### B. Aleatoriedad de Características
En cada nodo de cada árbol, solo se considera un subconjunto aleatorio de $m$ características ($m \leq p$) al buscar la mejor división. Esto garantiza que los árboles sean diversos y descorrelacionados.

---

## 2. Construcción del Árbol de Clasificación

Cada árbol individual en el bosque es un **Árbol de Decisión de Clasificación**. El criterio para decidir la mejor división en cada nodo es el que maximiza la **Pureza** de los nodos hijos o, equivalentemente, el que reduce más la **Impureza**. Los criterios más comunes son la **Ganancia de Información (basada en Entropía)** o el **Índice de Gini**.

### A. Índice de Gini (Criterio de Impureza Común)
El Índice de Gini mide la probabilidad de clasificar erróneamente un elemento si se selecciona al azar. Una impureza de 0.0 indica que el nodo es puro (todos los elementos pertenecen a la misma clase).

$$\mathbf{Gini}(t) = 1 - \sum_{j=1}^{C} (p_j)^2$$

Donde:
* $t$ es el nodo que se evalúa.
* $C$ es el número de clases (en clasificación binaria, $C=2$).
* $p_j$ es la proporción de instancias de la Clase $j$ en el nodo $t$.

### B. Criterio de Decisión
El algoritmo selecciona la característica y el punto de división que maximizan la **Reducción de Impureza** (o Ganancia de Gini).

$$\text{Ganancia Gini} = \mathbf{Gini}_{\text{padre}} - \sum_{hijo \in \{\text{izq, der}\}} w_{hijo} \cdot \mathbf{Gini}_{\text{hijo}}$$

Donde $w_{hijo}$ es la proporción de instancias que caen en el nodo hijo.

---

## 3. Predicción Final (Votación Mayoritaria)

Para hacer una predicción para una nueva instancia $\mathbf{x}$, la instancia es pasada a través de todos los $K$ árboles entrenados. Cada árbol genera una predicción de clase ($\hat{y}_k \in \{0, 1\}$).

### A. Votación de la Clase
El resultado final del Bosque Aleatorio es la clase que recibe la **mayoría de los votos** de todos los árboles.

$$\mathbf{\hat{Y}}_{\text{RF}}(\mathbf{x}) = \text{Moda} \{\hat{y}_1(\mathbf{x}), \hat{y}_2(\mathbf{x}), \dots, \hat{y}_K(\mathbf{x})\}$$

### B. Probabilidades de Clase
Además de la clase, Random Forest puede generar una probabilidad de predicción al contar la proporción de árboles que votaron por una clase específica.

$$\mathbf{P}(Y=1|\mathbf{x}) = \frac{\text{Número de árboles que votaron por la Clase } 1}{K}$$