# Modelo de Árboles de Decisión

Los **árboles de decisión** son modelos predictivos utilizados tanto en problemas de clasificación como de regresión. Estos modelos se basan en una estructura de árbol, donde cada nodo representa una característica o atributo del conjunto de datos, y cada rama representa un valor posible de ese atributo. Las hojas del árbol representan las predicciones finales o la salida del modelo.

## Estructura de un Árbol de Decisión

Un árbol de decisión está compuesto por tres elementos clave:

1. **Nodos de Decisión (nodos internos):** Representan una prueba o condición sobre un atributo. 
2. **Ramas:** Conectan los nodos y representan el resultado de una prueba o condición.
3. **Nodos Hoja (nodos terminales):** Representan la decisión o predicción final, que puede ser una clase (en clasificación) o un valor continuo (en regresión).

El árbol se construye mediante un proceso de particionamiento recursivo. Comienza en la raíz y se realizan divisiones sucesivas de los datos en subconjuntos más pequeños, utilizando el atributo que mejor separa los datos según un criterio de división. Este proceso continúa hasta que se cumple un criterio de parada, como la profundidad máxima del árbol o un número mínimo de muestras en un nodo.

### Criterios de División

Los criterios de división determinan cómo se eligen los atributos en cada nodo para dividir los datos:

1. **Índice de Gini:** Mide la pureza de los nodos. Un nodo es puro si contiene solo muestras de una clase. El índice de Gini se utiliza comúnmente en clasificación.
   
   $
   Gini = 1 - \sum_{i=1}^{n} p_i^2
   $
   donde $p_i$ es la proporción de elementos en la clase $i$.

2. **Entropía:** Mide la incertidumbre o impureza en un nodo. Es utilizada en la construcción de árboles de decisión como el algoritmo ID3.
   
   $
   Entropía = - \sum_{i=1}^{n} p_i \log_2(p_i)
   $
    donde $p_i$ es la proporción de elementos en la clase $i$.

3. **Reducción de Varianza (para regresión):** En problemas de regresión, se utiliza la varianza de las muestras en los nodos para decidir las divisiones. Se elige la partición que minimiza la varianza dentro de los nodos hijos.

### Ecuación del Modelo

La predicción para un árbol de decisión en un problema de clasificación se puede representar como:

$
\hat{y} = \text{Clase más frecuente en la hoja correspondiente a los valores de } x_1, x_2, \ldots, x_n
$

Para un problema de regresión, la predicción se obtiene promediando los valores de las muestras en la hoja:

$
\hat{y} = \frac{1}{m} \sum_{i=1}^{m} y_i
$
donde $m$ es el número de muestras en la hoja, y $y_i$ es el valor de la variable dependiente.

## Ventajas y Desventajas

- **Ventajas:**
- **Interpretabilidad:** Los árboles de decisión son fáciles de entender y visualizar.
- **No linealidad:** Capturan relaciones no lineales entre las variables independientes y la variable dependiente.
- **No requieren normalización:** No es necesario escalar las características, y pueden manejar variables categóricas y continuas.

- **Desventajas:**
- **Sobreajuste:** Los árboles de decisión pueden sobreajustarse fácilmente a los datos de entrenamiento, lo que reduce su capacidad de generalización.
- **Inestabilidad:** Pequeñas variaciones en los datos pueden llevar a cambios significativos en la estructura del árbol.

## Ejemplo de Aplicación

Supongamos que queremos predecir si un cliente comprará un producto en función de sus características demográficas (edad, ingreso, etc.).

- **Datos de ejemplo:**
  
  | Edad | Ingreso | Compra |
  |------|---------|--------|
  | 25   | Bajo    | No     |
  | 35   | Alto    | Sí     |
  | 45   | Medio   | Sí     |
  | 50   | Alto    | No     |

- **Construcción del Árbol:**
  Utilizando un algoritmo como CART (Classification and Regression Tree), el árbol se construye seleccionando la característica (Edad o Ingreso) que mejor divide los datos según un criterio como el índice de Gini o la entropía. El proceso continúa hasta que se cumplen las condiciones de parada.

- **Predicción:**
  Para un nuevo cliente de 40 años con ingreso medio, el árbol de decisión determinará si comprará o no en función de las reglas aprendidas en los nodos.

### Implementación en Python



In [1]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import LabelEncoder
import numpy as np

# Datos de ejemplo
X = np.array([
    [25, 'Bajo'], 
    [35, 'Alto'], 
    [45, 'Medio'], 
    [50, 'Alto']
])
y = np.array(['No', 'Sí', 'Sí', 'No'])

# Convertir la columna categórica ('Bajo', 'Alto', 'Medio') en valores numéricos
le = LabelEncoder()
X[:, 1] = le.fit_transform(X[:, 1])

# Convertir X de nuevo a tipo numérico (entero)
X = X.astype(float)

# Crear y entrenar el modelo
model = DecisionTreeClassifier(criterion='gini', max_depth=3)
model.fit(X, y)

# Predicción para un nuevo cliente
nuevo_cliente = np.array([[40, 'Medio']])

# Convertir la característica categórica del nuevo cliente
nuevo_cliente[:, 1] = le.transform(nuevo_cliente[:, 1])

# Convertir nuevo_cliente a tipo numérico (entero)
nuevo_cliente = nuevo_cliente.astype(float)

# Realizar la predicción
prediccion = model.predict(nuevo_cliente)

print(f'Predicción para el nuevo cliente: {prediccion[0]}')

Predicción para el nuevo cliente: Sí
