# Random Forest
Un Random Forest (o Bosque Aleatorio) es un algoritmo de aprendizaje automático supervisado que se usa tanto para clasificación como para regresión. Se basa en la idea de combinar muchos modelos sencillos, en este caso, árboles de decisión, para obtener un modelo más preciso y estable.

## Idea principal
En lugar de entrenar un solo árbol de decisión (que puede sobreajustarse o ser inestable), el random forest:

1. Crea muchos árboles de decisión, cada uno entrenado con una muestra aleatoria de los datos (técnica llamada bagging o bootstrap aggregating).

2. En cada división del árbol, se selecciona un subconjunto aleatorio de características para decidir cómo dividir los nodos.

3. Luego, combina los resultados:
    - **En clasificación**: se toma la votación mayoritaria de los árboles.
    - **En regresión**: se toma el promedio de las predicciones de los árboles.

Generalmente tiene una mejor precisión predictiva que un sólo árbol y trabaja muy bien con los parámetros por defecto.

## Ejemplo

Definiendo los datos de entrada:

In [None]:
import pandas as pd

melbourne_path = "./melb_data.csv"
melbourne_data = pd.read_csv(melbourne_path)
filtered_melbourne_data = melbourne_data.dropna(axis=0)
y = filtered_melbourne_data.Price
melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'BuildingArea', 'YearBuilt', 'Lattitude', 'Longtitude']
X = filtered_melbourne_data[melbourne_features]

Se dividen los datos de entrenamiento y validación:

In [None]:
from sklearn.model_selection import train_test_split

training_X, validation_X, training_y, validation_y = train_test_split(X, y)

Se importa `RandomForestRegressor` y la métrica MAE de `sklearn`.

In [None]:
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error

melbourne_model = RandomForestRegressor(random_state=0)
melbourne_model.fit(training_X, training_y)
melbourne_prediction = melbourne_model.predict(validation_X)
print(mean_absolute_error(validation_y, melbourne_prediction))