# Random Forest (FR):

## Paso 1: Importar bibliotecas necesarias

En primer lugar, necesitamos importar algunas bibliotecas necesarias para este ejercicio. En particular, necesitaremos pandas para trabajar con datos tabulares y scikit-learn para realizar el análisis de Random Forest.

In [1]:
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

## Paso 2: Cargar los datos

En este ejercicio, vamos a trabajar con un conjunto de datos de clasificación de flores iris. Vamos a cargar los datos utilizando la biblioteca pandas.

In [2]:
df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',
                 header=None,
                 names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'])

# Visualizamos los primeros 5 registros de los datos
print(df.head())


   sepal_length  sepal_width  petal_length  petal_width        class
0           5.1          3.5           1.4          0.2  Iris-setosa
1           4.9          3.0           1.4          0.2  Iris-setosa
2           4.7          3.2           1.3          0.2  Iris-setosa
3           4.6          3.1           1.5          0.2  Iris-setosa
4           5.0          3.6           1.4          0.2  Iris-setosa


## Paso 3: Preparar los datos para el análisis

Antes de poder analizar los datos con Random Forest, debemos preparar los datos. En particular, necesitamos dividir los datos en conjuntos de entrenamiento y prueba. En este ejercicio, utilizaremos el 70% de los datos para el entrenamiento y el 30% para la prueba.

In [11]:
# Dividimos los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(df.iloc[:, :-1], df.iloc[:, -1], test_size=0.4, random_state=42)

# Visualizamos las formas de los conjuntos de entrenamiento y prueba
print('Forma de X_train:', X_train.shape)
print('Forma de y_train:', y_train.shape)
print('Forma de X_test:', X_test.shape)
print('Forma de y_test:', y_test.shape)

Forma de X_train: (90, 4)
Forma de y_train: (90,)
Forma de X_test: (60, 4)
Forma de y_test: (60,)


## Paso 4: Entrenar el modelo de Random Forest

Ahora estamos listos para entrenar el modelo de Random Forest. Para hacerlo, creamos una instancia de RandomForestClassifier y lo ajustamos a los datos de entrenamiento.

In [12]:
# Creamos una instancia del modelo de Random Forest
rf = RandomForestClassifier(random_state=60)

# Entrenamos el modelo con los datos de entrenamiento
rf.fit(X_train, y_train)

## Paso 5: Evaluar el modelo de Random Forest

Finalmente, podemos evaluar el modelo de Random Forest utilizando los datos de prueba. En particular, podemos utilizar la función accuracy_score para calcular la precisión del modelo.

In [13]:
# Realizamos las predicciones utilizando los datos de prueba
y_pred = rf.predict(X_test)

# Calculamos la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)

# Mostramos la precisión del modelo
print('Precisión del modelo:', accuracy)

Precisión del modelo: 0.9833333333333333


Y eso es todo. Este es un ejemplo básico de cómo utilizar el algoritmo de Random Forest para realizar una tarea de clasificación. Por supuesto, hay muchas más cosas que se pueden hacer con este algoritmo, como ajustar los hiperparámetros del modelo y visualizar los resultados. Pero este ejemplo debería darte una idea básica de cómo funciona Random Forest y cómo se puede utilizar en Jupyter Notebook.