##Integración en un Flujo de Trabajo de Aprendizaje Automático

Ahora que hemos aprendido sobre SimpleImputer, OneHotEncoder y LabelEncoder, veamos cómo integrarlos en un flujo de trabajo completo de aprendizaje automático.

En este ejemplo:

1. Cargamos el conjunto de datos «tic-tac-toe» utilizando fetch_openml() de Scikit-learn.
2. Dividimos los datos en conjuntos de entrenamiento y prueba utilizando train_test_split().
3. Creamos instancias de SimpleImputer y OneHotEncoder para manejar valores faltantes y codificar variables categóricas, respectivamente.
4. Preprocesamos los datos de entrenamiento y prueba utilizando los transformadores.
5. Codificamos las etiquetas de destino utilizando LabelEncoder.
6. Creamos y entrenamos un clasificador de árboles de decisión.
7. Hacemos predicciones en el conjunto de prueba y calculamos la precisión del modelo.
 

Este ejemplo muestra cómo podemos encadenar diferentes pasos de preprocesamiento y ajustar un modelo en un flujo de trabajo coherente.

In [1]:
from sklearn.datasets import fetch_openml
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder, LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# Cargar el conjunto de datos
X, y = fetch_openml('tic-tac-toe', version=1, return_X_y=True)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear un imputador para manejar valores faltantes
imputer = SimpleImputer(strategy='most_frequent')

# Crear un codificador One-Hot para variables categóricas
encoder = OneHotEncoder()

# Preprocesar los datos de entrenamiento
X_train_imputed = imputer.fit_transform(X_train)
X_train_encoded = encoder.fit_transform(X_train_imputed)

# Preprocesar los datos de prueba
X_test_imputed = imputer.transform(X_test)
X_test_encoded = encoder.transform(X_test_imputed)

# Codificar las etiquetas de destino
label_encoder = LabelEncoder()
y_train_encoded = label_encoder.fit_transform(y_train)
y_test_encoded = label_encoder.transform(y_test)

# Crear y entrenar un clasificador de árboles de decisión
classifier = DecisionTreeClassifier()
classifier.fit(X_train_encoded, y_train_encoded)

# Hacer predicciones en el conjunto de prueba
y_pred = classifier.predict(X_test_encoded)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test_encoded, y_pred)
print(f"Precisión del modelo: {accuracy}")

Precisión del modelo: 0.9479166666666666
