# Pipelines y Automatización de Flujo de Trabajo en Scikit-Learn 1

**Crea un Pipeline Básico**

Escribe un programa que cree un pipeline utilizando `make_pipeline` de Scikit-Learn. El pipeline debe realizar dos tareas:

1. Escalar los datos usando `StandardScaler`.

2. Entrenar un modelo de regresión logística con `LogisticRegression`.

Utiliza el dataset `load_iris` para entrenar y evaluar el pipeline, dividiendo los datos en conjuntos de entrenamiento y prueba.

**Para ello debes seguir los pasos que se detallan a continuación:**

1. Cargar el dataset `iris`

Crea las variables `X`, `y` para almacenar los parámetros correspondientes

2. Dividir los datos en conjuntos de entrenamiento y prueba con utilizando `train_test_split` con un 30% de los datos para prueba y una semilla aleatoria de 42.

Crea las variables:

`X_train`, 
`X_test`, 
`y_train`, 
`y_test` 

3. Crear el pipeline, almacenalo en una variable llamada: `pipeline`

4. Entrena al modelo

5. Realiza las predicciones. Crea la variable `y_pred`

6. Calcula la precisión. Crea la variable `puntaje`

In [1]:
import numpy as np

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline, make_pipeline


X, y = load_iris(return_X_y=True)

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.3,
    random_state=42
)

# por aquí va el pipeline!
pipeline: Pipeline = make_pipeline(
    StandardScaler(),
    LogisticRegression(random_state=42, max_iter=1000)
)

# entrenar al pipeline!
pipeline.fit(X_train, y_train)

# predicciones con el pipeline
y_pred: np.ndarray | tuple = pipeline.predict(X_test)
puntaje: float = float(pipeline.score(X_test, y_test))

print(f'Las predicciones son: {y_pred}')
print(f'El puntaje para la precisión del modelo es: {puntaje:.2f}')

Las predicciones son: [1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0 0 0 1 0 0 2 1
 0 0 0 2 1 1 0 0]
El puntaje para la precisión del modelo es: 1.00
