In [None]:
# 8. **Métricas de Evaluación**
   - **Utilidad:** Este grupo de métodos se utiliza para medir la precisión y eficacia de los modelos de clasificación y regresión.
   - **Funciones comunes:**
     - **precision_score:** Calcular la precisión de las predicciones.
     - **recall_score:** Calcular el recall de las predicciones.
     - **f1_score:** Calcular el F1-score.
     - **mean_squared_error:** Calcular el error cuadrático medio.
     - **r2_score:** Calcular el coeficiente de determinación (R²).

In [None]:
## Cargar y preparar los datos de clasificación y regresión
- Cargamos el dataset Wine y dividimos los datos en conjuntos de entrenamiento y prueba para clasificación.
- Cargamos el dataset California housing y dividimos los datos en conjuntos de entrenamiento y prueba para regresión.

In [13]:
from sklearn.datasets import load_wine, fetch_california_housing
from sklearn.model_selection import train_test_split

# Load the classification dataset
data_clf = load_wine()
X_clf = data_clf.data
y_clf = data_clf.target

# Split the classification dataset into training and testing sets
X_train_clf, X_test_clf, y_train_clf, y_test_clf = train_test_split(X_clf, y_clf, test_size=0.2, random_state=42)

# Load the regression dataset
data_reg = fetch_california_housing()
X_reg = data_reg.data
y_reg = data_reg.target

# Split the regression dataset into training and testing sets
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)


In [None]:
## Precision, Recall, F1 Score para clasificación
- Creamos un pipeline que primero escala los datos y luego aplica la regresión logística.
- Entrenamos el modelo, hacemos predicciones y calculamos las métricas de evaluación para clasificación.

In [17]:
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.metrics import precision_score, recall_score, f1_score

# Create a pipeline with scaling and logistic regression
pipeline_clf = Pipeline([
    ('scaler', StandardScaler()),
    ('logisticregression', LogisticRegression(max_iter=500, solver='liblinear'))
])

# Train the model
pipeline_clf.fit(X_train_clf, y_train_clf)

# Predict using the test set
y_pred_clf = pipeline_clf.predict(X_test_clf)

# Evaluate the model
precision = precision_score(y_test_clf, y_pred_clf, average='weighted')
recall = recall_score(y_test_clf, y_pred_clf, average='weighted')
f1 = f1_score(y_test_clf, y_pred_clf, average='weighted')

print(f'Precision: {precision:.2f}')
print(f'Recall: {recall:.2f}')
print(f'F1 Score: {f1:.2f}')


Precision: 1.00
Recall: 1.00
F1 Score: 1.00


In [None]:
## mean_squared_error
Entrenamos un modelo de regresión lineal, hacemos predicciones y calculamos el error cuadrático medio.

In [18]:
from sklearn.metrics import mean_squared_error
from sklearn.linear_model import LinearRegression

# Initialize the Linear Regression model
model_reg = LinearRegression()

# Train the model
model_reg.fit(X_train_reg, y_train_reg)

# Predict using the test set
y_pred_reg = model_reg.predict(X_test_reg)

# Evaluate the model
mse = mean_squared_error(y_test_reg, y_pred_reg)
print(f'Mean Squared Error: {mse:.2f}')


Mean Squared Error: 0.56


In [None]:
## r2_score
Calculamos el coeficiente de determinación R^2

In [19]:
from sklearn.metrics import r2_score

# Evaluate the model
r2 = r2_score(y_test_reg, y_pred_reg)
print(f'R^2 Score: {r2:.2f}')


R^2 Score: 0.58
