# Prueba de cordura

Las pruebas de cordura (sanity tests) son un subconjunto de pruebas de regresión que se realizan para verificar rápidamente que ciertas funcionalidades específicas de un sistema funcionan después de un cambio o actualización.

Para hacer la prueba de cordura al modelo para buscar problemas de clasificación necesitamos comparar sus predicciones con posibilidad aleatoria. ¿Cómo se hace una prueba de cordura para un modelo de regresión?

Darle la misma respuesta a todas las observaciones es un método simple de predicción de regresión. Vamos a usar el valor promedio del precio del apartamento para estar más cerca de la realidad.

1. encuentra el precio promedio

In [5]:
import pandas as pd
from sklearn.metrics import mean_squared_error

df = pd.read_csv('https://practicum-content.s3.us-west-1.amazonaws.com/datasets/train_data_us.csv')

# < crea las variables features y target >
features = df.drop(['last_price'], axis=1)
target = df['last_price']

# < calcula e imprime el promedio >
print('Average price:', target.mean())

Average price: 161005.67427559663


2. Calcula el MSE o RMSE para el conjunto de entrenamiento usando el precio promedio como valor de predicción. Estos son los valores que los modelos deben superar para validar su buen funcionamiento.

In [20]:
# Aquí está haciendo que todas las predictions sean iguales
predictions = pd.Series(target.mean(), index=target.index)

# < calcula el ECM  >
mse = mean_squared_error(target, predictions)
rmse = mean_squared_error(target, predictions, squared=False)

print('MSE:', mse)
print('RMSE:', rmse)

MSE: 5.529775874409322
RMSE: 2.3515475488302


# Métricas para modelos de regresión

| Métrica               | Explicación                                                                 | ¿Por qué elegirla?                                         | Librería Python      | Función de llamada                   |
|-----------------------|-----------------------------------------------------------------------------|------------------------------------------------------------|---------------------|------------------------------------|
| Mean Squared Error (MSE) | Promedio de los errores al cuadrado entre valores reales y predichos.        | Penaliza errores grandes, muy usada para regresión.         | sklearn.metrics     | mean_squared_error(y_true, y_pred) |
| Root Mean Squared Error (RMSE) | Raíz cuadrada del MSE.                                                     | En la misma escala que las variables, interpretación fácil. | sklearn.metrics | mean_squared_error(y_true, y_pred, squared=False)     |
| Mean Absolute Error (MAE) | Promedio del valor absoluto de los errores entre reales y predichos.         | Más robusta a valores atípicos que MSE.                     | sklearn.metrics     | mean_absolute_error(y_true, y_pred)|
| R2 (Coeficiente de determinación) | Mide proporción de la varianza explicada por el modelo.                | Indica ajuste global del modelo, interpretabilidad alta.    | sklearn.metrics     | r2_score(y_true, y_pred)            |

In [22]:
answers = [623, 253, 150, 237]
predictions = [649, 253, 370, 148]

# Mean Squared Error

In [23]:
# Función manual de MSE

def mse(answers, predictions):
    total = 0
    for i in range(len(answers)):
        total += (answers[i] - predictions[i])**2 # < agrega el error cuadrático >
    result = total/len(answers) # < divide la suma entre el número de observaciones >
    return result 

print(mse(answers, predictions))

14249.25


In [25]:
# De la librería sklearn.metrics

from sklearn.metrics import mean_squared_error

result = mean_squared_error(answers, predictions)
print(result)

14249.25


# Root Mean Squared Error

In [26]:
# Función manual de MSE

def mse(answers, predictions):
    total = 0
    for i in range(len(answers)):
        total += (answers[i] - predictions[i])**2 # < agrega el error cuadrático >
    result = (total/len(answers)) ** 0.5 # < divide la suma entre el número de observaciones >
    return result 

print(mse(answers, predictions))

119.37022241748568


In [24]:
# De la librería sklearn.metrics

from sklearn.metrics import mean_squared_error

result = mean_squared_error(answers, predictions, squared=False)
print(result)

119.37022241748568


# Métricas para modelos de clasificación

| Métrica               | Explicación                                                                | ¿Por qué elegirla?                                           | Librería Python      | Función de llamada                   |
|-----------------------|-----------------------------------------------------------------------------|--------------------------------------------------------------|---------------------|------------------------------------|
| Accuracy (Exactitud)   | Porcentaje de predicciones correctas totales.                             | Intuitiva, buena para datos balanceados.                     | sklearn.metrics     | accuracy_score(y_true, y_pred)      |
| Precision (Precisión)  | Proporción de verdaderos positivos entre todos los positivos predichos.   | Útil cuando falsos positivos son costosos o importantes.      | sklearn.metrics     | precision_score(y_true, y_pred)     |
| Recall (Sensibilidad) | Proporción de verdaderos positivos detectados entre todos los positivos reales. | Útil cuando es crítico detectar la mayoría de positivos.       | sklearn.metrics     | recall_score(y_true, y_pred)        |
| F1 Score              | Media armónica entre precisión y recall.                                  | Para balancear precisión y recall en datos desbalanceados.   | sklearn.metrics     | f1_score(y_true, y_pred)             |


# Accuracy

In [9]:
# VERSION 1: Con funciones

target_predictions = model_DTC.predict(features_train)

def error_count(answers, predictions):
    count = 0
    for i in range(len(answers)):
        if answers[i] != predictions[i]:
            count += 1
    return count

def accuracy(answers, predictions):
    errors = error_count(answers, predictions)
    return (len(answers) - errors) / len(predictions)

print('Errores:', error_count(target_train.values, target_predictions))
print('Accuracy:', accuracy(target_train.values, target_predictions))

Errores: 507
Accuracy: 0.8959145965920755


AQUI

PRECISION (PRECISION)
SENSIBILIDAD (RECALL)
EXACTITUD (ACCURACY)

In [10]:
# VERSION 2: Con una librería

from sklearn.metrics import accuracy_score

target_predictions = model_DTC.predict(features_train)

accuracy = accuracy_score(target_train, target_predictions)
print(accuracy)

0.8959145965920755


accuracy_score is a standalone function from sklearn.metrics that directly compares the true labels (target_train) with predicted labels (target_predictions). It requires you to first generate predictions externally (e.g., using model.predict(features_train)) and then calculate the accuracy. It is more flexible because you can compute accuracy for any set of true and predicted labels, including predictions from different models or manual predictions.

Explorar más esa librería

In [11]:
# OPCIÓN 3

score = model_DTC.score(features_train, target_train) 
print(score)

0.8959145965920755


model.score is a method of the trained model object that internally makes predictions on the input features (features_train) and compares those predictions to the true labels (target_train) to compute the accuracy. It combines prediction and accuracy calculation in one call and is less flexible but more convenient for quick evaluation directly on the model.