**Calcular el EMC**

Vamos a automatizar el cálculo del EMC.

¿Cómo calculaste el EMC en el ejercicio pasado? ¿Lo hiciste manualmente con una calculadora o programaste un sencillo programa en Python?

Automatiza este cálculo:

![image.png](attachment:image.png)

**Error cuadrático medio (MSE)** 
Glosario de visión artificial de Encord

En los campos del análisis de regresión y el aprendizaje automático, el error cuadrático medio (MSE) es una métrica crucial para evaluar el rendimiento de los modelos predictivos. Mide la diferencia cuadrática media entre los valores previstos y los valores objetivo reales dentro de un conjunto de datos. El objetivo principal del MSE es evaluar la calidad de las predicciones de un modelo midiendo en qué medida se alinean con la realidad básica.


1.

Escribe una función mse(). Debe tomar respuestas correctas y predicciones y devolver el valor del error cuadrático medio.

In [1]:
def mse(answers, predictions):
    # Calcula el error cuadrático medio
    emc = sum((a - p) ** 2 for a, p in zip(answers, predictions)) / len(answers)
    return emc

answers = [623, 253, 150, 237]
predictions = [649, 253, 370, 148]

print(mse(answers, predictions))


14249.25


También hay una función para calcular el EMC en sklearn.

Busca en la documentación el nombre de la función y cómo opera. Impórtala y resuelve el mismo problema. Imprime en la pantalla el valor del EMC.

Aquí puedes encontrar la documentación de la librería sklearn: https://scikit-learn.org/stable/modules/classes.html. Si pierdes el vínculo, haz una búsqueda con "sklearn reference" como frase clave.

In [3]:
from sklearn.metrics import mean_squared_error

# Valores reales
answers = [623, 253, 150, 237]

# Valores predichos
predictions = [649, 253, 370, 148]

# Cálculo del EMC
emc = mean_squared_error(answers, predictions)

# Impresión del resultado
print(f"El Error Medio Cuadrático es: {emc}")

El Error Medio Cuadrático es: 14249.25


*Interpretación del ECM*

Para hacer la prueba de cordura al modelo para buscar problemas de clasificación necesitamos comparar sus predicciones con posibilidad aleatoria. ¿Cómo se hace una prueba de cordura para un modelo de regresión?

Darle la misma respuesta a todas las observaciones es un método simple de predicción de regresión. Vamos a usar el valor promedio del precio del apartamento para estar más cerca de la realidad.

Interpretación del ECM

Ejercicio 1
Prepara los datos y encuentra el precio promedio.

Declara la variable features con todas las características excepto last_price.
Declara la variable target con last_price como objetivo.
Calcula el valor promedio para los elementos de la variable target.
Imprime el resultado como se muestra:

In [None]:
import pandas as pd
from sklearn.metrics import mean_squared_error

# Cargar los datos
df = pd.read_csv('/datasets/train_data_us.csv')

# Crear la variable features (todas las columnas excepto 'last_price') y target ('last_price')
features = df.drop(columns=['last_price'])
target = df['last_price']

# Calcular el promedio del precio
average_price = target.mean()

# Imprimir el resultado
print(f"Average price: {average_price:.2f}")

2.

Calcula el ECM para el conjunto de entrenamiento usando el precio promedio como valor de predicción.

Imprime el resultado como se muestra:

MSE: ...
La función mean_squared_error() en scikit-learn tiene su maña. Tendrás que pasar unos minutos leyendo la documentación o consultar Stack Overflow.

En el precódigo, dividimos los precios entre 100 000 con el propósito de evitar números grandes.

In [None]:
import pandas as pd
from sklearn.metrics import mean_squared_error

# Cargar los datos
df = pd.read_csv('/datasets/train_data_us.csv')

# Preparar las características y el objetivo
features = df.drop(['last_price'], axis=1)
target = df['last_price'] / 100000

# Calcular el precio promedio
average_price = target.mean()

# Crear las predicciones con el precio promedio
predictions = [average_price] * len(target)

# Calcular el ECM
mse = mean_squared_error(target, predictions)

# Imprimir el resultado
print('MSE:', mse)