In [6]:
import numpy as np
import pandas as pd
import yfinance as yf
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics

# --- 1. Preparación de Datos (la misma del módulo 8) ---
data = yf.download('^GSPC', period='10y')
data['Target'] = data['Close'].shift(-1)
data = data.dropna()
X = data[['Close']] 
y = data['Target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)

# --- 2. Entrenamiento del Modelo (el mismo de antes) ---
model = LinearRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)

# --- 3. NUEVO: Interpretación del Modelo ---
print("--- Interpretación del Modelo Entrenado ---")
# El coeficiente nos dice que por cada dólar que sube el precio de cierre hoy,
# predecimos que el de mañana subirá en 'coeficiente' dólares.
print(f"Coeficiente (w_1): {model.coef_[0]:.4f}")
# El intercepto es el valor base.
print(f"Intercepto (w_0): {model.intercept_:.4f}")
print("\n")


# --- 4. NUEVO: Evaluación Profunda ---
print("--- Evaluación del Modelo de ML ---")
mae = metrics.mean_absolute_error(y_test, predictions)
rmse = np.sqrt(metrics.mean_squared_error(y_test, predictions))
r2 = metrics.r2_score(y_test, predictions)

print(f"Error Absoluto Medio (MAE): {mae:.2f} dólares")
print(f"Raíz del Error Cuadrático Medio (RMSE): {rmse:.2f} dólares")
print(f"R-cuadrado (R²): {r2:.2%}") # Formateado como porcentaje
print("\n")


# --- 5. NUEVO: Creación y Evaluación del Modelo Baseline ---
print("--- Evaluación del Modelo Baseline (Predecir el precio de hoy) ---")
# La 'predicción' de la baseline es simplemente el precio de cierre de cada día en el test set.
# X_test['Close'] representa el precio de "hoy" para cada punto de datos de prueba.
baseline_predictions = X_test['Close']

baseline_mae = metrics.mean_absolute_error(y_test, baseline_predictions)
baseline_rmse = np.sqrt(metrics.mean_squared_error(y_test, baseline_predictions))
baseline_r2 = metrics.r2_score(y_test, baseline_predictions)

print(f"Baseline MAE: {baseline_mae:.2f} dólares")
print(f"Baseline RMSE: {baseline_rmse:.2f} dólares")
print(f"Baseline R²: {baseline_r2:.2%}")
print("\n")

# --- 6. Conclusión ---
print("--- Conclusión ---")
if rmse < baseline_rmse:
    print("¡Éxito! Nuestro modelo de ML es ligeramente mejor que la baseline.")
else:
    print("Nuestro modelo de ML no supera a la simple estrategia de la baseline.")

  data = yf.download('^GSPC', period='10y')
[*********************100%***********************]  1 of 1 completed

--- Interpretación del Modelo Entrenado ---
Coeficiente (w_1): 0.9989
Intercepto (w_0): 4.5916


--- Evaluación del Modelo de ML ---
Error Absoluto Medio (MAE): 36.94 dólares
Raíz del Error Cuadrático Medio (RMSE): 55.22 dólares
R-cuadrado (R²): 99.12%


--- Evaluación del Modelo Baseline (Predecir el precio de hoy) ---
Baseline MAE: 36.66 dólares
Baseline RMSE: 55.11 dólares
Baseline R²: 99.12%


--- Conclusión ---
Nuestro modelo de ML no supera a la simple estrategia de la baseline.



