In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
import joblib

# Charger les données
data = pd.read_csv("laptop_prices.csv")

# Visualiser données avant régression
plt.scatter(data["ram_gb"], data["price"], color='blue')
plt.xlabel("RAM (GB)")
plt.ylabel("Prix")
plt.title("Prix vs RAM avant régression")
plt.show()

# Préparation des données
X = data[["ram_gb", "storage_gb", "cpu_speed_ghz"]]
y = data["price"]

# Split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entraîner le modèle
model = LinearRegression()
model.fit(X_train, y_train)

# Prédictions
y_pred = model.predict(X_test)

# Évaluation
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse:.2f}")
print(f"R² Score: {r2:.2f}")

# Visualiser données après régression
plt.scatter(y_test, y_pred, color='green')
plt.xlabel("Prix Réel")
plt.ylabel("Prix Prédit")
plt.title("Prix Réel vs Prix Prédit après régression")
plt.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'r--')
plt.show()

# Sauvegarde
#joblib.dump(model, "laptop_price_model.pkl")

