In [5]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import tensorflow as tf
from tensorflow.keras import layers

# Charger le fichier CSV
file_path = r'C:\Users\mon\Downloads\BostonHousing.csv'  # Mets ici le chemin vers ton fichier

# Lire le fichier CSV dans un DataFrame pandas
data = pd.read_csv(file_path)

# Vérifier les premières lignes du dataset
print(data.head())

# Diviser les caractéristiques (X) et la cible (y)
X = data.drop('medv', axis=1)  # 'medv' est la colonne de prédiction (prix des maisons)
y = data['medv']

# Diviser les données en données d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Normaliser les données
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Construire le modèle
model = tf.keras.Sequential([
    layers.Dense(64, activation='relu', input_shape=(X_train.shape[1],)),
    layers.Dense(64, activation='relu'),
    layers.Dense(32, activation='relu'),
    layers.Dense(1)
])

# Compiler le modèle
model.compile(optimizer='adam', loss='mse', metrics=['mae'])

# Entraîner le modèle
model.fit(X_train, y_train, epochs=100, batch_size=16, validation_split=0.2)

# Évaluer le modèle
loss, mae = model.evaluate(X_test, y_test)
print(f"Mean Absolute Error on test data: {mae}")

      crim    zn  indus  chas    nox     rm   age     dis  rad  tax  ptratio  \
0  0.00632  18.0   2.31     0  0.538  6.575  65.2  4.0900    1  296     15.3   
1  0.02731   0.0   7.07     0  0.469  6.421  78.9  4.9671    2  242     17.8   
2  0.02729   0.0   7.07     0  0.469  7.185  61.1  4.9671    2  242     17.8   
3  0.03237   0.0   2.18     0  0.458  6.998  45.8  6.0622    3  222     18.7   
4  0.06905   0.0   2.18     0  0.458  7.147  54.2  6.0622    3  222     18.7   

        b  lstat  medv  
0  396.90   4.98  24.0  
1  396.90   9.14  21.6  
2  392.83   4.03  34.7  
3  394.63   2.94  33.4  
4  396.90   5.33  36.2  


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 27ms/step - loss: 611.9150 - mae: 22.6607 - val_loss: 444.1242 - val_mae: 19.3433
Epoch 2/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 9ms/step - loss: 459.0497 - mae: 19.0069 - val_loss: 235.9660 - val_mae: 13.4385
Epoch 3/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - loss: 193.8177 - mae: 11.6437 - val_loss: 63.3763 - val_mae: 6.1804
Epoch 4/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 72.6078 - mae: 6.9046 - val_loss: 35.1941 - val_mae: 4.3238
Epoch 5/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 14ms/step - loss: 38.0072 - mae: 4.8508 - val_loss: 26.4501 - val_mae: 3.6510
Epoch 6/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - loss: 25.7656 - mae: 3.8039 - val_loss: 24.6135 - val_mae: 3.5200
Epoch 7/100
[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1

In [7]:
# Sauvegarder le modèle dans le format natif Keras
model.save('house_price_model.keras')

# Charger le modèle plus tard
loaded_model = tf.keras.models.load_model('house_price_model.keras')

  saveable.load_own_variables(weights_store.get(inner_path))


In [8]:
# Nouvelles données (caractéristiques d'une nouvelle maison)
new_data = [[0.01, 18, 2.31, 0, 0.538, 6.575, 65.2, 4.0900, 1, 296, 15.3, 396.90, 4.98]]

# Normaliser les nouvelles données avec le même scaler que celui utilisé pour l'entraînement
new_data_scaled = scaler.transform(new_data)

# Prédire le prix avec le modèle chargé
predicted_price = loaded_model.predict(new_data_scaled)
print(f"Predicted price: {predicted_price[0][0]}")




[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 211ms/step
Predicted price: 25.77212142944336


In [9]:
# Évaluer le modèle sur les données de test
loss, mae = loaded_model.evaluate(X_test, y_test)
print(f"Mean Absolute Error on test data: {mae}")

[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 12ms/step - loss: 8.8173 - mae: 2.1813
Mean Absolute Error on test data: 2.2818336486816406


In [11]:
import joblib
from sklearn.preprocessing import StandardScaler

# Supposons que tu as déjà créé un scaler et l'as utilisé pour normaliser tes données
scaler = StandardScaler()

# Sauvegarde le scaler après avoir entraîné le modèle
joblib.dump(scaler, 'scaler.pkl')

['scaler.pkl']

In [13]:
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# Supposons que X est ton jeu de données d'entraînement
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Créer le scaler et ajuster sur les données d'entraînement
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)  # Ajuster et transformer
X_test_scaled = scaler.transform(X_test)  # Transformer les données de test

# Sauvegarder le scaler après l'avoir ajusté
joblib.dump(scaler, 'scaler.pkl')

['scaler.pkl']

In [17]:
import joblib

# Charger le scaler sauvegardé
scaler = joblib.load('scaler.pkl')

# Nouvelle donnée à normaliser
new_data = [[0.02731, 0, 7.07, 0, 0.469, 6.421, 78.9, 4.9671, 2, 242, 17.8, 396.90, 9.14]]

# Normaliser la nouvelle donnée avec le scaler ajusté
new_data_scaled = scaler.transform(new_data)

# Faire une prédiction avec le modèle chargé
predicted_price = model.predict(new_data_scaled)
print(f"Predicted price: {predicted_price[0][0]}")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 53ms/step
Predicted price: 23.655029296875


