# Entrainement du modèle



Connexion au drive

In [1]:
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive


Affichage des score de santé

In [None]:
import pandas as pd

# Charger les données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Vérifier les valeurs uniques de la colonne 'Score de santé'
print(data['Score de santé'].unique())


[0.25 0.5  0.75 0.  ]


In [None]:
import pandas as pd
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

# Chargement et préparation des données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Préparation des caractéristiques et de la cible
features = data[['Genre', 'Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Transformation des données catégorielles et numériques
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), ['Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']),
        ('cat', OneHotEncoder(), ['Genre'])
    ])

# Appliquer le prétraitement
X_preprocessed = preprocessor.fit_transform(features)

# Définir la taille de l'entrée pour le modèle
input_shape = X_preprocessed.shape[1]

# Définition du modèle
model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(input_shape,)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer='adam', loss='mse', metrics=['mae'])

# Séparer les données
X_train, X_test, y_train, y_test = train_test_split(X_preprocessed, target, test_size=0.2, random_state=42)

# Entraîner le modèle avec EarlyStopping
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

history = model.fit(
    X_train,
    y_train,
    validation_split=0.2,
    epochs=150,
    callbacks=[early_stopping],
    verbose=1
)

# Évaluation du modèle
loss, mae = model.evaluate(X_test, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'MAE sur les données de test : {mae}')


Epoch 1/150




[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 3ms/step - loss: 0.0671 - mae: 0.1811 - val_loss: 0.0109 - val_mae: 0.0835
Epoch 2/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 0.0135 - mae: 0.0876 - val_loss: 0.0087 - val_mae: 0.0739
Epoch 3/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 0.0096 - mae: 0.0752 - val_loss: 0.0055 - val_mae: 0.0551
Epoch 4/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 0.0080 - mae: 0.0663 - val_loss: 0.0044 - val_mae: 0.0471
Epoch 5/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 0.0064 - mae: 0.0583 - val_loss: 0.0036 - val_mae: 0.0437
Epoch 6/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0056 - mae: 0.0532 - val_loss: 0.0026 - val_mae: 0.0349
Epoch 7/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss:

In [None]:
import numpy as np

# Nouvelle donnée à prédire
nouvelles_donnees = pd.DataFrame({
    'Genre': ['Male'],
    'Âge': [27],
    'Qualité du sommeil': [60.0],  # Notez que nous utilisons des valeurs en pourcentage ici, donc 60.0% = 0.6
    'Rythme cardiaque': [77.0],
    'Étapes quotidiennes': [4200.0],
    'Durée du sommeil': [6.2]
})

# Convertir les pourcentages en décimaux
nouvelles_donnees['Qualité du sommeil'] = nouvelles_donnees['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Transformer les nouvelles données
nouvelles_donnees_transforme = preprocessor.transform(nouvelles_donnees)

# Prédire le score de santé
predictions = model.predict(nouvelles_donnees_transforme)

print(f'Score de santé prédit : {predictions[0][0]}')


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 125ms/step
Score de santé prédit : 1.4649937152862549


In [None]:
import pandas as pd
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

# Chargement et préparation des données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Préparation des caractéristiques et de la cible
features = data[['Genre', 'Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Transformation des données catégorielles et numériques
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), ['Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']),
        ('cat', OneHotEncoder(), ['Genre'])
    ])

# Appliquer le prétraitement
X_preprocessed = preprocessor.fit_transform(features)

# Définir la taille de l'entrée pour le modèle
input_shape = X_preprocessed.shape[1]

# Définition de la métrique personnalisée
def custom_accuracy(y_true, y_pred):
    return tf.keras.backend.mean(tf.keras.backend.abs(y_pred - y_true) <= 0.1 * y_true)

# Définition du modèle
model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(input_shape,)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer='adam', loss='mse', metrics=[custom_accuracy, 'mae'])

# Séparer les données
X_train, X_test, y_train, y_test = train_test_split(X_preprocessed, target, test_size=0.2, random_state=42)

# Entraîner le modèle avec EarlyStopping
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

history = model.fit(
    X_train,
    y_train,
    validation_split=0.2,
    epochs=150,
    callbacks=[early_stopping],
    verbose=1
)

# Évaluation du modèle
loss, custom_acc, mae = model.evaluate(X_test, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'Accuracy personnalisée sur les données de test : {custom_acc}')
print(f'MAE sur les données de test : {mae}')

# Sauvegarde du modèle
model.save('/content/drive/MyDrive/best_model.keras')


Epoch 1/150




[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 7ms/step - custom_accuracy: 0.1634 - loss: 0.0624 - mae: 0.1770 - val_custom_accuracy: 0.2015 - val_loss: 0.0111 - val_mae: 0.0854
Epoch 2/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.2773 - loss: 0.0142 - mae: 0.0915 - val_custom_accuracy: 0.2621 - val_loss: 0.0090 - val_mae: 0.0765
Epoch 3/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.3180 - loss: 0.0112 - mae: 0.0801 - val_custom_accuracy: 0.4028 - val_loss: 0.0069 - val_mae: 0.0635
Epoch 4/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.3966 - loss: 0.0087 - mae: 0.0694 - val_custom_accuracy: 0.5344 - val_loss: 0.0049 - val_mae: 0.0514
Epoch 5/150
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.4297 - loss: 0.0074 - mae: 0.0634 - val_custom_accuracy: 0.6036 - va

In [None]:
import numpy as np

# Charger le modèle
model = tf.keras.models.load_model('/content/drive/MyDrive/best_model.keras', custom_objects={'custom_accuracy': custom_accuracy})

# Nouvelle donnée à prédire
nouvelles_donnees = pd.DataFrame({
    'Genre': ['Male'],
    'Âge': [27],
    'Qualité du sommeil': [90.0],  # Notez que nous utilisons des valeurs en pourcentage ici, donc 60.0% = 0.6
    'Rythme cardiaque': [77.0],
    'Étapes quotidiennes': [10000.0],
    'Durée du sommeil': [8.2]
})

# Convertir les pourcentages en décimaux
nouvelles_donnees['Qualité du sommeil'] = nouvelles_donnees['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Transformer les nouvelles données
nouvelles_donnees_transforme = preprocessor.transform(nouvelles_donnees)

# Prédire le score de santé
predictions = model.predict(nouvelles_donnees_transforme)

print(f'Score de santé prédit : {predictions[0][0]}')


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 69ms/step
Score de santé prédit : 0.460076242685318


Entrainement du modele

In [None]:
import pandas as pd
import tensorflow as tf
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
import joblib

# Charger et préparer les données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Sélection des caractéristiques importantes
features = data[['Genre', 'Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Prétraitement
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), ['Âge', 'Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']),
        ('cat', OneHotEncoder(), ['Genre'])
    ])

X = preprocessor.fit_transform(features)
y = target

# Division des données en ensemble d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(X_train.shape[1],)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')  # Activation sigmoid pour limiter les sorties entre 0 et 1
])


# Fonction personnalisée de précision
def custom_accuracy(y_true, y_pred):
    return tf.keras.backend.mean(tf.keras.backend.abs(y_pred - y_true) <= 0.1 * y_true)

# Compilation du modèle
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='mse', metrics=[custom_accuracy, 'mae'])

# Entraînement du modèle
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

history = model.fit(X_train, y_train, epochs=300, validation_split=0.2, verbose=1, callbacks=[early_stopping])

# Évaluation du modèle
loss, accuracy, mae = model.evaluate(X_test, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'Accuracy personnalisée sur les données de test : {accuracy}')
print(f'MAE sur les données de test : {mae}')

# Sauvegarder le modèle et le préprocesseur
model.save('/content/drive/MyDrive/best_model.keras')
joblib.dump(preprocessor, '/content/drive/MyDrive/preprocessor.joblib')


Epoch 1/300




[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 5ms/step - custom_accuracy: 0.2598 - loss: 0.0185 - mae: 0.1057 - val_custom_accuracy: 0.4712 - val_loss: 0.0070 - val_mae: 0.0607
Epoch 2/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - custom_accuracy: 0.4249 - loss: 0.0078 - mae: 0.0656 - val_custom_accuracy: 0.5290 - val_loss: 0.0048 - val_mae: 0.0481
Epoch 3/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - custom_accuracy: 0.5095 - loss: 0.0056 - mae: 0.0534 - val_custom_accuracy: 0.6401 - val_loss: 0.0036 - val_mae: 0.0396
Epoch 4/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.5360 - loss: 0.0048 - mae: 0.0490 - val_custom_accuracy: 0.7020 - val_loss: 0.0030 - val_mae: 0.0340
Epoch 5/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - custom_accuracy: 0.5687 - loss: 0.0041 - mae: 0.0443 - val_custom_accuracy: 0.6505 - va

['/content/drive/MyDrive/preprocessor.joblib']

In [None]:
import pandas as pd
import tensorflow as tf
import joblib

# Fonction pour convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

# Charger le modèle
model = tf.keras.models.load_model('/content/drive/MyDrive/best_model.keras', custom_objects={'custom_accuracy': custom_accuracy})

# Charger le préprocesseur
preprocessor = joblib.load('/content/drive/MyDrive/preprocessor.joblib')

# Exemple de nouvelles données
nouvelles_donnees = pd.DataFrame({
    'Genre': ['Male'],
    'Âge': [35],
    'Qualité du sommeil': [0.0],  # Pourcentage, sera converti en décimal
    'Rythme cardiaque': [82.0],
    'Étapes quotidiennes': [3500.0],
    'Durée du sommeil': [0.3]
})

# Convertir les pourcentages en décimaux
nouvelles_donnees['Qualité du sommeil'] = nouvelles_donnees['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Appliquer le prétraitement
nouvelles_donnees_transforme = preprocessor.transform(nouvelles_donnees)

# Prédire le score de santé
predictions = model.predict(nouvelles_donnees_transforme)

print(f'Score de santé prédit : {predictions[0][0]}')


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 157ms/step
Score de santé prédit : 0.04537453129887581


In [None]:
import pandas as pd
import tensorflow as tf
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
import joblib

# Chargement des données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Conversion des pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Sélection des caractéristiques importantes (sans 'Genre' et 'Âge')
features = data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Prétraitement des données
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), ['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil'])
    ])

X = preprocessor.fit_transform(features)
y = target

# Division des données en ensemble d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Définition du modèle
model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(X_train.shape[1],)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')  # Limiter les sorties entre 0 et 1
])

# Multiplier par 0.75 pour limiter les sorties entre 0 et 0.75
model.add(tf.keras.layers.Lambda(lambda x: x * 0.75))

# Compilation du modèle
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='mse', metrics=['mae'])

# Entraînement du modèle
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

history = model.fit(X_train, y_train, epochs=300, validation_split=0.2, verbose=1, callbacks=[early_stopping])

# Évaluation du modèle
loss, mae = model.evaluate(X_test, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'MAE sur les données de test : {mae}')

# Sauvegarder le modèle et le préprocesseur
model.save('/content/drive/MyDrive/best_model.keras')
joblib.dump(preprocessor, '/content/drive/MyDrive/preprocessor.joblib')




Epoch 1/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - loss: 0.0176 - mae: 0.1051 - val_loss: 0.0065 - val_mae: 0.0611
Epoch 2/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 0.0075 - mae: 0.0641 - val_loss: 0.0048 - val_mae: 0.0469
Epoch 3/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 0.0053 - mae: 0.0519 - val_loss: 0.0038 - val_mae: 0.0410
Epoch 4/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 0.0046 - mae: 0.0462 - val_loss: 0.0033 - val_mae: 0.0361
Epoch 5/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 3ms/step - loss: 0.0037 - mae: 0.0400 - val_loss: 0.0026 - val_mae: 0.0286
Epoch 6/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0034 - mae: 0.0354 - val_loss: 0.0023 - val_mae: 0.0271
Epoch 7/300
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/

['/content/drive/MyDrive/preprocessor.joblib']

In [None]:
import pandas as pd
import numpy as np
import tensorflow as tf
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
import joblib

# Charger les données
data = pd.read_csv('/content/drive/MyDrive/Combine_Dataset_avec_score_duplicated.csv')

# Convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(chaine):
    if isinstance(chaine, str) and '%' in chaine:
        return float(chaine.replace('%', '')) / 100.0
    return float(chaine)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Préparation des données
features = data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Prétraitement des données
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), ['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil'])
    ]
)

X = preprocessor.fit_transform(features)
y = target

# Division des données en ensemble d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Définition du modèle
model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(X_train.shape[1],)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')  # Limiter les sorties entre 0 et 1
])

# Compilation du modèle
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
              loss='mse', metrics=['mae'])

# Entraînement du modèle
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)

history = model.fit(X_train, y_train, epochs=100, validation_split=0.2, verbose=1, callbacks=[early_stopping])

# Évaluation du modèle
loss, mae = model.evaluate(X_test, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'MAE sur les données de test : {mae}')

# Sauvegarder le modèle et le préprocesseur
model.save('/content/drive/MyDrive/best_model.keras')
joblib.dump(preprocessor, '/content/drive/MyDrive/preprocessor.joblib')

Epoch 1/100




[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 4ms/step - loss: 0.0182 - mae: 0.1069 - val_loss: 0.0059 - val_mae: 0.0576
Epoch 2/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0074 - mae: 0.0644 - val_loss: 0.0043 - val_mae: 0.0430
Epoch 3/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0055 - mae: 0.0527 - val_loss: 0.0035 - val_mae: 0.0377
Epoch 4/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0050 - mae: 0.0494 - val_loss: 0.0030 - val_mae: 0.0331
Epoch 5/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0043 - mae: 0.0442 - val_loss: 0.0028 - val_mae: 0.0322
Epoch 6/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 0.0038 - mae: 0.0411 - val_loss: 0.0026 - val_mae: 0.0306
Epoch 7/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss:

['/content/drive/MyDrive/preprocessor.joblib']

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, MinMaxScaler
import tensorflow as tf
import joblib
import numpy as np
import os

# Charger les données depuis le fichier CSV
file_path = '/content/drive/MyDrive/test.csv'
data = pd.read_csv(file_path)

# Convertir les pourcentages en décimaux
def convertir_pourcentage_en_decimal(pourcentage):
    if isinstance(pourcentage, str) and '%' in pourcentage:
        return float(pourcentage.replace('%', '')) / 100.0
    return float(pourcentage)

data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

# Sélectionner les caractéristiques et la cible
features = data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
target = data['Score de santé']

# Normaliser la cible
target_scaler = MinMaxScaler()
target = target_scaler.fit_transform(target.values.reshape(-1, 1))

# Diviser les données en ensemble d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.2, random_state=42)

# Prétraiter les données
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Sauvegarder le scaler pour une utilisation future
scaler_path = '/content/drive/MyDrive/scaler.joblib'
joblib.dump(scaler, scaler_path)

# Sauvegarder le scaler pour la cible
target_scaler_path = '/content/drive/MyDrive/target_scaler.joblib'
joblib.dump(target_scaler, target_scaler_path)

# Définir le modèle de réseau de neurones
model = tf.keras.models.Sequential([
    tf.keras.layers.InputLayer(input_shape=(X_train_scaled.shape[1],)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1)  # Pas de fonction d'activation ici pour la régression
])

# Compiler le modèle
model.compile(optimizer='adam', loss='mse', metrics=['mae'])

# Entraîner le modèle
history = model.fit(X_train_scaled, y_train, epochs=100, validation_split=0.2, verbose=1)

# Évaluer le modèle sur les données de test
loss, mae = model.evaluate(X_test_scaled, y_test, verbose=1)
print(f'Loss sur les données de test : {loss}')
print(f'MAE sur les données de test : {mae}')

# Sauvegarder le modèle
model_path = '/content/drive/MyDrive/best_model.keras'
model.save(model_path)

print("Entraînement terminé et modèle sauvegardé.")

# Charger le scaler et le modèle sauvegardés
scaler = joblib.load('/content/drive/MyDrive/scaler.joblib')
target_scaler = joblib.load('/content/drive/MyDrive/target_scaler.joblib')
model = tf.keras.models.load_model('/content/drive/MyDrive/best_model.keras')

# Exemple de nouvelles données
nouvelles_donnees = pd.DataFrame({
    'Qualité du sommeil': [0.30],  # Pourcentage converti en décimal
    'Rythme cardiaque': [82.0],
    'Étapes quotidiennes': [3500.0],
    'Durée du sommeil': [7.3]
})

# Prétraiter les nouvelles données
nouvelles_donnees_scaled = scaler.transform(nouvelles_donnees)

# Prédire le score de santé
score_sante_normalise = model.predict(nouvelles_donnees_scaled)
score_sante = target_scaler.inverse_transform(score_sante_normalise)
print(f'Score de santé prédit : {score_sante[0][0]}')


Epoch 1/100




[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 3ms/step - loss: 0.0990 - mae: 0.2262 - val_loss: 0.0158 - val_mae: 0.1012
Epoch 2/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0221 - mae: 0.1126 - val_loss: 0.0108 - val_mae: 0.0794
Epoch 3/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0156 - mae: 0.0930 - val_loss: 0.0086 - val_mae: 0.0683
Epoch 4/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - loss: 0.0130 - mae: 0.0830 - val_loss: 0.0067 - val_mae: 0.0568
Epoch 5/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - loss: 0.0104 - mae: 0.0740 - val_loss: 0.0067 - val_mae: 0.0569
Epoch 6/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 8ms/step - loss: 0.0092 - mae: 0.0669 - val_loss: 0.0051 - val_mae: 0.0436
Epoch 7/100
[1m259/259[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss:

#  Programmer les tests automatisés d’un modèle d’intelligence artificielle

Test de chargement des données

In [None]:
import unittest
import pandas as pd

# Fonction à tester : Charger les données et vérifier la présence de toutes les colonnes
def load_data_and_check_columns(file_path, expected_columns):
    try:
        data = pd.read_csv(file_path)
        # Vérifier que toutes les colonnes attendues sont présentes dans le DataFrame
        if all(column in data.columns for column in expected_columns):
            return True  # Retourne True si toutes les colonnes sont présentes
        return False  # Retourne False si certaines colonnes manquent
    except Exception as e:
        return None  # Retourne None si le fichier ne peut pas être chargé

# Classe de test
class TestDataColumns(unittest.TestCase):

    # Test pour un fichier CSV valide où toutes les colonnes attendues sont présentes
    def test_all_columns_present(self):
        file_path = '/content/drive/MyDrive/test.csv'  # Chemin vers un fichier CSV valide
        expected_columns = ['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil', 'Score de santé']
        result = load_data_and_check_columns(file_path, expected_columns)
        self.assertTrue(result, "Toutes les colonnes doivent être présentes.")

    # Test pour un fichier CSV avec des colonnes manquantes
    def test_columns_missing(self):
        file_path = '/content/drive/MyDrive/test_missing_columns.csv'  # Fichier avec des colonnes manquantes
        expected_columns = ['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil', 'Score de santé']
        result = load_data_and_check_columns(file_path, expected_columns)
        self.assertFalse(result, "Le fichier ne contient pas toutes les colonnes attendues.")

    # Test pour un fichier CSV qui ne peut pas être chargé
    def test_file_load_failure(self):
        file_path = '/content/drive/MyDrive/non_existent_file.csv'  # Fichier inexistant ou corrompu
        expected_columns = ['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil', 'Score de santé']
        result = load_data_and_check_columns(file_path, expected_columns)
        self.assertIsNone(result, "Le fichier ne doit pas pouvoir être chargé.")

# Exécution des tests
if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)



.....
----------------------------------------------------------------------
Ran 5 tests in 0.251s

OK


Conversion des pourcentages en décimaux

In [None]:
class TestConversionPourcentage(unittest.TestCase):

    def test_conversion_correcte(self):
        """Vérifie que les pourcentages sont correctement convertis en décimaux."""
        pourcentages = {
            '50%': 0.50,
            '100%': 1.00,
            '0%': 0.00,
            '25%': 0.25
        }
        for pourcentage, attendu in pourcentages.items():
            self.assertAlmostEqual(convertir_pourcentage_en_decimal(pourcentage), attendu, places=2,
                                   msg=f"La conversion de {pourcentage} devrait être {attendu}.")

    def test_conversion_sans_pourcentage(self):
        """Vérifie que les valeurs sans symbole de pourcentage sont correctement converties."""
        valeurs = {
            '50': 50.00,
            '100': 100.00,
            '0': 0.00,
            '25': 25.00
        }
        for valeur, attendu in valeurs.items():
            self.assertAlmostEqual(convertir_pourcentage_en_decimal(valeur), attendu, places=2,
                                   msg=f"La conversion de {valeur} devrait être {attendu}.")

    def test_conversion_invalide(self):
        """Vérifie que les valeurs invalides sont correctement traitées."""
        invalides = [
            '',                # Chaîne vide
            'abc',             # Chaîne non numérique
            '-5%',           # Pourcentage avec un format incorrect (point décimal)
            '1000%'            # Valeur hors des limites habituelles
        ]
        for invalide in invalides:
            with self.assertRaises(ValueError, msg=f"La conversion de {invalide} devrait échouer."):
                convertir_pourcentage_en_decimal(invalide)

if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)


........
----------------------------------------------------------------------
Ran 8 tests in 0.240s

OK


Normalisation des caractéristiques et de la cible  

  Je vérifie que les caractéristiques sont normalisées correctement et les données sont mises à l'échelle correctement après l'application du StandardScaler.

Je vérifie que les valeurs de la cible sont mises à l'échelle correctement après l'application du MinMaxScaler.

In [None]:
import unittest
import pandas as pd
from sklearn.preprocessing import StandardScaler, MinMaxScaler
import numpy as np

# Assurez-vous que ces classes sont définies dans le même script ou importées depuis votre module
def normaliser_caracteristiques(data):
    """Normalise les caractéristiques des données avec StandardScaler."""
    scaler = StandardScaler()
    features = data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
    return scaler.fit_transform(features), scaler

def normaliser_cible(data):
    """Normalise la cible des données avec MinMaxScaler."""
    target = data['Score de santé']
    scaler = MinMaxScaler()
    return scaler.fit_transform(target.values.reshape(-1, 1)), scaler

class TestNormalisation(unittest.TestCase):

    def setUp(self):
        """Prépare les données pour les tests."""
        self.data = pd.DataFrame({
            'Qualité du sommeil': [0.25, 0.50, 0.75, 1.00],
            'Rythme cardiaque': [60, 70, 80, 90],
            'Étapes quotidiennes': [3000, 4000, 5000, 6000],
            'Durée du sommeil': [6.0, 7.0, 8.0, 9.0],
            'Score de santé': [0.1, 0.2, 0.3, 0.4]
        })

    def test_normalisation_caracteristiques(self):
        """Vérifie que les caractéristiques sont normalisées correctement."""
        X_normalized, scaler = normaliser_caracteristiques(self.data)
        # Vérifie que la moyenne est proche de 0 et l'écart-type proche de 1 pour chaque caractéristique
        self.assertAlmostEqual(np.mean(X_normalized[:, 0]), 0, delta=0.1, msg="La moyenne de la première caractéristique normalisée ne devrait pas être différente de 0.")
        self.assertAlmostEqual(np.std(X_normalized[:, 0]), 1, delta=0.1, msg="L'écart-type de la première caractéristique normalisée ne devrait pas être différent de 1.")
        # Teste d'autres caractéristiques
        for i in range(X_normalized.shape[1]):
            self.assertAlmostEqual(np.mean(X_normalized[:, i]), 0, delta=0.1, msg=f"La moyenne de la caractéristique {i} normalisée ne devrait pas être différente de 0.")
            self.assertAlmostEqual(np.std(X_normalized[:, i]), 1, delta=0.1, msg=f"L'écart-type de la caractéristique {i} normalisée ne devrait pas être différent de 1.")

    def test_normalisation_cible(self):
        """Vérifie que la cible est normalisée correctement."""
        y_normalized, scaler = normaliser_cible(self.data)
        # Vérifie que les valeurs normalisées sont dans l'intervalle [0, 1]
        self.assertTrue(np.all(y_normalized >= 0) and np.all(y_normalized <= 1), "Les valeurs normalisées de la cible doivent être dans l'intervalle [0, 1].")
        # Vérifie que la valeur minimale est proche de 0 et la valeur maximale proche de 1
        self.assertAlmostEqual(np.min(y_normalized), 0, delta=0.1, msg="La valeur minimale normalisée de la cible ne devrait pas être différente de 0.")
        self.assertAlmostEqual(np.max(y_normalized), 1, delta=0.1, msg="La valeur maximale normalisée de la cible ne devrait pas être différente de 1.")

if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)


..........
----------------------------------------------------------------------
Ran 10 tests in 0.233s

OK


test_normalisation_caracteristiques :

Vérifie que la normalisation des caractéristiques est correcte en s'assurant que la moyenne des caractéristiques normalisées est proche de 0 et l'écart-type est proche de 1.
test_normalisation_cible :

Vérifie que la normalisation de la cible est correcte en s'assurant que toutes les valeurs sont dans l'intervalle [0, 1], et que les valeurs minimales et maximales sont proches de 0 et 1 respectivement

## Code de Test pour Division des Données


test_train_test_split_dimensions :

Vérifie que la taille des ensembles d'entraînement et de test est correcte en fonction du pourcentage spécifié. Utilise assertAlmostEqual pour permettre une petite marge d'erreur due à la taille de l'échantillon.
test_no_overlap :

Vérifie que les indices des ensembles d'entraînement et de test ne se chevauchent pas, garantissant que les ensembles sont distincts.

In [None]:
import unittest
from sklearn.model_selection import train_test_split
import pandas as pd

class TestTrainTestSplit(unittest.TestCase):

    def setUp(self):
        """Prépare les données pour les tests."""
        self.data = pd.DataFrame({
            'Qualité du sommeil': [0.25, 0.50, 0.75, 1.00, 0.30, 0.60, 0.80, 0.90],
            'Rythme cardiaque': [60, 70, 80, 90, 65, 75, 85, 95],
            'Étapes quotidiennes': [3000, 4000, 5000, 6000, 3200, 4200, 5200, 6200],
            'Durée du sommeil': [6.0, 7.0, 8.0, 9.0, 6.5, 7.5, 8.5, 9.5],
            'Score de santé': [0.1, 0.2, 0.3, 0.4, 0.15, 0.25, 0.35, 0.45]
        })
        self.features = self.data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
        self.target = self.data['Score de santé']
        self.test_size = 0.25  # 25% des données pour le test

    def test_train_test_split_dimensions(self):
        """Vérifie que la division des données produit des ensembles d'entraînement et de test de tailles correctes."""
        X_train, X_test, y_train, y_test = train_test_split(
            self.features, self.target, test_size=self.test_size, random_state=42
        )
        total_size = len(self.data)
        test_size = len(X_test)
        train_size = len(X_train)
        expected_test_size = total_size * self.test_size

        self.assertAlmostEqual(test_size, expected_test_size, delta=1, msg="La taille de l'ensemble de test ne correspond pas à la proportion attendue.")
        self.assertEqual(train_size, total_size - test_size, "La taille de l'ensemble d'entraînement ne correspond pas à la taille totale moins celle de l'ensemble de test.")

    def test_no_overlap(self):
        """Vérifie que les ensembles d'entraînement et de test ne se chevauchent pas."""
        X_train, X_test, y_train, y_test = train_test_split(
            self.features, self.target, test_size=self.test_size, random_state=42
        )
        train_indices = set(X_train.index)
        test_indices = set(X_test.index)

        self.assertTrue(train_indices.isdisjoint(test_indices), "Les ensembles d'entraînement et de test se chevauchent.")

if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)


............
----------------------------------------------------------------------
Ran 12 tests in 0.313s

OK


Les tests ont vérifié :

Dimensions des ensembles : Que les tailles des ensembles d'entraînement et de test correspondent aux proportions attendues.
Non-chevauchement : Que les ensembles d'entraînement et de test ne partagent pas de données.

In [None]:
import unittest
import pandas as pd
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, MinMaxScaler

class TestModelTraining(unittest.TestCase):

    @classmethod
    def setUpClass(cls):
        # Charger les données depuis le fichier CSV
        cls.file_path = '/content/drive/MyDrive/test.csv'
        cls.data = pd.read_csv(cls.file_path)

        # Convertir les pourcentages en décimaux
        def convertir_pourcentage_en_decimal(pourcentage):
            if isinstance(pourcentage, str) and '%' in pourcentage:
                return float(pourcentage.replace('%', '')) / 100.0
            return float(pourcentage)

        cls.data['Qualité du sommeil'] = cls.data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

        # Sélectionner les caractéristiques et la cible
        cls.features = cls.data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
        cls.target = cls.data['Score de santé']

        # Normaliser la cible
        cls.target_scaler = MinMaxScaler()
        cls.target = cls.target_scaler.fit_transform(cls.target.values.reshape(-1, 1))

        # Diviser les données en ensemble d'entraînement et de test
        cls.X_train, cls.X_test, cls.y_train, cls.y_test = train_test_split(
            cls.features, cls.target, test_size=0.2, random_state=42
        )

        # Prétraiter les données
        cls.scaler = StandardScaler()
        cls.X_train_scaled = cls.scaler.fit_transform(cls.X_train)
        cls.X_test_scaled = cls.scaler.transform(cls.X_test)

        # Définir le modèle de réseau de neurones
        cls.model = tf.keras.models.Sequential([
            tf.keras.layers.InputLayer(input_shape=(cls.X_train_scaled.shape[1],)),
            tf.keras.layers.Dense(128, activation='relu'),
            tf.keras.layers.Dropout(0.2),
            tf.keras.layers.Dense(64, activation='relu'),
            tf.keras.layers.Dropout(0.2),
            tf.keras.layers.Dense(32, activation='relu'),
            tf.keras.layers.Dense(1)  # Pas de fonction d'activation ici pour la régression
        ])
        cls.model.compile(optimizer='adam', loss='mse', metrics=['mae'])

    def test_model_training(self):
        """Vérifie que le modèle peut s'entraîner sans erreur."""
        try:
            history = self.model.fit(self.X_train_scaled, self.y_train, epochs=10, validation_split=0.2, verbose=0)
            self.assertIsNotNone(history, "L'historique de l'entraînement ne doit pas être None.")
        except Exception as e:
            self.fail(f"L'entraînement du modèle a échoué avec l'exception : {e}")

    def test_model_evaluation(self):
        """Vérifie que le modèle peut être évalué sur les données de test sans erreur."""
        try:
            self.model.fit(self.X_train_scaled, self.y_train, epochs=10, validation_split=0.2, verbose=0)
            loss, mae = self.model.evaluate(self.X_test_scaled, self.y_test, verbose=0)
            self.assertIsNotNone(loss, "La perte (loss) ne doit pas être None.")
            self.assertIsNotNone(mae, "L'erreur absolue moyenne (MAE) ne doit pas être None.")
            self.assertGreater(mae, 0, "L'erreur absolue moyenne (MAE) doit être positive.")
        except Exception as e:
            self.fail(f"L'évaluation du modèle a échoué avec l'exception : {e}")

if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)


......
----------------------------------------------------------------------
Ran 14 tests in 22.955s

OK


Normalisation des caractéristiques et de la cible : Vérification que les caractéristiques et la cible sont correctement normalisées.
Division des données (train/test split) : Vérification que les données sont correctement divisées en ensembles d'entraînement et de test.
Entraînement du modèle : Vérification que le modèle peut s'entraîner sans erreur.
Évaluation du modèle : Vérification que le modèle peut être évalué sur les données de test sans erreur.

#  Évaluation du modèle

In [None]:
import unittest
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, MinMaxScaler
import pandas as pd
import numpy as np

class TestModelEvaluation(unittest.TestCase):

    @classmethod
    def setUpClass(cls):
        """Prépare les données et le modèle pour les tests."""
        # Chargement des données depuis le fichier CSV
        file_path = '/content/drive/MyDrive/test.csv'
        data = pd.read_csv(file_path)

        # Conversion des pourcentages en décimaux
        def convertir_pourcentage_en_decimal(pourcentage):
            if isinstance(pourcentage, str) and '%' in pourcentage:
                return float(pourcentage.replace('%', '')) / 100.0
            return float(pourcentage)

        data['Qualité du sommeil'] = data['Qualité du sommeil'].apply(convertir_pourcentage_en_decimal)

        # Sélectionner les caractéristiques et la cible
        features = data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
        target = data['Score de santé']

        # Normalisation
        target_scaler = MinMaxScaler()
        target = target_scaler.fit_transform(target.values.reshape(-1, 1))
        scaler = StandardScaler()
        features = scaler.fit_transform(features)
        cls.X_train, cls.X_test, cls.y_train, cls.y_test = train_test_split(
            features, target, test_size=0.25, random_state=42
        )

        # Définir le modèle de réseau de neurones
        cls.model = tf.keras.models.Sequential([
            tf.keras.layers.InputLayer(input_shape=(cls.X_train.shape[1],)),
            tf.keras.layers.Dense(128, activation='relu'),
            tf.keras.layers.Dropout(0.2),
            tf.keras.layers.Dense(64, activation='relu'),
            tf.keras.layers.Dropout(0.2),
            tf.keras.layers.Dense(32, activation='relu'),
            tf.keras.layers.Dense(1)  # Pas de fonction d'activation ici pour la régression
        ])
        cls.model.compile(optimizer='adam', loss='mse', metrics=['mae'])

        # Entraîner le modèle
        cls.model.fit(cls.X_train, cls.y_train, epochs=10, validation_split=0.2, verbose=0)

    def test_model_evaluation(self):
        """Vérifie que le modèle peut être évalué sur les données de test sans erreur."""
        try:
            loss, mae = self.model.evaluate(self.X_test, self.y_test, verbose=0)
            self.assertIsNotNone(loss, "La perte (loss) ne doit pas être None.")
            self.assertIsNotNone(mae, "L'erreur absolue moyenne (MAE) ne doit pas être None.")
            self.assertGreater(mae, 0, "L'erreur absolue moyenne (MAE) doit être positive.")
        except Exception as e:
            self.fail(f"L'évaluation du modèle a échoué avec l'exception : {e}")

if __name__ == '__main__':
    unittest.main(argv=[''], exit=False)


......
----------------------------------------------------------------------
Ran 15 tests in 42.566s

OK


Le modèle peut être évalué correctement sur les données de test.

In [None]:
import unittest
import tensorflow as tf
import joblib
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler

class TestModelEvaluation(unittest.TestCase):

    @classmethod
    def setUpClass(cls):
        """Prépare les données et le modèle pour les tests."""
        # Charger le modèle et le scaler
        cls.model = tf.keras.models.load_model('/content/drive/MyDrive/best_model.keras')
        cls.target_scaler = joblib.load('/content/drive/MyDrive/target_scaler.joblib')

        # Charger le dataset pour obtenir les données
        cls.data = pd.read_csv('/content/drive/MyDrive/test.csv')

        # Nettoyer les données pour convertir les pourcentages en nombres flottants
        def convert_to_float(value):
            try:
                if isinstance(value, str) and '%' in value:
                    return float(value.replace('%', '').strip()) / 100.0
                else:
                    return float(value)
            except ValueError:
                return np.nan

        cls.data = cls.data.applymap(convert_to_float)

        cls.features = cls.data[['Qualité du sommeil', 'Rythme cardiaque', 'Étapes quotidiennes', 'Durée du sommeil']]
        cls.target = cls.data['Score de santé']

        # Vérifier les valeurs NaN après conversion
        if cls.features.isnull().values.any() or cls.target.isnull().values.any():
            raise ValueError("Les données contiennent encore des valeurs NaN après la conversion.")

        # Normalisation des données
        cls.features = cls.features.values.astype(np.float32)
        cls.target = cls.target.values.reshape(-1, 1).astype(np.float32)
        cls.target = cls.target_scaler.transform(cls.target)

        # Split des données
        split = int(0.75 * len(cls.features))
        cls.X_train, cls.X_test = cls.features[:split], cls.features[split:]
        cls.y_train, cls.y_test = cls.target[:split], cls.target[split:]

    def test_model_evaluation(self):
        """Vérifie que le modèle peut être évalué sur les données de test sans erreur."""
        try:
            self.model.fit(self.X_train, self.y_train, epochs=10, validation_split=0.2, verbose=0)
            loss, mae = self.model.evaluate(self.X_test, self.y_test, verbose=0)
            self.assertIsNotNone(loss, "La perte (loss) ne doit pas être None.")
            self.assertIsNotNone(mae, "L'erreur absolue moyenne (MAE) ne doit pas être None.")
            self.assertGreater(mae, 0, "L'erreur absolue moyenne (MAE) doit être positive.")
        except Exception as e:
            self.fail(f"L'évaluation du modèle a échoué avec l'exception : {e}")

if __name__ == "__main__":
    unittest.main(argv=[''], verbosity=2, exit=False)


test_conversion_correcte (__main__.TestConversionPourcentage)
Vérifie que les pourcentages sont correctement convertis en décimaux. ... ok
test_conversion_invalide (__main__.TestConversionPourcentage)
Vérifie que les valeurs invalides sont correctement traitées. ... ok
test_conversion_sans_pourcentage (__main__.TestConversionPourcentage)
Vérifie que les valeurs sans symbole de pourcentage sont correctement converties. ... ok
test_all_columns_present (__main__.TestDataColumns) ... ok
test_columns_missing (__main__.TestDataColumns) ... ok
test_file_load_failure (__main__.TestDataColumns) ... ok
test_columns_not_empty (__main__.TestLoadData)
Vérifie que toutes les colonnes sont remplies (pas de valeurs vides ou NaN) ... ok
test_dataset_is_valid (__main__.TestLoadData)
Vérifie que le dataset est valide (toutes les colonnes remplies) ... ok
  cls.data = cls.data.applymap(convert_to_float)
test_model_evaluation (__main__.TestModelEvaluation)
Vérifie que le modèle peut être évalué sur les don

Les données sont correctement nettoyées et converties.
Le modèle est capable d'être évalué et d'être entraîné sans erreurs.
Les normalisations et les divisions des données fonctionnent comme prévu.

In [None]:
import unittest
import numpy as np
import pandas as pd
import tensorflow as tf
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.model_selection import train_test_split
import joblib

class TestModelPrediction(unittest.TestCase):

    @classmethod
    def setUpClass(cls):
        # Charger le modèle et le scaler
        cls.model = tf.keras.models.load_model('/content/drive/MyDrive/best_model.keras')
        cls.target_scaler = joblib.load('/content/drive/MyDrive/target_scaler.joblib')

        # Préparer des données fictives pour la prédiction
        cls.data = pd.DataFrame({
            'Qualité du sommeil': [0.25, 0.50, 0.75, 1.00],
            'Rythme cardiaque': [60, 70, 80, 90],
            'Étapes quotidiennes': [3000, 4000, 5000, 6000],
            'Durée du sommeil': [6.0, 7.0, 8.0, 9.0]
        })
        cls.features = cls.data.values.astype(np.float32)

        # Normaliser les données
        cls.scaler = StandardScaler()
        cls.features = cls.scaler.fit_transform(cls.features)

    def test_model_prediction(self):
        """Vérifie que le modèle peut faire des prédictions sur de nouvelles données sans erreur."""
        try:
            predictions = self.model.predict(self.features)
            self.assertIsInstance(predictions, np.ndarray, "Les prédictions doivent être un tableau NumPy.")
            self.assertEqual(predictions.shape[1], 1, "La sortie des prédictions doit avoir une seule colonne pour la régression.")
        except Exception as e:
            self.fail(f"La prédiction du modèle a échoué avec l'exception : {e}")

if __name__ == "__main__":
    unittest.main(argv=[''], verbosity=2, exit=False)


test_conversion_correcte (__main__.TestConversionPourcentage)
Vérifie que les pourcentages sont correctement convertis en décimaux. ... ok
test_conversion_invalide (__main__.TestConversionPourcentage)
Vérifie que les valeurs invalides sont correctement traitées. ... ok
test_conversion_sans_pourcentage (__main__.TestConversionPourcentage)
Vérifie que les valeurs sans symbole de pourcentage sont correctement converties. ... ok
test_all_columns_present (__main__.TestDataColumns) ... ok
test_columns_missing (__main__.TestDataColumns) ... ok
test_file_load_failure (__main__.TestDataColumns) ... ok
test_columns_not_empty (__main__.TestLoadData)
Vérifie que toutes les colonnes sont remplies (pas de valeurs vides ou NaN) ... ok
test_dataset_is_valid (__main__.TestLoadData)
Vérifie que le dataset est valide (toutes les colonnes remplies) ... ok
  cls.data = cls.data.applymap(convert_to_float)
test_model_evaluation (__main__.TestModelEvaluation)
Vérifie que le modèle peut être évalué sur les don

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 118ms/step


ok
test_model_evaluation (__main__.TestModelTraining)
Vérifie que le modèle peut être évalué sur les données de test sans erreur. ... ok
test_model_training (__main__.TestModelTraining)
Vérifie que le modèle peut s'entraîner sans erreur. ... ok
test_normalisation_caracteristiques (__main__.TestNormalisation)
Vérifie que les caractéristiques sont normalisées correctement. ... ok
test_normalisation_cible (__main__.TestNormalisation)
Vérifie que la cible est normalisée correctement. ... ok
test_no_overlap (__main__.TestTrainTestSplit)
Vérifie que les ensembles d'entraînement et de test ne se chevauchent pas. ... ok
test_train_test_split_dimensions (__main__.TestTrainTestSplit)
Vérifie que la division des données produit des ensembles d'entraînement et de test de tailles correctes. ... ok

----------------------------------------------------------------------
Ran 16 tests in 39.832s

OK


Git

In [2]:
!git config --global user.name "yvanoide"
!git config --global user.email "iffikig71@gmail.com"


In [3]:
!git clone https://github.com/yvanoide/Mon_projet_final.git


Cloning into 'Mon_projet_final'...
fatal: could not read Username for 'https://github.com': No such device or address


In [4]:
%cd Mon_projet_final


[Errno 2] No such file or directory: 'Mon_projet_final'
/content


In [5]:
!git checkout -b e1


fatal: not a git repository (or any of the parent directories): .git


In [7]:


!git clone https://your-username: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@github.com/yvanoide/Mon_projet_final.git


Cloning into 'Mon_projet_final'...
remote: Enumerating objects: 51, done.[K
remote: Counting objects: 100% (51/51), done.[K
remote: Compressing objects: 100% (42/42), done.[K
remote: Total 51 (delta 6), reused 51 (delta 6), pack-reused 0 (from 0)[K
Receiving objects: 100% (51/51), 37.05 KiB | 566.00 KiB/s, done.
Resolving deltas: 100% (6/6), done.


In [10]:
!pwd


/content


In [11]:
%cd Mon_projet_final


/content/Mon_projet_final


In [12]:
!git status


On branch master
Your branch is up to date with 'origin/master'.

nothing to commit, working tree clean


In [13]:
!git checkout -b e1


Switched to a new branch 'e1'


In [14]:
!git add .


In [15]:
!git commit -m ". Programmer les tests automatisés d’un modèle dintelligence artificielle"


On branch e1
nothing to commit, working tree clean


In [17]:
!git pull origin e1 --rebase


From https://github.com/yvanoide/Mon_projet_final
 * branch            e1         -> FETCH_HEAD
Rebasing (1/2)Rebasing (2/2)[KSuccessfully rebased and updated refs/heads/e1.


In [18]:
!git push origin e1


Enumerating objects: 7, done.
Counting objects:  14% (1/7)Counting objects:  28% (2/7)Counting objects:  42% (3/7)Counting objects:  57% (4/7)Counting objects:  71% (5/7)Counting objects:  85% (6/7)Counting objects: 100% (7/7)Counting objects: 100% (7/7), done.
Delta compression using up to 2 threads
Compressing objects:  16% (1/6)Compressing objects:  33% (2/6)Compressing objects:  50% (3/6)Compressing objects:  66% (4/6)Compressing objects:  83% (5/6)Compressing objects: 100% (6/6)Compressing objects: 100% (6/6), done.
Writing objects:  16% (1/6)Writing objects:  33% (2/6)Writing objects:  50% (3/6)Writing objects:  66% (4/6)Writing objects:  83% (5/6)Writing objects: 100% (6/6)Writing objects: 100% (6/6), 11.88 KiB | 11.88 MiB/s, done.
Total 6 (delta 1), reused 2 (delta 0), pack-reused 0
remote: Resolving deltas:   0% (0/1)[Kremote: Resolving deltas: 100% (1/1)[Kremote: Resolving deltas: 100% (1/1), done.[K
To https://github.com/yvanoide/Mon_projet_final.git


In [24]:
import shutil

# Spécifiez le chemin source et le chemin de destination
source_path = '/content/drive/MyDrive/Colab Notebooks/service ia.ipynb'
destination_path = '/content/service_ia.ipynb'

# Copier le fichier
shutil.copy(source_path, destination_path)





'/content/service_ia.ipynb'

In [25]:
!git add /content/service_ia.ipynb


fatal: /content/service_ia.ipynb: '/content/service_ia.ipynb' is outside repository at '/content/Mon_projet_final'
