# Analyse Profil

Analyse de l'importance des différents critères pour l'utilisateur de 0 à 1.

In [8]:
import json
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn import tree

# Charger les données du fichier JSON
with open("profil.json", "r", encoding="utf-8") as file:
    json_data = json.load(file)

# Extraire les données et les résultats
data = json_data["data"]  
result = json_data["resultats"]  

# Création du DataFrame
dataframe = pd.DataFrame(data, columns=["orientation", "qualite", "animal", "nature", "luminosite"])
resultframe = pd.DataFrame(result, columns=["favorite"])

# Encoder les colonnes catégoriques en valeurs numériques
label_encoders = {}
for column in dataframe.columns:
    le = LabelEncoder()
    dataframe[column] = le.fit_transform(dataframe[column])
    label_encoders[column] = le  # Stocker l'encodeur pour usage futur si besoin

le_result = LabelEncoder()
resultframe["favorite"] = le_result.fit_transform(resultframe["favorite"])

# Création et entraînement du modèle Random Forest
rfc = RandomForestClassifier(n_estimators=100, random_state=42)
rfc.fit(dataframe.values, resultframe.values.ravel())

# Affichage des importances des caractéristiques
feature_importances = rfc.feature_importances_
feature_names = dataframe.columns

print("Importances des caractéristiques (Random Forest) :")
for feature, importance in zip(feature_names, feature_importances):
    print(f"   - {feature}: {importance:.3f}")

Importances des caractéristiques (Random Forest) :
   - orientation: 0.085
   - qualite: 0.125
   - animal: 0.142
   - nature: 0.609
   - luminosite: 0.039


# Analyse des tendances des critères parmi les photos mises en favoris par l'utilisateur.

In [6]:
import pandas as pd

# Créer un DataFrame
df = pd.DataFrame(data, columns=["orientation", "qualite", "animal", "nature", "luminosite"])

# Ajouter la colonne des résultats
df['result'] = result

# Filtrer les données pour ne garder que les images favorites
df_favorite = df[df['result'] == 'Favorite']

# Analyser la fréquence des tags pour chaque caractéristique
orientation_freq = df_favorite['orientation'].value_counts()
animal_freq = df_favorite['animal'].value_counts()
nature_freq = df_favorite['nature'].value_counts()
luminosite_freq = df_favorite['luminosite'].value_counts()
qualite_freq = df_favorite['qualite'].value_counts()

# Afficher les statistiques
print("Fréquence des orientations dans les images favorites :")
print(orientation_freq)

print("\nFréquence de la qualite dans les images favorites :")
print(qualite_freq)

print("\nFréquence des animaux dans les images favorites :")
print(animal_freq)

print("\nFréquence des natures dans les images favorites :")
print(nature_freq)

print("\nFréquence des luminosités dans les images favorites :")
print(luminosite_freq)




Fréquence des orientations dans les images favorites :
orientation
Paysage    6
Carre      1
Name: count, dtype: int64

Fréquence de la qualite dans les images favorites :
qualite
moyenne    5
haute      1
basse      1
Name: count, dtype: int64

Fréquence des animaux dans les images favorites :
animal
Chien      5
Chat       1
Unknown    1
Name: count, dtype: int64

Fréquence des natures dans les images favorites :
nature
en nature    7
Name: count, dtype: int64

Fréquence des luminosités dans les images favorites :
luminosite
sombre      4
lumineux    3
Name: count, dtype: int64


# Liste des tags préférés

In [7]:
orientation_pref = orientation_freq.idxmax() if orientation_freq.size > 0 else "Aucune orientation préférée"
animal_pref = animal_freq.idxmax() if animal_freq.size > 0 else "Aucun animal préféré"
qualite_pref = qualite_freq.idxmax() if qualite_freq.size > 0 else "Aucun qualite préférée"
nature_pref = nature_freq.idxmax() if nature_freq.size > 0 else "Aucune nature préférée"
luminosite_pref = luminosite_freq.idxmax() if luminosite_freq.size > 0 else "Aucune luminosité préférée"

# Affichage des résultats
print("Tag préféré par catégorie :")
print(f"- Orientation : {orientation_pref}")
print(f"- Qualité : {qualite_pref}")
print(f"- Animal : {animal_pref}")
print(f"- Nature : {nature_pref}")
print(f"- Luminosité : {luminosite_pref}")


Tag préféré par catégorie :
- Orientation : Paysage
- Qualité : moyenne
- Animal : Chien
- Nature : en nature
- Luminosité : sombre
