In [11]:
# Importation des bibliothèques nécessaires
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns



In [12]:
# Chargement des données
file_path = 'products.csv'
data = pd.read_csv(file_path)
print("Nombre de lignes:", data.shape[0])
print("Nombre de colonnes:", data.shape[1])
print("Aperçu des colonnes:", data.columns.tolist())
print("Types de données:\n", data.dtypes)
print("Premières lignes:\n", data.head())


Nombre de lignes: 3457
Nombre de colonnes: 4
Aperçu des colonnes: ['Nom du produit', 'Prix', 'Promotion', 'Ventes']
Types de données:
 Nom du produit    object
Prix              object
Promotion         object
Ventes             int64
dtype: object
Premières lignes:
   Nom du produit Prix         Promotion  Ventes
0            NaN  NaN               NaN       0
1            NaN  NaN               NaN       0
2            NaN  NaN               NaN       0
3            NaN  NaN  Pas de promotion       0
4            NaN  NaN               NaN       0


In [13]:

# Nettoyage des données
# Supprimer les lignes où "Nom du produit" et "Prix" sont manquants
data_cleaned = data.dropna(subset=['Nom du produit', 'Prix'])

# Remplacer les valeurs manquantes dans "Promotion" par "Information non disponible"
data_cleaned['Promotion'].fillna('Information non disponible', inplace=True)

# Convertir les prix en valeurs numériques
data_cleaned['Prix'] = data_cleaned['Prix'].str.replace('€', '').str.replace(',', '.').astype(float)




A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [14]:
import plotly.express as px

histogram_ventes = px.histogram(data_cleaned, x="Ventes",
                                title="Répartition des Ventes",
                                labels={"Ventes": "Nombre de Ventes"},
                                template="plotly_white",
                                color="Ventes",
                                hover_data=data.columns)

histogram_ventes.show()


In [18]:
boxplot_ventes = px.box(data_cleaned, y="Ventes", 
                        title="Diagramme en Boîte des Ventes",
                        labels={"Ventes": "Nombre de Ventes"},
                        template="plotly_white",
                        color="Ventes")

boxplot_ventes.show()


In [19]:
scatter_prix_ventes = px.scatter(data_cleaned, x="Prix", y="Ventes", 
                                 title="Relation entre le Prix et les Ventes",
                                 labels={"Prix": "Prix (€)", "Ventes": "Nombre de Ventes"},
                                 template="plotly_white",
                                 color="Ventes",
                                 hover_name="Nom du produit")

scatter_prix_ventes.show()


In [20]:
ventes_promotion = data_cleaned.groupby('Promotion')['Ventes'].mean().reset_index()

bar_promotion_ventes = px.bar(ventes_promotion, x="Promotion", y="Ventes", 
                              title="Impact de la Promotion sur les Ventes Moyennes",
                              labels={"Ventes": "Ventes Moyennes"},
                              template="plotly_white",
                              color="Ventes")

bar_promotion_ventes.show()


In [21]:
top_10_ventes = data_cleaned.nlargest(10, 'Ventes')

bar_top_10 = px.bar(top_10_ventes, x="Ventes", y="Nom du produit", orientation='h',
                    title="Top 10 des Produits les Plus Vendus",
                    labels={"Nom du produit": "Produit", "Ventes": "Nombre de Ventes"},
                    template="plotly_white",
                    color="Ventes")

bar_top_10.show()
