<a href="https://colab.research.google.com/github/mohamedbenhouad-cell/chapitre-1-Introduction-au-langage-Python/blob/main/1_5_%09Traitement_des_fichiers_Excel_CSV.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Exemple d’application 1.16**

In [None]:
import requests
# 1. URL de fichier CSV de test avec données réelles
url = "https://people.sc.fsu.edu/~jburkardt/data/csv/addresses.csv"
# 2. Envoyer une requête HTTP
r = requests.get(url)
# 3. Récupérer le contenu
data = r.content
# 4. Sauvegarder localement
nom_fichier = "adresses_clients.csv"
with open(nom_fichier, "wb") as fichier:
    fichier.write(data)
print(f" Fichier sauvegardé : {nom_fichier}")


# **Exemple d’application 1.17**

In [None]:
# Importation de la bibliothèque pandas
import pandas as pd
# Lecture d’une feuille spécifique par son nom
dataframe = pd.read_excel("/content/Exemple_1.1.xlsx", sheet_name="Feuil1")
# Vérification du contenu
print(dataframe.head())  # Aperçu des premières lignes
print(dataframe.info()) # Informations générales sur le DataFrame
print(f"Lignes : {dataframe.shape[0]}, Colonnes : {dataframe.shape[1]}") # Dimensions du dataset
print("Colonnes :", dataframe.columns.tolist()) # Noms des colonnes


# **Exemple d’application 1.18**

In [None]:
# Importation de la bibliothèque pandas
import pandas as pd
# 1. Charger le dataset (à adapter avec votre vrai fichier)
df = pd.read_excel("/content/Exemple_1.2.xlsx")  # Ou .read_csv() pour CSV
# 2. Afficher les colonnes avant suppression
print("Colonnes avant suppression :", df.columns.tolist())
# 3. Supprimer la colonne spécifique
df = df.drop('Taux_conversion_achats', axis=1)
# 4. Afficher les colonnes après suppression
print("Colonnes après suppression :", df.columns.tolist())
# 5. Sauvegarder dans un nouveau fichier Excel
df.to_excel("nouveau_fichier.xlsx", index=False)
print ("Nouveau fichier sauvegardé")


# **Exemple d'application 1.19**

In [None]:


# Étape 1 : Importations

import pandas as pd


# Étape 2 : Fichier Excel et chargement des données (sans nom de feuille)

fichier_entree = "/content/Exemple_1.2.xlsx"
df = pd.read_excel(fichier_entree)   # <-- pas de sheet_name


# Étape 3 : Afficher les colonnes

print("Colonnes disponibles dans le fichier :")
print(df.columns.tolist())


# Étape 4 : Paramètres + Vérifications

colonne_freq = "Fréquence_achat"
seuil = 10

if colonne_freq not in df.columns:
    raise ValueError(f"ERREUR : La colonne '{colonne_freq}' n'existe pas dans le fichier.")


# Étape 5 : Suppression des clients (Fréquence_achat < 10)

# Conversion en numérique (au cas où la colonne est lue comme texte)
df[colonne_freq] = pd.to_numeric(df[colonne_freq], errors="coerce")

# Condition de suppression
condition_suppr = df[colonne_freq] < seuil

# Clients supprimés
df_supprimes = df.loc[condition_suppr].copy()

# Clients conservés
df_filtre = df.loc[~condition_suppr].copy()


# Étape 6 : Afficher les clients supprimés

print("\nClients supprimés (Fréquence_achat < 10) :")
print(f"Nombre de clients supprimés : {len(df_supprimes)}")

if df_supprimes.empty:
    print("Aucun client supprimé.")
else:
    print(df_supprimes.to_string(index=False))
# Étape 7 : Sauvegarde des résultats

fichier_sortie = "clients_filtrés.xlsx"
fichier_supprimes = "clients_supprimés.xlsx"

df_filtre.to_excel(fichier_sortie, index=False)
df_supprimes.to_excel(fichier_supprimes, index=False)

print("\n Sauvegarde terminée !")
print(f"➡ Nouveau fichier (clients conservés) : {fichier_sortie}")
print(f"➡ Fichier des clients supprimés : {fichier_supprimes}")
print(f"Nombre de clients restants : {len(df_filtre)}")


# **Exemple d'application 1.20**

In [None]:
import pandas as pd

# Étape 1 : Charger le fichier Excel
fichier_entree = "/content/Exemple_1.2.xlsx"
df = pd.read_excel(fichier_entree)

# Étape 2 : Afficher les colonnes disponibles
print("Colonnes disponibles dans le fichier :")
print(df.columns.tolist())

# Étape 3 : Paramètres et vérification
colonne_cat = "Catégorie_produits_achetés_dominants"
valeur_exclue = "Beauté"

if colonne_cat not in df.columns:
    raise ValueError(f"ERREUR : La colonne '{colonne_cat}' n'existe pas dans le fichier.")

# Étape 4 : Identifier les clients à supprimer (catégorie contenant 'Beauté')
serie_cat = df[colonne_cat].astype(str)
condition_suppr = serie_cat.str.contains(valeur_exclue, case=False, na=False)

df_supprimes = df.loc[condition_suppr].copy()     # clients supprimés
df_filtre = df.loc[~condition_suppr].copy()       # clients conservés

# Étape 5 : Afficher les clients supprimés
print("\nClients supprimés (catégorie contenant 'Beauté') :")
print(f"Nombre de clients supprimés : {len(df_supprimes)}")

if df_supprimes.empty:
    print("Aucun client supprimé.")
else:
    print(df_supprimes.to_string(index=False))

# Étape 6 : Sauvegarder les résultats dans deux nouveaux fichiers Excel
fichier_sortie = "clients_sans_Beaute.xlsx"
fichier_supprimes = "clients_Beaute_supprimes.xlsx"

df_filtre.to_excel(fichier_sortie, index=False)
df_supprimes.to_excel(fichier_supprimes, index=False)

print("\n Sauvegarde terminée !")
print(f"➡ Nouveau fichier (clients conservés) : {fichier_sortie}")
print(f"➡ Fichier des clients supprimés : {fichier_supprimes}")
print(f"Nombre de clients restants : {len(df_filtre)}")
