In [1]:
import pandas as pd
import os

def charger_dataset_iris():
    """
    Charge le dataset Iris depuis le dossier DATASET
    Returns:
        DataFrame pandas contenant les données Iris
    """
    # Chemin vers le fichier avec le nom correct
    chemin_iris = 'WEEK_2/DAY_2/DATASET/Iris_dataset.csv'
    
    try:
        # Vérification de l'existence du fichier
        if not os.path.exists(chemin_iris):
            print(f"Erreur : Le fichier {chemin_iris} n'existe pas")
            return None
        
        # Chargement du dataset
        df_iris = pd.read_csv(chemin_iris)
        return df_iris
        
    except Exception as e:
        print(f"Erreur lors du chargement du dataset Iris : {e}")
        return None

def afficher_apercu_donnees(df):
    """
    Affiche un aperçu des données du DataFrame
    Args:
        df: DataFrame pandas à analyser
    """
    if df is not None:
        print("\n=== APERÇU DU DATASET IRIS ===")
        print("\n1. Les cinq premières lignes du dataset :")
        print(df.head())
        
        print("\n2. Informations sur le dataset :")
        print(df.info())
        
        print("\n3. Statistiques descriptives :")
        print(df.describe())

def main():
    # Chargement du dataset Iris
    df_iris = charger_dataset_iris()
    
    # Affichage des données
    afficher_apercu_donnees(df_iris)

if __name__ == "__main__":
    main()




=== APERÇU DU DATASET IRIS ===

1. Les cinq premières lignes du dataset :
   5.1  3.5  1.4  0.2  Iris-setosa
0  4.9  3.0  1.4  0.2  Iris-setosa
1  4.7  3.2  1.3  0.2  Iris-setosa
2  4.6  3.1  1.5  0.2  Iris-setosa
3  5.0  3.6  1.4  0.2  Iris-setosa
4  5.4  3.9  1.7  0.4  Iris-setosa

2. Informations sur le dataset :
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 149 entries, 0 to 148
Data columns (total 5 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   5.1          149 non-null    float64
 1   3.5          149 non-null    float64
 2   1.4          149 non-null    float64
 3   0.2          149 non-null    float64
 4   Iris-setosa  149 non-null    object 
dtypes: float64(4), object(1)
memory usage: 5.9+ KB
None

3. Statistiques descriptives :
              5.1         3.5         1.4         0.2
count  149.000000  149.000000  149.000000  149.000000
mean     5.848322    3.051007    3.774497    1.205369
std      0.828594    0.433499   

In [17]:
#Installez openpyxl
!pip3 install openpyxl

Collecting openpyxl
  Downloading openpyxl-3.1.5-py2.py3-none-any.whl.metadata (2.5 kB)
Collecting et-xmlfile (from openpyxl)
  Downloading et_xmlfile-2.0.0-py3-none-any.whl.metadata (2.7 kB)
Downloading openpyxl-3.1.5-py2.py3-none-any.whl (250 kB)
Downloading et_xmlfile-2.0.0-py3-none-any.whl (18 kB)
Installing collected packages: et-xmlfile, openpyxl
Successfully installed et-xmlfile-2.0.0 openpyxl-3.1.5


In [18]:
import pandas as pd
import os
from datetime import datetime

def charger_dataset_iris():
    """
    Charge le dataset Iris depuis le dossier DATASET
    """
    # Chemin vers le fichier Iris_dataset.csv
    chemin_iris = 'DATASET/Iris_dataset.csv'  # Chemin modifié
    
    try:
        # Vérification de l'existence du fichier
        if not os.path.exists(chemin_iris):
            print(f"Erreur : Le fichier {chemin_iris} n'existe pas")
            print("\nFichiers disponibles dans le dossier DATASET :")
            if os.path.exists('DATASET'):
                print("\n".join(os.listdir('DATASET')))
            return None
        
        # Chargement du dataset
        return pd.read_csv(chemin_iris)
        
    except Exception as e:
        print(f"Erreur lors du chargement : {e}")
        return None

def exporter_vers_excel(df, nom_fichier):
    """
    Exporte le DataFrame vers un fichier Excel
    """
    try:
        os.makedirs('exports', exist_ok=True)
        chemin_excel = f'exports/{nom_fichier}.xlsx'
        df.to_excel(chemin_excel, index=False)
        print(f"Export Excel réussi : {chemin_excel}")
        return True
    except Exception as e:
        print(f"Erreur lors de l'export Excel : {e}")
        return False

def exporter_vers_json(df, nom_fichier):
    """
    Exporte le DataFrame vers un fichier JSON
    """
    try:
        os.makedirs('exports', exist_ok=True)
        chemin_json = f'exports/{nom_fichier}.json'
        df.to_json(chemin_json, orient='records')
        print(f"Export JSON réussi : {chemin_json}")
        return True
    except Exception as e:
        print(f"Erreur lors de l'export JSON : {e}")
        return False

def main():
    # 1. Chargement du dataset Iris
    print("Chargement du dataset Iris...")
    df_iris = charger_dataset_iris()
    
    if df_iris is not None:
        # Affichage des premières lignes
        print("\nAperçu du DataFrame :")
        print(df_iris.head())
        
        # Création d'un horodatage pour les noms de fichiers
        horodatage = datetime.now().strftime("%Y%m%d_%H%M%S")
        
        # 2. Export vers Excel
        nom_fichier_excel = f"iris_dataset_{horodatage}"
        exporter_vers_excel(df_iris, nom_fichier_excel)
        
        # 3. Export vers JSON
        nom_fichier_json = f"iris_dataset_{horodatage}"
        exporter_vers_json(df_iris, nom_fichier_json)
        
        # 4. Vérification des exports
        print("\nVérification des fichiers exportés :")
        if os.path.exists('exports'):
            print("Fichiers dans le dossier 'exports' :")
            for fichier in os.listdir('exports'):
                taille = os.path.getsize(f'exports/{fichier}') / 1024
                print(f"- {fichier} ({taille:.2f} Ko)")

if __name__ == "__main__":
    main()


Chargement du dataset Iris...

Aperçu du DataFrame :
   5.1  3.5  1.4  0.2  Iris-setosa
0  4.9  3.0  1.4  0.2  Iris-setosa
1  4.7  3.2  1.3  0.2  Iris-setosa
2  4.6  3.1  1.5  0.2  Iris-setosa
3  5.0  3.6  1.4  0.2  Iris-setosa
4  5.4  3.9  1.7  0.4  Iris-setosa
Export Excel réussi : exports/iris_dataset_20250218_104732.xlsx
Export JSON réussi : exports/iris_dataset_20250218_104732.json

Vérification des fichiers exportés :
Fichiers dans le dossier 'exports' :
- iris_dataset_20250218_104732.xlsx (8.17 Ko)
- iris_dataset_20250218_104732.json (10.53 Ko)
- iris_dataset_20250218_104456.json (10.53 Ko)
