In [5]:
import pandas as pd
import matplotlib.pyplot as plt

def main():
    print("=== TP1: Pandas DataFrame Basics ===\n")

    # 1. Importation et lecture des données
    print("1. Importation et lecture des données")
    try:
        # Lecture du fichier CSV
        df = pd.read_csv('TecInf\Downloads\pokemon_data.csv')
        print("✓ Fichier CSV lu avec succès")
        print(f"Dimensions: {df.shape}")
    except FileNotFoundError:
        print("⚠ Fichier 'pokemon_data.csv' non trouvé. Création d'un échantillon de données...")
        # Création d'un échantillon de données pour les tests
        df = create_sample_data()

    print("\n" + "="*50)

    # 2. Affichage des premières lignes
    print("2. Méthode head() - Premières lignes")
    print(df.head())
    print(f"\nPremières 3 lignes:")
    print(df.head(3))

    print("\n" + "="*50)

    # 3. Affichage des dernières lignes
    print("3. Méthode tail() - Dernières lignes")
    print(df.tail())
    print(f"\nDernières 3 lignes:")
    print(df.tail(3))

    print("\n" + "="*50)

    # 4. Informations générales sur le DataFrame
    print("4. Méthode info() - Informations générales")
    print("Informations détaillées:")
    df.info()
    print("\nInformations condensées:")
    df.info(verbose=False)

    print("\n" + "="*50)

    # 5. Échantillonnage aléatoire
    print("5. Méthode sample() - Échantillonnage")
    print("5 lignes aléatoires:")
    print(df.sample(5))
    print(f"\n10% des données (fraction=0.1):")
    sample_fraction = df.sample(frac=0.1)
    print(f"Nombre de lignes échantillonnées: {len(sample_fraction)}")
    print(sample_fraction.head())

    print("\n" + "="*50)

    # 6. Noms des colonnes
    print("6. Fonction columns - Noms des colonnes")
    print("Colonnes du DataFrame:")
    print(df.columns.tolist())

    print("\n" + "="*50)

    # 7. Index du DataFrame
    print("7. Méthode index() - Index des lignes")
    print("Index du DataFrame:")
    print(df.index)

    print("\n" + "="*50)

    # 8. Statistiques descriptives
    print("8. Méthode describe() - Statistiques descriptives")
    print("Statistiques pour toutes les colonnes numériques:")
    print(df.describe())

    # Statistiques pour colonnes spécifiques
    if 'HP' in df.columns and 'Attack' in df.columns:
        print(f"\nStatistiques pour HP et Attack:")
        print(df[['HP', 'Attack']].describe())

    print("\n" + "="*50)

    # 9. Sélection de colonnes comme DataFrame
    print("9. Sélection de colonnes comme DataFrame")
    if 'HP' in df.columns:
        print("Colonne HP comme DataFrame:")
        hp_df = df[['HP']]
        print(hp_df.head())
        print(f"Type: {type(hp_df)}")

    print("\n" + "="*50)

    # 10. Sélection de colonnes comme Series
    print("10. Sélection de colonnes comme Series")
    if 'HP' in df.columns:
        print("Colonne HP comme Series:")
        hp_series = df['HP']
        print(hp_series.head())
        print(f"Type: {type(hp_series)}")

    print("\n" + "="*50)

    # 11. Sélection par numéro de colonne
    print("11. Sélection par numéro de colonne")
    print("Premières 4 colonnes:")
    first_four = df[df.columns[:4]]
    print(first_four.head())

    print("\n" + "="*50)

    # 12. Filtrage par type de données
    print("12. Filtrage par type de données")
    print("Colonnes numériques (int):")
    numeric_cols = df.select_dtypes('int')
    print(numeric_cols.head())

    print(f"\nColonnes object (texte):")
    text_cols = df.select_dtypes('object')
    print(text_cols.head())

    print("\n" + "="*50)

    # 13. Visualisations
    print("13. Visualisations")
    try:
        # Histogramme pour HP
        if 'HP' in df.columns:
            plt.figure(figsize=(10, 6))
            df['HP'].plot.hist(bins=20, alpha=0.7, title='Distribution des HP')
            plt.xlabel('HP')
            plt.ylabel('Fréquence')
            plt.savefig('hp_histogram.png')
            print("✓ Histogramme HP sauvegardé: hp_histogram.png")
            plt.close()

        # Graphique en barres pour les premières lignes
        if len(df.columns) > 4:
            plt.figure(figsize=(12, 6))
            df.head().plot.bar(figsize=(12, 6))
            plt.title('Graphique en barres - Premières lignes')
            plt.xticks(rotation=45)
            plt.tight_layout()
            plt.savefig('head_barplot.png')
            print("✓ Graphique en barres sauvegardé: head_barplot.png")
            plt.close()
    except Exception as e:
        print(f"⚠ Erreur lors de la création des graphiques: {e}")

    print("\n" + "="*50)


def create_sample_data():
    """Crée un échantillon de données Pokemon pour les tests"""
    import numpy as np

    pokemon_names = ['Bulbasaur', 'Ivysaur', 'Venusaur', 'Charmander', 'Charmeleon',
                    'Charizard', 'Squirtle', 'Wartortle', 'Blastoise', 'Caterpie']

    data = {
        '#': range(1, 11),
        'Name': pokemon_names,
        'Type 1': ['Grass', 'Grass', 'Grass', 'Fire', 'Fire', 'Fire', 'Water', 'Water', 'Water', 'Bug'],
        'Type 2': ['Poison', 'Poison', 'Poison', None, None, 'Flying', None, None, None, None],
        'HP': [45, 60, 80, 39, 58, 78, 44, 59, 79, 45],
        'Attack': [49, 62, 82, 52, 64, 84, 48, 63, 83, 30],
        'Defense': [49, 63, 83, 43, 58, 78, 65, 80, 100, 35],
        'Sp. Atk': [65, 80, 100, 60, 80, 109, 50, 65, 85, 20],
        'Sp. Def': [65, 80, 100, 50, 65, 85, 64, 80, 105, 20],
        'Speed': [45, 60, 80, 65, 80, 100, 43, 58, 78, 45],
        'Generation': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        'Legendary': [False, False, False, False, False, False, False, False, False, False]
    }

    return pd.DataFrame(data)

if __name__ == "__main__":
    main()

=== TP1: Pandas DataFrame Basics ===

1. Importation et lecture des données
⚠ Fichier 'pokemon_data.csv' non trouvé. Création d'un échantillon de données...

2. Méthode head() - Premières lignes
   #        Name Type 1  Type 2  HP  Attack  Defense  Sp. Atk  Sp. Def  Speed  \
0  1   Bulbasaur  Grass  Poison  45      49       49       65       65     45   
1  2     Ivysaur  Grass  Poison  60      62       63       80       80     60   
2  3    Venusaur  Grass  Poison  80      82       83      100      100     80   
3  4  Charmander   Fire    None  39      52       43       60       50     65   
4  5  Charmeleon   Fire    None  58      64       58       80       65     80   

   Generation  Legendary  
0           1      False  
1           1      False  
2           1      False  
3           1      False  
4           1      False  

Premières 3 lignes:
   #       Name Type 1  Type 2  HP  Attack  Defense  Sp. Atk  Sp. Def  Speed  \
0  1  Bulbasaur  Grass  Poison  45      49       49    

<Figure size 1200x600 with 0 Axes>