In [2]:
import pandas as pd
import matplotlib.pyplot as plt

def main():
    print("=== TP2: Filtrage de lignes avec iloc[], loc[], et query() ===\n")

    # 1. Importation et lecture des données
    print("1. Importation et lecture des données")
    try:
        df = pd.read_csv('TecInf\Downloadspokemon_data.csv')
        print("✓ Fichier CSV lu avec succès")
        print(f"Dimensions: {df.shape}")
    except FileNotFoundError:
        print("⚠ Fichier 'pokemon_data.csv' non trouvé. Création d'un échantillon de données...")
        df = create_sample_data()

    print("\n" + "="*60)

    # 2. Filtrage avec iloc[] - par position
    print("2. Filtrage avec iloc[] - par position d'index")

    # Élément spécifique
    print("Élément à la ligne 2, colonne 4:")
    print(df.iloc[2, 4])

    # Premières lignes et colonnes
    print(f"\nPremières 5 lignes, premières 5 colonnes:")
    print(df.iloc[:5, :5])

    # Ligne spécifique
    print(f"\nLigne 5 (comme Series):")
    print(df.iloc[5])

    # Ligne spécifique comme DataFrame
    print(f"\nLigne 5 (comme DataFrame):")
    print(df.iloc[[5]])

    # Toutes les lignes, colonne spécifique
    print(f"\nToutes les lignes, colonne 1 (Name):")
    name_series = df.iloc[:, 1]
    print(f"Type: {type(name_series)}")
    print(name_series.head())

    # Toutes les lignes, colonnes spécifiques
    print(f"\nToutes les lignes, colonnes 1 et 6 (Name et Defense):")
    name_defense = df.iloc[:, [1, 6]]
    print(name_defense.head())

    print("\n" + "="*60)

    # 3. Filtrage avec loc[] - par conditions
    print("3. Filtrage avec loc[] - par conditions booléennes")

    # Filtrage simple
    if 'Legendary' in df.columns:
        print("Pokémon non-légendaires:")
        non_legendary = df.loc[df['Legendary'] == False]
        print(f"Nombre de Pokémon non-légendaires: {len(non_legendary)}")
        print(non_legendary.head())

    # Filtrage multiple avec AND
    if 'Legendary' in df.columns and 'Type 1' in df.columns:
        print(f"\nPokémon non-légendaires de type Grass:")
        grass_non_legendary = df.loc[
            (df['Legendary'] == False) &
            (df['Type 1'] == 'Grass')
        ]
        print(f"Nombre trouvé: {len(grass_non_legendary)}")
        print(grass_non_legendary.head())

    # Filtrage avec négation (NOT)
    if 'Type 1' in df.columns and 'Legendary' in df.columns:
        print(f"\nPokémon qui ne sont PAS (Grass ET non-légendaires):")
        not_grass_legendary = df.loc[
            ~((df['Type 1'] == 'Grass') & (df['Legendary'] == False))
        ]
        print(f"Nombre trouvé: {len(not_grass_legendary)}")
        print(not_grass_legendary.head())

    print("\n" + "="*60)

    # 4. Filtrage avec query() - syntaxe SQL-like
    print("4. Filtrage avec query() - syntaxe SQL-like")

    # Requête simple
    if 'HP' in df.columns and 'Attack' in df.columns:
        print("Pokémon avec HP > 40 et Attack < 100:")
        filtered_pokemon = df.query('(HP > 40) and (Attack < 100)')
        print(f"Nombre trouvé: {len(filtered_pokemon)}")
        print(filtered_pokemon.head())

    # Utilisation de variables externes avec @
    if 'HP' in df.columns:
        min_hp = 70
        print(f"\nPokémon avec HP > {min_hp} (utilisation de variable externe):")
        high_hp_pokemon = df.query('HP > @min_hp')
        print(f"Nombre trouvé: {len(high_hp_pokemon)}")
        print(high_hp_pokemon.head())

    # Requête complexe
    if 'HP' in df.columns and 'Attack' in df.columns and 'Speed' in df.columns:
        print(f"\nPokémon équilibrés (HP > 60, Attack > 70, Speed > 60):")
        balanced_pokemon = df.query('(HP > 60) and (Attack > 70) and (Speed > 60)')
        print(f"Nombre trouvé: {len(balanced_pokemon)}")
        print(balanced_pokemon.head())

    print("\n" + "="*60)

    # 5. Exemples pratiques et comparaisons
    print("5. Exemples pratiques et comparaisons des méthodes")

    # Comparaison des 3 méthodes pour le même résultat
    if 'HP' in df.columns:
        print("Comparaison des 3 méthodes pour HP > 80:")

        # Méthode 1: loc[]
        method1 = df.loc[df['HP'] > 80]
        print(f"loc[]: {len(method1)} résultats")

        # Méthode 2: query()
        method2 = df.query('HP > 80')
        print(f"query(): {len(method2)} résultats")

        # Vérification que les résultats sont identiques
        print(f"Résultats identiques: {len(method1) == len(method2)}")

    # Filtrage par type de Pokémon
    if 'Type 1' in df.columns:
        print(f"\nAnalyse par type de Pokémon:")
        type_counts = df['Type 1'].value_counts()
        print("Top 5 des types les plus fréquents:")
        print(type_counts.head())

        # Filtrage du type le plus fréquent
        most_common_type = type_counts.index[0]
        print(f"\nTous les Pokémon de type {most_common_type}:")
        same_type = df.query(f'`Type 1` == "{most_common_type}"')
        print(f"Nombre: {len(same_type)}")
        print(same_type.head())

    print("\n" + "="*60)

    # 6. Exercices avancés
    print("6. Exercices avancés")

    # Exercice 1: Pokémon avec des stats élevées
    if all(col in df.columns for col in ['HP', 'Attack', 'Defense']):
        print("Pokémon avec HP, Attack et Defense > 100:")
        high_stats = df.query('(HP > 100) and (Attack > 100) and (Defense > 100)')
        print(f"Nombre trouvé: {len(high_stats)}")
        if len(high_stats) > 0:
            print(high_stats[['Name', 'HP', 'Attack', 'Defense']].head())

    # Exercice 2: Analyse par génération
    if 'Generation' in df.columns:
        print(f"\nAnalyse par génération:")
        gen_counts = df['Generation'].value_counts().sort_index()
        print(gen_counts)

        # Pokémon de première génération
        gen1_pokemon = df.query('Generation == 1')
        print(f"\nPokémon de première génération: {len(gen1_pokemon)}")
        print(gen1_pokemon[['Name', 'Type 1', 'Type 2']].head())

    # Exercice 3: Pokémon avec un seul type
    if 'Type 2' in df.columns:
        print(f"\nPokémon avec un seul type (Type 2 manquant):")
        single_type = df.loc[df['Type 2'].isna()]
        print(f"Nombre: {len(single_type)}")
        print(single_type[['Name', 'Type 1', 'Type 2']].head())

    print("\n" + "="*60)

    # 7. Visualisations des données filtrées
    print("7. Visualisations des données filtrées")

    try:
        # Histogramme comparatif
        if 'HP' in df.columns and 'Legendary' in df.columns:
            plt.figure(figsize=(12, 5))

            # Subplot 1: HP de tous les Pokémon
            plt.subplot(1, 2, 1)
            df['HP'].plot.hist(bins=20, alpha=0.7, title='Distribution HP - Tous')
            plt.xlabel('HP')
            plt.ylabel('Fréquence')

            # Subplot 2: HP des Pokémon légendaires vs non-légendaires
            plt.subplot(1, 2, 2)
            legendary = df.loc[df['Legendary'] == True, 'HP']
            non_legendary = df.loc[df['Legendary'] == False, 'HP']

            plt.hist(legendary, bins=15, alpha=0.7, label='Légendaire', color='red')
            plt.hist(non_legendary, bins=15, alpha=0.7, label='Non-légendaire', color='blue')
            plt.xlabel('HP')
            plt.ylabel('Fréquence')
            plt.title('Distribution HP - Légendaire vs Non-légendaire')
            plt.legend()

            plt.tight_layout()
            plt.savefig('hp_comparison.png')
            print("✓ Graphique de comparaison HP sauvegardé: hp_comparison.png")
            plt.close()

        # Graphique des types les plus fréquents
        if 'Type 1' in df.columns:
            plt.figure(figsize=(10, 6))
            type_counts = df['Type 1'].value_counts().head(10)
            type_counts.plot.bar()
            plt.title('Top 10 des types de Pokémon les plus fréquents')
            plt.xlabel('Type')
            plt.ylabel('Nombre')
            plt.xticks(rotation=45)
            plt.tight_layout()
            plt.savefig('type_frequency.png')
            print("✓ Graphique des types sauvegardé: type_frequency.png")
            plt.close()

    except Exception as e:
        print(f"⚠ Erreur lors de la création des graphiques: {e}")

    print("\n" + "="*60)


def create_sample_data():
    """Crée un échantillon de données Pokemon pour les tests"""
    import numpy as np

    pokemon_data = {
        '#': range(1, 21),
        'Name': ['Bulbasaur', 'Ivysaur', 'Venusaur', 'Charmander', 'Charmeleon',
                'Charizard', 'Squirtle', 'Wartortle', 'Blastoise', 'Caterpie',
                'Metapod', 'Butterfree', 'Weedle', 'Kakuna', 'Beedrill',
                'Pidgey', 'Pidgeotto', 'Pidgeot', 'Rattata', 'Raticate'],
        'Type 1': ['Grass', 'Grass', 'Grass', 'Fire', 'Fire', 'Fire', 'Water', 'Water', 'Water', 'Bug',
                  'Bug', 'Bug', 'Bug', 'Bug', 'Bug', 'Normal', 'Normal', 'Normal', 'Normal', 'Normal'],
        'Type 2': ['Poison', 'Poison', 'Poison', None, None, 'Flying', None, None, None, None,
                  None, 'Flying', 'Poison', 'Poison', 'Poison', 'Flying', 'Flying', 'Flying', None, None],
        'HP': [45, 60, 80, 39, 58, 78, 44, 59, 79, 45, 50, 60, 40, 45, 65, 40, 63, 83, 30, 55],
        'Attack': [49, 62, 82, 52, 64, 84, 48, 63, 83, 30, 20, 45, 35, 25, 90, 45, 60, 80, 56, 81],
        'Defense': [49, 63, 83, 43, 58, 78, 65, 80, 100, 35, 55, 50, 30, 50, 40, 40, 55, 75, 35, 60],
        'Sp. Atk': [65, 80, 100, 60, 80, 109, 50, 65, 85, 20, 25, 90, 20, 25, 45, 35, 50, 70, 25, 50],
        'Sp. Def': [65, 80, 100, 50, 65, 85, 64, 80, 105, 20, 25, 80, 20, 25, 80, 35, 50, 70, 35, 70],
        'Speed': [45, 60, 80, 65, 80, 100, 43, 58, 78, 45, 30, 70, 50, 35, 75, 56, 71, 101, 72, 97],
        'Generation': [1]*20,
        'Legendary': [False]*20
    }

    return pd.DataFrame(pokemon_data)

if __name__ == "__main__":
    main()

=== TP2: Filtrage de lignes avec iloc[], loc[], et query() ===

1. Importation et lecture des données
⚠ Fichier 'pokemon_data.csv' non trouvé. Création d'un échantillon de données...

2. Filtrage avec iloc[] - par position d'index
Élément à la ligne 2, colonne 4:
80

Premières 5 lignes, premières 5 colonnes:
   #        Name Type 1  Type 2  HP
0  1   Bulbasaur  Grass  Poison  45
1  2     Ivysaur  Grass  Poison  60
2  3    Venusaur  Grass  Poison  80
3  4  Charmander   Fire    None  39
4  5  Charmeleon   Fire    None  58

Ligne 5 (comme Series):
#                     6
Name          Charizard
Type 1             Fire
Type 2           Flying
HP                   78
Attack               84
Defense              78
Sp. Atk             109
Sp. Def              85
Speed               100
Generation            1
Legendary         False
Name: 5, dtype: object

Ligne 5 (comme DataFrame):
   #       Name Type 1  Type 2  HP  Attack  Defense  Sp. Atk  Sp. Def  Speed  \
5  6  Charizard   Fire  Flying