In [2]:
import pandas as pd
data = {
    "Prénom": ['Beryl', 'Sarah', 'Kevin', 'Parfait'],
    "Age": [26, 22, 33, 20],
    "Filière": ['A', 'A', 'C', 'B']
}

# Création du DataFrame
df = pd.DataFrame(data)

# map 
df['Filière'] = df['Filière'].map({'A': 'Beryl', 'B': 'Parfait', 'C': 'Kevin'})

# sort_values : trier par âge croissant
df.sort_values(by='Age', ascending=True, inplace=True)

# pivot_table : moyenne d’âge par filière
pivot = df.pivot_table(values='Age', index='Filière', aggfunc='mean')
print("\nMoyenne d’âge par filière :")
print(pivot)

# groupby + max : âge max par filière
max_age = df.groupby('Filière')['Age'].max()
print("\nÂge max par filière :")
print(max_age)

# query simple : ceux avec Age > 25
filtres_simple = df.query('Age > 25')
print("\nÉtudiants avec Age > 25 :")
print(filtres_simple)

#utulisation de loc
loc_simple=df.loc[0, 'Prénom']
print(loc_simple)

#utulisation de iloc
iloc_simple=df.iloc[2, 1]
print(iloc_simple)



Moyenne d’âge par filière :
          Age
Filière      
Beryl    24.0
Kevin    33.0
Parfait  20.0

Âge max par filière :
Filière
Beryl      26
Kevin      33
Parfait    20
Name: Age, dtype: int64

Étudiants avec Age > 25 :
  Prénom  Age Filière
0  Beryl   26   Beryl
2  Kevin   33   Kevin
Beryl
26


In [3]:
# Découpage des âges en catégories
df['Tranche_Age'] = pd.cut(
    df['Age'],
    bins=[0, 25, 30, 40],
    labels=['Jeune', 'Intermédiaire', 'Sénior']
)
print("\nDécoupage en tranches d'âge (cut) :")
print(df[['Age', 'Tranche_Age']])



Découpage en tranches d'âge (cut) :
   Age    Tranche_Age
3   20          Jeune
1   22          Jeune
0   26  Intermédiaire
2   33         Sénior


In [4]:
# Exemple avec des langages par personne
df_langages = pd.DataFrame({
    'Nom': ['Alice', 'Bob'],
    'Langages': [['Python', 'R'], ['SQL', 'Python', 'Java']]
})

df_exploded = df_langages.explode('Langages')
print("\nExplode :")
print(df_exploded)



Explode :
     Nom Langages
0  Alice   Python
0  Alice        R
1    Bob      SQL
1    Bob   Python
1    Bob     Java


In [None]:
# Reprendre un DataFrame simple
df_simple = df[['Filière']].copy()

# Ajouter une autre colonne
df_simple['Autre'] = ['X', 'Y', 'Z', 'W']

# stack
stacked = df_simple.stack()
print("\nStack :")
print(stacked)

# unstack
unstacked = stacked.unstack()
print("\nUnstack :")
print(unstacked)



Stack :
3  Filière    Parfait
   Autre            X
1  Filière      Beryl
   Autre            Y
0  Filière      Beryl
   Autre            Z
2  Filière      Kevin
   Autre            W
dtype: object

Unstack :
   Filière Autre
3  Parfait     X
1    Beryl     Y
0    Beryl     Z
2    Kevin     W


In [None]:

Q1 = df['Age'].quantile(0.25)  
Q3 = df['Age'].quantile(0.75)  
IQR = Q3 - Q1                  
df_outliers = df[
    (df['Age'] < Q1 - 1.5 * IQR) | 
    (df['Age'] > Q3 + 1.5 * IQR)
]
print("\nValeurs détectées :")
print(df_outliers)



Valeurs aberrantes détectées :
Empty DataFrame
Columns: [Prénom, Age, Filière, Tranche_Age]
Index: []
