In [1]:
import json
import os
import re
import pandas as pd
import matplotlib.pyplot as plt

# Récupération des données

In [2]:
# Récupère l'ensemble des fichiers json
json_files = [f for f in os.listdir('./fichiers json') if f.endswith('.json')]

# Trie les semestres par ordre chronologique, en attribuant un nombre à chaque semestre
# (P07 -> 7, A07 -> 7.5, P08 -> 8, A08 -> 8.5, ...)
semester_numbers = {}
for json_file in json_files:
    if re.match("output_(.{3}).json", json_file):
        semestre = re.match("output_(.{3}).json", json_file).group(1)
        num = int(semestre[1:]) + (0.5 if semestre.startswith("A") else 0)
        semester_numbers[semestre] = num
sorted_semesters = sorted(semester_numbers, key=semester_numbers.get)

print(sorted_semesters)

# Concatène les données, par semestre
data_by_semester = {}
for semester in sorted_semesters:
    with open(f'./fichiers json/output_{semester}.json', "r") as f:
        data = json.load(f)
        data_by_semester[semester] = data

['P07', 'A07', 'P08', 'A08', 'P09', 'A09', 'P10', 'A10', 'P11', 'A11', 'P12', 'A12', 'P13', 'A13', 'P14', 'A14', 'P15', 'A15', 'P16', 'A16', 'P17', 'A17', 'P18', 'A18', 'P19', 'A19', 'P20', 'A20', 'P21', 'A21', 'P22', 'A22', 'P23', 'A23', 'P24']


# Exemple simplifié

In [None]:
semestres = ['Semestre 1', 'Semestre 2', 'Semestre 3', 'Semestre 4'] # colonnes
cours = ['Cours 1', 'Cours 2', 'Cours 3'] # lignes

example_df = pd.DataFrame(index=cours, columns=semestres)

# cellules
data_cours_1_semestre_1 = {
    'taux_de_reussite': 0.85,
    'nombre_d_inscrits': 100,
    'nombre_d_absents': 10,
    'nombre_d_etudiants_ayant_obtenu_uv': 75
}
data_cours_2_semestre_2 = {
    'taux_de_reussite': 0.90,
    'nombre_d_inscrits': 120,
    'nombre_d_absents': 8,
    'nombre_d_etudiants_ayant_obtenu_uv': 95
}
data_cours_1_semestre_2 = {
    'taux_de_reussite': 0.80,
    'nombre_d_inscrits': 90,
    'nombre_d_absents': 20,
    'nombre_d_etudiants_ayant_obtenu_uv': 72
}
data_cours_1_semestre_3 = {
    'taux_de_reussite': 0.60,
    'nombre_d_inscrits': 80,
    'nombre_d_absents': 15,
    'nombre_d_etudiants_ayant_obtenu_uv': 56
}
data_cours_2_semestre_3 = {
    'taux_de_reussite': 0.95,
    'nombre_d_inscrits': 110,
    'nombre_d_absents': 10,
    'nombre_d_etudiants_ayant_obtenu_uv': 77
}

example_df.at['Cours 1', 'Semestre 1'] = data_cours_1_semestre_1
example_df.at['Cours 2', 'Semestre 2'] = data_cours_2_semestre_2
example_df.at['Cours 1', 'Semestre 2'] = data_cours_1_semestre_2
example_df.at['Cours 1', 'Semestre 3'] = data_cours_1_semestre_3
example_df.at['Cours 2', 'Semestre 3'] = data_cours_2_semestre_3

# Récupère uniquement les taux de réussite
taux_reussite = example_df.applymap(lambda x: x['taux_de_reussite'] if pd.notnull(x) else x)
# Filtre sur les 3 derniers semestres
taux_reussite = taux_reussite[taux_reussite.columns[-3:]]
# Génère la moyenne des taux de réussite par cours
taux_reussite['Moyenne'] = taux_reussite.mean(axis=1)
# Génère un dégradé de couleurs selon le taux de réussite
taux_reussite.style.background_gradient(cmap='Blues', axis=None)

  taux_reussite = example_df.applymap(lambda x: x['taux_de_reussite'] if pd.notnull(x) else x)


Unnamed: 0,Semestre 2,Semestre 3,Semestre 4,Moyenne
Cours 1,0.8,0.6,,0.7
Cours 2,0.9,0.95,,0.925
Cours 3,,,,


# Création du dataframe

In [4]:
# En s'appuyant sur data_by_semester, génère un DataFrame contenant les stats de chaque UV pour chaque semestre

semestres = data_by_semester.keys()
cours = sorted({uv for uvs in data_by_semester.values() for uv in uvs.keys()})

full_df = pd.DataFrame(index=cours, columns=semestres)

for semestre, uvs in data_by_semester.items():
    for uv, uv_data in uvs.items():
        if uv_data.get('taux_reussite', None) is None:
            print(f"{uv} en {semestre} n'a pas de taux de réussite")
            continue
        full_df.at[uv, semestre] = {
            'taux_reussite': uv_data.get('taux_reussite', None),
            'nb_inscrits': uv_data.get('nb_inscrits', None),
            'nb_absents': uv_data.get('nb_absents', None),
            'nb_recus': uv_data.get('nb_recus', None),
        }

full_df

LG41 en P07 n'a pas de taux de réussite
MU03 en A07 n'a pas de taux de réussite
MU01 en A08 n'a pas de taux de réussite
LNG01 en A09 n'a pas de taux de réussite
LNG01 en A10 n'a pas de taux de réussite
SF00 en P14 n'a pas de taux de réussite
SF00 en P15 n'a pas de taux de réussite
BIO03 en A15 n'a pas de taux de réussite
MU02 en A15 n'a pas de taux de réussite
MT89 en P16 n'a pas de taux de réussite
SF00 en P16 n'a pas de taux de réussite
MA09 en A16 n'a pas de taux de réussite
MA09 en A17 n'a pas de taux de réussite
MU02 en A17 n'a pas de taux de réussite
PTV54 en A17 n'a pas de taux de réussite
MA09 en A18 n'a pas de taux de réussite
MU02 en A18 n'a pas de taux de réussite
MA09 en A19 n'a pas de taux de réussite
MU02 en A19 n'a pas de taux de réussite
GPFA en P20 n'a pas de taux de réussite
BG06 en A20 n'a pas de taux de réussite
MA09 en A20 n'a pas de taux de réussite
MU02 en A20 n'a pas de taux de réussite
MA09 en A21 n'a pas de taux de réussite
MU02 en A21 n'a pas de taux de réuss

Unnamed: 0,P07,A07,P08,A08,P09,A09,P10,A10,P11,A11,...,A19,P20,A20,P21,A21,P22,A22,P23,A23,P24
AA01,,,,,,,,,"{'taux_reussite': 100.0, 'nb_inscrits': 13, 'n...",,...,,,,,,,,,,
AA23,,,,,,,,,,,...,,,,,,,,,,
AC01,,,,,,,,,,,...,"{'taux_reussite': 95.24, 'nb_inscrits': 42, 'n...",,"{'taux_reussite': 86.96, 'nb_inscrits': 23, 'n...",,"{'taux_reussite': 85.0, 'nb_inscrits': 41, 'nb...",,"{'taux_reussite': 73.77, 'nb_inscrits': 61, 'n...",,"{'taux_reussite': 75.0, 'nb_inscrits': 45, 'nb...",
AC02,,,,,,,,,,,...,"{'taux_reussite': 100.0, 'nb_inscrits': 9, 'nb...",,"{'taux_reussite': 100.0, 'nb_inscrits': 18, 'n...",,"{'taux_reussite': 90.0, 'nb_inscrits': 20, 'nb...",,"{'taux_reussite': 86.67, 'nb_inscrits': 16, 'n...",,"{'taux_reussite': 88.46, 'nb_inscrits': 26, 'n...",
AC03,,,,,,,,,,,...,"{'taux_reussite': 97.06, 'nb_inscrits': 34, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 26, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 24, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 62, 'n...",,"{'taux_reussite': 97.96, 'nb_inscrits': 50, 'n...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
UXD02,,,,,,,,,,,...,,,,,,,,,,
UXD1,,,,,,,,,,,...,,"{'taux_reussite': 100.0, 'nb_inscrits': 16, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 13, 'n...",,,,"{'taux_reussite': 100.0, 'nb_inscrits': 12, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 9, 'nb..."
UXD2,,,,,,,,,,,...,"{'taux_reussite': 100.0, 'nb_inscrits': 13, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 22, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 19, 'n...",,"{'taux_reussite': 100.0, 'nb_inscrits': 6, 'nb...",,"{'taux_reussite': 100.0, 'nb_inscrits': 14, 'n...",
WE01,,,,,,,,,,,...,,,"{'taux_reussite': 100.0, 'nb_inscrits': 20, 'n...","{'taux_reussite': 100.0, 'nb_inscrits': 19, 'n...","{'taux_reussite': 94.44, 'nb_inscrits': 38, 'n...","{'taux_reussite': 100.0, 'nb_inscrits': 50, 'n...","{'taux_reussite': 92.86, 'nb_inscrits': 44, 'n...","{'taux_reussite': 95.65, 'nb_inscrits': 24, 'n...","{'taux_reussite': 94.12, 'nb_inscrits': 36, 'n...","{'taux_reussite': 100.0, 'nb_inscrits': 23, 'n..."


# Analyse des données

In [5]:
# TAUX DE REUSSITE

df = full_df.applymap(lambda x: x['taux_reussite'] if pd.notnull(x) else x)

################### 1. FILTRES COLONNES ###################

# 26 premiers semestres (avant P20)
#df = df[df.columns[:26]]                # npo de changer le calcul du nb d'étudiants + bas 

# 7 derniers semestres (après P20)
#df = df[df.columns[-7:]]               # npo de changer le calcul du nb d'étudiants + bas 

################### 2. CALCULS COLONNES ###################

df['Nb étudiants moyen'] = None # pour placer la colonne avant la moyenne

# moyenne taux réussite
df['Moyenne'] = df.mean(axis=1)

# nb étudiants moyen
df['Nb étudiants moyen'] = full_df.applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)
#df['Nb étudiants moyen'] = full_df[full_df.columns[-7:]].applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)
#df['Nb étudiants moyen'] = full_df[full_df.columns[:26]].applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)

################### 3. FILTRES LIGNES ######################

# nom de l'UV
#df = df.loc[df.index.str.startswith("SY")]

# uv ayant existé au moins 2 semestres
df = df[df.count(axis=1) >= 4]

# nb d'étudiants moyen
df = df[df['Nb étudiants moyen'] > 20]

################### 4. TRI #################################

df = df.sort_values('Moyenne', ascending=True)

################### 5. AFFICHAGE ###########################

print(f'Nombre de semestres : {len(df.columns)-2}')
print(f'Nombre d\'UVs : {len(df)}')

# Déplace les colonnes 'Moyenne' et 'Nb étudiants moyen' en premier
cols = df.columns.tolist()
cols = cols[-2:] + cols[:-2]
df = df[cols]

# Génère rendu visuel avec dégradé de couleurs
df.style.background_gradient(cmap='Greens', axis=None, subset=df.columns[1:]).background_gradient(cmap='Purples', axis=None, subset=df.columns[0]).format("{:.2f}").format("{:.0f}", subset=df.columns[:1]).set_properties(**{'text-align': 'center'})

  df = full_df.applymap(lambda x: x['taux_reussite'] if pd.notnull(x) else x)
  df['Nb étudiants moyen'] = full_df.applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)


Nombre de semestres : 35
Nombre d'UVs : 507


Unnamed: 0,Nb étudiants moyen,Moyenne,P07,A07,P08,A08,P09,A09,P10,A10,P11,A11,P12,A12,P13,A13,P14,A14,P15,A15,P16,A16,P17,A17,P18,A18,P19,A19,P20,A20,P21,A21,P22,A22,P23,A23,P24
MT21,206,61.6,55.3,57.5,62.39,64.41,68.42,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
MT35,20,67.05,,,,,,,,,,,,,63.64,,,,62.5,,75.0,,,,,,,,,,,,,,,,
SV01,68,70.04,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,73.49,73.68,73.03,70.21,54.29,75.51
MT91,215,70.31,,,,,,71.55,54.41,71.04,67.71,63.85,60.64,61.45,61.22,60.48,58.76,66.07,65.71,71.3,81.72,74.6,87.18,70.15,76.42,71.69,75.0,76.09,79.03,87.34,73.91,,,,,,
AC04,32,71.32,,,,,,,,,,,,,,,,,,,,,,,83.33,,78.57,,83.33,,88.24,,63.89,,54.17,,47.73
CM01,103,72.52,72.13,,77.46,,71.43,,67.71,,80.41,,85.83,,57.24,,67.31,,73.17,,,,,,,,,,,,,,,,,,
SY02,253,73.62,73.36,78.06,79.92,84.82,68.2,76.33,74.71,80.0,76.87,84.55,80.67,81.64,75.23,81.82,74.46,83.07,71.96,85.28,70.77,80.59,74.1,72.37,66.17,76.29,80.93,71.67,69.83,71.95,69.14,68.02,64.35,65.88,60.64,40.0,63.16
BL01,79,73.72,55.84,68.92,75.0,68.09,90.91,74.71,74.51,67.86,70.13,67.35,74.36,85.71,56.76,70.93,77.42,80.95,64.0,78.26,76.92,72.45,84.29,76.53,60.81,74.26,71.23,79.0,83.56,77.89,79.17,,,,,,
PS91,177,73.77,,,,,,65.22,74.36,57.32,71.28,76.54,78.82,77.11,76.0,79.75,78.7,72.73,77.38,,,,,,,,,,,,,,,,,,
MQ01,200,74.14,78.83,75.9,71.43,75.59,74.67,71.18,74.37,75.86,71.43,75.1,76.28,74.79,79.46,72.47,80.46,69.04,82.76,71.13,83.12,70.04,79.7,72.51,79.38,76.7,75.12,72.91,91.19,70.11,73.3,69.4,83.1,48.33,73.2,54.13,71.78


In [6]:
# LES PLUS GRANDS RATÉS DE L'UTC

df2 = df.copy()

# drop les colonnes 'Moyenne' et 'Nb étudiants moyen'
df2 = df2.drop(columns=['Moyenne', 'Nb étudiants moyen'])

# garde uniquement les valeurs <60%
df2 = df2[df2 < 70] 

# enlève les lignes entièrement vides
df2 = df2.dropna(how='all')

# calcul % réussite moyen (après avoir gardé les valeurs <60%)
df2['Moyenne'] = df['Moyenne']

# ajoute nb étudiants moyen
df2['Nb étudiants moyen'] = df['Nb étudiants moyen']

# garde les cours avec au moins 40 étudiants en moyenne
df2 = df2[df2['Nb étudiants moyen'] > 40]

styled_df  = df2.style.background_gradient(cmap='Greens', axis=None, subset=df2.columns[:-1]).background_gradient(cmap='Purples', axis=None, subset=df2.columns[-1]).format("{:.2f}").format("{:.0f}", subset=df2.columns[-1]).set_properties(**{'text-align': 'center'})

# Conversion en HTML
html_table = styled_df.to_html()

# Écrire le contenu HTML dans un fichier
with open('les plus grands ratés.html', 'w') as f:
    f.write(html_table)

In [7]:
# NOMBRE D'ECHECS

df = full_df.applymap(lambda x: x['nb_inscrits'] - x['nb_recus'] - x['nb_absents'] if pd.notnull(x) else x)


################### 1. FILTRES COLONNES ###################

# 15 premiers semestres
#df = df[df.columns[:15]]

# 10 derniers semestres
#df = df[df.columns[-10:]]

################### 2. CALCULS COLONNES ###################

# nb échecs moyen
df['Nb échec moyen'] = df.mean(axis=1)

# nb échecs total
df['Nb échec total'] = df.sum(axis=1)

# nb étudiants moyen
df['Nb inscrits moyen'] = full_df.applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)

# taux de réussite moyen
df['Taux de réussite moyen'] = full_df.applymap(lambda x: x['taux_reussite'] if pd.notnull(x) else x).mean(axis=1)

################### 3. FILTRES LIGNES ######################

# nom de l'UV
#df = df.loc[df.index.str.startswith("SY")]

# uv ayant existé au moins 2 semestres
df = df[df.count(axis=1) >= 4]

# nb d'étudiants moyen
df = df[df['Nb inscrits moyen'] > 40]

################### 4. TRI #################################

df = df.sort_values('Nb échec total', ascending=False)

################### 5. AFFICHAGE ###########################

print(f'Nombre de semestres : {len(df.columns)-2}')
print(f'Nombre d\'UVs : {len(df)}')

df.head(10).style.background_gradient(cmap='Reds', axis=None, subset=df.columns[:-4]).format("{:.0f}").set_properties(**{'text-align': 'center'})

Nombre de semestres : 37
Nombre d'UVs : 217


  df = full_df.applymap(lambda x: x['nb_inscrits'] - x['nb_recus'] - x['nb_absents'] if pd.notnull(x) else x)
  df['Nb inscrits moyen'] = full_df.applymap(lambda x: x['nb_inscrits'] if pd.notnull(x) else x).mean(axis=1)
  df['Taux de réussite moyen'] = full_df.applymap(lambda x: x['taux_reussite'] if pd.notnull(x) else x).mean(axis=1)


Unnamed: 0,P07,A07,P08,A08,P09,A09,P10,A10,P11,A11,P12,A12,P13,A13,P14,A14,P15,A15,P16,A16,P17,A17,P18,A18,P19,A19,P20,A20,P21,A21,P22,A22,P23,A23,P24,Nb échec moyen,Nb échec total,Nb inscrits moyen,Taux de réussite moyen
LA13,61.0,78.0,48.0,55.0,54.0,76,137,118,177,116,125,87,120,67,69,61,107,65,106,81,110,69,116,74,75,49,8,58,59,58.0,61.0,60.0,53.0,55.0,77.0,80,2870,404,79
SY02,61.0,52.0,50.0,39.0,69.0,71,65,62,68,51,58,47,81,56,71,53,83,44,83,53,72,71,68,55,37,66,54,62,50,63.0,41.0,72.0,37.0,120.0,35.0,61,2181,253,74
MQ01,29.0,47.0,46.0,52.0,38.0,66,41,56,48,60,51,59,38,68,34,74,30,69,26,71,40,58,40,48,50,55,17,55,55,56.0,36.0,93.0,52.0,50.0,57.0,50,1815,200,74
MT22,52.0,27.0,58.0,37.0,72.0,17,125,32,98,22,85,24,103,23,79,25,88,14,67,20,57,18,65,27,50,34,8,19,42,13.0,71.0,24.0,40.0,38.0,52.0,46,1672,220,78
MT23,10.0,24.0,15.0,32.0,19.0,54,37,57,54,77,54,79,37,66,39,63,36,56,41,24,36,66,34,73,32,58,19,75,32,40.0,30.0,39.0,23.0,129.0,8.0,45,1613,190,76
MT91,,,,,,103,31,95,31,124,37,133,38,147,40,114,24,93,17,80,10,97,25,92,20,77,13,39,12,,,,,,,62,1554,215,70
CM11,31.0,35.0,43.0,43.0,39.0,39,51,67,48,83,64,52,28,72,46,49,17,43,26,40,19,22,25,30,25,28,15,14,12,13.0,30.0,18.0,26.0,17.0,28.0,35,1273,159,78
MT90,,,,,,74,17,97,23,57,19,95,17,73,16,79,17,54,11,47,11,91,26,89,23,66,12,66,17,,,,,,,46,1143,208,77
PS90,,,,,,98,7,44,22,103,14,97,21,104,26,90,11,106,35,49,19,44,15,24,25,32,5,17,7,23.0,22.0,10.0,9.0,11.0,6.0,37,1133,189,82
TN01,13.0,31.0,12.0,28.0,24.0,43,32,36,39,34,42,66,41,50,49,64,25,45,26,52,12,23,21,45,25,43,10,16,10,21.0,26.0,22.0,15.0,13.0,15.0,31,1100,190,84


# analyse v2

In [8]:
# Nouveau dataframe, avec les données stockées de manière plus lisible
clean_df = full_df.copy()

# fonction qui attribue un numéro à chaque semestre (P07 -> 7, A07 -> 7.5, P08 -> 8, A08 -> 8.5, ...)
def sem_number(semester):
    return int(semester[1:]) + (0.5 if semester.startswith("A") else 0)

# remplissage du dataframe à partir de full_df
for uv in full_df.index:
    for semestre in full_df.columns:
        data = full_df.at[uv, semestre]
        if pd.isnull(data):
            continue
        if data['taux_reussite'] < 110 and data['nb_inscrits'] > 0 and sem_number(semestre) > 0:  # FILTRES sur les cellules
            tx_reussite = data['taux_reussite']
            nb_inscrits = data['nb_inscrits']
            nb_absents = data['nb_absents']
            nb_echecs = nb_inscrits - data['nb_recus'] - data['nb_absents']
            clean_df.at[uv, semestre] = [tx_reussite, nb_inscrits, nb_absents, nb_echecs]  #  CELLS DATA :  % REUSSITE, NB INSCRITS, NB ECHECS
        else:
            clean_df.at[uv, semestre] = None

# enlève les lignes vides
clean_df = clean_df.dropna(how='all')

# enlève les colonnes vides
clean_df = clean_df.dropna(axis=1, how='all')

# ================================ CALCULS ================================ #

# Taux de réussite moyen par UV 
clean_df['Taux de réussite moyen'] = clean_df.apply(lambda row: sum(x[0] for x in row if isinstance(x, list)) / len([x for x in row if isinstance(x, list)]), axis=1)

# Calcul du taux de réussite moyen par UV, pondéré par le nombre d'inscrits
clean_df['Taux de réussite pondéré'] = clean_df.apply(lambda row: sum(x[0] * x[1] for x in row if isinstance(x, list)) / sum(x[1] for x in row if isinstance(x, list)), axis=1)

# Nombre moyen d'inscrits par UV
clean_df['Nb inscrits moyen'] = clean_df.apply(lambda row: sum(x[1] for x in row if isinstance(x, list)) / len([x for x in row if isinstance(x, list)]), axis=1)

# Nombre total d'inscrits par UV
clean_df['Nb inscrits total'] = clean_df.apply(lambda row: sum(x[1] for x in row if isinstance(x, list)), axis=1)

# Nombre total d'absents par UV
clean_df['Nb absents total'] = clean_df.apply(lambda row: sum(x[2] for x in row if isinstance(x, list)), axis=1)

# Nombre total d'échecs par UV
clean_df['Nb échecs total'] = clean_df.apply(lambda row: sum(x[3] for x in row if isinstance(x, list)), axis=1)

# ================================== TRI ==================================== #

# Trie par taux de réussite moyen puis par nb d'inscrits moyen
#clean_df = clean_df.sort_values('Nb inscrits moyen', ascending=False).sort_values('Taux de réussite pondéré', ascending=False)

# Tri par ordre alphabétique
clean_df = clean_df.sort_index()

# tri par nombre d'inscrits total décroissant
#clean_df = clean_df.sort_values('Nb inscrits total', ascending=False)

# ================================ COULEURS ================================ #

# fonction appliquant un dégradé de couleurs sur une cellule données
def color_gradient(val, min_val, min_color, max_val, max_color):
    r = int(min_color[0] + (val - min_val) / (max_val - min_val) * (max_color[0] - min_color[0]))
    g = int(min_color[1] + (val - min_val) / (max_val - min_val) * (max_color[1] - min_color[1]))
    b = int(min_color[2] + (val - min_val) / (max_val - min_val) * (max_color[2] - min_color[2]))
    if r + g + b > 382: # si le contraste est trop faible, on écrit en noir
        return f'background-color: rgb({r},{g},{b}); color:black'
    else:
        return f'background-color: rgb({r},{g},{b}); color:white'

# dégradé du rouge (taux = 40) au vert (taux = 100)
def color_tx_reussite(cell):
    if isinstance(cell, list):
        taux = cell[0]
        return color_gradient(taux, 40, [255, 0, 0], 100, [0, 255, 0])
    return ''

# dégradé du rouge (nb échecs = 100) au blanc (nb échecs = 0)
def color_nb_echecs(cell):
    if isinstance(cell, list):
        nb_echecs = cell[3]
        return color_gradient(nb_echecs, 0, [255, 255, 255], 200, [255, 0, 0])
    return ''

# ====================== FILTRES sur les LIGNES ======================== #

# uv ayant existé au moins 2 semestres :
#clean_df = clean_df[clean_df.count(axis=1) >= 8]

# au moins 40 étudiants en moyenne
#clean_df = clean_df[clean_df['Nb inscrits moyen'] >= 60]

# UV dont le nom commence par "LA1"
#clean_df = clean_df.loc[clean_df.index.str.startswith("LA1")]

# ======================== AFFICHAGE et EXPORT ======================== #

# taille du tableau
print(clean_df.shape)

# affiche le tableau
clean_df.style.applymap(color_tx_reussite).format("{:.2f}", subset=['Taux de réussite moyen','Taux de réussite pondéré']).format("{:.0f}", subset='Nb inscrits moyen')

# enregistre dans xlsx
#clean_df.to_excel('full_table.xlsx')

(1055, 41)


  clean_df.style.applymap(color_tx_reussite).format("{:.2f}", subset=['Taux de réussite moyen','Taux de réussite pondéré']).format("{:.0f}", subset='Nb inscrits moyen')


Unnamed: 0,P07,A07,P08,A08,P09,A09,P10,A10,P11,A11,P12,A12,P13,A13,P14,A14,P15,A15,P16,A16,P17,A17,P18,A18,P19,A19,P20,A20,P21,A21,P22,A22,P23,A23,P24,Taux de réussite moyen,Taux de réussite pondéré,Nb inscrits moyen,Nb inscrits total,Nb absents total,Nb échecs total
AA01,,,,,,,,,"[100.0, 13, 1, 0]",,"[100.0, 14, 0, 0]",,"[100.0, 13, 1, 0]",,,,,,,,,,,,,,,,,,,,,,,100.0,100.0,13,40,2,0
AA23,,,,,,,,,,,,,,,,,,,,,,,"[33.33, 9, 0, 6]",,"[80.0, 5, 0, 1]",,,,,,,,,,,56.66,50.0,7,14,0,7
AC01,,,,,,,,,,,,,,,,,,,,"[85.0, 40, 0, 6]",,"[96.43, 28, 0, 1]",,"[89.19, 37, 0, 4]",,"[95.24, 42, 0, 2]",,"[86.96, 23, 0, 3]",,"[85.0, 41, 1, 6]",,"[73.77, 61, 0, 16]",,"[75.0, 45, 1, 11]",,85.82,84.42,40,317,2,49
AC02,,,,,,,,,,,,,,,,,,,,"[84.62, 13, 0, 2]",,"[85.0, 20, 0, 3]",,"[100.0, 15, 0, 0]",,"[100.0, 9, 0, 0]",,"[100.0, 18, 0, 0]",,"[90.0, 20, 0, 2]",,"[86.67, 16, 1, 2]",,"[88.46, 26, 0, 3]",,91.84,91.14,17,137,1,12
AC03,,,,,,,,,,,,,,,,,,,,"[100.0, 22, 0, 0]",,"[100.0, 24, 0, 0]",,"[100.0, 31, 0, 0]",,"[97.06, 34, 0, 1]",,"[100.0, 26, 1, 0]",,"[100.0, 24, 0, 0]",,"[100.0, 62, 0, 0]",,"[97.96, 50, 1, 1]",,99.38,99.26,34,273,2,2
AC04,,,,,,,,,,,,,,,,,,,,,,,"[83.33, 24, 0, 4]",,"[78.57, 28, 0, 6]",,"[83.33, 24, 0, 4]",,"[88.24, 17, 0, 2]",,"[63.89, 36, 0, 13]",,"[54.17, 48, 0, 22]",,"[47.73, 44, 0, 23]",71.32,66.52,32,221,0,74
AC05,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,"[83.33, 18, 0, 3]",,"[83.33, 24, 0, 4]",,83.33,83.33,21,42,0,7
AH01,,,,,,,,,,,,,,,,,,,,"[100.0, 42, 0, 0]",,,,,,,,,,,,,,,,100.0,100.0,42,42,0,0
AH02,,,,,,,,,,,,,,,,,,,,"[100.0, 22, 0, 0]",,,,,,,,,,,,,,,,100.0,100.0,22,22,0,0
AH03,,,,,,,,,,,,,,,,,,,,"[100.0, 25, 0, 0]","[100.0, 19, 0, 0]",,,,,,,,,,,,,,,100.0,100.0,22,44,0,0


In [9]:
# On calcule la moyenne des taux de réussite par SEMESTRE, pondérée par le nombre d'inscrits de chaque UV
mean_df = pd.DataFrame(index=['Moyenne pondérée'], columns=clean_df.columns[:-6])
mean_df.loc['Moyenne pondérée'] = 0
for semestre in mean_df.columns:
    sum_nb_inscrits = 0
    for uv in clean_df.index:
        uv_data = clean_df.at[uv, semestre]
        if isinstance(uv_data, list):
            taux_reussite = uv_data[0]
            nb_inscrits = uv_data[1]
            if pd.notnull(taux_reussite) and pd.notnull(nb_inscrits):
                mean_df.at['Moyenne pondérée', semestre] = mean_df.at['Moyenne pondérée', semestre] + taux_reussite * nb_inscrits
                sum_nb_inscrits += nb_inscrits
    if sum_nb_inscrits > 0:
        mean_df.at['Moyenne pondérée', semestre] = mean_df.at['Moyenne pondérée', semestre] / sum_nb_inscrits


# affiche le tableau
mean_df.style.background_gradient(cmap='Greens', axis=None, subset=mean_df.columns).format("{:.2f}")

Unnamed: 0,P07,A07,P08,A08,P09,A09,P10,A10,P11,A11,P12,A12,P13,A13,P14,A14,P15,A15,P16,A16,P17,A17,P18,A18,P19,A19,P20,A20,P21,A21,P22,A22,P23,A23,P24
Moyenne pondérée,88.41,87.05,88.58,88.5,88.59,87.11,87.7,87.33,87.65,88.02,88.84,89.32,88.5,89.01,89.65,89.1,89.86,89.49,90.26,90.17,91.2,89.68,90.64,89.45,90.75,90.72,96.03,91.86,91.85,91.73,92.27,90.38,91.54,87.93,90.74
